BỘ MÔN CNTT TỔ CHỨC SEMINA CHUYÊN ĐỀ THÁNG 9/2023

Nghiên cứu tổng quan về các kỹ thuật để sinh chú thích cho ảnh như chú thích ảnh dựa trên truy xuất thông tin, dựa trên khuôn mẫu và đặc biệt chú thích học dựa trên học sâu đã mang lại cuộc cách mạng trong sinh chú thích cho ảnh.

Ngoài cập nhật các nghiên cứu mới ra, tác giả còn giới thiệu các tập dữ liệu phục vụ huấn luyện và kiểm thử hệ thống sinh chú thích, các loại độ đo phổ biến để đánh giá hiệu quả sinh chú thích cho ảnh và đề xuất một số hướng nghiên cứu về lĩnh vực chú thích ảnh mà các nhà nghiên cứu có thể đi sâu tìm hiểu.

1. Tổng quan quy trình hoạt động của sinh chú thích cho ảnh

- Mã hóa đặc trưng ảnh:

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

Mã hóa đặc trưng ảnh: loại bỏ các lớp phân loại.

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Giải mã tuần tự

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Tạo câu

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

2. Các kiến trúc của sinh chú thích cho ảnh

- Kiến trúc: Encoder-Decoder

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Kiến trúc: Multi-Modal

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Kiến trúc: Object Detection backbone

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Kiến trúc: Encoder-Decoder với Attention

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Kiến trúc: Encoder-Decoder với Transformers

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

- Kiến trúc: Dense Captioning

NGHIÊN CỨU VỀ CÁC KỸ THUẬT, BỘ DỮ LIỆU VÀ ĐỘ ĐO CỦA SINH CHÚ THÍCH CHO ẢNH

TS CNTT: 0966563186