Hỏi Đáp Tự Động Dựa Trên Hình Ảnh Chủ Đề Mở Trong Tiếng Việt

2023

99
1
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: MÔ TẢ BÀI TOÁN. CÁC CÔNG TRÌNH LIÊN QUAN. LÝ DO THỰC HIỆN ĐỀ TÀI. HẠN CHẾ CỦA BỘ DỮ LIỆU VQAV2. HẠN CHẾ CỦA BỘ DỮ LIỆU TEXTVQA. HẠN CHẾ CỦA BỘ DỮ LIỆU VIVQA. TỔNG QUAN QUY TRÌNH.

1.1. Thu thập hình ảnh

1.2. Xây dựng guideline tạo câu hỏi — câu trả lời

1.3. Xây dựng công cụ tạo dữ liệu

1.4. Huy động nhân lực và tạo câu hỏi - câu trả lời

1.5. Thẩm định và hoàn thiện bộ dữ liệu

1.6. Phân loại cặp câu hỏi — câu trả lời

1.7. Xác định vị trí của đối tượng trong hình ảnh

1.8. Xác định số lượng đối tượng trong hình ảnh

1.9. Xác định màu sắc của đối tượng trong hình ảnh

1.10. Phân tích tổng quan đặc trưng bộ dữ liệu

1.11. Các phương pháp thử nghiệm

1.12. Thiết lập tham số thí nghiệm

2. CHƯƠNG 2: PHƯƠNG PHÁP TRÍCH XUẤT ĐẶC TRƯNG CỦA HÌNH ẢNH. PHƯƠNG PHÁP TRÍCH XUẤT SCENE TEXT TRONG HÌNH ẢNH. CÁC PHƯƠNG PHÁP ĐÁNH GIÁ.

2.1. Show, Ask, Attend and Answer (SAAA)

2.2. Modular Co-Attention Neural Network (MCAN)

2.3. Look, Read, Reason and Answer (LoRRA)

2.4. Iterative Answer Prediction with Pointer - Augmented Multimodal Transformer (M4C)

2.5. Các phương pháp cải tiến dựa trên các mô hình classifier

2.5.1. Modular Co-Attention Neural Network with Generator (MCAN+generator)

2.5.2. Show, Ask, Attend and Answer with Generator (SAAA+Generator)

2.5.3. Look, Reason, Read and Answer with Generator (LoRRA+generator)

2.6. Các kết quả thử nghiệm

2.6.1. Kết quả chính

2.6.2. Hướng tiếp cận dựa trên phân loại câu trả lời không phù hợp với bộ dữ liệu OpenViVQA

2.6.3. Các phương pháp học sâu cần thêm thông tin từ scene text để hiểu câu hỏi tốt hơn và đưa ra câu trả lời phù hợp

3. CHƯƠNG 3: CÁC KẾT QUẢ THỬ NGHIỆM VỚI PHƯƠNG PHÁP M4C. PHÂN TÍCH KẾT QUẢ. ĐÓNG GÓP, HẠN CHẾ VÀ HƯỚNG PHÁT TRIỂN.

3.1. Tác động từ các yếu tố của scene text lên hiệu năng của M4C-small

3.2. Tác động của kích thước lên hiệu năng của M4C

3.3. Tác động của mô hình ảnh được huấn luyện sẵn lên hiệu năng của M4C

3.4. Phân tích kết quả

3.4.1. Kết quả của mô hình M4C-small trên Non-text QA

3.4.2. Kết quả của mô hình M4C-small trên text QA

3.4.3. Ảnh hưởng của độ dài câu hỏi — câu trả lời lên kết quả của M4C-small

3.4.4. Ảnh hưởng của mô hình OCR lên kết quả của M4C

3.4.5. Ảnh hưởng của mô hình ảnh được huấn luyện sẵn lên kết quả của M4C

3.4.6. Phân tích kết quả của các độ đo đánh giá trên bộ dữ liệu OpenViVQA

3.5. Đóng góp, hạn chế và hướng phát triển

DANH MỤC HÌNH

DANH MỤC BẢNG

DANH MỤC BIỂU ĐỒ

TÓM TẮT KHÓA LUẬN

Khóa luận tốt nghiệp khoa học dữ liệu hỏi đáp tự động dựa trên hình ảnh trong tiếng việt