Khóa luận tốt nghiệp: Đánh giá phương pháp học sâu cho bài toán hỏi đáp trên ảnh infographics tiếng Việt

Trường đại học

Đại học Công nghệ Thông tin

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

2021

115
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT KHÓA LUẬN

1. CHƯƠNG 1: TỔNG QUAN

1.1. Đặt vấn đề

1.2. Phạm vi và mục tiêu

1.3. Đóng góp của khóa luận

1.4. Cấu trúc khóa luận

2. CHƯƠNG 2: KIẾN THỨC CƠ SỞ

2.1. Mở đầu

2.2. Tổng quan về bài toán hỏi đáp trên hình ảnh infographic

2.2.1. Ảnh infographic là gì?

2.2.2. Định nghĩa bài toán

2.2.3. Nhu cầu của bài toán

2.2.4. Vai trò của ảnh infographic trong cuộc sống

2.2.5. Thách thức của bài toán

2.3. Các nghiên cứu liên quan

2.3.1. Hướng tiếp cận modular method

2.3.2. Hướng tiếp cận monolithic method

2.4. Kiến trúc tổng quan cho bài toán hỏi đáp trên ảnh

2.4.1. Rút trích đặc trưng thị giác

2.4.1.1. Một số kiến trúc dùng để rút trích đặc trưng thị giác

2.4.2. Rút trích đặc trưng văn bản

2.4.2.1. Một số kiến trúc dùng để rút trích đặc trưng trong văn bản

2.4.3. Kết hợp thông tin thị giác và văn bản

3. CHƯƠNG 3: ĐÁNH GIÁ MỘT SỐ PHƯƠNG PHÁP HỌC SÂU CHO BÀI TOÁN HỎI ĐÁP DỰA TRÊN ẢNH INFOGRAPHIC

3.1. Kiến trúc Transformer

3.1.1. Các thành phần cơ bản trong Transformer

3.2. Phương pháp BERT

3.2.1. Các giai đoạn trong mô hình BERT

3.2.2. Các kiến trúc mô hình BERT

3.2.3. Áp dụng BERT cho bài toán hỏi đáp

3.3. Phương pháp LayoutLMv2

3.3.1. Kiến trúc mô hình

3.3.2. Multi-modal Encoder with Spatial-Aware Self-Attention Mechanism

3.3.3. Huấn luyện mô hình LayoutLMv2

3.3.3.1. Giai đoạn fine-tuning

4. CHƯƠNG 4: XÂY DỰNG BỘ DỮ LIỆU HỎI ĐÁP INFOGRAPHIC CHO TIẾNG VIỆT

4.1. Mô tả dữ liệu

4.2. Xây dựng tập dữ liệu VilnfographicVQA

4.2.1. Thu thập ảnh infographic

4.2.2. Quá trình thu thập dữ liệu

4.2.3. Quá trình tiền xử lý dữ liệu

4.2.4. Thống kê số liệu tập dữ liệu

4.2.5. Xây dựng dữ liệu OCR (OCR token annotations)

4.2.5.1. Tạo OCR token bằng Tesseract

4.2.6. Xây dựng dữ câu hỏi câu trả lời (Question-Answer annotation)

4.2.6.1. Xây dựng tập câu hỏi-câu trả lời
4.2.6.2. Phân loại câu hỏi-câu trả lời
4.2.6.3. Thông tin thống kê bộ dữ liệu VilnfographicVQA

5. CHƯƠNG 5: THỰC NGHIỆM VÀ ĐÁNH GIÁ

5.1. Tập dữ liệu InfographicVQA

5.2. Tập dữ liệu VilnfographicVQA

5.3. Average Normalized Levenshtein Similarity (ANLS)

5.4. Kết quả đánh giá trên InfographicVQA

5.5. Kết quả đánh giá trên VilnfographicVQA

5.6. Một số nhận xét

5.6.1. Phương pháp cho bài toán

5.6.2. Tập dữ liệu VilnfographicVQA

5.6.3. Xây dựng ứng dụng minh họa

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

6.1. Kết luận

6.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

DANH SÁCH HÌNH VẼ

DANH SÁCH BẢNG

DANH MỤC TỪ VIẾT TẮT