Khóa Luận Tốt Nghiệp: Nhận Dạng Ký Tự Hán-Nôm Sử Dụng Học Sâu

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

2022

123
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: MỞ ĐẦU

1.1. Đặt vấn đề

1.2. Lý do chọn đề tài. Mục tiêu khóa luận. Đối tượng và phạm vi nghiên cứu. Các nội dung chính

2. CHƯƠNG 2: TỔNG QUAN

2.1. Giới thiệu đề tài. Tính ứng dụng của đề tài. NGHIÊN CỨU LIÊN QUAN. Tình hình nghiên cứu trên thế giới. Tình hình nghiên cứu trong nước

4. CHƯƠNG 4: NHẬN DẠNG KÝ TỰ QUANG HỌC (OCR)

4.1. Các khái niệm cơ bản. Phân loại hình ảnh chứa văn bản. OCR và HỌC

4.2. Các bước triển khai chính. Một số dataset cho văn bản phi cấu trúc. Một số công cụ mã nguồn mở. Các thành phần tính toán chính

4.3. Mạng Nơ-ron Tích chập (CNN). Các khái niệm cơ bản. Phân vùng ảnh (Image Segmentation). Các khái niệm cơ bản. Ý tưởng từ mạng FCN

4.4. Mạng Nơ-ron Hồi tiếp (RNN). Các khái niệm cơ bản. Nút Hồi tiếp có Cổng (GRU). Mạng Nơ-ron Hồi tiếp 2 chiều

4.5. Mô hình chuỗi sang chuỗi (Seq2Seq). Cơ chế Tập trung (Attention Mechanism). Các tính toán chính. Seq2Seq sử dụng Cơ chế Tập trung. Tự tập trung (Self-Attention). Kiến trúc Transformer

5. CHƯƠNG 5: BỘ DỮ LIỆU NOMNAOCR

5.1. Khai quát chung. Thu thập dữ liệu. Xây dựng hướng dẫn (Guideline). Gán nhãn tự động (Auto annotation). Quy trình đánh giá. Triển khai thực tế. Các khó khăn cùng hướng xử lý. Phân tích và chia dữ liệu. Bộ dữ liệu Synthetic Nom String

6. CHƯƠNG 6: CÁC PHƯƠNG PHÁP TIẾP CẬN

6.1. Khởi nguồn và lý do tiếp cận bằng Học sâu. Phát hiện văn bản (Text Detection). Tiếp cận theo Regression-based với EAST. Tiếp cận theo Segmentation-based với DBNet. Nhận dạng văn bản (Text Recognition). Tiếp cận theo hướng sinh mô tả cho ảnh. Kiến trúc Injection và Merging. Kiến trúc dựa trên Cơ chế Tập trung. Mạng Nơ-ron Hồi tiếp Tích chập (CRNN). Tiếp cận theo hướng Seq2Seq trong dịch máy. Các mô hình TransformerOCR

7. CHƯƠNG 7: CÀI ĐẶT THỬ NGHIỆM

7.1. Triển khai cho bài toán Text Detection. Triển khai cho bài toán Text Recognition. Các giai đoạn huấn luyện. Cài đặt phần Xử lý ngôn ngữ. Thuật toán tối ưu (Optimizer). Các thông số khác. Thử nghiệm với các Kết nối tắt

8. CHƯƠNG 8: ĐÁNH GIÁ VÀ KẾT QUẢ

8.1. Phương pháp đánh giá. Metrics đánh giá Text Detection và End-to-End. Metrics đánh giá với riêng Text Recognition. Kết quả thử nghiệm. Kết quả bài toán Text Detection. Kết quả tổng quan. Kết quả theo từng tác phẩm. Kết quả bài toán Text Recognition. Kết quả giai đoạn Pre-training. Kết quả Fine-tuning và Retraining. Kết quả các ngưỡng

8.2. Kết quả End-to-End. Kết quả trên toàn bộ ảnh. Kết quả chi tiết trên thơ và văn xuôi. Phân tích lỗi. Phân tích lỗi cho bài toán Text Detection

8.3. Phân tích lỗi cho bài toán Text Recognition

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Khóa luận tốt nghiệp khoa học dữ liệu nhận diện ký tự hán nôm sử dụng deep learning