Khóa Luận Tốt Nghiệp Về Trích Xuất Thông Tin Từ Bìa Sách Tiếng Việt

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

2022

82
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. MỞ ĐẦU

2. CHƯƠNG 1: BÀI TOÁN TRÍCH XUẤT THÔNG TIN TRÊN BÌA SÁCH TIẾNG VIỆT

2.1. Bài toán trích xuất thông tin trên bìa sách tiếng Việt

2.2. Phương pháp đề xuất giải quyết bài toán

3. CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

3.1. Các công trình nghiên cứu trên ngôn ngữ nước ngoài

3.2. Các công trình nghiên cứu trên ngôn ngữ tiếng Việt

4. CHƯƠNG 4: XÂY DỰNG BỘ DỮ LIỆU CHO BÀI TOÁN TRÍCH XUẤT THÔNG TIN TRÊN BÌA SÁCH TIẾNG VIỆT

4.1. Hướng dẫn gán nhãn dữ liệu

4.2. Quá trình gán nhãn dữ liệu

5. CÁC PHƯƠNG PHÁP TIẾP CẬN

5.1. Tiền xử lý chia dữ liệu tập huấn luyện, tập kiểm thử và tập đánh giá

5.2. Tiền xử lý dữ liệu cho mô hình phát hiện văn bản (Text Detection)

5.3. Tiền xử lý dữ liệu cho mô hình Text Recognition

5.4. Tiền xử lý dữ liệu cho mô hình Object detection

5.5. Bài toán phát hiện chữ trên ảnh (Text Detection)

5.5.1. Hệ thống nhận dạng chữ viết PaddleOCR

5.5.2. Mô hình EAST

5.5.3. Mô hình SAST

5.5.4. Mô hình CRAFT

5.6. Bài toán nhận diện chữ trên ảnh (Text Recognition)

5.6.1. Mô hình CRNN trong hệ thống PP-OCR

5.6.2. Mô hình SVTR-LCNet trong hệ thống PP-OCR

5.6.3. Thư viện VietOCR

5.7. Bài toán xử lý tổng hợp thông tin

5.7.1. Mô hình Yolov4

6. CÀI ĐẶT, THỰC NGHIỆM VÀ ĐÁNH GIÁ

6.1. Cài đặt, thực nghiệm

6.1.1. Bài toán phát hiện văn bản (Text Detection)

6.1.2. Bài toán nhận diện văn bản

6.1.3. Phân loại và tổng hợp thông tin

6.2. Kết quả thực nghiệm và đánh giá

7. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Khóa luận tốt nghiệp khoa học dữ liệu trích xuất thông tin trên bìa sách tiếng việt

Tài liệu có tiêu đề Trích Xuất Thông Tin Từ Bìa Sách Tiếng Việt cung cấp cái nhìn sâu sắc về quy trình và kỹ thuật trích xuất thông tin từ bìa sách, đặc biệt là trong ngữ cảnh tiếng Việt. Nội dung chính của tài liệu nhấn mạnh tầm quan trọng của việc sử dụng công nghệ hiện đại để nhận diện và phân tích các đặc trưng của bìa sách, từ đó giúp cải thiện khả năng tìm kiếm và quản lý thông tin trong thư viện số.

Độc giả sẽ nhận được nhiều lợi ích từ tài liệu này, bao gồm việc hiểu rõ hơn về các phương pháp trích xuất thông tin, cũng như ứng dụng của chúng trong các hệ thống thông tin hiện đại. Để mở rộng kiến thức và khám phá thêm về các khía cạnh liên quan, bạn có thể tham khảo tài liệu Khóa luận tốt nghiệp khoa học dữ liệu trích xuất các đặc trưng sử dụng mô hình học sâu ứng dụng trong hệ thống phát hiện xâm nhập. Tài liệu này sẽ giúp bạn hiểu rõ hơn về việc áp dụng các mô hình học sâu trong việc trích xuất thông tin, từ đó nâng cao khả năng phát hiện và phân tích dữ liệu trong các hệ thống hiện đại.