Khóa luận tốt nghiệp: Hệ thống trích xuất thông tin văn bản từ ảnh hành chính

2021

96
2
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: MỞ ĐẦU

1.1. Đặt vấn đề

1.2. Mục tiêu và phạm vi

1.3. Đóng góp của khóa luận

1.4. Cấu trúc khóa luận

2. CHƯƠNG 2: TỔNG QUAN

2.1. Giới thiệu các bài toán rút trích thông tin trong hình ảnh văn bản và các bài toán liên quan

2.1.1. Bài toán rút trích thông tin

2.1.2. Bài toán phát hiện văn bản

2.1.3. Bài toán nhận diện chữ

2.2. Một số nghiên cứu liên quan đối với bài toán rút trích thông tin

2.2.1. Hướng tiếp cận truyền thống

2.2.2. Sử dụng các kĩ thuật học sâu

2.2.2.1. Sử dụng nội dung chữ viết trong văn bản
2.2.2.2. Sử dụng phối hợp các đặc trưng trực quan và nội dung chữ viết

3. CHƯƠNG 3: CƠ SỞ LÝ THUYẾT

3.1. Ý tưởng cốt lõi trong Transformer

3.1.1. Multi-Head Attention

3.2. Mạng thần kinh đồ thị học sâu (Graph neural network - GNN)

3.2.1. Một số khai niệm trong lí thuyết đồ thị

3.2.2. Các bài toán điển hình đối với GNN

3.3. Nhúng thông tin trong đồ thị (Graph-based Embedding)

3.4. Áp dụng Deep Learning vào bài toán nhận diện chữ viết tiếng Việt

3.4.1. Phát hiện dòng văn bản bằng Pixel Aggregation Network (PANet)

3.4.2. Nhận diện chữ bằng VietOCR

3.5. Rút trích thông tin từ hình ảnh văn bản sử dụng SDMGR

4. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Mở đầu

4.2. Xây dựng tập dữ liệu

4.2.1. Giai đoạn phát hiện dòng văn bản (Text line Detection)

4.2.1.1. Quá trình thu thập dữ liệu
4.2.1.2. Quá trình tiền xử lý dữ liệu
4.2.1.3. Thống kê số liệu tập dữ liệu

4.2.2. Giai đoạn nhận diện chữ (Text Recognition)

4.2.2.1. Quá trình thu thập dữ liệu
4.2.2.2. Quá trình tiền xử lý dữ liệu
4.2.2.3. Cách thức thực hiện
4.2.2.4. Thống kê số liệu tập dữ liệu

4.2.3. Giai đoạn trích xuất thông tin từ trong văn bản (Key information extraction)

4.2.3.1. Quá trình thu thập dữ liệu
4.2.3.2. Quá trình tiền xử lý dữ liệu
4.2.3.3. Thống kê số liệu tập dữ liệu

4.3. Một số khái niệm cơ bản

4.4. Kết quả và đánh giá

4.4.1. Giai đoạn phát hiện chữ (Text Detection)

4.4.2. Giai đoạn nhận diện chữ (Text Recognition)

4.4.3. Giai đoạn trích xuất thông tin (Key information extraction)

4.5. Đánh giá toàn hệ thống

5. CHƯƠNG 5: XÂY DỰNG ỨNG DỤNG MINH HỌA THỰC NGHIỆM

5.1. Danh sách Use-case

5.1.1. Đặc tả Use-case "Chọn ảnh từ thư mục"

5.1.2. Đặc tả Use-case "Chọn ảnh từ đường dẫn"

5.1.2.1. Chọn ảnh từ thư mục
5.1.2.2. Chọn ảnh từ đường dẫn

5.2. Mô hình hóa ứng xử

5.2.1. Luồng xử lý dữ liệu

5.2.2. Mô tả chi tiết từng thành phần trong hệ thống

5.2.2.1. Các API hệ thống rút trích thông tin từ hình ảnh văn bản

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

6.1. Kết luận

6.2. Hướng phát triển

Tài liệu tham khảo

Khóa luận tốt nghiệp khoa học máy tính tìm hiểu và xây dựng hệ thống trích xuất thông tin văn bản trên dữ liệu ảnh văn bản hành chính

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học máy tính tìm hiểu và xây dựng hệ thống trích xuất thông tin văn bản trên dữ liệu ảnh văn bản hành chính

Tài liệu "Hệ thống trích xuất thông tin văn bản từ ảnh hành chính" trình bày một giải pháp công nghệ tiên tiến nhằm tự động hóa quá trình trích xuất thông tin từ các tài liệu hành chính dưới dạng hình ảnh. Hệ thống này không chỉ giúp tiết kiệm thời gian và công sức cho người dùng mà còn nâng cao độ chính xác trong việc thu thập dữ liệu. Bằng cách áp dụng các thuật toán nhận diện ký tự quang học (OCR), tài liệu này mở ra cơ hội cho việc số hóa và quản lý thông tin hiệu quả hơn trong các lĩnh vực như hành chính, giáo dục và kinh doanh.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ trong tự động hóa và quản lý thông tin, bạn có thể tham khảo các tài liệu liên quan như Luận văn thạc sĩ kỹ thuật điều khiển và tự động hóa điều khiển cân bằng pendubot, nơi bạn sẽ tìm thấy những nghiên cứu sâu hơn về tự động hóa trong kỹ thuật. Ngoài ra, tài liệu Khóa luận tốt nghiệp khoa học máy tính tìm hiểu và xây dựng hệ thống phân loại hình ảnh văn bản cũng sẽ cung cấp cái nhìn sâu sắc về việc phân loại và xử lý hình ảnh văn bản, một khía cạnh quan trọng trong việc phát triển hệ thống trích xuất thông tin. Cuối cùng, bạn có thể khám phá thêm về Khóa luận tốt nghiệp kỹ thuật phần mềm cải tiến hệ thống điểm danh sinh viên trong lớp học tự động bằng dual camera có tích hợp mạng cnn, tài liệu này sẽ giúp bạn hiểu rõ hơn về ứng dụng của công nghệ trong việc tự động hóa quy trình quản lý.

Mỗi liên kết trên đều là cơ hội để bạn khám phá sâu hơn về các chủ đề liên quan, mở rộng kiến thức và ứng dụng công nghệ trong thực tiễn.