Luận văn tốt nghiệp: Phát triển hệ thống trích xuất bảng từ hình ảnh tài liệu

Trường đại học

Ho Chi Minh University of Technology

Chuyên ngành

Computer Science

Người đăng

Ẩn danh

Thể loại

Thesis

2022 - 2023

56
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu

Nhu cầu trích xuất bảng từ hình ảnh tài liệu ngày càng trở nên cấp thiết trong bối cảnh chuyển đổi số. Hệ thống trích xuất bảng từ hình ảnh tài liệu trong khoa học máy tính không chỉ giúp tự động hóa quá trình thu thập thông tin mà còn cải thiện độ chính xác trong việc xử lý dữ liệu. Việc trích xuất bảng từ hình ảnh tài liệu đòi hỏi sự kết hợp của nhiều kỹ thuật, bao gồm xử lý hình ảnh, machine learning, và computer vision. Bài luận này tập trung vào việc phát triển một quy trình hoàn chỉnh cho việc trích xuất bảng từ hình ảnh tài liệu, nhằm giải quyết những thách thức trong việc nhận diện và phân loại bảng trong các tài liệu như hóa đơn, báo cáo tài chính và các biểu mẫu khác.

1.1. Tầm quan trọng của việc trích xuất bảng

Bảng là một trong những phương thức phổ biến nhất để tổ chức thông tin trong tài liệu. Việc trích xuất thông tin từ bảng giúp người đọc có thể so sánh và truy xuất thông tin nhanh chóng hơn. Tuy nhiên, do sự đa dạng và phức tạp của các kiểu bảng, việc chuyển đổi dữ liệu bảng từ hình ảnh tài liệu thành định dạng có thể đọc được bởi máy tính là một thách thức lớn. Điều này nhấn mạnh sự cần thiết của một công cụ trích xuất bảng hiệu quả, nhằm tối ưu hóa quy trình xử lý tài liệu và nâng cao hiệu quả trong các ứng dụng thực tiễn.

II. Hệ thống trích xuất bảng

Hệ thống trích xuất bảng được đề xuất trong bài luận này bao gồm nhiều bước quan trọng nhằm phát hiện, phân loại và trích xuất dữ liệu từ các vùng bảng trong hình ảnh tài liệu. Quy trình này không chỉ đơn thuần là nhận diện hình ảnh mà còn bao gồm việc xử lý hình ảnh và áp dụng các mô hình học sâu để cải thiện độ chính xác. Phân tích hình ảnh là bước đầu tiên, trong đó các mô hình như YOLO được sử dụng để phát hiện các vùng bảng trong hình ảnh. Sau đó, các vùng bảng được phân loại thành hai loại: bảng có viền và bảng không viền, nhằm phục vụ cho việc trích xuất thông tin từ các ô trong bảng.

2.1. Phát hiện vùng bảng

Quá trình phát hiện vùng bảng được thực hiện bằng cách áp dụng các kỹ thuật như convolutional neural networks (CNN). Mô hình YOLO được sử dụng để phát hiện bảng trong hình ảnh tài liệu, và các kỹ thuật xử lý hình ảnh như morphologyphân tích thành phần kết nối được áp dụng để tinh chỉnh kết quả phát hiện. Việc sử dụng các mô hình học sâu cho phép hệ thống nhận diện được các đặc điểm phức tạp của bảng, từ đó cải thiện độ chính xác trong việc phát hiện.

2.2. Phân loại bảng

Sau khi phát hiện, các bảng được phân loại thành bảng có viền và bảng không viền. Việc phân loại này rất quan trọng vì nó ảnh hưởng đến cách thức trích xuất dữ liệu từ các ô trong bảng. Mô hình MobilenetV3 được áp dụng để phân loại các bảng đã phát hiện, giúp hệ thống có thể xử lý và trích xuất thông tin một cách hiệu quả. Kết quả của quá trình phân loại cũng được đánh giá thông qua các bộ dữ liệu công khai và riêng, nhằm đảm bảo tính chính xác và khả năng áp dụng trong thực tiễn.

III. Ứng dụng thực tiễn

Hệ thống trích xuất bảng từ hình ảnh tài liệu có nhiều ứng dụng trong các lĩnh vực như quản lý tài liệu, phân tích dữ liệu và tự động hóa quy trình văn phòng. Việc áp dụng công nghệ này giúp tiết kiệm thời gian và nguồn lực trong việc xử lý thông tin từ các tài liệu lớn. Hệ thống thông minh này không chỉ giúp cải thiện hiệu suất công việc mà còn nâng cao độ chính xác trong việc thu thập và phân tích dữ liệu. Các ứng dụng trong môi trường công nghiệp cũng cho thấy rằng việc trích xuất bảng từ hình ảnh tài liệu có thể được tích hợp vào các quy trình làm việc hiện tại, từ đó cải thiện hiệu quả và giảm thiểu sai sót.

3.1. Tích hợp vào quy trình làm việc

Việc tích hợp hệ thống trích xuất bảng vào quy trình làm việc hiện tại có thể giúp các doanh nghiệp cải thiện quy trình xử lý tài liệu. Hệ thống có thể tự động nhận diện và trích xuất thông tin từ các tài liệu như hóa đơn, báo cáo tài chính, giúp giảm thiểu thời gian và công sức cần thiết cho việc xử lý thủ công. Điều này không chỉ làm tăng hiệu quả công việc mà còn giúp giảm thiểu sai sót do con người gây ra.

10/01/2025
Luận văn tốt nghiệp khoa học máy tính developing a pipeline for table extraction in document images
Bạn đang xem trước tài liệu : Luận văn tốt nghiệp khoa học máy tính developing a pipeline for table extraction in document images

để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài luận văn tốt nghiệp mang tiêu đề "Phát triển hệ thống trích xuất bảng từ hình ảnh tài liệu" của tác giả Lu Anh Khoa, dưới sự hướng dẫn của các giảng viên Dr. Tran Tuan Anh, Dr. Nguyen Tien Thinh và Mr. Nguyen Nam Quan, được thực hiện tại Trường Đại Học Bách Khoa TP.HCM trong năm học 2022 - 2023. Bài viết tập trung vào việc phát triển một hệ thống có khả năng trích xuất bảng từ hình ảnh tài liệu, một vấn đề quan trọng trong lĩnh vực khoa học máy tính. Hệ thống này không chỉ giúp tự động hóa quá trình thu thập dữ liệu từ tài liệu hình ảnh mà còn nâng cao hiệu quả trong việc xử lý và phân tích thông tin.

Độc giả có thể tìm hiểu thêm về các chủ đề liên quan như Giải pháp thanh toán nhanh món ăn ở căn tin trường học thông qua thuật toán nhận dạng hình ảnh, nơi mà các thuật toán nhận dạng hình ảnh được ứng dụng trong một lĩnh vực khác. Ngoài ra, bài viết Các Tấn Công Tích Cực Lên Hệ Thống Thông Tin Di Động 5G: Nghiên Cứu Luận Văn Thạc Sĩ 2023 cũng đề cập đến các vấn đề an ninh trong công nghệ thông tin, một khía cạnh quan trọng trong việc bảo vệ dữ liệu. Cuối cùng, bài viết Ứng dụng mô hình ngôn ngữ lớn trong chuyển đổi văn bản thành SQL mở rộng thêm về cách thức xử lý và phân tích dữ liệu, giúp độc giả có cái nhìn sâu sắc hơn về các ứng dụng công nghệ trong việc tối ưu hóa quy trình làm việc.

Những tài liệu này không chỉ cung cấp thêm thông tin mà còn mở rộng kiến thức cho những ai quan tâm đến các ứng dụng công nghệ trong khoa học máy tính.

Tải xuống (56 Trang - 3.7 MB )