Nghiên Cứu và Triển Khai Ứng Dụng Trích Xuất Thông Tin Từ Hóa Đơn Thanh Toán

Luận văn thạc sĩ nghiên cứu máy tính nghiên cứu và triển khai ứng dụng trích xuất thông tin từ hóa đơn thanh toán research and, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện

Trường đại học

Đại học Quốc gia TP. HCM Trường Đại học Công nghệ Thông tin

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2024

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN

1.1. Mục tiêu đề tài

1.1.1. Mục tiêu tổng quan

1.1.2. Mục tiêu cụ thể

1.2. Đối tượng và phạm vi đề tài

1.2.1. Đối tượng nghiên cứu

1.2.2. Giới hạn đề tài

1.3. Phương pháp thực hiện

1.4. Ý nghĩa của đề tài

2. CHƯƠNG 2: CÁC NGHIÊN CỨU VÀ CÔNG NGHỆ LIÊN QUAN

2.1. Xu hướng và các công nghệ nghiên cứu trên thế giới

2.2. Xu hướng và các công nghệ nghiên cứu tại Việt Nam

2.3. Cơ sở lý thuyết và hướng tiếp cận đề tài

2.3.1. Bài toán Scene Text Recognition

2.3.2. Các mô hình máy học cho việc phát hiện đối tượng

3. CHƯƠNG 3: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG

3.1. Thiết kế hệ thống tổng quan

3.2. Thiết kế chi tiết

3.3. Giao diện người dùng

3.4. Các hàm, phương thức xử lý

3.5. Cơ sở dữ liệu

3.6. Ngữ cảnh thiết kế

4. CHƯƠNG 4: THỰC HIỆN VÀ TRIỂN KHAI HỆ THỐNG

4.1. Thực hiện các thành phần của hệ thống

4.2. Tập dữ liệu (Dataset)

4.3. Thực hiện thực nghiệm

4.4. Triển khai hệ thống

4.5. Một số hình ảnh triển khai hệ thống

5. CHƯƠNG 5: KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ

5.1. Đánh giá độ chính xác và hiệu quả mô hình máy học

5.2. Lý thuyết phép đo đánh giá mô hình

5.3. Đánh giá kết quả

5.4. Đánh giá kết quả của ứng dụng

5.5. Kết quả thu được

5.6. Ý nghĩa thực tiễn

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN TƯƠNG LAI

6.1. Kết quả đạt được

6.2. Một số khó khăn, hạn chế của đề tài

6.3. Hướng phát triển tương lai

TÀI LIỆU THAM KHẢO

DANH MỤC CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC HÌNH ẢNH

DANH MỤC CÁC BẢNG

Tóm tắt

I. Tổng Quan Ứng Dụng Trích Xuất Thông Tin Từ Hóa Đơn 55 ký tự

Sự phát triển mạnh mẽ của công nghệ thông tin thúc đẩy các nghiên cứu nâng cao chất lượng cuộc sống. Chuyển đổi số, đặc biệt trong lĩnh vực tiêu dùng, đòi hỏi thu thập, xử lý và số hóa dữ liệu hàng hóa để nắm bắt nhu cầu thị trường. Tuy nhiên, xử lý thủ công hóa đơn tốn kém và mất thời gian. Trích xuất thông tin từ hóa đơn thanh toán đối mặt với thách thức xử lý lượng lớn dữ liệu không cấu trúc, đa dạng. Luận văn này tập trung giải quyết bài toán này. Các giải pháp rút trích dữ liệu từ hình ảnh hóa đơn đã phát triển, nhưng vẫn còn vấn đề về độ chính xác và khả năng đáp ứng linh hoạt. Đề xuất phương pháp vận dụng mô hình máy học, công nghệ liên quan để nâng cao khả năng rút trích thông tin. Mô hình máy học như YOLO và công cụ nhận dạng ký tự quang học Tesseract OCR, hứa hẹn giải pháp linh hoạt.

1.1. Mục Tiêu Tổng Quan Nghiên Cứu Trích Xuất Hóa Đơn

Mục tiêu chính là tìm hiểu và nghiên cứu các mô hình, công cụ áp dụng trong xử lý hình ảnh, hướng đến phát triển mô hình máy học có khả năng xử lý, rút trích thông tin từ hóa đơn thanh toán. Cải thiện độ chính xác và hiệu suất là yếu tố then chốt. Đồng thời, xây dựng ứng dụng tự động hóa thực hiện xử lý và rút trích thông tin từ hóa đơn thanh toán một cách hiệu quả. Ứng dụng này sẽ giảm thiểu thời gian và sai sót trong quá trình nhập liệu thủ công.

1.2. Giới Hạn Phạm Vi Đề Tài Nghiên Cứu OCR Hóa Đơn

Luận văn tập trung vào trích xuất thông tin trên ảnh chụp hóa đơn in từ máy tính tiền theo tiêu chuẩn. Tập dữ liệu sử dụng là SROIE (Scanned Receipts OCR and Information Extraction). Nghiên cứu phương pháp, kỹ thuật kết hợp mô hình máy học YOLO và Tesseract OCR để tăng cường độ chính xác trong việc rút trích thông tin. Do giới hạn thời gian, hệ thống có thể còn một vài hạn chế cần được tiếp tục phát triển.

II. Vấn Đề Thách Thức Trích Xuất Dữ Liệu Hóa Đơn 57 ký tự

Xử lý hóa đơn thủ công tốn nhiều thời gian và dễ mắc lỗi, gây chậm trễ cho đội ngũ kế toán. Công nghệ OCR truyền thống không hiệu quả với hóa đơn phức tạp và đa dạng. OCR chỉ hữu ích cho tài liệu đồng nhất, không linh hoạt cho các loại hóa đơn khác nhau. Các nghiên cứu hiện nay ứng dụng trí tuệ nhân tạo cho xử lý và rút trích thông tin từ hóa đơn. Mô hình máy học, học sâu như YOLO và Tesseract, được cải tiến để đáp ứng thách thức về chất lượng hình ảnh kém và phông nền phức tạp. Cần có các giải pháp trích xuất dữ liệu hóa đơn hiệu quả.

2.1. Xu Hướng Nghiên Cứu Trích Xuất Thông Tin Hóa Đơn Toàn Cầu

Các nghiên cứu trên thế giới tập trung vào việc vận dụng trí tuệ nhân tạo để giải quyết bài toán xử lý và rút trích thông tin từ hóa đơn. Các mô hình máy học, đặc biệt là học sâu, ngày càng được phát triển và ứng dụng rộng rãi. Trong đó, YOLO đã trải qua nhiều phiên bản, từ YOLOv1 đến YOLOv8, thể hiện sự ưu việt về tốc độ. Công nghệ OCR, đặc biệt là Tesseract, được cải tiến liên tục để xử lý các thách thức như chất lượng hình ảnh kém và phông nền phức tạp.

2.2. Nghiên Cứu Ứng Dụng AI Trong Kế Toán Tại Việt Nam

Các nghiên cứu tại Việt Nam tập trung tùy chỉnh và cải thiện công nghệ để phục vụ đặc thù thị trường nội địa. Thách thức chính là xử lý hóa đơn với nhiều kiểu chữ, ngôn ngữ khác nhau và định dạng không chuẩn. Nghiên cứu và phát triển giải pháp tích hợp với hệ thống hiện hành của tổ chức, cải thiện hiệu suất xử lý công việc. Tự động hóa quy trình kế toán là một mục tiêu quan trọng.

III. Giải Pháp Trích Xuất Thông Tin YOLO Tesseract 57 ký tự

Nhận dạng văn bản trong cảnh (Scene Text Recognition - STR) là lĩnh vực quan trọng trong thị giác máy tính và xử lý ngôn ngữ tự nhiên. Nhiệm vụ chính là trích xuất và nhận dạng văn bản từ hình ảnh thực tế. Các phương pháp truyền thống bao gồm lọc, ngưỡng, phát hiện cạnh và xác định vùng quan tâm (ROI). Các mô hình học sâu như YOLO và Tesseract OCR chứng minh hiệu quả vượt trội. Việc kết hợp mô hình học sâu với OCR mang lại độ chính xác và hiệu suất cao. Ứng dụng thực tế có thể thấy trong nhận dạng biển số xe, tự động hóa kiểm tra tài liệu và trích xuất thông tin từ biển quảng cáo.

3.1. Phân Tích Bài Toán Scene Text Recognition STR Chi Tiết

Các phương pháp truyền thống làm rõ và tách biệt văn bản khỏi nền, bao gồm các giai đoạn: Lọc và ngưỡng để chuyển đổi hình ảnh sang dạng nhị phân. Phát hiện cạnh sử dụng các bộ lọc như Sobel hoặc Canny. Xác định vùng quan tâm (ROI) trước khi áp dụng OCR. Các mô hình học sâu đã chứng minh hiệu quả vượt trội nhờ khả năng học đặc trưng mạnh mẽ.

3.2. Ưu Điểm Khi Kết Hợp YOLO Và Tesseract Trong OCR

Việc kết hợp mô hình học sâu với OCR mang lại độ chính xác cao, cũng như việc hiệu suất được cải thiện: YOLO giúp phát hiện chính xác các vùng văn bản, giảm nhiễu và cải thiện chất lượng đầu vào cho OCR. Tăng tốc độ xử lý và giảm lỗi nhận dạng. Có thể áp dụng trong nhiều lĩnh vực như nhận dạng biển số xe, tự động hóa kiểm tra tài liệu và trích xuất thông tin từ biển quảng cáo. Tuy nhiên, cần lưu ý đến độ phức tạp và yêu cầu tài nguyên cao.

IV. So Sánh YOLO vs Faster R CNN Cho Trích Xuất Hóa Đơn 60 ký tự

Trong lĩnh vực máy học phát hiện đối tượng, Faster R-CNN (nhận diện hai bước) và YOLO (nhận diện một bước) là hai mô hình nổi bật. Faster R-CNN đạt độ chính xác cao hơn, nhưng phức tạp hơn do phải qua hai giai đoạn suy luận. YOLO, với cấu trúc đơn giản, có thể phát hiện đối tượng chỉ với một lần quét. YOLO nhanh và hài hòa tốc độ, độ chính xác, phù hợp ứng dụng cần phản hồi thời gian thực. Vì vậy, YOLO được chọn cho nghiên cứu trích xuất thông tin hóa đơn này.

4.1. Ưu Điểm Vượt Trội Của YOLO Trong Phát Hiện Đối Tượng

YOLO đặc biệt nổi bật với tốc độ cao trong thời gian thực bằng cách chỉ xem qua một lần toàn bộ hình ảnh để dự đoán vị trí và phân loại các đối tượng. YOLOv1 đưa ra khái niệm phát hiện đối tượng theo kiểu hội tụ, dùng một mạng thần kinh duy nhất. Điều này làm giảm đáng kể độ phức tạp trong các hệ thống phát hiện đối tượng và tăng cường tốc độ.

4.2. Các Phiên Bản YOLO và Cải Tiến Qua Các Năm

YOLOv2 và YOLOv3 đã cải tiến độ chính xác qua việc vận dụng các phương pháp mới. YOLOv4 và YOLOv5 tiếp tục đưa vào nhiều cải tiến về kiến trúc và hiệu suất. YOLOv6 và YOLOv7 tập trung vào khả năng tùy biến và triển khai thuận tiện. YOLOv8 (phiên bản mới nhất) có hiệu suất cao nhất trong nhiệm vụ phát hiện đối tượng, đạt được sự cân đối hoàn hảo giữa tốc độ và độ chính xác.

V. Thực Nghiệm Đánh Giá Ứng Dụng Trích Xuất Hóa Đơn 58 ký tự

Luận văn tập trung nghiên cứu và triển khai hệ thống trích xuất thông tin từ hình ảnh hóa đơn thanh toán, kết hợp mô hình máy học YOLO, công nghệ nhận dạng ký tự quang học Tesseract OCR và hiện thực ứng dụng. Quá trình nghiên cứu gồm chuẩn bị, xử lý dữ liệu từ tập SROIE, tìm hiểu các mô hình YOLO gần đây và tiến hành thực nghiệm. Mục tiêu là xác định mô hình phù hợp nhất cho phát hiện đối tượng trên hóa đơn thanh toán. Sau đó, kết hợp mô hình YOLO đã chọn với Tesseract OCR để trích xuất chính xác thông tin từ các vùng (ROI) đã phát hiện.

5.1. Kết Quả Thực Nghiệm Mô Hình Trích Xuất Thông Tin

Kết quả cho thấy sự kết hợp YOLO và Tesseract OCR không những tăng cường độ chính xác một cách rõ rệt, mà còn đóng góp vào việc tối ưu hóa xử lý trên hình ảnh hóa đơn có cấu trúc phức tạp. Hướng tới phát triển các hệ thống trí tuệ nhân tạo linh hoạt hơn trong tương lai. Từ đó, đề xuất hướng tiếp cận mới có thể tham khảo trong việc áp dụng trí tuệ nhân tạo vào lĩnh vực xử lý hóa đơn.

5.2. Ứng Dụng Web Trích Xuất Dữ Liệu Hóa Đơn Thực Tế

Hệ thống được triển khai qua ứng dụng web, cho phép xử lý ảnh hóa đơn thanh toán và nhận thông tin được kết quả trích xuất một cách nhanh chóng, chính xác. Các giải pháp hiệu quả nâng cao năng suất và hiệu quả trong công việc.

VI. Kết Luận Hướng Phát Triển Ứng Dụng Trích Xuất 52 ký tự

Ứng dụng trích xuất thông tin từ hóa đơn này đóng góp vào việc giảm thời gian, nguồn lực cho quá trình xử lý. Giúp cá nhân, tổ chức doanh nghiệp cân nhắc tối ưu hóa quản lý tài chính. Nghiên cứu không chỉ tập trung vào các mô hình, công nghệ hiện tại mà còn hiện thực phương pháp, khả năng ứng dụng, kết hợp của các mô hình máy học và công cụ liên quan. Với thị trường cạnh tranh, giảm thời gian xử lý rút trích thông tin từ hóa đơn thanh toán là cấp thiết với mục đích tăng hiệu suất và giảm thiểu sai sót.

6.1. Tóm Tắt Ý Nghĩa Thực Tiễn Của Nghiên Cứu

Đề tài tiếp cận bài toán từ góc độ mới, kết hợp mô hình máy học cho tác vụ phát hiện và công nghệ trích xuất thông tin quang học. Góp phần vào quá trình số hóa hóa đơn và quản lý hóa đơn điện tử hiệu quả.

6.2. Hướng Phát Triển Tương Lai Cho Hệ Thống OCR Hóa Đơn

Cần tiếp tục nghiên cứu và cải thiện để xử lý các loại hóa đơn phức tạp hơn, đa dạng về định dạng và ngôn ngữ. Tích hợp hệ thống với các nền tảng kế toán và quản lý tài chính khác để tạo ra giải pháp toàn diện. Nâng cao khả năng tự động hóa và xử lý hóa đơn tự động để giảm thiểu sự can thiệp của con người.

28/05/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính nghiên cứu và triển khai ứng dụng trích xuất thông tin từ hóa đơn thanh toán research and deployment of an application for extracting information from payment invoices

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh chuyển đổi số ngày càng phát triển mạnh mẽ trên toàn cầu, việc xử lý và số hóa dữ liệu từ hóa đơn thanh toán trở thành một nhu cầu cấp thiết đối với các cá nhân và doanh nghiệp. Theo ước tính, hàng triệu hóa đơn được phát sinh mỗi ngày với đa dạng định dạng và cấu trúc phức tạp, gây khó khăn lớn trong việc xử lý thủ công do tốn kém thời gian và nguồn lực. Luận văn này tập trung nghiên cứu và triển khai ứng dụng trích xuất thông tin từ hình ảnh hóa đơn thanh toán, nhằm giải quyết bài toán xử lý lượng lớn dữ liệu không cấu trúc một cách nhanh chóng và chính xác.

Mục tiêu chính của nghiên cứu là phát triển một hệ thống tự động sử dụng mô hình máy học YOLO kết hợp với công nghệ nhận dạng ký tự quang học (OCR) Tesseract để phát hiện và trích xuất các vùng thông tin quan trọng trên hóa đơn. Phạm vi nghiên cứu tập trung vào các hóa đơn được in từ máy tính tiền, sử dụng tập dữ liệu SROIE với hơn 1.000 ảnh hóa đơn, trong đó có 897 ảnh dùng cho huấn luyện và thẩm định mô hình, cùng 117 ảnh hóa đơn mục tiêu để tinh chỉnh và kiểm thử. Ý nghĩa của đề tài thể hiện qua việc nâng cao độ chính xác trích xuất thông tin, giảm thiểu sai sót và tăng hiệu suất xử lý, góp phần tối ưu hóa quản lý tài chính cho doanh nghiệp.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Mô hình phát hiện đối tượng YOLO (You Only Look Once): Đây là mô hình học sâu một bước, cho phép phát hiện nhiều đối tượng trong ảnh với tốc độ nhanh và độ chính xác cao. Phiên bản YOLOv8 được lựa chọn nhờ cải tiến về kiến trúc mạng CSPDarknet53, sử dụng các lớp Path Aggregation Network (PANet) và hàm loss CloU + DFL giúp tối ưu hóa dự đoán vùng chứa thông tin trên hóa đơn.
Công nghệ nhận dạng ký tự quang học Tesseract OCR: Là công cụ mã nguồn mở, hỗ trợ nhận dạng văn bản trên hình ảnh và PDF với hơn 100 ngôn ngữ. Tesseract sử dụng kỹ thuật Adaptive Thresholding, Connected Component Analysis và quy trình nhận dạng hai lượt (passes) để nâng cao độ chính xác trích xuất văn bản từ các vùng đã được phát hiện.

Các khái niệm chuyên ngành quan trọng bao gồm: Scene Text Recognition (STR), Region of Interest (ROI), Intersection over Union (IoU), Precision-Recall Curve, và Transfer Learning.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là tập ảnh hóa đơn SROIE gồm 1.014 hình ảnh, được phân chia thành 897 ảnh cho huấn luyện và thẩm định, 117 ảnh hóa đơn mục tiêu để tinh chỉnh mô hình và kiểm thử. Phương pháp phân tích sử dụng kỹ thuật học sâu với mô hình YOLOv8, kết hợp học chuyển tiếp (transfer learning) để tối ưu hóa hiệu suất trên tập hóa đơn mục tiêu.

Quá trình nghiên cứu gồm các bước: tiền xử lý dữ liệu (chuyển đổi nhãn sang định dạng YOLO), huấn luyện mô hình với batch size 16, kích thước ảnh 640x640, số epoch 40, đánh giá mô hình qua các chỉ số accuracy, precision, recall và F1-score. Ứng dụng web được phát triển trên nền tảng Laravel (PHP) kết hợp với Python, sử dụng các thư viện OpenCV và PyTorch để xử lý ảnh và triển khai mô hình.

Timeline nghiên cứu kéo dài trong khoảng 12 tháng, bao gồm giai đoạn thu thập và xử lý dữ liệu, huấn luyện và đánh giá mô hình, phát triển ứng dụng và thử nghiệm thực tế.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất mô hình YOLOv8 vượt trội: So với các phiên bản YOLOv5, YOLOv6 và YOLOv7, YOLOv8 đạt mAP (mean Average Precision) cao hơn khoảng 5-7%, với tốc độ xử lý nhanh hơn 20-30%, phù hợp cho ứng dụng thời gian thực.
Tăng độ chính xác trích xuất thông tin: Kết hợp YOLOv8 với Tesseract OCR giúp nâng cao độ chính xác nhận dạng văn bản lên đến 92%, tăng khoảng 15% so với chỉ sử dụng OCR truyền thống.
Khả năng xử lý đa dạng hóa đơn: Hệ thống có thể phát hiện và trích xuất chính xác các trường thông tin như tên hóa đơn, mã số, ngày lập, tên nhân viên, danh sách mặt hàng và tổng tiền trên nhiều định dạng hóa đơn khác nhau với tỷ lệ thành công trên 90%.
Tiết kiệm thời gian xử lý: Thời gian xử lý trung bình cho một hóa đơn giảm xuống còn khoảng 2 giây, so với 10-15 phút khi xử lý thủ công, giúp tăng hiệu suất làm việc đáng kể.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là nhờ kiến trúc mạng CSPDarknet53 và cơ chế PANet trong YOLOv8 giúp mô hình học được đặc trưng đa tỷ lệ và phát hiện chính xác các vùng nhỏ trên hóa đơn. Việc áp dụng học chuyển tiếp trên tập hóa đơn mục tiêu giúp mô hình thích ứng tốt với đặc thù dữ liệu thực tế.

So sánh với các nghiên cứu trước đây, kết quả này vượt trội về cả tốc độ và độ chính xác, đồng thời giảm thiểu sai sót do con người gây ra trong quá trình nhập liệu. Dữ liệu có thể được trình bày qua biểu đồ Precision-Recall và bảng so sánh mAP giữa các phiên bản YOLO, minh họa rõ ràng hiệu quả của mô hình được chọn.

Ý nghĩa của kết quả không chỉ nằm ở việc tự động hóa quy trình xử lý hóa đơn mà còn mở ra hướng phát triển các hệ thống trí tuệ nhân tạo linh hoạt hơn trong lĩnh vực quản lý tài chính và kế toán.

Đề xuất và khuyến nghị

Triển khai rộng rãi hệ thống tự động trích xuất thông tin hóa đơn: Đẩy mạnh ứng dụng trong các doanh nghiệp và tổ chức tài chính nhằm giảm thiểu chi phí và tăng hiệu quả quản lý.
Nâng cấp và mở rộng mô hình: Tiếp tục nghiên cứu tích hợp các mô hình học sâu mới, cải thiện khả năng nhận dạng các loại hóa đơn phức tạp và đa ngôn ngữ, hướng tới độ chính xác trên 95%.
Đào tạo và hỗ trợ người dùng: Tổ chức các khóa đào tạo sử dụng hệ thống cho nhân viên kế toán, đồng thời xây dựng tài liệu hướng dẫn chi tiết để tối ưu hóa quá trình áp dụng.
Phát triển giao diện người dùng thân thiện: Cải tiến ứng dụng web với các tính năng như chỉnh sửa thông tin trích xuất, báo cáo tự động và tích hợp với hệ thống quản lý doanh nghiệp hiện có.
Thời gian thực hiện: Các giải pháp trên nên được triển khai trong vòng 12-18 tháng, với sự phối hợp giữa nhóm phát triển công nghệ và các đơn vị sử dụng cuối.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Khoa học Máy tính, Trí tuệ nhân tạo: Nắm bắt kiến thức về ứng dụng mô hình YOLO và OCR trong xử lý ảnh và nhận dạng văn bản.
Chuyên gia phát triển phần mềm và kỹ sư AI: Áp dụng các kỹ thuật học sâu và công nghệ OCR để xây dựng hệ thống tự động hóa xử lý dữ liệu.
Doanh nghiệp và tổ chức tài chính: Tìm hiểu giải pháp nâng cao hiệu quả quản lý hóa đơn, giảm thiểu sai sót và tiết kiệm chi phí vận hành.
Người làm công tác kế toán và quản lý: Hiểu rõ về công nghệ hỗ trợ công việc, từ đó tối ưu hóa quy trình nhập liệu và kiểm tra hóa đơn.

Câu hỏi thường gặp

Hệ thống có thể xử lý những loại hóa đơn nào?
Hệ thống chủ yếu xử lý các hóa đơn được in từ máy tính tiền theo định dạng chuẩn, với khả năng mở rộng để nhận dạng các loại hóa đơn đa dạng hơn thông qua tinh chỉnh mô hình.
Độ chính xác của việc trích xuất thông tin đạt bao nhiêu?
Độ chính xác trung bình đạt khoảng 92%, cao hơn đáng kể so với các phương pháp truyền thống nhờ sự kết hợp giữa YOLOv8 và Tesseract OCR.
Thời gian xử lý một hóa đơn là bao lâu?
Trung bình khoảng 2 giây cho một hóa đơn, giúp tiết kiệm thời gian so với xử lý thủ công lên đến 10-15 phút.
Hệ thống có hỗ trợ đa ngôn ngữ không?
Tesseract OCR hỗ trợ hơn 100 ngôn ngữ, do đó hệ thống có thể được tùy biến để nhận dạng nhiều ngôn ngữ khác nhau trên hóa đơn.
Làm thế nào để tích hợp hệ thống vào quy trình làm việc hiện tại?
Ứng dụng web được xây dựng trên nền tảng Laravel dễ dàng tích hợp với các hệ thống quản lý doanh nghiệp thông qua API, đồng thời có giao diện thân thiện cho người dùng cuối.

Kết luận

Nghiên cứu thành công phát triển hệ thống trích xuất thông tin từ hóa đơn thanh toán sử dụng mô hình YOLOv8 kết hợp Tesseract OCR.
Hệ thống đạt độ chính xác trích xuất trên 90% và xử lý nhanh chóng, phù hợp với yêu cầu thực tế.
Ứng dụng web được triển khai hiệu quả, hỗ trợ người dùng tải lên, xử lý và quản lý hóa đơn dễ dàng.
Kết quả mở ra hướng phát triển các giải pháp trí tuệ nhân tạo trong lĩnh vực quản lý tài chính và kế toán.
Đề xuất tiếp tục nâng cấp mô hình và mở rộng phạm vi ứng dụng trong 12-18 tháng tới để tối ưu hóa hiệu quả và tính linh hoạt.

Hãy bắt đầu áp dụng công nghệ tự động hóa này để nâng cao hiệu suất và giảm thiểu sai sót trong quản lý hóa đơn ngay hôm nay!

Trích đoạn nội dung tài liệu

Chương 1. Mục tiêu đề tài 1. Mục tiêu tổng quan Thực hiện tìm hiểu, nghiên cứu các mô hình, công cụ áp dụng trong xứ lý hình ảnh: với mục đích phát triển mô hình máy học hiện tại có với khả năng xử lý, rút trích thông tin từ hóa đơn thanh toán. Từ đó cải thiện độ chính xác và hiệu suất.

Xây dựng ứng dụng: hiện thực ứng dụng tự động hóa thực hiện hiện xử lý và rút trích thông tin từ hóa đơn thanh toán hiệu quả. Mục tiêu cụ thể © _ Thực hiện nghiên cứu các công nghệ liên quan tới trích xuất thông tin từ hình ảnh, cụ thể là thông tin từ hình ảnh hóa đơn thanh toán. e Tìm hiểu mô hình máy học YOLO trong việc phát hiện đối tượng chứa thông tin từ ảnh hóa đơn thanh toán [6, 7]. Về tốc độ, YOLO - một trong những mô hình nhanh nhất hiện nay cho việc phát hiện đối tượng, với cấu trúc đơn giản và dễ triển khai.

Mặt khác, so sánh với các mô hình tương tự, việc ứng dụng phát hiện nhiều đối tượng đồng thời và có kích thước nhỏ trên ảnh có hiệu suất tốt hơn. Có thể YOLO cho. thấy độ chính xác, hiệu suất không quá ưu việt nhưng YOLO cho thấy độ hài hòa giữa tốc độ và độ chính xác trong ứng dụng thời gian thực, với việc phát hiện đối tượng trong một lần quét qua ảnh [6]. e Phương pháp rút trích văn bản hiệu qua Scene Text Recognition (STR) [5].

Với mục đích rút trích các nội dung chính trên hóa đơn như: tên của tổ chức, ngày, địa chỉ, mã số hóa đơn, tổng tiền, thông tin chỉ tiết các mặt hàng. Giới hạn phạm vi dé tài là thực hiện việc rút trích thông tin trên ảnh chụp hóa đơn có định dạng theo tiêu chuẩn được in từ máy tính tiền. Tập dữ liệu ảnh chụp các hóa đơn được in từ máy tính tiền SROIE (Scanned Receipts OCR and Information Extraction). ¢ _ Nghiên cứu phương pháp, kỹ thuật với mục đích kết hợp mô hình máy học YOLO và Tesseract OCR với mục đích đảm tăng cường độ chính xác trong việc rút trích thông tin.

e Xử lý tập dữ liệu: o_ Tiền xử lý dữ liệu nhằm phù hợp cho việc huấn luyện mô hình. Tổng quan o Tập dữ liệu sau đó được phân chia cho việc huấn luyện, thấm định va kiểm thử. Thực nghiệm và tiến hành đánh giá mô hình với các tiêu chí bao gồm: sự chính xác (accuracy), độ chính xác (precision), độ phủ (recall), Fl-score, và hiệu suất của mô hình xây dựng. Nghiên cứu và hiện thực ứng dụng thực nghiệm cho việc rút trích dữ liệu từ hình ảnh của hóa đơn thanh toán.

Đối tượng và phạm vi đề tài 1. Đối tượng nghiên cứu Nghiên cứu các mô hình máy học YOLO cho việc phát hiện vùng thông tin từ hóa đơn thanh toán, cùng với phương pháp phục vụ cho xử lý hình ảnh và rút trích văn bản hiệu quả Tesseract. Giới hạn đề tài Trong bối cảnh thời gian có giới hạn, việc hiện thực hệ thống hoàn thành các tiêu chí dé ra song trong quá trình phát triển, nhưng vẫn còn một vài hạn chế cần được tiếp tục phát triển. Phương pháp thực hiện Tìm hiểu bài toán, các nghiên cứu và công nghệ có liên quan.

Tìm hiểu và áp dụng các công cụ xử lý ảnh, mô hình máy học YOLO và Tesseract OCR. Thuc hiện đánh giá và chon mô hình tối ưu. Kết hợp mô hình máy học YOLOv8 (phát hiện các vùng thông tin) và công cụ trích xuất ký tự quang học Tesseract OCR (trích xuất nội dung). Phân tích thiết kế hệ thống.

Xây dựng ứng dụng, thực nghiệm và đánh giá. Ý nghĩa của đề tài Tinh ứng dụng: Triển khai ứng dụng này đóng góp vào việc giảm thiéu thời gian, nguồn lực cho quá trình xử lý hóa đơn giúp cá nhân, tổ chức doanh nghiệp cân nhắc với việc tối ưu hóa quản lý tài chính. Tính khoa học: Không chỉ nghiên cứu trên các mô hình, công nghệ hiện tại mà còn từ đó hiện thực phương pháp, khả năng ứng dụng, kết hợp của các mô hình máy học và công cụ liên quan. Tính cấp thiết: Với thị trường cạnh tranh, giảm thời gian xử lý rút trích thông tin từ hóa đơn thanh toán là cấp thiết với mục đích tăng hiệu suất và giảm thiểu sai sot.

Tính mới: Đề tài này tiếp cận bài toán từ một góc độ mới, kết hop mô hình máy học cho tác vụ phát hiện va công nghệ trích xuất thông tin quang học. Các nghiên cứu và công nghệ liên quan Chương 2 CÁC NGHIÊN CỨU VÀ CÔNG NGHỆ LIÊN QUAN Trong chương nay, tổng quan về những nghiên cứu hiện tại trên thé giới và tại Việt Nam. Cung cấp cái nhìn chỉ tiết liên quan tới tiến bộ công nghệ và nghiên cứu được vận dụng nhằm quyết những thách thức, từ đó định hình nền tảng lý thuyết và hướng tiếp cận mà đề tài này sẽ theo đuổi. Xu hướng và các công nghệ nghiên cứu trên thế giới Xử lý hóa đơn vẫn là vấn đề quan trọng và đầy thách thức, khó khăn trong việc xử lý thủ công do mắt nhiều thời giờ và dễ mắc phải lỗi.

Phần lớn các đội ngũ kế toán gặp phải sự chậm trễ liên quan tới quy trình không hiệu quả. Mặt khác, Công nghệ OCR truyền thống không hiệu quả với các hóa đơn phức tạp và đa dạng về định dạng. OCR hữu ích cho các tài liệu đồng nhất nhưng không linh hoạt cho các loại hóa đơn khác nhau [16]. Các nghiên cứu đây vận dung trí tuệ nhân tạo cho xử lý rút trích thông tin từ hóa đơn [17].

Các mô hình máy học, học sâu được phát triển và ứng dụng phổ biến. Trong đó, YOLO đã được biến đổi qua nhiều phiên bản, từ YOLOv1 đến YOLOv8 mới nhất, cho thấy sự ưu viét về tô. Cùng với đó, công nghệ OCR, đặc biệt là Tesseract, được cải tiên xử lý nhằm đáp ứng các thách thức như chất lượng hình ảnh kém và phông nền phức tạp [4, 5]. Xu hướng và các công nghệ nghiên cứu tại Việt Nam Các nghiên cứu đây mạnh việc tùy chỉnh và cải thiện các công nghệ nhằm phục vụ cho đặc thù thị của trường nội địa.

Các thách thức chính bao gồm việc xử lý hóa đơn với nhiều kiểu chữ và ngôn ngữ khác nhau, cũng như các định dạng hóa đơn không chuẩn. Nghiên cứu và phát triển giải pháp với mục đích tích hợp với hệ thong hiện hành của tốt chức, qua đó cải thiện hiệu suất xử lý trong công việc [1, 2]. Các nghiên cứu và công nghệ liên quan 2. Cơ sở lý thuyết và hướng tiếp cận đề tài 2.

Bài toán Scene Text Recognition Nhận dạng văn bản trong cảnh (Scene Text Recognition - STR) là một lĩnh vực nghiên cứu quan trọng trong thị giác máy tính và xử lý ngôn ngữ tự nhiên. Nhiệm vụ chính của STR là trích xuất và nhận dang văn ban xuất hiện trong hình ảnh chụp tir môi trường thực tế như biển quảng cáo, tạp chí, biển số xe, các tài liệu giấy tờ [18]. Các phương pháp truyền thống làm rõ và tách biệt văn bản khỏi nền, bao gồm các giai đoạn: ©_ Lọc và ngưỡng: Chuyên đồi hình ảnh sang dạng nhị phân dé phân đoạn văn bản ra khỏi nên. e Phat hiện cạnh: Sử dụng các bộ lọc như Sobel hoặc Canny để tìm kiếm các cạnh của ký tự trong hình ảnh.

© - Xác định vùng quan tâm (ROI): xác định các vùng có khả năng chứa văn bản trước khi áp dụng OCR bằng kỹ thuật nhận dạng mẫu. Các mô hình học sâu đã chứng minh hiệu quả vượt trội nhờ khả năng học đặc trưng mạnh mẽ và khả năng tông quát hóa tốt, bao gồm: ® YOLO: Phát hiện các vùng chứa văn bản chính xác và nhanh chóng. ¢ Tesseract OCR: Trích xuất văn ban từ các vùng đã được phát hiện. Việc kết hợp mô hình học sâu với OCR mang lại độ chính xác cao, cũng như việc hiệu suất được cải thiện: ¢ D6 chính xác: Giúp phát hiện chính xác các vùng văn bản, giảm nhiễu và cải thiện chất lượng đầu vào cho OCR.

© _ Hiệu suất: Tăng tốc độ xử lý và giảm lỗi nhận dạng. ° Ứng dụng thực tế: Có thể áp dụng trong nhiều lĩnh vực như nhận dạng biển số xe, tự động hóa kiểm tra tài liệu và trích xuất thông tin từ biển quảng cáo. Một số hạn chế: © D6 phức tạp: Kết hợp nhiều mô hình làm tăng độ phức tạp của hệ thống. Các nghiên cứu và công nghệ liên quan e _ Yêu cầu tài nguyên: Mô hình học sâu yêu cầu phần cứng mạnh và thời gian đào tạo dài.

e _ Xử lý trường hợp khó: Văn bản mờ, cong vênh hoặc có nền phức tạp vẫn là thách thức lớn. Sử dụng mô hình học sâu kết hợp với OCR mang lại kết quả ấn tượng trong nhận dạng văn bản trong cảnh, mở ra nhiều cơ hội ứng dụng thực tế. Tuy nhiên, vẫn còn nhiều thách thức cần giải quyết và hướng phát triển dé cải thiện và mở rộng công nghệ này. Các mô hình máy học cho việc phát hiện đối tượng Trong lĩnh vực máy học phát hiện đối tượng hiện nay, hai mô hình nổi bật là Faster R-CNN và YOLO, đại diện cho hai kiểu mô hình tiêu biểu, trong đó Faster R- CNN thuộc loại nhận diện hai bước (two-stage detection), trong khi YOLO là nhận điện một bước (one-stage detection).

Mặc dù Faster R-CNN đạt độ chính xác cao hơn một chút. Tuy nhiên, sự phức tạp trong việc suy luận do phải qua hai giai đoạn phức tạp [15]. Trong khi đó, YOLO, với cấu trúc đơn giản hơn, có thể phát hiện đối tượng chỉ với một lần quét. YOLO không chỉ nhanh mà còn hài hòa được tốc độ và độ chính xác, nhờ thế nên ưu tiên được lựa chọn cho các ứng dụng cần phản hồi thời gian thực [15].

Do đó, lựa chọn YOLO cho nghiên cứu này với nhiệm vụ phát hiện đối tượng. YOLO là mô hình tiên phong trong lĩnh vực phát hiện đối tượng. YOLO đặc biệt nồi bật với tốc độ cao trong thời gian thực bằng cách chỉ xem qua một lần toàn bộ hình ảnh dé dự đoán cùng lúc vị trí cộng với việc phân loại các đối tượng [6, 7]. YOLOvIl, ra mắt vào năm 201 5, đã đưa ra khái niệm phát hiện đối tượng theo.

kiêu hội tụ với việc dùng một mạng thần kinh (neural) duy nhất nhằm thực hiện dự đoán cùng lúc nhiều hộp giới hạn (bounding box) và xác suất cho mỗi hộp, thay vì dùng các hệ thống gợi ý vùng như các mô hình trước đó. Điều này làm giảm đáng kể độ phức tạp trong các hệ thông phát hiện đối tượng và tăng cường tốc độ.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu có tiêu đề Nghiên Cứu và Triển Khai Ứng Dụng Trích Xuất Thông Tin Từ Hóa Đơn Thanh Toán tập trung vào việc phát triển các ứng dụng công nghệ để trích xuất thông tin từ hóa đơn thanh toán, một lĩnh vực ngày càng quan trọng trong quản lý dữ liệu và tự động hóa quy trình. Nghiên cứu này không chỉ giúp cải thiện hiệu quả trong việc xử lý hóa đơn mà còn mang lại lợi ích lớn cho các doanh nghiệp trong việc tiết kiệm thời gian và chi phí.

Để mở rộng thêm kiến thức về các phương pháp và kỹ thuật liên quan, bạn có thể tham khảo tài liệu Luận văn thạc sĩ khoa học máy tính so sánh hiệu quả hai phương pháp paa epaa trong bài toán tìm kiếm tương tự và hai phương pháp sax esax trong bài toán nhận dạng chuỗi con bất đồng trong dữ liệu chuỗi thời gian, nơi bạn sẽ tìm thấy những phân tích sâu sắc về các phương pháp trích xuất dữ liệu.

Ngoài ra, tài liệu Luận văn thạc sĩ các kỹ thuật phân cụm trong khai phá dữ liệu sử dụng tính toán tiến hóa cũng sẽ cung cấp cho bạn cái nhìn tổng quan về các kỹ thuật phân tích dữ liệu, giúp bạn hiểu rõ hơn về cách thức khai thác thông tin từ các nguồn dữ liệu khác nhau.

Cuối cùng, bạn có thể tìm hiểu thêm về Tiểu luận ứng dụng phần mềm sql server data tool thực hiện khai phá dữ liệu tại công ty tnhh fornix, tài liệu này sẽ giúp bạn nắm bắt được cách ứng dụng các công cụ khai thác dữ liệu trong thực tế, từ đó mở rộng khả năng áp dụng các kỹ thuật trích xuất thông tin trong công việc của bạn.

Những tài liệu này không chỉ giúp bạn hiểu rõ hơn về lĩnh vực trích xuất thông tin mà còn mở ra nhiều cơ hội để bạn nâng cao kiến thức và kỹ năng trong ngành công nghệ thông tin.

#công nghệ nhận diện văn bản

#tối ưu hóa quy trình kinh doanh

#tự động hóa quy trình thanh toán

#trích xuất thông tin hóa đơn

#ứng dụng công nghệ OCR

#quản lý hóa đơn điện tử

Chủ đề

Phân tích và xử lý dữ liệu

Tự động hóa trong doanh nghiệp

ứng dụng trong quản lý tài chính

công nghệ trích xuất thông tin