Luận văn thạc sĩ HCMUTE về ứng dụng xử lý ảnh trong nhận dạng và trích xuất thông tin hóa đơn bán hàng

2017

97
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LÝ LỊCH KHOA HỌC

LỜI CAM ĐOAN

LỜI CẢM TẠ

1. CHƯƠNG 1: TỔNG QUAN

1.1. Tính cấp thiết của đề tài, ý nghĩa khoa học và thực tiễn của đề tài

1.2. Tổng quan về hướng nghiên cứu

1.3. Mục đích nghiên cứu và đối tượng nghiên cứu của đề tài

1.4. Nhiệm vụ và giới hạn của đề tài

1.5. Phương pháp nghiên cứu

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Phương pháp xử lý ảnh

2.2. Độ phân giải của ảnh

2.3. Trích chọn đặc điểm

2.4. Không gian màu

2.4.1. Không gian màu xám

2.4.2. Không gian màu RGB

2.4.3. Không gian màu CMYK

2.4.4. Không gian màu HSV

2.4.5. Chuyển đổi giữa các không gian màu

3. CHƯƠNG 3: CÔNG CỤ

3.1. Mã nguồn mở thị giác máy (OpenCV – Open Source Computer Vision)

3.2. Một số phép xử lý trong OpenCV

3.3. PHẦN MỀM QT CREATOR

3.3.1. Các lớp của QT Creator

3.3.2. GUI trên QT Creator

4. CHƯƠNG 4: GIẢI THUẬT SVM (SUPPORT VECTOR MACHINES)

4.1. SVM tuyến tính

4.2. SVM phi tuyến

4.3. Tính toán bộ phân loại SVM

4.3.1. Bài toán gốc

4.3.2. Bài toán đối ngẫu

4.3.3. Thủ thuật kernel

4.3.4. Các phương pháp hiện đại

4.4. Giảm thiểu sai số thực nghiệm

4.4.1. Giảm thiểu sai số

4.4.2. Chuẩn hóa và ổn định

4.4.3. SVM và sự mất bản lề

4.4.4. Hàm mục tiêu

4.4.5. Lựa chọn thông số

5. CHƯƠNG 5: GIẢI THUẬT

5.1. Lưu đồ giải thuật tổng quát

5.2. Lưu đồ giải thuật chương trình tách ký tự

5.3. Lưu đồ giải thuật chương trình huấn luyện

5.4. Lưu đồ giải thuật chương trình nhận dạng và lưu trữ

5.5. Xác định dòng và tách ký tự

5.5.1. Các bước xử lý cơ bản

5.5.2. Tách dòng và ký tự

5.6. Tạo tập mẫu huấn luyện

5.7. Huấn luyện tạo thư viện nhận dạng

5.8. Nhận dạng và lưu trữ

6. CHƯƠNG 6: KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN

6.1. Hướng phát triển

Tài liệu tham khảo

Tóm tắt

I. Tổng quan về ứng dụng xử lý ảnh

Ứng dụng xử lý ảnh trong nhận dạng và trích xuất dữ liệu từ hóa đơn bán hàng đã trở thành một lĩnh vực nghiên cứu quan trọng. Việc nhận dạng hình ảnh từ hóa đơn giúp tiết kiệm thời gian và công sức trong quá trình nhập liệu. Công nghệ này không chỉ giúp doanh nghiệp quản lý thông tin tốt hơn mà còn nâng cao hiệu quả làm việc. Các phương pháp như OCR (nhận diện ký tự quang học) đã được áp dụng để chuyển đổi hình ảnh thành văn bản có thể chỉnh sửa. Đặc biệt, việc sử dụng các thư viện mã nguồn mở như OpenCV đã tạo điều kiện thuận lợi cho việc phát triển các ứng dụng này. Theo nghiên cứu, việc trích xuất dữ liệu từ hóa đơn có thể đạt độ chính xác cao, tuy nhiên vẫn còn nhiều thách thức cần khắc phục.

1.1. Tính cấp thiết của đề tài

Việc trích xuất dữ liệu hóa đơn là cần thiết trong bối cảnh hiện đại, nơi mà thông tin cần được xử lý nhanh chóng và chính xác. Các doanh nghiệp cần nắm bắt thông tin về doanh thu, chi phí và tồn kho một cách hiệu quả. Việc sử dụng công nghệ nhận diện văn bản giúp giảm thiểu thời gian nhập liệu và sai sót. Hệ thống này không chỉ giúp tiết kiệm chi phí mà còn nâng cao năng suất làm việc. Theo một nghiên cứu, việc áp dụng công nghệ này có thể giảm thời gian nhập liệu xuống 50% so với phương pháp truyền thống.

1.2. Tổng quan về hướng nghiên cứu

Nghiên cứu về nhận dạng ký tự quang học đã có từ lâu và ngày càng phát triển với nhiều ứng dụng thực tiễn. Các công nghệ như machine learningtrí tuệ nhân tạo đã được áp dụng để cải thiện độ chính xác của việc nhận dạng. Các nghiên cứu gần đây cho thấy việc sử dụng các thuật toán như SVM (Support Vector Machines) kết hợp với các phương pháp xử lý ảnh có thể nâng cao hiệu quả nhận dạng. Hệ thống nhận dạng hiện đại không chỉ dừng lại ở việc nhận diện ký tự mà còn có khả năng phân tích và trích xuất thông tin từ các hình ảnh phức tạp.

II. Phương pháp xử lý ảnh

Phương pháp xử lý ảnh là một lĩnh vực quan trọng trong nghiên cứu và ứng dụng công nghệ thông tin. Để thực hiện việc trích xuất dữ liệu từ hóa đơn, cần phải thực hiện các bước như xác định dòng và tách ký tự. Việc sử dụng các hàm trong OpenCV như Erode và Dilate giúp loại bỏ nhiễu và xác định các dòng ký tự. Sau đó, các ký tự sẽ được tách ra và chuẩn hóa kích thước để phù hợp với quá trình huấn luyện. Đặc biệt, việc sử dụng phân tích hình ảnh giúp cải thiện độ chính xác trong việc nhận dạng ký tự. Các nghiên cứu cho thấy rằng việc áp dụng các phương pháp này có thể nâng cao độ chính xác lên tới 80% cho các ký tự số và 70% cho ký tự chữ.

2.1. Các bước xử lý cơ bản

Quá trình xử lý ảnh bắt đầu bằng việc thu nhận hình ảnh từ hóa đơn. Sau đó, các bước như xác định dòng và tách ký tự được thực hiện. Việc sử dụng các hàm Erode và Dilate giúp loại bỏ nhiễu và xác định các dòng ký tự. Tiếp theo, các ký tự sẽ được tách ra và chuẩn hóa kích thước để phù hợp với quá trình huấn luyện. Cuối cùng, các ký tự sẽ được nhận dạng và lưu trữ dưới dạng văn bản. Quá trình này không chỉ giúp tiết kiệm thời gian mà còn nâng cao độ chính xác trong việc nhập liệu.

2.2. Ứng dụng công nghệ trong nhận dạng

Công nghệ nhận diện văn bản đã có những bước tiến vượt bậc nhờ vào sự phát triển của machine learningtrí tuệ nhân tạo. Việc áp dụng các thuật toán như SVM giúp cải thiện độ chính xác trong việc nhận dạng ký tự. Hệ thống nhận dạng hiện đại không chỉ dừng lại ở việc nhận diện ký tự mà còn có khả năng phân tích và trích xuất thông tin từ các hình ảnh phức tạp. Các nghiên cứu cho thấy rằng việc áp dụng các phương pháp này có thể nâng cao độ chính xác lên tới 80% cho các ký tự số và 70% cho ký tự chữ.

25/01/2025

Bài viết "Luận văn thạc sĩ HCMUTE về ứng dụng xử lý ảnh trong nhận dạng và trích xuất thông tin hóa đơn bán hàng" của tác giả Thân Đức Trường, dưới sự hướng dẫn của TS. Nguyễn Văn Thái, trình bày về việc ứng dụng công nghệ xử lý ảnh để nhận diện và trích xuất dữ liệu từ hóa đơn bán hàng. Nghiên cứu này không chỉ giúp cải thiện hiệu quả trong việc quản lý thông tin hóa đơn mà còn mở ra hướng đi mới cho việc tự động hóa trong các quy trình kinh doanh. Độc giả sẽ tìm thấy những lợi ích thiết thực từ việc áp dụng công nghệ này, từ việc tiết kiệm thời gian đến giảm thiểu sai sót trong quá trình nhập liệu.

Nếu bạn quan tâm đến các ứng dụng công nghệ thông tin trong giáo dục, hãy tham khảo bài viết Quản lý ứng dụng công nghệ thông tin trong dạy học ở trường trung học cơ sở Hoằng Hóa, Thanh Hóa. Bài viết này cũng đề cập đến việc ứng dụng công nghệ để nâng cao hiệu quả trong giáo dục.

Ngoài ra, bạn có thể tìm hiểu thêm về Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói, nơi mà công nghệ học máy được áp dụng để cải thiện quy trình lựa chọn dữ liệu, tương tự như cách mà xử lý ảnh được sử dụng trong nghiên cứu của Thân Đức Trường.

Cuối cùng, bài viết Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ cũng là một ví dụ điển hình về việc ứng dụng công nghệ hiện đại trong lĩnh vực nhận diện, tương đồng với chủ đề của luận văn này. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và cái nhìn sâu sắc hơn về các ứng dụng công nghệ trong nhiều lĩnh vực khác nhau.