Luận văn thạc sĩ về nâng cao chất lượng hệ thống nhập dữ liệu tự động theo form

Luận văn thạc sĩ phân tích và đề xuất giải pháp nâng cao chất lượng hệ thống nhập dữ liệu tự động theo form, tối ưu hóa quy trình làm việc.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2010

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

PHẦN MỞ ĐẦU

1. CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ FORM TÀI LIỆU

1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH

1.1.1. Xử lý ảnh là gì

1.1.2. Các vấn đề cơ bản trong xử lý ảnh

1.1.3. Picture Element: phần tử ảnh

1.1.4. Grey level: mức xám

1.1.5. Quan hệ giữa các điểm ảnh

1.2. BIỂU DIỄN FORM TÀI LIỆU

1.2.1. Các mô hình biểu diễn ảnh

1.2.2. Mô hình Raster

1.2.3. Mô hình Vector

1.2.4. Các phương pháp biểu diễn ảnh

1.2.4.1. Biểu diễn mã loạt dài (Run – Length code)

1.2.4.2. Biểu diễn mã xích (Chain Code)

1.2.4.3. Biểu diễn mã tứ phân (Quad Tree Code)

1.2.5. Biểu diễn Form tài liệu

1.2.5.1. Cấu trúc vật lý

1.2.5.2. Cấu trúc logic

2. CHƯƠNG 2: MỘT SỐ KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HỆ THỐNG NHẬP DỮ LIỆU TỰ ĐỘNG THEO FORM

2.1. Lọc tuyến tính (Linear Filter)

2.2. Lọc trung bình không gian. Lọc thông thấp (Spacial Low-Pass Filter)

2.3. Lọc đồng hình (Homomorphic filter)

2.4. Lọc phi tuyến (NonLinear Filter)

2.5. Lọc trung vị (Median filter)

2.6. Bộ lọc giữ biên (Kuwahara filter)

2.7. Mặt nạ gờ sai phân và làm nhăn (Unharp Masking and Crispering)

2.8. Lọc thông thấp, thông cao và lọc dải thông

2.9. PHÁT HIỆN VÀ HIỆU CHỈNH GÓC NGHIÊNG

2.9.1. Biến đổi Hough

2.9.2. Biến đổi Hough cho đường thẳng

2.9.3. Biến đổi Hough cho đường thẳng trong tọa độ cực

2.9.4. Áp dụng biến đổi Hough trong phát hiện và hiệu chỉnh góc nghiêng văn bản

2.9.5. Phép chiếu nghiêng (Projection Profiles)

2.9.6. Giới thiệu về phép chiếu nghiêng

2.9.7. Áp dụng phép chiếu nghiêng trong việc phát hiện và hiệu chỉnh góc nghiêng văn bản

2.9.8. Phương pháp láng giềng gần nhất (Nearest Neighbor). Một số định nghĩa

2.9.9. Thuật toán phát hiện góc nghiêng dựa trên phương pháp láng giềng gần nhất. Biến đổi Morphology. Ước lượng thô. Áp dụng các phép biến đổi Morphology. Ước lượng tinh

3. CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM

PHẦN KẾT LUẬN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Khái quát về hệ thống tự động

Hệ thống tự động là một phần quan trọng trong việc nâng cao chất lượng dữ liệu. Việc nhập dữ liệu tự động giúp giảm thiểu sai sót và tiết kiệm thời gian. Hệ thống này sử dụng các công nghệ hiện đại để tự động hóa quy trình nhập liệu, từ đó nâng cao hiệu suất và độ chính xác. Công nghệ tự động hóa không chỉ giúp cải thiện quy trình mà còn tạo ra một môi trường làm việc hiệu quả hơn. Việc áp dụng các giải pháp tự động hóa trong quản lý dữ liệu đã trở thành một xu hướng tất yếu trong thời đại công nghệ số. Theo một nghiên cứu, việc áp dụng hệ thống tự động có thể giảm thiểu đến 80% thời gian nhập liệu so với phương pháp thủ công. Điều này cho thấy tầm quan trọng của việc phát triển và cải tiến các hệ thống tự động trong việc xử lý và quản lý dữ liệu.

1.1. Tối ưu hóa quy trình

Tối ưu hóa quy trình là một trong những yếu tố quan trọng trong việc nâng cao chất lượng dữ liệu. Việc tối ưu hóa không chỉ giúp giảm thiểu thời gian xử lý mà còn nâng cao độ chính xác của dữ liệu. Các phương pháp tối ưu hóa quy trình bao gồm việc sử dụng các thuật toán thông minh để phân tích và xử lý dữ liệu một cách hiệu quả. Giải pháp tự động hóa giúp loại bỏ các bước không cần thiết, từ đó giảm thiểu sai sót trong quá trình nhập liệu. Một nghiên cứu cho thấy rằng việc tối ưu hóa quy trình có thể cải thiện hiệu suất làm việc lên đến 50%. Điều này chứng tỏ rằng việc áp dụng các phương pháp tối ưu hóa là cần thiết để nâng cao chất lượng dữ liệu trong hệ thống tự động.

II. Công nghệ tự động hóa

Công nghệ tự động hóa đóng vai trò quan trọng trong việc nâng cao chất lượng dữ liệu. Các công nghệ như nhập liệu tự động và phân tích dữ liệu giúp cải thiện quy trình làm việc. Hệ thống tự động hóa sử dụng các công cụ và phần mềm hiện đại để thu thập, xử lý và lưu trữ dữ liệu một cách hiệu quả. Việc áp dụng công nghệ tự động hóa không chỉ giúp tiết kiệm thời gian mà còn nâng cao độ chính xác của dữ liệu. Theo một báo cáo, việc sử dụng công nghệ tự động hóa có thể giảm thiểu đến 90% sai sót trong quá trình nhập liệu. Điều này cho thấy rằng công nghệ tự động hóa là một yếu tố không thể thiếu trong việc nâng cao chất lượng dữ liệu.

2.1. Quản lý dữ liệu

Quản lý dữ liệu là một phần quan trọng trong hệ thống tự động. Việc quản lý dữ liệu hiệu quả giúp đảm bảo rằng thông tin được lưu trữ và xử lý một cách chính xác. Các công nghệ quản lý dữ liệu hiện đại cho phép người dùng dễ dàng truy cập và phân tích thông tin. Hệ thống quản lý dữ liệu tự động giúp giảm thiểu thời gian và công sức cần thiết để xử lý dữ liệu. Theo một nghiên cứu, việc áp dụng hệ thống quản lý dữ liệu tự động có thể cải thiện hiệu suất làm việc lên đến 70%. Điều này chứng tỏ rằng quản lý dữ liệu là một yếu tố quan trọng trong việc nâng cao chất lượng dữ liệu.

III. Phân tích dữ liệu

Phân tích dữ liệu là một bước quan trọng trong việc nâng cao chất lượng dữ liệu. Việc phân tích giúp xác định các xu hướng và mẫu trong dữ liệu, từ đó đưa ra các quyết định chính xác hơn. Các công nghệ phân tích dữ liệu hiện đại cho phép người dùng dễ dàng truy cập và xử lý thông tin. Hệ thống phân tích dữ liệu tự động giúp giảm thiểu thời gian và công sức cần thiết để xử lý dữ liệu. Theo một báo cáo, việc sử dụng công nghệ phân tích dữ liệu tự động có thể cải thiện độ chính xác của thông tin lên đến 80%. Điều này cho thấy rằng phân tích dữ liệu là một yếu tố không thể thiếu trong việc nâng cao chất lượng dữ liệu.

3.1. Ứng dụng thực tiễn

Ứng dụng thực tiễn của hệ thống tự động trong phân tích dữ liệu rất đa dạng. Các lĩnh vực như tài chính, y tế, và giáo dục đều có thể hưởng lợi từ việc áp dụng công nghệ tự động hóa. Hệ thống tự động giúp thu thập và phân tích dữ liệu một cách nhanh chóng và chính xác. Theo một nghiên cứu, việc áp dụng hệ thống tự động trong phân tích dữ liệu có thể giúp tiết kiệm đến 60% thời gian xử lý. Điều này chứng tỏ rằng việc áp dụng công nghệ tự động hóa trong phân tích dữ liệu là cần thiết để nâng cao chất lượng dữ liệu.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ nâng cao chất lượng hệ thống nhập dữ liệu tự động theo form

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và sự gia tăng nhanh chóng lượng tài liệu giấy trên toàn cầu, việc số hóa và xử lý tự động các tài liệu này trở thành một nhu cầu cấp thiết. Ước tính hàng tỷ trang giấy được tạo ra mỗi năm dưới nhiều hình thức như sách báo, văn bản pháp luật, biểu mẫu, bảng kê khai thuế, phiếu điều tra thị hiếu... Việc nhập liệu thủ công từ các tài liệu này không chỉ tốn kém thời gian, công sức mà còn khó khả thi khi khối lượng dữ liệu quá lớn. Do đó, hệ thống nhập dữ liệu tự động dựa trên công nghệ nhận dạng ký tự quang học (OCR) được xem là giải pháp tối ưu.

Luận văn tập trung nghiên cứu nâng cao chất lượng hệ thống nhập dữ liệu tự động theo form tài liệu, đặc biệt là cải thiện chất lượng ảnh đầu vào thông qua các kỹ thuật xử lý ảnh tiên tiến. Phạm vi nghiên cứu tập trung vào các kỹ thuật xử lý ảnh như lọc nhiễu, phát hiện và hiệu chỉnh góc nghiêng văn bản, áp dụng cho các tài liệu quét tại Việt Nam trong giai đoạn hiện đại. Mục tiêu chính là giảm thiểu sai số trong quá trình nhận dạng, nâng cao độ chính xác và hiệu quả của hệ thống OCR, từ đó hỗ trợ đắc lực cho các ứng dụng thực tế như tự động thu thập dữ liệu từ phiếu điều tra, hóa đơn, hồ sơ lao động, kiểm tra chữ ký ngân hàng, và xử lý văn bản pháp luật.

Việc nâng cao chất lượng ảnh đầu vào được đánh giá qua các chỉ số như tỷ lệ nhiễu giảm xuống dưới 10%, độ chính xác nhận dạng ký tự tăng trên 95%, và thời gian xử lý được rút ngắn đáng kể. Những đóng góp của luận văn có ý nghĩa khoa học trong lĩnh vực xử lý ảnh và ứng dụng thực tiễn trong tự động hóa nhập liệu, góp phần thúc đẩy phát triển công nghệ thông tin tại Việt Nam.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu trong lĩnh vực xử lý ảnh số và nhận dạng ký tự quang học (OCR). Hai khung lý thuyết chính được áp dụng gồm:

Lý thuyết xử lý ảnh số: Bao gồm các khái niệm về điểm ảnh (pixel), mức xám (grey level), các mô hình biểu diễn ảnh (Raster và Vector), cũng như các phương pháp lọc ảnh như lọc tuyến tính (linear filter), lọc phi tuyến (nonlinear filter), và các kỹ thuật phát hiện biên ảnh, phân đoạn ảnh. Các thuật toán lọc trung bình, lọc trung vị, lọc đồng hình, và mặt nạ gờ sai phân được sử dụng để nâng cao chất lượng ảnh đầu vào.
Mô hình phát hiện và hiệu chỉnh góc nghiêng văn bản: Áp dụng các phương pháp biến đổi Hough, phép chiếu nghiêng (projection profiles), phương pháp láng giềng gần nhất (nearest neighbor), và biến đổi Morphology để xác định và chỉnh sửa góc nghiêng của văn bản trong ảnh tài liệu. Các khái niệm về thành phần liên thông, chuỗi láng giềng gần nhất, và các thuật toán dò biên được sử dụng để phân tích cấu trúc ảnh và xác định góc nghiêng chính xác.

Các khái niệm chuyên ngành quan trọng bao gồm: nhiễu ảnh (additive noise, multiplicative noise, impulse noise), bộ lọc thông thấp và thông cao, biến đổi Hough trong tọa độ cực, cấu trúc vật lý và logic của form tài liệu, cũng như các thuật toán phân tích bố cục tài liệu (bottom-up, top-down).

Phương pháp nghiên cứu

Luận văn sử dụng phương pháp nghiên cứu thực nghiệm kết hợp phân tích lý thuyết. Nguồn dữ liệu chính là các ảnh tài liệu quét từ các form giấy thực tế tại một số địa phương Việt Nam, với cỡ mẫu khoảng vài trăm ảnh đa dạng về loại hình và chất lượng.

Phương pháp phân tích bao gồm:

Tiền xử lý ảnh: Áp dụng các bộ lọc tuyến tính (lọc trung bình, lọc thông thấp), phi tuyến (lọc trung vị, lọc đồng hình) để loại bỏ nhiễu muối tiêu và các loại nhiễu khác, nâng cao độ tương phản và sắc nét của ảnh.
Phát hiện và hiệu chỉnh góc nghiêng: Sử dụng biến đổi Hough cho đường thẳng trong tọa độ cực, phép chiếu nghiêng theo các góc khác nhau, và thuật toán láng giềng gần nhất để xác định góc nghiêng chính xác của văn bản. Các thuật toán được cài đặt và thử nghiệm trên bộ dữ liệu thực tế, với timeline nghiên cứu kéo dài khoảng 12 tháng.
Phân tích kết quả: Đánh giá hiệu quả các kỹ thuật qua các chỉ số như tỷ lệ giảm nhiễu, độ chính xác phát hiện góc nghiêng, và cải thiện độ chính xác nhận dạng ký tự trong hệ thống OCR.

Quá trình nghiên cứu được chia thành ba giai đoạn chính: tổng quan và xây dựng khung lý thuyết (3 tháng), phát triển và thử nghiệm các thuật toán xử lý ảnh (6 tháng), đánh giá kết quả và hoàn thiện luận văn (3 tháng).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả lọc nhiễu: Các bộ lọc phi tuyến như lọc trung vị và lọc đồng hình đã giảm tỷ lệ nhiễu muối tiêu trong ảnh từ khoảng 30% xuống dưới 8%, đồng thời giữ được độ sắc nét của biên ảnh. Lọc trung bình không gian giúp làm mịn ảnh nhưng có thể làm mờ biên, trong khi lọc đồng hình cải thiện đáng kể ảnh nhiễu nhân.
Phát hiện góc nghiêng bằng biến đổi Hough: Thuật toán biến đổi Hough trong tọa độ cực cho phép phát hiện góc nghiêng chính xác với sai số trung bình dưới 0.5 độ, vượt trội so với các phương pháp truyền thống. Tỷ lệ phát hiện chính xác đạt trên 95% trong bộ dữ liệu thử nghiệm.
Phép chiếu nghiêng và phương pháp láng giềng gần nhất: Phép chiếu nghiêng giúp xác định góc nghiêng dựa trên cực đại của lược đồ chiếu, đạt độ chính xác khoảng 92%. Phương pháp láng giềng gần nhất cải tiến với chuỗi K-NN cho kết quả chính xác hơn, đặc biệt với các tài liệu có font chữ đồng đều, đạt độ chính xác trên 90%.
Tác động đến chất lượng nhận dạng OCR: Sau khi áp dụng các kỹ thuật xử lý ảnh và hiệu chỉnh góc nghiêng, độ chính xác nhận dạng ký tự trong hệ thống OCR tăng từ khoảng 85% lên trên 95%, đồng thời giảm thời gian xử lý trung bình mỗi trang xuống 20%.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện là do việc loại bỏ nhiễu và hiệu chỉnh góc nghiêng giúp các bước phân đoạn, tách khối và nhận dạng ký tự trong hệ thống OCR hoạt động hiệu quả hơn. So với các nghiên cứu trước đây, việc kết hợp đồng thời nhiều kỹ thuật lọc và phát hiện góc nghiêng đã nâng cao đáng kể độ chính xác và tính ổn định của hệ thống.

Kết quả cũng cho thấy, biến đổi Hough trong tọa độ cực là phương pháp ưu việt nhất trong phát hiện góc nghiêng, phù hợp với các tài liệu có nhiều dòng văn bản và cấu trúc phức tạp. Phép chiếu nghiêng và phương pháp láng giềng gần nhất có thể được sử dụng bổ trợ hoặc trong các trường hợp tài liệu có đặc điểm khác biệt.

Dữ liệu có thể được trình bày qua biểu đồ so sánh tỷ lệ nhiễu trước và sau lọc, biểu đồ độ chính xác phát hiện góc nghiêng của từng phương pháp, và bảng thống kê độ chính xác nhận dạng ký tự OCR trước và sau xử lý. Những biểu đồ này minh họa rõ ràng hiệu quả của các kỹ thuật được nghiên cứu.

Đề xuất và khuyến nghị

Triển khai hệ thống lọc nhiễu đa tầng: Áp dụng kết hợp các bộ lọc phi tuyến như lọc trung vị, lọc đồng hình và lọc thông thấp để giảm thiểu tối đa nhiễu ảnh đầu vào, nhằm nâng cao chất lượng ảnh cho hệ thống OCR. Thời gian thực hiện: 3-6 tháng. Chủ thể thực hiện: các đơn vị phát triển phần mềm OCR.
Áp dụng biến đổi Hough trong phát hiện và hiệu chỉnh góc nghiêng: Tích hợp thuật toán biến đổi Hough trong tọa độ cực vào quy trình xử lý ảnh để tự động phát hiện và chỉnh sửa góc nghiêng văn bản, đảm bảo độ chính xác trên 95%. Thời gian thực hiện: 4 tháng. Chủ thể thực hiện: nhóm nghiên cứu và phát triển công nghệ xử lý ảnh.
Phát triển module phân tích cấu trúc form tài liệu: Xây dựng các thuật toán phân tích bố cục vật lý và logic của form tài liệu để hỗ trợ phân đoạn chính xác, từ đó nâng cao hiệu quả nhận dạng ký tự. Thời gian thực hiện: 6 tháng. Chủ thể thực hiện: các nhà nghiên cứu và kỹ sư phần mềm.
Đào tạo và nâng cao nhận thức người dùng: Tổ chức các khóa đào tạo cho cán bộ kỹ thuật và người dùng cuối về cách chuẩn bị tài liệu, quét ảnh đúng chuẩn để giảm thiểu lỗi đầu vào, góp phần nâng cao hiệu quả hệ thống. Thời gian thực hiện: liên tục. Chủ thể thực hiện: các tổ chức đào tạo và doanh nghiệp ứng dụng.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Hệ thống Thông tin: Luận văn cung cấp kiến thức chuyên sâu về xử lý ảnh và nhận dạng ký tự, hỗ trợ phát triển các đề tài nghiên cứu liên quan.
Các doanh nghiệp phát triển phần mềm OCR và tự động hóa nhập liệu: Tham khảo để cải tiến thuật toán, nâng cao chất lượng sản phẩm, giảm thiểu sai sót trong quá trình nhận dạng.
Cơ quan quản lý và lưu trữ tài liệu số: Áp dụng các kỹ thuật xử lý ảnh để số hóa tài liệu giấy hiệu quả, phục vụ công tác lưu trữ và tra cứu thông tin.
Người làm công tác kỹ thuật số hóa và xử lý dữ liệu văn bản: Hướng dẫn thực hành các bước tiền xử lý ảnh, phát hiện và hiệu chỉnh góc nghiêng, giúp nâng cao năng suất và chất lượng công việc.

Câu hỏi thường gặp

Tại sao cần nâng cao chất lượng ảnh đầu vào trong hệ thống OCR?
Ảnh đầu vào chất lượng thấp chứa nhiều nhiễu, góc nghiêng và biến dạng sẽ làm giảm độ chính xác nhận dạng ký tự, gây sai sót và tăng thời gian xử lý. Ví dụ, ảnh nhiễu muối tiêu 30% có thể làm sai lệch kết quả nhận dạng đến 20%.
Các bộ lọc nào hiệu quả nhất để loại bỏ nhiễu trong ảnh tài liệu?
Bộ lọc trung vị và lọc đồng hình được đánh giá cao trong việc loại bỏ nhiễu muối tiêu và nhiễu nhân, đồng thời giữ được biên nét của ảnh, giúp cải thiện đáng kể chất lượng ảnh đầu vào.
Phương pháp nào phát hiện góc nghiêng văn bản chính xác nhất?
Biến đổi Hough trong tọa độ cực cho kết quả chính xác nhất với sai số trung bình dưới 0.5 độ, phù hợp với nhiều loại tài liệu có cấu trúc phức tạp.
Làm thế nào để xác định góc nghiêng bằng phép chiếu nghiêng?
Phép chiếu nghiêng tính tổng số điểm ảnh theo các góc quay khác nhau, góc có giá trị cực đại của lược đồ chiếu được chọn làm góc nghiêng. Phương pháp này đơn giản nhưng hiệu quả với tài liệu có cấu trúc rõ ràng.
Ứng dụng thực tế của nghiên cứu này là gì?
Nghiên cứu giúp phát triển hệ thống nhập liệu tự động chính xác, giảm chi phí nhân lực, tăng tốc độ xử lý tài liệu trong các lĩnh vực như ngân hàng, thuế, hải quan, và lưu trữ văn bản pháp luật.

Kết luận

Luận văn đã nghiên cứu và áp dụng thành công các kỹ thuật xử lý ảnh nâng cao nhằm cải thiện chất lượng ảnh đầu vào cho hệ thống nhập dữ liệu tự động theo form tài liệu.
Các bộ lọc phi tuyến và biến đổi Hough được chứng minh hiệu quả trong việc giảm nhiễu và phát hiện góc nghiêng với độ chính xác cao.
Kết quả thực nghiệm cho thấy độ chính xác nhận dạng ký tự OCR tăng trên 95%, góp phần nâng cao hiệu quả tự động hóa nhập liệu.
Nghiên cứu có ý nghĩa thực tiễn lớn, hỗ trợ các tổ chức, doanh nghiệp trong việc số hóa và xử lý tài liệu giấy.
Đề xuất tiếp theo là triển khai ứng dụng rộng rãi các kỹ thuật này trong các hệ thống OCR thương mại và đào tạo nhân lực kỹ thuật liên quan.

Hãy áp dụng các giải pháp nghiên cứu để nâng cao hiệu quả xử lý tài liệu số và thúc đẩy chuyển đổi số trong các lĩnh vực quản lý và lưu trữ thông tin.

Trích đoạn nội dung tài liệu

PHẦN MỞ ĐẦU Ngày nay, với sự thịnh hành của máy tính và sự phát triển của xã hội, số lƣợng những tài liệu lƣu trữ trên giấy đã tăng lên đáng kể. Hàng tỷ tỷ những trang giấy đƣợc tạo ra mỗi năm dƣới nhiều hình thức khác nhau nhƣ sách báo, tạp chí, bản tin, văn bản, thƣ từ, biểu mẫu, bảng ghi nhớ, … trên khắp thế giới, và việc sử dụng giấy để lƣu trữ tài liệu trong một số mục đích vẫn không thể thay thế đƣợc (nhƣ sách báo, công văn, văn bản pháp luật…). Trong số những tài liệu này, có rất nhiều thông tin cần phải đƣợc lƣu trữ vào máy tính để xử lý, chẳng hạn nhƣ các phiếu điều tra của các nhà sản xuất muốn điều tra thị hiếu và mức tiêu thụ sản phẩm, các nhà hoạch định chính sách muốn có những cuộc điều tra để xây dựng những chính sách phù hợp với thực tế, các kỳ thi trắc nghiệm. trên giấ y , hoặc các tờ kê khai thuế mà doanh nghiệp phải nộp cho cơ quan thuế, hải quan, và rất nhiều lý do khác.

Các tài liệu giấy có thể đƣợc số hoá và lƣu trữ trong máy tính bằng máy quét, máy fax, nhƣng làm thế nào để chuyển từ tài liệu giấy thành dạng máy có thể hiểu và xử lý đƣợc? Câu hỏi đó đã khiến các chuyên gia trong lĩnh vực Công nghệ thông tin phải đầu tƣ, nghiên cứu. Cách thủ công nhất đó là nhập lại nội dung của văn bản thông qua bàn phím và tất nhiên, đó là công việc đòi hỏi tốn rất nhiều công sức, thời gian và nhân lực, thậm chí không thể thực hiện đƣợc với một số lƣợng cực lớn những tài liệu giấy. Hiện nay chúng ta đã có các máy Scan với tốc độ cao, công nghệ xử lý của máy tính ngày càng siêu việt với tốc độ tính toán cao, vậy tại sao chúng ta không quét toàn bộ các trang tài liệu vào và chuyển chúng thành văn bản một cách tự động? Vấn đề ở đây là khi quét vào máy tính chúng ta không thu đƣợc ngay các dòng văn bản từ các trang tài liệu kia để có thể soạn thảo, sửa chữa và tìm kiếm nhƣ làm trên Office. Tất cả những gì thu đƣợc chỉ là các tấm ảnh của các trang văn bản, máy tính lại đối xử công bằng nhƣ nhau với mọi điểm ảnh, máy tính không có “mắt” nhƣ chúng ta để biết đâu là điểm ảnh của chữ, đâu là điểm ảnh của đối tƣợng đồ họa.

Một giải pháp có thể đáp ứng đƣợc những yêu cầu đó là xây dựng một hệ thống nhận dạng quang học (OCR - Optical Character Recognition system), ở đó, z 8 mỗi văn bản sẽ đƣợc scan bằng máy scaner thành một file ảnh, hệ thống OCR sẽ phân tích file ảnh đó để nhận biết nội dung của tài liệu đó là gì (xem hình 0.1: Hệ thống OCR Một cách tổng quát thì cách thức làm việc của một hệ thống nhận dạng chữ nhƣ sau: 1. Chụp ảnh, scan các trang tài liệu trên giấy và lƣu lại trong máy tính dƣới dạng hình ảnh. Sử dụng một chƣơng trình xử lý ảnh để phân tích hình ảnh sau khi quét, đọc đƣợc ký tự trên hình ảnh đó và ghi lại vào máy tính theo cách mà máy tính quản lý đƣợc thông tin đó. Bƣớc 1 là phân tích cấu trúc của ảnh tài liệu, từ đó xác định đâu là phần chứa chữ, đâu là phần chứa cả ảnh lẫn ký tự và đâu chỉ chứa hình ảnh.

Bƣớc này thực sự quan trọng cho bƣớc nhận dạng. Bởi nó định vị chính xác cho việc áp dụng các thuật toán nhận dạng lên vùng đã xác định tính chất. Bƣớc 2 nhận dạng ký tự dựa vào các tính chất của ký tự, ví dụ nhƣ sắp xếp theo dòng, khoảng cách giữa 2 từ lớn hơn khoảng cách giữa 2 ký tự, dùng trí tuệ nhân tạo để dự đoán các ký tự kề nhau phải nhƣ thế nào, các từ trong câu phải nhƣ thế nào để câu có nghĩa. Từ đó có nội dung đúng để lƣu trữ, quản lý….

Hệ thống nhập liệu tự động OCR là bài toán ngày càng thu hút nhiều sự chú ý vì khả năng áp dụng rộng rãi vào thực tế và những hiệu quả mà nó mang lại, có thể kể đến một số ứng dụng nhƣ: - Sắp xếp thƣ tín, dựa vào việc nhận dạng mã bƣu chính (Zipcode) hay địa chỉ gửi tới. z 9 - Tự động thu thập dữ liệu từ các mẫu đơn/báo biểu hay từ các hồ sơ lao động. - Hệ thống tự động kiểm tra trong ngân hàng (tự động xác nhận chữ ký) - Tự động xử lý các hóa đơn hay các yêu cầu thanh toán - Hệ thống tự động đọc và kiểm tra passport - Tự động phục hồi và copy tài liệu từ các ảnh quét. - Máy đọc cho những ngƣời khiếm thính - Các ứng dụng Datamining -… Kỹ thuật nhập liệu tự động liên quan chặt chẽ với đồ hoạ, nhận dạng và thuật xử lý ảnh.

Sự phát triển nhanh chóng của công nghệ thông tin trên cả hai lĩnh vực phần cứng và phần mềm đã cho phép kỹ thuật nhập liệu tự động phát triển theo nhiều phƣơng hƣớng khác nhau và đã đạt đƣợc những thành công nhất định. Tuy vậy trong thực tế, việc hiện thực một hệ thống OCR để có thể đƣa ra đƣợc những kết quả chính xác một cách tự động, không cần bất cứ một sự chỉnh sửa nào là một vấn đề vô cùng khó khăn. Những vấn đề thƣờng gặp phải trong quá trình thu nhận đó là: nhiễu, độ lệch, độ dịch chuyển, xoay, biến dạng v. của phiếu điều tra, cũng nhƣ vấn đề tách đƣợc các đối tƣợng hình học đƣợc dùng để đánh dấu trong phiếu.

Xuất phát từ thực tế đó, luận văn nhằm nghiên cứu một số kỹ thuật xử lý ảnh giúp nâng cao chất lƣợng ảnh Form đầu vào nhằm nâng cao chất lƣợng các hệ thống nhận dạng Form mẫu. Đây là một việc làm có ý nghĩa khoa học và ý nghĩa thực tiễn trong hoàn cảnh của Việt Nam. Luận văn đƣợc trình bày 3 chƣơng nhƣ sau: Chƣơng 1 trình bày tổng quan về xử lý ảnh, các phƣơng pháp biểu diễn ảnh, biểu diễn Form tài liệu. Chƣơng 2 trình bày một số kỹ thuật phát hiện và hiệu chỉnh góc nghiêng ảnh văn bản, độ dịch chuyển, khử nhiễu, … Chƣơng 3 cài đặt chƣơng trình thử nghiệm phát hiện góc nghiêng văn bản và chỉnh lại văn bản nhờ các kỹ thuật tìm hiểu đƣợc, qua đó giúp nâng cao chất lƣợng ảnh form dữ liệu đầu vào cho các hệ thống nhận dạng Form mẫu z 10 Chƣơng 1 : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ FORM TÀI LIỆU 1.

KHÁI QUÁT VỀ XỬ LÝ ẢNH 1. Xử lý ảnh là gì Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn.

Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận.1: Quá trình xử lý ảnh Để dễ tƣởng tƣợng, xét các bƣớc cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên từ thế giới ngoài đƣợc thu nhận qua các thiết bị thu (nhƣ Camera, máy chụp ảnh, máy scanner). Trƣớc đây, ảnh thu qua Camera là các ảnh tƣơng tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng đƣợc lấy ra từ Camera, sau đó nó đƣợc chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo.

Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.2 dƣới đây mô tả các bƣớc cơ bản trong xử lý ảnh.1: Các bƣớc cơ bản trong xử lý ảnh Sơ đồ này bao gồm các thành phần sau: a) Phần thu nhận ảnh (Image Acquisition) Ảnh có thể nhận qua camera màu hoặc đen trắng. Thƣờng ảnh nhận qua camera là ảnh tƣơng tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (nhƣ loại CCD – Change Coupled Device) là loại photodiot tạo cƣờng độ sáng tại mỗi điểm ảnh. Camera thƣờng dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều. Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng, phong cảnh) b) Tiền xử lý (Image Processing) Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử lý để nâng cao chất lƣợng.

Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng phản, nổi biên, làm trơn biên ảnh, khuyếch đại ảnh… để làm ảnh rõ hơn, nét hơn. c) Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh.

Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. d) Biểu diễn ảnh (Image Representation) z 12 Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác trong phạm vi ảnh nhận đƣợc.

Ví dụ: trong nhận dạng ký tự trên phong bì thƣ, chúng ta miêu tả các đặc trƣng của từng ký tự giúp phân biệt ký tự này với ký tự khác. e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học (hoặc lƣu) từ trƣớc. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng.

Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thƣ có thể đƣợc nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Nâng cao chất lượng hệ thống nhập dữ liệu tự động theo form" của tác giả Nguyễn Quang, dưới sự hướng dẫn của PGS. TS Đỗ Năng Toàn, được thực hiện tại Đại học Quốc gia Hà Nội vào năm 2010. Bài viết tập trung vào việc cải thiện quy trình nhập dữ liệu tự động, nhằm nâng cao độ chính xác và hiệu quả trong việc thu thập thông tin. Những điểm chính của luận văn bao gồm phân tích các yếu tố ảnh hưởng đến chất lượng dữ liệu, đề xuất các giải pháp công nghệ và quy trình để tối ưu hóa hệ thống nhập liệu. Độc giả sẽ nhận được những lợi ích từ việc hiểu rõ hơn về cách thức cải thiện quy trình nhập dữ liệu, từ đó áp dụng vào thực tiễn công việc của mình.

Nếu bạn quan tâm đến các chủ đề liên quan đến công nghệ thông tin và hệ thống mạng, bạn có thể tham khảo thêm các bài viết sau: Khảo Sát Mạng LAN với Các Phần Mở Rộng Không Dây, nơi bạn sẽ tìm thấy thông tin về mạng LAN và các công nghệ không dây, hoặc Nâng Cao Chất Lượng Dịch Vụ Và Trải Nghiệm Mạng Không Dây, bài viết này sẽ giúp bạn hiểu rõ hơn về chất lượng dịch vụ trong mạng không dây. Cuối cùng, bài viết Quản Lý Sự Cố Hạ Tầng Mạng Bằng Hệ Thống Thông Tin Số Hóa cũng sẽ cung cấp cho bạn cái nhìn sâu sắc về quản lý sự cố trong hạ tầng mạng. Những tài liệu này sẽ mở rộng kiến thức của bạn về các khía cạnh khác nhau trong lĩnh vực công nghệ thông tin.

#tự động hóa

#Luận văn Thạc sĩ

#công nghệ thông tin

#tối ưu hóa quy trình

#quản lý dữ liệu

#hệ thống nhập dữ liệu

Chủ đề

Giáo dục và nghiên cứu thạc sĩ

Nghiên cứu và phát triển hệ thống

Quản lý và xử lý dữ liệu

Công nghệ thông tin và tự động hóa