Luận Văn Thạc Sĩ Về Nhận Dạng Chữ Viết Tay Tiếng Việt Offline

Khám phá luận văn thạc sĩ về nhận dạng chữ viết tay tiếng Việt offline trong lĩnh vực khoa học máy tính, ứng dụng và công nghệ tiên tiến.

Trường đại học

Đại học Bách Khoa - Đại học Quốc Gia Tp. Hồ Chí Minh

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2013

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CÁM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: TONG QUAN VE ĐÉ TÀI

1.1. Đặt van dé

1.2. Giới thiệu đề tài

1.3. Mục tiêu của đề tài

1.4. Giới hạn của đề tài

1.5. Ý nghĩa khoa học và thực tiễn

1.6. Tóm lược kết quả đạt được

1.7. Kết cấu của luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Mô hình hệ thống CR

2.2. Phương pháp trích đặc trưng

2.2.1. Gradient Feature

2.3. Phương pháp học máy SVM và phương pháp đánh giá chéo K-fold

3. CHƯƠNG 3: CÁC KẾT QUẢ NGHIÊN CỨU LIÊN QUAN

3.1. Nhận dạng chữ Viết tay

3.1.1. Mô hình nhận dạng

3.1.2. Kết quả nhận dạng và nhận xét

3.2. Nhận dạng chữ viết tay Latin

3.2.1. Mô hình nhận dạng

3.2.2. Kết quả nhận dạng và nhận xét

3.3. Nhận dạng chữ viết tay Tiếng Việt

3.3.1. Mô hình nhận dạng thứ nhất

3.3.2. Kết quả nhận dạng và nhận xét thứ nhất

3.3.3. Mô hình nhận dạng thứ hai

3.3.4. Kết quả nhận dạng và nhận xét thứ hai

3.3.5. Mô hình nhận dạng thứ ba

3.3.6. Kết quả nhận dạng và nhận xét thứ ba

4. CHƯƠNG 4: HƯỚNG TIẾP CẬN VÀ HIỆN THỰC

4.1. Mô hình nhận dạng và ý tưởng hiện thực

4.1.1. Quá trình tiền xử lý

4.1.2. Quá trình trích đặc trưng

4.1.3. Quá trình phân loại

4.1.4. Tóm tắt ý tưởng hiện thực mô hình

4.1.5. Hai mô hình hiện thực

5. CHƯƠNG 5: KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ

5.1. Tập dữ liệu

5.2. Kết quả thực nghiệm và đánh giá

5.2.1. Quá trình trích đặc trưng

5.2.2. Quá trình phân loại

6. CHƯƠNG 6: TỔNG KẾT

6.1. Kết quả đạt được

6.2. Ưu điểm và khuyết điểm

6.3. Hướng phát triển tương lai

DANH MỤC CHỮ VIẾT TẮT

DANH MỤC HÌNH

DANH MỤC BẢNG BIỂU

Tóm tắt

I. Tổng quan về đề tài

Luận văn 'Nhận Dạng Chữ Viết Tay Tiếng Việt Offline Trong Luận Văn Thạc Sĩ Khoa Học Máy Tính' tập trung vào việc nghiên cứu và phát triển hệ thống nhận dạng chữ viết tay tiếng Việt. Đặc điểm của chữ viết tay tiếng Việt là sự đa dạng và phức tạp, điều này gây khó khăn trong việc phân loại và nhận dạng. Luận văn khảo sát nhiều phương pháp nhận dạng chữ viết tay offline, từ đó đề xuất mô hình nhận dạng hiệu quả. Mục tiêu chính là tìm ra phương pháp trích đặc trưng và phân loại phù hợp, nhằm nâng cao độ chính xác trong nhận dạng chữ viết tay tiếng Việt. Việc áp dụng công nghệ nhận dạng chữ viết tay không chỉ có giá trị trong nghiên cứu mà còn có ứng dụng thực tiễn trong nhiều lĩnh vực như giáo dục, văn phòng và công nghệ thông tin.

1.1 Giới thiệu đề tài

Đề tài 'Nhận Dạng Chữ Viết Tay Tiếng Việt Offline' được chọn do sự khó khăn trong việc phân loại chữ viết tay tiếng Việt. Luận văn này không chỉ khảo sát các phương pháp hiện có mà còn đề xuất mô hình nhận dạng mới. Mục tiêu là phát triển một hệ thống có khả năng nhận dạng chính xác chữ viết tay tiếng Việt, từ đó mở ra hướng nghiên cứu mới trong lĩnh vực này.

1.2 Mục tiêu và ý nghĩa của đề tài

Mục tiêu của đề tài là tìm hiểu và so sánh các phương pháp trích đặc trưng và phân loại chữ viết tay tiếng Việt. Ý nghĩa khoa học và thực tiễn của đề tài nằm ở việc cung cấp cái nhìn tổng quan về những thách thức trong nhận dạng chữ viết tay tiếng Việt, đồng thời đề xuất các phương pháp hiệu quả cho nghiên cứu và ứng dụng thực tế.

II. Cơ sở lý thuyết

Luận văn trình bày cơ sở lý thuyết về hệ thống nhận dạng chữ viết tay offline, bao gồm các phương pháp trích đặc trưng và phân loại. Hệ thống nhận dạng chữ viết tay được chia thành nhiều bước, từ thu thập dữ liệu đến xử lý và phân loại. Các phương pháp trích đặc trưng như Gradient Feature, Structural Feature, và SVM được áp dụng để nâng cao độ chính xác của hệ thống. Việc sử dụng các phương pháp học máy như SVM và đánh giá chéo K-fold giúp cải thiện hiệu quả nhận dạng. Mô hình tổng quát của hệ thống CR được mô tả rõ ràng, cho thấy sự kết hợp giữa các bước là rất quan trọng để đạt được kết quả tốt nhất.

2.1 Mô hình hệ thống CR

Mô hình hệ thống nhận dạng chữ viết tay bao gồm nhiều bước như thu thập, tiền xử lý, phân tách, trích đặc trưng, chọn đặc trưng và phân loại. Mỗi bước đều có vai trò quan trọng trong việc nâng cao độ chính xác của hệ thống. Quá trình trích đặc trưng và phân loại là hai yếu tố quyết định đến hiệu quả nhận dạng. Việc áp dụng các phương pháp trích đặc trưng hiện đại giúp hệ thống nhận dạng hoạt động hiệu quả hơn.

2.2 Phương pháp trích đặc trưng

Các phương pháp trích đặc trưng như Gradient Feature, Structural Feature, và Concavity Feature được nghiên cứu và áp dụng trong luận văn. Mỗi phương pháp có những ưu điểm và nhược điểm riêng, và việc lựa chọn phương pháp phù hợp là rất quan trọng. Luận văn cũng đề cập đến cách thức tính toán và ứng dụng của từng phương pháp trong việc nâng cao độ chính xác của hệ thống nhận dạng chữ viết tay tiếng Việt.

III. Kết quả nghiên cứu

Luận văn đã thu được những kết quả đáng khích lệ trong việc nhận dạng chữ viết tay tiếng Việt. Các tổ hợp phương pháp trích đặc trưng và phân loại đã được thử nghiệm, cho thấy tỷ lệ nhận dạng chính xác tương đối cao. Việc xây dựng các SVM dựa vào tính liên thông của đặc trưng ký tự tiếng Việt đã cải thiện đáng kể kết quả nhận dạng. Kết quả thực nghiệm cho thấy rằng việc áp dụng các phương pháp học máy hiện đại có thể mang lại những bước tiến lớn trong lĩnh vực nhận dạng chữ viết tay.

3.1 Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy rằng các phương pháp trích đặc trưng và phân loại đã được áp dụng hiệu quả. Tỷ lệ nhận dạng chính xác đạt được là một trong những yếu tố quan trọng nhất trong nghiên cứu này. Các tổ hợp phương pháp đã được thử nghiệm cho thấy sự cải thiện rõ rệt trong độ chính xác so với các phương pháp truyền thống.

3.2 Đánh giá và nhận xét

Đánh giá kết quả cho thấy rằng việc áp dụng các phương pháp học máy như SVM và K-fold cross-validation đã mang lại những kết quả khả quan. Luận văn cũng chỉ ra những hạn chế còn tồn tại và đề xuất hướng nghiên cứu trong tương lai để cải thiện hơn nữa hệ thống nhận dạng chữ viết tay tiếng Việt.

09/02/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính nhận dạng chữ viết tay tiếng việt offline

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Nhận dạng chữ viết tay (Character Recognition - CR) là lĩnh vực nghiên cứu phát triển mạnh mẽ với nhiều ứng dụng thực tiễn trong xử lý ngôn ngữ tự nhiên và tương tác người-máy. Đặc biệt, chữ viết tay Tiếng Việt offline có tính phức tạp cao do sự đa dạng về nhóm ký tự và dấu hiệu ngữ âm, gây khó khăn trong việc phân loại chính xác. Luận văn tập trung nghiên cứu nhận dạng chữ viết tay Tiếng Việt offline rời rạc, với mục tiêu khảo sát, đánh giá các phương pháp trích đặc trưng và áp dụng kỹ thuật học máy để phân loại nhằm nâng cao độ chính xác nhận dạng.

Phạm vi nghiên cứu bao gồm 147 ký tự Tiếng Việt (chữ hoa, chữ thường, có dấu và không dấu), thu thập 4410 mẫu từ 3 người viết khác nhau, thực hiện trên tập dữ liệu xây dựng riêng. Thời gian nghiên cứu từ tháng 01 đến tháng 06 năm 2013 tại Trường Đại học Bách Khoa, Đại học Quốc gia TP. Hồ Chí Minh. Ý nghĩa nghiên cứu không chỉ góp phần làm rõ các thách thức trong nhận dạng chữ viết tay Tiếng Việt mà còn đề xuất mô hình nhận dạng hiệu quả, có thể ứng dụng trong các hệ thống tự động hóa xử lý văn bản, hỗ trợ nhập liệu và bảo tồn ngôn ngữ.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn vận dụng mô hình tổng quát hệ thống nhận dạng chữ viết tay offline gồm các bước: thu thập dữ liệu, tiền xử lý, phân tách ký tự, trích đặc trưng, chọn đặc trưng, phân loại nhận dạng và hậu xử lý. Trong đó, hai bước trích đặc trưng và phân loại nhận dạng được xem là trọng tâm quyết định hiệu quả hệ thống.

Bảy phương pháp trích đặc trưng được khảo sát gồm:

Gradient Feature: Tính toán hướng và độ lớn gradient của ảnh, chia ảnh thành các vùng nhỏ để thống kê hướng gradient, tạo thành đặc trưng nhị phân.
Structural Feature: Áp dụng 12 luật dựa trên mối quan hệ giữa pixel và các điểm lân cận để trích xuất đặc trưng hình học.
Concavity Feature: Trích xuất các đặc trưng liên quan đến lõm, lỗ trống và các dạng stroke theo nhiều hướng.
Projection Feature và Projection Histogram Feature: Thống kê số lượng pixel đen trên các trục chiếu khác nhau (x, y, chéo trái, chéo phải).
Zone Feature: Chia ảnh thành các vùng nhỏ, đếm số pixel đen trong mỗi vùng.
Contour Profiles Feature: Xác định vị trí điểm đen gần nhất từ các cạnh ảnh.

Phương pháp phân loại sử dụng Support Vector Machine (SVM) với mô hình C-Support Vector Classification (C-SVM) và hàm kernel tuyến tính. Phương pháp đánh giá chéo K-fold (K=5) được áp dụng để đánh giá độ chính xác và tính ổn định của mô hình.

Phương pháp nghiên cứu

Nguồn dữ liệu gồm 4410 mẫu chữ viết tay Tiếng Việt rời rạc, thu thập từ 3 người viết, phân loại thành 147 lớp ký tự. Mỗi ký tự được chuẩn hóa kích thước 28x28 pixel sau tiền xử lý.

Phương pháp phân tích bao gồm:

Tiền xử lý ảnh: lọc nhiễu bằng bộ lọc trung vị (median filter), loại bỏ nhiễu cạnh bằng cách tìm contour và vùng liên thông nhỏ.
Trích đặc trưng: áp dụng 7 phương pháp cơ bản và kết hợp tạo thành 127 tổ hợp đặc trưng để khảo sát hiệu quả.
Phân loại: xây dựng mô hình SVM phân loại đa lớp 147 ký tự, đồng thời thử nghiệm mô hình kết hợp 3 SVM dựa trên đặc điểm vùng liên thông của ký tự (1, 2 hoặc 3 vùng).
Đánh giá: sử dụng phương pháp đánh giá chéo K-fold 5 lần, tính trung bình tỷ lệ nhận dạng lỗi.

Quá trình nghiên cứu được thực hiện trên máy tính cấu hình Core 2 Duo 2.00 GHz, RAM 4GB, hệ điều hành Ubuntu 11.10.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả các phương pháp trích đặc trưng: Trong 127 tổ hợp, 8 tổ hợp phương pháp trích đặc trưng cho kết quả nhận dạng tốt nhất với tỷ lệ lỗi trung bình khoảng 2.83% trên mô hình SVM 147 lớp. Các phương pháp Gradient Feature, Structural Feature và Concavity Feature khi kết hợp cho hiệu quả vượt trội so với từng phương pháp riêng lẻ.
Mô hình phân loại SVM kết hợp vùng liên thông: Việc chia bộ phân loại thành 3 SVM riêng biệt dựa trên số vùng liên thông của ký tự giúp giảm nhầm lẫn giữa các ký tự có đặc điểm hình học tương tự, cải thiện độ chính xác nhận dạng so với mô hình SVM đơn.
Tác động của tiền xử lý: Sử dụng bộ lọc trung vị và loại bỏ nhiễu cạnh giúp làm sạch dữ liệu đầu vào, giảm tỷ lệ nhận dạng sai do nhiễu ảnh, góp phần nâng cao độ chính xác chung của hệ thống.
So sánh với các nghiên cứu trước: Kết quả nhận dạng đạt độ chính xác cao hơn so với các mô hình nhận dạng chữ viết tay Tiếng Việt trước đây, đồng thời phù hợp với xu hướng sử dụng SVM và kết hợp nhiều đặc trưng để tăng hiệu quả.

Thảo luận kết quả

Nguyên nhân chính giúp nâng cao độ chính xác là sự kết hợp đa dạng các phương pháp trích đặc trưng, tận dụng ưu điểm của từng nhóm đặc trưng hình học và thống kê. Việc phân loại dựa trên vùng liên thông tận dụng đặc điểm cấu trúc riêng biệt của chữ viết Tiếng Việt, giảm nhầm lẫn giữa các ký tự có hình dạng gần giống.

So với các nghiên cứu nhận dạng chữ viết tay Latin và số, đặc thù của Tiếng Việt với nhiều dấu và biến thể ký tự đòi hỏi mô hình phức tạp hơn, nhưng kết quả đạt được cho thấy khả năng ứng dụng thực tiễn cao. Dữ liệu có thể được trình bày qua biểu đồ so sánh tỷ lệ nhận dạng lỗi giữa các tổ hợp đặc trưng và mô hình phân loại, hoặc bảng ma trận nhầm lẫn thể hiện chi tiết lỗi nhận dạng từng ký tự.

Đề xuất và khuyến nghị

Tối ưu hóa bộ trích đặc trưng: Tiếp tục nghiên cứu và phát triển các tổ hợp đặc trưng mới, ưu tiên các phương pháp kết hợp hình học và thống kê để nâng cao độ chính xác và giảm kích thước dữ liệu đầu vào.
Phát triển mô hình phân loại đa tầng: Áp dụng mô hình phân loại đa tầng hoặc kết hợp nhiều bộ phân loại chuyên biệt dựa trên đặc điểm vùng liên thông và cấu trúc ký tự nhằm giảm nhầm lẫn và tăng tốc độ nhận dạng.
Cải tiến tiền xử lý ảnh: Nghiên cứu các kỹ thuật tiền xử lý nâng cao như lọc nhiễu thích nghi, chuẩn hóa hình dạng ký tự để cải thiện chất lượng dữ liệu đầu vào, đặc biệt với dữ liệu thu thập trong điều kiện thực tế.
Mở rộng tập dữ liệu và đa dạng hóa người viết: Thu thập thêm mẫu chữ viết tay từ nhiều đối tượng khác nhau để tăng tính đại diện và khả năng tổng quát của mô hình, đồng thời áp dụng các kỹ thuật học sâu để khai thác đặc trưng phức tạp hơn.

Các giải pháp trên nên được triển khai trong vòng 1-2 năm tới, phối hợp giữa các nhóm nghiên cứu và doanh nghiệp ứng dụng để phát triển hệ thống nhận dạng chữ viết tay Tiếng Việt có độ chính xác và hiệu quả cao.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Khoa học Máy tính, Trí tuệ nhân tạo: Nắm bắt các phương pháp trích đặc trưng và kỹ thuật học máy trong nhận dạng chữ viết tay, làm cơ sở cho các nghiên cứu tiếp theo.
Chuyên gia phát triển phần mềm xử lý ngôn ngữ tự nhiên và nhận dạng ký tự: Áp dụng mô hình và kết quả nghiên cứu để xây dựng các ứng dụng nhập liệu tự động, chuyển đổi chữ viết tay sang văn bản số.
Doanh nghiệp công nghệ và giáo dục: Tận dụng hệ thống nhận dạng chữ viết tay để phát triển các sản phẩm hỗ trợ học tập, kiểm tra tự động, hoặc số hóa tài liệu.
Cơ quan quản lý và bảo tồn ngôn ngữ: Sử dụng công nghệ nhận dạng chữ viết tay để số hóa và lưu trữ các tài liệu chữ viết tay Tiếng Việt, góp phần bảo tồn di sản văn hóa.

Câu hỏi thường gặp

Phương pháp trích đặc trưng nào hiệu quả nhất cho nhận dạng chữ viết tay Tiếng Việt?
Kết quả nghiên cứu cho thấy sự kết hợp của Gradient Feature, Structural Feature và Concavity Feature mang lại độ chính xác cao nhất, khoảng 97% trên tập dữ liệu thử nghiệm.
Tại sao lại sử dụng SVM cho phân loại đa lớp trong bài toán này?
SVM có khả năng tìm siêu phẳng phân cách tối ưu, đảm bảo nghiệm toàn cục và duy nhất, phù hợp với bài toán phân loại nhiều lớp khi kết hợp với chiến lược mở rộng như One-Versus-One.
Phương pháp đánh giá chéo K-fold có vai trò gì?
Phương pháp này giúp đánh giá mô hình một cách khách quan và ổn định bằng cách sử dụng toàn bộ dữ liệu cho cả huấn luyện và kiểm tra, giảm thiểu sai số do phân chia dữ liệu ngẫu nhiên.
Làm thế nào để giảm nhầm lẫn giữa các ký tự có hình dạng tương tự?
Việc phân loại dựa trên đặc điểm vùng liên thông của ký tự, xây dựng các bộ phân loại riêng biệt cho từng nhóm vùng liên thông giúp giảm nhầm lẫn hiệu quả.
Có thể áp dụng mô hình này cho chữ viết tay online không?
Mô hình hiện tại tập trung nhận dạng offline, tuy nhiên các phương pháp trích đặc trưng và phân loại có thể được điều chỉnh để áp dụng cho dữ liệu online với các đặc trưng thời gian và vận tốc.

Kết luận

Đã xây dựng thành công hệ thống nhận dạng chữ viết tay Tiếng Việt offline với 147 lớp ký tự, thu thập 4410 mẫu dữ liệu thực tế.
Khảo sát và kết hợp 7 phương pháp trích đặc trưng, tạo ra 127 tổ hợp, trong đó 8 tổ hợp cho hiệu quả nhận dạng cao nhất với tỷ lệ lỗi trung bình 2.83%.
Áp dụng mô hình phân loại SVM đa lớp và mô hình kết hợp 3 SVM dựa trên vùng liên thông, cải thiện độ chính xác và giảm nhầm lẫn.
Đề xuất các hướng phát triển tiếp theo bao gồm tối ưu hóa đặc trưng, mô hình phân loại đa tầng, cải tiến tiền xử lý và mở rộng tập dữ liệu.
Kêu gọi các nhà nghiên cứu, doanh nghiệp và cơ quan quản lý quan tâm ứng dụng và phát triển công nghệ nhận dạng chữ viết tay Tiếng Việt để nâng cao hiệu quả xử lý ngôn ngữ và bảo tồn văn hóa.

Tiếp theo, việc triển khai các giải pháp đề xuất và mở rộng nghiên cứu sẽ góp phần hoàn thiện hệ thống nhận dạng chữ viết tay Tiếng Việt, hướng tới ứng dụng rộng rãi trong thực tế.

Trích đoạn nội dung tài liệu

Chương 1 giới thiệu tong quan về dé tài như sơ lược quá trình phát triển hệ thống CR, tên dé tài, mục tiêu, giới hạn nghiên cứu và ý nghĩa của đề tài. Chương 2 trình bày cơ sở lý thuyết chúng tôi vận dụng trong hệ thống gồm mô hình tổng quát hệ thống CR offline, các phương pháp trích đặc trưng đã sử dụng. phương pháp học máy SVM và phương pháp đánh giá chéo K-fold. Chương 3 tìm hiểu các kết quả nghiên cứu liên quan với dé tài nhằm giúp chúng tôi có cái nhìn về phương pháp và kết quả đã đạt được từ các trong công trình nghiên cứu trước đó.

Chương 4 dé xuất và hiện thực mô hình nhận dạng. Chương 5 nêu kết quả thực nghiệm đạt được trên tập dữ liệu và đưa ra nhận xét đánh giá. Chương 6 tong kết các kết quả đã đạt được bên cạnh ưu, nhược điểm và hướng phát trién tương lai của đề tài. CƠ SỞ LÝ THUYET CHUONG 2 CO SO LY THUYET Do tai dé nghiên cứu của chúng tôi hướng đến hệ thông CR chữ viết tay offline.

Nham mục đích dễ trình bày không nhăm lẫn nên khi chúng tôi dé cập đến khái niệm hệ thống CR thì đó là hệ thông CR chữ viết tay offline. Trong phân này, chúng tôi sẽ trình bày mô hình tong quát của hệ thống CR và so lược các kỹ thuật áp dung cho từng tiến trình của mô hình. Trong hệ thống CR sẽ bao gồm nhiều tiến trình con với nhiều kỹ thuật khác nhau được xây dựng phục vụ cho từng mục đích khác nhau. Sự kết hợp này sẽ tạo nên độ chính xác khi nhận dang cho hệ thong CR.

Chính vi thé, quá trình nghiên cứu về hệ thông CR là một quá trình phức tạp. Ngoài ra trong giới hạn nghiên cứu của đề tài, chúng tôi sẽ trình bày bảy phương pháp trích đặc trưng, phương pháp học máy SVM và phương pháp đánh giá chéo K-fold mà chúng tôi sẽ vận dụng để khảo sát trong nghiên cứu này.1 Mô hình hệ thống CRỊ3] Quá Trình Thu Thập Quá Trình Tiền Xử Lý Quá Trình Phân Tách Ỷ Quá Trình Trích Đặc Trưng Ỷ Quá Trình Chọn Đặc Trưng Ỷ Quá Trình Phân Loại Nhận Dạng Ỷ Quá Trình Hậu Xử Lý Hình 2.1 Sơ đô các quá trình hệ thống CR[3]. CƠ SỞ LÝ THUYET Trong quá trình tìm hiểu sơ bộ về hệ thông CR, mô hình chúng tôi có thé thay từ hệ thống CR như miéu tả ở hình 2. Quá trình nhận dang sẽ trải qua bay bước chính.

Cac bước này nối kết với nhau để tạo nên dòng chảy các công việc. Đầu ra của quá trình này chính là đầu vào của quá trình kia. Quá trình thu thập có nhiệm vụ tạo ra hình ảnh để đưa vào hệ thống nhận dạng thông qua thiết bị máy scan. Quá trình tiền xử lý thực hiện khử bớt nhiễu xảy ra đối với ảnh đưa vào.

Trong thực tế có rất nhiều nguyên nhân dẫn đến việc gây nhiễu trên ảnh như chất lượng tài liệu scan, máy scan, cách thức scan dữ liệu. Tất cả những nguyên nhân đó có thể ảnh hưởng đến chất lượng nhận dạng của hệ thống CR. Sau quá trình tiền xử lý hệ thống sẽ thu được ảnh đã giảm bớt được lượng nhiễu có thể. Hình ảnh này tiếp đến sẽ được đưa vào quá trình phân tách để thực hiện thao tác tách những don vi xử lý như ký tu, từ, dong hay đoạn văn tùy theo mô hình CR hiện thực.

Quá trình trích đặc trưng mục tiêu chính giúp hệ thống trích những đặc trưng phân biệt để phục vụ cho quá trình nhận dạng. Tuy nhiên, nhiều thuộc tính trong quá trình trích đặc trưng có thể dư thừa vì thế cần thực hiện thao tác lựa chọn những đặc trưng phù hợp. Quá trình chọn đặc trưng sẽ chọn một số thuộc tính và loại bỏ những thuộc tính dư thừa nhằm tăng khả năng tính toán cho hệ thống. Quá trình phân loại nhận dạng dựa vào các đặc trưng được chọn lựa để thực hiện công việc nhận dạng.

Trong hệ thống CR, có thể nói quá trình trích đặc trưng và quá trình phân loại nhận dạng là hai quá trình quan trọng. Vì cả hai quá trình này đều mang ý nghĩa quyết định tạo nên độ chính xác và sự khác biệt cho hệ thống CR. Đa số các bài báo đều khai thác những kỹ thuật khác nhau trong hai quá trình này nhằm mục tiêu cải tiễn hệ thống CR. Nói như thế không phải các quá trình khác đều không có ảnh hưởng đáng kế đến hệ thống.

Mỗi quá trình đều có đóng góp tích cực đến việc tăng khả năng nhận dạng chính xác cho hệ thống. Quá trình hậu xử lý mục đích chính thực hiện việc chỉnh sửa kết quả nhận dạng nham mục tiêu tăng thêm độ chính xác cần thiết. Tóm lại, mô hình như hình 2.1 xem như mô hình tổng quát của hệ thống CR. Tuy nhiên tùy vào những nghiên cứu và khảo sát cụ thé mà mô hình CR có thé thay đối không nhất thiết có đầy đủ các quá trình trên.

Phần kế tiếp chúng tôi xin trình bày cơ sở lý thuyết một vài CHUONG 2. CƠ SỞ LÝ THUYET phương pháp trích đặc trưng và phương pháp học máy SVM kết hợp đánh giá chéo K- fold sẽ áp dụng trong luận văn này.2 Phuong pháp trích đặc trưng 2.1 Gradient Feature[2| Phương pháp nay sử dung đặc trưng gradient theo những hướng cụ thé của hình anh. Từ đó hình thành nên dữ liệu thống kê bằng cách xem số lần xuất hiện của nhóm hướng cụ thể và đưa ra giá trị cho đặc trưng của hình ảnh. Từ những ý trên, rõ ràng trong phương pháp này cần quan tam hai yếu tố: cách tính gradient của hình ảnh và bao nhiêu hướng cụ thé để khảo sát.

Về cách tinh gradient, tác giả sẽ tinh bằng cách tích chập hình ảnh với cửa số Sobel theo trục x và y. Sau đó, tính độ lớn và hướng của từng pixel trong hình ảnh đó. Còn về số hướng cụ thể thì tùy thuộc vào số lượng hướng hay số lượng đặc trưng muốn thống kê mà đưa ra quyết định. Sau khi đếm số lượng hướng, tác giả chọn giá trị ngưỡng cho mỗi đặc trưng và so sánh số lượng hướng với ngưỡng này.

Nếu số lượng lớn hơn giá trị ngưỡng thì đặc trưng đó bằng 1 và ngược lại thì bằng 0. Sau đây là công thức tính toán giá trị gradient của một pixel bất kỳ trong hình ảnh. Of of Vf = [Gx,Gy] = [Bx’ by Gx a(x,y) ,ÿ) an — = tan Gy Gx, Gy: giá tri dao ham trên trục x và trục y của hình anh, a(x, y): giá tri gradient cua pixel (x,y) của hình anh. Ngoài ra, hình 2.2 bên dưới biểu hiện cho 12 giá tri thông kê của 12 hướng thuộc tính của vùng thứ 8 trong ảnh và giá tri 12 thuộc tính hình thành với ngưỡng 8 = 5 trong phương pháp Gradient Feature.

CƠ SỞ LÝ THUYET a 1 10000000000 a 12 features Hình 2.2 Các thuộc tinh cua phương pháp Gradient Feature[2].2 Structural Feature[2| Cũng sử dung giá trị hướng của gradient nhưng việc thống kê lại dựa trên đặc trưng khác của hình ảnh. Ở đây, tác giả sẽ đưa ra 12 luật tương ứng với 12 đặc trưng thống kê. Với mỗi pixel của hình ảnh, tác giả sẽ xem xét 12 luật ấy và sẽ có số lượng tương ứng. Điều chú ý ở các luật này là chúng thống kê dựa vào các điểm lân cận của pixel.

Cũng giống phương pháp Gradient Feature, tác giả cũng áp dụng quy tắc ngưỡng cho mỗi luật để đặt các luật về 2 giá trị 0 và 1.3 mô tả 8 pixel lận cận có đánh thứ tự của một pixel và 12 quy luật thống kê cho 12 thuộc tính của một hình ảnh bất ky. Khi xem xét một pixel bat ky dé thống kê quy luật thi cần xem xét 8 pixel lận cận. Nếu pixel lân cận thỏa quy luật nào đó thi sẽ tăng quy luật đó lên 1 đơn vi. Ví dụ như dòng đầu tiên trong bảng quy luật, nêu điểm lận cận NO có gradient thuộc về vùng (2,3 4) hay N4 có gradient thuộc về vùng (2.4) thì quy luật 1 sẽ tăng lên tương ứng.

Và tương tự cho các quy luật còn lại với các điêm lân cận. CƠ SỞ LÝ THUYET N3 N2 NI N4 x NO NS N6 N7 Rules | Description Neighbor 1 Neighbor 2 1 Type 1 horizontal stroke NO (2.4) 2 Type 2 horizontal stroke NO (8.10) 3 Type 1 vertical stroke N2 (5,6,7) N6 (5.7) 4 Type 2 vertical stroke N2(1.11) 5 Type 1 upward diagonal N5 (4.6) 6 Type 2 upward diagonal NS(0.11,10) 7 Type 1 downward điagonal N3@.1) 8 Type 2 downward diagonal N3 (7,8,9) N7(7,8.9) 9 Type 1 right angle N2 (5.6,7) NO (8,9,10) 10 Type 2 right angle N6 (5.4) 11 Type 3 right angle N4 (8,9,10) N2(1,0,11) 12 Type 4 right angle N4 (4,3,2) N6 (1.3 Các thuộc tinh cua phương pháp Structural Feature[2]. Concavity Feature[2] Trong phương pháp nay, tác giả sẽ trích 8 đặc trưng cơ bản: số lượng pixel màu den, số lượng horizonal large stroke, số lượng vertical large stroke, số lượng upward concavity, số lượng downward concavity, số lượng leftward concavity, số lượng rightward concavity và số lượng lỗ trống hình ảnh. Tương tự 2 phương pháp trên, tác giả cũng sẽ chọn giá trị ngưỡng để thiết lập giá trị đặc trưng bang 0 hay 1.4 (a) miêu ta thuộc tinh số lượng pixel đen trong vùng 12 của hình ảnh.4 (b) tính toán xem pixel màu xanh thuộc horizontal large stroke hay vertical large stroke.

Thuộc tính này được xác định dựa vào SỐ pixel liên tục thuộc hàng và cột của pixel màu xanh thuộc về. Nếu số pixel liên tục thuộc hàng lớn hon SỐ pixel liên tục thuộc cột nhân 1.5 thì pixel màu xanh có thuộc tính horizontal large stroke. Ngược lại, nếu số pixel liên tục thuộc hàng nhỏ hơn sỐ pixel liên tục thuộc cột nhân 0.75 thi pixel màu xanh có thuộc tính vertical large stroke. Theo như hình 2.4 (b), pixel màu xanh có số pixel liên tục thuộc hàng bằng 5 và số pixel liên tục thuộc cột bằng 9 thỏa điều kiện thuộc tính S CHUONG 2.

CƠ SỞ LÝ THUYET vertical large stroke. Vì thé pixel mau xanh duoc đếm thuộc về thuộc tinh vertical large stroke.4 (c) đưa ra 8 hướng thống kê để xét xem pixel sẽ thuộc về thuộc tính upward concavity, downward concavity, leftward concavity, rightward concavity hay lỗ trống. Nếu tir pixel xem xét mở rộng theo 8 hướng dung được pixel của hình ảnh (pixel màu đen) thì xem như hướng đó của pixel khảo sát tôn tại. Sau khi khảo sát theo 8 hướng, nếu tổn tại các hướng (0-7-6-5-4) thì pixel xem xét có thuộc tính upward concavity.

Tương tự pixel sẽ có thuộc tính downward concavity (0-1-2-3-4); leftward concavity (2-1-0-7-6); rightward concavity (2-3-4-5-6); 16 trong (tat cả các hướng).

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài viết "Nhận Dạng Chữ Viết Tay Tiếng Việt Offline Trong Luận Văn Thạc Sĩ Khoa Học Máy Tính" khám phá công nghệ nhận dạng chữ viết tay tiếng Việt, một lĩnh vực đang ngày càng trở nên quan trọng trong nghiên cứu và ứng dụng công nghệ thông tin. Bài viết nêu bật các phương pháp và kỹ thuật hiện đại được sử dụng để phát triển hệ thống nhận dạng chữ viết tay, đồng thời chỉ ra những lợi ích mà công nghệ này mang lại, như cải thiện hiệu suất trong việc xử lý văn bản và hỗ trợ người dùng trong việc chuyển đổi chữ viết tay thành văn bản số hóa.

Để mở rộng thêm kiến thức về các ứng dụng và nghiên cứu liên quan trong lĩnh vực công nghệ thông tin, bạn có thể tham khảo bài viết "Luận văn thạc sĩ khoa học máy tính xây dựng hệ thống khuyến nghị dựa trên graph neural network", nơi bạn sẽ tìm hiểu về cách thức xây dựng hệ thống khuyến nghị thông minh. Ngoài ra, bài viết "Luận văn thạc sĩ một số quy trình huấn luyện mạng nơron và ứng dụng xấp xỉ hàm số" sẽ cung cấp cái nhìn sâu sắc về quy trình huấn luyện mạng nơron, một công nghệ cốt lõi trong nhận dạng chữ viết tay. Cuối cùng, bạn cũng có thể tìm hiểu thêm về "Luận án tiến sĩ nghiên cứu phát triển giải thuật điều khiển thông minh dựa trên mạng nơ ron mờ hồi quy ứng dụng điều khiển hệ phi tuyến", để thấy được ứng dụng của mạng nơron trong các lĩnh vực khác nhau. Những tài liệu này sẽ giúp bạn mở rộng hiểu biết và khám phá sâu hơn về công nghệ thông tin hiện đại.

#Luận văn Thạc sĩ

#khoa học máy tính

#trí tuệ nhân tạo

#công nghệ nhận dạng

#nhận dạng chữ viết tay

Chủ đề

Nghiên cứu và phát triển trong khoa học máy tính

Công nghệ nhận dạng chữ viết tay

Ứng dụng của trí tuệ nhân tạo trong giáo dục

Phân tích và xử lý ngôn ngữ tự nhiên