Luận Văn Thạc Sĩ Về Thuật Toán Trích Xuất Số Phách Trên Phiếu Trả Lời Trắc Nghiệm

Luận văn thạc sĩ nghiên cứu xây dựng thuật toán trích xuất số phách trên phiếu trả lời trắc nghiệm của trường đại học phan thiết, đánh giá hiện trạng, phân tích vấn đề, đề xuất

Trường đại học

Trường Đại học Phan Thiết

Chuyên ngành

Công nghệ Thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2023

119

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: Lý do chọn đề tài

1.1. Mục tiêu, nội dung và phương pháp nghiên cứu

1.1.1. Mục tiêu nghiên cứu

1.1.2. Nội dung nghiên cứu

1.1.3. Phạm vi nghiên cứu

1.1.4. Ý nghĩa của đề tài

1.1.4.1. Ý nghĩa khoa học

1.1.4.2. Ý nghĩa thực tiễn

1.1.5. Cấu trúc luận văn

2. CHƯƠNG 2: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG CHỮ SỐ VIẾT TAY

2.1. Tổng quan

2.2. Các công trình nghiên cứu trong và ngoài nước

2.2.1. Các công trình nghiên cứu trong nước

2.2.2. Các công trình nghiên cứu nước ngoài

DANH MỤC CÁC TỪ VIẾT TẮT

DANH MỤC CÁC BẢNG BIỂU

DANH MỤC CÁC HÌNH VẼ

TÓM TẮT

3. CHƯƠNG 3: Mô hình mạng Nơ-ron tích chập

4. CHƯƠNG 4: Xử lý ảnh và nhận dạng chữ số viết tay với mạng Nơ-ron tích chập

5. CHƯƠNG 5: Đánh giá kết quả thực hiện

6. KẾT LUẬN VÀ KIẾN NGHỊ

Tóm tắt

I. Giới thiệu về thuật toán trích xuất số phách

Trong bối cảnh giáo dục hiện đại, việc áp dụng thuật toán để trích xuất dữ liệu từ phiếu trả lời trắc nghiệm ngày càng trở nên cần thiết. Đặc biệt tại Trường Đại học Phan Thiết, việc trích xuất số phách từ phiếu trả lời trắc nghiệm không chỉ giúp giảm thiểu thời gian chấm thi mà còn nâng cao độ chính xác trong việc đánh giá kết quả học tập của sinh viên. Hệ thống đánh giá này sử dụng công nghệ thông tin hiện đại để tối ưu hóa quy trình chấm điểm, từ đó tạo điều kiện thuận lợi cho cả giảng viên và sinh viên. Việc áp dụng công nghệ này không chỉ giúp tiết kiệm thời gian mà còn đảm bảo tính khách quan trong đánh giá. Theo một nghiên cứu gần đây, việc chấm điểm tự động đã giảm đáng kể khối lượng công việc cho cán bộ chấm thi, từ đó nâng cao hiệu quả quản lý lớp học.

1.1. Đặc điểm của phiếu trả lời trắc nghiệm

Phiếu trả lời trắc nghiệm thường có cấu trúc đơn giản với các ô đánh dấu cho từng câu hỏi. Mỗi ô này cần được nhận diện chính xác để đảm bảo kết quả chấm điểm chính xác. Việc xử lý ảnh và nhận dạng chữ số viết tay là những bước quan trọng trong quy trình trích xuất số phách. Các phương pháp như mạng Nơ-ron tích chập (CNN) đã được chứng minh là hiệu quả trong việc nhận diện các ký tự và số viết tay. Hệ thống cần phải có khả năng xử lý các tình huống như chữ viết không đồng nhất và các lỗi trong quá trình nhận dạng. Điều này đòi hỏi phải có một thuật toán mạnh mẽ có thể thích ứng với nhiều kiểu chữ viết khác nhau và đảm bảo độ chính xác cao trong việc trích xuất số liệu.

1.2. Phương pháp trích xuất số phách

Phương pháp trích xuất số phách bao gồm các bước tiền xử lý ảnh, nhận diện biên và tách vùng số phách. Việc sử dụng các kỹ thuật như lọc mịn ảnh và nhị phân hóa là rất quan trọng để đảm bảo rằng các số phách được nhận diện một cách chính xác. Độ nhiễu của ảnh có thể ảnh hưởng đến kết quả nhận diện, do đó cần áp dụng các kỹ thuật xử lý ảnh phù hợp để giảm thiểu vấn đề này. Sau khi xác định biên, các thuật toán sẽ tách vùng chứa số phách ra khỏi ảnh tổng thể. Quá trình này không chỉ giúp nhận diện chính xác mà còn đảm bảo rằng số liệu thu được có thể được sử dụng cho các mục đích khác nhau trong giáo dục.

II. Ứng dụng của thuật toán trong thực tiễn

Việc áp dụng thuật toán trích xuất số phách trong giáo dục tại Trường Đại học Phan Thiết không chỉ mang lại lợi ích cho việc chấm thi mà còn mở ra nhiều cơ hội mới cho việc cải tiến quy trình đánh giá. Hệ thống này giúp tự động hóa việc chấm điểm và giảm thiểu sai sót do con người gây ra. Cán bộ chấm thi sẽ không còn phải thực hiện các thao tác lặp đi lặp lại, từ đó nâng cao hiệu suất làm việc và giảm bớt áp lực trong các kỳ thi lớn. Nghiên cứu cho thấy rằng hệ thống này có thể xử lý hàng nghìn phiếu trả lời trong thời gian ngắn, đảm bảo rằng kết quả được công bố đúng thời hạn. Đánh giá kết quả cũng trở nên khách quan hơn nhờ vào việc sử dụng công nghệ, giúp tạo ra một môi trường học tập công bằng cho tất cả sinh viên.

2.1. Tăng cường hiệu quả quản lý lớp học

Hệ thống trích xuất số phách không chỉ giúp giảm thiểu thời gian chấm thi mà còn giúp quản lý lớp học hiệu quả hơn. Việc có thể theo dõi điểm số và kết quả học tập của sinh viên một cách nhanh chóng và chính xác sẽ giúp giảng viên có thể đưa ra các phương pháp giảng dạy phù hợp hơn. Công nghệ thông tin đã chứng minh rằng việc sử dụng các công cụ tự động hóa trong giáo dục có thể cải thiện đáng kể hiệu suất học tập của sinh viên. Các báo cáo điểm số được tạo ra tự động giúp sinh viên dễ dàng theo dõi tiến độ học tập của mình, từ đó có thể điều chỉnh phương pháp học tập cho phù hợp.

2.2. Đảm bảo tính bảo mật và độ tin cậy

Một trong những lợi ích lớn nhất của việc áp dụng thuật toán này là đảm bảo tính bảo mật và độ tin cậy của kết quả thi. Việc trích xuất số phách tự động giúp giảm thiểu nguy cơ mất phiếu kiểm tra và đảm bảo rằng tất cả các bài thi đều được chấm một cách công bằng. Hệ thống cũng cho phép lưu trữ và truy xuất dữ liệu một cách dễ dàng, giúp cho việc quản lý thông tin trở nên hiệu quả hơn. Các giáo viên và cán bộ chấm thi có thể dễ dàng truy cập vào các kết quả đã được xử lý, từ đó có thể đưa ra những quyết định đúng đắn hơn trong quá trình giảng dạy và đánh giá học tập.

05/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ xây dựng thuật toán trích xuất số phách trên phiếu trả lời trắc nghiệm của trường đại học phan thiết

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh giáo dục hiện đại, việc ứng dụng công nghệ thị giác máy tính vào quá trình chấm thi trắc nghiệm tự động đang trở thành xu hướng tất yếu nhằm nâng cao hiệu quả và độ chính xác trong đánh giá học tập. Trường Đại học Phan Thiết (ĐHPT) hàng năm tổ chức các kỳ thi Toeic chuẩn đầu ra với số lượng bài thi lên đến hàng nghìn, gây áp lực lớn về thời gian và nhân lực cho công tác chấm thi thủ công. Các khó khăn như sai sót trong nhập số phách, mất phiếu kiểm tra, chậm trễ trong trả kết quả và thiếu tính bảo mật đã đặt ra nhu cầu cấp thiết về một hệ thống chấm thi tự động, chính xác và tiết kiệm chi phí.

Mục tiêu nghiên cứu của luận văn là xây dựng thuật toán trích xuất số phách trên phiếu trả lời trắc nghiệm dựa trên công nghệ nhận dạng chữ số viết tay sử dụng mạng Nơ-ron tích chập (CNN). Nghiên cứu tập trung vào việc phát triển mô hình nhận dạng chữ số viết tay từ 0 đến 9 và áp dụng vào việc chấm điểm tự động các bài thi trắc nghiệm đơn đáp án gồm 4 lựa chọn A, B, C, D. Phạm vi nghiên cứu được giới hạn trong dữ liệu thu thập từ phiếu trả lời trắc nghiệm của Trung tâm Phát triển Nguồn nhân lực tại Trường ĐHPT trong năm học gần nhất.

Ý nghĩa của đề tài không chỉ nằm ở việc giảm tải công việc thủ công cho cán bộ chấm thi mà còn nâng cao độ chính xác, bảo mật và tính minh bạch trong quá trình chấm thi. Hệ thống được kỳ vọng giúp tiết kiệm thời gian chấm thi, giảm thiểu sai sót do con người và tạo điều kiện thuận lợi cho việc quản lý, lưu trữ và xử lý khiếu nại kết quả thi. Qua đó, nghiên cứu góp phần thúc đẩy ứng dụng công nghệ thông tin trong giáo dục, đặc biệt trong lĩnh vực đánh giá kết quả học tập.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai khung lý thuyết chính: xử lý ảnh kỹ thuật số và mạng Nơ-ron tích chập (CNN).

Xử lý ảnh kỹ thuật số: Bao gồm các kỹ thuật tiền xử lý ảnh như lọc mịn, nhị phân hóa ảnh, lấy ngưỡng Otsu, chỉnh nghiêng ảnh, phát hiện biên cạnh bằng thuật toán Canny và mã hóa hướng biên Freeman. Các kỹ thuật này giúp chuẩn hóa dữ liệu ảnh, giảm nhiễu và trích xuất đặc trưng quan trọng phục vụ cho bước nhận dạng.
Mạng Nơ-ron tích chập (CNN): Là mô hình học sâu được thiết kế đặc biệt cho các bài toán nhận dạng hình ảnh. CNN sử dụng các lớp tích chập để tự động trích xuất đặc trưng từ ảnh đầu vào, kết hợp với các lớp kết nối đầy đủ để phân loại chữ số viết tay. Mạng CNN có khả năng học các đặc trưng phức tạp và đạt độ chính xác cao trong nhận dạng chữ số viết tay.

Ba khái niệm chuyên ngành quan trọng được sử dụng gồm: điểm ảnh (pixel), độ xám ảnh (grayscale), và thuật toán phát hiện biên cạnh (edge detection). Điểm ảnh là đơn vị cơ bản của ảnh kỹ thuật số, độ xám ảnh biểu diễn mức sáng của điểm ảnh, còn thuật toán phát hiện biên cạnh giúp xác định ranh giới các ký tự số viết tay trên phiếu trả lời.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là tập ảnh chữ số viết tay thu thập từ phiếu trả lời trắc nghiệm của sinh viên Trường ĐHPT, kết hợp với bộ dữ liệu chuẩn MNIST để huấn luyện và đánh giá mô hình. Cỡ mẫu bao gồm khoảng hàng nghìn ảnh chữ số viết tay, được lựa chọn ngẫu nhiên nhằm đảm bảo tính đại diện và đa dạng về phong cách viết.

Phương pháp phân tích chính là xây dựng và huấn luyện mô hình CNN sử dụng ngôn ngữ lập trình Python cùng các thư viện mã nguồn mở như OpenCV và TensorFlow. Quá trình nghiên cứu được thực hiện theo timeline gồm: thu thập và tiền xử lý dữ liệu (2 tháng), xây dựng mô hình CNN và huấn luyện (3 tháng), phát triển thuật toán trích xuất số phách và chấm điểm tự động (2 tháng), thử nghiệm và đánh giá kết quả (1 tháng).

Các bước tiền xử lý ảnh bao gồm lọc mịn, nhị phân hóa, lấy ngưỡng Otsu, chỉnh nghiêng và phát hiện biên cạnh nhằm chuẩn hóa ảnh đầu vào cho mô hình CNN. Mô hình CNN được thiết kế với các lớp tích chập, lớp pooling và lớp fully connected, tối ưu bằng thuật toán Adam và hàm mất mát cross-entropy. Kết quả được đánh giá qua các chỉ số độ chính xác, độ nhạy và độ đặc hiệu.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Độ chính xác nhận dạng chữ số viết tay: Mô hình CNN đạt độ chính xác trung bình khoảng 96,5% trên tập kiểm thử, vượt trội so với các phương pháp truyền thống như SVM (khoảng 85-90%). Kết quả này được minh họa qua biểu đồ so sánh độ chính xác giữa các mô hình.
Hiệu quả trích xuất số phách trên phiếu trả lời: Thuật toán trích xuất số phách tự động từ ảnh phiếu trả lời đạt tỷ lệ thành công khoảng 94%, giúp giảm thời gian xử lý mỗi phiếu từ trung bình 3 phút xuống còn dưới 30 giây.
Độ chính xác chấm điểm tự động: Hệ thống chấm điểm tự động dựa trên nhận dạng số phách và đáp án trắc nghiệm đạt độ chính xác trên 98% so với chấm thủ công, đảm bảo tính khách quan và nhất quán trong đánh giá.
Tiết kiệm thời gian và nhân lực: So với phương pháp chấm thủ công, hệ thống tự động giúp tiết kiệm khoảng 70% thời gian và giảm đáng kể sai sót do nhập liệu thủ công.

Thảo luận kết quả

Nguyên nhân chính dẫn đến hiệu quả cao của mô hình CNN là khả năng tự động trích xuất đặc trưng phức tạp từ ảnh chữ số viết tay, giúp nhận dạng chính xác ngay cả với các biến thể phong cách viết khác nhau. Kết quả này phù hợp với các nghiên cứu quốc tế về ứng dụng CNN trong nhận dạng chữ số viết tay.

Việc áp dụng các kỹ thuật tiền xử lý ảnh như lọc mịn, nhị phân hóa và chỉnh nghiêng đã góp phần giảm nhiễu và chuẩn hóa dữ liệu, nâng cao độ chính xác nhận dạng. So với các phương pháp truyền thống như SVM hay đối sánh mẫu, CNN thể hiện ưu thế vượt trội về khả năng học và tổng quát hóa.

Kết quả chấm điểm tự động không chỉ đảm bảo tính chính xác mà còn tăng tính bảo mật và minh bạch trong quá trình thi cử, giảm thiểu rủi ro mất mát phiếu kiểm tra và sai sót do con người. Dữ liệu có thể được trình bày qua bảng so sánh thời gian và độ chính xác giữa chấm thủ công và chấm tự động, cũng như biểu đồ phân phối lỗi nhận dạng.

Tuy nhiên, một số hạn chế như độ chính xác giảm nhẹ khi ảnh đầu vào bị mờ hoặc nhiễu nặng vẫn tồn tại, đòi hỏi nghiên cứu tiếp tục cải tiến thuật toán tiền xử lý và tăng cường dữ liệu huấn luyện.

Đề xuất và khuyến nghị

Triển khai hệ thống chấm thi tự động tại các kỳ thi lớn: Đề xuất áp dụng hệ thống tại các kỳ thi Toeic chuẩn đầu ra của Trường ĐHPT trong vòng 1 năm tới nhằm giảm tải công việc cho cán bộ chấm thi và nâng cao hiệu quả quản lý.
Nâng cao chất lượng dữ liệu đầu vào: Khuyến nghị tổ chức tập huấn cho sinh viên về cách viết số phách rõ ràng, tránh mờ nhòe để tăng độ chính xác nhận dạng, đồng thời cải tiến quy trình quét ảnh phiếu trả lời.
Mở rộng ứng dụng cho các loại bài thi khác: Đề xuất nghiên cứu và phát triển thêm các thuật toán nhận dạng cho bài thi tự luận hoặc bài thi trắc nghiệm đa đáp án, mở rộng phạm vi ứng dụng của hệ thống.
Cập nhật và bảo trì hệ thống định kỳ: Khuyến nghị xây dựng kế hoạch bảo trì, cập nhật mô hình CNN và thuật toán xử lý ảnh định kỳ để đảm bảo hiệu suất và độ chính xác trong điều kiện dữ liệu thực tế thay đổi.
Đào tạo nhân sự vận hành và bảo mật dữ liệu: Đề xuất tổ chức các khóa đào tạo cho cán bộ kỹ thuật và quản lý về vận hành hệ thống, bảo mật thông tin và xử lý sự cố nhằm đảm bảo tính ổn định và an toàn của hệ thống.

Đối tượng nên tham khảo luận văn

Giảng viên và cán bộ quản lý giáo dục: Có thể ứng dụng kết quả nghiên cứu để cải tiến quy trình chấm thi, nâng cao hiệu quả và độ chính xác trong đánh giá học sinh, sinh viên.
Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Trí tuệ nhân tạo: Tham khảo mô hình CNN và các kỹ thuật xử lý ảnh để phát triển các ứng dụng nhận dạng chữ viết tay và xử lý ảnh trong nhiều lĩnh vực khác.
Các trung tâm đào tạo và tổ chức thi: Áp dụng hệ thống chấm thi tự động để tiết kiệm thời gian, nhân lực và tăng tính bảo mật trong công tác tổ chức thi.
Doanh nghiệp phát triển phần mềm giáo dục: Sử dụng các thuật toán và mô hình nghiên cứu để phát triển các sản phẩm phần mềm chấm thi tự động, hỗ trợ giáo dục thông minh.

Câu hỏi thường gặp

Hệ thống có thể nhận dạng chính xác chữ số viết tay với phong cách đa dạng không?
Mô hình CNN được huấn luyện trên tập dữ liệu đa dạng, đạt độ chính xác khoảng 96,5%, cho thấy khả năng nhận dạng tốt với nhiều phong cách viết khác nhau.
Thời gian xử lý một phiếu trả lời trắc nghiệm là bao lâu?
Hệ thống tự động xử lý và chấm điểm một phiếu trong vòng dưới 30 giây, nhanh hơn nhiều so với phương pháp thủ công trung bình 3 phút.
Hệ thống có thể áp dụng cho các loại bài thi khác ngoài Toeic không?
Có thể mở rộng ứng dụng cho các bài thi trắc nghiệm khác với cấu trúc tương tự, tuy nhiên cần điều chỉnh thuật toán phù hợp với đặc thù từng loại bài thi.
Làm thế nào để giảm thiểu sai sót do ảnh mờ hoặc nhiễu?
Áp dụng các kỹ thuật tiền xử lý như lọc mịn, chỉnh nghiêng và tăng cường dữ liệu huấn luyện giúp cải thiện độ chính xác nhận dạng trong trường hợp ảnh đầu vào kém chất lượng.
Hệ thống có đảm bảo tính bảo mật và tránh mất mát dữ liệu không?
Hệ thống được thiết kế với cơ chế lưu trữ số hóa và quản lý dữ liệu tập trung, giảm thiểu nguy cơ mất phiếu kiểm tra và tăng cường bảo mật thông tin.

Kết luận

Đã xây dựng thành công mô hình nhận dạng chữ số viết tay dựa trên mạng Nơ-ron tích chập với độ chính xác trên 96%.
Thuật toán trích xuất số phách và chấm điểm tự động giúp tiết kiệm hơn 70% thời gian so với chấm thủ công.
Hệ thống đảm bảo tính chính xác, bảo mật và minh bạch trong quá trình chấm thi trắc nghiệm tại Trường ĐHPT.
Kết quả nghiên cứu có thể mở rộng ứng dụng cho các kỳ thi và bài thi trắc nghiệm khác trong giáo dục.
Đề xuất triển khai hệ thống trong vòng 1 năm tới, đồng thời tiếp tục nghiên cứu cải tiến để nâng cao hiệu quả và mở rộng phạm vi ứng dụng.

Quý độc giả và các đơn vị quan tâm được khuyến khích áp dụng và phát triển thêm dựa trên nền tảng nghiên cứu này nhằm thúc đẩy chuyển đổi số trong giáo dục và nâng cao chất lượng đánh giá học tập.

Trích đoạn nội dung tài liệu

Chương 1: Giới thiệu đề tài Chương 2: Tổng quan về xử lý anh và nhận dạng chữ số viết tay Chương 3: Mô hình mạng Nơ-ron tích chập Chương 4: Xử lý ảnh và nhận dạng chữ số viết tay với mạng Nơ-ron tích chập Chương 5: Đánh giá kết quả thực hiện 5 CHƯƠNG 2. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG CHỮ SỐ VIẾT TAY 2. Tổng quan Trong thời đại hiện nay, nhận dạng chữ số viết tay đã trở thành một yếu tố quan trọng trong nhiều lĩnh vực và có ứng dụng rộng rãi. Ví dụ, việc nhận dạng bảng điểm viết tay, số xe và các tác vụ khác đòi hỏi khả năng nhận dạng chính xác các chữ số viết tay.

Tuy nhiên, nhận dạng chữ viết tay và chữ số viết tay là những thách thức đáng kể đối với các nhà nghiên cứu. Mỗi cá nhân có phong cách viết riêng biệt và đặc trưng, tạo ra sự đa dạng trong các biểu thức chữ viết tay. Do đó, xây dựng một hệ thống nhận dạng chữ số viết tay có khả năng nhận dạng mọi chữ số là một nhiệm vụ không dễ dàng. Các công trình nghiên cứu trong và ngoài nước 2.

Các công trình nghiên cứu trong nước Phân tích chữ viết tay, kể cả việc nhận dạng chữ số viết tay, đang là một lĩnh vực phức tạp mà các nhà nghiên cứu đối mặt. Trong thời gian gần đây, có nhiều nghiên cứu tập trung vào việc nhận dạng chữ số viết tay, và ở Việt Nam cũng xuất hiện nhiều nhóm nghiên cứu trong lĩnh vực này. Các mô hình phổ biến được sử dụng bao gồm: HMM (Hidden Markov Model), SVM (Support Vector Machine), HOG (Histogram of Oriented Gradients), mạng Nơ-ron, và nhiều phương pháp khác. Hiện tại, trong nước ta, chỉ có một số công trình của các tác giả đã được công bố.

Ví dụ, tác giả Lê Thanh Trúc[11] đã nghiên cứu về "Nhận dạng điểm viết tay trên bảng điểm với biến đổi Hough và đặc trưng Gist". Tác giả Phạm Anh Phương[12] đã tìm hiểu "Áp dụng một số chiến lược SVM đa lớp cho bài toán nhận dạng chữ viết tay hạn chế". Tác giả Đinh Thị Mẫn và thành viên[18] đã nghiên cứu “Phương pháp nhận dạng kí tự số viết tay dựa trên mạng Nơ ron học sâu”, trong đó các tác giả đã minh chứng tính hiệu quả của phương pháp đề xuất, thực nghiệm được xây dựng và đánh giá trên tập dữ liệu ảnh MNIST. Kết quả thực nghiệm đã cho thấy tính khả thi và hiệu quả của phương pháp, đồng thời dễ dàng mở rộng cho việc nhận diện các hình ảnh chữ viết tay khác.

Tác giả Hoàng Thị Tình[13], đã thực hiện nghiên cứu về 6 "Xây dựng hệ thống hỗ trợ học sinh thi trắc nghiệm bậc THPT", trong đó tác giả sử dụng phương pháp nhận dạng ký tự (OCR) để nhận diện đáp án trắc nghiệm. Các tác giả cũng đã áp dụng các phương pháp xử lý ảnh như loại bỏ nhiễu, phát hiện cạnh, phân đoạn ảnh, sử dụng thuật toán Hough để phát hiện đường thẳng trong ảnh và phân vùng ảnh. Tác giả cũng sử dụng thuật toán K-Nearest Neighbors (KNN) để phân loại các ký tự được nhận dạng. Kết quả cho thấy hệ thống đạt được độ chính xác trung bình khoảng 85%.

Các công trình nghiên cứu nước ngoài Ngày nay, nhận dạng chữ số viết tay đã trở thành một lĩnh vực phức tạp và thu hút sự quan tâm của nhiều nhà nghiên cứu. Có hai phương pháp chính để thực hiện việc này là nhận dạng online và nhận dạng offline. Trên hình thức nhận dạng online, hệ thống máy tính có khả năng nhận dạng chữ số ngay sau khi người viết đã hoàn thành việc viết lên màn hình. Quá trình này ghi lại thông tin về thứ tự, hướng và tốc độ của các nét chữ số để tạo nền tảng cho việc nhận dạng chữ viết.

Nhận dạng online không gặp nhiều khó khăn vì thông tin về nét viết được lưu lại. Một ví dụ, Hệ thống nhận dạng chữ số viết tay trực tuyến của IBM, được phát triển bởi một nhóm nghiên cứu tại trung tâm nghiên cứu Watson, là một ví dụ tiêu biểu về công nghệ nhận dạng chữ số viết tay trực tuyến. Hệ thống này có khả năng nhận dạng chữ số ngay sau khi chúng được viết trên màn hình, giúp đánh giá tính chính xác và tin cậy của kết quả. Hệ thống nhận dạng chữ số viết tay trực tuyến của IBM sử dụng các thuật toán và mô hình học máy tiên tiến để phân loại và nhận dạng chữ số.

Khi người dùng viết chữ số trên màn hình hoặc bảng vẽ, hệ thống sẽ tự động xử lý và phân tích dữ liệu để nhận dạng chữ số đó. Với sự kết hợp của công nghệ xử lý ảnh, trí tuệ nhân tạo và học máy, hệ thống nhận dạng chữ số viết tay trực tuyến của IBM đạt được hiệu suất cao và đáng tin cậy trong việc nhận dạng chữ số viết tay từ người dùng. Điều này mang lại nhiều ứng dụng trong các lĩnh vực như công nghệ giao diện người-máy, bảo mật, điều khiển và quản lý dữ liệu. 7 Hệ thống này không chỉ tiết kiệm thời gian và công sức so với việc nhận dạng chữ số thủ công, mà còn mang lại khả năng nhận dạng chính xác và nhất quán trên nhiều nền tảng và thiết bị khác nhau.

Điều này giúp cải thiện hiệu suất và trải nghiệm người dùng trong các ứng dụng sử dụng nhận dạng chữ số viết tay trực tuyến. Mặc dù hệ thống này là một ví dụ tiêu biểu trong lĩnh vực nhận dạng chữ số viết tay trực tuyến, tuy nhiên, hiện vẫn chưa có nhiều ứng dụng thực tế sử dụng công nghệ này, do đó, việc áp dụng nhận dạng chữ số viết tay trực tuyến vẫn chưa phổ biến rộng rãi. Trong khi đó, nhận dạng offline xảy ra khi chúng ta chỉ có sẵn hình ảnh chữ số viết tay mà không có thông tin về việc viết. Trong phương pháp này, các thuật toán xử lý ảnh được sử dụng để tiền xử lý và trích xuất đặc trưng từ hình ảnh chữ số.

Các đặc trưng này có thể bao gồm các biểu đồ pixel, đặc điểm hình học và các đặc trưng khác. Sau đó, các thuật toán nhận dạng như SVM, ANN hoặc CNN có thể được áp dụng để phân loại và nhận dạng chữ số từ các đặc trưng đã được trích xuất. Ví dụ, một công trình nghiên cứu của tác giả Li, J.[51] tập trung vào xây dựng hệ thống nhận dạng chữ số viết tay dựa trên mạng Nơ-ron. Công trình này đặt giới hạn và áp dụng tiêu chuẩn cụ thể để nhận dạng chữ số viết tay trong một lĩnh vực cụ thể.

Công trình khác của tác giả Ascencio, H.[52] tập trung vào việc phát triển công cụ chấm điểm tự động cho bài kiểm tra trắc nghiệm bằng sử dụng Computer Vision. Công trình này đặt giới hạn và áp dụng các tiêu chuẩn cụ thể để nhận dạng chữ số viết tay trong bài kiểm tra trắc nghiệm. Cả hai phương pháp đều có ưu điểm và hạn chế riêng, tùy thuộc vào ứng dụng cụ thể mà chúng ta có thể lựa chọn phương pháp phù hợp. Nhận dạng online thường cung cấp thông tin đa dạng hơn về việc viết, nhưng yêu cầu các thiết bị thu thập thông tin đặc biệt.

Trong khi đó, nhận dạng offline đơn giản hơn để triển khai nhưng có thể bị ảnh hưởng bởi chất lượng hình ảnh và không có thông tin về việc viết gốc. Những khó khăn trong nhận dạng chữ số viết tay Nhận dạng chữ số viết tay đặt ra nhiều thách thức và khó khăn do các yếu tố sau: - Đa dạng về biến thể chữ viết tay: Mỗi người có cách viết riêng biệt và đặc trưng, dẫn đến sự đa dạng lớn trong cách viết chữ số. Điều này tạo ra thách thức trong việc xây dựng một hệ thống nhận dạng chung có thể xử lý được tất cả các biến thể này. - Khả năng thay đổi của chữ số viết tay: Cùng một chữ số có thể được viết ở nhiều cách khác nhau dựa trên tốc độ, áp lực và phong cách viết của người viết.

Điều này tạo ra sự biến đổi trong hình dạng và cấu trúc của chữ số, gây khó khăn trong việc nhận dạng đúng và chính xác. - Nhiễu và độ mờ: Trong quá trình viết, có thể xảy ra nhiễu và chữ viết tay có thể không rõ ràng, mờ đi. Điều này gây khó khăn trong việc nhận dạng chính xác và yêu cầu các kỹ thuật xử lý ảnh để giảm thiểu ảnh hưởng của nhiễu và tăng cường độ rõ nét.Minh họa ảnh mờ - Số lượng dữ liệu huấn luyện: Để xây dựng mô hình nhận dạng chữ số viết tay đáng tin cậy, cần có một tập dữ liệu huấn luyện đủ lớn và đa dạng. Tuy nhiên, việc thu thập và gán nhãn dữ liệu có thể tốn kém và tốn thời gian.

- Độ phức tạp của chữ số: Một số chữ số có độ phức tạp cao hơn so với các chữ số khác, với nét viết cong, vòng cung hoặc đường nét phức tạp hơn. Điều này tạo ra thách thức trong việc phân loại và nhận dạng đúng các chữ số phức tạp hơn. Ảnh minh họa số nằm lòng vào nhau Hình 2. Minh họa số viết dính liền hoặc cắt nhau - Tỷ lệ nhận dạng chính xác: Mặc dù đã có sự phát triển đáng kể trong lĩnh vực nhận dạng chữ số viết tay, vẫn còn một tỷ lệ nhận dạng sai không thể tránh khỏi.

Điều này đặt ra thách thức về việc cải thiện độ chính xác và đáng tin cậy của các hệ thống nhận dạng. Những khó khăn trên đòi hỏi sự kết hợp giữa các phương pháp xử lý ảnh, mô hình học máy và công nghệ tiên tiến để tạo ra các giải pháp nhận dạng chữ số viết tay hiệu quả và tin cậy. Các phương pháp nhận dạng chữ số viết tay Hiện nay, trong các hệ thống nhận dạng chữ số viết tay, đã có sử dụng nhiều phương pháp khác nhau, bao gồm: - Đối sánh mẫu: Phương pháp này so sánh mẫu chữ số viết tay với các mẫu đã được lưu trữ trước đó để tìm ra sự tương đồng và nhận dạng chữ số tương ứng. - Phương pháp thống kê: Dựa trên các đặc điểm thống kê của các chữ số viết tay, phương pháp này xác định và so sánh các đặc trưng để nhận dạng chữ số.

- Phương pháp cấu trúc: Dựa trên cấu trúc và hình dạng của các chữ số viết tay, phương pháp này phân tích các đặc trưng cấu trúc để nhận dạng chữ số. - Mạng Nơ-ron: Sử dụng các mạng Nơ-ron như Multilayer Perceptron (MLP) hoặc Convolutional Neural Network (CNN) để huấn luyện và nhận dạng chữ số viết tay dựa trên mẫu dữ liệu đã có.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tên Luận Văn Thạc Sĩ Về Thuật Toán Trích Xuất Số Phách Trên Phiếu Trả Lời Trắc Nghiệm của tác giả Lê Trung Thành, dưới sự hướng dẫn của TS. Phan Ngọc Hoàng, được thực hiện tại Trường Đại học Phan Thiết vào năm 2023. Bài viết tập trung vào việc xây dựng thuật toán nhằm trích xuất số phách từ phiếu trả lời trắc nghiệm, một vấn đề quan trọng trong lĩnh vực công nghệ thông tin, đặc biệt trong việc xử lý dữ liệu và tự động hóa quy trình đánh giá.

Bài luận không chỉ cung cấp cái nhìn sâu sắc về các kỹ thuật trích xuất dữ liệu mà còn mở ra cơ hội cho những nghiên cứu tiếp theo trong lĩnh vực này. Độc giả có thể tìm hiểu thêm về những ứng dụng thực tiễn của công nghệ thông tin trong giáo dục qua bài viết Luận văn thạc sĩ về quản lý giáo dục và ứng dụng công nghệ thông tin trong dạy học ở huyện Phong Điền, TP Cần Thơ, hay cách mà công nghệ có thể hỗ trợ trong việc trích xuất thông tin qua Luận văn thạc sĩ: Nghiên cứu trích xuất thông tin từ ảnh tài liệu trong khoa học máy tính. Những tài liệu này sẽ giúp độc giả mở rộng kiến thức về ứng dụng công nghệ thông tin trong giáo dục và các phương pháp trích xuất dữ liệu hiệu quả.

#Luận văn Thạc sĩ

#Phân tích dữ liệu

#Đại học Phan Thiết

#thuật toán trích xuất

#phiếu trả lời trắc nghiệm

Chủ đề

nghiên cứu khoa học

Công nghệ giáo dục

Phân tích và xử lý dữ liệu

Phát triển phần mềm trong giáo dục