Chương 1 – Tổng quan Chương này trình bày khái quát định hướng lựa chọn, mục tiêu, giới hạn đề tài cũng như giải pháp nghiên cứu và tiếp cận. Chương 2 – Cơ sở lý thuyết Chương này giới thiệu khái quát các khái niệm cơ bản về thị giác máy tính (Computer Vision), lý thuyết về cơ bản về nueral nhân tạo và xử lý ảnh, cũng như các chỉ tiêu đánh giá việc phân loại các hạt gạo không đạt tiêu chuẩn. Chương 3 – Giải thuật Chương này trình bày phương pháp đề xuất và các bước phân tích để có thể phân loại các hạt gạo đạt tiêu chuẩn về kích thước và màu sắc trong thời gian thực. Chương 4 – Kết quả Chương này thể hiện kết quả đạt được, tốc độ xử lý của giải thuật từ đó rút ra những đánh giá, nhận xét cụ thể và so sánh với các phương pháp truyền thống hiện có.
Chương 5 – Kết luận và hướng phát triển chính Chương này nhằm tổng kết những kết quả đạt được và đưa ra kết luận cụ thể cũng như những hướng phát chính của đề tài trong tương lai. 2 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT Trong chương này sẽ trình bày sơ lược các khái niệm cơ bản về xử lý ảnh, mạng nơron, và phần mềm Matlab. GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH Xử lý ảnh là đối tượng nghiên cứu trong lĩnh vực thị giác máy tính, là quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới có các đặc tính và tuân theo ý muốn của người sử dụng, xử lý ảnh tuy là một ngành khoa học mới mẻ so với các ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm, nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó và nó đang được ứng dụng trong rất nhiều trong dự báo thời tiết, nhận biết khuôn mặt, nhận dạng vân tay, nhận biết các biển báo chỉ đường,. Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính là: nâng cao chất lượng ảnh và phân tích ảnh.
Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ London đến New York từ những năm 1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình phát triển xử lý ảnh số diễn ra một cách thuận lợi.
Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như mạng neuron nhân tạo, các thuật toán xử lý hiện đại, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan. Nhưng trong những năm trở lại đây thì xử lý ảnh được cho là rất quan trọng là có thể dùng để phân biệt màu sắc và được được áp dụng rất nhiều trong các ngành công nghiệp nhằm phát hiện và loại bỏ các sản phẩm không đạt chuẩn về kích thước lẫn màu sắc.
Nhờ có công nghệ số hóa hiện đại, ngày nay con người đã có thể xử lý tín hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản cho đến những máy tính song song cao cấp. Mục tiêu của xử lý này có thể chia làm ba hướng như sau: Xử lý ảnh ban đầu để có được ảnh mới theo yêu một yêu cầu nhất định. 3 Phân tích, thu thập các thông tin ảnh đặc trưng giúp phân loại, nhận biết ảnh. Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức độ cao hơn, sâu hơn.
Xử lý ảnh bao gồm các bước, ban đầu ảnh từ thế giới bên ngoài được thu nhận qua các thiết bị thu (camera, máy chụp ảnh). Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh.1 mô tả các bước cơ bản trong xử lý ảnh.1: Các bước cơ bản trong xử lý ảnh.
Sơ đồ trên bao gồm các thành phần sau: Phần thu nhận ảnh (Image Acquisition): Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (như loại CCD – Charge Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).
Tiền xử lý (Image Processing): Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. 4 Phân vùng ảnh (Segmentation): Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Biểu diễn ảnh (Image Representation): Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation): Nhận dạng ảnh là quá trình xác định ảnh. Quá trình thường thu được bằng cách so sánh với mẫu chuẩn đã được học hoặc lưu từ trước.
Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại nhận dạng cơ bản: - Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc. Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhân dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người. Cơ sở tri thức (Knowledge Base): Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh khá phong phú kéo theo các loại nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp 5 nhận và xử lý ảnh theo cách của con người.
Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người như ứng dụng nơron nhân tạo. Mô tả (biểu diễn ảnh): Từ Hình 2.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region).
Một số phương pháp biểu diễn thường sử dụng là các cách sau: - Biểu diễn bằng mã chạy (Run-LengthCode). - Biểu diễn bằng mã xích (Chaine-Code). - Biểu diễn bằng mã tứ phân (Quad-Tree Code). Biểu diễn bằng mã chạy: Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân.
Một vùng ảnh R có thể mã hóa đơn giản nhờ một ma trận nhị phân: - U (m, n) = 1 nếu (m, n) thuộc R. Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1. Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; mà trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc dọc. Biểu diễn bằng mã xích: Phương pháp này thường dùng để biểu diễn đường biên ảnh.
Một đường bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,…mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng. 6 Biểu diễn bằng mã tứ phân: Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh.
Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất.