Tổng quan nghiên cứu

Theo ước tính, số người bị liệt toàn thân ngày càng gia tăng do nhiều nguyên nhân như tai nạn giao thông, nhồi máu cơ tim, tai biến mạch máu não, gây ra tình trạng mất khả năng vận động. Những người này không thể tự di chuyển và phải phụ thuộc hoàn toàn vào người chăm sóc, dẫn đến cảm giác là gánh nặng cho gia đình và xã hội. Trong bối cảnh đó, việc phát triển các phương pháp điều khiển xe lăn điện thông minh nhằm giúp người khuyết tật có thể tự chủ trong di chuyển là rất cần thiết.

Mục tiêu của luận văn là nghiên cứu và xây dựng thuật toán điều khiển xe lăn điện bằng kỹ thuật xử lý ảnh mắt, giúp người bị liệt toàn thân có thể điều khiển xe lăn mà không cần sự hỗ trợ của người khác. Phạm vi nghiên cứu tập trung vào việc sử dụng camera gắn cách mắt 10 cm để thu nhận hình ảnh mắt, xử lý ảnh nhằm xác định vị trí tâm con ngươi và hai hốc mắt, từ đó tính toán hướng nhìn để điều khiển xe lăn điện thông qua chuẩn nối tiếp RS232. Thời gian nghiên cứu được thực hiện trong giai đoạn trước năm 2014 tại thành phố Hồ Chí Minh.

Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện chất lượng cuộc sống cho người khuyết tật, giảm gánh nặng cho gia đình và xã hội, đồng thời góp phần phát triển công nghệ hỗ trợ người khuyết tật tại Việt Nam. Các chỉ số hiệu quả như độ chính xác xác định hướng nhìn và tốc độ phản hồi điều khiển xe lăn được chú trọng đánh giá trong nghiên cứu.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Xử lý ảnh số (Digital Image Processing): Ảnh số được xem là ma trận hai chiều các điểm ảnh (pixel) với mức xám từ 0 đến 255. Các kỹ thuật xử lý ảnh như phân đoạn ảnh, tách biên, phát hiện góc và biến đổi Hough được áp dụng để xác định các đặc điểm hình học của mắt.

  • Phân đoạn ảnh và tách biên: Sử dụng các toán tử Sobel, Canny, Prewitt, Roberts và Laplace của hàm Gauss để phát hiện biên mắt, từ đó xác định vùng chứa con ngươi và hốc mắt.

  • Phát hiện góc Harris: Áp dụng để xác định chính xác vị trí các điểm đặc trưng như hốc mắt dựa trên hàm tự tương quan và giá trị riêng của ma trận cường độ ảnh.

  • Biến đổi Hough: Sử dụng để phát hiện hình tròn (con ngươi) và đường thẳng (hốc mắt) trong ảnh, giúp xác định vị trí và bán kính con ngươi.

  • Chuẩn nối tiếp RS232: Là chuẩn truyền thông nối tiếp được sử dụng để truyền tín hiệu điều khiển từ máy tính đến mạch điều khiển động cơ xe lăn.

Các khái niệm chính bao gồm: điểm ảnh (pixel), mức xám (grayscale), phân đoạn ảnh (image segmentation), tách biên (edge detection), phát hiện góc (corner detection), biến đổi Hough (Hough transform), và chuẩn giao tiếp RS232.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là hình ảnh mắt thu được từ webcam đặt cách mắt người dùng khoảng 10 cm, đảm bảo thu được toàn bộ vùng mắt không bị che khuất bởi lông mày. Cỡ mẫu nghiên cứu bao gồm nhiều ảnh mắt của người dùng trong các trạng thái nhìn khác nhau (nhìn thẳng, sang trái, sang phải, lên, xuống, nhắm mắt).

Phương pháp chọn mẫu là lấy mẫu ngẫu nhiên các ảnh mắt trong điều kiện ánh sáng và khoảng cách cố định để đảm bảo tính nhất quán. Phân tích dữ liệu sử dụng các thuật toán xử lý ảnh trong MATLAB, bao gồm:

  • Thu thập ảnh qua Image Acquisition Toolbox.

  • Xử lý ảnh bằng Image Processing Toolbox với các bước: chuyển đổi ảnh sang mức xám, phân đoạn ảnh theo ngưỡng, tách biên bằng toán tử Sobel và Canny, phát hiện góc Harris, biến đổi Hough để xác định hình tròn và đường thẳng.

  • Tính toán khoảng cách hình học giữa tâm con ngươi và hai hốc mắt để xác định hướng nhìn.

  • Truyền tín hiệu điều khiển qua cổng RS232 đến mạch điều khiển động cơ xe lăn.

Timeline nghiên cứu kéo dài trong khoảng 12 tháng, bao gồm các giai đoạn: khảo sát và tổng quan lý thuyết, thiết kế thuật toán xử lý ảnh, xây dựng mạch điều khiển, thử nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Xác định chính xác vị trí con ngươi và hốc mắt: Thuật toán xử lý ảnh đã xác định được vị trí tâm con ngươi với độ chính xác khoảng 95% trong điều kiện ánh sáng ổn định. Vị trí hai hốc mắt được phát hiện chính xác với tỷ lệ thành công trên 90% nhờ ứng dụng phát hiện góc Harris và biến đổi Hough.

  2. Phân loại hướng nhìn dựa trên khoảng cách hình học: So sánh khoảng cách từ tâm con ngươi đến hai hốc mắt cho phép phân biệt được 5 hướng nhìn chính: nhìn thẳng, sang trái, sang phải, lên và xuống. Tỷ lệ phân loại chính xác đạt khoảng 92%, giúp điều khiển xe lăn theo hướng mong muốn.

  3. Tín hiệu điều khiển truyền qua RS232 ổn định: Việc sử dụng chuẩn nối tiếp RS232 để truyền tín hiệu điều khiển đến mạch động cơ xe lăn đảm bảo độ trễ thấp, thời gian phản hồi trung bình dưới 200 ms, phù hợp với yêu cầu điều khiển thời gian thực.

  4. Hiệu quả điều khiển xe lăn: Trong các thử nghiệm thực tế, xe lăn điện di chuyển theo hướng nhìn của người điều khiển với độ chính xác trên 90%, bao gồm các lệnh đi tới, lùi, quẹo trái, quẹo phải và dừng lại khi nhắm mắt.

Thảo luận kết quả

Nguyên nhân của độ chính xác cao trong xác định vị trí con ngươi và hốc mắt là do việc sử dụng kết hợp nhiều phương pháp xử lý ảnh như tách biên Canny, phát hiện góc Harris và biến đổi Hough, giúp giảm nhiễu và tăng độ tin cậy của kết quả. So với các nghiên cứu trước đây sử dụng cảm biến điện mắt hoặc kính áp tròng, phương pháp xử lý ảnh không gây khó chịu cho người dùng và có tính ứng dụng thực tế cao hơn.

Tuy nhiên, hạn chế của hệ thống là phụ thuộc vào điều kiện ánh sáng và vị trí cố định của camera, do đó phạm vi hoạt động của người dùng bị giới hạn trong một vùng nhất định. So sánh với các nghiên cứu quốc tế về điều khiển xe lăn bằng cử động đầu hoặc giọng nói, phương pháp xử lý ảnh mắt mang lại sự tiện lợi và chính xác hơn cho nhóm người bị liệt nặng không thể cử động tay và đầu.

Dữ liệu có thể được trình bày qua biểu đồ độ chính xác xác định vị trí con ngươi và hốc mắt theo từng phương pháp xử lý ảnh, bảng so sánh tỷ lệ phân loại hướng nhìn, và biểu đồ thời gian phản hồi tín hiệu điều khiển qua RS232.

Đề xuất và khuyến nghị

  1. Cải tiến thuật toán xử lý ảnh: Tăng cường khả năng nhận diện trong điều kiện ánh sáng yếu hoặc thay đổi bằng cách áp dụng các kỹ thuật lọc nhiễu nâng cao và học máy để cải thiện độ chính xác xác định vị trí mắt. Chủ thể thực hiện: nhóm nghiên cứu công nghệ xử lý ảnh, thời gian: 6 tháng.

  2. Phát triển hệ thống camera đa điểm: Lắp đặt thêm camera phụ để mở rộng vùng hoạt động và giảm giới hạn vị trí người dùng, giúp hệ thống linh hoạt hơn trong thực tế. Chủ thể thực hiện: đơn vị phát triển phần cứng, thời gian: 9 tháng.

  3. Tối ưu hóa giao tiếp điều khiển: Nâng cấp chuẩn truyền thông từ RS232 lên các chuẩn hiện đại hơn như USB hoặc Bluetooth để tăng tốc độ truyền và giảm dây cáp, tạo sự tiện lợi cho người dùng. Chủ thể thực hiện: kỹ sư phần cứng, thời gian: 4 tháng.

  4. Tích hợp hệ thống phản hồi người dùng: Thiết kế giao diện người dùng trực quan, có thể hiển thị trạng thái điều khiển và cảnh báo để người dùng dễ dàng kiểm soát xe lăn. Chủ thể thực hiện: nhóm phát triển phần mềm, thời gian: 5 tháng.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành kỹ thuật điện tử, xử lý ảnh: Có thể áp dụng các phương pháp xử lý ảnh và thuật toán phát hiện mắt trong các đề tài liên quan đến thị giác máy tính và điều khiển thiết bị.

  2. Các đơn vị phát triển thiết bị hỗ trợ người khuyết tật: Tham khảo để phát triển các sản phẩm xe lăn điện thông minh, nâng cao tính tự chủ cho người dùng.

  3. Bệnh viện và trung tâm phục hồi chức năng: Áp dụng công nghệ điều khiển xe lăn bằng mắt để hỗ trợ bệnh nhân liệt nặng trong quá trình phục hồi và sinh hoạt hàng ngày.

  4. Các nhà quản lý và chính sách y tế: Sử dụng kết quả nghiên cứu để xây dựng các chương trình hỗ trợ người khuyết tật, thúc đẩy ứng dụng công nghệ trong chăm sóc sức khỏe.

Câu hỏi thường gặp

  1. Phương pháp xử lý ảnh có thể áp dụng cho các loại mắt khác nhau không?
    Phương pháp dựa trên đặc điểm hình học của mắt nên có thể áp dụng cho đa dạng người dùng, tuy nhiên cần hiệu chỉnh tham số cho từng cá nhân để đạt độ chính xác cao nhất.

  2. Hệ thống có hoạt động tốt trong điều kiện ánh sáng yếu không?
    Hiện tại, hệ thống hoạt động tốt trong điều kiện ánh sáng ổn định; trong ánh sáng yếu, độ chính xác giảm do nhiễu ảnh, cần cải tiến thuật toán lọc nhiễu.

  3. Tín hiệu điều khiển có bị trễ khi truyền qua RS232 không?
    Thời gian phản hồi trung bình dưới 200 ms, đủ nhanh để điều khiển xe lăn trong thời gian thực, không gây cảm giác trễ đáng kể cho người dùng.

  4. Người dùng có cần đeo thiết bị đặc biệt nào không?
    Không, hệ thống sử dụng camera gắn cách mắt 10 cm, không cần đeo kính áp tròng hay điện cực, tạo sự thoải mái và tiện lợi.

  5. Hệ thống có thể mở rộng để điều khiển các thiết bị khác không?
    Có thể, với việc điều chỉnh thuật toán và phần cứng, hệ thống có thể áp dụng để điều khiển các thiết bị hỗ trợ khác như robot hỗ trợ di chuyển hoặc thiết bị nhà thông minh.

Kết luận

  • Luận văn đã xây dựng thành công thuật toán xử lý ảnh để xác định vị trí con ngươi và hốc mắt, từ đó điều khiển xe lăn điện bằng hướng nhìn mắt với độ chính xác trên 90%.
  • Việc sử dụng chuẩn nối tiếp RS232 đảm bảo truyền tín hiệu điều khiển ổn định và thời gian phản hồi nhanh.
  • Phương pháp xử lý ảnh không gây khó chịu cho người dùng, phù hợp với người bị liệt toàn thân không thể cử động tay và đầu.
  • Hạn chế hiện tại là phụ thuộc vào điều kiện ánh sáng và vị trí cố định của camera, cần cải tiến để mở rộng phạm vi hoạt động.
  • Các bước tiếp theo bao gồm cải tiến thuật toán, phát triển phần cứng đa điểm, nâng cấp giao tiếp và tích hợp giao diện người dùng để hoàn thiện hệ thống điều khiển xe lăn điện thông minh.

Mời các nhà nghiên cứu và đơn vị phát triển công nghệ hỗ trợ người khuyết tật tiếp cận và ứng dụng kết quả nghiên cứu nhằm nâng cao chất lượng cuộc sống cho người khuyết tật.