Đồ án HCMUTE: Ứng dụng xử lý ảnh để phát hiện ngủ gật sử dụng Raspberry Pi

2018

85
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Phát hiện ngủ gật Tổng quan và mục tiêu

Đồ án tốt nghiệp này tập trung vào việc phát hiện ngủ gật bằng xử lý ảnh trên Raspberry Pi. Mục tiêu chính là xây dựng một hệ thống phát hiện ngủ gật chính xác và hiệu quả sử dụng camera trên Raspberry Pi, kết hợp với các thuật toán xử lý ảnh để nhận diện trạng thái mắt. Hệ thống hướng đến ứng dụng thực tiễn, đặc biệt trong lĩnh vực giám sát lái xean toàn giao thông. Phát hiện buồn ngủ cũng được xem xét như một phần của dự án. Đây là một đề tài có ý nghĩa thiết thực, góp phần vào việc nâng cao an toàn lao độngan toàn giao thông. Việc sử dụng Raspberry Pi giúp giảm chi phí và tăng tính di động của hệ thống. Nghiên cứu tập trung vào các thuật toán xử lý ảnh hiệu quả, tối ưu hóa thời gian thực hiện và độ chính xác.

1.1. Phân tích yêu cầu hệ thống

Hệ thống cần đáp ứng các yêu cầu sau: phát hiện ngủ gật với độ chính xác cao; hoạt động ổn định trong nhiều điều kiện ánh sáng khác nhau; thời gian thực hiện nhanh, phù hợp với ứng dụng thời gian thực; khả năng tích hợp với các thiết bị khác để tạo thành hệ thống cảnh báo; sử dụng phần cứng Raspberry Pi tiết kiệm chi phí. Thuật toán cần xử lý hiệu quả các hình ảnh từ camera Raspberry Pi, nhận diện khuôn mặt và trích xuất vùng mắt để phân tích. Các thuật toán xử lý ảnh, đặc biệt là nhận diện khuôn mặtphát hiện khuôn mặt, sẽ được nghiên cứu và áp dụng. OpenCV Python là thư viện chính được sử dụng cho việc xử lý hình ảnh. Quá trình trích xuất đặc trưng sẽ tập trung vào các điểm mốc trên khuôn mặt, đặc biệt là vùng mắt. Độ chính xác của hệ thống sẽ được đánh giá dựa trên các chỉ số cụ thể, bao gồm tỉ lệ phát hiện đúng và tỉ lệ báo động giả. Dữ liệu huấn luyện cho hệ thống được thu thập từ nhiều nguồn khác nhau đảm bảo tính đa dạng.

1.2. Công nghệ và thuật toán

Đồ án ứng dụng các công nghệ và thuật toán sau: xử lý hình ảnh với thư viện OpenCV; nhận diện khuôn mặt dựa trên các đặc trưng Haar-like và thuật toán AdaBoost; phát hiện khu vực quan tâm (ROI) là vùng mắt; phân tích trạng thái mắt dựa trên các điểm mốc trên khuôn mặt; thuật toán Facial Landmarks để xác định các điểm mốc trên khuôn mặt; khoảng cách Euclide để đo khoảng cách giữa mí mắt; OpenCV Python cho việc lập trình và tích hợp; tích hợp camera với Raspberry Pi. Machine learning không được sử dụng trực tiếp trong đồ án này. Tuy nhiên, các thuật toán được sử dụng đều dựa trên các nguyên lý của xử lý tín hiệu hình ảnhcomputer vision. Việc tối ưu hóa hiệu năng hệ thống là một yếu tố quan trọng, nhằm đảm bảo hoạt động thời gian thực trên Raspberry Pi.

II. Thiết kế và triển khai hệ thống

Hệ thống được thiết kế dựa trên kiến trúc ba tầng: thu nhận dữ liệu, xử lý và ra quyết định. Tầng thu nhận dữ liệu sử dụng camera Raspberry Pi để thu thập hình ảnh. Tầng xử lý thực hiện các bước xử lý ảnh: phát hiện khuôn mặt, trích xuất vùng mắt, tính toán tỷ lệ mắt. Tầng ra quyết định dựa trên tỷ lệ mắt để xác định trạng thái ngủ gật. Xây dựng hệ thống phát hiện bao gồm các bước cài đặt hệ điều hành Raspbian trên Raspberry Pi, cài đặt các thư viện OpenCVdlib, viết code Python để thực hiện các thuật toán xử lý ảnh. Hướng dẫn từng bước được cung cấp chi tiết trong báo cáo. Code mẫu và các tài liệu hỗ trợ được đính kèm. Việc tích hợp camera với Raspberry Pi là một bước quan trọng đảm bảo hoạt động ổn định của hệ thống. Phân tích video được thực hiện từng frame để đảm bảo thời gian thực.

2.1. Cài đặt và cấu hình phần cứng

Quá trình cài đặt bao gồm các bước: cài đặt hệ điều hành Raspbian trên thẻ nhớ SD; kết nối camera Raspberry Pi với bo mạch; cấu hình camera Raspberry Pi trong hệ điều hành; cài đặt các thư viện OpenCVdlib cần thiết cho xử lý hình ảnh; kiểm tra hoạt động của camera và các thư viện. Raspberry Pi 3 được sử dụng trong đồ án này. Hướng dẫn thực hành chi tiết được cung cấp để người dùng có thể tái tạo hệ thống. Việc lựa chọn Raspberry Pi là do kích thước nhỏ gọn, chi phí thấp và khả năng xử lý hình ảnh đáp ứng yêu cầu của đề tài. Quá trình cài đặt OpenCV Python được thực hiện cẩn thận để đảm bảo hoạt động trơn tru của hệ thống. Tối ưu hóa hiệu năng trên Raspberry Pi cần được quan tâm để đảm bảo thời gian thực hiện các thuật toán.

2.2. Lập trình và tích hợp

Phần mềm được lập trình bằng ngôn ngữ lập trình Python, sử dụng thư viện OpenCVdlib. Code mẫu được cung cấp để minh họa các thuật toán. Các bước lập trình bao gồm: xây dựng hàm phát hiện khuôn mặt; xây dựng hàm trích xuất vùng mắt; xây dựng hàm tính toán tỷ lệ mắt; xây dựng hàm phát hiện ngủ gật; tích hợp các hàm trên thành một hệ thống hoàn chỉnh. Tối ưu hóa code là rất quan trọng để đảm bảo hiệu năng của hệ thống trên Raspberry Pi. Phân tích ảnh tĩnh được sử dụng để kiểm tra tính chính xác của các thuật toán trước khi tích hợp vào hệ thống phân tích video. Internet of Things (IoT) có thể được tích hợp vào hệ thống trong tương lai để tạo ra một hệ thống giám sát từ xa.

III. Đánh giá và kết luận

Kết quả nghiên cứu được đánh giá dựa trên độ chính xác của hệ thống trong phát hiện ngủ gật. Các chỉ số đánh giá bao gồm: tỷ lệ phát hiện đúng, tỷ lệ báo động giả, thời gian xử lý một frame hình ảnh. Đánh giá độ chính xác được thực hiện trên một tập dữ liệu thử nghiệm độc lập. Tối ưu hóa hiệu năng hệ thống được thực hiện bằng cách tinh chỉnh các tham số trong thuật toán và tối ưu hóa code. Các yếu tố ảnh hưởng đến độ chính xác của hệ thống được phân tích, bao gồm: ánh sáng, góc quay, chất lượng hình ảnh. Kết luận tóm tắt những thành tựu đạt được, những hạn chế của hệ thống và các hướng phát triển trong tương lai. Ứng dụng thực tiễn của hệ thống được đề cập. ADAS (Advanced Driver-Assistance Systems) có thể tích hợp hệ thống này để nâng cao an toàn giao thông.

3.1. Kết quả thử nghiệm

Kết quả thử nghiệm cho thấy hệ thống đạt được độ chính xác nhất định trong phát hiện ngủ gật. Tuy nhiên, vẫn còn một số hạn chế cần được khắc phục. Dữ liệu huấn luyện cần được mở rộng để cải thiện độ chính xác của hệ thống. Phân tích ảnh tĩnh cho kết quả tốt hơn so với phân tích video do ảnh hưởng của chuyển động. Tối ưu hóa thuật toántối ưu hóa code là hai hướng cần được tập trung trong tương lai. Phát hiện sự mệt mỏiphát hiện cử động đầu có thể được tích hợp để nâng cao độ chính xác của hệ thống. Phát hiện nhắm mắt là một chỉ số quan trọng được sử dụng để xác định trạng thái ngủ gật.

3.2. Hạn chế và hướng phát triển

Hệ thống vẫn còn một số hạn chế, chủ yếu là độ chính xác chưa cao và khả năng hoạt động trong điều kiện ánh sáng phức tạp còn hạn chế. Các hướng phát triển trong tương lai bao gồm: sử dụng các thuật toán deep learning để cải thiện độ chính xác; thu thập thêm dữ liệu huấn luyện đa dạng hơn; tích hợp các cảm biến khác như cảm biến đo nhịp tim để nâng cao độ tin cậy; phát triển hệ thống cảnh báo tích hợp với các thiết bị khác; ứng dụng xử lý tín hiệu để lọc nhiễu và tăng cường chất lượng hình ảnh; phát hiện sai sót mệt mỏi ngoài ngủ gật. Ứng dụng IoT là một hướng phát triển tiềm năng để giám sát từ xa và tích hợp với các hệ thống khác. Phát triển phần mềm dựa trên phát hiện cử động đầu là hướng nghiên cứu đáng quan tâm.

01/02/2025
Đồ án hcmute ứng dụng xử lý ảnh vào việc phát hiện ngủ gật dùng kit raspberry
Bạn đang xem trước tài liệu : Đồ án hcmute ứng dụng xử lý ảnh vào việc phát hiện ngủ gật dùng kit raspberry

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài viết "Phát hiện ngủ gật bằng xử lý ảnh trên Raspberry Pi" khám phá cách sử dụng công nghệ xử lý ảnh để phát hiện tình trạng ngủ gật của người lái xe, một vấn đề nghiêm trọng trong an toàn giao thông. Bằng cách áp dụng các thuật toán xử lý ảnh trên Raspberry Pi, bài viết không chỉ cung cấp cái nhìn sâu sắc về cách thức hoạt động của hệ thống mà còn nhấn mạnh lợi ích của việc ứng dụng công nghệ này trong việc giảm thiểu tai nạn giao thông. Độc giả sẽ tìm thấy thông tin hữu ích về cách mà công nghệ có thể cải thiện an toàn và nâng cao nhận thức về tình trạng lái xe mệt mỏi.

Nếu bạn muốn tìm hiểu thêm về các ứng dụng khác của xử lý ảnh, hãy tham khảo bài viết Đồ án hcmute ứng dụng xử lí ảnh phát hiện người và báo động dùng sim900, nơi bạn sẽ thấy cách công nghệ này được áp dụng trong việc phát hiện người. Ngoài ra, bài viết Đồ án hcmute ứng dụng xử lý ảnh trong hệ thống phân loại sản phẩm sẽ giúp bạn hiểu rõ hơn về việc sử dụng xử lý ảnh trong phân loại sản phẩm. Cuối cùng, bài viết Hcmute ứng dụng xử lý ảnh để phân loại sản phẩm bằng qr code trên băng tải sẽ mở rộng thêm kiến thức về ứng dụng của xử lý ảnh trong công nghiệp. Những liên kết này sẽ giúp bạn khám phá sâu hơn về các khía cạnh khác nhau của công nghệ xử lý ảnh.