Phát hiện ngủ gật bằng xử lý ảnh trên Raspberry Pi

I. Phát hiện ngủ gật Tổng quan và mục tiêu

Đồ án tốt nghiệp này tập trung vào việc phát hiện ngủ gật bằng xử lý ảnh trên Raspberry Pi. Mục tiêu chính là xây dựng một hệ thống phát hiện ngủ gật chính xác và hiệu quả sử dụng camera trên Raspberry Pi, kết hợp với các thuật toán xử lý ảnh để nhận diện trạng thái mắt. Hệ thống hướng đến ứng dụng thực tiễn, đặc biệt trong lĩnh vực giám sát lái xe và an toàn giao thông. Phát hiện buồn ngủ cũng được xem xét như một phần của dự án. Đây là một đề tài có ý nghĩa thiết thực, góp phần vào việc nâng cao an toàn lao động và an toàn giao thông. Việc sử dụng Raspberry Pi giúp giảm chi phí và tăng tính di động của hệ thống. Nghiên cứu tập trung vào các thuật toán xử lý ảnh hiệu quả, tối ưu hóa thời gian thực hiện và độ chính xác.

1.1. Phân tích yêu cầu hệ thống

Hệ thống cần đáp ứng các yêu cầu sau: phát hiện ngủ gật với độ chính xác cao; hoạt động ổn định trong nhiều điều kiện ánh sáng khác nhau; thời gian thực hiện nhanh, phù hợp với ứng dụng thời gian thực; khả năng tích hợp với các thiết bị khác để tạo thành hệ thống cảnh báo; sử dụng phần cứng Raspberry Pi tiết kiệm chi phí. Thuật toán cần xử lý hiệu quả các hình ảnh từ camera Raspberry Pi, nhận diện khuôn mặt và trích xuất vùng mắt để phân tích. Các thuật toán xử lý ảnh, đặc biệt là nhận diện khuôn mặt và phát hiện khuôn mặt, sẽ được nghiên cứu và áp dụng. OpenCV Python là thư viện chính được sử dụng cho việc xử lý hình ảnh. Quá trình trích xuất đặc trưng sẽ tập trung vào các điểm mốc trên khuôn mặt, đặc biệt là vùng mắt. Độ chính xác của hệ thống sẽ được đánh giá dựa trên các chỉ số cụ thể, bao gồm tỉ lệ phát hiện đúng và tỉ lệ báo động giả. Dữ liệu huấn luyện cho hệ thống được thu thập từ nhiều nguồn khác nhau đảm bảo tính đa dạng.

1.2. Công nghệ và thuật toán

Đồ án ứng dụng các công nghệ và thuật toán sau: xử lý hình ảnh với thư viện OpenCV; nhận diện khuôn mặt dựa trên các đặc trưng Haar-like và thuật toán AdaBoost; phát hiện khu vực quan tâm (ROI) là vùng mắt; phân tích trạng thái mắt dựa trên các điểm mốc trên khuôn mặt; thuật toán Facial Landmarks để xác định các điểm mốc trên khuôn mặt; khoảng cách Euclide để đo khoảng cách giữa mí mắt; OpenCV Python cho việc lập trình và tích hợp; tích hợp camera với Raspberry Pi. Machine learning không được sử dụng trực tiếp trong đồ án này. Tuy nhiên, các thuật toán được sử dụng đều dựa trên các nguyên lý của xử lý tín hiệu hình ảnh và computer vision. Việc tối ưu hóa hiệu năng hệ thống là một yếu tố quan trọng, nhằm đảm bảo hoạt động thời gian thực trên Raspberry Pi.

II. Thiết kế và triển khai hệ thống

Hệ thống được thiết kế dựa trên kiến trúc ba tầng: thu nhận dữ liệu, xử lý và ra quyết định. Tầng thu nhận dữ liệu sử dụng camera Raspberry Pi để thu thập hình ảnh. Tầng xử lý thực hiện các bước xử lý ảnh: phát hiện khuôn mặt, trích xuất vùng mắt, tính toán tỷ lệ mắt. Tầng ra quyết định dựa trên tỷ lệ mắt để xác định trạng thái ngủ gật. Xây dựng hệ thống phát hiện bao gồm các bước cài đặt hệ điều hành Raspbian trên Raspberry Pi, cài đặt các thư viện OpenCV và dlib, viết code Python để thực hiện các thuật toán xử lý ảnh. Hướng dẫn từng bước được cung cấp chi tiết trong báo cáo. Code mẫu và các tài liệu hỗ trợ được đính kèm. Việc tích hợp camera với Raspberry Pi là một bước quan trọng đảm bảo hoạt động ổn định của hệ thống. Phân tích video được thực hiện từng frame để đảm bảo thời gian thực.

2.1. Cài đặt và cấu hình phần cứng

Quá trình cài đặt bao gồm các bước: cài đặt hệ điều hành Raspbian trên thẻ nhớ SD; kết nối camera Raspberry Pi với bo mạch; cấu hình camera Raspberry Pi trong hệ điều hành; cài đặt các thư viện OpenCV và dlib cần thiết cho xử lý hình ảnh; kiểm tra hoạt động của camera và các thư viện. Raspberry Pi 3 được sử dụng trong đồ án này. Hướng dẫn thực hành chi tiết được cung cấp để người dùng có thể tái tạo hệ thống. Việc lựa chọn Raspberry Pi là do kích thước nhỏ gọn, chi phí thấp và khả năng xử lý hình ảnh đáp ứng yêu cầu của đề tài. Quá trình cài đặt OpenCV Python được thực hiện cẩn thận để đảm bảo hoạt động trơn tru của hệ thống. Tối ưu hóa hiệu năng trên Raspberry Pi cần được quan tâm để đảm bảo thời gian thực hiện các thuật toán.

2.2. Lập trình và tích hợp

Phần mềm được lập trình bằng ngôn ngữ lập trình Python, sử dụng thư viện OpenCV và dlib. Code mẫu được cung cấp để minh họa các thuật toán. Các bước lập trình bao gồm: xây dựng hàm phát hiện khuôn mặt; xây dựng hàm trích xuất vùng mắt; xây dựng hàm tính toán tỷ lệ mắt; xây dựng hàm phát hiện ngủ gật; tích hợp các hàm trên thành một hệ thống hoàn chỉnh. Tối ưu hóa code là rất quan trọng để đảm bảo hiệu năng của hệ thống trên Raspberry Pi. Phân tích ảnh tĩnh được sử dụng để kiểm tra tính chính xác của các thuật toán trước khi tích hợp vào hệ thống phân tích video. Internet of Things (IoT) có thể được tích hợp vào hệ thống trong tương lai để tạo ra một hệ thống giám sát từ xa.

III. Đánh giá và kết luận

Kết quả nghiên cứu được đánh giá dựa trên độ chính xác của hệ thống trong phát hiện ngủ gật. Các chỉ số đánh giá bao gồm: tỷ lệ phát hiện đúng, tỷ lệ báo động giả, thời gian xử lý một frame hình ảnh. Đánh giá độ chính xác được thực hiện trên một tập dữ liệu thử nghiệm độc lập. Tối ưu hóa hiệu năng hệ thống được thực hiện bằng cách tinh chỉnh các tham số trong thuật toán và tối ưu hóa code. Các yếu tố ảnh hưởng đến độ chính xác của hệ thống được phân tích, bao gồm: ánh sáng, góc quay, chất lượng hình ảnh. Kết luận tóm tắt những thành tựu đạt được, những hạn chế của hệ thống và các hướng phát triển trong tương lai. Ứng dụng thực tiễn của hệ thống được đề cập. ADAS (Advanced Driver-Assistance Systems) có thể tích hợp hệ thống này để nâng cao an toàn giao thông.

3.1. Kết quả thử nghiệm

Kết quả thử nghiệm cho thấy hệ thống đạt được độ chính xác nhất định trong phát hiện ngủ gật. Tuy nhiên, vẫn còn một số hạn chế cần được khắc phục. Dữ liệu huấn luyện cần được mở rộng để cải thiện độ chính xác của hệ thống. Phân tích ảnh tĩnh cho kết quả tốt hơn so với phân tích video do ảnh hưởng của chuyển động. Tối ưu hóa thuật toán và tối ưu hóa code là hai hướng cần được tập trung trong tương lai. Phát hiện sự mệt mỏi và phát hiện cử động đầu có thể được tích hợp để nâng cao độ chính xác của hệ thống. Phát hiện nhắm mắt là một chỉ số quan trọng được sử dụng để xác định trạng thái ngủ gật.

3.2. Hạn chế và hướng phát triển

Hệ thống vẫn còn một số hạn chế, chủ yếu là độ chính xác chưa cao và khả năng hoạt động trong điều kiện ánh sáng phức tạp còn hạn chế. Các hướng phát triển trong tương lai bao gồm: sử dụng các thuật toán deep learning để cải thiện độ chính xác; thu thập thêm dữ liệu huấn luyện đa dạng hơn; tích hợp các cảm biến khác như cảm biến đo nhịp tim để nâng cao độ tin cậy; phát triển hệ thống cảnh báo tích hợp với các thiết bị khác; ứng dụng xử lý tín hiệu để lọc nhiễu và tăng cường chất lượng hình ảnh; phát hiện sai sót mệt mỏi ngoài ngủ gật. Ứng dụng IoT là một hướng phát triển tiềm năng để giám sát từ xa và tích hợp với các hệ thống khác. Phát triển phần mềm dựa trên phát hiện cử động đầu là hướng nghiên cứu đáng quan tâm.

Đồ án HCMUTE: Ứng dụng xử lý ảnh để phát hiện ngủ gật sử dụng Raspberry Pi

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN

1.1. MỤC TIÊU ĐỀ TÀI

1.2. NỘI DUNG NGHIÊN CỨU

1.3. GIỚI HẠN

1.4. BỐ CỤC

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. TỔNG QUAN VỀ XỬ LÝ ẢNH

2.2. Các thành phần cơ bản của hệ thống ảnh

2.3. Các vấn đề cơ bản trong xử lý ảnh

2.4. Ảnh và điểm ảnh

2.5. Độ phân giải của ảnh

2.6. Mức xám của ảnh

2.7. Biến đổi ảnh

3. CHƯƠNG 3: TÍNH TOÁN THIẾT KẾ

4. CHƯƠNG 4: THI CÔNG HỆ THỐNG

5. CHƯƠNG 5: KẾT QUẢ, NHẬN XÉT VÀ ĐÁNH GIÁ

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

I. Phát hiện ngủ gật Tổng quan và mục tiêu

1.1. Phân tích yêu cầu hệ thống

1.2. Công nghệ và thuật toán

II. Thiết kế và triển khai hệ thống

2.1. Cài đặt và cấu hình phần cứng

2.2. Lập trình và tích hợp

III. Đánh giá và kết luận

3.1. Kết quả thử nghiệm

3.2. Hạn chế và hướng phát triển

THÔNG TIN CHI TIẾT

Tác giả: Nông Văn Tân

Người hướng dẫn: Th.s Nguyễn Duy Thảo

Trường học: Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành: Công Nghệ Kỹ Thuật Điện Tử Truyền Thông

Đề tài: Phát Hiện Ngủ Gật Bằng Xử Lý Ảnh Trên Raspberry Pi

Loại tài liệu: Đồ Án Tốt Nghiệp

Năm xuất bản: 2018

Địa điểm: Tp. Hồ Chí Minh

Đồ án HCMUTE: Ứng dụng xử lý ảnh để phát hiện ngủ gật sử dụng Raspberry Pi

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN

1.1. MỤC TIÊU ĐỀ TÀI

1.2. NỘI DUNG NGHIÊN CỨU

1.3. GIỚI HẠN

1.4. BỐ CỤC

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. TỔNG QUAN VỀ XỬ LÝ ẢNH

2.2. Các thành phần cơ bản của hệ thống ảnh

2.3. Các vấn đề cơ bản trong xử lý ảnh

2.4. Ảnh và điểm ảnh

2.5. Độ phân giải của ảnh

2.6. Mức xám của ảnh

2.7. Biến đổi ảnh

3. CHƯƠNG 3: TÍNH TOÁN THIẾT KẾ

4. CHƯƠNG 4: THI CÔNG HỆ THỐNG

5. CHƯƠNG 5: KẾT QUẢ, NHẬN XÉT VÀ ĐÁNH GIÁ

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

I. Phát hiện ngủ gật Tổng quan và mục tiêu

1.1. Phân tích yêu cầu hệ thống

1.2. Công nghệ và thuật toán

II. Thiết kế và triển khai hệ thống

2.1. Cài đặt và cấu hình phần cứng

2.2. Lập trình và tích hợp

III. Đánh giá và kết luận

3.1. Kết quả thử nghiệm

3.2. Hạn chế và hướng phát triển

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Nông Văn Tân

Người hướng dẫn: Th.s Nguyễn Duy Thảo

Trường học: Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành: Công Nghệ Kỹ Thuật Điện Tử Truyền Thông

Đề tài: Phát Hiện Ngủ Gật Bằng Xử Lý Ảnh Trên Raspberry Pi

Loại tài liệu: Đồ Án Tốt Nghiệp

Năm xuất bản: 2018

Địa điểm: Tp. Hồ Chí Minh