Đồ án HCMUTE: Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc sử dụng mạng nơ ron tích chập

Trường đại học

Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành

Công Nghệ Kỹ Thuật Điện Tử - Truyền Thông

Người đăng

Ẩn danh

Thể loại

đồ án tốt nghiệp

2020

109

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN

1.1. TÌNH HÌNH NGHIÊN CỨU

1.2. MỤC TIÊU ĐỀ TÀI

1.3. GIỚI HẠN ĐỀ TÀI

1.4. ĐỐI TƯỢNG NGHIÊN CỨU

1.5. PHẠM VI NGHIÊN CỨU

1.6. BỐ CỤC ĐỀ TÀI

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. TỔNG QUAN VỀ QUÁ TRÌNH XỬ LÝ ẢNH

2.1.1. Tăng cường ảnh

2.1.2. Khôi phục ảnh

2.1.3. Phân tích ảnh

2.1.4. Nén dữ liệu ảnh

2.1.5. Nhận dạng ảnh

2.2. KHUÔN MẶT VÀ CẢM XÚC

2.2.1. Đặc trưng của mặt người

2.2.2. Phương pháp tiếp cận đặc trưng khuôn mặt

2.2.3. Biểu cảm của khuôn mặt khi bày tỏ cảm xúc

2.3. MẠNG NƠ-RON TÍCH CHẬP

2.3.1. Mạng nơ-ron nhân tạo

2.3.2. Mạng nơ-ron tích chập

2.3.2.1. Mô hình tổng quan

2.3.2.2. Các lớp trong mô hình

2.3.2.3. Những vấn đề xảy ra với mô hình mạng nơ-ron tích chập

2.3.3. Giới thiệu về máy tính nhúng kit Raspberry Pi

2.3.4. Xử lý ảnh với Python

2.3.4.1. Giới thiệu ngôn ngữ lập trình Python

2.3.4.2. Một số ưu điểm của ngôn ngữ Python

3. CHƯƠNG 3: XÂY DỰNG HỆ THỐNG NHẬN DIỆN KHUÔN MẶT VÀ CẢM XÚC DÙNG MẠNG NƠ-RON TÍCH CHẬP TRÊN KIT RASPBERRY PI 4

3.1. Yêu cầu của hệ thống

3.2. Đặc tả hệ thống

3.3. Sơ đồ khối hệ thống

3.4. Thiết kế chi tiết hệ thống

3.4.1. Khối xử lý Raspberry Pi 4

3.4.2. Hệ thống nhận dạng khuôn mặt

3.4.2.1. Sơ đồ quá trình xử lý hệ thống nhận dạng khuôn mặt

3.4.2.2. Tạo cơ sở dữ liệu ảnh

3.4.2.3. Phát hiện khuôn mặt

3.4.2.4. Trích chọn đặc trưng

3.4.2.5. Phân loại, nhận dạng

3.4.3. Mô hình mạng nơ-ron tích chập được dùng để mã hóa khuôn mặt

3.5. Hệ thống nhận dạng cảm xúc

3.5.1. Lưu đồ xử lý của hệ thống nhận dạng cảm xúc

3.5.2. Mô hình mạng CNN được dùng để nhận dạng cảm xúc

3.5.3. Tập dữ liệu

3.5.3.1. Tập dữ liệu mẫu có sẵn

3.5.3.2. Tập dữ liệu riêng

3.5.4. Quá trình huấn luyện và nhận dạng

3.5.4.1. Quá trình huấn luyện

3.5.4.2. Quá trình nhận dạng

3.5.5. Khối hiển thị

4. CHƯƠNG 4: KẾT QUẢ

4.1. Mô hình hoàn chỉnh của hệ thống

4.2. Giao diện hiển thị kết quả của hệ thống

4.3. Kết quả hệ thống nhận dạng khuôn mặt

4.3.1. Phân tích và nhận xét kết quả hệ thống nhận dạng khuôn mặt

4.3.2. Kết quả kiểm tra với tập dữ liệu 1

4.3.3. Kết quả kiểm tra với tập dữ liệu 2

4.3.4. Kết quả kiểm tra nhận dạng với một số ảnh

4.4. Kết quả hệ thống nhận dạng cảm xúc

4.4.1. Kết quả huấn luyện và nhận dạng

4.4.2. Kết quả kiểm tra nhận dạng với một số ảnh

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. Kết quả đạt được

5.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về Hệ thống Nhận diện Khuôn mặt và Cảm xúc

Đề tài "Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng nơ-ron tích chập tại HCMUTE" tập trung vào việc phát triển một hệ thống có khả năng nhận diện khuôn mặt và cảm xúc con người sử dụng mạng nơ ron tích chập (CNN), hay Convolutional Neural Network (CNN). Đây là một ứng dụng quan trọng của trí tuệ nhân tạo (AI) và machine learning, đặc biệt trong lĩnh vực an ninh và giám sát. Hệ thống được thiết kế để hoạt động trên cả máy tính và kit Raspberry Pi 4, thể hiện khả năng ứng dụng rộng rãi. Nghiên cứu này đóng góp vào lĩnh vực phát triển công nghệ nhận diện khuôn mặt và nhận diện cảm xúc tại HCMUTE (Trường Đại học Công nghệ TP.HCM). Nghiên cứu này hướng đến việc cải thiện hiệu quả và tốc độ xử lý của hệ thống, cho phép nhận diện theo thời gian thực.

1.1. Tổng quan về Nhận diện Khuôn mặt

Phần này tập trung vào nhận diện khuôn mặt. Hệ thống sử dụng hai tập dữ liệu: một tập dữ liệu có sẵn và một tập dữ liệu được thu thập trực tiếp. Thuật toán phát hiện khuôn mặt dựa trên đặc trưng Haar-like và thư viện OpenCV. Mạng nơ-ron tích chập (CNN) được huấn luyện với cả hai tập dữ liệu. Kết quả huấn luyện trên các tập dữ liệu khác nhau được so sánh để đánh giá hiệu quả của mô hình. Xác định khuôn mặt chính xác là bước quan trọng, ảnh hưởng đến độ chính xác của toàn bộ hệ thống. Biểu hiện khuôn mặt đa dạng, cần mô hình có khả năng xử lý các biến đổi về ánh sáng, góc chụp, v.v. Kỹ thuật số đóng vai trò quan trọng trong việc xử lý và phân tích hình ảnh. Phát hiện khuôn mặt là một bài toán nhận diện phức tạp, đòi hỏi giải pháp nhận diện hiệu quả. Phân tích ảnh và xử lý ảnh là các bước cần thiết để đảm bảo chất lượng đầu vào cho hệ thống.

1.2. Tổng quan về Nhận diện Cảm xúc

Phần này tập trung vào nhận diện cảm xúc. Hệ thống sử dụng tập dữ liệu FERC-2013 để huấn luyện mô hình CNN. Hệ thống được thiết kế để nhận diện 7 cảm xúc cơ bản: vui vẻ, buồn, sợ hãi, khó chịu, giận dữ, ngạc nhiên và trung tính. Cảm xúc tích cực, cảm xúc tiêu cực và cảm xúc trung tính được phân biệt dựa trên các đặc điểm khuôn mặt. Phân tích dữ liệu đóng vai trò quan trọng trong việc huấn luyện và đánh giá hiệu quả của mô hình. Cảm xúc tích cực và cảm xúc tiêu cực ảnh hưởng đến việc đánh giá độ chính xác của hệ thống. Phát hiện cảm xúc dựa trên sự biến đổi của các điểm đặc trưng trên khuôn mặt. Xử lý tín hiệu được ứng dụng để trích xuất thông tin cảm xúc từ hình ảnh. Mạng nơ ron được huấn luyện để phân loại các cảm xúc khác nhau. Thuật toán CNN được áp dụng để thực hiện nhiệm vụ này.

II. Phương pháp luận và Kiến trúc Hệ thống

Hệ thống được xây dựng dựa trên mạng nơ ron tích chập (CNN). Mô hình CNN được chọn vì khả năng trích xuất đặc trưng hiệu quả từ hình ảnh. Quá trình đào tạo mô hình bao gồm các bước: tiền xử lý dữ liệu, trích xuất đặc trưng, và huấn luyện mô hình. Thuật toán được sử dụng để tối ưu hóa quá trình huấn luyện. Đánh giá mô hình được thực hiện bằng cách sử dụng các chỉ số như độ chính xác, độ phủ, độ nhạy. Học máy và học sâu (deep learning) là cơ sở lý thuyết cho việc thiết kế và triển khai hệ thống. Dữ liệu huấn luyện đóng vai trò quyết định đến hiệu quả của hệ thống. Phát triển hệ thống bao gồm nhiều giai đoạn, từ thiết kế đến thử nghiệm và đánh giá. Phân tích dữ liệu được tiến hành để đánh giá kết quả. Ứng dụng thực tế của hệ thống cần được xem xét kỹ lưỡng.

2.1. Thiết kế và Triển khai Hệ thống trên Máy tính

Hệ thống được triển khai trên máy tính để huấn luyện và đánh giá hiệu quả của mô hình CNN. Mô hình toán học được xây dựng và cài đặt bằng các ngôn ngữ lập trình phù hợp. Phần mềm được sử dụng để hỗ trợ quá trình phát triển hệ thống. Giao diện người dùng được thiết kế để dễ dàng sử dụng. Quá trình huấn luyện được thực hiện trên một tập dữ liệu lớn. Tập dữ liệu cần được chuẩn bị kỹ lưỡng trước khi đưa vào quá trình huấn luyện. Đánh giá hiệu quả của hệ thống được thực hiện trên một tập dữ liệu độc lập. Kết quả nghiên cứu được trình bày một cách chi tiết và rõ ràng. Công nghệ thông tin đóng vai trò quan trọng trong việc xây dựng hệ thống. Xử lý dữ liệu là một bước quan trọng trong quá trình phát triển hệ thống. Mô hình toán học được sử dụng để mô tả quá trình nhận diện khuôn mặt và cảm xúc.

2.2. Triển khai Hệ thống trên Kit Raspberry Pi 4

Hệ thống được triển khai trên kit Raspberry Pi 4 để kiểm tra khả năng hoạt động thời gian thực. Việc nhúng hệ thống lên thiết bị này đòi hỏi tối ưu hóa mã nguồn để giảm thiểu thời gian xử lý. Vi xử lý trên Raspberry Pi 4 có giới hạn về khả năng tính toán, do đó, tối ưu hóa thuật toán là rất quan trọng. Kết nối camera với Raspberry Pi 4 để thu thập dữ liệu hình ảnh. Phần cứng của Raspberry Pi 4 ảnh hưởng đến hiệu suất của hệ thống. Ứng dụng thực tế của hệ thống trên Raspberry Pi 4 rất rộng rãi, ví dụ như trong giám sát an ninh hoặc các ứng dụng tương tác người-máy. Môi trường lập trình cần được lựa chọn phù hợp với hệ điều hành của Raspberry Pi 4. Khó khăn trong việc triển khai hệ thống trên Raspberry Pi 4 có thể gặp phải. Giải pháp để khắc phục các khó khăn này cần được đề cập. Phần mềm cần được tối ưu hóa để hoạt động hiệu quả trên thiết bị này.

III. Kết quả và Thảo luận

Kết quả nghiên cứu cho thấy hệ thống đạt được độ chính xác cao trong cả nhận diện khuôn mặt và nhận diện cảm xúc. Các thử nghiệm được thực hiện trên nhiều tập dữ liệu khác nhau. Kết quả thực nghiệm được phân tích và đánh giá. Độ chính xác của hệ thống được so sánh với các hệ thống khác. Hiệu quả của hệ thống được thể hiện rõ ràng qua các số liệu. Thời gian xử lý của hệ thống được đo đạc và phân tích. Các yếu tố ảnh hưởng đến độ chính xác của hệ thống được xác định. Khó khăn và thách thức trong quá trình nghiên cứu cũng được đề cập. Triển vọng phát triển của hệ thống được thảo luận. Ứng dụng thực tiễn của hệ thống được đề xuất.

3.1. Phân tích Kết quả Nhận diện Khuôn mặt

Kết quả nhận diện khuôn mặt được đánh giá dựa trên độ chính xác, tốc độ xử lý, và khả năng hoạt động trong điều kiện thực tế. Các chỉ số đánh giá cụ thể được trình bày. So sánh với các phương pháp khác trong cùng lĩnh vực. Phân tích nguyên nhân gây ra các lỗi nhận diện. Tập dữ liệu ảnh hưởng đến kết quả nhận diện. Giải pháp cải thiện độ chính xác của hệ thống. Tốc độ xử lý trên cả máy tính và Raspberry Pi 4 được so sánh. Khó khăn và thách thức trong quá trình nhận diện khuôn mặt. Hạn chế của hệ thống và hướng cải thiện trong tương lai. Ứng dụng thực tiễn của hệ thống nhận diện khuôn mặt.

3.2. Phân tích Kết quả Nhận diện Cảm xúc

Kết quả nhận diện cảm xúc được đánh giá dựa trên độ chính xác, khả năng phân biệt các loại cảm xúc khác nhau, và khả năng hoạt động trong điều kiện thực tế. Các chỉ số đánh giá cụ thể được trình bày. So sánh kết quả với các nghiên cứu khác. Phân tích nguyên nhân dẫn đến các lỗi nhận diện cảm xúc. Ảnh hưởng của ánh sáng, góc chụp, và biểu cảm khuôn mặt. Giải pháp để cải thiện độ chính xác của hệ thống nhận diện cảm xúc. Khó khăn và thách thức trong quá trình nhận diện cảm xúc. Hạn chế của hệ thống và hướng cải thiện trong tương lai. Ứng dụng thực tiễn của hệ thống nhận diện cảm xúc.

IV. Kết luận và Hướng phát triển

Đề tài đã thành công trong việc xây dựng hệ thống nhận diện khuôn mặt và cảm xúc sử dụng mạng nơ ron tích chập (CNN). Hệ thống hoạt động hiệu quả trên cả máy tính và kit Raspberry Pi 4. Kết quả nghiên cứu đóng góp vào lĩnh vực xử lý ảnh, học máy, và trí tuệ nhân tạo. Hướng phát triển trong tương lai bao gồm việc cải thiện độ chính xác, tốc độ xử lý, và khả năng thích ứng với điều kiện thực tế. Ứng dụng thực tiễn của hệ thống rất rộng rãi, trong nhiều lĩnh vực khác nhau. Công nghệ này có tiềm năng lớn trong việc ứng dụng thực tiễn.

01/02/2025

Bạn đang xem trước tài liệu:

Đồ án hcmute xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng nơ ron tích chập

Tải đầy đủ

Bài viết "Hệ thống nhận diện khuôn mặt và cảm xúc bằng mạng nơ ron tích chập tại HCMUTE" trình bày một hệ thống tiên tiến sử dụng công nghệ mạng nơ ron tích chập để nhận diện khuôn mặt và cảm xúc. Hệ thống này không chỉ giúp cải thiện độ chính xác trong việc nhận diện mà còn mở ra nhiều ứng dụng tiềm năng trong các lĩnh vực như an ninh, giáo dục và chăm sóc sức khỏe. Độc giả sẽ tìm thấy những thông tin hữu ích về cách mà công nghệ này có thể được áp dụng trong thực tiễn, cũng như những thách thức và cơ hội mà nó mang lại.

Nếu bạn muốn tìm hiểu thêm về các ứng dụng liên quan đến xử lý ảnh, hãy tham khảo bài viết Đồ án hcmute ứng dụng xử lý ảnh trong nhận diện khuôn mặt. Ngoài ra, bài viết Đồ án hcmute ứng dụng xử lý ảnh trong hệ thống phân loại sản phẩm cũng sẽ cung cấp cho bạn cái nhìn sâu sắc về việc ứng dụng công nghệ xử lý ảnh trong phân loại sản phẩm. Cuối cùng, bạn có thể khám phá thêm về Hcmute áp dụng kỹ thuật trượt điều khiển cân bằng hệ reaction wheel inverted pendulum, một ứng dụng khác của công nghệ điều khiển trong các hệ thống tự động. Những liên kết này sẽ giúp bạn mở rộng kiến thức và hiểu rõ hơn về các ứng dụng công nghệ hiện đại.

#công nghệ AI

#nhận diện khuôn mặt

#hệ thống nhận diện

#mạng nơ ron tích chập

Chủ đề

Công nghệ nhận diện khuôn mặt

Nghiên cứu và phát triển tại HCMUTE

Ứng dụng của mạng nơ ron

Phát triển hệ thống AI