Luận văn tốt nghiệp: Phát triển hệ thống nhận diện cảm xúc qua giọng nói

2022

91
72
1

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Tổng quan đề tài

Đề tài luận văn tốt nghiệp này tập trung vào việc phát triển một hệ thống nhận diện cảm xúc qua giọng nói và ứng dụng vào website nghe nhạc. Mục tiêu chính là nghiên cứu và xây dựng một mô hình học máy có khả năng nhận diện cảm xúc của người dùng thông qua giọng nói, từ đó đề xuất nội dung âm nhạc phù hợp. Lựa chọn giọng nói làm yếu tố đầu vào vì cảm xúc thường được giải tỏa qua lời nói, giúp người dùng giải tỏa cảm xúc tiêu cực và thúc đẩy cảm xúc tích cực. Đề tài xoay quanh việc nghiên cứu các phương pháp học sâu và học máy trong phân loại cảm xúc qua giọng nói, thiết kế hệ thống tích hợp mô hình này và ứng dụng vào website nghe nhạc. Phương pháp nghiên cứu bao gồm phân tích lý thuyết về cảm xúc, giọng nói và học máy, thiết kế ngược từ các sản phẩm hiện có và phân tích tổng kết thí nghiệm để đánh giá độ chính xác và chất lượng sản phẩm.

II. Nghiên cứu liên quan và ứng dụng

Luận văn tìm hiểu về mối liên hệ giữa âm nhạc và cảm xúc con người, từ nguồn gốc âm nhạc đến hoạt động của não bộ khi nghe nhạc. Đề tài cũng khảo sát các phương pháp nhận diện cảm xúc, bao gồm các phương pháp không sử dụng Deep Learning và các phương pháp sử dụng Deep Learning như phân loại cảm xúc dựa trên đặc điểm âm thanh và kết hợp âm thanh với ngữ nghĩa. Việc nhận dạng cảm xúc trong giọng nói có nhiều ứng dụng thực tiễn, ví dụ như trong hệ thống tổng đài chăm sóc khách hàng, tương tác người - robot, và hỗ trợ quá trình học tập bằng cách đánh giá tâm lý người học. "SER sẽ hỗ trợ và trích xuất thông tin giúp cải thiện dịch vụ đó" - cho thấy tiềm năng ứng dụng của hệ thống nhận diện cảm xúc trong việc nâng cao chất lượng dịch vụ khách hàng.

III. Thiết kế và xây dựng hệ thống

Hệ thống được thiết kế bao gồm mô hình nhận diện cảm xúc qua giọng nói và website nghe nhạc tích hợp mô hình này. Mô hình nhận diện cảm xúc được xây dựng dựa trên các kỹ thuật học sâu, sử dụng tập dữ liệu RAVDESS và tiền xử lý dữ liệu để tăng độ chính xác. Website nghe nhạc được thiết kế với các chức năng như đăng nhập/đăng ký, phát nhạc, tải nhạc, hát karaoke, xem thông tin chi tiết, tạo playlist, yêu thích bài hát và đặc biệt là chức năng đề xuất nhạc dựa trên cảm xúc. Luận văn trình bày chi tiết kiến trúc hệ thống, cơ sở dữ liệu, giao diện người dùng (wireframe và mockup), luồng hoạt động của các chức năng và cách thức tương tác với mô hình nhận diện cảm xúc. Việc sử dụng Zing MP3 API giúp hệ thống khai thác nguồn nhạc phong phú và đa dạng. "Các sinh viên kết hợp giữa việc phát triển ứng dụng và giải thuật học máy cho một bài toán thực tế" - nhận xét của giảng viên hướng dẫn cho thấy tính ứng dụng cao của đề tài.

IV. Thực nghiệm đánh giá và kết luận

Đề tài thực hiện thực nghiệm và đánh giá mô hình phân loại cảm xúc qua giọng nói dựa trên các tiêu chí như độ chính xác. Kết quả cho thấy mô hình đạt hiệu quả tốt, đặc biệt khi kết hợp nhiều đặc trưng âm thanh. Hệ thống website nghe nhạc cũng được đánh giá về tính đầy đủ chức năng và hiệu quả của mô hình nhận diện cảm xúc khi tích hợp vào hệ thống. Mặc dù đạt được kết quả khả quan, luận văn cũng thẳng thắn nhìn nhận những hạn chế như chưa đánh giá mô hình với dữ liệu thực tế, phần ứng dụng website còn gượng ép. "Nhóm chỉ đánh giá được độ chính xác của mô hình trên tập benchmark, chưa đánh giá được với dữ liệu thực tế" - đây là một hạn chế cần được khắc phục trong tương lai. Luận văn đề xuất hướng phát triển trong tương lai, bao gồm việc cải thiện mô hình, mở rộng ứng dụng và đánh giá trên dữ liệu thực tế để nâng cao tính thực tiễn.

27/11/2024
Luận văn tốt nghiệp khoa học máy tính phát triển hệ thống nhận diện cảm xúc qua giọng nói
Bạn đang xem trước tài liệu : Luận văn tốt nghiệp khoa học máy tính phát triển hệ thống nhận diện cảm xúc qua giọng nói

để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài viết "Luận văn tốt nghiệp khoa học máy tính phát triển hệ thống nhận diện cảm xúc qua giọng nói" của các tác giả Trần Đình Đức và Trương Đình Đức, dưới sự hướng dẫn của các giảng viên tại Trường Đại Học Bách Khoa - Đại Học Quốc Gia TP.HCM, trình bày một nghiên cứu sâu sắc về việc phát triển hệ thống nhận diện cảm xúc thông qua giọng nói. Nghiên cứu này không chỉ mang lại cái nhìn mới về công nghệ nhận diện giọng nói mà còn mở ra hướng đi mới trong việc ứng dụng trí tuệ nhân tạo vào các lĩnh vực như tâm lý học và giao tiếp con người. Độc giả sẽ tìm thấy giá trị trong việc hiểu rõ hơn về cách mà công nghệ có thể cải thiện trải nghiệm tương tác và giao tiếp trong xã hội hiện đại.

Nếu bạn quan tâm đến các nghiên cứu và ứng dụng trong lĩnh vực công nghệ thông tin, bạn có thể tham khảo thêm bài viết Nghiên cứu kiểm thử phần mềm và sử dụng công cụ postman để test api cho website, nơi tìm hiểu về kiểm thử phần mềm và ứng dụng công cụ trong phát triển hệ thống. Ngoài ra, bài viết Đồ án tốt nghiệp mô hình phân loại sản phẩm bằng mã qr code cũng có thể thu hút bạn, với cách tiếp cận ứng dụng công nghệ vào thực tiễn. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và hiểu biết về các xu hướng công nghệ hiện nay.

Tải xuống (91 Trang - 3.14 MB )