I. Giới thiệu và mục tiêu nghiên cứu
Luận văn thạc sĩ tập trung vào việc áp dụng giải thuật di truyền để lựa chọn đặc trưng trong bài toán nhận dạng hành vi. Mục tiêu chính là tối ưu hóa vector đặc trưng, giúp cải thiện hiệu suất của các mô hình học máy như Support Vector Machine (SVM) và 2-Stages Continuous Hidden Markov Model (2SCHMM). Việc thu gọn vector đặc trưng không chỉ nâng cao độ chính xác phân lớp mà còn giảm thời gian thực thi và bộ nhớ sử dụng, đặc biệt quan trọng khi triển khai trên các thiết bị có phần cứng hạn chế như điện thoại thông minh.
1.1. Lý do chọn đề tài
Nhận dạng hành vi con người thông qua cảm biến cá nhân đã trở thành một lĩnh vực nghiên cứu quan trọng, đặc biệt trong các ứng dụng giám sát sức khỏe và hoạt động thể chất. Sự phổ biến của điện thoại thông minh với các cảm biến tích hợp như gia tốc kế và con quay hồi chuyển đã tạo điều kiện thuận lợi cho việc thu thập dữ liệu chuyển động. Tuy nhiên, hạn chế về phần cứng của các thiết bị này đòi hỏi các giải pháp tối ưu hóa để đảm bảo hiệu suất và độ chính xác.
1.2. Mục tiêu nghiên cứu
Mục tiêu của luận văn là sử dụng giải thuật di truyền để thu gọn vector đặc trưng, tìm ra bộ đặc trưng tối ưu cho các mô hình học máy. Cụ thể, luận văn tập trung vào hai mô hình: SVM và 2SCHMM, với mục tiêu nâng cao độ chính xác phân lớp và giảm thời gian thực thi.
II. Phương pháp nghiên cứu và công trình liên quan
Luận văn sử dụng tập dữ liệu UCI HAR, một bộ dữ liệu phổ biến trong nghiên cứu nhận dạng hành vi, được thu thập từ cảm biến gia tốc và con quay hồi chuyển trên điện thoại thông minh. Phương pháp nghiên cứu bao gồm việc áp dụng giải thuật di truyền để thu gọn vector đặc trưng, sau đó đánh giá hiệu quả thông qua các mô hình học máy.
2.1. Công trình liên quan
Các công trình nghiên cứu trước đây đã sử dụng các phương pháp như Random Forest và Hidden Markov Model (HMM) để thu gọn vector đặc trưng. Ví dụ, công trình của C. Cho đã giảm số chiều vector từ 561 xuống còn 119, đạt độ chính xác 91.76%. Công trình của Rodrigo Cilla et al. kết hợp giải thuật di truyền với HMM, đạt độ chính xác 75.01%.
2.2. Phương pháp nghiên cứu
Luận văn áp dụng giải thuật di truyền để tối ưu hóa vector đặc trưng, với mục tiêu giảm kích thước vector mà vẫn duy trì độ chính xác phân lớp trong phạm vi sai số 5%. Quá trình nghiên cứu bao gồm việc thực nghiệm trên hai mô hình SVM và 2SCHMM, đánh giá hiệu quả thông qua độ chính xác và thời gian thực thi.
III. Kết quả và đánh giá
Kết quả thực nghiệm cho thấy việc sử dụng giải thuật di truyền để thu gọn vector đặc trưng đã mang lại hiệu quả đáng kể. Độ chính xác của mô hình SVM đạt 96.64%, trong khi mô hình 2SCHMM đạt 88%. Điều này chứng tỏ rằng việc tối ưu hóa vector đặc trưng không chỉ cải thiện độ chính xác mà còn giảm thiểu thời gian và tài nguyên tính toán.
3.1. Kết quả thực nghiệm
Kết quả thực nghiệm trên tập dữ liệu UCI HAR cho thấy, việc thu gọn vector đặc trưng bằng giải thuật di truyền đã giúp cải thiện đáng kể hiệu suất của cả hai mô hình SVM và 2SCHMM. Độ chính xác của SVM tăng lên 96.64%, trong khi 2SCHMM đạt 88%.
3.2. Đánh giá hiệu quả
Việc thu gọn vector đặc trưng không chỉ nâng cao độ chính xác mà còn giảm thời gian thực thi và bộ nhớ sử dụng. Điều này đặc biệt quan trọng khi triển khai các ứng dụng trên thiết bị di động, nơi tài nguyên phần cứng bị hạn chế.
IV. Kết luận và hướng phát triển
Luận văn đã chứng minh hiệu quả của việc sử dụng giải thuật di truyền trong lựa chọn đặc trưng cho bài toán nhận dạng hành vi. Kết quả nghiên cứu không chỉ mang lại giá trị khoa học mà còn có ứng dụng thực tiễn cao, đặc biệt trong lĩnh vực y tế và giám sát sức khỏe. Hướng phát triển trong tương lai có thể bao gồm việc áp dụng phương pháp này trên các bộ dữ liệu lớn hơn và tích hợp vào các hệ thống IoT.
4.1. Kết luận
Luận văn đã thành công trong việc áp dụng giải thuật di truyền để tối ưu hóa vector đặc trưng, cải thiện hiệu suất của các mô hình học máy trong bài toán nhận dạng hành vi. Kết quả nghiên cứu cho thấy tiềm năng lớn của phương pháp này trong việc triển khai trên các thiết bị di động.
4.2. Hướng phát triển
Trong tương lai, nghiên cứu có thể mở rộng bằng cách áp dụng phương pháp này trên các bộ dữ liệu lớn hơn, tích hợp vào các hệ thống IoT, và thử nghiệm với các mô hình học máy tiên tiến hơn để tiếp tục nâng cao hiệu quả.