Tổng quan nghiên cứu

Trong bối cảnh công nghệ di động phát triển mạnh mẽ, việc nhận dạng hoạt động người dùng trên điện thoại thông minh ngày càng trở nên quan trọng, đặc biệt trong các ứng dụng chăm sóc sức khỏe, giám sát vận động và tương tác người-máy. Theo báo cáo của ngành, tỷ lệ người sử dụng điện thoại Android chiếm khoảng 85% thị phần toàn cầu, tạo ra một lượng lớn dữ liệu cảm biến có thể khai thác để nhận dạng hành vi. Tuy nhiên, việc xây dựng phần mềm nhận dạng hoạt động người dùng trên hệ điều hành Android vẫn còn nhiều thách thức do tính đa dạng của hành vi và môi trường sử dụng.

Luận văn thạc sĩ này tập trung nghiên cứu và phát triển phần mềm nhận dạng hoạt động người dùng điện thoại trên nền tảng Android, với mục tiêu nâng cao độ chính xác nhận dạng các hoạt động phổ biến như ngồi, đứng, đi bộ, chạy bộ, lên/xuống cầu thang. Phạm vi nghiên cứu bao gồm việc thu thập và xử lý dữ liệu cảm biến gia tốc từ tập dữ liệu Actitracker trong môi trường thực tế, đồng thời áp dụng các mô hình mạng nơron tích chập (CNN) để phân lớp hành vi. Thời gian nghiên cứu kéo dài trong năm 2018 tại Việt Nam.

Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện các chỉ số chính như độ chính xác phân loại (đạt trên 90%), giảm thiểu sai số và tăng khả năng ứng dụng thực tiễn trong các thiết bị di động. Kết quả nghiên cứu góp phần thúc đẩy phát triển các ứng dụng giám sát sức khỏe cá nhân và nâng cao trải nghiệm người dùng trên nền tảng Android.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên hai khung lý thuyết chính: lý thuyết nhận dạng hành vi dựa trên cảm biến và mô hình mạng nơron tích chập (CNN). Lý thuyết nhận dạng hành vi sử dụng dữ liệu cảm biến gia tốc ba trục (x, y, z) để trích xuất các đặc trưng thời gian và tần số, phục vụ cho việc phân lớp hành động. Các khái niệm chính bao gồm:

  • Phân lớp dữ liệu (Classification): Quá trình phân loại các mẫu dữ liệu cảm biến thành các nhãn hành vi cụ thể dựa trên đặc trưng trích xuất.
  • Mạng nơron tích chập (CNN): Mô hình học sâu có khả năng tự động trích xuất đặc trưng từ dữ liệu đầu vào, phù hợp với dữ liệu chuỗi thời gian như cảm biến gia tốc.
  • Hàm Softmax: Hàm phân phối xác suất cho các lớp phân loại, giúp xác định nhãn hành vi có xác suất cao nhất.
  • Thuật toán tối ưu Gradient Descent và Stochastic Gradient Descent (SGD): Phương pháp cập nhật trọng số mạng nhằm giảm thiểu hàm mất mát trong quá trình huấn luyện.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là tập dữ liệu Actitracker, bao gồm dữ liệu cảm biến gia tốc thu thập từ điện thoại Android trong môi trường thực tế với 7 loại hoạt động người dùng được gán nhãn rõ ràng. Cỡ mẫu dữ liệu khoảng 723.702 mẫu, được chia thành tập huấn luyện và tập kiểm tra theo tỷ lệ 80:20.

Phương pháp phân tích sử dụng mô hình mạng nơron tích chập CNN với các lớp tích chập, lớp lấy mẫu (pooling), lớp fully connected và lớp softmax để phân loại hành vi. Quá trình huấn luyện được thực hiện trên môi trường TensorFlow với CPU Intel Core i3, RAM 8GB, sử dụng thuật toán tối ưu SGD với learning rate được điều chỉnh phù hợp.

Timeline nghiên cứu bao gồm các bước: thu thập và tiền xử lý dữ liệu (chuẩn hóa, cắt cửa sổ thời gian), xây dựng mô hình CNN, huấn luyện và đánh giá mô hình, phân tích kết quả và đề xuất giải pháp.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác nhận dạng hoạt động đạt trên 90%: Mô hình CNN đạt độ chính xác trung bình khoảng 92% trên tập kiểm tra, vượt trội so với các phương pháp truyền thống như SVM hay K-NN (khoảng 85-88%).

  2. Hiệu quả trích xuất đặc trưng tự động: So với phương pháp trích xuất đặc trưng thủ công, CNN tự động học được các đặc trưng quan trọng từ dữ liệu cảm biến, giúp cải thiện độ chính xác phân loại lên khoảng 5%.

  3. Tỷ lệ phân loại các hoạt động khác nhau: Hoạt động đi bộ và chạy bộ được nhận dạng với độ chính xác lần lượt là 95% và 93%, trong khi hoạt động lên/xuống cầu thang có độ chính xác thấp hơn, khoảng 86-88%, do tính phức tạp và biến động dữ liệu cao.

  4. Ảnh hưởng của kích thước cửa sổ thời gian: Cửa sổ thời gian 180 mẫu (khoảng 3 giây) được xác định là phù hợp nhất, cân bằng giữa độ chính xác và độ trễ trong nhận dạng.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình CNN đạt hiệu quả cao là khả năng học đặc trưng đa cấp từ dữ liệu cảm biến gia tốc ba trục, giảm thiểu sự phụ thuộc vào kỹ thuật trích xuất đặc trưng thủ công. Kết quả này phù hợp với các nghiên cứu gần đây trong lĩnh vực nhận dạng hành vi sử dụng mạng nơron tích chập.

Tuy nhiên, độ chính xác nhận dạng hoạt động lên/xuống cầu thang thấp hơn do đặc điểm chuyển động phức tạp và dữ liệu bị nhiễu nhiều hơn. Điều này gợi ý cần cải tiến mô hình hoặc bổ sung thêm cảm biến khác như con quay hồi chuyển để nâng cao hiệu quả.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác phân loại từng hoạt động, bảng thống kê tỷ lệ nhãn trong tập dữ liệu, và biểu đồ ảnh hưởng của kích thước cửa sổ thời gian đến hiệu suất mô hình.

Đề xuất và khuyến nghị

  1. Tăng cường thu thập dữ liệu đa cảm biến: Kết hợp thêm dữ liệu từ cảm biến con quay hồi chuyển và cảm biến vị trí GPS để cải thiện độ chính xác nhận dạng các hoạt động phức tạp như lên/xuống cầu thang. Thời gian thực hiện: 6 tháng; Chủ thể: nhóm nghiên cứu và nhà phát triển phần mềm.

  2. Tối ưu hóa mô hình CNN: Áp dụng các kỹ thuật học sâu nâng cao như mạng nơron hồi tiếp (RNN) hoặc mạng kết hợp CNN-RNN để khai thác tốt hơn tính tuần tự của dữ liệu. Mục tiêu tăng độ chính xác thêm 3-5% trong vòng 1 năm; Chủ thể: nhóm nghiên cứu.

  3. Phát triển giao diện người dùng thân thiện: Thiết kế phần mềm nhận dạng hoạt động tích hợp trên Android với giao diện trực quan, hỗ trợ người dùng theo dõi và phân tích hành vi cá nhân. Thời gian: 3 tháng; Chủ thể: đội ngũ phát triển ứng dụng.

  4. Triển khai thử nghiệm thực tế: Thực hiện thử nghiệm phần mềm trên một số nhóm người dùng tại địa phương để thu thập phản hồi và điều chỉnh mô hình phù hợp với đặc điểm người dùng Việt Nam. Thời gian: 6 tháng; Chủ thể: nhóm nghiên cứu và đối tác triển khai.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành kỹ thuật viễn thông, khoa học máy tính: Nghiên cứu về ứng dụng mạng nơron tích chập trong nhận dạng hành vi người dùng trên thiết bị di động.

  2. Phát triển phần mềm và ứng dụng di động: Áp dụng mô hình nhận dạng hoạt động để phát triển các ứng dụng chăm sóc sức khỏe, thể dục thể thao, và tương tác người-máy.

  3. Chuyên gia trong lĩnh vực y tế và chăm sóc sức khỏe cá nhân: Sử dụng phần mềm nhận dạng hoạt động để giám sát vận động, hỗ trợ phục hồi chức năng và phòng ngừa bệnh tật.

  4. Doanh nghiệp công nghệ và startup: Khai thác công nghệ nhận dạng hành vi để phát triển sản phẩm thông minh, nâng cao trải nghiệm người dùng và tạo ra các dịch vụ giá trị gia tăng.

Câu hỏi thường gặp

  1. Phần mềm nhận dạng hoạt động người dùng trên Android sử dụng dữ liệu gì?
    Phần mềm sử dụng dữ liệu cảm biến gia tốc ba trục (x, y, z) thu thập từ điện thoại Android, được xử lý qua các cửa sổ thời gian để trích xuất đặc trưng phục vụ phân loại hành vi.

  2. Mô hình mạng nơron tích chập (CNN) có ưu điểm gì trong nhận dạng hành vi?
    CNN tự động học và trích xuất đặc trưng từ dữ liệu đầu vào, giảm thiểu sự phụ thuộc vào kỹ thuật trích xuất thủ công, giúp tăng độ chính xác và khả năng tổng quát hóa của mô hình.

  3. Độ chính xác nhận dạng các hoạt động phổ biến đạt được là bao nhiêu?
    Mô hình đạt độ chính xác trung bình khoảng 92%, trong đó hoạt động đi bộ và chạy bộ có độ chính xác trên 90%, còn hoạt động lên/xuống cầu thang khoảng 86-88%.

  4. Có thể áp dụng mô hình này cho các thiết bị khác ngoài Android không?
    Có thể, tuy nhiên cần điều chỉnh và huấn luyện lại mô hình với dữ liệu cảm biến tương ứng của thiết bị mới để đảm bảo hiệu quả nhận dạng.

  5. Làm thế nào để cải thiện độ chính xác nhận dạng hoạt động phức tạp?
    Có thể bổ sung thêm dữ liệu từ các cảm biến khác như con quay hồi chuyển, áp dụng mô hình học sâu kết hợp CNN và RNN, hoặc tăng cường thu thập dữ liệu đa dạng hơn trong môi trường thực tế.

Kết luận

  • Nghiên cứu đã xây dựng thành công phần mềm nhận dạng hoạt động người dùng điện thoại trên hệ điều hành Android với độ chính xác trung bình đạt 92%.
  • Mô hình mạng nơron tích chập (CNN) được áp dụng hiệu quả trong việc tự động trích xuất đặc trưng và phân loại hành vi.
  • Các hoạt động đi bộ, chạy bộ được nhận dạng chính xác cao, trong khi hoạt động lên/xuống cầu thang cần cải tiến thêm.
  • Đề xuất mở rộng nghiên cứu bằng cách tích hợp thêm cảm biến và áp dụng các mô hình học sâu nâng cao.
  • Các bước tiếp theo bao gồm phát triển giao diện phần mềm, thử nghiệm thực tế và tối ưu hóa mô hình để ứng dụng rộng rãi trong chăm sóc sức khỏe và tương tác người-máy.

Hành động ngay: Các nhà nghiên cứu và phát triển phần mềm nên áp dụng mô hình này để tạo ra các ứng dụng thông minh, đồng thời tiếp tục cải tiến dựa trên dữ liệu thực tế nhằm nâng cao hiệu quả nhận dạng hành vi người dùng.