Tổng quan nghiên cứu

Rối loạn nhịp tim là một trong những nguyên nhân hàng đầu gây tử vong do tim trên thế giới, ảnh hưởng đến mọi độ tuổi và có thể dẫn đến các biến chứng nghiêm trọng nếu không được phát hiện và điều trị kịp thời. Việc theo dõi sức khỏe tim mạch truyền thống thường yêu cầu bệnh nhân đến bệnh viện để thực hiện đo điện tâm đồ (ECG) bằng thiết bị chuyên dụng, gây khó khăn và chậm trễ trong việc chẩn đoán sớm. Trong bối cảnh dịch Covid-19 diễn biến phức tạp, việc đo nồng độ oxy trong máu (SpO2) trở nên quan trọng nhằm phát hiện sớm tình trạng thiếu oxy, góp phần nâng cao hiệu quả chăm sóc sức khỏe.

Luận văn tập trung phát triển ứng dụng chăm sóc sức khỏe thông minh dựa trên công nghệ điện toán cận biên (Edge Computing), kết hợp với trí tuệ nhân tạo (AI) và Internet of Medical Things (IoMT) nhằm theo dõi nhịp tim, điện tâm đồ và chỉ số SpO2 theo thời gian thực. Mục tiêu cụ thể bao gồm xây dựng mô hình dự đoán bệnh tim mạch sử dụng các thuật toán máy học như SVM, Logistic Regression, LGBM trên nền tảng điện toán đám mây Google Colab, đồng thời triển khai mô hình này trên hệ thống điện toán cận biên để giảm độ trễ và tăng hiệu quả xử lý dữ liệu. Phạm vi nghiên cứu tập trung vào các thiết bị IoT như Arduino Uno, Raspberry Pi, cảm biến AD8232, MAX30102, cùng các công nghệ ảo hóa container Docker và Kubernetes, thực hiện tại TP. Hồ Chí Minh trong năm 2022.

Nghiên cứu có ý nghĩa quan trọng trong việc nâng cao khả năng theo dõi sức khỏe từ xa, giảm tải cho hệ thống y tế, đồng thời mở rộng ứng dụng công nghệ hiện đại trong chăm sóc sức khỏe cộng đồng. Theo ước tính, việc ứng dụng điện toán cận biên có thể giảm thời gian phản hồi xuống dưới 100ms, cải thiện hiệu suất xử lý dữ liệu lên đến 30% so với điện toán đám mây truyền thống.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên ba khung lý thuyết chính:

  1. Internet of Things (IoT) và Internet of Medical Things (IoMT): IoT là hệ thống các thiết bị vật lý được kết nối và trao đổi dữ liệu qua Internet mà không cần sự tương tác trực tiếp của con người. Trong lĩnh vực y tế, IoMT bao gồm các thiết bị cảm biến như AD8232 (đo điện tâm đồ), MAX30102 (đo SpO2 và nhịp tim), kết nối qua các giao thức Wi-Fi, LoRa, Bluetooth để thu thập dữ liệu sức khỏe bệnh nhân.

  2. Điện toán cận biên (Edge Computing): Công nghệ xử lý dữ liệu gần nguồn phát sinh nhằm giảm độ trễ và băng thông so với điện toán đám mây. Điện toán cận biên sử dụng các trạm dữ liệu vi mô để xử lý và lưu trữ dữ liệu cục bộ, kết hợp với công nghệ ảo hóa container (Docker) và điều phối (Kubernetes) để quản lý tài nguyên hiệu quả, hỗ trợ mở rộng hệ thống linh hoạt.

  3. Trí tuệ nhân tạo và máy học (AI & Machine Learning): Sử dụng các thuật toán phân lớp có giám sát như SVM, Logistic Regression, LGBM để huấn luyện mô hình dự đoán nguy cơ bệnh tim mạch dựa trên dữ liệu bệnh sử và các chỉ số cận lâm sàng. Mô hình được huấn luyện trên nền tảng điện toán đám mây Google Colab, tận dụng GPU miễn phí để tăng tốc quá trình huấn luyện.

Các khái niệm chính bao gồm: điện tâm đồ (ECG), nồng độ oxy trong máu (SpO2), container ảo hóa, Kubernetes cluster, thuật toán phân lớp, và giao thức truyền thông MQTT, CoAP.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu công khai trên Kaggle về bệnh tim mạch, được tiền xử lý và gán nhãn để huấn luyện mô hình máy học. Cỡ mẫu huấn luyện khoảng vài nghìn bản ghi, đảm bảo tính đại diện và độ chính xác của mô hình.

Phương pháp chọn mẫu là chọn mẫu ngẫu nhiên có kiểm soát từ bộ dữ liệu để đảm bảo cân bằng giữa các lớp nguy cơ và không nguy cơ. Phân tích dữ liệu sử dụng Python với các thư viện scikit-learn, Pandas, và thư viện Neurokit2 để xử lý tín hiệu điện tâm đồ.

Timeline nghiên cứu kéo dài trong 12 tháng, bao gồm các giai đoạn: nghiên cứu tài liệu (3 tháng), thiết kế và huấn luyện mô hình (4 tháng), phát triển ứng dụng và triển khai trên điện toán cận biên (3 tháng), thử nghiệm và đánh giá hiệu năng (2 tháng).

Phương pháp phân tích bao gồm đánh giá độ chính xác mô hình qua các chỉ số Confusion Matrix, Precision, Recall, F1-score, đồng thời đo lường thời gian phản hồi và hiệu suất tài nguyên (CPU, RAM) của hệ thống khi triển khai trên Docker và Kubernetes.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác mô hình dự đoán bệnh tim mạch: Thuật toán Logistic Regression đạt độ chính xác 87%, F1-score 0.85, vượt trội so với các thuật toán khác như SVM (độ chính xác 83%) và LGBM (độ chính xác 85%). Mô hình được huấn luyện trên Google Colab và lưu trữ trên Google Drive để triển khai trên điện toán cận biên.

  2. Hiệu suất xử lý trên điện toán cận biên: Thời gian phản hồi trung bình của hệ thống khi xử lý dữ liệu tại biên là khoảng 80ms, giảm 40% so với thời gian phản hồi 135ms khi xử lý trên đám mây. Điều này chứng tỏ điện toán cận biên giúp giảm độ trễ đáng kể, phù hợp với các ứng dụng theo dõi sức khỏe thời gian thực.

  3. Khả năng mở rộng và ổn định của hệ thống: Hệ thống triển khai trên Kubernetes cluster với 3 node, mỗi node chạy nhiều container, cho phép tự động cân bằng tải và khởi tạo lại container khi gặp sự cố. Đánh giá hiệu năng cho thấy CPU sử dụng trung bình 65%, RAM 70% khi xử lý đồng thời 50 yêu cầu, đảm bảo tính ổn định và khả năng mở rộng.

  4. Ứng dụng thực tế của thiết bị IoT: Thiết bị đo điện tâm đồ AD8232 kết nối với ESP8266 qua Wi-Fi hoạt động ổn định, thu thập dữ liệu ECG chính xác với sai số dưới 5%. Thiết bị đo SpO2 MAX30102 cho kết quả đo nhịp tim và nồng độ oxy trong máu tương đồng với thiết bị y tế chuyên dụng, sai số dưới 3%.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình dự đoán đạt hiệu quả cao là do việc lựa chọn thuật toán phù hợp và tiền xử lý dữ liệu kỹ lưỡng, loại bỏ các giá trị nhiễu và cân bằng dữ liệu. Kết quả này tương đồng với các nghiên cứu gần đây về ứng dụng máy học trong dự đoán bệnh tim mạch, đồng thời cho thấy lợi thế của việc triển khai mô hình trên nền tảng điện toán đám mây kết hợp điện toán cận biên.

Việc giảm độ trễ xử lý nhờ điện toán cận biên là yếu tố then chốt giúp ứng dụng có thể theo dõi sức khỏe bệnh nhân theo thời gian thực, đặc biệt trong các tình huống cấp cứu hoặc bệnh nhân cần giám sát liên tục. So sánh với các nghiên cứu khác, hệ thống này có khả năng mở rộng tốt hơn nhờ sử dụng Kubernetes, giúp quản lý tài nguyên hiệu quả và tăng tính ổn định.

Dữ liệu có thể được trình bày qua biểu đồ so sánh thời gian phản hồi giữa điện toán đám mây và điện toán cận biên, bảng thống kê độ chính xác các thuật toán máy học, và biểu đồ sử dụng tài nguyên CPU, RAM khi chạy hệ thống dưới tải.

Đề xuất và khuyến nghị

  1. Triển khai mở rộng hệ thống IoMT tại các cơ sở y tế: Khuyến nghị các bệnh viện, phòng khám áp dụng hệ thống theo dõi sức khỏe thông minh dựa trên điện toán cận biên để nâng cao chất lượng chăm sóc, giảm tải cho nhân viên y tế. Thời gian thực hiện trong 12 tháng, phối hợp giữa đơn vị phát triển và cơ sở y tế.

  2. Tăng cường đào tạo và chuyển giao công nghệ: Tổ chức các khóa đào tạo về IoT, điện toán cận biên và AI cho đội ngũ kỹ thuật và y tế nhằm đảm bảo vận hành và bảo trì hệ thống hiệu quả. Thời gian đào tạo dự kiến 6 tháng, do các chuyên gia công nghệ thông tin và y tế phối hợp thực hiện.

  3. Nâng cấp và tích hợp thêm các cảm biến mới: Mở rộng hệ thống với các loại cảm biến khác như đo huyết áp, đường huyết để đa dạng hóa chức năng chăm sóc sức khỏe. Thời gian nghiên cứu và tích hợp khoảng 9 tháng, do nhóm phát triển phần mềm và phần cứng phối hợp.

  4. Phát triển ứng dụng di động hỗ trợ người dùng cuối: Xây dựng ứng dụng di động thân thiện, cho phép người dùng theo dõi chỉ số sức khỏe cá nhân và nhận cảnh báo sớm. Thời gian phát triển 6 tháng, do nhóm phát triển phần mềm di động đảm nhiệm.

Đối tượng nên tham khảo luận văn

  1. Các nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Luận văn cung cấp kiến thức sâu rộng về IoT, điện toán cận biên, AI và ứng dụng thực tiễn trong chăm sóc sức khỏe, hỗ trợ phát triển các đề tài nghiên cứu liên quan.

  2. Chuyên gia và kỹ sư phát triển hệ thống IoT và AI: Tài liệu chi tiết về thiết kế kiến trúc hệ thống, triển khai Docker, Kubernetes và huấn luyện mô hình máy học giúp nâng cao kỹ năng và áp dụng vào dự án thực tế.

  3. Cán bộ y tế và quản lý bệnh viện: Hiểu rõ về công nghệ mới trong theo dõi sức khỏe từ xa, giúp đưa ra quyết định đầu tư và triển khai các giải pháp công nghệ phù hợp với nhu cầu chăm sóc bệnh nhân.

  4. Doanh nghiệp công nghệ và startup trong lĩnh vực y tế số: Tham khảo mô hình kinh doanh và kỹ thuật để phát triển sản phẩm chăm sóc sức khỏe thông minh, tăng cường khả năng cạnh tranh trên thị trường.

Câu hỏi thường gặp

  1. Điện toán cận biên khác gì so với điện toán đám mây?
    Điện toán cận biên xử lý dữ liệu gần nguồn phát sinh, giảm độ trễ và băng thông so với điện toán đám mây, vốn xử lý tập trung tại trung tâm dữ liệu xa. Ví dụ, thời gian phản hồi trên điện toán cận biên chỉ khoảng 80ms so với 135ms trên đám mây.

  2. Các thuật toán máy học nào được sử dụng để dự đoán bệnh tim mạch?
    Luận văn sử dụng các thuật toán phân lớp như Logistic Regression, SVM, LGBM. Logistic Regression cho kết quả tốt nhất với độ chính xác 87% và F1-score 0.85.

  3. Thiết bị IoT nào được sử dụng để thu thập dữ liệu sức khỏe?
    Các thiết bị chính gồm cảm biến AD8232 đo điện tâm đồ, MAX30102 đo SpO2 và nhịp tim, kết nối qua Wi-Fi hoặc LoRa với các board Arduino Uno, ESP8266 và Raspberry Pi.

  4. Làm thế nào để hệ thống đảm bảo tính ổn định khi có nhiều thiết bị kết nối?
    Hệ thống sử dụng Kubernetes để quản lý container, tự động cân bằng tải và khởi tạo lại container khi gặp sự cố, đảm bảo hoạt động liên tục và mở rộng linh hoạt.

  5. Ứng dụng của nghiên cứu này trong thực tế là gì?
    Hệ thống giúp theo dõi sức khỏe bệnh nhân từ xa, phát hiện sớm các dấu hiệu bệnh tim mạch và thiếu oxy, giảm tải cho bệnh viện, đặc biệt hữu ích trong giai đoạn dịch bệnh và chăm sóc bệnh nhân tại nhà.

Kết luận

  • Phát triển thành công ứng dụng chăm sóc sức khỏe thông minh dựa trên điện toán cận biên, kết hợp AI và IoMT, đáp ứng nhu cầu theo dõi nhịp tim, điện tâm đồ và SpO2 theo thời gian thực.
  • Mô hình dự đoán bệnh tim mạch đạt độ chính xác 87%, F1-score 0.85, triển khai hiệu quả trên nền tảng điện toán đám mây và cận biên.
  • Hệ thống điện toán cận biên giảm thời gian phản hồi xuống 80ms, cải thiện hiệu suất xử lý và khả năng mở rộng nhờ công nghệ Docker và Kubernetes.
  • Thiết bị IoT sử dụng cho thu thập dữ liệu có độ chính xác cao, phù hợp với ứng dụng chăm sóc sức khỏe thực tế.
  • Đề xuất mở rộng triển khai tại các cơ sở y tế, đào tạo nhân lực và phát triển thêm các tính năng mới để nâng cao hiệu quả chăm sóc sức khỏe cộng đồng.

Tiếp theo, nghiên cứu sẽ tập trung vào mở rộng hệ thống với nhiều thiết bị IoT hơn, tối ưu thuật toán máy học và phát triển ứng dụng di động hỗ trợ người dùng cuối. Độc giả và các đơn vị quan tâm được khuyến khích liên hệ để hợp tác phát triển và ứng dụng công nghệ trong chăm sóc sức khỏe thông minh.