Trường đại học
Trường Đại Học Công NghệChuyên ngành
Công Nghệ Thông TinNgười đăng
Ẩn danhThể loại
Đồ Án Tốt Nghiệp2023
Phí lưu trữ
30.000 VNĐMục lục chi tiết
Tóm tắt
Trong kỷ nguyên số, việc chủ động chăm sóc sức khỏe ngày càng được chú trọng. Một hệ thống y tế thông minh tại nhà không chỉ là xu hướng mà còn là giải pháp thiết thực, đặc biệt trong bối cảnh nhu cầu chăm sóc sức khỏe từ xa (telehealth) tăng cao. Bài viết này sẽ phân tích chi tiết phương pháp xây dựng một hệ thống giám sát sức khỏe toàn diện, ứng dụng sức mạnh của công nghệ Học máy (Machine Learning) và Chuỗi khối (Blockchain) để giải quyết các bài toán về dự đoán bệnh và bảo mật thông tin. Hệ thống được đề xuất không chỉ thu thập dữ liệu từ các thiết bị đeo theo dõi sức khỏe và cảm biến IoT trong y tế, mà còn sử dụng các mô hình AI tiên tiến để đưa ra cảnh báo sớm, hỗ trợ quản lý bệnh mãn tính hiệu quả. Cách tiếp cận này hướng tới việc tạo ra một nền tảng y tế số an toàn, minh bạch và hiệu quả, góp phần nâng cao chất lượng sống cho cộng đồng. Nghiên cứu này tập trung vào việc tích hợp các công nghệ đột phá để tạo ra một giải pháp e-health hoàn chỉnh, từ khâu thu thập dữ liệu, phân tích dự đoán cho đến việc quản lý và bảo mật hồ sơ sức khỏe điện tử (EHR).
Nhu cầu chăm sóc sức khỏe từ xa đang trở nên cấp thiết hơn bao giờ hết. Theo một khảo sát được trích dẫn trong tài liệu nghiên cứu, có tới 83.7% người được hỏi cho biết chi phí là một yếu tố cản trở họ tiếp cận dịch vụ y tế. Điều này dẫn đến việc nhiều người trì hoãn việc khám chữa bệnh, khiến tình trạng bệnh trở nên tồi tệ hơn. Một hệ thống giám sát tại nhà hiệu quả giúp giải quyết rào cản này bằng cách cho phép theo dõi các chỉ số sức khỏe quan trọng một cách liên tục mà không cần đến bệnh viện. Việc này đặc biệt hữu ích cho bệnh nhân mắc các bệnh mãn tính như tiểu đường, tim mạch và người cao tuổi cần theo dõi thường xuyên. Hệ thống cho phép phát hiện sớm các dấu hiệu bất thường, từ đó can thiệp kịp thời và giảm thiểu nguy cơ biến chứng, đồng thời giảm tải cho các cơ sở y tế.
Mục tiêu chính của đề tài là xây dựng một hệ thống theo dõi sức khỏe toàn diện, có khả năng dự đoán bệnh tiểu đường và viêm phổi. Hệ thống này tự động thu thập và lưu trữ dữ liệu y tế cá nhân (PHR) từ nhiều nguồn khác nhau. Trọng tâm của nghiên cứu là triển khai các mô hình dự đoán sức khỏe dựa trên học sâu (Deep Learning) và áp dụng học phân tán (Federated Learning) để huấn luyện mô hình trên dữ liệu phân tán mà vẫn đảm bảo tính riêng tư. Đồng thời, nghiên cứu đề xuất giải pháp bảo mật sử dụng công nghệ chuỗi khối để xác minh danh tính và đảm bảo tính toàn vẹn dữ liệu. Phạm vi nghiên cứu bao gồm việc phát triển ứng dụng di động cho cả bác sĩ và bệnh nhân, tạo ra một môi trường tương tác hiệu quả, an toàn và minh bạch.
Việc triển khai một hệ thống giám sát sức khỏe tại nhà đối mặt với hai thách thức lớn: độ chính xác của chẩn đoán và tính bảo mật của dữ liệu. Dữ liệu y tế là một trong những loại thông tin nhạy cảm nhất, đòi hỏi các biện pháp bảo vệ nghiêm ngặt để chống lại truy cập trái phép và lạm dụng. Các phương pháp lưu trữ tập trung truyền thống dễ trở thành mục tiêu của các cuộc tấn công mạng, gây rò rỉ thông tin trên diện rộng. Mặt khác, việc huấn luyện các mô hình dự đoán sức khỏe đòi hỏi một lượng lớn dữ liệu chất lượng cao. Tuy nhiên, việc thu thập dữ liệu từ nhiều cơ sở y tế khác nhau lại vướng phải các quy định về quyền riêng tư và bảo mật. Nếu không có cơ chế bảo vệ phù hợp, việc chia sẻ dữ liệu để huấn luyện mô hình chung là bất khả thi. Những thách thức này đòi hỏi một giải pháp công nghệ đột phá, có khả năng vừa đảm bảo an toàn thông tin, vừa cho phép khai thác sức mạnh của dữ liệu phân tán.
Bảo vệ tính riêng tư và an toàn của dữ liệu y tế cá nhân là ưu tiên hàng đầu. Trong các hệ thống truyền thống, dữ liệu thường được tập trung tại một máy chủ duy nhất, làm tăng nguy cơ bị xâm phạm. Nghiên cứu nhấn mạnh rằng việc tích hợp công nghệ hiện đại phải đi đôi với các giải pháp bảo mật dữ liệu y tế mạnh mẽ. Việc sử dụng dữ liệu để huấn luyện các mô hình trí tuệ nhân tạo (AI) chẩn đoán bệnh cần một cơ chế không chỉ mã hóa mà còn phải đảm bảo tính minh bạch và chống giả mạo. Bất kỳ sự thay đổi nào trên hồ sơ sức khỏe điện tử đều phải được ghi lại và không thể sửa đổi một cách tùy tiện. Đây là nền tảng để xây dựng lòng tin từ người dùng và tuân thủ các quy định pháp lý nghiêm ngặt về y tế.
Một trong những rào cản lớn nhất của học máy trong y tế là việc dữ liệu bệnh nhân được lưu trữ phân tán tại nhiều cơ sở y tế và không thể gom về một nơi để huấn luyện. Việc này không chỉ tốn kém về băng thông mà còn vi phạm nghiêm trọng các quy định về quyền riêng tư. Phương pháp học tập trung truyền thống không còn phù hợp. Do đó, cần một phương pháp mới cho phép mô hình 'học' ngay tại nơi dữ liệu được lưu trữ mà không cần di chuyển dữ liệu đi. Giải pháp này phải giải quyết được bài toán đồng bộ hóa các phiên bản mô hình từ nhiều nguồn, đồng thời đảm bảo rằng quá trình huấn luyện chung vẫn mang lại độ chính xác cao và có khả năng tổng quát hóa tốt trên các tập dữ liệu đa dạng.
Để giải quyết bài toán chẩn đoán bệnh sớm, hệ thống sử dụng một kiến trúc kết hợp giữa Internet of Things (IoTs), Học sâu (Deep Learning) và Học phân tán (Federated Learning). Dữ liệu từ các cảm biến IoT trong y tế và thiết bị đeo theo dõi sức khỏe (wearable devices) được thu thập và xử lý tại biên (edge computing) để giảm độ trễ và tăng cường bảo mật. Cốt lõi của hệ thống là hai mô hình học sâu chuyên biệt: một mô hình Mạng Nơ-ron (Neural Network - NN) để dự đoán bệnh tiểu đường dựa trên các chỉ số sinh học, và một mô hình Mạng Nơ-ron Tích chập (Convolutional Neural Network - CNN) để dự đoán bệnh viêm phổi từ hình ảnh X-quang. Điểm đột phá của nghiên cứu là việc áp dụng phương pháp Học phân tán, cho phép huấn luyện các mô hình này trên dữ liệu của nhiều bệnh viện mà không cần tập trung dữ liệu. Cách tiếp cận này không chỉ nâng cao độ chính xác của mô hình nhờ nguồn dữ liệu đa dạng mà còn là giải pháp tối ưu cho vấn đề bảo mật và quyền riêng tư, tạo nên một hệ thống y tế thông minh thực sự hiệu quả.
Mô hình Mạng Nơ-ron (NN) được thiết kế chuyên biệt để dự đoán bệnh tiểu đường từ bộ dữ liệu Pima Indians Diabetes. Cấu trúc mô hình bao gồm một lớp đầu vào tương ứng với 8 đặc trưng y tế (số lần mang thai, đường huyết, huyết áp, v.v.), hai lớp ẩn và một lớp đầu ra. Các lớp ẩn sử dụng hàm kích hoạt LeakyReLU để xử lý tính phi tuyến và ngăn chặn hiện tượng biến mất đạo hàm. Lớp đầu ra sử dụng hàm sigmoid để đưa ra một giá trị xác suất từ 0 đến 1, biểu thị khả năng mắc bệnh tiểu đường. Theo kết quả được trình bày trong tài liệu nghiên cứu, mô hình này sau khi huấn luyện đã đạt độ chính xác lên đến 88%, cho thấy hiệu quả cao trong việc chẩn đoán bệnh sớm dựa trên các chỉ số lâm sàng.
Đối với bài toán chẩn đoán viêm phổi qua hình ảnh X-quang, một mô hình Mạng Nơ-ron Tích chập (CNN) đã được xây dựng. Mô hình này bao gồm nhiều lớp tích chập 3x3 để trích xuất các đặc trưng hình ảnh, kết hợp với các lớp Chuẩn hóa hàng loạt (Batch Normalization) để ổn định quá trình huấn luyện. Lớp gộp MaxPooling được sử dụng để giảm kích thước dữ liệu và các lớp Dropout được tích hợp để ngăn chặn hiện tượng quá khớp (overfitting). Mô hình được huấn luyện trên bộ dữ liệu Chest X-ray và đạt được độ chính xác ấn tượng là 90%. Kết quả này khẳng định khả năng của trí tuệ nhân tạo (AI) chẩn đoán bệnh trong việc hỗ trợ các bác sĩ phân tích hình ảnh y tế, đặc biệt là trong việc phân biệt giữa các trường hợp bình thường và viêm phổi.
Để giải quyết thách thức về dữ liệu phân tán, hệ thống áp dụng Học phân tán (Federated Learning - FL). Thay vì gửi dữ liệu về máy chủ trung tâm, mô hình toàn cục sẽ được gửi đến các bệnh viện (client). Tại đây, mô hình được huấn luyện trên dữ liệu cục bộ, sau đó chỉ các cập nhật về trọng số (weights) được gửi về máy chủ để tổng hợp. Nghiên cứu đã so sánh hai thuật toán tổng hợp là FedAvg (trung bình) và FedMed (trung vị). Kết quả thực nghiệm cho thấy phương pháp FedAvg vượt trội hơn, đạt độ chính xác 89% khi phân bổ dữ liệu hợp lý. Việc này chứng tỏ FL là một giải pháp hiệu quả để phân tích dữ liệu lớn y tế mà vẫn tôn trọng tuyệt đối quyền riêng tư của bệnh nhân.
Để đảm bảo bảo mật dữ liệu y tế và tạo ra một môi trường đáng tin cậy, công nghệ chuỗi khối (Blockchain) được tích hợp sâu vào kiến trúc hệ thống. Thay vì chỉ mã hóa, Blockchain cung cấp một sổ cái phân tán, bất biến, nơi mọi giao dịch và thay đổi dữ liệu đều được ghi lại một cách minh bạch và không thể sửa đổi. Nền tảng Hyperledger Sawtooth được lựa chọn nhờ tính linh hoạt và khả năng tách biệt lớp ứng dụng khỏi lớp lõi hệ thống. Trong hệ thống này, Blockchain không trực tiếp lưu trữ dữ liệu y tế cồng kềnh mà đóng vai trò xác thực danh tính, quản lý quyền truy cập và quan trọng nhất là ghi lại các giao dịch liên quan đến quá trình huấn luyện học phân tán. Sự kết hợp này tạo ra một lớp bảo mật vững chắc, đảm bảo tính toàn vẹn dữ liệu và tính minh bạch cho toàn bộ hệ thống giám sát sức khỏe tại nhà.
Hệ thống sử dụng Hyperledger Sawtooth, một nền tảng blockchain được thiết kế cho môi trường doanh nghiệp. Ưu điểm của Sawtooth là kiến trúc module linh hoạt, cho phép các nhà phát triển tùy chỉnh logic nghiệp vụ (Transaction Processors) mà không cần can thiệp vào lõi của blockchain. Trong hệ thống này, Sawtooth đóng vai trò là một lớp xác thực và ghi lại nhật ký. Mỗi khi một client (bệnh viện) hoàn thành một vòng huấn luyện cục bộ và gửi cập nhật trọng số, một giao dịch sẽ được tạo ra. Giao dịch này chứa thông tin về client, phiên bản mô hình, và một con trỏ (hash) trỏ đến tệp trọng số được lưu trữ trên IPFS. Điều này đảm bảo mọi đóng góp cho mô hình toàn cục đều được ghi lại một cách minh bạch và có thể truy vết.
Để giải quyết vấn đề lưu trữ các tệp trọng số mô hình có kích thước lớn, hệ thống tích hợp Hệ thống tệp liên hành tinh (InterPlanetary File System - IPFS). IPFS là một mạng lưu trữ phi tập trung, nơi dữ liệu được định danh bằng chính nội dung của nó (content-addressing). Khi một tệp trọng số được tải lên IPFS, nó sẽ nhận một chuỗi hash duy nhất. Chuỗi hash này, có kích thước rất nhỏ, sau đó được lưu trữ trên blockchain thông qua một giao dịch. Hợp đồng thông minh (smart contract) được sử dụng để tự động hóa quy trình xác thực giao dịch và cập nhật trạng thái của mô hình toàn cục. Sự kết hợp giữa Blockchain và IPFS tạo ra một giải pháp lưu trữ vừa an toàn, phi tập trung, vừa có khả năng mở rộng hiệu quả.
Hiệu quả của hệ thống giám sát sức khỏe tại nhà được đánh giá toàn diện trên nhiều khía cạnh, từ độ chính xác của các mô hình dự đoán đến hiệu suất của hạ tầng công nghệ. Kết quả triển khai cho thấy sự kết hợp giữa Machine Learning và Blockchain mang lại những lợi ích vượt trội. Các mô hình dự đoán sức khỏe không chỉ đạt độ chính xác cao (88-90%), mà còn có khả năng cải thiện liên tục nhờ kiến trúc học phân tán. Về mặt hệ thống, việc triển khai các API bằng FastAPI cho phép giao tiếp linh hoạt và hiệu quả giữa các thành phần. Nền tảng blockchain, mặc dù làm tăng một chút độ trễ, nhưng đảm bảo được mục tiêu cốt lõi là an toàn và minh bạch. Ứng dụng di động dành cho bác sĩ và bệnh nhân được thiết kế với giao diện trực quan, dễ sử dụng, hoàn thiện giải pháp e-health và mang lại trải nghiệm người dùng tích cực. Những kết quả này chứng minh tính khả thi và tiềm năng to lớn của hệ thống.
Theo Bảng 4.1 và 4.2 trong tài liệu gốc, các mô hình học sâu cho thấy hiệu suất rất cao. Mô hình NN dự đoán tiểu đường đạt độ chính xác 88%, với chỉ số F1-score là 0.88 cho cả hai lớp (Normal và Diabetes), cho thấy sự cân bằng tốt giữa Precision và Recall. Tương tự, mô hình CNN chẩn đoán viêm phổi đạt độ chính xác tổng thể 90%, với F1-score là 0.90. Các ma trận hỗn loạn (confusion matrix) cũng chỉ ra rằng mô hình có tỷ lệ dự đoán sai (False Positive và False Negative) thấp. Những con số này chứng minh rằng việc áp dụng học máy trong y tế có thể mang lại kết quả chẩn đoán đáng tin cậy, hỗ trợ đắc lực cho các chuyên gia y tế.
Hệ thống API được xây dựng trên FastAPI, một framework hiện đại cho hiệu suất cao. Các API quản lý người dùng, cảm biến, bệnh nhân và dự đoán hoạt động ổn định, đáp ứng nhanh chóng các yêu cầu. Đối với hạ tầng blockchain, Bảng 4.5 cho thấy thời gian phản hồi phụ thuộc vào số lượng người dùng và loại yêu cầu. Yêu cầu gửi tệp (ghi giao dịch) nhanh hơn yêu cầu nhận tệp (đọc từ blockchain). Mặc dù có độ trễ nhất định, thời gian này là chấp nhận được trong bối cảnh lợi ích về an toàn và tính toàn vẹn dữ liệu mà blockchain mang lại là rất lớn. Hệ thống đã cân bằng thành công giữa hiệu suất và yêu cầu bảo mật nghiêm ngặt.
Mặc dù đã đạt được những kết quả đáng khích lệ, hệ thống giám sát sức khỏe tại nhà vẫn còn nhiều tiềm năng để phát triển và hoàn thiện. Tương lai của nền tảng y tế số nằm ở khả năng tích hợp các công nghệ mới và mở rộng phạm vi ứng dụng. Hướng phát triển chính bao gồm việc làm giàu thêm bộ dữ liệu huấn luyện để nâng cao độ chính xác và khả năng dự đoán nhiều loại bệnh hơn nữa. Việc tự động hóa quá trình thu thập và kiểm tra dữ liệu từ các thiết bị đeo theo dõi sức khỏe sẽ giúp cải thiện tính tiện lợi và khả năng sẵn sàng của hệ thống. Đồng thời, việc tiếp tục nghiên cứu các cơ chế đồng thuận và mã hóa tiên tiến hơn trong lĩnh vực blockchain sẽ giúp tối ưu hóa hiệu suất và tăng cường hơn nữa lớp bảo mật. Xa hơn nữa, hệ thống có thể tích hợp với AI tạo sinh để cung cấp các tư vấn sức khỏe cá nhân hóa, hoặc kết hợp với công nghệ thực tế ảo (VR/AR) để tạo ra các trải nghiệm telehealth sống động và hiệu quả hơn.
Một trong những hướng đi quan trọng là mở rộng mô hình để dự đoán thêm các bệnh lý khác như bệnh tim, đột quỵ, hoặc các bệnh liên quan đến sức khỏe tâm thần. Để làm được điều này, cần thu thập thêm nhiều bộ dữ liệu đa dạng và chất lượng cao. Bên cạnh đó, việc tích hợp sâu hơn với các wearable devices và cảm biến IoT trong y tế để tự động hóa hoàn toàn quá trình thu thập dữ liệu sẽ giúp giảm thiểu sai sót do người dùng nhập liệu thủ công. Hệ thống có thể tự động đồng bộ hóa dữ liệu về nhịp tim, nồng độ oxy trong máu, chất lượng giấc ngủ, v.v., tạo ra một bức tranh toàn cảnh và liên tục về sức khỏe của người dùng, từ đó nâng cao chất lượng của việc quản lý bệnh mãn tính.
Lĩnh vực blockchain đang phát triển không ngừng. Các nghiên cứu trong tương lai có thể tập trung vào việc áp dụng các cơ chế đồng thuận hiệu quả hơn như Proof of Stake (PoS) hoặc các giải pháp layer-2 để giảm thời gian xác thực giao dịch và tăng thông lượng của mạng. Việc khám phá các kỹ thuật mã hóa mới như Zero-Knowledge Proofs (ZKP) có thể cho phép xác minh tính đúng đắn của dữ liệu mà không cần tiết lộ chính dữ liệu đó, đưa khả năng bảo mật dữ liệu y tế lên một tầm cao mới. Những cải tiến này sẽ giúp hệ thống y tế thông minh trở nên nhanh hơn, an toàn hơn và có khả năng mở rộng để phục vụ hàng triệu người dùng.
Bạn đang xem trước tài liệu:
Khóa luận tốt nghiệp xây dựng hệ thống theo dõi sức khỏe tại nhà dựa trên công nghệ học máy và chuỗi khối