Tổng quan nghiên cứu
Dự báo lượng bệnh nhân nhập viện tại phòng cấp cứu là một bài toán quan trọng trong quản lý y tế nhằm tối ưu hóa nguồn lực và nâng cao chất lượng dịch vụ. Bộ dữ liệu nghiên cứu được thu thập từ Bệnh Viện Đa Khoa Khu Vực Củ Chi, thành phố Hồ Chí Minh, với 1096 điểm dữ liệu hàng ngày từ 01/01/2018 đến 31/12/2020, ghi nhận lượng bệnh nhân trung bình 69 người/ngày, thấp nhất 7 và cao nhất 122 người/ngày. Chuỗi dữ liệu này có tính mùa rõ rệt với chu kỳ 7 ngày, phản ánh sự biến động theo tuần.
Mục tiêu nghiên cứu tập trung vào việc xây dựng và so sánh hiệu quả dự báo của các mô hình dự báo chuỗi thời gian có tính mùa, bao gồm mô hình Holt – Winters, mạng nơ-ron nhân tạo có tính mùa (SANN), mô hình lai giữa Holt – Winters và SANN, cùng mô hình học sâu LSTM xếp chồng. Việc đánh giá dựa trên các chỉ số sai số dự báo phổ biến như MAPE và MSE nhằm xác định mô hình phù hợp nhất cho bài toán dự báo lượng bệnh nhân cấp cứu hàng ngày.
Phạm vi nghiên cứu giới hạn trong dữ liệu thu thập tại bệnh viện Củ Chi trong giai đoạn 2018-2020, tập trung vào dự báo một bước tiếp theo (one step-ahead prediction). Ý nghĩa của nghiên cứu không chỉ giúp bệnh viện hoạch định nguồn lực hiệu quả mà còn đóng góp vào lĩnh vực khoa học máy tính trong ứng dụng mô hình dự báo chuỗi thời gian có tính mùa, đặc biệt là trong môi trường y tế.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên các lý thuyết và mô hình dự báo chuỗi thời gian có tính mùa, bao gồm:
Mô hình Holt – Winters: Làm trơn hàm mũ có khả năng xử lý chuỗi thời gian có xu hướng và tính mùa, với hai phiên bản chính là dạng nhân và dạng cộng. Mô hình này sử dụng ba tham số làm trơn (α, β, γ) để ước lượng biên độ, xu hướng và thành phần mùa, giúp dự báo chính xác các chuỗi có tính mùa.
Mạng nơ-ron nhân tạo có tính mùa (SANN): Mạng nơ-ron truyền thẳng với cấu trúc đặc biệt, trong đó số nút tầng nhập bằng độ dài mùa của chuỗi thời gian (ở đây là 7), giúp mạng nắm bắt đặc tính mùa mà không cần tiền xử lý khử mùa. SANN có khả năng mô hình hóa các đặc tính phi tuyến của chuỗi thời gian.
Mô hình lai Holt – Winters và SANN: Kết hợp ưu điểm của mô hình tuyến tính Holt – Winters và mô hình phi tuyến SANN để cải thiện hiệu quả dự báo. Kết quả dự báo cuối cùng là sự kết hợp trọng số giữa hai mô hình thành phần, trọng số được tối ưu hóa dựa trên sai số dự báo.
Mạng nơ-ron học sâu LSTM xếp chồng: Mạng hồi quy có khả năng ghi nhớ thông tin dài hạn, khắc phục vấn đề phụ thuộc dài hạn trong chuỗi thời gian. Mô hình xếp chồng nhiều tầng LSTM giúp học sâu hơn các đặc trưng phi tuyến phức tạp của dữ liệu.
Các khái niệm chính bao gồm chuỗi thời gian, thành phần xu hướng, thành phần mùa, hệ số tự tương quan, hàm tự tương quan, và các chỉ số đánh giá sai số dự báo như MAPE và MSE.
Phương pháp nghiên cứu
Nguồn dữ liệu chính là bộ dữ liệu lượng bệnh nhân nhập viện hàng ngày tại phòng cấp cứu Bệnh Viện Đa Khoa Khu Vực Củ Chi, thu thập từ 01/01/2018 đến 31/12/2020, gồm 1096 điểm dữ liệu. Bộ dữ liệu được chia thành 70% cho huấn luyện và 30% cho kiểm thử.
Phương pháp phân tích bao gồm:
Tiền xử lý dữ liệu và xác định tính mùa dựa trên biểu đồ hàm tự tương quan (ACF), xác định độ dài mùa là 7 ngày.
Hiện thực các mô hình Holt – Winters, SANN, mô hình lai giữa Holt – Winters và SANN, cùng mô hình LSTM xếp chồng.
Huấn luyện mạng nơ-ron sử dụng thuật toán lan truyền ngược (backpropagation), với cấu trúc mạng SANN gồm 7 nút tầng nhập, 7 nút tầng ẩn và 1 nút tầng xuất.
Mô hình Holt – Winters được tối ưu tham số α, β, γ bằng phương pháp vét cạn (brute force) với bước nhảy 0.01.
Mô hình lai kết hợp dự báo của Holt – Winters và SANN theo công thức trọng số tối ưu hóa dựa trên sai số MSE.
Mô hình LSTM xếp chồng gồm nhiều tầng ẩn LSTM, được huấn luyện để so sánh hiệu quả dự báo.
Đánh giá hiệu quả dự báo dựa trên các chỉ số MAPE và MSE, so sánh sai số giữa các mô hình.
Timeline nghiên cứu kéo dài từ tháng 9/2023 đến tháng 12/2023, bao gồm các bước thu thập dữ liệu, xây dựng mô hình, huấn luyện, thử nghiệm và đánh giá kết quả.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Mô hình lai Holt – Winters và SANN cho hiệu quả dự báo vượt trội so với từng mô hình đơn lẻ: Sai số MAPE của mô hình lai thấp hơn trung bình 3.5% so với mô hình SANN và thấp hơn 4.5% so với mô hình Holt – Winters đơn lẻ trên bộ dữ liệu 1096 điểm.
Mô hình LSTM xếp chồng đạt hiệu quả dự báo tốt nhất: Sai số MAPE của mô hình LSTM thấp hơn mô hình lai trung bình 1.23%, cho thấy khả năng ghi nhớ thông tin dài hạn và học sâu giúp cải thiện độ chính xác dự báo.
Tính mùa của chuỗi thời gian được xác nhận rõ ràng với chu kỳ 7 ngày: Biểu đồ ACF cho thấy các điểm tự tương quan vượt ngưỡng tin cậy tại các độ trễ bội số của 7, phù hợp với đặc điểm biến động theo tuần của lượng bệnh nhân.
Biến động lượng bệnh nhân có sự khác biệt rõ rệt vào cuối tuần và ngày lễ: Điều này làm tăng tính phức tạp của bài toán dự báo, đòi hỏi mô hình phải nắm bắt được đặc tính phi tuyến và tính mùa.
Thảo luận kết quả
Kết quả cho thấy mô hình lai giữa Holt – Winters và SANN tận dụng được ưu điểm của cả hai mô hình: Holt – Winters xử lý tốt thành phần tuyến tính và tính mùa, trong khi SANN nắm bắt được các đặc tính phi tuyến của chuỗi thời gian. Do đó, mô hình lai cải thiện đáng kể hiệu quả dự báo so với từng mô hình riêng lẻ.
Mô hình LSTM xếp chồng vượt trội hơn nhờ khả năng học sâu và ghi nhớ thông tin dài hạn, phù hợp với dữ liệu chuỗi thời gian có tính mùa và biến động phức tạp. Kết quả này tương đồng với các nghiên cứu quốc tế về ứng dụng LSTM trong dự báo chuỗi thời gian y tế.
Dữ liệu có thể được trình bày qua biểu đồ so sánh sai số MAPE và MSE của các mô hình, cùng biểu đồ đường biểu diễn lượng bệnh nhân thực tế và dự báo trong một tháng để minh họa độ chính xác của từng mô hình.
Đề xuất và khuyến nghị
Áp dụng mô hình LSTM xếp chồng trong dự báo lượng bệnh nhân cấp cứu hàng ngày nhằm nâng cao độ chính xác dự báo, giúp bệnh viện chủ động trong phân bổ nguồn lực. Thời gian triển khai: 6 tháng; chủ thể: phòng công nghệ thông tin và quản lý bệnh viện.
Phát triển hệ thống dự báo tự động tích hợp mô hình lai Holt – Winters và SANN để làm công cụ hỗ trợ ra quyết định trong trường hợp không có đủ nguồn lực triển khai LSTM. Thời gian: 4 tháng; chủ thể: nhóm nghiên cứu và kỹ thuật viên CNTT.
Tăng cường thu thập và cập nhật dữ liệu liên tục để cải thiện chất lượng dữ liệu đầu vào, đặc biệt chú ý các biến động theo ngày lễ, cuối tuần. Thời gian: liên tục; chủ thể: bộ phận quản lý dữ liệu bệnh viện.
Đào tạo nhân viên y tế và quản lý về ứng dụng mô hình dự báo nhằm nâng cao nhận thức và khả năng sử dụng kết quả dự báo trong công tác điều phối bệnh nhân và nguồn lực. Thời gian: 3 tháng; chủ thể: phòng đào tạo và quản lý bệnh viện.
Đối tượng nên tham khảo luận văn
Quản lý bệnh viện và phòng cấp cứu: Nhận được công cụ dự báo chính xác để tối ưu hóa phân bổ nhân lực và trang thiết bị, giảm thiểu tình trạng quá tải.
Nhà nghiên cứu khoa học máy tính và trí tuệ nhân tạo: Tham khảo phương pháp kết hợp mô hình thống kê và mạng nơ-ron nhân tạo trong dự báo chuỗi thời gian có tính mùa.
Chuyên gia y tế công cộng và hoạch định chính sách y tế: Sử dụng kết quả dự báo để xây dựng các kế hoạch ứng phó kịp thời với biến động bệnh nhân cấp cứu.
Sinh viên và học viên cao học ngành khoa học máy tính, y sinh học: Học tập mô hình LSTM xếp chồng và mô hình lai trong ứng dụng thực tế, phát triển kỹ năng nghiên cứu và ứng dụng mô hình dự báo.
Câu hỏi thường gặp
Mô hình nào phù hợp nhất để dự báo lượng bệnh nhân cấp cứu?
Mô hình LSTM xếp chồng cho kết quả dự báo chính xác nhất với sai số MAPE thấp hơn mô hình lai khoảng 1.23%, nhờ khả năng học sâu và ghi nhớ thông tin dài hạn.Tại sao cần kết hợp mô hình Holt – Winters và SANN?
Mô hình lai tận dụng ưu điểm của Holt – Winters trong xử lý thành phần tuyến tính và tính mùa, cùng khả năng nắm bắt phi tuyến của SANN, giúp cải thiện hiệu quả dự báo so với từng mô hình riêng lẻ.Chu kỳ mùa của dữ liệu là bao nhiêu?
Chu kỳ mùa được xác định là 7 ngày, tương ứng với biến động theo tuần, được phát hiện qua phân tích hàm tự tương quan (ACF).Sai số dự báo được đánh giá bằng chỉ số nào?
Chủ yếu sử dụng sai số phần trăm tuyệt đối trung bình (MAPE) và sai số bình phương trung bình (MSE) để đánh giá độ chính xác của các mô hình dự báo.Có thể áp dụng mô hình này cho các bệnh viện khác không?
Có thể, tuy nhiên cần thu thập dữ liệu tương ứng và điều chỉnh mô hình phù hợp với đặc điểm chuỗi thời gian của từng bệnh viện để đảm bảo hiệu quả dự báo.
Kết luận
- Xây dựng thành công mô hình lai giữa Holt – Winters và SANN, cải thiện hiệu quả dự báo lượng bệnh nhân cấp cứu so với từng mô hình đơn lẻ.
- Mô hình LSTM xếp chồng cho kết quả dự báo tốt nhất, thể hiện tiềm năng ứng dụng mạng nơ-ron học sâu trong dự báo chuỗi thời gian y tế.
- Bộ dữ liệu 1096 điểm thu thập từ Bệnh Viện Đa Khoa Khu Vực Củ Chi trong giai đoạn 2018-2020 có tính mùa rõ rệt với chu kỳ 7 ngày.
- Kết quả nghiên cứu góp phần nâng cao hiệu quả quản lý nguồn lực bệnh viện và mở rộng ứng dụng khoa học máy tính trong y tế.
- Đề xuất triển khai ứng dụng mô hình LSTM và mô hình lai trong thực tế, đồng thời tiếp tục nghiên cứu mở rộng với dữ liệu đa biến và dự báo nhiều bước.
Hành động tiếp theo là triển khai thử nghiệm mô hình LSTM trong môi trường thực tế bệnh viện, đồng thời phát triển hệ thống dự báo tự động hỗ trợ quản lý phòng cấp cứu. Các nhà quản lý và chuyên gia công nghệ thông tin được khuyến khích phối hợp để ứng dụng kết quả nghiên cứu vào thực tiễn nhằm nâng cao chất lượng dịch vụ y tế.