Tổng quan nghiên cứu
Dự báo nhu cầu sản xuất đóng vai trò then chốt trong việc tối ưu hóa chuỗi cung ứng và quản lý tồn kho tại các doanh nghiệp sản xuất, đặc biệt trong ngành dược phẩm. Theo báo cáo của ngành, dữ liệu bán hàng của một công ty dược phẩm tại Việt Nam trong khoảng thời gian từ năm 2019 đến 2020 với hơn 111 nghìn dòng dữ liệu, bao gồm 1100 mặt hàng thuộc 25 loại hàng hóa, đã được thu thập và phân tích. Vấn đề nghiên cứu tập trung vào việc xây dựng mô hình dự báo nhu cầu sản xuất dựa trên dữ liệu quá khứ nhằm giúp doanh nghiệp xác định chính xác tỷ lệ cung ứng, từ đó giảm thiểu chi phí tồn kho và tối ưu hóa kế hoạch mua nguyên vật liệu.
Mục tiêu cụ thể của luận văn là so sánh hiệu quả của hai mô hình dự báo chuỗi thời gian phổ biến là SARIMA và LSTM trên dữ liệu bán hàng thực tế của công ty dược phẩm, từ đó lựa chọn mô hình tối ưu nhất để áp dụng trong thực tiễn. Phạm vi nghiên cứu tập trung vào dữ liệu bán hàng theo tháng trong vòng 12 tháng, với trọng tâm là các nhóm sản phẩm có tính mùa vụ và đặc thù ngành dược. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác dự báo, giảm sai số RMSE xuống khoảng 37% so với mô hình truyền thống, góp phần nâng cao hiệu quả quản lý sản xuất và kinh doanh.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên hai khung lý thuyết chính:
Mô hình SARIMA (Seasonal AutoRegressive Integrated Moving Average): Đây là mô hình dự báo chuỗi thời gian có tính đến yếu tố mùa vụ, kết hợp các thành phần tự hồi quy (AR), sai phân tích hợp (I) và trung bình động (MA) cùng với các tham số mùa vụ (P, D, Q, m). SARIMA phù hợp với dữ liệu có chu kỳ lặp lại theo mùa, giúp bắt được các quy luật biến động theo tháng trong ngành dược phẩm.
Mô hình LSTM (Long Short-Term Memory Networks): Là một dạng mạng nơ-ron hồi tiếp (RNN) có khả năng ghi nhớ thông tin dài hạn, LSTM vượt trội trong việc xử lý dữ liệu chuỗi thời gian phi tuyến tính và phức tạp. Mô hình này được xây dựng và huấn luyện bằng Python với các thư viện Keras và TensorFlow, cho phép dự báo chính xác hơn trong các trường hợp dữ liệu có nhiều biến động và yếu tố ngoại lai.
Các khái niệm chính bao gồm: chuỗi thời gian, sai phân bậc d, tham số AR, MA, yếu tố mùa vụ, mạng nơ-ron hồi tiếp, và hàm mất mát RMSE (Root Mean Square Error) dùng để đánh giá sai số dự báo.
Phương pháp nghiên cứu
Nguồn dữ liệu chính là bộ dữ liệu bán hàng thực tế của công ty dược phẩm, gồm khoảng 111 nghìn dòng dữ liệu chi tiết về sản phẩm, ngày bán, số lượng bán và các thông tin liên quan, được trích xuất từ hệ thống quản lý Microsoft SQL Server 2016. Dữ liệu được xử lý và chuẩn hóa thành chuỗi thời gian theo tháng, với 83% dữ liệu dùng để huấn luyện và 17% để kiểm tra mô hình.
Phương pháp phân tích bao gồm:
- Xây dựng và huấn luyện mô hình SARIMA với cấu hình tham số được lựa chọn dựa trên phân tích ACF, PACF và tiêu chí Box-Jenkins, trong đó chu kỳ mùa vụ được xác định là 12 tháng.
- Xây dựng mô hình LSTM với cấu trúc 4 lớp, sử dụng dữ liệu đầu vào dạng mảng 3 chiều (số mẫu, số bước thời gian, số đặc trưng), chuẩn hóa dữ liệu về khoảng [0,1].
- So sánh kết quả dự báo của hai mô hình dựa trên chỉ số RMSE.
- Thời gian nghiên cứu từ tháng 2 đến tháng 6 năm 2020, với việc áp dụng thực nghiệm trên dữ liệu bán hàng của công ty dược phẩm.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả mô hình SARIMA: Mô hình SARIMA với cấu hình ((p,d,q),(P,D,Q,m)) = ((0,0,1),(0,1,2,12)) cho kết quả RMSE khoảng 176,333 trên dữ liệu nhóm sản phẩm. Mô hình này thể hiện khả năng bắt được tính mùa vụ và xu hướng trong dữ liệu bán hàng theo tháng.
Hiệu quả mô hình LSTM: Mô hình LSTM đạt RMSE khoảng 111,208, giảm 37% so với mô hình SARIMA, cho thấy khả năng dự báo chính xác hơn nhờ xử lý tốt các yếu tố phi tuyến và biến động phức tạp trong dữ liệu.
Phân tích theo nhóm sản phẩm: Dữ liệu được phân tích theo nhóm thuốc da liễu, tiêu hóa và kháng sinh nhẹ, trong đó mô hình LSTM đều cho kết quả dự báo vượt trội hơn SARIMA với sai số thấp hơn đáng kể.
Phân tích theo sản phẩm riêng lẻ: Trực quan hóa dữ liệu bán hàng của các sản phẩm như ALPHA, B1-B6-B12 cho thấy mô hình LSTM có khả năng dự báo sát với biến động thực tế hơn, đặc biệt trong các tháng có biến động do ảnh hưởng dịch bệnh Covid-19.
Thảo luận kết quả
Nguyên nhân mô hình LSTM vượt trội là do khả năng ghi nhớ dài hạn và xử lý phi tuyến của mạng nơ-ron, phù hợp với dữ liệu bán hàng có nhiều biến động và yếu tố mùa vụ không tuyến tính. Trong khi đó, SARIMA mặc dù hiệu quả với dữ liệu có tính mùa vụ rõ ràng nhưng hạn chế trong việc xử lý các biến động phức tạp và yếu tố ngoại lai.
So sánh với các nghiên cứu trước đây trong lĩnh vực dự báo chuỗi thời gian tài chính và bán hàng, kết quả này phù hợp với xu hướng ứng dụng mô hình học sâu (deep learning) ngày càng phổ biến và hiệu quả hơn các mô hình truyền thống. Kết quả có thể được trình bày qua biểu đồ so sánh RMSE giữa hai mô hình và bảng tổng hợp sai số dự báo theo từng nhóm sản phẩm.
Ý nghĩa của nghiên cứu là cung cấp một phương pháp dự báo nhu cầu sản xuất chính xác, giúp doanh nghiệp dược phẩm tối ưu hóa kế hoạch sản xuất, giảm tồn kho và chi phí, đồng thời nâng cao khả năng thích ứng với biến động thị trường.
Đề xuất và khuyến nghị
Áp dụng mô hình LSTM trong hệ thống dự báo nhu cầu sản xuất: Doanh nghiệp nên triển khai mô hình LSTM để dự báo nhu cầu theo tháng, nhằm giảm sai số dự báo xuống dưới 20%, cải thiện hiệu quả quản lý tồn kho trong vòng 6 tháng tới.
Tích hợp dữ liệu ngoại lai vào mô hình: Bổ sung các yếu tố bên ngoài như biến động thị trường, dịch bệnh, chính sách để nâng cao độ chính xác dự báo, thực hiện trong vòng 12 tháng với sự phối hợp của bộ phận phân tích dữ liệu.
Đào tạo nhân sự về kỹ thuật học máy và Python: Tổ chức các khóa đào tạo cho đội ngũ quản lý và kỹ thuật nhằm nâng cao năng lực vận hành và bảo trì mô hình dự báo, hoàn thành trong 3 tháng.
Xây dựng hệ thống tự động hóa báo cáo và cảnh báo: Phát triển phần mềm tích hợp mô hình dự báo với hệ thống ERP để tự động cập nhật kế hoạch sản xuất và mua hàng, giảm thiểu sai sót thủ công, triển khai trong 9 tháng.
Đối tượng nên tham khảo luận văn
Nhà quản lý sản xuất và chuỗi cung ứng: Giúp họ hiểu và áp dụng các mô hình dự báo hiện đại để tối ưu hóa kế hoạch sản xuất và tồn kho, giảm chi phí vận hành.
Chuyên gia phân tích dữ liệu và khoa học dữ liệu: Cung cấp phương pháp và ví dụ thực tiễn về ứng dụng mô hình SARIMA và LSTM trong dự báo chuỗi thời gian ngành dược phẩm.
Nhà nghiên cứu và sinh viên ngành hệ thống thông tin quản lý: Là tài liệu tham khảo về cách xây dựng, huấn luyện và đánh giá mô hình dự báo trên dữ liệu thực tế, đồng thời so sánh hiệu quả các phương pháp truyền thống và học máy.
Doanh nghiệp sản xuất trong các ngành có tính mùa vụ: Có thể áp dụng mô hình và quy trình nghiên cứu để cải thiện dự báo nhu cầu sản xuất, đặc biệt trong các ngành có chu kỳ sản xuất và tiêu thụ rõ ràng.
Câu hỏi thường gặp
Mô hình SARIMA là gì và khi nào nên sử dụng?
SARIMA là mô hình dự báo chuỗi thời gian có tính đến yếu tố mùa vụ, phù hợp với dữ liệu có chu kỳ lặp lại theo tháng hoặc năm. Ví dụ, trong ngành dược phẩm, các sản phẩm có nhu cầu tăng theo mùa có thể được dự báo hiệu quả bằng SARIMA.LSTM khác gì so với các mô hình truyền thống?
LSTM là mạng nơ-ron hồi tiếp có khả năng ghi nhớ thông tin dài hạn và xử lý dữ liệu phi tuyến, giúp dự báo chính xác hơn khi dữ liệu có nhiều biến động phức tạp, không chỉ dựa vào quy luật tuyến tính như SARIMA.Sai số RMSE có ý nghĩa gì trong dự báo?
RMSE đo lường độ lệch trung bình giữa giá trị dự báo và giá trị thực tế, càng nhỏ càng tốt. Ví dụ, mô hình LSTM giảm sai số RMSE khoảng 37% so với SARIMA, cho thấy dự báo chính xác hơn đáng kể.Dữ liệu cần chuẩn bị như thế nào để xây dựng mô hình?
Dữ liệu cần được chuẩn hóa, xử lý thiếu sót và chuyển đổi thành chuỗi thời gian theo khoảng thời gian cố định (ví dụ theo tháng). Dữ liệu càng đầy đủ và chính xác thì mô hình càng cho kết quả tốt.Làm sao để lựa chọn mô hình dự báo phù hợp?
Cần đánh giá đặc điểm dữ liệu (có tính mùa vụ, phi tuyến hay không), thử nghiệm các mô hình khác nhau và so sánh các chỉ số đánh giá như RMSE. Trong thực tế, mô hình LSTM thường phù hợp với dữ liệu phức tạp, còn SARIMA phù hợp với dữ liệu có tính mùa vụ rõ ràng.
Kết luận
- Luận văn đã xây dựng và so sánh hai mô hình dự báo nhu cầu sản xuất dựa trên dữ liệu bán hàng thực tế của công ty dược phẩm, gồm SARIMA và LSTM.
- Mô hình LSTM cho kết quả dự báo chính xác hơn, giảm sai số RMSE khoảng 37% so với SARIMA.
- Nghiên cứu góp phần nâng cao hiệu quả quản lý sản xuất, tồn kho và kế hoạch mua nguyên vật liệu trong ngành dược phẩm.
- Đề xuất áp dụng mô hình LSTM kết hợp đào tạo nhân sự và tích hợp hệ thống tự động hóa trong vòng 6-12 tháng tới.
- Khuyến khích các nhà quản lý, chuyên gia phân tích dữ liệu và doanh nghiệp sản xuất tham khảo để cải thiện quy trình dự báo và quản lý sản xuất.
Hãy bắt đầu áp dụng các mô hình dự báo hiện đại để nâng cao hiệu quả sản xuất và kinh doanh ngay hôm nay!