Tổng quan nghiên cứu
Quy trình hoàn ứng và tạm ứng chi phí di chuyển là một phần thiết yếu trong hoạt động của các tổ chức, doanh nghiệp và cơ sở giáo dục nhằm hoàn trả các khoản chi phí phát sinh khi nhân viên đi công tác trong và ngoài nước. Theo dữ liệu từ cuộc thi Business Process Intelligence Challenge (BPI) 2020, bộ dữ liệu thực tế thu thập từ Đại học Công nghệ Eindhoven, Hà Lan, bao gồm ba bộ nhật ký sự kiện chính: Domestic Declarations với 10,500 trường hợp và 56,437 sự kiện, International Declarations với 6,449 trường hợp và 72,151 sự kiện, cùng Prepaid Travel Cost với 2,099 trường hợp và 18,246 sự kiện. Những dữ liệu này phản ánh chi tiết các bước trong quy trình hoàn ứng và tạm ứng chi phí di chuyển từ năm 2017 đến 2018.
Vấn đề nghiên cứu tập trung vào việc khai thác và cải tiến quy trình hoàn ứng và tạm ứng chi phí di chuyển nhằm loại bỏ các nút thắt, giảm thiểu sai sót và tăng hiệu quả vận hành. Mục tiêu cụ thể của luận văn là áp dụng các kỹ thuật khai thác quy trình, đặc biệt là kỹ thuật cải tiến dựa trên thuật toán Quy hoạch tuyến tính nguyên (Integer Linear Programming - ILP), để sửa chữa và tối ưu hóa các mô hình quy trình từ dữ liệu BPI 2020. Phạm vi nghiên cứu giới hạn trong ba bộ dữ liệu đã được tiền xử lý, tập trung vào các hoạt động phê duyệt, từ chối và xử lý chi phí di chuyển trong và ngoài nước.
Ý nghĩa nghiên cứu được thể hiện qua việc nâng cao hiệu quả quản lý chi phí di chuyển, giảm thiểu thời gian xử lý và tăng tính minh bạch trong quy trình hoàn ứng, từ đó góp phần cải thiện hiệu suất hoạt động của tổ chức. Các chỉ số đo lường như độ chắc chắn (fitness), độ chính xác (precision) và độ tổng quát hóa (generalization) được sử dụng để đánh giá hiệu quả của các phương pháp cải tiến.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên ba kỹ thuật chính của khai thác quy trình: khám phá (discovery), kiểm tra tính phù hợp (conformance checking) và cải tiến (enhancement). Trong đó, trọng tâm là kỹ thuật cải tiến nhằm sửa chữa luồng điều khiển (control-flow) của mô hình quy trình để nâng cao hiệu quả vận hành.
Mạng Petri (Petri net) được sử dụng làm công cụ mô hình hóa và phân tích quy trình, giúp biểu diễn các trạng thái, sự kiện và luồng điều khiển một cách trực quan và chính xác. Mạng Petri được định nghĩa bởi bộ ba N = (P, T, F), trong đó P là tập các điểm (places), T là tập các chuyển giao (transitions), và F là tập các luồng chạy (flows) kết nối giữa P và T.
Thuật toán Quy hoạch tuyến tính nguyên (ILP) được lựa chọn làm nền tảng cho phương pháp cải tiến do khả năng tìm ra giải pháp tối ưu trong không gian lựa chọn lớn, đồng thời cho phép thêm các ràng buộc tuyến tính để xử lý các nút thắt trong quy trình. Lý thuyết về các vùng (theory of regions) hỗ trợ việc chuyển đổi các ràng buộc ILP thành các vị trí trong mạng Petri, đảm bảo mô hình quy trình được sửa chữa phản ánh chính xác nhật ký sự kiện.
Các khái niệm chính bao gồm: nhật ký sự kiện (event log), trường hợp (case), sự kiện (event), hoạt động (activity), mốc thời gian (timestamp), và các chỉ số đánh giá mô hình như fitness, precision và generalization.
Phương pháp nghiên cứu
Nguồn dữ liệu chính là ba bộ nhật ký sự kiện từ cuộc thi BPI 2020: Domestic Declarations, International Declarations và Prepaid Travel Cost, đã được tiền xử lý để loại bỏ các trường hợp không hoàn chỉnh, dữ liệu nhiễu và các sự kiện ngoại lệ. Quá trình tiền xử lý sử dụng plugin “Filter Log Using Simple Heuristics” trong công cụ ProM, giúp đảm bảo tính nhất quán và phù hợp của dữ liệu.
Phương pháp phân tích bao gồm áp dụng ba kỹ thuật cải tiến: hai phương pháp cải tiến hiện có của các nghiên cứu trước (D. Fahland và A. Mitsyuk) và phương pháp cải tiến mới do luận văn đề xuất dựa trên thuật toán ILP, gọi là RILP. Các mô hình quy trình sau khi cải tiến được đánh giá và so sánh bằng các chỉ số fitness, precision và generalization thông qua các plugin “Replay a Log on Petri Net for Performance/Conformance” và “Measure Precision/Generalization” trong ProM.
Timeline nghiên cứu kéo dài từ việc khảo sát và tiền xử lý dữ liệu, phát triển và áp dụng các phương pháp cải tiến, đến thực nghiệm và phân tích kết quả trên môi trường máy tính cấu hình CPU Intel Core i7, RAM 16GB, sử dụng ProM 6.11 tích hợp Eclipse và Java 8.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả cải tiến quy trình bằng RILP vượt trội: Phương pháp RILP đạt độ chắc chắn (fitness) trung bình trên 95%, cao hơn khoảng 7% so với phương pháp D. Fahland và 5% so với phương pháp A. Mitsyuk trên ba bộ dữ liệu. Độ chính xác (precision) của RILP cũng cải thiện đáng kể, đạt khoảng 90%, so với mức 82% và 85% của hai phương pháp còn lại.
Giảm thiểu các vòng lặp không cần thiết: Mô hình quy trình sau khi áp dụng RILP loại bỏ được hơn 80% các vòng lặp phụ không cần thiết, trong khi các phương pháp trước chỉ giảm được khoảng 60-65%. Điều này giúp giảm thiểu thời gian xử lý và tăng tính minh bạch của quy trình.
Tăng tính tổng quát hóa của mô hình: RILP cải thiện độ tổng quát hóa (generalization) lên khoảng 88%, cao hơn 10% so với các phương pháp cải tiến hiện có, cho phép mô hình phù hợp với nhiều trường hợp thực tế hơn mà không bị quá khớp với dữ liệu huấn luyện.
Khả năng ứng dụng rộng rãi: Các mô hình được sửa chữa bằng RILP có thể áp dụng hiệu quả cho cả quy trình hoàn ứng trong nước và quốc tế, với sự ổn định về hiệu suất trên các bộ dữ liệu có quy mô và đặc điểm khác nhau.
Thảo luận kết quả
Nguyên nhân chính của sự cải tiến vượt trội của RILP là do thuật toán ILP cho phép tối ưu hóa đồng thời nhiều ràng buộc tuyến tính, giúp phát hiện và sửa chữa các nút thắt trong luồng điều khiển một cách chính xác hơn. Việc bổ sung các ràng buộc nhằm ngăn chặn tạo ra các vòng lặp không cần thiết giúp mô hình trở nên gọn nhẹ và hiệu quả hơn so với phương pháp D. Fahland vốn có xu hướng tạo ra nhiều vòng lặp phụ.
So sánh với các nghiên cứu trước, kết quả của luận văn khẳng định tính khả thi và hiệu quả của việc áp dụng thuật toán ILP vào kỹ thuật cải tiến khai thác quy trình, đặc biệt trong bối cảnh dữ liệu thực tế phức tạp như BPI 2020. Các biểu đồ so sánh fitness, precision và generalization minh họa rõ sự vượt trội của RILP trên từng bộ dữ liệu, đồng thời bảng tổng hợp số lượng vòng lặp được loại bỏ cũng làm nổi bật ưu điểm của phương pháp này.
Ý nghĩa của kết quả là giúp các tổ chức giảm thiểu thời gian và chi phí xử lý quy trình hoàn ứng, đồng thời nâng cao độ chính xác và minh bạch trong quản lý chi phí di chuyển. Điều này góp phần thúc đẩy ứng dụng khai thác quy trình trong các lĩnh vực công nghiệp khác như y tế, tài chính, và logistics.
Đề xuất và khuyến nghị
Triển khai phương pháp RILP trong hệ thống quản lý chi phí di chuyển: Các tổ chức nên áp dụng phương pháp RILP để sửa chữa và tối ưu hóa quy trình hoàn ứng và tạm ứng chi phí di chuyển, nhằm nâng cao hiệu quả xử lý và giảm thiểu sai sót. Thời gian triển khai dự kiến trong vòng 6 tháng, do bộ phận công nghệ thông tin phối hợp với phòng tài chính thực hiện.
Tăng cường đào tạo và nâng cao nhận thức về khai thác quy trình: Đào tạo nhân viên và quản lý về các kỹ thuật khai thác quy trình và lợi ích của việc áp dụng các phương pháp cải tiến nhằm đảm bảo sự đồng thuận và hiệu quả trong vận hành. Khuyến nghị tổ chức các khóa đào tạo định kỳ hàng năm.
Xây dựng hệ thống giám sát và kiểm soát tự động: Phát triển các công cụ giám sát tự động dựa trên mô hình quy trình đã được cải tiến để phát hiện sớm các vi phạm, nút thắt và sai sót trong quy trình hoàn ứng, từ đó kịp thời xử lý. Chủ thể thực hiện là bộ phận công nghệ thông tin và kiểm soát nội bộ, với lộ trình 9 tháng.
Mở rộng ứng dụng kỹ thuật cải tiến vào các quy trình khác: Áp dụng các kỹ thuật cải tiến khai thác quy trình, đặc biệt là RILP, vào các quy trình nghiệp vụ khác như quản lý dự án, xử lý đơn hàng, và dịch vụ khách hàng để tối ưu hóa hiệu suất toàn diện. Thời gian nghiên cứu và thử nghiệm khoảng 12 tháng.
Đối tượng nên tham khảo luận văn
Chuyên gia và nhà nghiên cứu trong lĩnh vực khai thác quy trình (Process Mining): Luận văn cung cấp phương pháp cải tiến dựa trên thuật toán ILP, giúp mở rộng kiến thức và ứng dụng trong nghiên cứu và phát triển kỹ thuật khai thác quy trình.
Quản lý và chuyên viên phòng tài chính, kế toán tại các tổ chức: Tham khảo để hiểu rõ hơn về quy trình hoàn ứng và tạm ứng chi phí di chuyển, từ đó áp dụng các giải pháp tối ưu hóa quy trình nhằm nâng cao hiệu quả quản lý chi phí.
Nhà phát triển phần mềm và kỹ sư hệ thống: Có thể sử dụng các thuật toán và mô hình được đề xuất để phát triển các công cụ hỗ trợ tự động hóa và cải tiến quy trình nghiệp vụ trong doanh nghiệp.
Sinh viên và học viên cao học ngành Công nghệ Thông tin, Quản trị Kinh doanh: Luận văn là tài liệu tham khảo quý giá về ứng dụng thuật toán ILP trong khai thác quy trình, đồng thời cung cấp ví dụ thực tiễn từ dữ liệu thực tế BPI 2020.
Câu hỏi thường gặp
Phương pháp RILP khác gì so với các phương pháp cải tiến trước đây?
RILP sử dụng thuật toán Quy hoạch tuyến tính nguyên để tối ưu hóa luồng điều khiển trong mô hình quy trình, giúp loại bỏ các vòng lặp không cần thiết và nút thắt hiệu quả hơn, trong khi các phương pháp trước chủ yếu dựa trên phân tách và thêm quy trình con mà chưa tối ưu hóa toàn diện.Dữ liệu BPI 2020 có đặc điểm gì nổi bật?
BPI 2020 cung cấp dữ liệu thực tế về quy trình hoàn ứng và tạm ứng chi phí di chuyển với hàng chục nghìn trường hợp và sự kiện, bao gồm cả dữ liệu trong nước và quốc tế, có tính phức tạp cao và chứa nhiều trường hợp không hoàn chỉnh, đòi hỏi tiền xử lý kỹ lưỡng.Các chỉ số fitness, precision và generalization phản ánh điều gì?
Fitness đo lường mức độ phù hợp giữa mô hình và dữ liệu thực tế; precision đánh giá độ chính xác của mô hình trong việc không cho phép các luồng không hợp lệ; generalization thể hiện khả năng mô hình áp dụng cho các trường hợp mới chưa xuất hiện trong dữ liệu huấn luyện.Phương pháp tiền xử lý dữ liệu được thực hiện như thế nào?
Tiền xử lý sử dụng plugin “Filter Log Using Simple Heuristics” trong ProM để loại bỏ các trường hợp không hoàn chỉnh và sự kiện ngoại lệ, đồng thời loại bỏ dữ liệu năm 2017 để tập trung vào quy trình mới nhất năm 2018, đảm bảo tính nhất quán và phù hợp cho phân tích.Phương pháp RILP có thể áp dụng cho các lĩnh vực khác ngoài chi phí di chuyển không?
Có, do tính chất tổng quát của thuật toán ILP và kỹ thuật khai thác quy trình, RILP có thể được áp dụng để cải tiến các quy trình nghiệp vụ trong y tế, tài chính, logistics và nhiều lĩnh vực công nghiệp khác nhằm tối ưu hóa hiệu suất và giảm thiểu sai sót.
Kết luận
- Luận văn đã thành công trong việc áp dụng thuật toán Quy hoạch tuyến tính nguyên (ILP) để đề xuất phương pháp cải tiến RILP, giúp sửa chữa và tối ưu hóa quy trình hoàn ứng và tạm ứng chi phí di chuyển từ dữ liệu thực tế BPI 2020.
- Phương pháp RILP vượt trội hơn các kỹ thuật cải tiến hiện có về độ chắc chắn, độ chính xác và độ tổng quát hóa, đồng thời giảm thiểu các vòng lặp không cần thiết trong mô hình quy trình.
- Kết quả thực nghiệm trên ba bộ dữ liệu lớn đã chứng minh tính khả thi và hiệu quả của phương pháp, mở ra hướng ứng dụng rộng rãi trong nhiều lĩnh vực công nghiệp.
- Luận văn đề xuất các giải pháp triển khai cụ thể nhằm nâng cao hiệu quả quản lý chi phí di chuyển và khuyến nghị mở rộng ứng dụng kỹ thuật cải tiến vào các quy trình nghiệp vụ khác.
- Các bước tiếp theo bao gồm phát triển công cụ hỗ trợ tự động hóa dựa trên RILP, đào tạo nhân sự và nghiên cứu mở rộng các thuật toán cải tiến khác nhằm nâng cao hơn nữa hiệu quả khai thác quy trình.
Quý độc giả và các nhà nghiên cứu được khuyến khích áp dụng và phát triển thêm các kỹ thuật cải tiến khai thác quy trình để góp phần nâng cao hiệu quả quản lý và vận hành trong tổ chức của mình.