Tổng quan nghiên cứu

Trong bối cảnh cạnh tranh ngày càng gay gắt và sự phát triển nhanh chóng của khoa học kỹ thuật, nguồn nhân lực trở thành yếu tố sống còn đối với sự phát triển bền vững của doanh nghiệp. Tại Công ty Vissan, một trong những doanh nghiệp hàng đầu trong ngành thực phẩm, việc quản lý và duy trì nguồn nhân lực chất lượng cao là nhiệm vụ trọng yếu. Theo báo cáo thường niên năm 2021, tổng số lao động của công ty từ năm 2018 đến 2021 dao động quanh khoảng 4.179 người, trong đó có hơn 800 lao động nghỉ việc chỉ trong năm 2020, gây ảnh hưởng trực tiếp đến dây chuyền sản xuất và hoạt động kinh doanh.

Vấn đề nghỉ việc của người lao động không chỉ làm gián đoạn hoạt động sản xuất mà còn làm tăng chi phí tuyển dụng và đào tạo nhân sự mới. Do đó, việc phân tích dữ liệu hành vi người lao động để dự đoán khả năng nghỉ việc và đưa ra các quyết định nhân sự kịp thời là rất cần thiết. Mục tiêu nghiên cứu của luận văn là áp dụng các mô hình phân tích dữ liệu và thuật toán máy học nhằm dự báo chính xác các yếu tố ảnh hưởng đến quyết định nghỉ việc của người lao động tại Công ty Vissan trong giai đoạn 2014-2020.

Nghiên cứu tập trung vào việc khai thác dữ liệu nhân sự do Phòng Tổ chức Nhân sự (TCNS) cung cấp, sử dụng các mô hình như Kaplan-Meier, Cox Proportional Hazards (CoxPH), Hồi quy Logistic, Random Forest, K-Nearest Neighbors (KNN) và Support Vector Machine (SVM) để phân tích và dự báo. Kết quả nghiên cứu không chỉ giúp công ty có cái nhìn tổng quan về tình hình nhân sự mà còn hỗ trợ xây dựng các chính sách nhân sự hiệu quả, giảm thiểu tỷ lệ nghỉ việc và nâng cao năng suất lao động.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình phân tích dữ liệu nhân sự và học máy, bao gồm:

  • Phân tích sống còn (Survival Analysis): Đây là phương pháp thống kê dùng để ước lượng thời gian tồn tại của một sự kiện, trong trường hợp này là thời gian người lao động gắn bó với công ty trước khi nghỉ việc. Các khái niệm chính gồm hàm sinh tồn (Survival Function) và hàm rủi ro (Hazard Function). Mô hình Kaplan-Meier được sử dụng để ước tính xác suất sống sót theo thời gian, trong khi mô hình CoxPH giúp đánh giá tác động của các biến độc lập đến nguy cơ nghỉ việc.

  • Hồi quy Logistic (Logistic Regression): Mô hình này dùng để dự báo xác suất xảy ra sự kiện nhị phân, như nghỉ việc hay không nghỉ việc, dựa trên các biến độc lập. Hàm Sigmoid được sử dụng để chuyển đổi giá trị đầu ra thành xác suất trong khoảng 0 đến 1.

  • Thuật toán máy học: Bao gồm Random Forest, K-Nearest Neighbors (KNN) và Support Vector Machine (SVM). Random Forest là mô hình dựa trên tập hợp các cây quyết định, giúp cải thiện độ chính xác dự báo. KNN dựa trên nguyên tắc láng giềng gần nhất để phân loại, còn SVM tìm siêu phẳng tối ưu phân chia các lớp dữ liệu.

Các khái niệm chuyên ngành như Hazard Ratio (HR), Life Table, và các thuật ngữ về quản lý nguồn nhân lực cũng được áp dụng để phân tích sâu sắc hơn về hành vi nghỉ việc của người lao động.

Phương pháp nghiên cứu

Nguồn dữ liệu chính được sử dụng là tập dữ liệu nhân sự do Phòng TCNS Công ty Vissan cung cấp, bao gồm 11.947 bản ghi từ năm 2014 đến tháng 8 năm 2020 với 26 biến đặc trưng liên quan đến thông tin cá nhân, vị trí công việc, trình độ, thu nhập và trạng thái nghỉ việc. Trong đó, có khoảng 65% người lao động đã nghỉ việc tính đến cuối năm 2020.

Phương pháp nghiên cứu bao gồm:

  • Tiền xử lý dữ liệu: Làm sạch dữ liệu, xử lý giá trị thiếu, chuẩn hóa và số hóa các biến phân loại để phù hợp với các mô hình phân tích.

  • Phân tích mô tả và trực quan hóa: Sử dụng các biểu đồ và bảng thống kê để mô tả phân bố nhân sự, tỷ lệ nghỉ việc theo năm, tháng, trình độ chuyên môn và khu vực địa lý.

  • Áp dụng các mô hình phân tích: Thực hiện phân tích sống còn với Kaplan-Meier và CoxPH để đánh giá thời gian gắn bó và các yếu tố ảnh hưởng. Đồng thời, xây dựng các mô hình máy học Logistic Regression, Random Forest, KNN và SVM để dự đoán khả năng nghỉ việc.

  • Đánh giá mô hình: Sử dụng các chỉ số như độ chính xác (accuracy), ma trận nhầm lẫn (confusion matrix) và thời gian huấn luyện để so sánh hiệu quả các mô hình.

Quá trình nghiên cứu được thực hiện trong khoảng 6 tháng từ tháng 12/2020 đến tháng 5/2021 tại Phòng TCNS Công ty Vissan, với sự hỗ trợ kỹ thuật từ các chuyên gia và giảng viên hướng dẫn.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Tỷ lệ nghỉ việc cao và phân bố không đồng đều: Từ năm 2014 đến 2020, có 7.707 người lao động nghỉ việc, chiếm khoảng 65% tổng số lao động trong dữ liệu. Số lượng nghỉ việc cao nhất tập trung vào năm 2020 với hơn 800 người, sau đó có xu hướng giảm dần đến quý II năm 2021.

  2. Ảnh hưởng của trình độ chuyên môn và khu vực: Các nhóm trình độ có tỷ lệ nghỉ việc cao nhất là lao động phổ thông và trình độ cao đẳng, trong khi nhóm trình độ đại học có tỷ lệ nghỉ việc thấp hơn. Về mặt địa lý, tỷ lệ nghỉ việc phân bố không đồng đều giữa các khu vực, với một số tỉnh thuộc Đồng bằng sông Cửu Long có số lượng nghỉ việc cao nhất.

  3. Hiệu quả các mô hình dự báo: Mô hình Random Forest đạt độ chính xác cao nhất trong dự đoán nghỉ việc, với tỷ lệ chính xác trên 85%, vượt trội hơn so với KNN và SVM. Mô hình CoxPH cho thấy các biến như tuổi, thu nhập và thâm niên có ảnh hưởng đáng kể đến nguy cơ nghỉ việc, với Hazard Ratio (HR) của nhóm lao động trẻ và thu nhập thấp cao hơn 1.5 lần so với nhóm còn lại.

  4. Thời gian gắn bó trung bình: Phân tích Kaplan-Meier cho thấy xác suất sống sót (không nghỉ việc) giảm dần theo thời gian, với thời gian trung bình gắn bó của người lao động khoảng 3-4 năm trước khi có nguy cơ nghỉ việc tăng cao.

Thảo luận kết quả

Kết quả nghiên cứu phản ánh thực trạng nhân sự tại Công ty Vissan, nơi tỷ lệ nghỉ việc cao gây áp lực lớn lên hoạt động sản xuất kinh doanh. Nguyên nhân chính được xác định là do mức thu nhập chưa đáp ứng kỳ vọng, đặc biệt với lao động phổ thông và trình độ thấp, cũng như sự cạnh tranh từ thị trường lao động bên ngoài.

So sánh với các nghiên cứu trong ngành, kết quả phù hợp với xu hướng chung về ảnh hưởng của thu nhập và thâm niên đến quyết định nghỉ việc. Việc áp dụng mô hình Random Forest và CoxPH giúp công ty có công cụ dự báo chính xác, từ đó xây dựng các chính sách nhân sự phù hợp. Biểu đồ Kaplan-Meier và bảng Hazard Ratio có thể được sử dụng để trực quan hóa mức độ rủi ro nghỉ việc theo thời gian và các yếu tố tác động, hỗ trợ việc ra quyết định kịp thời.

Ngoài ra, việc phân tích phân bố nghỉ việc theo khu vực và trình độ giúp công ty xác định các điểm nóng cần tập trung tuyển dụng và đào tạo, đồng thời điều chỉnh chính sách đãi ngộ phù hợp với từng nhóm lao động.

Đề xuất và khuyến nghị

  1. Xây dựng hệ thống cảnh báo sớm dựa trên mô hình dự báo: Áp dụng mô hình Random Forest và CoxPH để phát triển hệ thống cảnh báo nhân sự có nguy cơ nghỉ việc cao, giúp Phòng TCNS chủ động trong việc tuyển dụng và đào tạo bổ sung. Thời gian triển khai dự kiến trong 6 tháng, do bộ phận IT và TCNS phối hợp thực hiện.

  2. Điều chỉnh chính sách tiền lương và đãi ngộ: Tăng cường chính sách lương thưởng linh hoạt, đặc biệt cho nhóm lao động phổ thông và trình độ thấp, nhằm giảm tỷ lệ nghỉ việc. Đề xuất xây dựng thang lương theo năng lực và hiệu quả công việc, áp dụng trong vòng 1 năm.

  3. Đào tạo và phát triển nhân sự: Tổ chức các chương trình đào tạo nâng cao kỹ năng và kiến thức cho người lao động, đặc biệt là nhóm có nguy cơ nghỉ việc cao, nhằm tăng sự gắn bó và năng suất lao động. Thời gian thực hiện liên tục, đánh giá hiệu quả hàng quý.

  4. Chuẩn hóa và đồng bộ dữ liệu nhân sự: Rà soát, làm sạch và chuẩn hóa dữ liệu nhân sự, xây dựng quy trình cập nhật dữ liệu thống nhất để đảm bảo tính chính xác và nhất quán cho các phân tích trong tương lai. Thời gian hoàn thành trong 3 tháng, do Phòng TCNS chủ trì.

  5. Tăng cường truyền thông và xây dựng môi trường làm việc thân thiện: Tạo kênh giao tiếp hiệu quả giữa người lao động và quản lý, tổ chức các hoạt động gắn kết nhằm nâng cao tinh thần làm việc và giảm thiểu sự bất mãn. Thực hiện liên tục, đánh giá tác động hàng năm.

Đối tượng nên tham khảo luận văn

  1. Phòng Tổ chức Nhân sự (TCNS) các doanh nghiệp sản xuất: Luận văn cung cấp phương pháp và công cụ phân tích dữ liệu nhân sự giúp dự báo nghỉ việc, hỗ trợ xây dựng chính sách nhân sự hiệu quả.

  2. Các nhà quản lý và lãnh đạo doanh nghiệp: Giúp hiểu rõ hơn về các yếu tố ảnh hưởng đến sự gắn bó của người lao động, từ đó đưa ra quyết định chiến lược về tuyển dụng, đào tạo và giữ chân nhân sự.

  3. Chuyên gia phân tích dữ liệu và khoa học máy tính: Cung cấp ví dụ thực tiễn về ứng dụng các mô hình học máy và phân tích sống còn trong lĩnh vực quản trị nhân sự, mở rộng kiến thức và kỹ năng ứng dụng.

  4. Sinh viên và nghiên cứu sinh ngành Quản trị nhân lực, Khoa học máy tính: Tài liệu tham khảo quý giá cho các đề tài nghiên cứu liên quan đến phân tích dữ liệu nhân sự và ứng dụng machine learning trong quản trị doanh nghiệp.

Câu hỏi thường gặp

  1. Tại sao cần phân tích dữ liệu hành vi người lao động để dự báo nghỉ việc?
    Phân tích dữ liệu giúp nhận diện các yếu tố ảnh hưởng đến quyết định nghỉ việc, từ đó dự báo chính xác và kịp thời để doanh nghiệp có kế hoạch tuyển dụng và giữ chân nhân sự, giảm thiểu gián đoạn sản xuất.

  2. Mô hình nào cho kết quả dự báo nghỉ việc chính xác nhất?
    Trong nghiên cứu, mô hình Random Forest cho độ chính xác dự báo trên 85%, vượt trội hơn so với KNN và SVM, nhờ khả năng xử lý dữ liệu phức tạp và đa chiều hiệu quả.

  3. Dữ liệu nhân sự cần chuẩn bị những thông tin gì để phân tích?
    Các thông tin cơ bản gồm tuổi, giới tính, trình độ học vấn, vị trí công việc, thu nhập, thâm niên làm việc, trạng thái nghỉ việc và các chỉ số đánh giá năng lực, thái độ làm việc.

  4. Phân tích sống còn giúp ích gì trong quản lý nhân sự?
    Phân tích sống còn ước lượng thời gian gắn bó của người lao động với công ty, giúp đánh giá nguy cơ nghỉ việc theo thời gian và các yếu tố tác động, hỗ trợ xây dựng chính sách giữ chân nhân sự hiệu quả.

  5. Làm thế nào để áp dụng kết quả nghiên cứu vào thực tiễn doanh nghiệp?
    Doanh nghiệp cần xây dựng hệ thống cảnh báo dựa trên mô hình dự báo, điều chỉnh chính sách tiền lương, đào tạo nhân sự, đồng bộ dữ liệu và tăng cường môi trường làm việc để giảm tỷ lệ nghỉ việc và nâng cao hiệu quả quản lý nhân sự.

Kết luận

  • Luận văn đã áp dụng thành công các mô hình phân tích sống còn và học máy để dự báo hành vi nghỉ việc của người lao động tại Công ty Vissan, với dữ liệu từ 2014 đến 2020.
  • Kết quả cho thấy tỷ lệ nghỉ việc cao, tập trung ở nhóm lao động phổ thông và trình độ thấp, ảnh hưởng lớn đến hoạt động sản xuất kinh doanh.
  • Mô hình Random Forest và CoxPH được đánh giá là hiệu quả nhất trong việc dự báo và phân tích các yếu tố tác động đến quyết định nghỉ việc.
  • Đề xuất các giải pháp cụ thể về chính sách tiền lương, đào tạo, chuẩn hóa dữ liệu và xây dựng hệ thống cảnh báo nhằm giảm thiểu tỷ lệ nghỉ việc.
  • Các bước tiếp theo bao gồm triển khai hệ thống dự báo, hoàn thiện quy trình quản lý dữ liệu và đánh giá hiệu quả các chính sách nhân sự trong vòng 6-12 tháng tới.

Hành động ngay hôm nay: Các phòng ban liên quan cần phối hợp triển khai các giải pháp đề xuất để đảm bảo nguồn nhân lực ổn định, góp phần nâng cao năng suất và phát triển bền vững cho Công ty Vissan.