## Tổng quan nghiên cứu
Trong bối cảnh ngành mỹ phẩm tại Việt Nam đang phát triển mạnh mẽ với sự cạnh tranh ngày càng gay gắt, việc quản lý và phân tích dữ liệu kinh doanh trở thành yếu tố then chốt giúp doanh nghiệp nâng cao hiệu quả hoạt động. Theo ước tính, các công ty mỹ phẩm tại TP. Hồ Chí Minh đang phải xử lý lượng dữ liệu lớn từ nhiều nguồn khác nhau, gây khó khăn trong việc tổng hợp và phân tích kịp thời. Vấn đề nghiên cứu tập trung vào việc xây dựng hệ thống Data Warehouse (DW) và Business Intelligence (BI) nhằm tập trung hóa dữ liệu từ các hệ thống khác nhau như bán hàng, kho và khiếu nại khách hàng, giúp cải thiện quy trình ra quyết định nhanh chóng và chính xác.
Mục tiêu cụ thể của luận văn là khảo sát thực trạng hệ thống CNTT và quy trình nghiệp vụ của một công ty mỹ phẩm tại TP. Hồ Chí Minh, từ đó thiết kế và triển khai hệ thống DW và BI phù hợp với nhu cầu thực tế. Phạm vi nghiên cứu tập trung vào dữ liệu phát sinh trong năm 2021, tại một công ty mỹ phẩm có quy mô vừa và lớn tại TP. Hồ Chí Minh. Ý nghĩa nghiên cứu được thể hiện qua việc giảm thiểu thời gian xử lý báo cáo, nâng cao độ chính xác dữ liệu và hỗ trợ các phòng ban trong việc phân tích, từ đó tăng hiệu quả kinh doanh và năng lực cạnh tranh của doanh nghiệp.
## Cơ sở lý thuyết và phương pháp nghiên cứu
### Khung lý thuyết áp dụng
Luận văn dựa trên hai lý thuyết chính: Data Warehouse và Business Intelligence.
- **Data Warehouse** là hệ thống lưu trữ dữ liệu tập trung, tích hợp dữ liệu từ nhiều nguồn khác nhau, có tính chất lịch sử, không thay đổi và hỗ trợ truy vấn phân tích. Các đặc tính quan trọng gồm tính tích hợp, chủ đề hướng đối tượng, tính lịch sử và tính bất biến.
- **Business Intelligence** là tập hợp các công cụ và quy trình giúp tổ chức phân tích dữ liệu kinh doanh, tạo ra các báo cáo, dashboard trực quan nhằm hỗ trợ ra quyết định hiệu quả.
Các khái niệm chuyên ngành được sử dụng bao gồm: OLTP (Online Transaction Processing), OLAP (Online Analytical Processing), ETL (Extract, Transform, Load), Data Mart, Metadata, và các mô hình dữ liệu như Star Schema và Snowflake Schema.
### Phương pháp nghiên cứu
Nguồn dữ liệu chính được thu thập từ hệ thống CNTT và các quy trình nghiệp vụ của công ty mỹ phẩm tại TP. Hồ Chí Minh, bao gồm dữ liệu bán hàng, kho và khiếu nại khách hàng trong năm 2021. Phương pháp phân tích sử dụng mô hình thiết kế Data Warehouse theo kiến trúc Staging Area, Data Mart và hệ thống BI trên nền tảng Microsoft SQL Server và Power BI.
Quy trình nghiên cứu được thực hiện từ tháng 9 đến tháng 12 năm 2021, bao gồm khảo sát thực trạng, thu thập yêu cầu, thiết kế mô hình dữ liệu, xây dựng hệ thống ETL, triển khai Data Mart và phát triển dashboard BI. Cỡ mẫu dữ liệu được lựa chọn đảm bảo tính đại diện cho các phân hệ nghiệp vụ chính, với phương pháp chọn mẫu ngẫu nhiên từ các bảng giao dịch thực tế.
## Kết quả nghiên cứu và thảo luận
### Những phát hiện chính
- Hệ thống CNTT hiện tại của công ty sử dụng nhiều phần mềm và cơ sở dữ liệu khác nhau, dẫn đến dữ liệu phân tán và không đồng nhất, gây khó khăn trong việc tổng hợp báo cáo. Khoảng 70% báo cáo được xử lý thủ công qua Excel, mất nhiều thời gian và dễ phát sinh sai sót.
- Sau khi triển khai hệ thống Data Warehouse và Business Intelligence, thời gian tạo báo cáo giảm khoảng 50%, đồng thời độ chính xác dữ liệu được cải thiện rõ rệt nhờ quy trình ETL chuẩn hóa và làm sạch dữ liệu.
- Mô hình Data Mart được xây dựng cho ba phân hệ chính: bán hàng, kho và khiếu nại khách hàng, giúp phân tích dữ liệu theo nhiều chiều như thời gian, sản phẩm, khách hàng, vùng miền và kênh bán hàng. Ví dụ, doanh thu bán hàng theo từng kênh tăng khả năng phân tích chi tiết và hỗ trợ chiến lược marketing hiệu quả hơn.
- Hệ thống BI với dashboard trực quan trên Power BI giúp các phòng ban dễ dàng theo dõi số liệu cập nhật theo thời gian thực, nâng cao hiệu quả ra quyết định và giảm thiểu rủi ro trong kinh doanh.
### Thảo luận kết quả
Nguyên nhân chính của các vấn đề trước đây là do dữ liệu phân tán, thiếu chuẩn hóa và quy trình báo cáo thủ công. Việc áp dụng mô hình Data Warehouse tập trung hóa dữ liệu từ nhiều nguồn giúp giải quyết triệt để vấn đề này. So sánh với các nghiên cứu trong ngành, kết quả cho thấy việc xây dựng DW và BI không chỉ nâng cao hiệu quả quản lý dữ liệu mà còn giúp doanh nghiệp tăng khả năng cạnh tranh trên thị trường.
Dữ liệu có thể được trình bày qua các biểu đồ cột thể hiện doanh thu theo tháng, biểu đồ tròn phân bổ khiếu nại theo loại sản phẩm, và bảng tổng hợp số lượng tồn kho theo từng kho. Các báo cáo này giúp lãnh đạo và các phòng ban có cái nhìn tổng quan và chi tiết về hoạt động kinh doanh.
## Đề xuất và khuyến nghị
- **Triển khai mở rộng hệ thống Data Warehouse** cho các phân hệ khác như mua hàng, nhân sự nhằm tăng tính toàn diện của hệ thống dữ liệu, dự kiến hoàn thành trong 12 tháng tới, do phòng CNTT chủ trì.
- **Đào tạo nhân viên sử dụng BI và Power BI** để nâng cao kỹ năng phân tích dữ liệu, giảm phụ thuộc vào báo cáo thủ công, thực hiện trong 6 tháng, do phòng nhân sự phối hợp với phòng CNTT.
- **Tối ưu hóa quy trình ETL** nhằm đảm bảo dữ liệu được cập nhật nhanh chóng và chính xác, giảm thiểu lỗi dữ liệu, thực hiện liên tục với đánh giá định kỳ hàng quý.
- **Xây dựng chính sách bảo mật và quản lý dữ liệu** nhằm bảo vệ an toàn thông tin, tuân thủ các quy định pháp luật về bảo vệ dữ liệu cá nhân, do phòng pháp chế và CNTT phối hợp thực hiện.
- **Phát triển các báo cáo phân tích nâng cao** dựa trên AI và Machine Learning để dự báo xu hướng thị trường và hành vi khách hàng, kế hoạch triển khai trong 18 tháng tới.
## Đối tượng nên tham khảo luận văn
- **Các nhà quản lý doanh nghiệp mỹ phẩm**: Nắm bắt được cách thức xây dựng hệ thống quản lý dữ liệu tập trung, nâng cao hiệu quả ra quyết định.
- **Chuyên viên CNTT và phân tích dữ liệu**: Học hỏi quy trình thiết kế và triển khai Data Warehouse, BI trong môi trường doanh nghiệp thực tế.
- **Sinh viên và nghiên cứu sinh ngành công nghệ thông tin, quản trị kinh doanh**: Tham khảo mô hình nghiên cứu ứng dụng thực tiễn, phương pháp phân tích dữ liệu.
- **Các công ty trong ngành bán lẻ và sản xuất**: Áp dụng mô hình DW và BI để cải thiện quản lý dữ liệu và tối ưu hóa hoạt động kinh doanh.
## Câu hỏi thường gặp
1. **Data Warehouse là gì và tại sao cần thiết cho doanh nghiệp mỹ phẩm?**
Data Warehouse là hệ thống lưu trữ dữ liệu tập trung, giúp tích hợp và chuẩn hóa dữ liệu từ nhiều nguồn khác nhau. Nó cần thiết để doanh nghiệp mỹ phẩm có thể phân tích dữ liệu nhanh chóng, chính xác, hỗ trợ ra quyết định hiệu quả.
2. **Business Intelligence khác gì so với Data Warehouse?**
Data Warehouse tập trung vào lưu trữ và quản lý dữ liệu, trong khi Business Intelligence là công cụ và quy trình phân tích dữ liệu, tạo báo cáo và dashboard trực quan để hỗ trợ người dùng cuối.
3. **Quy trình ETL gồm những bước nào?**
ETL gồm ba bước chính: Extract (trích xuất dữ liệu từ nguồn), Transform (biến đổi và làm sạch dữ liệu), Load (tải dữ liệu vào kho dữ liệu). Quy trình này đảm bảo dữ liệu được chuẩn hóa và sẵn sàng cho phân tích.
4. **Làm thế nào để đảm bảo dữ liệu trong DW luôn chính xác và cập nhật?**
Bằng cách thiết kế quy trình ETL hiệu quả, kiểm tra và làm sạch dữ liệu định kỳ, đồng thời áp dụng các công cụ giám sát và cảnh báo lỗi dữ liệu.
5. **Power BI hỗ trợ gì trong việc phân tích dữ liệu?**
Power BI cung cấp giao diện trực quan, dễ sử dụng để tạo dashboard và báo cáo động, hỗ trợ phân tích đa chiều, giúp người dùng nhanh chóng nắm bắt thông tin và đưa ra quyết định kịp thời.
## Kết luận
- Đã xây dựng thành công hệ thống Data Warehouse và Business Intelligence cho công ty mỹ phẩm tại TP. Hồ Chí Minh, tập trung vào ba phân hệ bán hàng, kho và khiếu nại khách hàng.
- Hệ thống giúp tập trung hóa dữ liệu từ nhiều nguồn, chuẩn hóa và làm sạch dữ liệu, giảm thời gian xử lý báo cáo khoảng 50%.
- Mô hình Data Mart và dashboard BI hỗ trợ phân tích đa chiều, nâng cao hiệu quả quản lý và ra quyết định.
- Đề xuất mở rộng hệ thống, đào tạo nhân viên và tối ưu quy trình ETL để phát huy tối đa lợi ích của hệ thống.
- Khuyến khích các doanh nghiệp trong ngành mỹ phẩm và bán lẻ áp dụng mô hình này để nâng cao năng lực cạnh tranh trong thời đại công nghiệp 4.0.
Hành động tiếp theo là triển khai các đề xuất mở rộng và đào tạo, đồng thời theo dõi hiệu quả ứng dụng hệ thống trong thực tế để điều chỉnh kịp thời.