Đề tài nghiên cứu mô hình dự đoán giá sản phẩm theo mùa dựa trên bộ dữ liệu về quà tặng giáng sinh thông qua nền tảng azure machine learning studio

Chuyên khảo phân tích Đề tài nghiên cứu mô hình dự đoán giá sản phẩm theo mùa dựa trên bộ dữ liệu về quà tặng giáng sinh, đánh giá các khía cạnh quan trọng, đề xuất hướng nghiên

Trường đại học

Trường Đại Học Công Nghệ Thông Tin

Chuyên ngành

Khoa Học Dữ Liệu

Người đăng

Ẩn danh

Thể loại

Đồ Án Tốt Nghiệp

2023

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU

1.1. Lý do chọn đề tài

1.2. Mục tiêu nghiên cứu

1.2.1. Mục tiêu nghiên cứu chung

1.2.2. Mục tiêu nghiên cứu cụ thể

1.3. Câu hỏi nghiên cứu

1.4. Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu

1.4.2. Phạm vi nghiên cứu

1.5. Phương pháp nghiên cứu

1.5.1. Nghiên cứu sơ bộ

1.5.2. Nghiên cứu chính thức

1.6. Ý nghĩa đề tài nghiên cứu

1.6.1. Ý nghĩa khoa học

1.6.2. Ý nghĩa thực tiễn

2. CHƯƠNG 2: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU

2.1. Mục tiêu nghiên cứu

2.2. Phương pháp nghiên cứu

2.3. Đề xuất mô hình nghiên cứu

3. CHƯƠNG 3: DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

3.1. Thiết kế nghiên cứu

3.2. Thu thập dữ liệu

3.3. Xử lý dữ liệu

3.4. Phương pháp nghiên cứu trên nền tảng Azure Machine Learning Studio

3.5. Phương pháp dự đoán

3.5.1. Linear Regression

3.5.2. Support Vector Regression

3.5.3. Random Forest Regression

3.6. Quy trình đưa ra kết quả dự đoán

4. CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU

4.1. Mô tả mối quan hệ giữa biến độc lập và biến phụ thuộc

4.2. Quy trình xây dựng phương pháp dự đoán

4.3. Phương pháp thống kê

4.4. Đánh giá và lựa chọn mô hình dự đoán

4.5. Triển khai dự đoán và thử nghiệm

5. CHƯƠNG 5: KẾT LUẬN VÀ HẠN CHẾ

5.1. Hạn chế và hướng nghiên cứu trong tương lai

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Khám phá mô hình dự đoán giá sản phẩm Giáng Sinh hiệu quả

Trong kỷ nguyên số, dữ liệu được xem là tài sản chiến lược của doanh nghiệp. Khả năng phân tích và khai thác dữ liệu lớn giúp tối ưu hóa vận hành và đưa ra quyết định kinh doanh chính xác. Một trong những ứng dụng quan trọng nhất là học máy dự đoán giá, đặc biệt đối với các sản phẩm mang tính thời vụ như quà tặng Giáng Sinh. Việc định giá chính xác trong giai đoạn này có thể ảnh hưởng trực tiếp đến doanh thu, lợi nhuận và sự hài lòng của khách hàng. Bài viết này trình bày một nghiên cứu ứng dụng, tập trung vào việc xây dựng và đánh giá các mô hình dự đoán giá sản phẩm theo mùa, cụ thể là mặt hàng quà tặng Giáng Sinh. Nghiên cứu sử dụng nền tảng Azure Machine Learning Studio, một công cụ mạnh mẽ của Microsoft Azure AI, để xử lý, huấn luyện và triển khai mô hình. Mục tiêu chính là đề xuất một phương pháp khoa học, dựa trên dữ liệu, giúp doanh nghiệp thiết lập chiến lược giá mùa lễ hội một cách chủ động và hiệu quả. Quá trình nghiên cứu bao gồm các bước từ thu thập dữ liệu, tiền xử lý dữ liệu, lựa chọn thuật toán, huấn luyện mô hình cho đến đánh giá độ chính xác mô hình. Kết quả không chỉ cung cấp một cái nhìn sâu sắc về các yếu tố ảnh hưởng đến giá mà còn mang lại một công cụ thực tiễn để hỗ trợ việc ra quyết định. Nghiên cứu này kiểm định và mở rộng các phát hiện từ nghiên cứu của Mohamed và cộng sự (2022), chứng minh tính khả thi của việc áp dụng khoa học dữ liệu ứng dụng vào lĩnh vực bán lẻ và thương mại điện tử. Nó cung cấp một lộ trình rõ ràng cho các doanh nghiệp muốn chuyển đổi từ định giá theo cảm tính sang định giá dựa trên phân tích dự báo.

1.1. Tầm quan trọng của khoa học dữ liệu ứng dụng trong bán lẻ

Ngành bán lẻ, đặc biệt là thương mại điện tử, đang đối mặt với sự cạnh tranh khốc liệt. Việc ứng dụng khoa học dữ liệu không còn là một lựa chọn mà đã trở thành yếu tố sống còn. Phân tích dữ liệu giúp doanh nghiệp hiểu rõ hành vi khách hàng, dự báo nhu cầu thị trường, và quan trọng nhất là thực hiện định giá sản phẩm động. Thay vì áp dụng một mức giá cố định, doanh nghiệp có thể điều chỉnh giá linh hoạt dựa trên các yếu tố như thời điểm, nhu cầu, lượng hàng tồn kho và giá của đối thủ cạnh tranh, từ đó tối đa hóa lợi nhuận.

1.2. Mục tiêu của mô hình nghiên cứu dự đoán giá sản phẩm

Nghiên cứu này đặt ra bốn mục tiêu cụ thể: (1) Kiểm tra và đề xuất các phương pháp học máy và thống kê phù hợp để dự báo giá sản phẩm theo mùa. (2) So sánh hiệu suất giữa các phương pháp để xác định mô hình tối ưu. (3) Đánh giá các mô hình được đề xuất dựa trên các thước đo hiệu suất chuẩn như MAE và RMSE. (4) Đưa ra kết luận về mô hình phù hợp nhất và đề xuất các hàm ý quản trị, giúp doanh nghiệp xây dựng chiến lược bán hàng và quản lý tồn kho hiệu quả hơn.

II. Thách thức định giá sản phẩm động trong mùa lễ hội cao điểm

Mùa Giáng Sinh là thời điểm mua sắm sôi động nhất trong năm, nhưng cũng đặt ra nhiều thách thức cho các nhà bán lẻ. Nhu cầu thị trường tăng đột biến có thể dẫn đến tình trạng mất cân bằng cung cầu. Nếu không có một chiến lược giá mùa lễ hội hợp lý, doanh nghiệp có thể bỏ lỡ cơ hội doanh thu hoặc đối mặt với rủi ro tồn kho lớn sau mùa vụ. Các phương pháp định giá truyền thống dựa trên kinh nghiệm hoặc chi phí thường không đủ linh hoạt để phản ứng với những biến động nhanh chóng của thị trường. Việc đặt giá quá cao có thể làm mất khách hàng vào tay đối thủ, trong khi đặt giá quá thấp lại làm giảm lợi nhuận. Vấn đề cốt lõi nằm ở việc làm sao để xác định được mức giá tối ưu tại mỗi thời điểm. Điều này đòi hỏi một sự hiểu biết sâu sắc về các yếu tố ảnh hưởng đến quyết định mua hàng của người tiêu dùng và khả năng dự báo chính xác xu hướng giá. Bài toán dự báo chuỗi thời gian trở nên phức tạp hơn với dữ liệu theo mùa, vốn chứa đựng các yếu tố chu kỳ và xu hướng không ổn định. Nghiên cứu này giải quyết trực tiếp thách thức đó bằng cách tiếp cận dựa trên phân tích dữ liệu bán hàng lịch sử, từ đó xây dựng một mô hình hồi quy có khả năng học hỏi các quy luật ngầm và đưa ra dự báo đáng tin cậy. Mục tiêu là cung cấp một công cụ giúp người bán xác định thời điểm giá sản phẩm có khả năng tăng hoặc giảm, từ đó chủ động xây dựng chiến lược tối ưu hóa giá bán.

2.1. Phân tích các yếu tố ảnh hưởng đến giá bán sản phẩm

Giá của một sản phẩm quà tặng Giáng Sinh không chỉ phụ thuộc vào chi phí sản xuất. Nó bị ảnh hưởng bởi một tổ hợp nhiều biến số như: loại quà tặng (gift_type), danh mục sản phẩm (gift_category), ngành hàng (gift_cluster), và ngày nhập kho (instock_date). Nghiên cứu chỉ ra rằng các yếu tố này có mức độ tác động khác nhau. Việc xác định và lượng hóa các mối quan hệ này thông qua feature engineering là bước đầu tiên và quan trọng nhất để xây dựng một mô hình dự báo chính xác.

2.2. Hạn chế của các phương pháp định giá truyền thống

Các phương pháp truyền thống như định giá cộng chi phí (cost-plus pricing) hay định giá theo đối thủ cạnh tranh (competitor-based pricing) thường mang tính bị động và thiếu cơ sở khoa học. Chúng không tính đến sự biến động của nhu cầu, các yếu tố tâm lý của người mua, hay các xu hướng vi mô trên thị trường. Điều này dẫn đến việc bỏ lỡ cơ hội tối ưu hóa giá bán và không thể thích ứng kịp thời với các thay đổi đột ngột, đặc biệt trong các mùa cao điểm như Giáng Sinh.

III. Hướng dẫn quy trình nghiên cứu giá qua Azure Machine Learning

Để xây dựng một mô hình dự báo đáng tin cậy, một quy trình nghiên cứu có cấu trúc là điều bắt buộc. Nghiên cứu này áp dụng một quy trình 5 giai đoạn được thực hiện hoàn toàn trên nền tảng Azure Machine Learning Studio. Giai đoạn đầu tiên là thu thập và tiền xử lý dữ liệu. Dữ liệu thô từ Kaggle được làm sạch, các biến không liên quan bị loại bỏ và các biến quan trọng được lựa chọn thông qua kỹ thuật feature engineering. Giai đoạn thứ hai là thiết kế mô hình, nơi các thuật toán machine learning tiềm năng được xác định. Giai đoạn ba là huấn luyện mô hình. Tại đây, bộ dữ liệu được chia theo tỷ lệ 80:20, với 80% dùng để huấn luyện và 20% để kiểm tra. Các mô hình được huấn luyện trên tập dữ liệu 80% này. Giai đoạn bốn là kiểm tra và đánh giá hiệu suất. Mô hình đã huấn luyện được áp dụng trên 20% dữ liệu còn lại (dữ liệu mà mô hình chưa từng thấy) để đánh giá độ chính xác mô hình một cách khách quan thông qua các chỉ số như MAE, RMSE, và R-squared. Cuối cùng, giai đoạn năm là triển khai mô hình AI. Mô hình có hiệu suất tốt nhất sẽ được triển khai dưới dạng một web service, sẵn sàng tích hợp vào các ứng dụng kinh doanh để cung cấp dự đoán giá theo thời gian thực. Việc sử dụng Azure ML Studio giúp đơn giản hóa toàn bộ quy trình phức tạp này nhờ giao diện kéo-thả trực quan, cho phép các nhà nghiên cứu và phân tích tập trung vào logic mô hình thay vì các chi tiết kỹ thuật phức tạp về hạ tầng.

3.1. Nền tảng Microsoft Azure AI và các tính năng của Azure ML Studio

Microsoft Azure AI là một bộ sưu tập các dịch vụ AI và học máy trên nền tảng đám mây. Trong đó, Azure ML Studio là một công cụ nổi bật, cung cấp một không gian làm việc hợp nhất để xây dựng, huấn luyện và triển khai các mô hình học máy. Nó hỗ trợ cả giao diện trực quan (designer) và môi trường viết mã (notebooks), tích hợp sẵn nhiều thuật toán phổ biến, và cho phép quản lý toàn bộ vòng đời của một dự án Machine Learning từ dữ liệu đầu vào đến sản phẩm cuối cùng.

3.2. Quy trình thu thập và tiền xử lý dữ liệu Preprocessing

Dữ liệu được sử dụng trong nghiên cứu là bộ “Christmas GIft Price Prediction” từ Kaggle, ghi nhận từ tháng 2/2014 đến 11/2016. Quá trình tiền xử lý dữ liệu bao gồm việc loại bỏ các biến không cần thiết như ID sản phẩm (gift_id) hay các biến ngày tháng không phù hợp với mô hình hồi quy. Các biến quan trọng như loại quà tặng, danh mục, ngành hàng và 6 biến ẩn danh (lsg_1 đến lsg_6) được giữ lại để làm đầu vào cho mô hình. Bước này đảm bảo dữ liệu đầu vào sạch và phù hợp, là nền tảng cho một mô hình dự báo chính xác.

IV. So sánh các thuật toán machine learning dự báo chuỗi thời gian

Việc lựa chọn đúng thuật toán machine learning là yếu tố quyết định đến sự thành công của mô hình. Nghiên cứu này đã tiến hành thử nghiệm và so sánh hiệu suất của năm mô hình khác nhau, bao gồm bốn mô hình hồi quy thuộc phương pháp học máy và một mô hình thống kê. Các mô hình học máy bao gồm: Linear Regression (Hồi quy tuyến tính), Ridge Regression, Support Vector Regression (SVR), và Random Forest Regression. Mỗi thuật toán có một cách tiếp cận khác nhau để tìm ra mối quan hệ giữa các biến đầu vào và biến giá mục tiêu. Bên cạnh đó, mô hình thống kê ARIMA (Autoregressive Integrated Moving Average) cũng được đưa vào so sánh. Đây là một phương pháp kinh điển trong dự báo chuỗi thời gian, đặc biệt hiệu quả với dữ liệu theo mùa. Để đảm bảo một sự so sánh công bằng, tất cả các mô hình đều được huấn luyện trên cùng một tập dữ liệu (80%) và được đánh giá trên cùng một tập kiểm tra (20%). Việc đánh giá độ chính xác mô hình được thực hiện dựa trên một bộ chỉ số thống nhất, bao gồm Sai số tuyệt đối trung bình (MAE), Lỗi bình phương trung bình (RMSE), Phần trăm sai số tuyệt đối trung bình (MAPE) và hệ số xác định R-squared (R2). Quá trình so sánh này không chỉ tìm ra mô hình hoạt động tốt nhất cho bài toán cụ thể này mà còn cung cấp những hiểu biết giá trị về điểm mạnh và điểm yếu của từng thuật toán khi xử lý dữ liệu bán lẻ theo mùa.

4.1. Phân tích các mô hình hồi quy Linear Ridge SVR Random Forest

Bốn mô hình hồi quy được lựa chọn đại diện cho các cách tiếp cận khác nhau. Linear và Ridge Regression là các mô hình tuyến tính, đơn giản nhưng hiệu quả. SVR là một mô hình mạnh mẽ dựa trên máy vector hỗ trợ, có khả năng xử lý các mối quan hệ phi tuyến tính. Random Forest là một thuật toán học tập tổng hợp (ensemble learning), kết hợp nhiều cây quyết định để tạo ra một dự đoán ổn định và chính xác hơn, đồng thời giảm thiểu nguy cơ quá khớp (overfitting).

4.2. Ứng dụng mô hình ARIMA cho dữ liệu theo mùa

Mô hình ARIMA được thiết kế đặc biệt cho time-series forecasting. Nó phân tích các xu hướng (trend), tính thời vụ (seasonality) và các thành phần nhiễu trong dữ liệu quá khứ để đưa ra dự báo cho tương lai. Trong nghiên cứu này, biến instock_date được sử dụng làm chuỗi thời gian đầu vào cho ARIMA. Việc so sánh hiệu suất của ARIMA với các mô hình hồi quy khác giúp xác định phương pháp nào phù hợp hơn với đặc thù của bộ dữ liệu quà tặng Giáng Sinh.

V. Kết quả triển khai mô hình AI và tối ưu hóa giá bán hiệu quả

Sau quá trình huấn luyện và đánh giá nghiêm ngặt, kết quả nghiên cứu đã chỉ ra một cách rõ ràng mô hình vượt trội nhất. Dựa trên các chỉ số đánh giá, mô hình Random Forest Regression đã cho thấy hiệu suất dự đoán tốt nhất. Cụ thể, mô hình này đạt được chỉ số MAE là 41.16 và RMSE là 159.74, thấp nhất so với bốn mô hình còn lại. Điều này cho thấy sai lệch trung bình giữa giá dự đoán và giá thực tế là nhỏ nhất. Đồng thời, chỉ số R-squared đạt 0.674, nghĩa là mô hình có thể giải thích được khoảng 67.4% sự biến động của giá sản phẩm, một con số đáng tin cậy. Kết quả này tương đồng với nghiên cứu của Mohamed và cộng sự (2022), củng cố thêm độ tin cậy của phát hiện. Sự thành công của Random Forest đến từ khả năng xử lý các mối quan hệ phức tạp và phi tuyến tính giữa nhiều biến đầu vào. Sau khi xác định được mô hình tốt nhất, bước tiếp theo là triển khai mô hình AI thành một dịch vụ web (web service) trên Azure Machine Learning. Dịch vụ này cho phép các ứng dụng khác gửi yêu cầu với thông tin của một sản phẩm mới và nhận lại kết quả dự đoán giá gần như ngay lập tức. Thử nghiệm thực tế cho thấy, với một bộ thông số đầu vào cụ thể, mô hình có thể dự đoán mức giá là 165.75, cung cấp một cơ sở vững chắc cho việc tối ưu hóa giá bán và đưa ra các quyết định kinh doanh dựa trên dữ liệu.

5.1. Mô hình Random Forest Regression cho kết quả vượt trội

Random Forest là một tập hợp của nhiều cây quyết định. Mỗi cây được huấn luyện trên một mẫu dữ liệu ngẫu nhiên và đưa ra một dự đoán riêng. Kết quả cuối cùng là trung bình của tất cả các dự đoán từ các cây. Phương pháp này giúp mô hình trở nên mạnh mẽ, ổn định và ít bị ảnh hưởng bởi nhiễu trong dữ liệu. Biểu đồ so sánh giá thực tế và giá dự đoán từ mô hình Random Forest cho thấy hai đường có độ trùng khớp cao, minh chứng cho khả năng dự báo chính xác của mô hình.

5.2. Hướng dẫn triển khai dự đoán và thử nghiệm thực tế

Trên Azure ML Studio, việc triển khai mô hình AI được thực hiện chỉ với vài cú nhấp chuột. Sau khi huấn luyện, mô hình được chuyển đổi thành một "Predictive Web Service". Dịch vụ này tạo ra một điểm cuối API (API endpoint). Doanh nghiệp có thể tích hợp API này vào hệ thống quản lý bán hàng hoặc trang web thương mại điện tử của mình. Khi cần định giá một sản phẩm mới, hệ thống sẽ tự động gửi thông tin sản phẩm đến API và nhận lại mức giá đề xuất từ mô hình.

VI. Kết luận và hàm ý quản trị từ mô hình dự đoán giá sản phẩm

Nghiên cứu đã chứng minh thành công việc áp dụng học máy để xây dựng một mô hình dự đoán giá sản phẩm Giáng Sinh với độ chính xác cao. Mô hình Random Forest Regression, được triển khai trên nền tảng Azure Machine Learning, đã cho thấy hiệu suất vượt trội, cung cấp một công cụ mạnh mẽ và đáng tin cậy cho các nhà bán lẻ. Kết quả này không chỉ mang ý nghĩa khoa học mà còn có những hàm ý quản trị sâu sắc. Doanh nghiệp có thể tận dụng mô hình này để chuyển đổi từ việc định giá bị động sang chủ động, xây dựng các chiến lược giá mùa lễ hội thông minh và linh hoạt. Việc dự báo nhu cầu thị trường và giá cả giúp tối ưu hóa việc quản lý hàng tồn kho, giảm thiểu rủi ro tồn hàng sau mùa vụ và đảm bảo cung ứng đủ sản phẩm vào thời điểm nhu cầu cao. Tuy nhiên, nghiên cứu cũng có những hạn chế nhất định, chẳng hạn như bộ dữ liệu chỉ giới hạn trong một nhà bán lẻ và trong một khoảng thời gian cụ thể. Hướng phát triển trong tương lai có thể bao gồm việc mở rộng bộ dữ liệu từ nhiều nguồn khác nhau, tích hợp thêm các biến ngoại sinh (như chi phí quảng cáo, dữ liệu kinh tế vĩ mô) và thử nghiệm các thuật toán machine learning phức tạp hơn như mạng nơ-ron sâu (Deep Learning) để cải thiện hơn nữa độ chính xác. Tóm lại, đây là một bước tiến quan trọng trong việc ứng dụng khoa học dữ liệu ứng dụng vào thực tiễn kinh doanh, mở ra tiềm năng lớn trong việc tối ưu hóa giá bán và nâng cao năng lực cạnh tranh.

6.1. Xây dựng chiến lược giá mùa lễ hội dựa trên dữ liệu

Với mô hình dự đoán, nhà quản trị có thể chạy các kịch bản "what-if" để xem giá sẽ thay đổi như thế nào nếu các yếu tố đầu vào thay đổi. Điều này cho phép họ xây dựng một chiến lược giá mùa lễ hội năng động, điều chỉnh giá bán một cách hợp lý để thu hút khách hàng và tối đa hóa lợi nhuận. Thay vì giảm giá hàng loạt, doanh nghiệp có thể áp dụng các chương trình khuyến mãi có mục tiêu dựa trên dự báo của mô hình.

6.2. Hạn chế của nghiên cứu và hướng phát triển trong tương lai

Hạn chế chính của nghiên cứu là phạm vi dữ liệu. Để mô hình có tính tổng quát cao hơn, các nghiên cứu trong tương lai nên thu thập dữ liệu từ nhiều doanh nghiệp và trong một khoảng thời gian dài hơn. Hơn nữa, có thể tích hợp thêm các nguồn dữ liệu phi cấu trúc như phân tích cảm tính từ mạng xã hội để nắm bắt tốt hơn tâm lý người tiêu dùng. Việc huấn luyện lại mô hình một cách định kỳ cũng là cần thiết để đảm bảo mô hình luôn được cập nhật với các xu hướng thị trường mới nhất.

10/07/2025

Bạn đang xem trước tài liệu:

Đề tài nghiên cứu mô hình dự đoán giá sản phẩm theo mùa dựa trên bộ dữ liệu về quà tặng giáng sinh thông qua nền tảng azure machine learning studio

Tải đầy đủ

Trích đoạn nội dung tài liệu

Chương 1: Tổng quan về dé tài nghiên cứu Chương này, nhóm tác giả trình bày rõ lý do chọn đề tài, mục tiêu nghiên cứu, câu hỏi nghiên cứu, đối tượng và phạm vi nghiên cứu, phương pháp, ý nghĩa và kết câu của đề tài nghiên cứu. Chương 2: Cơ sở lý thuyết Chương 2 trình bày về các yếu tô ảnh hưởng đến giá bán quà tặng Giáng sinh, các công trỉnh nghiên cứu tham khảo, mô hình nghiên cứu có liên quan. Sau đó, nhóm thực hiện đề xuất mô hình nghiên cứu được sử dụng trong bài nghiên cứu. Chương 3: Dữ liệu và phương pháp nghiên cứu Trong chương 3, bài nghiên cứu trình bày các bước thiết kế nghiên cứu, quy trình nghiên cứu, mô tả quy trình thu thập, nguồn gốc bộ dữ liệu, xử lý dữ liệu, trình bày lý thuyết và công thức các phương pháp dự đoán, thông số đánh giá và quy trình đưa ra dự đoán chung.

Chương 4: Kết quả nghiên cứu Ở chương này, nhóm tập trung trình bày quy trình huấn luyện và kiểm tra các mô hình dự đoán, ghi nhận kết quả, diễn giải ý nghĩa các thông số của các thuật toán được dùng để sử dụng trong bài để nghiên cứu dự đoán. Chương 5: Kết luận và hàm ý quản trị 11 Trong chương cuối, nhóm tác giả đưa ra kết luận tổng thê của cả bài nghiên cứu, trình bày các hàm ý quản trị của bài nghiên cứu, đưa ra hạn chế của bài nghiên cứu và đề xuất hướng nghiên cứu trong tương lai cho các đề tài cùng lĩnh vực. 12 CHUONG 2: CO SO LY THUYET 2. Các yếu tố ảnh hưởng đến giá bán sản phẩm theo mùa Mô hình nghiên cứu sẽ sử dụng 10 biến trong số 16 biến thu thập được, trong đó có 1 biến phụ thuộc là biến giá cả hàng hóa (Price) và 9 biến độc lập: loại quả tặng (gift_type), danh mục hang cua qua tang (gift_category), nganh hang cua qua tang (gift_cluster), ngày nhập kho của quà tặng (instock_ date) và các biến ân danh liên quan đến quà tặng (lsg_1 đến lsg_6).

Cụ thê như sau: e© Loại quà tặng (gift type): biến loại quà tặng sẽ giúp phân loại dữ liệu đầu vào thành các nhóm khác nhau như quân áo và đỗ điện tử. Tính năng này giúp mô hình đề xuất dự đoán giá quà tặng với một khoảng giá nhất định, vì mỗi loại quà tặng đều sẽ có khoảng giá khác nhau (Mohamed và cộng sự, 2022). e© Danh mục hàng của quả tặng (gift category): danh mục quà tặng thê hiện số lượng các loại quà tặng bán ra của doanh nghiệp, tổng số mặt hàng có trong tổng số các loại quả tặng khác nhau của doanh nghiệp, và số lượng những mặt hàng khác nhau có trong từng nhãn hiệu của từng loại sản phẩm quà tặng. Biến này sẽ giúp phân loại các quà tặng theo những chủng loại sản phẩm khác nhau (Mohamed và cộng sự, 2022).

e Ngành hàng của quà tặng (gift cluster): biến này sẽ giúp phân loại các ngành nghề mà quà tặng thuộc về. Dong và cộng sự (2019) đã đề cập rằng các sản phẩm theo mùa bao gồm nhiều ngành công nghiệp khác nhau ví dụ như thực phẩm, quân áo, hàng điện tử. Các sản phẩm thuộc các ngành nghề vào các thời điểm sẽ có xu hướng tăng hoặc giảm khác nhau, như đỗ điện tử và quần áo thời trang thường sẽ giảm giá trị trong một mùa ban hang (Dong va Wu, 2019). e Ngày nhập kho của quà tặng (instock_ date): đây là biến thời gian duy nhất được sử dụng trong bải nhằm hỗ trợ cho việc việc kiểm tra mô hình ARIMA trong việc dự báo giá.

Biến này cho biết ngày mà quả tặng được nhập về đến kho (Mohamed và cộng sự, 2022). e_ Các biến ân danh liên quan đến quà tặng (lsg_1 đến lsg_6): các biến ân danh được sử dụng trong mô hình bởi chúng được cho biết là các yếu tố liên quan đến quả tặng. 13 Mohamed và cộng sự (2022) cho biết vì để đảm bảo quyền riêng tư của nhà bán lẻ trực tuyến cung cấp dữ liệu nên tac gia đã tiên hàng ân danh chúng. Phương pháp dự báo giá bán sản phẩm theo mùa bằng học máy 2.1, Cac nghién citu trudc 2.

Nghiên cứu của nhom tac gia Mohamed va cộng sự (2022) Nghiên cứu “Price Prediction of Seasonal Items Using Machine Learning and Statistical Methods” (Mohamed và cộng sự, 2022) về dự đoán giá sản phẩm theo mua dựa trên phương pháp học máy và phương pháp thống kê. Bài nghiên cứu của nhóm tác giả tham khảo và sử dụng cơ sở lý thuyết chính từ nghiên cứu này. Đây là một trong số ít các bài báo khoa học nghiên cứu dự đoán sản phẩm theo mùa. Trong nghiên cứu, Mohamed và cộng sự (2022) đã thực hiện hiện dự đoán giá sản phâm theo mùa dựa trên bộ dữ liệu quà tặng Giáng sinh bằng cách sử dụng phương pháp học máy và phương pháp thống kê.

Nghiên cứu này với mục đích đề xuất các mô hình dự đoán hàng hoá theo mùa, so sánh hiệu suất của mô hình thuộc phương pháp học máy và phương pháp thống kê bằng cách đánh giá dựa trên một số thước đo. Quy trình nghiên cứu bao gồm 5 giai đoạn: (1) thu thập và xử lý dữ liệu, (2) thiết kế mô hình, (3) đào tạo mô hình, (4) thử nghiệm mô hình, (5) triển khai mô hình, được mô tả theo hình sau: Machine learning mam | model conception Training Item price prediction + Evaluation fy 6G Nw Machine learning == ì Z ‘a model application Hình 2. 1: Quy trình nghiên cứu Mohamed và cộng sự (2022) Trong giai đoạn đầu tiên, nghiên cứu thực hiện thu thập và xử lý dữ liệu. Bài nghiên cứu được thực hiện dựa trên bộ dữ liệu về quà tặng Giáng sinh được ghi nhận từ một nhà bán lẻ trực tuyên, nhà bán lẻ này đã ghi nhận dữ liệu trong suốt thời gian triển khai một chương trinh khuyến mãi đặc biệt cho sự kiện Giảng sinh.

Bộ dữ liệu bao gồm 14 2 phần được: phần huấn luyện (20.179 bản ghi) và phần kiêm tra (13. Mohamed và cộng sự (2022) đã thực hiện chia tach 80% và 20% tương ứng cho bộ dữ liệu huấn luyện và kiểm tra. Với mô hình ARIMA, nghiên cứu chọn các tham số p, q, d lần lượt là 0, 0, 2. Trong giai đoạn tiếp theo, nghiên cứu đề xuất dự đoán dựa trên 4 mô hình thuộc phương pháp hoc may (Linear Regression, Ridge Regression, Support Vector Regression, Random Forest Regression) va 1 mô hình thuộc phương pháp thống kê (ARIMA Model).

Sau đó, nghiên cứu thực hiện đánh giá mức độ uy tín và hiệu suất của các mô hình trén 4 thang do: Mean Absolute Error (MAE), Root Mean Square Error (RMSE), R-Squared (R2), Mean Absolute Percentage Error (MAPE). Giai doan 3, nghiên cứu thực hiện đào tạo mô hình, các mô hình được đảo tạo trên một phần dữ liệu được chia sẵn (80%). Phần dữ liệu còn lại sẽ được sử dụng trong giai đoạn 4, thử nghiệm mô hình. Cuối cùng, các mô hình được đảo tạo và thử nghiệm được triên khai để nguoi dùng sử dụng trong các tình huống thực tế.

Mohamed và cộng sự (2022) đã thực hiện đánh giá, đo lường hiệu suất của từng mô hình và đưa ra kết luận mô hình học máy Random Forest có hiệu suất dự đoán tốt nhất và mô hình thống kê ARIMA có hiệu suất tốt thứ 2, tuy nhiên, khoảng cách hiệu suất giữa chúng không lớn. Do đó, nghiên cứu đề xuất người dùng nên sử dụng mô hình học máy Random Forest và mô hình thống kê ARIMA để dự đoán giá hàng hoá theo mùa. Nghiên cứu của nhóm tác gia Abdul-Rahman va céng sự (2021) Nghiên cứu “Advanced Machine Learning Algorithms for House Price Prediction: Case Study in Kuala Lumpur” (Abdul-Rahman và cộng sự, 2021) về dự đoán giá nhà ở Kuala Lumpur dựa trên phương pháp học máy. Nghiên cứu được thực hiện với mục đích đề xuất các mô hình học máy thường dùng để dự đoán giá nhà và cung cấp chính xác một mô hình học máy dự đoán chính xác giá nhà ở Kuala Lumpur.

Quy trình nghiên cứu bao gồm: thu thập và xử lý dữ liệu, thiết kế mô hình, huấn luyện mô hình, thử nghiệm và triên khai mô hình. Các mô hình học máy được đánh giá thông qua các thang đo. Nghiên cứu thực hiện dự đoán dựa trên bộ dữ liệu thứ cấp “Property Listing in Kuala Lumpur” được thu thập từ Kaggle và Google Map. Sau đó, tác giá thực hiện các thao tác xử lý và chuyên đổi dữ liệu để thu thập được 15 chứa 21984 quan sát với 11 biến độc lập và 1 biến phụ thuộc.

Bộ dữ liệu này được phân tách dữ liệu thành 2 phân: 70 % sử dụng cho huân luyện mô hình và 30% dùng làm mẫu thử cho kiểm tra. Nghiên cứu xây dựng mô hình dự đoán dựa trên 2 phương pháp học may nang cao: Extreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM) và 2 phương pháp học máy truyền thống: Multiple Regression Analysis, Ridge Regression. Trong giai đoạn nghiên cứu tiếp theo, tác giả thực hiện đào tạo mô hình trên phần dữ liệu huấn luyện. Sau khi hoàn tất huấn luyện, mô hỉnh được ghi nhận và đánh giá các mô hình dựa trên thang đo hiệu suất (MAE, MSE, RMSE, R squared).

Cuối cùng, các mô hình được thử nghiệm và triển khai sử dụng công khai. Nghiên cứu Abdul-Rahman và cộng sự (2021) đã thực hiện triển khai và so sánh các mô hình học máy truyền thống và nâng cao. Kết quả cho thấy mô hình XGBoost dự đoán chính xác giá nhà ở Kuala Lumpur. Trong tương lai, nghiên cứu này còn có thể phát triển hơn thông qua việc mở rộng phạm vi nghiên cứu, thu thập nhiều biến độc lập có tác động (quy mô ngôi nhà và khoảng cách đến các địa điểm công cộng).

Từ đó, có thé thay, nghiên cứu này có thể hỗ trợ đáng kê trong việc dự đoán giá nhà trong tương lai và xây dựng chính sách bất động sản. Đề xuất mô hình nghiên cứu Từ những nghiên cứu đã thảo luận, thấy rằng có rất nhiều công việc đã được thực hiện để dự báo giá cả nói chung. Tuy nhiên, có rất ít nỗ lực đê khám phá vấn đề dự báo giá của các mặt hàng theo mùa. Do đó, dựa vào những hạn chế trên, chúng tôi với mong muốn xây dựng nên mô hình dự đoán để giải quyết vân đề này.

Mô hình đề xuất cho nghiên cứu dự đoán giá các sản phẩm quà tặng theo mùa được chia thành 5 giai đoạn, cụ thể: (1) — Thu thập và xử lý dữ liệu (2) Thiết kế mô hình nghiên cứu (3) Huấn luyện mô hình bằng các thuật toán (4) — Kiểm tra, đánh giá hiệu suất 16 (5) Trién khai áp dụng mô hình cho việc dự đoán gia = M6 hinh hoc may phu hop | Áp dụng mô hình học máy (El Hình 2.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chắc chắn rồi, với vai trò là một chuyên gia SEO, tôi sẽ tóm tắt tài liệu và kết nối các chủ đề một cách tự nhiên để thu hút và giữ chân người đọc.

Tài liệu "Nghiên Cứu Mô Hình Dự Đoán Giá Sản Phẩm Giáng Sinh Qua Azure Machine Learning" là một công trình nghiên cứu chuyên sâu, hướng dẫn chi tiết cách ứng dụng công nghệ học máy trên nền tảng đám mây Azure để giải quyết một bài toán kinh doanh thực tế: dự báo giá các sản phẩm theo mùa. Người đọc sẽ thu được lợi ích thiết thực khi hiểu rõ quy trình xây dựng một mô hình dự đoán hoàn chỉnh, từ khâu thu thập dữ liệu, xử lý, huấn luyện mô hình cho đến đánh giá hiệu quả. Đây là kiến thức vô giá cho các nhà khoa học dữ liệu, nhà phân tích kinh doanh và những ai muốn ứng dụng AI để tối ưu hóa chiến lược giá và quản lý hàng tồn kho.

Để mở rộng kiến thức và có cái nhìn đa chiều về các ứng dụng của học máy và dữ liệu lớn, việc khám phá các công trình liên quan là vô cùng hữu ích. Nếu bạn quan tâm đến kỹ thuật dự báo chuỗi thời gian, một phương pháp cốt lõi trong tài liệu này, bạn có thể tìm hiểu cách nó được áp dụng trong một lĩnh vực hoàn toàn khác qua Khóa luận tốt nghiệp khoa học dữ liệu dự báo luồng giao thông với mô hình chuỗi thời gian đa biến sử dụng bigdl. Bên cạnh đó, để thấy sức mạnh của học máy trong việc cải thiện hiệu quả kinh doanh tổng thể, công trình Luận văn thạc sĩ nghiên cứu và ứng dụng các phương pháp học máy nhằm tăng cường hiệu quả các dịch vụ giá trị gia tăng của mạng di động beeline sẽ cung cấp một ví dụ điển hình về việc tối ưu hóa dịch vụ. Cuối cùng, khi xử lý các bài toán dữ liệu lớn, nền tảng công nghệ là yếu tố quyết định; hãy khám phá một giải pháp xử lý song song mạnh mẽ khác ngoài Azure qua Luận văn thạc sĩ giải pháp xếp hạng và tính toán song song trên nền tảng apache spark để làm phong phú thêm bộ công cụ kỹ thuật của mình. Mỗi tài liệu là một cánh cửa mới, giúp bạn đào sâu hơn vào thế giới rộng lớn của khoa học dữ liệu.

#học máy trong thương mại điện tử

#chiến lược định giá sản phẩm

#Ứng dụng Azure Machine Learning

#Dự đoán giá sản phẩm bằng machine learning

#Mô hình dự báo giá theo mùa

#Phân tích dữ liệu quà tặng Giáng sinh

Chủ đề

Phân tích dữ liệu lớn

khoa học dữ liệu ứng dụng

Học máy trong kinh doanh

Dự báo trong thương mại điện tử

Đề tài nghiên cứu mô hình dự đoán giá sản phẩm theo mùa dựa trên bộ dữ liệu về quà tặng giáng sinh thông qua nền tảng azure machine learning studio

LỜI MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU

1.1. Lý do chọn đề tài

1.2. Mục tiêu nghiên cứu

1.2.1. Mục tiêu nghiên cứu chung

1.2.2. Mục tiêu nghiên cứu cụ thể

1.3. Câu hỏi nghiên cứu

1.4. Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu

1.4.2. Phạm vi nghiên cứu

1.5. Phương pháp nghiên cứu

1.5.1. Nghiên cứu sơ bộ

1.5.2. Nghiên cứu chính thức

1.6. Ý nghĩa đề tài nghiên cứu

1.6.1. Ý nghĩa khoa học

1.6.2. Ý nghĩa thực tiễn

2. CHƯƠNG 2: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU

2.1. Mục tiêu nghiên cứu

2.2. Phương pháp nghiên cứu

2.3. Đề xuất mô hình nghiên cứu

3. CHƯƠNG 3: DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

3.1. Thiết kế nghiên cứu

3.2. Thu thập dữ liệu

3.3. Xử lý dữ liệu

3.4. Phương pháp nghiên cứu trên nền tảng Azure Machine Learning Studio

3.5. Phương pháp dự đoán

3.5.1. Linear Regression

3.5.2. Support Vector Regression

3.5.3. Random Forest Regression

3.6. Quy trình đưa ra kết quả dự đoán

4. CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU

4.1. Mô tả mối quan hệ giữa biến độc lập và biến phụ thuộc

4.2. Quy trình xây dựng phương pháp dự đoán

4.3. Phương pháp thống kê

4.4. Đánh giá và lựa chọn mô hình dự đoán

4.5. Triển khai dự đoán và thử nghiệm

5. CHƯƠNG 5: KẾT LUẬN VÀ HẠN CHẾ

5.1. Hạn chế và hướng nghiên cứu trong tương lai

TÀI LIỆU THAM KHẢO

I. Khám phá mô hình dự đoán giá sản phẩm Giáng Sinh hiệu quả

1.1. Tầm quan trọng của khoa học dữ liệu ứng dụng trong bán lẻ

1.2. Mục tiêu của mô hình nghiên cứu dự đoán giá sản phẩm

II. Thách thức định giá sản phẩm động trong mùa lễ hội cao điểm

2.1. Phân tích các yếu tố ảnh hưởng đến giá bán sản phẩm

2.2. Hạn chế của các phương pháp định giá truyền thống

III. Hướng dẫn quy trình nghiên cứu giá qua Azure Machine Learning

3.1. Nền tảng Microsoft Azure AI và các tính năng của Azure ML Studio

3.2. Quy trình thu thập và tiền xử lý dữ liệu Preprocessing

IV. So sánh các thuật toán machine learning dự báo chuỗi thời gian

4.1. Phân tích các mô hình hồi quy Linear Ridge SVR Random Forest

4.2. Ứng dụng mô hình ARIMA cho dữ liệu theo mùa

V. Kết quả triển khai mô hình AI và tối ưu hóa giá bán hiệu quả

5.1. Mô hình Random Forest Regression cho kết quả vượt trội

5.2. Hướng dẫn triển khai dự đoán và thử nghiệm thực tế

VI. Kết luận và hàm ý quản trị từ mô hình dự đoán giá sản phẩm

6.1. Xây dựng chiến lược giá mùa lễ hội dựa trên dữ liệu

6.2. Hạn chế của nghiên cứu và hướng phát triển trong tương lai

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Trường học: Trường Đại Học Công Nghệ Thông Tin

Chuyên ngành: Khoa Học Dữ Liệu

Đề tài: Nghiên Cứu Mô Hình Dự Đoán Giá Sản Phẩm Giáng Sinh Qua Azure Machine Learning

Loại tài liệu: Đồ Án Tốt Nghiệp

Năm xuất bản: 2023

Địa điểm: Hồ Chí Minh

Có thể bạn quan tâm