Tổng quan nghiên cứu

Trong bối cảnh nền kinh tế Việt Nam những năm gần đây chứng kiến sự biến động mạnh mẽ của giá cả nhiều mặt hàng thiết yếu, đặc biệt là các mặt hàng dân sinh, xuất nhập khẩu chủ đạo, việc nghiên cứu mối quan hệ giữa các biến động giá trở nên cấp thiết. Theo số liệu thu thập từ năm 2008 đến quý 1 năm 2010, giá của hơn 120 mặt hàng được thống kê theo tuần, phản ánh rõ nét sự biến động phức tạp và đa chiều của thị trường. Vấn đề nghiên cứu tập trung vào việc xác định các mối quan hệ nhân quả giữa sự biến động giá của các mặt hàng nhằm hỗ trợ công tác bình ổn giá và kìm chế lạm phát. Mục tiêu cụ thể là phát hiện các luật kết hợp, đặc biệt là luật kết hợp mẫu âm, để làm rõ các mối quan hệ tăng – giảm giá đồng thời hoặc ngược chiều giữa các mặt hàng. Phạm vi nghiên cứu bao gồm các nhóm mặt hàng dân sinh, nhập khẩu, xuất khẩu và một số mặt hàng cơ bản trên thế giới, với dữ liệu thu thập tại Hà Nội và từ Tổng cục Hải quan trong khoảng thời gian 120 tuần. Ý nghĩa nghiên cứu được thể hiện qua việc cung cấp cơ sở khoa học cho các cơ quan quản lý nhà nước trong việc xây dựng chính sách bình ổn giá, đồng thời làm nền tảng cho mô hình dự báo giá được áp dụng tại Bộ Công Thương.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên lý thuyết khai phá dữ liệu (Data Mining), trong đó trọng tâm là luật kết hợp (Association Rules) và luật kết hợp mẫu âm (Negative Association Rules). Luật kết hợp được định nghĩa là mối quan hệ giữa các tập mục trong cơ sở dữ liệu giao dịch, biểu diễn dưới dạng $X \Rightarrow Y$ với độ hỗ trợ (support) và độ tin cậy (confidence) xác định mức độ phổ biến và độ tin cậy của luật. Thuật toán Apriori được sử dụng để tìm các tập mục phổ biến, từ đó sinh ra các luật kết hợp thỏa mãn ngưỡng minsup và minconf. Luật kết hợp mẫu âm mở rộng khái niệm này bằng cách xét sự vắng mặt của một mục trong mối quan hệ, ví dụ $X \Rightarrow \neg Y$, với công thức tính độ hỗ trợ và độ tin cậy dựa trên luật kết hợp dương. Khung lý thuyết còn bao gồm khái niệm miền tri thức (domain knowledge) và quan hệ anh-em (Locality Of Similarity – LOS) để phân loại và loại bỏ các luật dư thừa, nâng cao tính khả thi của các luật mẫu âm.

Các khái niệm chính bao gồm:

  • Luật kết hợp dương và mẫu âm
  • Độ hỗ trợ (support) và độ tin cậy (confidence)
  • Thuật toán Apriori
  • Miền tri thức và quan hệ anh-em (LOS)

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ số liệu giá cả của 120 mặt hàng thuộc các nhóm dân sinh, nhập khẩu, xuất khẩu và mặt hàng thế giới, thu thập theo tuần từ ngày 3/1/2008 đến 31/3/2010. Dữ liệu dân sinh được thu thập tại Hà Nội, dữ liệu nhập khẩu và xuất khẩu từ Tổng cục Hải quan. Các mặt hàng có biến động giá nhỏ hoặc dữ liệu không đầy đủ (dưới 75% số tuần) bị loại bỏ hoặc được xử lý bằng phương pháp trung bình trượt để bổ sung dữ liệu khuyết thiếu.

Phương pháp phân tích sử dụng phần mềm CBA (Classification Based on Associations) với thuật toán Apriori để phát hiện luật kết hợp. Dữ liệu được chuyển đổi sang dạng nhị phân thể hiện sự tăng, giảm giá so với tuần trước đó, lưu dưới dạng file *.tra phù hợp với phần mềm. Các tham số minSup và minConf được điều chỉnh để đảm bảo phát hiện đủ số lượng luật cần thiết. Cỡ mẫu là toàn bộ 120 tuần dữ liệu, phương pháp chọn mẫu là toàn bộ dữ liệu có sẵn, đảm bảo tính đại diện và đầy đủ. Quá trình nghiên cứu diễn ra trong khoảng thời gian từ năm 2008 đến quý 1 năm 2010, với các bước thu thập, xử lý dữ liệu, phân tích và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Phát hiện luật kết hợp dương giữa các mặt hàng dân sinh: Qua phân tích 120 mặt hàng dân sinh, các luật kết hợp với độ hỗ trợ trên 40% và độ tin cậy trên 70% được phát hiện, ví dụ như mối quan hệ giữa mặt hàng gạo tẻ thường và gạo tẻ ngon có sự biến động giá đồng bộ với độ hỗ trợ khoảng 60%. Các mặt hàng thịt lợn và thịt bò cũng thể hiện mối liên hệ giá phức tạp, với thịt bò tăng giá phi mã trong khi thịt lợn giảm nhẹ.

  2. Luật kết hợp mẫu âm thể hiện mối quan hệ ngược chiều: Một số mặt hàng khi tăng giá thì mặt hàng khác giảm giá, ví dụ nhóm mặt hàng nhập khẩu và xuất khẩu có những luật mẫu âm với độ hỗ trợ và độ tin cậy trên 30%, cho thấy sự cạnh tranh hoặc điều tiết giá giữa các nhóm hàng. Luật mẫu âm giúp phát hiện các mối quan hệ không dễ nhận thấy qua luật dương truyền thống.

  3. Ảnh hưởng của các mặt hàng thế giới đến giá trong nước: Giá dầu thô Brent IPE và dầu thô nhẹ New York có sự biến động mạnh, tác động trực tiếp đến giá dầu trong nước với độ tương quan cao, thể hiện qua các luật kết hợp có độ hỗ trợ trên 50%. Giá gạo Thái Lan và ngô Chicago cũng ảnh hưởng đến giá gạo và ngô trong nước với các luật kết hợp có độ tin cậy trên 75%.

  4. Sự biến động giá theo nhóm mặt hàng: Nhóm mặt hàng rau củ quả có sự biến động giá đột biến trong các tuần mưa lụt tại Hà Nội năm 2008, với giá rau bắp cải tăng từ 5.000 đ/kg lên đến 18.000 đ/kg, phản ánh tác động của thiên tai đến giá cả. Nhóm vật liệu xây dựng và đồ điện dân dụng có sự biến động giá không ổn định nhưng có xu hướng tăng trong quý 1 năm 2010.

Thảo luận kết quả

Nguyên nhân của các mối quan hệ giá được giải thích bởi các yếu tố cung cầu, chi phí sản xuất, tác động của thiên tai, chính sách thuế và nhập khẩu. So sánh với các nghiên cứu trong ngành khai phá dữ liệu, việc áp dụng luật kết hợp mẫu âm đã mở rộng khả năng phát hiện các mối quan hệ ngược chiều, giúp các nhà quản lý có cái nhìn toàn diện hơn về thị trường. Dữ liệu có thể được trình bày qua biểu đồ mạng lưới luật kết hợp, thể hiện các nút là mặt hàng và các cạnh là các luật với trọng số theo độ hỗ trợ và độ tin cậy, giúp trực quan hóa mối quan hệ phức tạp giữa các mặt hàng. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc xây dựng các chính sách bình ổn giá, dự báo biến động giá và kiểm soát lạm phát.

Đề xuất và khuyến nghị

  1. Xây dựng hệ thống cảnh báo sớm biến động giá dựa trên các luật kết hợp phát hiện được, nhằm giảm thiểu tác động tiêu cực của biến động giá lên nền kinh tế. Thời gian triển khai trong 1 năm, chủ thể thực hiện là Bộ Công Thương phối hợp với các viện nghiên cứu.

  2. Áp dụng mô hình dự báo giá sử dụng luật kết hợp mẫu âm để nhận diện các mối quan hệ ngược chiều giữa các mặt hàng, giúp điều chỉnh chính sách thuế và nhập khẩu linh hoạt hơn. Mục tiêu nâng cao độ chính xác dự báo giá trên 80% trong vòng 2 năm.

  3. Tăng cường thu thập và xử lý dữ liệu giá cả theo tuần tại các địa phương trọng điểm nhằm cập nhật kịp thời biến động thị trường, đảm bảo dữ liệu đầy đủ và chính xác. Thời gian thực hiện liên tục, chủ thể là các cơ quan thống kê và hải quan.

  4. Đào tạo và nâng cao năng lực sử dụng phần mềm khai phá dữ liệu CBA cho cán bộ quản lý và chuyên gia kinh tế nhằm khai thác hiệu quả các công cụ phân tích dữ liệu lớn. Kế hoạch đào tạo trong 6 tháng, chủ thể là các trường đại học và viện nghiên cứu.

Đối tượng nên tham khảo luận văn

  1. Cơ quan quản lý nhà nước về giá và thị trường: Sử dụng kết quả nghiên cứu để xây dựng chính sách bình ổn giá, kiểm soát lạm phát và điều tiết thị trường hiệu quả.

  2. Các nhà kinh tế và chuyên gia phân tích thị trường: Áp dụng phương pháp khai phá dữ liệu và luật kết hợp mẫu âm để nghiên cứu sâu hơn về mối quan hệ giá cả và dự báo biến động.

  3. Doanh nghiệp thương mại và xuất nhập khẩu: Hiểu rõ các mối quan hệ giá giữa các mặt hàng để tối ưu hóa chiến lược kinh doanh, quản lý rủi ro giá cả.

  4. Các viện nghiên cứu và trường đại học: Tham khảo phương pháp luận và kết quả nghiên cứu để phát triển các đề tài nghiên cứu tiếp theo trong lĩnh vực khai phá dữ liệu và kinh tế học.

Câu hỏi thường gặp

  1. Luật kết hợp mẫu âm là gì và tại sao quan trọng?
    Luật kết hợp mẫu âm là các luật biểu thị mối quan hệ giữa sự có mặt của một tập mục và sự vắng mặt của một tập mục khác, ví dụ $X \Rightarrow \neg Y$. Chúng quan trọng vì giúp phát hiện các mối quan hệ ngược chiều, không thể thấy rõ qua luật kết hợp dương, hỗ trợ phân tích sâu sắc hơn về biến động giá.

  2. Phần mềm CBA có ưu điểm gì trong khai phá luật kết hợp?
    CBA hỗ trợ khai phá luật kết hợp với nhiều mức độ hỗ trợ và tin cậy khác nhau, xử lý dữ liệu dạng giao dịch và bảng, đồng thời tích hợp thuật toán Apriori hiệu quả, giúp phát hiện các luật kết hợp phức tạp trong dữ liệu lớn.

  3. Dữ liệu giá cả được xử lý như thế nào để phù hợp với phân tích luật kết hợp?
    Dữ liệu giá cả được chuyển đổi thành dạng nhị phân thể hiện sự tăng hoặc giảm giá so với tuần trước đó, lưu dưới dạng file *.tra để phù hợp với phần mềm khai phá luật kết hợp, đảm bảo tính chính xác và dễ dàng phân tích.

  4. Các luật kết hợp phát hiện được có thể ứng dụng thực tế ra sao?
    Các luật này giúp dự báo biến động giá, hỗ trợ xây dựng chính sách thuế, nhập khẩu, bình ổn giá, đồng thời giúp doanh nghiệp điều chỉnh chiến lược kinh doanh phù hợp với xu hướng thị trường.

  5. Làm thế nào để loại bỏ các luật kết hợp dư thừa hoặc không mong muốn?
    Sử dụng miền tri thức và quan hệ anh-em (LOS) để phân loại và loại bỏ các luật trùng lặp hoặc không hợp lý, đồng thời áp dụng các tiêu chí về độ lệch độ tin cậy và độ hỗ trợ để giữ lại các luật khả thi và có ý nghĩa thực tiễn.

Kết luận

  • Luận văn đã phát triển thành công mô hình khai phá luật kết hợp và luật kết hợp mẫu âm để phân tích biến động giá của hơn 120 mặt hàng trong 120 tuần từ 2008 đến quý 1/2010.
  • Phát hiện các mối quan hệ giá đồng bộ và ngược chiều giữa các nhóm mặt hàng dân sinh, nhập khẩu, xuất khẩu và mặt hàng thế giới với độ hỗ trợ và độ tin cậy cao.
  • Áp dụng phần mềm CBA và thuật toán Apriori hiệu quả trong việc xử lý và phân tích dữ liệu lớn, cung cấp công cụ hỗ trợ cho công tác bình ổn giá và dự báo giá.
  • Đề xuất các giải pháp cụ thể nhằm xây dựng hệ thống cảnh báo sớm, nâng cao chất lượng dữ liệu và đào tạo nhân lực chuyên môn.
  • Hướng nghiên cứu tiếp theo tập trung vào mở rộng phạm vi dữ liệu, cải tiến thuật toán khai phá luật kết hợp mẫu âm và ứng dụng mô hình dự báo giá trong thực tiễn quản lý nhà nước.

Các cơ quan quản lý, nhà nghiên cứu và doanh nghiệp được khuyến khích áp dụng kết quả nghiên cứu để nâng cao hiệu quả quản lý và kinh doanh trong bối cảnh biến động giá ngày càng phức tạp.