NGHIÊN CỨU PHƯƠNG PHÁP GIẢM CHIỀU BIẾN DỰA TRÊN HÀM NHÂN VÀ ỨNG DỤNG TRONG BÀI TOÁN DỰ BÁO KIM NGẠCH XUẤT KHẨU

Chuyên ngành

Hệ Thống Thông Tin

Người đăng

Ẩn danh

Thể loại

Luận Án Tiến Sĩ

2024

158
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giảm Chiều Dữ Liệu Hàm Nhân Tổng quan và ứng dụng

Trong bối cảnh kinh tế toàn cầu hóa, việc dự báo chính xác kim ngạch xuất khẩu trở nên vô cùng quan trọng. Tuy nhiên, các mô hình dự báo truyền thống thường gặp khó khăn khi xử lý lượng dữ liệu lớn và phức tạp. Giảm chiều dữ liệu là một giải pháp hiệu quả để giải quyết vấn đề này. Kỹ thuật này giúp đơn giản hóa dữ liệu, giảm thiểu nhiễu và cải thiện hiệu suất của các mô hình dự báo. Bài toán đặt ra là làm sao để áp dụng hiệu quả hàm nhân vào quá trình giảm chiều, từ đó nâng cao độ chính xác của dự báo kim ngạch xuất khẩu. Việc sử dụng hàm nhân trong giảm chiều dữ liệu không chỉ giúp tăng tốc độ xử lý mà còn giúp các mô hình dự báo trở nên mạnh mẽ hơn trong việc nắm bắt các mối quan hệ phi tuyến tính trong dữ liệu. Luận án này tập trung nghiên cứu về ứng dụng hàm nhân trong giảm chiều dữ liệu để dự báo kim ngạch xuất khẩu. Cụ thể luận án tập trung nghiên cứu đề xuất phương pháp giảm chiều trên các tập dữ liệu chuỗi thời gian lớn khắc phục được hạn chế và có hiệu suất giảm chiều nổi trội hơn một số phương pháp giảm chiều hiện được sử dụng phổ biến và được xem là hiệu quả nhất trong lĩnh vực kinh tế - tài chính và đề xuất quy trình/thuật toán dự báo trên tập dữ liệu chuỗi thời gian lớn sử dụng phương pháp giảm chiều được đề xuất và ứng dụng của nó trong lĩnh vực kinh tế - tài chính, mà trước hết là lĩnh vực xuất khẩu.

1.1. Tầm quan trọng của dự báo kim ngạch xuất khẩu chính xác

Dự báo chính xác kim ngạch xuất khẩu là yếu tố then chốt trong việc hoạch định chính sách kinh tế và thương mại của một quốc gia. Theo tài liệu nghiên cứu, Việt Nam có nền kinh tế mở, ở đó kim ngạch xuất, nhập khẩu chiếm tỷ trọng rất cao trong tổng sản phẩm quốc nội (GDP) vì thế việc dự báo kim ngạch xuất khẩu càng quan trọng và cần thiết hơn. Một dự báo chính xác cho phép chính phủ và các doanh nghiệp đưa ra các quyết định đầu tư, sản xuất và phân phối hiệu quả hơn, từ đó thúc đẩy tăng trưởng kinh tế và nâng cao năng lực cạnh tranh quốc gia. Ngoài ra, dự báo chính xác cũng giúp giảm thiểu rủi ro và ứng phó kịp thời với các biến động bất lợi trên thị trường quốc tế. Việc sử dụng mô hình giảm chiều dữ liệuhàm nhân sẽ góp phần nâng cao chất lượng dự báo, hỗ trợ các nhà quản lý đưa ra các quyết định sáng suốt.

1.2. Thách thức khi dự báo kim ngạch xuất khẩu trên dữ liệu lớn

Việc dự báo kim ngạch xuất khẩu gặp nhiều thách thức, đặc biệt khi phải xử lý một lượng lớn dữ liệu phức tạp. Các yếu tố kinh tế vĩ mô, biến động tỷ giá, chính sách thương mại, và thậm chí cả các yếu tố chính trị đều có thể ảnh hưởng đến kim ngạch xuất khẩu. Khi số lượng biến tăng lên, việc xây dựng và duy trì một mô hình dự báo chính xác trở nên khó khăn hơn. Giảm chiều dữ liệu trở thành một giải pháp thiết yếu để loại bỏ các biến không liên quan, giảm thiểu nhiễu, và tập trung vào các yếu tố quan trọng nhất. Tuy nhiên, việc lựa chọn phương pháp giảm chiều phù hợp và hàm nhân tối ưu vẫn là một thách thức lớn. Các tập dữ liệu thế giới thực trong lĩnh vực kinh tế - tài chính thường là dữ liệu chuỗi thời gian ở đó số lượng các biến nói chung là lớn, thậm chí lớn hơn nhiều số quan sát, và người ta không thể xây dựng được mô hình dự báo và thực hiện dự báo trên các tập dữ liệu như vậy bằng các kỹ thuật thống kê.

II. Giảm Chiều Dữ Liệu Hàm Nhân Cách Phương Pháp Hoạt Động

Giảm chiều dữ liệu hàm nhân là một kỹ thuật mạnh mẽ kết hợp khả năng của hàm nhân với các phương pháp giảm chiều truyền thống như PCA (Principal Component Analysis). Thay vì thực hiện giảm chiều trực tiếp trên dữ liệu gốc, hàm nhân được sử dụng để ánh xạ dữ liệu vào một không gian đặc trưng cao hơn, nơi các mối quan hệ phi tuyến tính trở nên rõ ràng hơn. Sau đó, PCA hoặc một phương pháp giảm chiều khác được áp dụng trong không gian đặc trưng này. Kết quả là một biểu diễn dữ liệu có số chiều thấp hơn nhưng vẫn giữ lại được các đặc trưng quan trọng và mối quan hệ phi tuyến tính. PCA là phương pháp giảm chiều tuyến tính điển hình. Nghiên cứu [18] chỉ ra rằng PCA là phương pháp giảm chiều tuyến tính tốt nhất do nó bảo toàn cấu trúc hiệp phương sai và phương sai cực đại của tập dữ liệu ban đầu. Phương pháp giảm chiều biến dựa vào kỹ thuật hàm nhân.1 Phương pháp giảm chiều dựa vào kỹ thuật hàm nhân .2 Giảm chiều bằng sử dụng phương pháp KTPCA lặp .2 Hiệu suất giảm chiều biến của phương pháp KTPCA lặp .1 Đối với các tập dữ liệu tần suất lấy mẫu giống nhau

2.1. Ưu điểm của việc sử dụng Hàm Nhân trong Giảm Chiều

Việc sử dụng hàm nhân mang lại nhiều ưu điểm so với các phương pháp giảm chiều tuyến tính truyền thống. Thứ nhất, hàm nhân cho phép nắm bắt các mối quan hệ phi tuyến tính trong dữ liệu, điều mà các phương pháp tuyến tính không thể làm được. Thứ hai, hàm nhân có thể cải thiện hiệu suất của các mô hình học máy bằng cách tạo ra các đặc trưng phân biệt tốt hơn. Thứ ba, hàm nhân có thể được sử dụng với nhiều loại dữ liệu khác nhau, bao gồm dữ liệu số, dữ liệu văn bản và dữ liệu hình ảnh. Như vậy, kết quả nghiên cứu trong [19], [20] tiết lộ rằng các tập dữ liệu thế giới thực được thực nghiệm trong các nghiên cứu đó có vẻ gần xấp xỉ một siêu phẳng. Tuy nhiên thực tế cho thấy các tập dữ liệu chuỗi thời gian thế giới thực không phải lúc nào cũng như vậy.

2.2. Các loại Hàm Nhân phổ biến và ứng dụng

Có nhiều loại hàm nhân khác nhau, mỗi loại phù hợp với một loại dữ liệu và bài toán cụ thể. Một số loại hàm nhân phổ biến bao gồm hàm nhân RBF (Radial Basis Function), hàm nhân đa thức (Polynomial Kernel), và hàm nhân sigmoid. Hàm nhân RBF thường được sử dụng cho các bài toán phân loại và hồi quy, trong khi hàm nhân đa thức phù hợp với các bài toán có mối quan hệ đa thức giữa các biến. Nghiên cứu này cần xác định hàm nhân nào phù hợp nhất cho bài toán dự báo kim ngạch xuất khẩu. Ví dụ như phương pháp KTPCA dựa vào mô hình có RMSE tốt nhất .2: So sánh hiệu suất giảm chiều của PCA và họ SPCA .3: Hiệu suất giảm chiều dựa vào mô hình BE.

III. Kernel PCA và Kernel LDA So sánh và ứng dụng

Kernel PCAKernel LDA là hai phương pháp giảm chiều dữ liệu hàm nhân phổ biến. Kernel PCA là một mở rộng phi tuyến của PCA, trong khi Kernel LDA là một mở rộng phi tuyến của LDA (Linear Discriminant Analysis). Kernel PCA tập trung vào việc tìm kiếm các thành phần chính trong không gian đặc trưng, trong khi Kernel LDA tập trung vào việc tìm kiếm các hướng phân biệt tốt nhất giữa các lớp. Sự khác biệt này khiến chúng phù hợp với các loại bài toán khác nhau. Bảng 2.1: Sự khác nhau của các phương pháp PCA, KPCA, và KTPCA .2: Các đặc tính thống kê của các tập dữ liệu thực nghiệm .3: Khoảng cách trung bình tối thiểu giữa hai véc tơ cột của các tập dữ liệu .4: Hiệu suất giảm chiều của phương pháp KTPCA lặp.5: Hiệu suất giảm chiều của các phương pháp (RMSE) .6: Các đặc tính thống kê của các tập dữ liệu thực nghiệm .7: Hiệu suất giảm chiều biến của các phương pháp được đề xuất.8: Hiệu suất giảm chiều của PCA so với họ SPCA

3.1. Khi nào nên sử dụng Kernel PCA

Kernel PCA thích hợp khi dữ liệu có cấu trúc phi tuyến tính phức tạp và mục tiêu là giảm số chiều mà vẫn giữ lại được các đặc trưng quan trọng. Ví dụ, Kernel PCA có thể được sử dụng để phân tích các mẫu trong dữ liệu tài chính hoặc để trích xuất các đặc trưng từ dữ liệu hình ảnh. Điều quan trọng là Kernel PCA không yêu cầu thông tin về lớp hoặc nhãn của dữ liệu.

3.2. Ứng dụng Kernel LDA trong bài toán phân loại và dự báo

Kernel LDA là lựa chọn tốt khi có thông tin về lớp hoặc nhãn của dữ liệu và mục tiêu là phân loại hoặc dự báo. Ví dụ, Kernel LDA có thể được sử dụng để phân loại khách hàng dựa trên hành vi mua hàng hoặc để dự đoán khả năng vỡ nợ của một công ty. Khi so sánh hai cách tiếp cận xây dựng mô hình dự báo có điều kiện .2: Tập dữ liệu phục vụ dự báo kim ngạch xuất khẩu .3: Các chỉ số dẫn báo được chọn của biến EX .4: Kết quả giảm chiều bằng phương pháp KTPCA LẶP .5: So sánh kết quả dự báo kim ngạch xuất khẩu của các mô hình với thực tế107

IV. Dự Báo Kim Ngạch Xuất Khẩu Ứng Dụng và Kết Quả Nghiên Cứu

Nghiên cứu này ứng dụng phương pháp giảm chiều dữ liệu hàm nhân vào bài toán dự báo kim ngạch xuất khẩu. Dữ liệu kinh tế vĩ mô, dữ liệu thương mại, và các yếu tố liên quan khác được thu thập và xử lý. Sau đó, hàm nhân phù hợp được lựa chọn và áp dụng để giảm chiều dữ liệu. Cuối cùng, một mô hình dự báo được xây dựng trên dữ liệu đã giảm chiều và được đánh giá bằng các tiêu chuẩn độ chính xác phù hợp. Mục đích của giảm chiều là tăng tính hiệu quả (tốn ít thời gian và bộ nhớ) và tính dễ giải thích cho các mô hình dự báo được xây dựng trên tập dữ liệu lớn sử dụng phương pháp giảm chiều. Việc đề xuất một quy trình hoặc thuật toán dự báo trên tập dữ liệu chuỗi thời gian lớn sử dụng phương pháp giảm chiều được đề xuất và áp dụng quy trình hoặc thuật toán đó để dự báo các chỉ số kinh tế - tài chính quan trọng cũng cần được nghiên cứu khảo sát.

4.1. Quy trình xây dựng mô hình dự báo kim ngạch xuất khẩu

Quy trình bao gồm các bước chính sau: (1) Thu thập và xử lý dữ liệu; (2) Lựa chọn hàm nhân và áp dụng phương pháp giảm chiều; (3) Xây dựng mô hình dự báo (ví dụ: mô hình hồi quy, mô hình chuỗi thời gian); (4) Đánh giá độ chính xác của mô hình (sử dụng các chỉ số như RMSE, MAE). Sau đó tiến hành chiết xuất nhân tố và xây dựng mô hình dự báo .4 Giai đoạn 4: Thực hiện dự báo.5 Dự báo ngoài mẫu kim ngạch xuất khẩu .4 Dự báo có điều kiện kim ngạch xuất khẩu .1 Giai đoạn 1: Xử lý dữ liệu .2 Giai đoạn 2: Lựa chọn biến

4.2. Kết quả và so sánh với các phương pháp dự báo khác

Kết quả nghiên cứu cho thấy phương pháp giảm chiều dữ liệu hàm nhân có thể cải thiện đáng kể độ chính xác của dự báo kim ngạch xuất khẩu so với các phương pháp truyền thống. So sánh với các mô hình không sử dụng giảm chiều hoặc sử dụng giảm chiều tuyến tính, mô hình sử dụng hàm nhân cho kết quả tốt hơn, đặc biệt trong việc nắm bắt các biến động phi tuyến tính trong dữ liệu.Kết quả giảm chiều bằng phương pháp KTPCA LẶP .5: So sánh kết quả dự báo kim ngạch xuất khẩu của các mô hình với thực tế

V. Tối Ưu Hóa Tham Số Bí quyết tăng độ chính xác

Để đạt được hiệu suất tối ưu, việc tối ưu hóa tham số cho hàm nhân và mô hình dự báo là rất quan trọng. Các tham số như độ rộng của hàm nhân RBF, bậc của hàm nhân đa thức, và các tham số của mô hình dự báo cần được điều chỉnh cẩn thận để đạt được độ chính xác cao nhất. Các phương pháp tối ưu hóa như tìm kiếm lưới (grid search), tối ưu hóa Bayesian, và giải thuật di truyền có thể được sử dụng để tìm kiếm các tham số tối ưu. Ở đây hiệu suất của một phương pháp giảm chiều được đo bằng sai số dự báo bình phương trung bình chuẩn (RMSE). Nó đóng vai trò như là hàm mất mát (hàm LOSS). Mục đích của giảm chiều là tăng tính hiệu quả (tốn ít thời gian và bộ nhớ) và tính dễ giải thích cho các mô hình dự báo được xây dựng trên tập dữ liệu lớn sử dụng phương pháp giảm chiều.

5.1. Các phương pháp tối ưu hóa tham số phổ biến

Tìm kiếm lưới là một phương pháp đơn giản nhưng hiệu quả, trong đó tất cả các tổ hợp tham số có thể được thử nghiệm. Tối ưu hóa Bayesian sử dụng một mô hình xác suất để ước lượng hiệu suất của các tham số khác nhau và tập trung vào các tham số có khả năng cho kết quả tốt nhất. Giải thuật di truyền sử dụng các nguyên tắc của tiến hóa để tìm kiếm các tham số tối ưu. Thuật toán dự báo trên tập dữ liệu chuỗi thời gian lớn .1 Thuật toán dự báo có điều kiện .2 Thuật toán dự báo không điều kiện.3 Độ phức tạp tính toán

5.2. Ảnh hưởng của tối ưu hóa tham số đến độ chính xác dự báo

Việc tối ưu hóa tham số có thể cải thiện đáng kể độ chính xác của dự báo. Một nghiên cứu điển hình cho thấy việc điều chỉnh tham số độ rộng của hàm nhân RBF có thể giảm RMSE đến 20%. Do đó, đầu tư vào tối ưu hóa tham số là rất xứng đáng để đạt được kết quả dự báo tốt nhất.

VI. Giảm Chiều Hàm Nhân Hướng phát triển và nghiên cứu tiếp

Mặc dù đã đạt được nhiều tiến bộ, lĩnh vực giảm chiều dữ liệu hàm nhân vẫn còn nhiều tiềm năng phát triển. Các nghiên cứu trong tương lai có thể tập trung vào việc phát triển các hàm nhân mới, cải tiến các phương pháp tối ưu hóa tham số, và ứng dụng các kỹ thuật giảm chiều vào các bài toán dự báo phức tạp hơn. Ngoài ra, việc kết hợp giảm chiều dữ liệu hàm nhân với các kỹ thuật học sâu cũng là một hướng đi đầy hứa hẹn. Các yếu tố tác động đến kim ngạch xuất khẩu .2 Tập dữ liệu phục vụ dự báo .3 Dự báo không điều kiện kim ngạch xuất khẩu .1 Giai đoạn 1: Xử lý dữ liệu .3 Giai đoạn 3: Chiết xuất nhân tố và xây dựng mô hình dự báo .4 Giai đoạn 4: Thực hiện dự báo.5 Dự báo ngoài mẫu kim ngạch xuất khẩu

6.1. Kết hợp giảm chiều hàm nhân và học sâu

Học sâu đã chứng minh được khả năng mạnh mẽ trong việc xử lý dữ liệu phức tạp. Kết hợp giảm chiều hàm nhân và học sâu có thể tạo ra các mô hình dự báo mạnh mẽ hơn, tận dụng được cả khả năng nắm bắt các mối quan hệ phi tuyến tính của hàm nhân và khả năng học các đặc trưng phức tạp của học sâu.

6.2. Ứng dụng giảm chiều vào các bài toán dự báo phức tạp

Giảm chiều dữ liệu hàm nhân có thể được áp dụng vào các bài toán dự báo phức tạp hơn, chẳng hạn như dự báo kim ngạch xuất khẩu theo ngành, dự báo tác động của các chính sách thương mại đến kim ngạch xuất khẩu, hoặc dự báo biến động tỷ giá. Điều quan trọng là phải lựa chọn hàm nhân và phương pháp giảm chiều phù hợp với từng bài toán cụ thể.

16/05/2025
Nghiên cứu phương pháp giảm chiều biến dựa trên hàm nhân và ứng dụng trong bài toán dự báo kim ngạch xuất khẩu
Bạn đang xem trước tài liệu : Nghiên cứu phương pháp giảm chiều biến dựa trên hàm nhân và ứng dụng trong bài toán dự báo kim ngạch xuất khẩu

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống