Dự báo Dữ Liệu Chuỗi Thời Gian Sử Dụng Mô Hình Lai Ghép GAN và ARIMA

Nghiên cứu mô hình lai ghép GAN và ARIMA trong dự báo chuỗi thời gian. Tìm hiểu phương pháp lựa chọn tham số và đánh giá hiệu quả mô hình.

Trường đại học

Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh

Chuyên ngành

Kỹ Thuật Dữ Liệu

Người đăng

Ẩn danh

Thể loại

Đồ án tốt nghiệp

2024

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. PHẦN 1: MỞ ĐẦU

1.1. LÝ DO CHỌN ĐỀ TÀI

1.2. ĐỐI TƯỢNG NGHIÊN CỨU

1.3. MỤC TIÊU NGHIÊN CỨU

1.4. NHIỆM VỤ NGHIÊN CỨU

1.5. GIỚI HẠN ĐỀ TÀI

2. PHẦN 2: NỘI DUNG

2. CHƯƠNG 1: CÁC KIẾN THỨC CƠ BẢN

1.1. TỔNG QUAN VỀ DỰ BÁO CHUỖI THỜI GIAN

1.2. TỔNG QUAN VỀ CHUỖI DỪNG

1.3. TỔNG QUAN VỀ MÔ HÌNH LAI GHÉP

1.4. CÁC CÔNG TRÌNH LIÊN QUAN

3. CHƯƠNG 2: MÔ HÌNH LAI GHÉP GAN VÀ ARIMA

2.1. TÌM HIỂU VỀ MÔ HÌNH THỐNG KÊ ARIMA

2.2. TÌM HIỂU CÁC PHƯƠNG PHÁP LỰA CHỌN THAM SỐ PDQ CỦA MÔ HÌNH ARIMA

2.3. MÔ HÌNH GENERATIVE ADVERSARIAL NETWORKS (GAN)

2.4. TÌM HIỂU CÁCH LAI GHÉP MÔ HÌNH GAN VÀ ARIMA

2.4.1. LAI GHÉP BẰNG MÔ HÌNH CỘNG

2.4.2. LAI GHÉP BẰNG MÔ HÌNH NHÂN

2.4.3. LAI GHÉP BẰNG MÔ HÌNH SONG SONG

4. CHƯƠNG 3: CÀI ĐẶT MÔ HÌNH

3.1. XỬ LÝ DỮ LIỆU

3.1.1. Tiền xử lý dữ liệu

3.1.2. Chia dữ liệu thành tập train và tập test

3.1.3. Tạo chuỗi huấn luyện, kiểm tra

3.1.4. Chuẩn hóa dữ liệu

3.1.5. Khử chuẩn hóa dữ liệu

3.1.6. Lấy chỉ mục của dữ liệu

3.2. MÔ HÌNH GAN

3.2.1. Xây dựng generator

3.2.2. Xây dựng discriminator

3.2.3. Xây dựng hàm tính loss generator

3.2.4. Xây dựng hàm tính loss discriminator

3.2.5. Huấn luyện mô hình gan

3.2.6. Tối ưu hóa mô hình gan

3.2.7. Kiểm thử mô hình gan

3.3. MÔ HÌNH ARIMA

3.3.1. Huấn luyện mô hình arima

3.3.2. Kiểm thử mô hình arima

3.4. MÔ HÌNH LAI GHÉP

3.4.1. Mô hình lai ghép cộng

3.4.2. Mô hình lai ghép nhân

3.4.3. Mô hình lai ghép song song

3.4.4. Kiểm thử mô hình lai ghép

5. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ

4.1. MÔI TRƯỜNG THỰC NGHIỆM

4.2. DỮ LIỆU THỰC NGHIỆM

4.2.1. Dữ liệu thời tiết

4.2.2. Dữ liệu giá vàng

4.2.3. Dữ liệu dầu thô

4.2.4. Dữ liệu sản xuất bia

4.3. CÁC TIÊU CHÍ ĐÁNH GIÁ

4.4. CÁC TRƯỜNG HỢP THỰC NGHIỆM

4.5. KẾT QUẢ THỰC NGHIỆM

4.5.1. Kết quả thực nghiệm trên tập dữ liệu thời tiết

4.5.2. Kết quả thực nghiệm trên tập dữ liệu giá vàng

4.5.3. Kết quả thực nghiệm trên tập dữ liệu dầu thô

4.5.4. Kết quả thực nghiệm trên tập dữ liệu dữ liệu sản xuất bia

4.6. ĐÁNH GIÁ KẾT QUẢ

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Dự Báo Chuỗi Thời Gian Với Mô Hình GAN ARIMA

Dự báo chuỗi thời gian là một lĩnh vực quan trọng trong phân tích dữ liệu, với mục tiêu dự đoán các giá trị tương lai dựa trên các quan sát trong quá khứ. Các phương pháp truyền thống như phương pháp dự báo thống kê và mô hình ARIMA đã được sử dụng rộng rãi. Tuy nhiên, chúng thường gặp khó khăn trong việc xử lý các chuỗi thời gian phi tuyến tính và phức tạp. Gần đây, phương pháp học sâu trong dự báo, đặc biệt là mô hình GAN, đã chứng minh khả năng mạnh mẽ trong việc nắm bắt các đặc tính phức tạp của dữ liệu. Việc kết hợp mô hình GAN và mô hình ARIMA trong một mô hình lai ghép GAN-ARIMA hứa hẹn mang lại độ chính xác và hiệu quả cao hơn. Nghiên cứu này tập trung vào khám phá tiềm năng của mô hình GAN-ARIMA trong ứng dụng dự báo. Theo [4], dự đoán chuỗi thời gian là một phương pháp phân tích nhằm dự đoán giá trị của chuỗi trong tương lai.

1.1. Các Thành Phần Cơ Bản Của Chuỗi Thời Gian

Chuỗi thời gian thường bao gồm các thành phần như xu hướng (trend), tính thời vụ (seasonality), chu kỳ (cycle) và tính bất thường (irregularity). Việc hiểu rõ các thành phần này là rất quan trọng để lựa chọn thuật toán dự báo phù hợp. Xu hướng thể hiện hướng đi dài hạn của dữ liệu, trong khi tính thời vụ thể hiện sự lặp lại theo chu kỳ cố định. Chu kỳ có thể kéo dài hơn tính thời vụ và tính bất thường là các biến động ngẫu nhiên. Theo [5], xu hướng, tính thời vụ, chu kỳ, và tính bất thường là các yếu tố quan trọng trong chuỗi thời gian.

1.2. Thách Thức Trong Dự Báo Chuỗi Thời Gian Phức Tạp

Một trong những thách thức lớn nhất trong dự báo chuỗi thời gian là xử lý các chuỗi phi tuyến tính, không dừng (non-stationary) và chứa nhiều nhiễu. Các phương pháp truyền thống thường gặp khó khăn trong việc nắm bắt các mối quan hệ phức tạp này, dẫn đến sai số dự báo cao. Để giải quyết vấn đề này, các phương pháp học sâu trong dự báo, đặc biệt là các mô hình lai ghép, đang ngày càng được quan tâm.

II. Vấn Đề Hạn Chế Của Mô Hình ARIMA Trong Thực Tế

Mặc dù mô hình ARIMA là một công cụ mạnh mẽ để phân tích chuỗi thời gian và dự báo, nó có một số hạn chế nhất định, đặc biệt khi áp dụng vào các chuỗi thời gian phức tạp. Mô hình ARIMA hoạt động tốt nhất với các chuỗi thời gian tuyến tính và dừng. Tuy nhiên, nhiều chuỗi thời gian thực tế, như dự báo tài chính hoặc dự báo năng lượng, thể hiện các đặc tính phi tuyến tính và không dừng. Điều này có thể dẫn đến dự báo kém chính xác khi sử dụng mô hình ARIMA đơn thuần. Bên cạnh đó, việc xác định các tham số (p, d, q) tối ưu cho mô hình ARIMA cũng là một thách thức.

2.1. Tính Tuyến Tính Và Tính Dừng Của Dữ Liệu

Mô hình ARIMA giả định rằng dữ liệu là tuyến tính và dừng. Nếu dữ liệu không đáp ứng các điều kiện này, cần thực hiện các phép biến đổi, chẳng hạn như lấy sai phân để chuyển đổi chuỗi thành chuỗi dừng, hoặc sử dụng các phương pháp dự báo thống kê phức tạp hơn. Tuy nhiên, việc biến đổi dữ liệu có thể làm mất đi thông tin quan trọng.

2.2. Khó Khăn Trong Việc Xác Định Tham Số Tối Ưu

Việc xác định các tham số (p, d, q) tối ưu cho mô hình ARIMA đòi hỏi kiến thức chuyên môn và kinh nghiệm. Các phương pháp tự động hóa, như AIC và BIC, có thể được sử dụng, nhưng chúng không phải lúc nào cũng đưa ra kết quả tốt nhất. Việc tìm kiếm tham số tối ưu có thể tốn nhiều thời gian và công sức.

2.3. Xử Lý Các Chuỗi Thời Gian Phi Tuyến Tính

Nhiều chuỗi thời gian thực tế, đặc biệt là trong lĩnh vực tài chính và kinh tế, có các thành phần phi tuyến tính đáng kể. Mô hình ARIMA, vốn là một mô hình tuyến tính, không thể nắm bắt được các mối quan hệ phức tạp này, dẫn đến độ chính xác dự báo giảm. Do đó, cần có các phương pháp tiếp cận mạnh mẽ hơn, chẳng hạn như mô hình GAN, để mô hình hóa các thành phần phi tuyến tính của chuỗi thời gian.

III. Giải Pháp Lai Ghép GAN ARIMA Để Nâng Cao Dự Báo

Để khắc phục những hạn chế của mô hình ARIMA và tận dụng sức mạnh của mô hình GAN, một giải pháp hiệu quả là kết hợp hai mô hình này trong một mô hình lai ghép. Mô hình GAN có khả năng học các phân phối dữ liệu phức tạp và tạo ra các mẫu dữ liệu mới, trong khi mô hình ARIMA có thể nắm bắt các mối quan hệ tuyến tính trong chuỗi thời gian. Sự kết hợp này cho phép mô hình lai ghép GAN-ARIMA xử lý cả các thành phần tuyến tính và phi tuyến tính của chuỗi thời gian, cải thiện độ chính xác dự báo. Ưu điểm GAN-ARIMA là có khả năng học các đặc trưng phức tạp của dữ liệu.

3.1. Cơ Chế Hoạt Động Của Mô Hình Lai Ghép GAN ARIMA

Mô hình lai ghép GAN-ARIMA thường hoạt động theo hai giai đoạn chính. Đầu tiên, mô hình GAN được sử dụng để tạo ra các mẫu dữ liệu mới dựa trên dữ liệu lịch sử. Sau đó, mô hình ARIMA được huấn luyện trên dữ liệu gốc và dữ liệu được tạo ra bởi mô hình GAN. Cuối cùng, mô hình ARIMA được sử dụng để dự báo các giá trị tương lai.

3.2. Lợi Ích Của Việc Kết Hợp GAN Và ARIMA

Việc kết hợp mô hình GAN và mô hình ARIMA mang lại nhiều lợi ích. Mô hình GAN có thể giúp mô hình ARIMA học được các đặc tính phi tuyến tính của dữ liệu, trong khi mô hình ARIMA có thể cung cấp thông tin về xu hướng và tính thời vụ. Sự kết hợp này có thể cải thiện độ chính xác dự báo và giảm sai số dự báo.

IV. Hướng Dẫn Xây Dựng Mô Hình Lai Ghép GAN ARIMA Hiệu Quả

Để xây dựng một mô hình lai ghép GAN-ARIMA hiệu quả, cần tuân thủ một số bước quan trọng. Đầu tiên, cần chuẩn bị dữ liệu chuỗi thời gian, bao gồm làm sạch, chuẩn hóa và chia dữ liệu thành tập huấn luyện và tập kiểm tra. Tiếp theo, cần xây dựng và huấn luyện mô hình GAN và mô hình ARIMA riêng biệt. Cuối cùng, cần kết hợp hai mô hình này và đánh giá hiệu quả dự báo. Việc lựa chọn kiến trúc phù hợp cho Kiến trúc GAN và tham số cho mô hình ARIMA là rất quan trọng.

4.1. Các Bước Chuẩn Bị Dữ Liệu Chuỗi Thời Gian

Việc chuẩn bị dữ liệu là một bước quan trọng trong quá trình xây dựng mô hình lai ghép GAN-ARIMA. Cần làm sạch dữ liệu bằng cách xử lý các giá trị thiếu và các giá trị ngoại lai. Sau đó, cần chuẩn hóa dữ liệu để đảm bảo rằng tất cả các giá trị nằm trong một phạm vi nhất định. Cuối cùng, cần chia dữ liệu thành tập huấn luyện và tập kiểm tra để đánh giá hiệu quả dự báo.

4.2. Lựa Chọn Kiến Trúc Và Tham Số Cho GAN Và ARIMA

Việc lựa chọn kiến trúc và tham số phù hợp cho mô hình GAN và mô hình ARIMA là rất quan trọng để đạt được hiệu quả dự báo tốt nhất. Đối với mô hình GAN, cần lựa chọn kiến trúc phù hợp với đặc tính của dữ liệu. Đối với mô hình ARIMA, cần xác định các tham số (p, d, q) tối ưu. Các phương pháp tự động hóa, như AIC và BIC, có thể được sử dụng.

V. Ứng Dụng Dự Báo Tài Chính Với Mô Hình GAN ARIMA Thử Nghiệm

Một ứng dụng dự báo tiềm năng của mô hình lai ghép GAN-ARIMA là trong lĩnh vực dự báo tài chính. Các chuỗi thời gian tài chính, như giá cổ phiếu và tỷ giá hối đoái, thường có tính phi tuyến tính và biến động cao. Mô hình lai ghép GAN-ARIMA có thể giúp nắm bắt các đặc tính phức tạp này và cải thiện độ chính xác dự báo. Nghiên cứu này sẽ trình bày kết quả thực nghiệm trên một số bộ dữ liệu tài chính thực tế để chứng minh hiệu quả của mô hình lai ghép GAN-ARIMA. Một vài ứng dụng dự báo khác cũng rất tiềm năng như Dự báo năng lượng, Dự báo nhu cầu và Dự báo bán hàng.

5.1. Thực Nghiệm Với Dữ Liệu Giá Cổ Phiếu

Thực nghiệm sẽ được thực hiện trên dữ liệu giá cổ phiếu của một số công ty lớn. Mô hình lai ghép GAN-ARIMA sẽ được huấn luyện trên dữ liệu lịch sử và sau đó được sử dụng để dự báo giá cổ phiếu trong tương lai. Kết quả dự báo sẽ được so sánh với các phương pháp truyền thống, như mô hình ARIMA đơn thuần.

5.2. So Sánh Kết Quả Dự Báo Với Các Phương Pháp Khác

Kết quả dự báo từ mô hình lai ghép GAN-ARIMA sẽ được so sánh với kết quả từ mô hình ARIMA đơn thuần và các phương pháp dự báo khác. Các độ đo như Mean Absolute Error (MAE), Root Mean Squared Error (RMSE) và Mean Absolute Percentage Error (MAPE) sẽ được sử dụng để đánh giá hiệu quả dự báo. Đánh giá hiệu quả dự báo là bước quan trọng để chứng minh ưu điểm của mô hình lai ghép GAN-ARIMA.

VI. Kết Luận Tiềm Năng Phát Triển Của Mô Hình GAN ARIMA

Mô hình lai ghép GAN-ARIMA là một hướng nghiên cứu đầy tiềm năng trong lĩnh vực dự báo chuỗi thời gian. Kết quả thực nghiệm cho thấy rằng mô hình lai ghép GAN-ARIMA có thể cải thiện độ chính xác dự báo so với các phương pháp truyền thống. Trong tương lai, có thể nghiên cứu các biến thể khác của mô hình lai ghép GAN-ARIMA, cũng như áp dụng vào các lĩnh vực khác nhau. Cải tiến mô hình GAN-ARIMA có thể được thực hiện bằng cách sử dụng các kiến trúc GAN phức tạp hơn hoặc bằng cách kết hợp với các kỹ thuật học sâu khác.

6.1. Các Hướng Nghiên Cứu Tiếp Theo Cho Mô Hình GAN ARIMA

Trong tương lai, có thể nghiên cứu các biến thể khác của mô hình lai ghép GAN-ARIMA, chẳng hạn như sử dụng các kiến trúc GAN phức tạp hơn hoặc kết hợp với các kỹ thuật học sâu khác. Ngoài ra, có thể áp dụng mô hình lai ghép GAN-ARIMA vào các lĩnh vực khác nhau, như dự báo năng lượng, dự báo nhu cầu và dự báo bán hàng.

6.2. Ứng Dụng Thực Tế Của Mô Hình GAN ARIMA Trong Tương Lai

Mô hình lai ghép GAN-ARIMA có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Ví dụ, nó có thể được sử dụng để dự báo giá cổ phiếu, tỷ giá hối đoái, nhu cầu năng lượng, doanh số bán hàng và nhiều chuỗi thời gian khác. Việc áp dụng mô hình lai ghép GAN-ARIMA có thể giúp các doanh nghiệp và tổ chức đưa ra các quyết định tốt hơn và cải thiện hiệu quả hoạt động.

26/04/2025

Bạn đang xem trước tài liệu:

Dự báo dữ liệu chuỗi thời gian sử dụng mô hình lai ghép gan và arima

Tải đầy đủ

Trích đoạn nội dung tài liệu

CHƯƠNG 1: CÁC KIẾN THỨC CƠ BẢN 1. TỔNG QUAN VỀ DỰ BÁO CHUỖI THỜI GIAN Định nghĩa: Dự đoán chuỗi thời gian là một phương pháp phân tích và khai phá dữ liệu được ghi lại hoặc thu thập theo thời gian. Nó nhằm dự đoán giá trị của chuỗi trong tương lai. [4] Các thành phần của chuỗi thời gian: Xu hướng: Xu hướng dài hạn của dữ liệu là một khía cạnh quan trọng của chuỗi thời gian.

Xu hướng có thể là tăng, giảm hoặc không đổi. Nếu dữ liệu có xu hướng tăng, điều này ngụ ý rằng giá trị của nó đang tăng dần theo thời gian. Ngược lại, nếu có xu hướng giảm, đó có nghĩa là giá trị đang giảm dần theo thời gian. Trong trường hợp không có sự thay đổi đáng kể qua thời gian, dữ liệu được coi là có xu hướng đi ngang.

[5] Tính thời vụ: là sự lặp lại của các biến đổi theo một chu kỳ cố định, thường do các yếu tố như thời tiết hoặc các ngày lễ. [5] Chu kỳ: là một khía cạnh khác của chuỗi thời gian, biểu hiện sự lặp lại của dữ liệu theo một khoảng thời gian dài hơn so với tính thời vụ. Tính bất thường xuất hiện khi có các biến động ngẫu nhiên trong dữ liệu, thường là do các yếu tố ngoại lai không mong muốn như lỗi trong quá trình thu thập dữ liệu hoặc các sự kiện bất thường như đợt dịch bệnh. [5] Tính bất thường: Các tình huống/sự kiện/kịch bản bất ngờ và tăng đột biến trong khoảng thời gian ngắn.

TỔNG QUAN VỀ CHUỖI DỪNG Định nghĩa: Chuỗi dừng (stationary series) là một khái niệm quan trọng trong phân tích chuỗi thời gian. Chuỗi dừng có các đặc điểm thống kê như kỳ vọng (mean), phương sai (variance), hiệp phương sai (covariance) và độ lệch chuẩn (standard deviation) không thay đổi theo thời gian. Điều này có nghĩa là các đặc tính của chuỗi không phụ thuộc vào thời điểm bắt đầu hoặc kết thúc, làm cho chuỗi dễ dàng dự đoán một cách hiệu quả và chính xác hơn. [8] Các loại chuỗi dừng: 3  Chuỗi dừng nghiêm ngặt (Strict Stationary): Chuỗi thỏa mãn định nghĩa toán học của quá trình dừng.

Trung bình, phương sai và hiệp phương sai không phụ thuộc vào thời gian.  Chuỗi dừng mùa vụ (Seasonal Stationary): Chuỗi thể hiện tính thời vụ  Chuỗi dừng xu hướng (Trend Stationary): Chuỗi thể hiện tính xu hướng. [8] Kiểm tra chuỗi dừng:  Trực quan hóa: Quan sát biểu đồ chuỗi thời gian để xem xét các đặc tính thống kê.  ADF Test (Augmented Dickey-Fuller Test): Kiểm tra tính dừng của chuỗi thông qua các kiểm định thống kê.

 KPSS Test (Kwiatkowski-Phillips-Schmidt-Shin Test): Kiểm định khác để kiểm tra tính dừng của chuỗi thời gian. [8] Lợi ích của chuỗi dừng: Chuỗi dừng có tính ổn định về mặt thống kê, giúp cho các mô hình dự báo như ARIMA hoạt động hiệu quả hơn. Nếu chuỗi không dừng, ta có thể sử dụng các phương pháp như lấy sai phân để chuyển đổi thành chuỗi dừng. Ứng dụng: Chuỗi dừng được áp dụng rộng rãi trong kinh tế, tài chính và nhiều lĩnh vực khác để dự báo và phân tích dữ liệu chuỗi thời gian.

TỔNG QUAN VỀ MÔ HÌNH LAI GHÉP Mô hình lai ghép, hay còn gọi là Ensemble Model, là một phương pháp trong máy học và học sâu, nơi nhiều mô hình được kết hợp lại để tạo ra một dự đoán hoặc phân loại cuối cùng. Ý tưởng cơ bản của mô hình lai ghép là kết hợp sức mạnh của nhiều mô hình khác nhau để cải thiện hiệu suất dự đoán so với việc sử dụng một mô hình đơn lẻ. CÁC CÔNG TRÌNH LIÊN QUAN Time Series Forecasting using Hybrid ARIMA and ANN Models based on DWT Decomposition: đây là bài báo được viết bởi Khandelwal, I. Trong kết luận của bài báo, tác giả nhấn mạnh rằng việc dự báo chuỗi thời 4 gian chính xác là rất quan trọng nhưng đầy thách thức.

ARIMA và ANN là hai mô hình dự báo phổ biến: ARIMA phù hợp với dữ liệu tuyến tính, trong khi ANN phù hợp với dữ liệu phi tuyến tính. Do chuỗi thời gian thực tế thường chứa cả cấu trúc tuyến tính và phi tuyến, bài báo đề xuất phương pháp dự báo kết hợp sử dụng cả ARIMA và ANN bằng phương pháp tuần tự cộng. Kết quả thực nghiệm cho thấy phương pháp này dự báo tốt hơn so với các mô hình ARIMA, ANN, và mô hình kết hợp của Zhang.[7] Forecasting energy consumption using ensemble ARIMA–ANFIS hybrid algorithm: đây là bài báo được viết bởi Sasan Barak and S. Bài báo trên đưa ra kết luận rằng sử dụng các mô hình lai đặc biệt có thể đem lại kết quả mong muốn với độ chính xác cao, đặc biệt khi cả hai mô hình đều có sức mạnh dự báo tốt.

Mô hình ARIMA dự báo tốt phần dữ liệu tuyến tính, sử dụng ANFIS cho phần dữ liệu phi tuyến có thể tăng cường hiệu quả dự báo. So sánh các mô hình được đề xuất, có thể kết luận rằng các mô hình lai có độ chính xác và sức mạnh tốt hơn so với mỗi mô hình riêng lẻ. [9] Carbon price forecasting with a novel hybrid ARIMA and least squares support vector machines methodology: bài báo được viết bởi của Bangzhu Zhu và Yi- Ming Wei giới thiệu một mô hình dự báo kết hợp giữa ARIMA và vector machine hỗ trợ bình phương nhỏ nhất (LSSVM) để dự đoán giá carbon. Mô hình này sử dụng ARIMA để nắm bắt các mô hình tuyến tính và LSSVM cho các mô hình phi tuyến.

Tối ưu hóa tham số của LSSVM được thực hiện bằng cách sử dụng thuật toán tối ưu bầy đàn (PSO). Kết quả cho thấy mô hình kết hợp này cải thiện độ chính xác dự báo so với các phương pháp truyền thống. [10] Forecasting Crude Oil Prices Using an ARIMA-ANN Hybrid Model đây là bài báo được viết bởi Hleil Alrweili và Haitham Fawzy. Bài báo này so sánh giữa các mô hình ARIMA, ANN và ARIMA-ANN để dự đoán giá Dầu Thô hàng tháng.

Kết quả cho thấy mô hình kết hợp ARIMA-ANN có độ chính xác cao nhất, là mô hình dự báo hiệu quả nhất. Trong tương lai, tác giả đề xuất cải thiện kết quả bằng cách sử dụng phương pháp kết hợp ARIMA và SVR. Không có xung đột lợi ích được tuyên bố. [11] Wind speed forecasting in three different regions of Mexico, using a hybrid ARIMA-ANN model: Bài báo của Erasmo Cadenas và Wilfrido Rivera cho rằng việc 5 kết hợp mô hình Autoregressive Integrated Moving Average cùng một mô hình Mạng Nơ-ron Nhân tạo đã đề xuất và phát triển để dự đoán tốc độ gió tại ba vùng khác nhau của México đã mang lại hiệu suất đáng chú ý.

Kết quả thể hiện rằng ba mô hình này đã dự đoán một cách khá hợp lý hành vi của chuỗi thời gian tại các địa điểm khác nhau. Tuy nhiên, thông qua việc đánh giá các độ đo lỗi thống kê, rõ ràng là các mô hình Hybrid dự đoán với độ chính xác cao hơn so với cả hai mô hình ARIMA và ANN độc lập tại ba địa điểm được nghiên cứu. Điều này đề xuất rằng mô hình Hybrid có thể là một giải pháp tốt hơn để dự báo tốc độ gió. 6 CHƯƠNG 2: MÔ HÌNH LAI GHÉP GAN VÀ ARIMA 2.

TÌM HIỂU VỀ MÔ HÌNH THỐNG KÊ ARIMA 2.1 Tổng quan ARIMA (AutoRegressive Integrated Moving Average) là một mô hình dự đoán chuỗi thời gian phổ biến trong lĩnh vực dự báo và phân tích chuỗi thời gian, dữ liệu trong quá khứ sẽ được sử dụng để dự báo dữ liệu trong tương lai. Mô hình ARIMA kết hợp ba thành phần chính gồm: AutoRegressive (AR), Integrated (I), và Moving Average (MA) [1]. Dưới đây là một tổng quan về từng thành phần này: 2.2 Mô hình AR(p) Ý tưởng chính của mô hình AR (AutoRegressive) là hồi quy dựa trên chính số liệu quá khứ ở những chu kỳ trước. Tức là mô hình dự đoán giá trị hiện tại của chuỗi dữ liệu dựa trên các quan sát trước đó trong chuỗi.

𝑝 𝑋(𝑡 ) = 𝑐 + ∑ 𝛽𝑖 × 𝑋𝑡−𝑖 + 𝜀𝑡 𝑖=1 Trong đó:  X(t): là giá trị chuỗi thời gian tại thời điểm t.  c: hệ số chặn.  p: là số kỳ trước đó được sử dụng.  𝛽𝑖 : hệ số trễ i  𝜀𝑡 : sai số dự báo ngẫu nhiên của mô hình tại thời điểm t.3 Mô hình MA(q) Ý tưởng chính của mô hình MA (Moving Average) là giá trị của chuỗi thời gian tại một thời điểm được tính dựa trên các sai số dự báo quá khứ.

Mô hình MA được sử dụng để mô hình hóa và dự đoán các biến thay đổi ngẫu nhiên trong dữ liệu chuỗi thời gian. 𝑞 𝑋(𝑡) = 𝑐 + ∑ ∅𝑖 × 𝜀𝑡−𝑖 + 𝜀𝑡 𝑖=1 Trong đó: 7  X(t): là giá trị chuỗi thời gian tại thời điểm t.  c: hệ số chặn.  q: là số kỳ trước đó được sử dụng.

 𝜀𝑡 : sai số dự báo ngẫu nhiên của mô hình tại thời điểm t.  ∅𝑖 : hệ số trung bình trượt i. Quá trình sai phân có thể được thực hiện bằng cách lấy hiệu của giá trị tại thời điểm hiện tại và giá trị tại một thời điểm trước đó, thường là lấy hiệu bậc một [2]. Việc xác định mức độ sai phân phù hợp là một phần quan trọng của việc xây dựng một mô hình ARIMA hiệu quả.

Một mức độ sai phân thấp có thể dẫn đến mô hình không ổn định hoặc dự báo không chính xác, trong khi mức độ sai phân quá cao có thể làm mất đi thông tin quan trọng từ chuỗi thời gian. Sai phân lần 1 (I(1)) : y(t) = x(t) – x(t-1) Sai phân lần 2 (I(2)) : z(t) = y(t) – y(t-1) [2] 2.5 Mô hình ARIMA ARIMA (AutoRegressive Integrated Moving Average) là một mô hình dự đoán chuỗi thời gian phổ biến trong lĩnh vực dự báo và phân tích chuỗi thời gian, dữ liệu trong quá khứ sẽ được sử dụng để dự báo dữ liệu trong tương lai. Mô hình ARIMA kết hợp ba thành phần chính gồm: AutoRegressive (AR), Integrated (I), và Moving Average (MA) [1]. Công thức đầy đủ của mô hình ARIMA gồm [3]: 𝑝 𝑞 𝑋(𝑡 ) = 𝑐 + ∑ 𝛽𝑖 × 𝑋𝑡−𝑖 + ∑ ∅𝑖 × 𝜀𝑡−𝑖 + 𝜀𝑡 𝑖=1 𝑖=1 2.

TÌM HIỂU CÁC PHƯƠNG PHÁP LỰA CHỌN THAM SỐ PDQ CỦA MÔ HÌNH ARIMA.1 Hàm tự tương quan ACF 8 Hàm tự tương quan Autocorrelation (ACF) đo lường sự tương quan giữa chuỗi và độ trễ của chính nó, các giá trị càng gần nhau hoặc nằm trong một chu kỳ thì độ tương quan càng mạnh. Hàm tự tương quan ACF và thường dùng để tìm ra độ trễ của quá trình trung bình trượt MV(q) và số lần sai phân cần thiết để có được chuỗi dừng, khi đó biểu đồ ACF đạt đến giá trị 0 khá nhanh [3] 2.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Dự báo chuỗi thời gian nâng cao

Mô hình lai ghép trong dự báo

Ứng dụng thực tế của GAN-ARIMA

Kết hợp GAN và ARIMA để dự báo