I. Giới thiệu về chuỗi thời gian
Chuỗi thời gian là tập hợp các giá trị quan sát được theo thời gian, thường được sử dụng trong các lĩnh vực như tài chính, thống kê, và dự báo thiên tai. Dữ liệu chuỗi thời gian có các đặc điểm như tính không cố định, tính không chắc chắn, tính xu hướng, và tính chu kỳ. Các kỹ thuật xử lý chuỗi thời gian bao gồm làm mịn và làm khác, giúp giảm thiểu nhiễu và cải thiện độ chính xác của dự báo.
1.1. Tính không cố định
Tính không cố định trong chuỗi thời gian thể hiện sự thay đổi của các thuộc tính thống kê như trung bình và phương sai theo thời gian. Điều này làm cho việc dự báo trở nên khó khăn. Các kỹ thuật như lấy sự khác biệt giữa các điểm dữ liệu thường được sử dụng để khắc phục vấn đề này.
1.2. Tính không chắc chắn
Tính không chắc chắn trong dữ liệu tài chính xuất phát từ sự ngẫu nhiên và rủi ro không thể đo lường được. Các mô hình dự báo cần phải tính đến yếu tố này để đưa ra các dự đoán chính xác hơn.
II. Ứng dụng SVM trong dự báo chuỗi thời gian tài chính
Máy hỗ trợ vector (SVM) là một thuật toán học máy được sử dụng rộng rãi trong dự báo chuỗi thời gian. Khác với các mạng nơron truyền thống, SVM tối ưu hóa cấu trúc rủi ro, giúp cải thiện độ chính xác của dự báo. Vector hỗ trợ hồi quy (SVR) là một biến thể của SVM, được áp dụng để dự báo các giá trị tương lai trong chuỗi thời gian.
2.1. Các loại hàm kernel trong SVM
Hàm kernel là yếu tố quan trọng trong SVM, giúp chuyển đổi dữ liệu sang không gian đặc trưng cao hơn. Các hàm kernel phổ biến bao gồm kernel tuyến tính, kernel đa thức, và kernel RBF. Mỗi hàm kernel có ưu điểm riêng, phù hợp với các loại dữ liệu khác nhau.
2.2. Đánh giá độ chính xác với MAPE
MAPE (Mean Absolute Percentage Error) là chỉ số được sử dụng để đánh giá độ chính xác của mô hình dự báo. MAPE đo lường sai số trung bình giữa giá trị dự báo và giá trị thực tế, giúp so sánh hiệu quả của các mô hình khác nhau.
III. Thực nghiệm và kết quả
Phần thực nghiệm của luận văn tập trung vào việc áp dụng SVM và SVR để dự báo giá cổ phiếu. Dữ liệu đầu vào là các chuỗi thời gian tài chính, được xử lý và phân tích để đưa ra các dự báo chính xác. Kết quả thực nghiệm cho thấy SVM có hiệu suất tốt hơn so với các mô hình truyền thống như mạng nơron nhân tạo.
3.1. Cài đặt thực nghiệm
Quá trình cài đặt thực nghiệm bao gồm việc chuẩn bị dữ liệu, lựa chọn hàm kernel, và tối ưu hóa các tham số của mô hình. GridSearch là kỹ thuật được sử dụng để tìm kiếm các tham số tối ưu, giúp cải thiện hiệu suất của mô hình.
3.2. Đánh giá kết quả
Kết quả thực nghiệm được đánh giá dựa trên các chỉ số như MAPE và độ chính xác của dự báo. Các kết quả cho thấy SVM và SVR có khả năng dự báo chính xác hơn so với các mô hình truyền thống, đặc biệt trong các chuỗi thời gian tài chính có độ nhiễu cao.