I. Giới thiệu đề tài
Luận văn thạc sĩ khoa học máy tính này tập trung vào việc kết hợp mạng nơron và thu giảm số chiều trong dự báo chuỗi thời gian. Mục tiêu chính là so sánh hiệu quả của việc kết hợp mạng nơron nhân tạo với các phương pháp thu giảm số chiều như PIP và PAA trong việc dự báo dữ liệu chuỗi thời gian. Luận văn đề xuất hai cách kết hợp: thu giảm số chiều trên toàn bộ tập dữ liệu huấn luyện và thu giảm trên dữ liệu cửa sổ trượt trong quá trình huấn luyện.
1.1 Dữ liệu chuỗi thời gian
Dữ liệu chuỗi thời gian là tập hợp các quan sát được thực hiện liên tục theo thời gian. Các thành phần chính của chuỗi thời gian bao gồm xu hướng dài hạn, chu kỳ, mùa và các yếu tố bất thường. Việc phân tích chuỗi thời gian có ứng dụng rộng rãi trong các bài toán như tìm kiếm tương tự, gom cụm, phân loại và dự báo.
1.2 Bài toán dự báo chuỗi thời gian
Dự báo chuỗi thời gian là quá trình sử dụng các giá trị đã biết để dự đoán các giá trị tương lai. Các phương pháp dự báo phổ biến bao gồm SVM, mạng nơron nhân tạo và các mô hình thống kê. Trong đó, mạng nơron được đánh giá cao nhờ khả năng xử lý dữ liệu phức tạp và cho kết quả chính xác hơn.
II. Cơ sở lý thuyết
Chương này trình bày cơ sở lý thuyết về mạng nơron nhân tạo và các phương pháp thu giảm số chiều như PAA và PIP. Mạng nơron được sử dụng để dự báo chuỗi thời gian thông qua việc huấn luyện trên tập dữ liệu đầu vào. Các phương pháp thu giảm số chiều giúp giảm kích thước dữ liệu mà vẫn giữ được thông tin tổng quát, từ đó tối ưu hóa quá trình huấn luyện.
2.1 Mạng nơron nhân tạo
Mạng nơron nhân tạo mô phỏng hoạt động của não người, bao gồm các đơn vị tính toán (nơron) kết nối với nhau. Quá trình huấn luyện mạng nơron sử dụng các giải thuật như lan truyền ngược và RPROP để tối ưu hóa mô hình. Mạng nơron được ứng dụng rộng rãi trong dự báo chuỗi thời gian nhờ khả năng học từ dữ liệu phức tạp.
2.2 Phương pháp thu giảm số chiều
Các phương pháp thu giảm số chiều như PAA và PIP giúp giảm kích thước dữ liệu mà vẫn giữ được thông tin quan trọng. PAA là phương pháp lấy mẫu đơn giản, trong khi PIP chọn các điểm quan trọng từ chuỗi dữ liệu. Cả hai phương pháp đều được sử dụng để tối ưu hóa quá trình huấn luyện mạng nơron trong dự báo chuỗi thời gian.
III. Kết hợp mạng nơron và thu giảm số chiều
Chương này trình bày hai cách kết hợp mạng nơron với các phương pháp thu giảm số chiều. Cách thứ nhất là thu giảm số chiều trên toàn bộ tập dữ liệu huấn luyện, cách thứ hai là thu giảm trên dữ liệu cửa sổ trượt trong quá trình huấn luyện. Cả hai cách đều nhằm mục đích tối ưu hóa quá trình huấn luyện và nâng cao khả năng dự báo của mạng nơron.
3.1 Thu giảm số chiều trên toàn bộ tập dữ liệu
Phương pháp này áp dụng thu giảm số chiều trên toàn bộ tập dữ liệu huấn luyện mạng nơron. Kết quả là tập dữ liệu được giảm kích thước nhưng vẫn giữ được thông tin tổng quát, giúp tăng tốc độ huấn luyện và cải thiện hiệu suất dự báo.
3.2 Thu giảm số chiều trên dữ liệu cửa sổ trượt
Phương pháp này chỉ áp dụng thu giảm số chiều trên dữ liệu cửa sổ trượt trong quá trình huấn luyện. Điều này giúp giảm thiểu thời gian tính toán mà vẫn đảm bảo độ chính xác của mô hình dự báo.
IV. Hiện thực và thực nghiệm
Chương này trình bày quá trình hiện thực chương trình thử nghiệm và kết quả thực nghiệm. Chương trình được xây dựng để so sánh hiệu quả của việc kết hợp mạng nơron với các phương pháp thu giảm số chiều. Kết quả thực nghiệm cho thấy việc kết hợp mạng nơron với PIP hoặc PAA giúp cải thiện đáng kể hiệu suất dự báo.
4.1 Cấu trúc chương trình
Chương trình được thiết kế để thử nghiệm hai cách kết hợp mạng nơron với thu giảm số chiều. Giao diện chương trình cho phép người dùng nhập dữ liệu, chọn phương pháp thu giảm và xem kết quả dự báo.
4.2 Kết quả thực nghiệm
Kết quả thực nghiệm cho thấy việc kết hợp mạng nơron với PIP hoặc PAA giúp giảm thời gian huấn luyện và cải thiện độ chính xác dự báo. Phương pháp PIP cho kết quả tốt hơn trong việc giữ lại thông tin quan trọng từ chuỗi dữ liệu.
V. Kết luận
Luận văn kết luận rằng việc kết hợp mạng nơron với các phương pháp thu giảm số chiều như PIP và PAA mang lại hiệu quả cao trong dự báo chuỗi thời gian. Phương pháp PIP được đánh giá cao hơn nhờ khả năng giữ lại các điểm quan trọng từ chuỗi dữ liệu. Luận văn cũng đề xuất hướng phát triển trong tương lai là nghiên cứu sâu hơn về các phương pháp thu giảm số chiều và ứng dụng của chúng trong các bài toán thực tế.