Tổng quan nghiên cứu
Trong bối cảnh thị trường chứng khoán ngày càng phát triển và trở nên phức tạp, việc dự đoán chính xác chỉ số chứng khoán như VN-Index đóng vai trò quan trọng trong việc hỗ trợ nhà đầu tư ra quyết định giao dịch hiệu quả, giảm thiểu rủi ro và tối đa hóa lợi nhuận. Theo dữ liệu thu thập từ ngày 01/01/2009 đến 31/12/2019, chỉ số VN-Index có nhiều biến động phức tạp với các yếu tố phi tuyến tính và chuỗi thời gian đa chiều. Mục tiêu nghiên cứu của luận văn là xây dựng và cải tiến hệ thống dự đoán chỉ số VN-Index dựa trên mô hình học sâu kết hợp giữa mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy dài hạn (LSTM), nhằm nâng cao độ chính xác dự báo so với các mô hình truyền thống như ARIMA hay các mô hình mạng nơ-ron đơn lẻ.
Phạm vi nghiên cứu tập trung vào dữ liệu chứng khoán Việt Nam trong khoảng thời gian 10 năm, sử dụng dữ liệu giá mở cửa, giá đóng cửa, giá cao, giá thấp và khối lượng giao dịch theo từng ngày. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện các chỉ số đánh giá mô hình như RMSE, MAPE và RMAE, giúp nhà đầu tư có công cụ dự báo tin cậy hơn, từ đó nâng cao hiệu quả đầu tư và quản lý rủi ro trên thị trường chứng khoán Việt Nam.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên hai mô hình học sâu chủ đạo: mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy dài hạn (LSTM). CNN được sử dụng để trích xuất đặc trưng từ dữ liệu hình ảnh biểu đồ nến Nhật kết hợp với biểu đồ khối lượng giao dịch (Candlebar chart), giúp nhận diện các mẫu phức tạp trong dữ liệu thị trường chứng khoán. Mô hình CNN trong nghiên cứu được xây dựng dựa trên kiến trúc ResNet với các khối bottleneck residual nhằm giảm thiểu hiện tượng quá khớp và tăng độ sâu mạng mà không làm giảm hiệu suất.
Mạng LSTM được áp dụng để xử lý dữ liệu chuỗi thời gian giá cổ phiếu, khắc phục hạn chế của mạng RNN truyền thống trong việc ghi nhớ thông tin dài hạn. LSTM sử dụng các cổng quên, cổng vào và cổng ra để điều chỉnh thông tin lưu giữ và truyền tải, giúp mô hình học được các phụ thuộc phức tạp trong chuỗi dữ liệu tài chính.
Ba khái niệm chính được sử dụng trong nghiên cứu gồm:
- Chuỗi thời gian phi tuyến tính: đặc trưng của dữ liệu chứng khoán với xu hướng và biến động theo mùa.
- Residual learning: kỹ thuật học phần dư trong mạng ResNet giúp giảm thiểu vấn đề gradient biến mất.
- Joint learning: phương pháp học kết hợp đồng thời các đặc trưng từ CNN và LSTM để nâng cao hiệu quả dự đoán.
Phương pháp nghiên cứu
Nguồn dữ liệu chính được sử dụng là bộ dữ liệu giá cổ phiếu và khối lượng giao dịch của VN-Index từ ngày 01/01/2009 đến 31/12/2019, cùng dữ liệu chi tiết theo phút từ 14/10/2016 đến 16/10/2017 với tổng cộng 97.474 bản ghi, lấy từ cơ sở dữ liệu Thomson Reuters. Dữ liệu được chia thành 70% cho huấn luyện, 10% cho xác nhận và 20% cho kiểm thử.
Phương pháp phân tích bao gồm:
- Tiền xử lý dữ liệu chuỗi thời gian và chuyển đổi dữ liệu thành dạng hình ảnh biểu đồ nến kết hợp biểu đồ khối lượng để làm đầu vào cho mô hình CNN.
- Xây dựng mô hình SC-CNN dựa trên kiến trúc ResNet-50 được điều chỉnh phù hợp với dữ liệu biểu đồ chứng khoán.
- Xây dựng mô hình ST-LSTM để xử lý dữ liệu chuỗi thời gian giá đóng cửa và khối lượng giao dịch.
- Kết hợp hai mô hình trên thành mô hình LSTM-CNN với phương pháp joint learning nhằm khai thác đồng thời đặc trưng hình ảnh và chuỗi thời gian.
- Đánh giá hiệu suất mô hình bằng các chỉ số RMSE, MAPE và RMAE, so sánh với các mô hình truyền thống như ARIMA và các mô hình mạng nơ-ron đơn lẻ.
Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ năm 2019 đến 2021, với các bước thu thập dữ liệu, xây dựng mô hình, huấn luyện và đánh giá kết quả.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu suất mô hình LSTM-CNN vượt trội: Mô hình kết hợp LSTM-CNN đạt RMSE thấp hơn 15% so với mô hình ARIMA truyền thống khi dự đoán chỉ số VN-Index trong 10 năm, đồng thời MAPE giảm từ khoảng 5.2% xuống còn 3.8%, cho thấy độ chính xác dự báo được cải thiện rõ rệt.
Ảnh hưởng tích cực của dữ liệu biểu đồ nến kết hợp khối lượng: Việc sử dụng biểu đồ Candlebar tích hợp dữ liệu khối lượng giao dịch làm đầu vào cho mô hình SC-CNN giúp tăng độ chính xác dự đoán lên khoảng 12% so với việc chỉ sử dụng dữ liệu chuỗi thời gian thuần túy.
Khả năng ghi nhớ dài hạn của LSTM: Mô hình ST-LSTM cho thấy khả năng dự đoán xu hướng giá trong ngắn hạn (5 phút đến 30 phút) với độ chính xác tăng 10% so với mạng RNN truyền thống, nhờ vào cấu trúc cổng quên và cổng vào giúp giữ thông tin quan trọng.
Joint learning nâng cao hiệu quả tổng thể: Việc kết hợp đồng thời đặc trưng từ CNN và LSTM thông qua joint learning giúp mô hình LSTM-CNN đạt được hiệu suất tốt hơn khoảng 8% so với việc huấn luyện riêng lẻ từng mô hình.
Thảo luận kết quả
Nguyên nhân chính của sự cải thiện hiệu suất dự báo là do mô hình LSTM-CNN tận dụng được cả đặc trưng không gian từ hình ảnh biểu đồ và đặc trưng thời gian từ chuỗi dữ liệu giá cổ phiếu. So với các nghiên cứu trước đây chỉ sử dụng mô hình ARIMA hoặc mạng nơ-ron đơn lẻ, mô hình kết hợp này có khả năng học sâu hơn và tổng quát hóa tốt hơn trên dữ liệu phức tạp của thị trường chứng khoán Việt Nam.
Kết quả cũng phù hợp với các nghiên cứu quốc tế về việc áp dụng mạng neural sâu trong dự báo tài chính, đồng thời khẳng định tính hiệu quả của việc sử dụng kiến trúc ResNet và kỹ thuật residual learning để tránh hiện tượng quá khớp khi mạng quá sâu.
Dữ liệu có thể được trình bày qua các biểu đồ so sánh RMSE, MAPE giữa các mô hình ARIMA, LSTM, CNN và LSTM-CNN, cũng như biểu đồ dự đoán giá thực tế và giá dự báo của VN-Index trong các khoảng thời gian khác nhau, giúp minh họa rõ ràng sự vượt trội của mô hình đề xuất.
Đề xuất và khuyến nghị
Triển khai mô hình LSTM-CNN trong hệ thống giao dịch tự động: Áp dụng mô hình vào các nền tảng giao dịch chứng khoán để hỗ trợ nhà đầu tư ra quyết định mua bán nhanh chóng, giảm thiểu rủi ro, với mục tiêu giảm RMSE xuống dưới 3% trong vòng 1 năm.
Mở rộng dữ liệu đầu vào đa dạng hơn: Kết hợp thêm các dữ liệu kinh tế vĩ mô, tin tức tài chính và các chỉ báo kỹ thuật để nâng cao độ chính xác dự báo, thực hiện trong vòng 2 năm tới bởi các tổ chức nghiên cứu và công ty công nghệ tài chính.
Phát triển giao diện trực quan cho người dùng cuối: Xây dựng dashboard trực quan hiển thị dự báo chỉ số VN-Index và các cảnh báo rủi ro, giúp nhà đầu tư dễ dàng tiếp cận thông tin, hoàn thành trong 6 tháng tới bởi các công ty phát triển phần mềm.
Nâng cao khả năng dự báo đa khung thời gian: Phát triển mô hình dự báo cho các khung thời gian ngắn hạn, trung hạn và dài hạn nhằm phục vụ đa dạng nhu cầu đầu tư, với mục tiêu cải thiện độ chính xác dự báo xu hướng trong vòng 1 năm, do các nhóm nghiên cứu chuyên sâu thực hiện.
Đối tượng nên tham khảo luận văn
Nhà đầu tư cá nhân và tổ chức: Có thể sử dụng kết quả nghiên cứu để nâng cao hiệu quả giao dịch, giảm thiểu rủi ro và tối ưu hóa lợi nhuận thông qua các dự báo chính xác về biến động chỉ số VN-Index.
Các công ty công nghệ tài chính (Fintech): Áp dụng mô hình học sâu kết hợp CNN-LSTM để phát triển các sản phẩm phân tích và dự báo thị trường chứng khoán, từ đó nâng cao giá trị dịch vụ và cạnh tranh trên thị trường.
Các nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Tài chính: Tham khảo phương pháp kết hợp mô hình học sâu và kỹ thuật xử lý dữ liệu chuỗi thời gian, từ đó phát triển các nghiên cứu tiếp theo hoặc ứng dụng trong các lĩnh vực tương tự.
Cơ quan quản lý thị trường chứng khoán: Sử dụng kết quả nghiên cứu để theo dõi, phân tích xu hướng thị trường, hỗ trợ xây dựng các chính sách quản lý và giám sát hiệu quả hơn.
Câu hỏi thường gặp
Mô hình LSTM-CNN có ưu điểm gì so với các mô hình truyền thống?
Mô hình LSTM-CNN kết hợp khả năng trích xuất đặc trưng không gian từ biểu đồ hình ảnh và đặc trưng thời gian từ chuỗi dữ liệu, giúp dự báo chính xác hơn so với các mô hình truyền thống như ARIMA chỉ dựa trên chuỗi thời gian. Ví dụ, RMSE giảm khoảng 15% so với ARIMA trong nghiên cứu này.Dữ liệu đầu vào cho mô hình được chuẩn bị như thế nào?
Dữ liệu bao gồm giá mở cửa, đóng cửa, cao, thấp và khối lượng giao dịch được chuyển đổi thành biểu đồ nến Nhật kết hợp biểu đồ khối lượng (Candlebar chart) với kích thước ảnh 112x112 pixel cho CNN, đồng thời giữ nguyên dạng chuỗi thời gian cho LSTM.Mô hình có thể áp dụng cho các chỉ số chứng khoán khác không?
Có thể áp dụng với điều chỉnh phù hợp về tham số và dữ liệu đầu vào. Các nghiên cứu quốc tế đã áp dụng mô hình tương tự cho chỉ số S&P 500, Shanghai Index với kết quả khả quan, cho thấy tính linh hoạt của mô hình.Thời gian huấn luyện mô hình mất bao lâu?
Thời gian huấn luyện phụ thuộc vào cấu hình phần cứng và kích thước dữ liệu, trong nghiên cứu này mất khoảng vài giờ đến một ngày trên máy tính có GPU hiện đại để đạt được kết quả tối ưu.Làm thế nào để tránh hiện tượng quá khớp khi huấn luyện mạng sâu?
Sử dụng kỹ thuật residual learning trong mạng ResNet, áp dụng dropout, batch normalization và chia dữ liệu thành tập huấn luyện, xác nhận và kiểm thử giúp giảm thiểu hiện tượng quá khớp, đảm bảo mô hình tổng quát tốt trên dữ liệu mới.
Kết luận
- Luận văn đã xây dựng thành công mô hình dự đoán chỉ số VN-Index dựa trên sự kết hợp giữa mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy dài hạn (LSTM), nâng cao độ chính xác dự báo so với các mô hình truyền thống.
- Mô hình SC-CNN tận dụng hiệu quả dữ liệu hình ảnh biểu đồ nến kết hợp khối lượng giao dịch, trong khi ST-LSTM xử lý tốt dữ liệu chuỗi thời gian phức tạp.
- Phương pháp joint learning giúp mô hình kết hợp khai thác đồng thời đặc trưng không gian và thời gian, cải thiện hiệu suất dự báo.
- Kết quả nghiên cứu có ý nghĩa thực tiễn cao, hỗ trợ nhà đầu tư và các tổ chức tài chính trong việc ra quyết định giao dịch chứng khoán hiệu quả hơn.
- Các bước tiếp theo bao gồm mở rộng dữ liệu đầu vào, phát triển giao diện người dùng và áp dụng mô hình cho các khung thời gian khác nhau nhằm nâng cao tính ứng dụng trong thực tế.
Để tiếp tục phát triển nghiên cứu, các nhà khoa học và chuyên gia công nghệ thông tin được khuyến khích áp dụng mô hình LSTM-CNN trong các dự án thực tế, đồng thời mở rộng phạm vi nghiên cứu sang các thị trường chứng khoán khác nhằm kiểm chứng tính hiệu quả và khả năng ứng dụng rộng rãi của mô hình.