I. Giới thiệu
Ngành doanh nghiệp xây dựng và bất động sản Việt Nam là hai lĩnh vực có ảnh hưởng lớn đến nền kinh tế vĩ mô. Giá cổ phiếu của các doanh nghiệp trong hai ngành này thường biến động mạnh, ảnh hưởng trực tiếp đến quyết định đầu tư của các nhà đầu tư. Việc áp dụng máy học để dự đoán giá cổ phiếu doanh nghiệp trở nên cần thiết nhằm giúp các nhà đầu tư có được thông tin chính xác hơn về xu hướng giá cả. Các mô hình như ANN, KNN, LSTM, ARIMA, và Hồi quy tuyến tính sẽ được nghiên cứu và áp dụng trong luận văn này nhằm tìm ra mô hình dự đoán hiệu quả nhất. Điều này không chỉ mang lại giá trị thực tiễn cho nhà đầu tư mà còn đóng góp vào việc phát triển lĩnh vực tài chính tại Việt Nam.
1.1. Tầm quan trọng của việc dự đoán giá cổ phiếu
Việc dự đoán giá cổ phiếu không chỉ giúp doanh nghiệp xây dựng và bất động sản điều chỉnh chiến lược kinh doanh mà còn giúp các nhà đầu tư đưa ra quyết định kịp thời. Theo một nghiên cứu, việc áp dụng máy học trong tài chính đã cho thấy những tiến bộ vượt bậc trong việc cải thiện độ chính xác của các dự đoán. Các mô hình học máy có khả năng xử lý và phân tích khối lượng dữ liệu lớn, từ đó phát hiện ra các xu hướng tiềm ẩn mà phương pháp truyền thống khó nhận diện. Điều này đặc biệt quan trọng trong bối cảnh thị trường chứng khoán Việt Nam đang phát triển mạnh mẽ nhưng cũng đầy biến động.
II. Các mô hình học máy
Nghiên cứu này sẽ sử dụng năm mô hình học máy chính, bao gồm ANN, KNN, LSTM, ARIMA và Hồi quy tuyến tính. Mỗi mô hình đều có những ưu điểm và nhược điểm riêng, và việc so sánh hiệu suất của chúng sẽ giúp xác định mô hình nào phù hợp nhất cho việc dự đoán giá cổ phiếu trong lĩnh vực xây dựng và bất động sản. Mô hình LSTM, với khả năng xử lý chuỗi thời gian, đã cho thấy hiệu quả cao trong việc dự đoán giá cổ phiếu. Trong khi đó, KNN và ANN cũng là những lựa chọn tốt nhờ vào khả năng phân loại và hồi quy. Mô hình ARIMA, mặc dù truyền thống hơn, vẫn có thể cung cấp những dự đoán chính xác khi dữ liệu tuân theo các quy luật thống kê nhất định.
2.1. Mô hình LSTM
Mô hình Long Short-Term Memory (LSTM) được thiết kế để giải quyết vấn đề của mạng nơron truyền thống trong việc ghi nhớ thông tin qua nhiều bước thời gian. LSTM đã trở thành một công cụ mạnh mẽ trong lĩnh vực máy học, đặc biệt là trong các bài toán dự đoán chuỗi thời gian như giá cổ phiếu. Theo một nghiên cứu, LSTM có khả năng dự đoán chính xác hơn so với các mô hình khác trong nhiều trường hợp, nhờ vào khả năng xử lý thông tin quá khứ một cách hiệu quả. Điều này cho phép mô hình phát hiện các xu hướng và mô hình phức tạp trong dữ liệu, từ đó tạo ra những dự đoán chính xác hơn cho các nhà đầu tư.
2.2. Mô hình KNN
Mô hình K-nearest neighbors (KNN) là một phương pháp đơn giản nhưng mạnh mẽ trong việc dự đoán giá cổ phiếu. KNN hoạt động dựa trên nguyên tắc tìm kiếm các điểm dữ liệu gần nhất trong không gian đa chiều. Mặc dù KNN có thể không hiệu quả với dữ liệu lớn do tính toán tốn kém, nhưng nó vẫn là một lựa chọn tốt cho những bài toán có kích thước dữ liệu vừa phải. KNN có khả năng cung cấp những dự đoán nhanh chóng và dễ hiểu, điều này rất có lợi cho các nhà đầu tư không có nhiều thời gian để phân tích dữ liệu phức tạp.
III. Phân tích và đánh giá kết quả thực nghiệm
Sau khi áp dụng các mô hình học máy vào dữ liệu thực tế, kết quả cho thấy mô hình LSTM đạt được độ chính xác cao nhất trong việc dự đoán giá cổ phiếu. Các chỉ số như MAPE, RMSE cho thấy rằng LSTM có khả năng dự đoán tốt hơn so với các mô hình khác. Điều này chứng tỏ rằng việc áp dụng máy học trong tài chính không chỉ là xu hướng mà còn là một giải pháp thực tiễn cho các vấn đề trong lĩnh vực này. Kết quả nghiên cứu sẽ cung cấp cho các nhà đầu tư những thông tin giá trị để đưa ra quyết định đúng đắn trong thời điểm thị trường biến động.
3.1. So sánh hiệu suất các mô hình
Kết quả thực nghiệm cho thấy rằng mô hình LSTM vượt trội hơn hẳn so với các mô hình khác như KNN, ANN, ARIMA và Hồi quy tuyến tính. Cụ thể, LSTM đạt được sai số thấp nhất trong các dự đoán, trong khi KNN và ANN có độ chính xác tương đối nhưng không bằng LSTM. Mô hình ARIMA, mặc dù đã được sử dụng lâu đời trong phân tích chuỗi thời gian, không thể cạnh tranh với các mô hình học máy hiện đại. Điều này cho thấy xu hướng chuyển dịch sang việc sử dụng máy học là cần thiết trong việc dự đoán giá cổ phiếu, đặc biệt trong bối cảnh thị trường chứng khoán Việt Nam đang ngày càng phát triển.