I. Tổng Quan Ứng Dụng Machine Learning Trong Đầu Tư Chứng Khoán
Quản trị danh mục đầu tư chứng khoán trong bối cảnh thị trường đầy biến động là một thách thức lớn. Quản trị danh mục đầu tư bao gồm xác định mục tiêu, xây dựng danh mục, đánh giá và điều chỉnh. Xây dựng danh mục là khâu quan trọng, và đa dạng hóa danh mục là một yếu tố then chốt. Harry Markowitz đặt nền móng cho quan điểm này (Markowitz, 1952). Lý thuyết danh mục đầu tư hiện đại (MPT) sau đó đã cách mạng hóa quản lý đầu tư, nhấn mạnh tầm quan trọng của quan điểm danh mục và sử dụng các phương pháp định lượng. Ngày nay, cả yếu tố định lượng và định tính đều bổ trợ lẫn nhau. Bài toán phân tích Trung bình - phương sai (MV) là cốt lõi của MPT, nhằm tối đa hóa lợi nhuận hoặc giảm thiểu rủi ro. Việc này dựa trên lợi nhuận kỳ vọng và độ rủi ro (phương sai). Tính toán đòi hỏi ước lượng giá trị kỳ vọng và ma trận hiệp phương sai. Với số lượng tài sản lớn và liên hệ phức tạp, phương pháp MV gặp một số hạn chế.
1.1. Lịch Sử Phát Triển Quản Trị Danh Mục Đầu Tư Hiện Đại
Từ công trình tiên phong của Harry Markowitz, lý thuyết danh mục đầu tư đã trải qua nhiều giai đoạn phát triển. Các nhà nghiên cứu như Jack Treynor và William Sharpe đã đóng góp vào việc xây dựng Modern Portfolio Theory (MPT), tập trung vào việc phân tích và lựa chọn các danh mục đầu tư dựa trên hiệu quả sử dụng rủi ro. MPT đã thúc đẩy việc sử dụng các phương pháp định lượng trong quản trị danh mục, giúp nhà đầu tư có cái nhìn sâu sắc hơn về mối quan hệ giữa rủi ro và lợi nhuận. Sự kết hợp giữa các khái niệm định lượng và định tính ngày càng trở nên quan trọng trong quản lý đầu tư hiện đại.
1.2. Vai Trò Của Đa Dạng Hóa Trong Quản Trị Danh Mục Đầu Tư
Đa dạng hóa danh mục là một nguyên tắc cơ bản trong đầu tư, giúp giảm thiểu rủi ro bằng cách phân bổ vốn vào nhiều loại tài sản khác nhau. Nguyên tắc này xuất phát từ công trình của Harry Markowitz, người đã chứng minh rằng việc kết hợp các tài sản có tương quan thấp có thể cải thiện hiệu quả của danh mục. Đa dạng hóa không chỉ giúp giảm rủi ro mà còn có thể tăng cơ hội sinh lời, đặc biệt trong bối cảnh thị trường chứng khoán luôn biến động và khó dự đoán.
II. Thách Thức Ước Lượng Rủi Ro Trong Quản Trị Danh Mục Chứng Khoán
Phương pháp Trung bình - phương sai có một số hạn chế. Nghiên cứu thực nghiệm chỉ ra rằng ước lượng ma trận hiệp phương sai, đặc biệt khi số lượng tài sản lớn, rất nhạy cảm với nhiễu (Jobson & Korkie, 1980; Best & Grauer, 1991). Cú sốc nhỏ có thể gây thay đổi lớn, dẫn đến sai lệch lớn trong danh mục. Vấn đề nghiêm trọng hơn khi cấu trúc thị trường thay đổi nhanh, gây khó khăn cho việc ước lượng chính xác. Hạn chế thứ hai là tính quá khớp của lời giải bài toán MV. Theo Kinn (2018), cách tiếp cận MV tương đương với giải bài toán hồi quy tuyến tính bằng phương pháp bình phương tối thiểu (OLS). OLS không cho phép đánh đổi giữa độ chệch và phương sai. Do đó, khi số tài sản lớn, hiệu suất có thể không tốt do vấn đề quá khớp.
2.1. Sự Nhạy Cảm Của Ma Trận Hiệp Phương Sai Với Nhiễu Thị Trường
Ước lượng ma trận hiệp phương sai, đặc biệt khi số lượng tài sản lớn, rất nhạy cảm với nhiễu thị trường. Một cú sốc nhỏ trên thị trường cũng có thể dẫn đến sự thay đổi lớn trong ma trận này, gây ra sai lệch đáng kể trong việc xây dựng danh mục. Các nghiên cứu thực nghiệm đã chứng minh rằng sai số trong ước lượng ma trận hiệp phương sai có thể ảnh hưởng nghiêm trọng đến hiệu suất của danh mục đầu tư.
2.2. Tính Quá Khớp Của Phương Pháp Trung Bình Phương Sai MV
Phương pháp MV có thể dẫn đến tình trạng quá khớp, đặc biệt khi số lượng tài sản lớn hơn số lượng quan sát. Điều này làm cho danh mục đầu tư trở nên quá nhạy cảm với dữ liệu lịch sử và kém hiệu quả trong việc dự đoán hiệu suất trong tương lai. Các kỹ thuật chính quy hóa có thể được sử dụng để giảm thiểu tình trạng quá khớp và cải thiện tính ổn định của danh mục.
2.3. Sai Số Ước Lượng và Ảnh Hưởng Đến Hiệu Suất Danh Mục Đầu Tư
Sai số trong việc ước lượng các tham số đầu vào, chẳng hạn như lợi suất kỳ vọng và ma trận hiệp phương sai, có thể ảnh hưởng lớn đến hiệu suất của danh mục đầu tư. Sai số này có thể dẫn đến việc phân bổ tài sản không tối ưu và giảm lợi nhuận. Các phương pháp Machine Learning có thể giúp giảm thiểu sai số ước lượng và cải thiện hiệu suất của danh mục.
III. Cách Ứng Dụng Machine Learning Để Tối Ưu Quản Trị Danh Mục
Gần đây, việc kết hợp Học máy (Machine learning - ML) với bài toán tối ưu MV đã được nghiên cứu để cải thiện các vấn đề trên. Nghiên cứu thực nghiệm cho thấy ưu điểm so với phương pháp MV tiêu chuẩn (Nanda và cộng sự, 2010; Iorio và cộng sự, 2018; DeMiguel & Nogales, 2009; Awoye, 2016; Bjerring và cộng sự, 2017; Brodie và cộng sự, 2009; Kinn, 2018; Ta và cộng sự, 2020; Ma và cộng sự, 2021; Zhang và cộng sự, 2022). Các nghiên cứu theo hướng này có thể chia thành ba nhóm chính. Thứ nhất, giảm chiều dữ liệu bằng phương pháp phân cụm chuỗi thời gian, hướng tới danh mục ít tài sản hơn. Kết quả cho thấy cải thiện so với MV tiêu chuẩn (Nanda và cộng sự (2010), Iorio và cộng sự (2018), Marvin và Bhatt (2015), Ren (2005)). Tiếp theo, giải quyết vấn đề quá khớp bằng cách tích hợp mô hình dự báo (Ta và cộng sự (2020), Wang và cộng sự (2020), Fjellström (2022), Zhang và cộng sự (2022)). Giá trị dự báo bởi ML phù hợp hơn so với lợi suất lịch sử. Cuối cùng, giải quyết vấn đề quá khớp bằng phương pháp chính quy.
3.1. Giảm Chiều Dữ Liệu Với Phương Pháp Phân Cụm Chuỗi Thời Gian
Phân cụm chuỗi thời gian là một phương pháp hiệu quả để giảm chiều dữ liệu trong quản trị danh mục. Bằng cách nhóm các cổ phiếu có đặc điểm tương đồng vào các cụm, nhà đầu tư có thể tập trung vào một số ít các đại diện cho mỗi cụm thay vì phải theo dõi toàn bộ thị trường. Điều này giúp giảm độ phức tạp của bài toán tối ưu hóa danh mục và cải thiện hiệu suất.
3.2. Tích Hợp Mô Hình Dự Báo Để Giải Quyết Vấn Đề Quá Khớp
Việc tích hợp các mô hình dự báo, chẳng hạn như mô hình Bộ nhớ ngắn - dài hạn (Long Short-Term Memory: LSTM), có thể giúp giải quyết vấn đề quá khớp trong quản trị danh mục. Các mô hình này có khả năng học hỏi từ dữ liệu lịch sử và dự đoán xu hướng thị trường, giúp nhà đầu tư đưa ra các quyết định thông minh hơn. Sử dụng giá trị dự báo thay vì lợi suất lịch sử có thể cải thiện đáng kể hiệu suất của danh mục.
3.3. Sử Dụng Phương Pháp Chính Quy Hóa Để Cải Thiện Độ Chính Xác
Phương pháp chính quy hóa, chẳng hạn như phương pháp Lasso, có thể giúp cải thiện độ chính xác của ước lượng trong quản trị danh mục. Bằng cách thêm một hình phạt vào hàm mục tiêu, phương pháp chính quy hóa khuyến khích các mô hình đơn giản hơn và ít nhạy cảm hơn với nhiễu. Điều này giúp giảm thiểu rủi ro và cải thiện hiệu suất ngoài mẫu.
IV. Ứng Dụng Machine Learning Dự Báo Chứng Khoán Việt Nam
Brodie và cộng sự (2009), Kinn (2018) hay Husmann và cộng sự (2022) sử dụng phương pháp chính quy với mô hình MV. Phương pháp chính quy chấp nhận một phần chệch cho giá trị trung bình nhưng giảm thiểu phương sai. Việc giảm thiểu phương sai này giúp cải thiện độ chính xác cho các tính toán ngoài mẫu. Thị trường chứng khoán Việt Nam đã phát triển mạnh về quy mô. Tính đến tháng 5/2023, sàn Hà Nội (HNX) có 359 công ty niêm yết, sàn TP.HCM (HSX) có 515. Điều này có thể ảnh hưởng đến chất lượng ước lượng ma trận hiệp phương sai và hiệu suất danh mục ngoài mẫu khi dùng MV tiêu chuẩn. Tuy nhiên, các nghiên cứu ở Việt Nam chưa tập trung vào việc khắc phục hạn chế này bằng Học máy. Thêm vào đó, các nghiên cứu thường so sánh các phương pháp trên cùng một bộ số liệu mà chưa làm rõ ưu điểm của từng phương pháp trên các trạng thái khác nhau của thị trường.
4.1. Tổng Quan Thị Trường Chứng Khoán Việt Nam 2008 2022
Thị trường chứng khoán Việt Nam đã trải qua nhiều giai đoạn phát triển, từ cuộc khủng hoảng tài chính toàn cầu năm 2008 đến giai đoạn bình ổn từ năm 2013 đến 2019 và sự tác động của đại dịch Covid-19 từ năm 2020 đến 2022. Số lượng công ty niêm yết và vốn hóa thị trường đã tăng trưởng đáng kể, nhưng điều này cũng đặt ra những thách thức mới trong việc quản trị danh mục đầu tư, đặc biệt là trong việc ước lượng ma trận hiệp phương sai.
4.2. Tình Hình Nghiên Cứu Ứng Dụng Machine Learning Tại Việt Nam
Mặc dù có tiềm năng lớn, việc ứng dụng Machine Learning trong quản trị danh mục đầu tư chứng khoán tại Việt Nam vẫn còn hạn chế. Các nghiên cứu hiện tại thường tập trung vào việc so sánh các phương pháp trên cùng một bộ số liệu mà chưa làm rõ ưu điểm của từng phương pháp trong các điều kiện thị trường khác nhau. Cần có thêm các nghiên cứu để đánh giá hiệu quả của các phương pháp Machine Learning trong bối cảnh thị trường Việt Nam.
V. So Sánh Các Mô Hình Học Máy Quản Trị Danh Mục Đầu Tư
Các nghiên cứu thường chỉ tập trung cho các thị trường mới nổi hoặc đã phát triển, mà chưa nghiên cứu cho thị trường cận biên như Việt Nam. Do vậy, việc nghiên cứu “Tiếp cận Machine Learning trong quản trị danh mục trên thị trường chứng khoán Việt Nam” là cần thiết. Luận án này sẽ áp dụng một số phương pháp Machine Learning để nghiên cứu thực nghiệm cho TTCK Việt Nam, và tìm hiểu hiệu quả của các phương pháp này khi thị trường ở các trạng thái khác nhau. Mục tiêu là xây dựng danh mục tối ưu sử dụng các phương pháp Học máy kết hợp với bài toán tối ưu Markowitz và đánh giá hiệu quả trong các bối cảnh khác nhau. Từ đó đề xuất các khuyến nghị cho các nhà đầu tư và các nhà nghiên cứu.
5.1. So Sánh Hiệu Quả Phân Cụm Chuỗi Thời Gian LSTM và Lasso
Luận án sử dụng ba nhóm phương pháp Machine Learning kết hợp với bài toán tối ưu MV: phân cụm chuỗi thời gian, LSTM, và chính quy hóa Lasso. Mục đích là khắc phục sai số khi ước lượng các đầu vào. Tính ưu việt phụ thuộc vào khả năng khắc phục này. Cần so sánh hiệu quả của từng phương pháp để xác định phương pháp phù hợp nhất cho từng điều kiện thị trường.
5.2. Khả Năng Thích Ứng Của LSTM Trong Các Điều Kiện Thị Trường
Phương pháp LSTM có tính tự học cao, có tính đến bài toán dự báo trong quá trình tính toán, và với bản chất phi tuyến, nên nó sẽ giúp cải thiện hơn so với các phương pháp Học máy khác trong bài toán xây dựng danh mục. Khả năng thích ứng và dự báo của LSTM có thể mang lại lợi thế đáng kể trong các điều kiện thị trường biến động.
VI. Hướng Dẫn Nghiên Cứu Ứng Dụng Machine Learning Chứng Khoán Việt
Luận án đặt ra các câu hỏi nghiên cứu: (1) Danh mục đề xuất bởi Học máy có hiệu quả hơn trong điều kiện thị trường bình thường? (2) Danh mục đề xuất bởi Học máy có hiệu quả hơn trong điều kiện thị trường biến động? (3) Hiệu quả của các phương pháp Học máy khác nhau như thế nào trong các điều kiện khác nhau? Giả thuyết: Sử dụng các phương pháp Học máy kết hợp MV sẽ giúp cải thiện hiệu quả so với phương pháp MV. Hiệu quả của các phương pháp có thể khác nhau trong điều kiện thị trường bình thường và biến động. Phương pháp LSTM có ưu việt hơn so với hai phương pháp còn lại. Đối tượng nghiên cứu là các cổ phiếu trên TTCK Việt Nam, mô hình MV và các phương pháp ML. Phạm vi thời gian: 2008-2022.
6.1. Phương Pháp Nghiên Cứu Sử Dụng Trong Luận Án
Luận án sử dụng các phương pháp nghiên cứu tại bàn (Desk research), thống kê, và mô hình hóa. Phương pháp tại bàn tập trung vào phân tích dữ liệu số và thống kê. Các phương pháp mô hình hóa bao gồm mô hình MV tiêu chuẩn và ba phương pháp kết hợp mô hình tối ưu với các phương pháp Học máy.
6.2. Dữ Liệu Sử Dụng Trong Phân Tích Thực Nghiệm
Luận án sử dụng dữ liệu giá đóng cửa hàng ngày của các cổ phiếu giao dịch trên sàn thành phố Hồ Chí Minh (HOSE) của Việt Nam, được cung cấp bởi công ty VietStock. Dữ liệu về lãi suất trái phiếu chính phủ được công bố trên trang vn.