Luận văn thạc sĩ quản lý xây dựng dự đoán giá cổ phiếu doanh nghiệp xây dựng và bất động sản trên thị trường chứng khoán việt nam dựa trên tiếp cận máy học

Luận văn thạc sĩ nghiên cứu quản lý xây dựng dự đoán giá cổ phiếu doanh nghiệp xây dựng và bất động sản trên thị trường chứng, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện

Trường đại học

Đại học Bách Khoa - Đại học Quốc gia Thành phố Hồ Chí Minh

Chuyên ngành

Quản Lý Xây Dựng

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

LỜI CAM KẾT

1. CHƯƠNG 1: Lý do chọn đề tài

1.1. Mục tiêu nghiên cứu

1.2. Đối tượng và phạm vi nghiên cứu

1.3. Ý nghĩa khoa học và thực tiễn của đề tài

1.4. Kết cấu luận văn

2. CHƯƠNG 2: Các nghiên cứu liên quan

2.1. Phạm vi ứng dụng

3. CHƯƠNG 3: Các khái niệm liên quan chứng khoán

3.1. Phân loại cổ phiếu

3.2. Đặc điểm của cổ phiếu

3.3. Các loại giá cổ phiếu

3.4. Lợi tức của cổ phiếu

3.5. Rủi ro của cổ phiếu

3.6. Thị trường chứng khoán

3.7. Chỉ số chứng khoán

3.8. Các chủ thể tham gia thị trường chứng khoán

3.9. Support Vector Machine (SVM)

3.10. Mạng Long Short Term Memory (LSTM)

4. CHƯƠNG 4: PHƯƠNG PHÁP LUẬN - MÔ HÌNH ĐỀ XUẤT

4.1. Các phương pháp phân tích cơ bản

4.2. Phương pháp phân tích top – down

4.3. Phương pháp phân tích bottom – up

4.4. Phương pháp phân tích bằng các mô hình học máy – mô hình đề xuất. Phương pháp sử dụng mô hình LSTM

4.5. Các tiêu chí đánh giá

5. CHƯƠNG 5: PHÂN TÍCH VÀ ĐÁNH GIÁ KẾT QUẢ THỰC NGHIỆM

5.1. Trình tự quy trình xử lý thực nghiệm. Cài đặt môi trường thực nghiệm

5.2. Ngôn ngữ lập trình Python

5.3. Môi trường Google colaboratory

5.4. Các thư viện dùng trong thực nghiệm

5.5. Thu thập danh sách mã CP các công ty theo ngành (Code_01)

5.6. Tải dữ liệu CK từ các website (Code_02)

5.7. Chạy thực nghiệm trên mỗi mã Cổ phiếu (Code_03)

5.8. Chạy thực nghiệm trên 03 bộ dữ liệu (80 mã CP nhóm BĐS, 95 mã CP nhóm XD, 175 mã CP BĐS và XD) (Code_04)

5.9. Nhận xét - đánh giá các mô hình

5.10. Trường hợp dự đoán giá trên bộ dữ liệu mỗi công ty

5.11. Trường hợp dự đoán giá trên toàn bộ dữ liệu của 175 công ty, 80 công ty lĩnh vực BĐS, 95 công ty lĩnh vực XD. Kết quả đạt được

6. CHƯƠNG 6: Kết luận và đề xuấti hướng nghiên cứu

6.1. Hạn chế của bài nghiên cứu

6.2. Hướng phát triển đề tài

6.3. Khi cổ phiếu giảm

DANH MỤC CÁC CÔNG TRÌNH NGHIÊN CỨU

TÀI LIỆU THAM KHẢO

PHỤ LỤC CÁC HÌNH ẢNH THỰC NGHIỆM

PHỤ LỤC CÁC CODE LIÊN QUAN

8.1. Code_01: Crawl dữ liệu nhóm ngành

8.2. Code_02: Tải dữ liệu chứng khoán

8.3. Code_03: Chạy các mô hình

8.4. Code_04: Chạy thực nghiệm cho tất cả công ty

DANH MỤC CÁC BIỂU BẢNG

DANH MỤC HÌNH ẢNH

DANH MỤC CÁC TỪ VIẾT TẮT

Tóm tắt

I. Giới thiệu

Ngành doanh nghiệp xây dựng và bất động sản Việt Nam là hai lĩnh vực có ảnh hưởng lớn đến nền kinh tế vĩ mô. Giá cổ phiếu của các doanh nghiệp trong hai ngành này thường biến động mạnh, ảnh hưởng trực tiếp đến quyết định đầu tư của các nhà đầu tư. Việc áp dụng máy học để dự đoán giá cổ phiếu doanh nghiệp trở nên cần thiết nhằm giúp các nhà đầu tư có được thông tin chính xác hơn về xu hướng giá cả. Các mô hình như ANN, KNN, LSTM, ARIMA, và Hồi quy tuyến tính sẽ được nghiên cứu và áp dụng trong luận văn này nhằm tìm ra mô hình dự đoán hiệu quả nhất. Điều này không chỉ mang lại giá trị thực tiễn cho nhà đầu tư mà còn đóng góp vào việc phát triển lĩnh vực tài chính tại Việt Nam.

1.1. Tầm quan trọng của việc dự đoán giá cổ phiếu

Việc dự đoán giá cổ phiếu không chỉ giúp doanh nghiệp xây dựng và bất động sản điều chỉnh chiến lược kinh doanh mà còn giúp các nhà đầu tư đưa ra quyết định kịp thời. Theo một nghiên cứu, việc áp dụng máy học trong tài chính đã cho thấy những tiến bộ vượt bậc trong việc cải thiện độ chính xác của các dự đoán. Các mô hình học máy có khả năng xử lý và phân tích khối lượng dữ liệu lớn, từ đó phát hiện ra các xu hướng tiềm ẩn mà phương pháp truyền thống khó nhận diện. Điều này đặc biệt quan trọng trong bối cảnh thị trường chứng khoán Việt Nam đang phát triển mạnh mẽ nhưng cũng đầy biến động.

II. Các mô hình học máy

Nghiên cứu này sẽ sử dụng năm mô hình học máy chính, bao gồm ANN, KNN, LSTM, ARIMA và Hồi quy tuyến tính. Mỗi mô hình đều có những ưu điểm và nhược điểm riêng, và việc so sánh hiệu suất của chúng sẽ giúp xác định mô hình nào phù hợp nhất cho việc dự đoán giá cổ phiếu trong lĩnh vực xây dựng và bất động sản. Mô hình LSTM, với khả năng xử lý chuỗi thời gian, đã cho thấy hiệu quả cao trong việc dự đoán giá cổ phiếu. Trong khi đó, KNN và ANN cũng là những lựa chọn tốt nhờ vào khả năng phân loại và hồi quy. Mô hình ARIMA, mặc dù truyền thống hơn, vẫn có thể cung cấp những dự đoán chính xác khi dữ liệu tuân theo các quy luật thống kê nhất định.

2.1. Mô hình LSTM

Mô hình Long Short-Term Memory (LSTM) được thiết kế để giải quyết vấn đề của mạng nơron truyền thống trong việc ghi nhớ thông tin qua nhiều bước thời gian. LSTM đã trở thành một công cụ mạnh mẽ trong lĩnh vực máy học, đặc biệt là trong các bài toán dự đoán chuỗi thời gian như giá cổ phiếu. Theo một nghiên cứu, LSTM có khả năng dự đoán chính xác hơn so với các mô hình khác trong nhiều trường hợp, nhờ vào khả năng xử lý thông tin quá khứ một cách hiệu quả. Điều này cho phép mô hình phát hiện các xu hướng và mô hình phức tạp trong dữ liệu, từ đó tạo ra những dự đoán chính xác hơn cho các nhà đầu tư.

2.2. Mô hình KNN

Mô hình K-nearest neighbors (KNN) là một phương pháp đơn giản nhưng mạnh mẽ trong việc dự đoán giá cổ phiếu. KNN hoạt động dựa trên nguyên tắc tìm kiếm các điểm dữ liệu gần nhất trong không gian đa chiều. Mặc dù KNN có thể không hiệu quả với dữ liệu lớn do tính toán tốn kém, nhưng nó vẫn là một lựa chọn tốt cho những bài toán có kích thước dữ liệu vừa phải. KNN có khả năng cung cấp những dự đoán nhanh chóng và dễ hiểu, điều này rất có lợi cho các nhà đầu tư không có nhiều thời gian để phân tích dữ liệu phức tạp.

III. Phân tích và đánh giá kết quả thực nghiệm

Sau khi áp dụng các mô hình học máy vào dữ liệu thực tế, kết quả cho thấy mô hình LSTM đạt được độ chính xác cao nhất trong việc dự đoán giá cổ phiếu. Các chỉ số như MAPE, RMSE cho thấy rằng LSTM có khả năng dự đoán tốt hơn so với các mô hình khác. Điều này chứng tỏ rằng việc áp dụng máy học trong tài chính không chỉ là xu hướng mà còn là một giải pháp thực tiễn cho các vấn đề trong lĩnh vực này. Kết quả nghiên cứu sẽ cung cấp cho các nhà đầu tư những thông tin giá trị để đưa ra quyết định đúng đắn trong thời điểm thị trường biến động.

3.1. So sánh hiệu suất các mô hình

Kết quả thực nghiệm cho thấy rằng mô hình LSTM vượt trội hơn hẳn so với các mô hình khác như KNN, ANN, ARIMA và Hồi quy tuyến tính. Cụ thể, LSTM đạt được sai số thấp nhất trong các dự đoán, trong khi KNN và ANN có độ chính xác tương đối nhưng không bằng LSTM. Mô hình ARIMA, mặc dù đã được sử dụng lâu đời trong phân tích chuỗi thời gian, không thể cạnh tranh với các mô hình học máy hiện đại. Điều này cho thấy xu hướng chuyển dịch sang việc sử dụng máy học là cần thiết trong việc dự đoán giá cổ phiếu, đặc biệt trong bối cảnh thị trường chứng khoán Việt Nam đang ngày càng phát triển.

09/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ quản lý xây dựng dự đoán giá cổ phiếu doanh nghiệp xây dựng và bất động sản trên thị trường chứng khoán việt nam dựa trên tiếp cận máy học

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh thị trường chứng khoán Việt Nam có sự biến động mạnh mẽ và phức tạp trong những năm gần đây, việc dự đoán giá cổ phiếu các doanh nghiệp ngành xây dựng và bất động sản trở thành một nhiệm vụ cấp thiết. Theo ước tính, bộ dữ liệu nghiên cứu bao gồm 175 doanh nghiệp niêm yết trên sàn chứng khoán Việt Nam từ năm 2017 đến ngày 21/01/2021, trong đó có 80 doanh nghiệp bất động sản và 95 doanh nghiệp xây dựng. Biến động giá cổ phiếu không chỉ ảnh hưởng trực tiếp đến lợi ích của nhà đầu tư mà còn tác động đến hoạt động kinh doanh và phát triển bền vững của các doanh nghiệp trong hai ngành này, vốn chiếm tỷ trọng lớn trong nền kinh tế vĩ mô.

Mục tiêu nghiên cứu là ứng dụng các mô hình học máy tiên tiến như ANN, KNN, LSTM, ARIMA và Linear Regression để dự đoán giá cổ phiếu dựa trên dữ liệu lịch sử, từ đó tìm ra mô hình có hiệu suất dự báo tốt nhất. Phạm vi nghiên cứu tập trung vào dữ liệu giá đóng cửa hàng ngày của các doanh nghiệp ngành xây dựng và bất động sản trên thị trường chứng khoán Việt Nam trong giai đoạn 2017-2021. Nghiên cứu không chỉ có ý nghĩa khoa học trong việc áp dụng các kỹ thuật học máy hiện đại vào dự báo tài chính mà còn mang giá trị thực tiễn cao, giúp nhà đầu tư và doanh nghiệp có cơ sở để đưa ra các quyết định chiến lược phù hợp, giảm thiểu rủi ro và tối ưu hóa lợi nhuận.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên nền tảng các lý thuyết và mô hình học máy hiện đại, bao gồm:

Mạng nơ-ron nhân tạo (ANN): Mô hình mô phỏng cấu trúc mạng thần kinh sinh học, có khả năng học các mối quan hệ phi tuyến trong dữ liệu. ANN được sử dụng để dự đoán giá cổ phiếu nhờ khả năng xử lý dữ liệu phức tạp và không tuyến tính.
K-nearest neighbors (KNN): Thuật toán dựa trên việc tìm kiếm các điểm dữ liệu gần nhất để dự đoán giá trị mới. KNN đơn giản, dễ hiểu nhưng có thể bị ảnh hưởng bởi nhiễu và tốn thời gian tính toán khi dữ liệu lớn.
Support Vector Machine (SVM): Thuật toán phân loại và hồi quy dựa trên việc tìm siêu mặt phẳng tối ưu phân tách dữ liệu. SVM có khả năng xử lý dữ liệu đa chiều và phi tuyến nhờ kỹ thuật kernel.
Mạng Long Short-Term Memory (LSTM): Một dạng mạng thần kinh tái phát (RNN) đặc biệt, có khả năng học các phụ thuộc dài hạn trong chuỗi thời gian, rất phù hợp với dữ liệu giá cổ phiếu có tính tuần tự và biến động phức tạp.
Mô hình ARIMA (Autoregressive Integrated Moving Average): Mô hình thống kê dự báo chuỗi thời gian dựa trên các thành phần tự hồi quy và trung bình động, thích hợp với dữ liệu có tính dừng.

Các khái niệm chính bao gồm: giá cổ phiếu đóng cửa, sai số trung bình tuyệt đối (MAE), sai số bình phương trung bình (MSE), phần trăm sai số trung bình tuyệt đối (MAPE), và các chỉ số đánh giá hiệu suất mô hình.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu giá cổ phiếu đóng cửa hàng ngày của 175 doanh nghiệp ngành xây dựng và bất động sản niêm yết trên sàn chứng khoán Việt Nam, thu thập từ các trang web uy tín như Vietstock và Vndirect, trong giai đoạn từ 23/01/2017 đến 21/01/2021. Cỡ mẫu gồm 80 doanh nghiệp bất động sản và 95 doanh nghiệp xây dựng.

Phương pháp phân tích bao gồm:

Tiền xử lý dữ liệu, chuẩn hóa và phân chia thành tập huấn luyện và kiểm tra.
Áp dụng đồng thời 5 mô hình học máy: ANN, KNN, LSTM, ARIMA và Linear Regression để dự đoán giá cổ phiếu.
Đánh giá hiệu suất các mô hình dựa trên các chỉ số MAPE, MSE, RMSE và MAE.
So sánh kết quả dự báo để lựa chọn mô hình phù hợp nhất với bộ dữ liệu.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ tháng 9/2020 đến tháng 7/2021, sử dụng ngôn ngữ lập trình Python và môi trường Google Colaboratory để thực hiện các thực nghiệm.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất mô hình LSTM vượt trội: Mô hình LSTM đạt sai số MAPE trung bình thấp nhất, khoảng 2.5%, so với các mô hình khác như KNN (MAPE ~4.1%), SVM (MAPE ~3.8%), ARIMA (MAPE ~5.2%) và Linear Regression (MAPE ~6.0%). Điều này cho thấy LSTM có khả năng nắm bắt tốt các phụ thuộc dài hạn và biến động phức tạp trong dữ liệu giá cổ phiếu.
Mô hình KNN và SVM cho kết quả ổn định: KNN và SVM thể hiện độ chính xác khá tốt với sai số MSE lần lượt là 0.015 và 0.013, thấp hơn so với ARIMA (0.022) và Linear Regression (0.028). Tuy nhiên, KNN có nhược điểm về thời gian tính toán khi dữ liệu lớn.
ARIMA và Linear Regression kém hiệu quả hơn: Hai mô hình truyền thống này có sai số dự báo cao hơn, đặc biệt Linear Regression nhạy cảm với nhiễu và dữ liệu phi tuyến, dẫn đến sai số RMSE cao hơn 15-20% so với LSTM.
Phân tích theo nhóm ngành: Khi phân tích riêng biệt, mô hình LSTM dự báo giá cổ phiếu nhóm bất động sản có sai số MAPE thấp hơn khoảng 1.8% so với nhóm xây dựng (khoảng 3.3%), phản ánh sự khác biệt về tính biến động và đặc điểm dữ liệu giữa hai ngành.

Thảo luận kết quả

Nguyên nhân chính khiến LSTM vượt trội là do khả năng xử lý chuỗi thời gian có tính tuần tự và phụ thuộc dài hạn, điều mà các mô hình truyền thống như ARIMA hay Linear Regression không thể làm tốt. Kết quả này phù hợp với các nghiên cứu quốc tế đã chứng minh hiệu quả của LSTM trong dự báo tài chính.

Việc KNN và SVM cho kết quả ổn định cũng phản ánh ưu điểm của các thuật toán học máy trong việc xử lý dữ liệu phi tuyến và đa chiều. Tuy nhiên, nhược điểm về hiệu suất tính toán và khả năng mở rộng cần được cân nhắc khi áp dụng thực tế.

Kết quả phân tích theo nhóm ngành cho thấy sự khác biệt về đặc điểm dữ liệu giữa bất động sản và xây dựng, từ đó gợi ý việc tùy chỉnh mô hình dự báo theo từng ngành để nâng cao độ chính xác.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh sai số MAPE, MSE của từng mô hình trên toàn bộ bộ dữ liệu và theo từng nhóm ngành, giúp trực quan hóa hiệu quả dự báo.

Đề xuất và khuyến nghị

Áp dụng mô hình LSTM trong dự báo giá cổ phiếu ngành xây dựng và bất động sản: Các doanh nghiệp và nhà đầu tư nên ưu tiên sử dụng mô hình LSTM để dự báo giá cổ phiếu với mục tiêu giảm sai số dự báo xuống dưới 3% trong vòng 6 tháng tới.
Phát triển hệ thống cảnh báo sớm dựa trên dự báo giá cổ phiếu: Xây dựng hệ thống cảnh báo biến động giá nhằm giúp doanh nghiệp và nhà đầu tư kịp thời điều chỉnh chiến lược kinh doanh và đầu tư, thực hiện trong vòng 12 tháng, do các tổ chức tài chính và công ty công nghệ tài chính triển khai.
Tăng cường đào tạo và nâng cao năng lực phân tích dữ liệu cho đội ngũ quản lý và nhà đầu tư: Tổ chức các khóa đào tạo về học máy và phân tích dữ liệu tài chính nhằm nâng cao khả năng ứng dụng công nghệ mới, thực hiện trong 6 tháng tới, do các trường đại học và trung tâm đào tạo chuyên ngành đảm nhiệm.
Mở rộng nghiên cứu và áp dụng mô hình dự báo cho các ngành khác trên thị trường chứng khoán Việt Nam: Khuyến khích các tổ chức nghiên cứu tiếp tục phát triển và thử nghiệm các mô hình học máy trên các nhóm ngành khác nhằm đa dạng hóa công cụ dự báo, thực hiện trong 18 tháng tới.

Đối tượng nên tham khảo luận văn

Nhà đầu tư cá nhân và tổ chức: Có thể sử dụng kết quả dự báo để đưa ra quyết định mua bán cổ phiếu chính xác hơn, giảm thiểu rủi ro và tối ưu hóa lợi nhuận đầu tư.
Doanh nghiệp ngành xây dựng và bất động sản: Áp dụng dự báo giá cổ phiếu để xây dựng chiến lược tài chính, quản lý rủi ro và nâng cao hiệu quả kinh doanh.
Các nhà nghiên cứu và sinh viên chuyên ngành quản lý xây dựng, tài chính và công nghệ thông tin: Tham khảo phương pháp luận và kết quả nghiên cứu để phát triển các đề tài nghiên cứu tiếp theo hoặc ứng dụng thực tế.
Cơ quan quản lý thị trường chứng khoán và các tổ chức tài chính: Sử dụng nghiên cứu để cải thiện công cụ giám sát thị trường, hỗ trợ chính sách và phát triển các sản phẩm tài chính mới.

Câu hỏi thường gặp

Tại sao chọn mô hình LSTM để dự báo giá cổ phiếu?
LSTM có khả năng học các phụ thuộc dài hạn trong chuỗi thời gian, phù hợp với dữ liệu giá cổ phiếu có tính tuần tự và biến động phức tạp. Kết quả thực nghiệm cho thấy LSTM có sai số dự báo thấp nhất so với các mô hình khác.
Dữ liệu sử dụng trong nghiên cứu có đảm bảo độ tin cậy không?
Dữ liệu được thu thập từ các trang web uy tín như Vietstock và Vndirect, bao gồm giá đóng cửa hàng ngày của 175 doanh nghiệp niêm yết từ 2017 đến 2021, đảm bảo tính chính xác và thực tiễn cao.
Mô hình dự báo có thể áp dụng cho các ngành khác không?
Có, các mô hình học máy như LSTM có thể được điều chỉnh và áp dụng cho các ngành khác trên thị trường chứng khoán để dự báo giá cổ phiếu hoặc các chỉ số tài chính khác.
Nhược điểm của các mô hình truyền thống như ARIMA và Linear Regression là gì?
Các mô hình này nhạy cảm với dữ liệu nhiễu và không xử lý tốt các mối quan hệ phi tuyến hoặc phụ thuộc dài hạn trong chuỗi thời gian, dẫn đến sai số dự báo cao hơn.
Làm thế nào để doanh nghiệp và nhà đầu tư ứng dụng kết quả nghiên cứu?
Có thể xây dựng hệ thống dự báo và cảnh báo biến động giá cổ phiếu dựa trên mô hình LSTM, từ đó điều chỉnh chiến lược đầu tư và quản lý rủi ro hiệu quả hơn.

Kết luận

Nghiên cứu đã áp dụng thành công 5 mô hình học máy để dự báo giá cổ phiếu của 175 doanh nghiệp ngành xây dựng và bất động sản trên thị trường chứng khoán Việt Nam giai đoạn 2017-2021.
Mô hình LSTM cho hiệu suất dự báo tốt nhất với sai số MAPE trung bình khoảng 2.5%, vượt trội so với các mô hình truyền thống và học máy khác.
Kết quả phân tích theo nhóm ngành cho thấy sự khác biệt về đặc điểm dữ liệu giữa bất động sản và xây dựng, gợi ý việc tùy chỉnh mô hình theo ngành.
Đề xuất áp dụng mô hình LSTM trong thực tiễn để hỗ trợ nhà đầu tư và doanh nghiệp trong việc ra quyết định tài chính chính xác và kịp thời.
Các bước tiếp theo bao gồm phát triển hệ thống cảnh báo biến động giá, mở rộng nghiên cứu sang các ngành khác và nâng cao năng lực phân tích dữ liệu cho các bên liên quan.

Để tiếp tục khai thác giá trị nghiên cứu, các nhà đầu tư và doanh nghiệp nên phối hợp với các chuyên gia công nghệ để triển khai ứng dụng mô hình dự báo trong hoạt động thực tế, đồng thời cập nhật và điều chỉnh mô hình theo biến động thị trường.

Trích đoạn nội dung tài liệu

Chương 1: Giới thiệu Chương 2: Tổng quan Chương 3: Cơ sở lý thuyết Chương 4: Phương pháp luận - Mô hình đề xuất Chương 5: Phân tích và đánh giá kết quả thực nghiệm Chương 6: Kết luận và đề xuấti hướng nghiên cứu 2 2. Các nghiên cứu liên quan Năm 2012, mạng học sâu AlexNet đánh dấu bước nhảy vọt của học sâu và đánh bại các thuật toán học máy khác. Mạng LSTM được đề xuất bởi Sepp Hochreiter và Jürgen Schmidhuber [1] vào năm 1997, với tính chất tuần tự thì việc áp dụng giải quyết các vấn đề liên quan đến chuỗi thời gian như giá chứng khoán rất hợp lý. Mãi đến năm 2013, mạng học sâu LSTM mới trở thành đối thủ đáng gờm trong các cuộc thi về nhận dạng giọng nói, chữ viết.

Đến năm 2016, LSTM trở thành nền tảng không thể thiếu trong các sản phẩm mới của các hãng công nghệ khổng lồ như Google, Apple, Microsoft. Cũng nhờ đó việc cài đặt mạng LSTM trên thực tế và thử nghiệm trở nên dễ dàng hơn nhờ các công cụ phần mềm mã nguồn mở. Đặc biệt với tính chất dễ tiếp cận cũng như khả năng hiện thực hoá lợi nhuận đơn giản như thị trường chứng khoán hay tiền điện tử đã thu hút rất nhiều người tham gia với các thuật toán học máy, đặc biệt là LSTM. Nhưng việc chọn mô hình tinh chỉnh các tham số chuẩn là một công việc cần có kinh nghiệm chuyên sâu về cả cổ phiếu lẫn học máy.

Việc thực hiện tinh chỉnh bằng tay hoặc ngẫu nhiên thì tốn rất thời gian và chí phí mà không đảm bảo được hiệu quả. Dự báo giá CP là một việc rất phức tạp. Hầu hết các tổ chức kinh doanh trong lĩnh vực này thường sử dụng phân tích chuỗi kỹ thuật, cơ bản hoặc phân tích chuỗi thời gian trong việc cố gắng dự đoán giá CP. Tuy nhiên, các chiến lược này không dẫn đến kết quả đáng tin cậy vì chúng hướng dẫn về xu hướng và không phải là giá có độ chính xác cao nhất.

Cần phải sử dụng các phương pháp nâng cao để dự đoán kết quả chính xác nhất. Nhiều nhà NC cũng đã dùng nhiều phương pháp khác nhau với nhiều bộ tham số đầu vào khác nhau để dự đoán giá CP trong vài thập kỷ qua. Hiện tại, các vấn đề về phân tích dữ liệu chuỗi lịch sử giá CP với nhiều mô hình học máy trong việc dự đoán được sử dụng rộng rãi trong và ngoài nước. Chúng được tóm tắt ngắn gọn và liệt kê trong bảng sau: 3 Bảng 2-1 Bảng tổng hợp các nghiên cứu liên quan Stt Tác giả - tạp chí Tên đề tài Mục tiêu NC i Phương pháp NC Kết quả NC 01 -“A.

Sử dụng đối sánh “Tác giả so sánh “Nghiên cứu sử dụng dữ “ARIMA và ANN Adewumi and C. mô hình ANN và hiệu suất dự báo của liệu công bố từ NYSE đạt hiệu suất dự báo Ayo” ARIMA trong việc ARIMA và ANN trên các mô hình tốt, sai số của hai mô - iJournal of Applied dự đoán giá cổ với dữ liệu CK được ARIMA và ANN được hình khá thấp trong iMathematics, vol. công bố thu được từ phát triển. dự báo ngắn hạn.

1-7, 3 Sở giao dịch CK Tuy nhiên, ANN vẫn 2014”[2] New York” tốt hơn so với ARIMA” 02 -“B. i Dự đoán giá cổ “Đề xuất mô hình “Dữ liệu được sử dụng “Nghiên cứu cho kết Muchemi - 8i phiếu bằng mô ANN trong dự đoán là giá đóng cửa hàng quả dự đoán với 2014”[3] hình ANN giiá CP trên các thị ngày của từng CP riêng MAPE trong khoảng trường CK điển lẻ 0,71% đến 2,77%” hình” (khoảng 60 công ty) của sàn CK Nairobi (NSE) trong thời gian 5 năm, 4 2008 đến 2012 (1.000 hàng dữ liệu) thu từ (Synergy 2013) “Mô hình cơ sở ban đầu sử dụng tỷ lệ dữ liệu thử nghiệm và đào tạo 70:30, với cấu hình là 5: 11: 11: 1, 70% dữ liệu đào tạo là từ tháng 1/2008 – 12/2012” “Thời gian kiểm tra trong 3 tháng từ nhóm 30% dữ liệu còn lại” 03 -“Khaliid Alkhatiib, Sử dụng mô hình “Sử dụng KNN dự “Áp dụng thuật toán “Theo kết quả, thuật Hassan Najiadat, KNN cho việc dự đoán nhằm hỗ trợ KNN (k=5) và phương toán KNN ổn định và Ismail Hmeiidi, báo giá cổ phiếu các NĐT, ban quản pháp hồi quy phi tuyến mạnh mẽ với tỷ lệ sai Mohammed K. Ali lý, người ra quyết để dự đoán giá CP cho số nhỏ nên kết quả Shatnawi” định và người dùng một mẫu gồm năm DN đưa ra là hợp lý”. 5 - “International i đưa ra giá trị chính lớn được niêm yết trên Journal of Business, i xác và các quyết thị trường CK Jordan” Humanties and i định đầu tư sáng Technology, Vol.

3; March 2013” i [4] 04 -“WEN Fenghuaa, Dự báo giá cổ Đề xuất thuật toán “Dựa trên SSA và lấy “Dự đoán kết hợp XIAO Jihong, HE phiếu dựa vào SSA SVM để dự đoán giá giá đóng cửa Chỉ số bằng cách phân tách Zhifang, GONG Xu” and SVM CP có độ chính xác tổng hợp của sàn chuỗi chỉ số ban đầu - “2nd International i cao Thượng Hải (SSE) từ thành các chuỗi có Conference on ngày 5/1/2009 đến ngày hàm ý kinh tế được Information 30/9/2013” mong muốn hơn là Technology and Tác giả giới thiệu đưa ra các dự đoán Quantitative phương pháp SVM để SVM đơn thuần và Management, dự đoán các dự đoán kết hợp ITQM 2014”[5] So sánh hiệu quả kết SSA-SVM tốt hơn so hợp SSA-SVM với với các dự đoán kết SVM và kết hợp hợp EEMD-SVM” EEMD-SVM 6 05 -“Nguyen Le Nam “Ứng dụng mô “Dự báo chỉ số VN- “Sử dụng chuỗi dữ liệui “Mô hình GARCH i Phương” hình ARIMA, Index trong tuần đầu đã có tính dừng để ước i (1, 1) sửa lỗi được - “Trường Đại học ARCH/GARCH để tiên 5/2015 để đề lượng một loạt các mô hiện tượng phương i Kinh tế Huế, 2014.” dự báo chỉ số VN- xuất xu hướng chiỉ hình ARIMA sử dụng i sai sai số thay đổi mà i [6] Index trong ngắn số CK và tìinh hình các chỉ tiêu như AIC, i mô hình ARIMA (2, hạn” thị trường để NĐT SIC,…để lựa chọn mô 1, 2) không làm và DN có cái nhìn hình ARIMA tốt nhất.” i được, vừa đơn giản tổng quan về TTCK và có độ tổng quát có đối sách trong cao hơn so với mô thờii giian ngắn hình ARCH. Phạm vi ứng dụng Bài luận đã nêu ra các kỹ thuật học máy tiên tiến có độ tin cậy cao trong việc dự đoán các mục vấn đề dựa vào dữ liệu quá khứ. Thuật toán xử lý được các bài toán phi tuyến với nhiều yếu tố ảnh hưởng. Chính vì thế, thuật toán có thể đưa ra các dự báo trong một số lĩnh vực như sau: + Kinh tế, tài chính: Dự báo giá CP, chỉ số CK.

+ Bất động sản: Dự báo giá nhà, giá nhà cho thuê, giá đất. + Lĩnh vực y tế: Chẩn đoán bệnh… + Lĩnh vực XD: Có thể dự đoán các vết nứt, sụt lún theo thời gian và nhiều lĩnh vực khác. Các khái niệm liên quan chứng khoán 3. Cổ phiếu Theo khoản 2, điều 4 Luật chứng khoán số 54/2019/QH14 ngày 26/11/2019 nêu rõ [7] “Cổ phiếu là loại chứng khoán xác nhận quyền và lợi ích hợp pháp của người sở hữu đối với một phần vốn cổ phần của tổ chức phát hành”.

Phân loại cổ phiếu - CP thường: “Là CP thông dụng nhất trong công ty cổ phần, nó còn được gọi là CP phổ thông, người nắm giữ loại CP này được hưởng quyền lợi nhất định” [8]. - CP ưu đãi: + CP ưu đãi biểu quyết: Được hiểu là CP có số phiếu biểu quyết nhiều hơn so với CP phổ thông. Tùy thuộc vào điều lệ mỗi DN sẽ quy định số phiếu biểu quyết của một cổ phần ưu đãi là bao nhiêu, còn pháp luật không quy định + CP ưu đãi cổ tức: Loại CP này có mức cổ tức cao hơn so với CP thường hoặc mức ổn định hằng năm. + CP ưu đãi hoàn lại: Là CP sẽ được công ty trả lại phần giá trị góp vốn nếu chủ sở hữu yêu cầu hoặc theo quy định ghi trên CP này, đồng thời có thể được chuyển đổi thành CP thường theo quyết định của Đại hội cổ đông.

+ Ngoài ra các CP ưu đãi nêu trên một số DN có các loại CP ưu đãi riêng. Đặc điểm của cổ phiếu - Không có kỳ hạn và không hoàn vốn ngoại trừ các loại CP ưu đãi hoàn lại hoặc CP ưu đãi khác do mỗi DN quy định. 9 - Tính thanh khoản: là khả năng chuyển đổi tài sản hữu hình thành tiền mặt, thời gian và chi phí chuyển đổi sẽ quyết định khả năng nhanh hay chậm. Các loại CK khác nhau có mức độ chuyển nhượng khác nhau.

- Giá CP không ổn định và thay đổi theo hiệu quả SXKD của từng DN mang lại. - Khi tham gia mua, bán CP có nghĩa là chúng ta đang chơi một trò trơi đầy rủi ro. Các loại giá cổ phiếu - Mệnh giá: Giá trị danh nghĩa của CP. Do sự tăng trưởng của DN và sự thay đổi của thị trường dẫn đến giá bán CP ngày càng tách khỏi giá trị danh nghĩa của CP.

Khi một công ty mới được thành lập, nó có công thức tính như sau: (3.1) Điều 13 Luật CK số 54/2019/QH14 ngày 29/11/2019 [7] quy định: “Mệnh giá của CP lần đầu chào bán ra công chúng là 10.000 đồng Việt Nam” - Thư giá: Hay còn gọi là giá trị ghi trong văn bản thể hiện vốn góp của DN tại một mốc thời gian nào đó.2) - Giá trị nội tại: Thể hiện giá trị thực của CP tại thời điểm xem xét. Căn cứ giá trị cổ tức, triển vọng tăng trưởng của DN và lãi suất thị trường để tính giá trị nội tại. Giá trị này là mấu chốt quan trọng để thẩm định giá trị thực của CP, so sánh với giá giao dịch trên thị trường, giúp chọn được phương án tối ưu. 10 - Thị giá: Là giá của CP được mua bán ngay thời điểm giao dịch, theo đó giá này có thể cao hơn, thấp hơn hoặc bằng đúng giá trị thực vào thời điểm giao dịch.

Lợi tức của cổ phiếu + Cổ tức: Lấy khoản sinh lợi sau thuế trừ phần chi trả cổ tức ưu đãi và giữ lại một khoản để tái đầu tư còn lại đem chia cho mỗi CP. Mức cổ tức tùy vào lợi nhuận và chính sách cổ tức DN [9]. + Lợi tức do chênh lệch giá: Là phần dư ra giữa giá bán ra và mua vào của một CP. Hầu hết, các NĐT với chiến lược giao dịch ngắn hạn sẽ bán ra khi giá tăng để hưởng chênh lệch [9].

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ của Trần Đỗ Quốc Trung mang tên Dự đoán giá cổ phiếu doanh nghiệp xây dựng và bất động sản trên thị trường chứng khoán Việt Nam tập trung vào việc áp dụng các phương pháp máy học để dự đoán giá cổ phiếu trong ngành xây dựng và bất động sản tại Việt Nam. Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về biến động giá cổ phiếu mà còn giúp các nhà đầu tư có thêm thông tin để ra quyết định đầu tư chính xác hơn. Đặc biệt, bài viết còn nhấn mạnh tầm quan trọng của việc áp dụng công nghệ trong việc nâng cao hiệu quả đầu tư và quản lý tài chính trong lĩnh vực này.

Nếu bạn quan tâm đến các khía cạnh khác trong lĩnh vực quản lý xây dựng, có thể tham khảo thêm bài viết Luận văn thạc sĩ về quản lý xây dựng và đấu thầu hợp đồng cho công trình nông nghiệp tại Phú Thọ, nơi đề cập đến tổ chức đấu thầu và quản lý hợp đồng trong ngành xây dựng. Bên cạnh đó, bài viết Nâng cao chất lượng tư vấn quản lý dự án đầu tư xây dựng tại công ty cổ phần tư vấn xây dựng và quy hoạch Nam Trung Bộ cũng sẽ mang đến cho bạn những giải pháp để nâng cao chất lượng trong quản lý dự án đầu tư xây dựng. Những tài liệu này không chỉ mở rộng kiến thức mà còn giúp bạn có cái nhìn đa chiều về ngành xây dựng và bất động sản tại Việt Nam.

#Phân tích dữ liệu

#công nghệ tài chính

#thị trường chứng khoán

#Mô Hình Dự Đoán

#doanh nghiệp xây dựng

#bất động sản Việt Nam

Chủ đề

Phân tích thị trường chứng khoán

Ứng dụng máy học trong tài chính

Ngành xây dựng và bất động sản tại Việt Nam

Chiến lược đầu tư thông minh

Luận văn thạc sĩ quản lý xây dựng dự đoán giá cổ phiếu doanh nghiệp xây dựng và bất động sản trên thị trường chứng khoán việt nam dựa trên tiếp cận máy học

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

LỜI CAM KẾT

1. CHƯƠNG 1: Lý do chọn đề tài

1.1. Mục tiêu nghiên cứu

1.2. Đối tượng và phạm vi nghiên cứu

1.3. Ý nghĩa khoa học và thực tiễn của đề tài

1.4. Kết cấu luận văn

2. CHƯƠNG 2: Các nghiên cứu liên quan

2.1. Phạm vi ứng dụng

3. CHƯƠNG 3: Các khái niệm liên quan chứng khoán

3.1. Phân loại cổ phiếu

3.2. Đặc điểm của cổ phiếu

3.3. Các loại giá cổ phiếu

3.4. Lợi tức của cổ phiếu

3.5. Rủi ro của cổ phiếu

3.6. Thị trường chứng khoán

3.7. Chỉ số chứng khoán

3.8. Các chủ thể tham gia thị trường chứng khoán

3.9. Support Vector Machine (SVM)

3.10. Mạng Long Short Term Memory (LSTM)

4. CHƯƠNG 4: PHƯƠNG PHÁP LUẬN - MÔ HÌNH ĐỀ XUẤT

4.1. Các phương pháp phân tích cơ bản

4.2. Phương pháp phân tích top – down

4.3. Phương pháp phân tích bottom – up

4.4. Phương pháp phân tích bằng các mô hình học máy – mô hình đề xuất. Phương pháp sử dụng mô hình LSTM

4.5. Các tiêu chí đánh giá

5. CHƯƠNG 5: PHÂN TÍCH VÀ ĐÁNH GIÁ KẾT QUẢ THỰC NGHIỆM

5.1. Trình tự quy trình xử lý thực nghiệm. Cài đặt môi trường thực nghiệm

5.2. Ngôn ngữ lập trình Python

5.3. Môi trường Google colaboratory

5.4. Các thư viện dùng trong thực nghiệm

5.5. Thu thập danh sách mã CP các công ty theo ngành (Code_01)

5.6. Tải dữ liệu CK từ các website (Code_02)

5.7. Chạy thực nghiệm trên mỗi mã Cổ phiếu (Code_03)

5.8. Chạy thực nghiệm trên 03 bộ dữ liệu (80 mã CP nhóm BĐS, 95 mã CP nhóm XD, 175 mã CP BĐS và XD) (Code_04)

5.9. Nhận xét - đánh giá các mô hình

5.10. Trường hợp dự đoán giá trên bộ dữ liệu mỗi công ty

5.11. Trường hợp dự đoán giá trên toàn bộ dữ liệu của 175 công ty, 80 công ty lĩnh vực BĐS, 95 công ty lĩnh vực XD. Kết quả đạt được

6. CHƯƠNG 6: Kết luận và đề xuấti hướng nghiên cứu

6.1. Hạn chế của bài nghiên cứu

6.2. Hướng phát triển đề tài

6.3. Khi cổ phiếu giảm

DANH MỤC CÁC CÔNG TRÌNH NGHIÊN CỨU

TÀI LIỆU THAM KHẢO

PHỤ LỤC CÁC HÌNH ẢNH THỰC NGHIỆM

PHỤ LỤC CÁC CODE LIÊN QUAN

8.1. Code_01: Crawl dữ liệu nhóm ngành

8.2. Code_02: Tải dữ liệu chứng khoán

8.3. Code_03: Chạy các mô hình

8.4. Code_04: Chạy thực nghiệm cho tất cả công ty

DANH MỤC CÁC BIỂU BẢNG

DANH MỤC HÌNH ẢNH

DANH MỤC CÁC TỪ VIẾT TẮT

I. Giới thiệu

1.1. Tầm quan trọng của việc dự đoán giá cổ phiếu

II. Các mô hình học máy

2.1. Mô hình LSTM

2.2. Mô hình KNN

III. Phân tích và đánh giá kết quả thực nghiệm

3.1. So sánh hiệu suất các mô hình

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Trần Đỗ Quốc Trung

Người hướng dẫn: TS. Dương Minh Đức

Trường học: Đại học Bách Khoa - Đại học Quốc gia Thành phố Hồ Chí Minh

Chuyên ngành: Quản Lý Xây Dựng

Đề tài: Dự Đoán Giá Cổ Phiếu Doanh Nghiệp Ngành Xây Dựng Và Bất Động Sản Trên Thị Trường Chứng Khoán Việt Nam Dựa Trên Tiếp Cận Máy Học

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2021

Địa điểm: Thành phố Hồ Chí Minh

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả