I. Mô hình dự đoán
Mô hình dự đoán là trọng tâm của khóa luận, tập trung vào việc dự đoán thời gian đến của các phương tiện giao thông công cộng. Các mô hình học máy và học sâu như Ridge Regression, Decision Tree, Random Forest, và Gradient-boosted Trees được áp dụng. Đặc biệt, các mô hình học sâu như CNN, LSTM, GRU, và BiGRU-BiLSTM-CNN được sử dụng để tăng độ chính xác. Các mô hình này được đánh giá dựa trên các chỉ số như MSE, RMSE, MAE, và R-squared.
1.1. Thuật toán dự đoán
Các thuật toán dự đoán được nghiên cứu và triển khai bao gồm Ridge Regression, Decision Tree, Random Forest, và Gradient-boosted Trees. Các thuật toán này được so sánh với các mô hình học sâu như CNN, LSTM, GRU, và BiGRU-BiLSTM-CNN để đánh giá hiệu quả. Kết quả cho thấy các mô hình học sâu có độ chính xác cao hơn trong việc dự đoán thời gian đến của phương tiện giao thông.
1.2. Mô hình học sâu
Các mô hình học sâu như CNN, LSTM, GRU, và BiGRU-BiLSTM-CNN được sử dụng để tối ưu hóa dự đoán. LSTM và GRU được chọn vì khả năng xử lý dữ liệu chuỗi thời gian, trong khi CNN được sử dụng để trích xuất đặc trưng từ dữ liệu. BiGRU-BiLSTM-CNN là mô hình kết hợp, mang lại kết quả dự đoán chính xác nhất.
II. Thời gian đến
Thời gian đến của phương tiện giao thông là yếu tố quan trọng trong nghiên cứu. Khóa luận tập trung vào việc dự đoán chính xác thời gian này dựa trên các yếu tố như điều kiện giao thông, thời tiết, và sự cố. Các mô hình được huấn luyện trên hai bộ dữ liệu Bus Dataset và Subway Dataset, đảm bảo tính đa dạng và thực tế.
2.1. Phân tích thời gian
Phân tích thời gian được thực hiện để hiểu rõ các yếu tố ảnh hưởng đến thời gian đến của phương tiện. Các yếu tố như thời tiết, sự cố giao thông, và lưu lượng được xem xét. Kết quả phân tích giúp cải thiện độ chính xác của các mô hình dự đoán.
2.2. Tối ưu hóa giao thông
Tối ưu hóa giao thông là mục tiêu chính của nghiên cứu. Bằng cách dự đoán chính xác thời gian đến, hệ thống giúp người dùng lên kế hoạch di chuyển hiệu quả, giảm thiểu thời gian chờ đợi và tăng cường trải nghiệm người dùng.
III. Phương tiện giao thông
Phương tiện giao thông công cộng như xe buýt và tàu điện ngầm là đối tượng chính của nghiên cứu. Dữ liệu được thu thập từ các nguồn như TTC Dataset, bao gồm thông tin về lịch trình, độ trễ, và sự cố. Các mô hình được huấn luyện để dự đoán thời gian đến của các phương tiện này, giúp cải thiện dịch vụ giao thông công cộng.
3.1. Dữ liệu giao thông
Dữ liệu giao thông được thu thập từ các nguồn như TTC Dataset, bao gồm thông tin về lịch trình, độ trễ, và sự cố. Dữ liệu được tiền xử lý để loại bỏ nhiễu và chuẩn hóa trước khi đưa vào mô hình.
3.2. Hệ thống giao thông
Hệ thống giao thông được cải thiện thông qua việc áp dụng các mô hình dự đoán. Hệ thống giúp tối ưu hóa lộ trình và lịch trình của các phương tiện, giảm thiểu độ trễ và nâng cao chất lượng dịch vụ.
IV. Khóa luận tốt nghiệp
Khóa luận tốt nghiệp này là kết quả của quá trình nghiên cứu và phát triển trong lĩnh vực Công nghệ Thông tin. Nghiên cứu tập trung vào việc xây dựng các mô hình dự đoán thời gian đến của phương tiện giao thông, áp dụng các công nghệ hiện đại như Big Data, Spark Streaming, và Kafka.
4.1. Ứng dụng CNTT
Ứng dụng CNTT trong nghiên cứu bao gồm việc sử dụng Big Data để xử lý lượng dữ liệu lớn, Spark Streaming để xử lý dữ liệu thời gian thực, và Kafka để thu thập dữ liệu từ nhiều nguồn.
4.2. Khoa học dữ liệu
Khoa học dữ liệu là nền tảng của nghiên cứu, với việc áp dụng các phương pháp phân tích dữ liệu và xây dựng mô hình dự đoán. Kết quả nghiên cứu hứa hẹn mang lại nhiều ứng dụng thực tiễn trong lĩnh vực giao thông.