Thiết kế hệ thống đa tác vụ cho xe tự hành tại HCMUTE

Trường đại học

Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành

Kỹ Thuật Máy Tính

Người đăng

Ẩn danh

Thể loại

luận văn

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

DANH MỤC HÌNH

DANH MỤC BẢNG

DANH MỤC NHỮNG TỪ VIẾT TẮT

THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI

MỞ ĐẦU

1. GIỚI THIỆU TÌNH HÌNH NGHIÊN CỨU HIỆN NAY

2. LÝ DO CHỌN ĐỀ TÀI

3. MỤC TIÊU ĐỀ TÀI

4. PHƯƠNG PHÁP NGHIÊN CỨU

5. ĐỐI TƯỢNG NGHIÊN CỨU

6. PHẠM VI NGHIÊN CỨU

1. CHƯƠNG 1: CƠ SỞ LÝ THUYẾT

1.1. Pytorch

1.2. Máy học (Machine Learning)

1.3. Học sâu (Deep learning)

1.4. Mạng nơ ron tích chập (Convolutional Neural Network)

2. CHƯƠNG 2: THIẾT KẾ VÀ XÂY DỰNG HỆ THỐNG

2.1. Thiết kế hệ thống

3. CHƯƠNG 3: KẾT QUẢ THỰC NGHIỆM

3.1. Môi trường đánh giá

3.2. Tập dữ liệu

3.3. Các phương pháp đánh giá

3.4. Chi tiết triển khai

4. CHƯƠNG 4: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

4.1. Hướng phát triển

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Hệ thống đa tác vụ cho xe tự hành tại HCMUTE Tổng quan

Công trình nghiên cứu Hệ thống đa tác vụ cho xe tự hành tại HCMUTE (Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh) tập trung vào việc thiết kế và triển khai một hệ thống xử lý thông tin đa nhiệm thời gian thực, nhằm cải thiện hiệu suất và độ tin cậy của hệ thống lái tự động. Nghiên cứu xe tự hành hiện nay thường sử dụng các mô hình xử lý độc lập các tác vụ, dẫn đến độ trễ cao và tiêu tốn tài nguyên. Ngược lại, hệ thống đa tác vụ được đề xuất trong nghiên cứu này cho phép thực hiện đồng thời nhiều tác vụ quan trọng, bao gồm nhận diện biển báo, phát hiện vật cản, và phân đoạn làn đường. Việc tích hợp các tác vụ này vào một hệ thống thống nhất nhằm mục đích giảm thiểu độ trễ, tối ưu hóa sử dụng tài nguyên và nâng cao an toàn giao thông. Ứng dụng thực tế của hệ thống này hướng tới việc hỗ trợ người lái và cuối cùng là xây dựng hệ thống lái tự động hoàn toàn. Công nghệ xe tự hành là trọng tâm của nghiên cứu, đặc biệt là xu hướng xe tự hành hiện đại. Nghiên cứu này đóng góp vào sự phát triển của công nghệ xe tự hành tại Việt Nam và mang lại các ứng dụng thực tiễn đáng kể.

1.1. Mục tiêu và phạm vi nghiên cứu

Mục tiêu chính là thiết kế và triển khai một hệ thống đa tác vụ hiệu quả cho xe tự hành, xử lý đồng thời các tác vụ: nhận diện biển báo, phát hiện vật cản, và phân đoạn làn đường. Phạm vi nghiên cứu tập trung vào việc thiết kế kiến trúc hệ thống, lựa chọn và tối ưu hóa thuật toán điều khiển, và đánh giá hiệu suất trên môi trường mô phỏng. Phần mềm nhúng đóng vai trò quan trọng trong việc thực hiện hệ thống. Nghiên cứu này sử dụng framework Pytorch và ngôn ngữ lập trình Python. Các thử nghiệm được thực hiện trên các video thu sẵn trong môi trường mô phỏng như Unity và Carla, điều này giúp giảm chi phí và rủi ro trong giai đoạn phát triển ban đầu. Kiến trúc hệ thống được thiết kế để đáp ứng yêu cầu thời gian thực, đảm bảo độ chính xác và độ tin cậy cao. An toàn xe tự hành là yếu tố được đặt lên hàng đầu trong suốt quá trình nghiên cứu và phát triển.

1.2. Phương pháp nghiên cứu

Nghiên cứu này sử dụng phương pháp nghiên cứu xe tự hành dựa trên học máy và học sâu. Cụ thể, nhóm nghiên cứu đã tổng hợp và phân tích các công trình nghiên cứu hiện có về mạng nơ ron tích chập (CNN), phát hiện vật thể, phân đoạn hình ảnh, và học đa tác vụ. Thuật toán điều khiển được lựa chọn dựa trên hiệu quả và khả năng đáp ứng yêu cầu thời gian thực. Mạng Nanodet được sử dụng cho nhiệm vụ phát hiện và nhận diện vật thể. Hệ thống định vị dựa trên dữ liệu từ camera và các cảm biến khác. Dữ liệu xử lý được tiến hành để đảm bảo chất lượng dữ liệu đầu vào. Lập kế hoạch đường đi là một phần quan trọng của hệ thống. Khả năng xử lý dữ liệu của hệ thống được đánh giá dựa trên tốc độ xử lý, độ chính xác và khả năng hoạt động trong điều kiện thực tế. Mô phỏng xe tự hành đóng vai trò quan trọng trong việc đánh giá hiệu quả của hệ thống. Trí tuệ nhân tạo (AI), cụ thể là học máy, được ứng dụng để xử lý thông tin hình ảnh và ra quyết định.

1.3. Kết quả và đóng góp

Kết quả nghiên cứu cho thấy hệ thống đa tác vụ đã đạt được hiệu quả đáng kể về tốc độ và độ chính xác so với các phương pháp xử lý độc lập. Cụ thể, hệ thống đã cải thiện tốc độ xử lý hơn 40 frames/s, đồng thời đạt độ chính xác cao hơn trong các nhiệm vụ nhận diện biển báo, phát hiện vật cản, và phân đoạn làn đường. Nghiên cứu đã chứng minh khả năng xử lý dữ liệu hiệu quả của hệ thống đa tác vụ, mở ra hướng phát triển mới cho xe tự hành tại Việt Nam. Cơ sở lý thuyết đã được xây dựng vững chắc, dựa trên các kiến thức về hệ điều hành thời gian thực (RTOS) và thiết kế hệ thống nhúng. Kết quả nghiên cứu được công bố tại hội nghị quốc tế, góp phần vào sự phát triển của cộng đồng nghiên cứu xe tự hành. An toàn xe tự hành được đảm bảo thông qua việc tối ưu hóa tốc độ xử lý và độ chính xác của hệ thống. Đây là một đóng góp quan trọng cho nghiên cứu xe tự hành và công nghệ xe tự hành nói chung.

01/02/2025

Bạn đang xem trước tài liệu:

Hcmute thiết kế hệ thống đa tác vụ cho xe tự hành

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển nhanh chóng của công nghệ xe tự hành tại Việt Nam, với sự tham gia tích cực của các tập đoàn lớn và cộng đồng nghiên cứu trong nước, việc nâng cao hiệu quả và tốc độ xử lý các nhiệm vụ nhận diện trong xe tự hành trở thành một thách thức quan trọng. Theo ước tính, các hệ thống xe tự hành hiện nay thường phải xử lý đồng thời nhiều tác vụ như nhận diện biển báo, phát hiện vật cản và phân đoạn làn đường, tuy nhiên các phương pháp truyền thống thường thực hiện các nhiệm vụ này một cách độc lập, dẫn đến độ trễ cao và tiêu tốn nhiều tài nguyên hệ thống. Mục tiêu của luận văn là thiết kế một hệ thống học đa tác vụ (multi-task learning) cho xe tự hành, nhằm xử lý đồng thời các tác vụ trên, cải thiện đáng kể độ trễ và tiết kiệm tài nguyên, phù hợp cho các thiết bị nhúng. Phạm vi nghiên cứu tập trung trên dữ liệu mô phỏng thu thập từ các phần mềm Unity và Carla, với tổng cộng 10.000 ảnh đa dạng về môi trường và điều kiện thời tiết. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao tốc độ xử lý hơn 40 khung hình/giây so với các mô hình đơn nhiệm, đồng thời cải thiện độ chính xác nhận diện vật thể và phân đoạn làn đường từ 1.1% đến 4% so với các mạng hiện đại, góp phần thúc đẩy ứng dụng thực tiễn trong lĩnh vực xe tự hành và các hệ thống hỗ trợ tài xế thông minh.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng học sâu (Deep Learning) và mạng nơ ron tích chập (Convolutional Neural Network - CNN) để giải quyết các bài toán thị giác máy tính trong xe tự hành. Hai lý thuyết trọng tâm được áp dụng gồm:

Mạng Nanodet: Một mạng phát hiện vật thể một giai đoạn (one-stage) với kiến trúc Fully Convolutional One-Stage Object Detection (FCOS), sử dụng kỹ thuật anchor-free để tăng tốc độ và giảm độ phức tạp tính toán. Nanodet kết hợp depthwise separable convolutions và ShuffleNetV2 làm backbone để giảm số lượng tham số và tăng tốc độ xử lý, đạt tốc độ xử lý nhanh gấp 3 lần so với các mạng YOLO nhẹ và kích thước mô hình chỉ 1.8MB.
Phương pháp học đa tác vụ (Multi-task Learning): Mạng được thiết kế để xử lý đồng thời các nhiệm vụ phát hiện vật thể, nhận diện biển báo và phân đoạn làn đường, tận dụng sự liên quan giữa các tác vụ để cải thiện hiệu suất tổng thể. Mạng sử dụng một nhánh mã hóa chung (backbone + neck) và hai nhánh giải mã riêng biệt cho các nhiệm vụ phát hiện và phân đoạn. Hàm mất mát tổng hợp bao gồm các thành phần bounding box loss, quality focal loss, distribution focal loss và cross entropy loss cho phân đoạn, với trọng số điều chỉnh cân bằng giữa các nhiệm vụ.

Các khái niệm chính bao gồm: convolution layer, pooling layer, fully connected layer, activation function (ReLU, Sigmoid), depthwise separable convolution, grouped convolution, channel shuffle, generalized focal loss (GFL), và các chỉ số đánh giá như mAP, IoU, Precision, Recall.

Phương pháp nghiên cứu

Nguồn dữ liệu sử dụng là bộ dữ liệu mô phỏng Carla và Unity, tổng cộng 10.000 ảnh với 13 phân lớp khác nhau, trong đó tập trung vào các phân lớp đường, nền, vật thể, biển báo và phương tiện giao thông. Dữ liệu được chia thành 8.000 ảnh huấn luyện và 2.000 ảnh đánh giá, đồng thời áp dụng kỹ thuật tăng cường dữ liệu (data augmentation) với các biến đổi hình học và trắc quang để tăng tính đa dạng và tránh overfitting.

Phương pháp phân tích bao gồm huấn luyện mô hình đa tác vụ trên framework PyTorch, sử dụng thuật toán tối ưu Adam với learning rate 0.001, và đánh giá hiệu năng qua các chỉ số mAP, IoU, Precision, Recall, cùng tốc độ xử lý (fps). Cỡ mẫu huấn luyện là 80.000 ảnh sau tăng cường, thử nghiệm trên 20.000 ảnh. Các so sánh được thực hiện giữa mô hình đa tác vụ và các mô hình đơn nhiệm nổi bật như Scaled Yolov4 Tiny, Faster RCNN, Unet, Enet.

Timeline nghiên cứu bao gồm giai đoạn tìm hiểu và tổng hợp lý thuyết, thiết kế mô hình, triển khai và huấn luyện, đánh giá kết quả và hoàn thiện báo cáo trong khoảng thời gian đào tạo 8 năm của sinh viên ngành Kỹ thuật Máy tính tại Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Tăng tốc độ xử lý đáng kể: Mô hình học đa tác vụ đạt tốc độ xử lý hơn 40 khung hình/giây so với việc thực thi từng tác vụ riêng biệt, cho phép vận hành trong thời gian thực trên các thiết bị nhúng.
Cải thiện độ chính xác phát hiện vật thể và nhận diện biển báo: Mô hình đa tác vụ đạt mAP 88.35%, vượt 4% so với mạng Scaled Yolov4 Tiny (84.35%) trong nhiệm vụ phát hiện vật cản và nhận diện biển báo.
Nâng cao hiệu quả phân đoạn làn đường: Mô hình đạt IoU 95.43%, cao hơn 1.1% so với Unet (94.33%) và 3.7% so với Enet, đồng thời duy trì tốc độ xử lý nhanh hơn đáng kể.
Hiệu quả trong điều kiện môi trường thách thức: Mô hình duy trì hiệu suất ổn định trong các điều kiện thời tiết xấu như ban đêm, mưa, và giao thông đông đúc, chứng minh tính ứng dụng thực tế cao.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là do thiết kế mạng đa tác vụ cho phép chia sẻ đặc trưng giữa các nhiệm vụ, từ đó tăng cường khả năng học và giảm thiểu sự trùng lặp trong xử lý. Việc sử dụng ShuffleNetV2 làm backbone và depthwise separable convolutions giúp giảm số lượng tham số và tăng tốc độ tính toán, phù hợp với các hệ thống nhúng có tài nguyên hạn chế.

So sánh với các nghiên cứu trước đây như Mask RCNN hay DLT-Net, mô hình đề xuất khắc phục được nhược điểm về tốc độ và khả năng xử lý đồng thời nhiều tác vụ, đồng thời thiết kế nhánh phân đoạn làn đường dựa trên mạng phát hiện vật thể giúp tăng tính linh hoạt và chính xác trong việc nhận diện các ranh giới phức tạp của làn đường.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh mAP, IoU và fps giữa các mô hình, cũng như bảng tổng hợp kết quả thử nghiệm trên các bộ dữ liệu Carla và Unity, minh họa rõ ràng sự vượt trội của mô hình đa tác vụ.

Đề xuất và khuyến nghị

Triển khai mô hình trên thiết bị nhúng thực tế: Tập trung tối ưu hóa phần cứng và phần mềm để đưa mô hình vào các hệ thống xe tự hành thực tế, nhằm tận dụng tốc độ xử lý cao và độ chính xác đã đạt được.
Mở rộng phạm vi nhiệm vụ đa tác vụ: Phát triển thêm các nhánh giải mã cho các tác vụ khác như dự đoán hành vi người đi bộ, nhận diện tín hiệu giao thông để nâng cao khả năng nhận thức toàn diện của xe tự hành.
Tăng cường dữ liệu huấn luyện đa dạng: Thu thập và bổ sung dữ liệu thực tế từ nhiều môi trường khác nhau, đặc biệt là các tình huống phức tạp và hiếm gặp để cải thiện khả năng khái quát của mô hình.
Nghiên cứu tích hợp với các hệ thống hỗ trợ tài xế: Áp dụng mô hình vào các hệ thống cảnh báo va chạm, hỗ trợ giữ làn đường nhằm nâng cao an toàn giao thông và trải nghiệm người dùng.

Các giải pháp trên nên được thực hiện trong vòng 1-2 năm tới, với sự phối hợp giữa các nhóm nghiên cứu, doanh nghiệp công nghệ và cơ quan quản lý giao thông để đảm bảo tính khả thi và hiệu quả ứng dụng.

Đối tượng nên tham khảo luận văn

Sinh viên và học viên ngành Kỹ thuật Máy tính, Điện-Điện tử: Có thể sử dụng luận văn làm tài liệu tham khảo để nghiên cứu về học sâu, mạng nơ ron tích chập và ứng dụng trong xe tự hành, từ đó phát triển các đề tài nghiên cứu hoặc dự án thực tế.
Nhà nghiên cứu và phát triển công nghệ xe tự hành: Được cung cấp phương pháp thiết kế mạng đa tác vụ hiệu quả, giúp cải thiện tốc độ và độ chính xác trong các hệ thống nhận diện và phân đoạn, phục vụ cho việc phát triển sản phẩm và giải pháp mới.
Doanh nghiệp công nghệ và startup trong lĩnh vực AI và xe tự hành: Có thể áp dụng các kiến thức và mô hình đề xuất để xây dựng các hệ thống nhúng thông minh, tiết kiệm tài nguyên và nâng cao hiệu suất vận hành.
Cơ quan quản lý và đào tạo: Sử dụng luận văn làm tài liệu tham khảo để xây dựng chương trình đào tạo, tổ chức các cuộc thi nghiên cứu khoa học nhằm thúc đẩy phát triển công nghệ xe tự hành trong nước.

Câu hỏi thường gặp

Mô hình học đa tác vụ có ưu điểm gì so với mô hình đơn nhiệm?
Mô hình học đa tác vụ cho phép chia sẻ đặc trưng giữa các nhiệm vụ liên quan, giúp cải thiện độ chính xác và giảm thời gian xử lý. Ví dụ, mô hình trong nghiên cứu tăng tốc hơn 40 fps so với thực thi từng tác vụ riêng biệt.
Tại sao chọn ShuffleNetV2 làm backbone cho mô hình?
ShuffleNetV2 giảm đáng kể số lượng tham số và tính toán nhờ kỹ thuật grouped convolution và channel shuffle, phù hợp cho các thiết bị nhúng cần tốc độ xử lý nhanh và tài nguyên hạn chế.
Phương pháp tăng cường dữ liệu được áp dụng như thế nào?
Tăng cường dữ liệu bao gồm biến đổi hình học (xoay, cắt, tịnh tiến) và biến đổi trắc quang (điều chỉnh màu sắc, độ sáng, độ tương phản), giúp mô hình học được đa dạng đặc trưng và tránh overfitting.
Mô hình có thể hoạt động tốt trong điều kiện thời tiết xấu không?
Kết quả thử nghiệm cho thấy mô hình duy trì hiệu suất ổn định trong các điều kiện như ban đêm, mưa và giao thông đông đúc, nhờ khả năng học đa tác vụ và dữ liệu huấn luyện đa dạng.
Làm thế nào để cân bằng giữa các hàm mất mát trong mô hình đa tác vụ?
Các trọng số α, β, γ trong hàm mất mát tổng hợp được xác định bằng thực nghiệm để đảm bảo cân bằng giữa các nhiệm vụ phát hiện và phân đoạn, giúp mô hình đạt hiệu quả tối ưu.

Kết luận

Đề tài đã thiết kế thành công hệ thống học đa tác vụ cho xe tự hành, xử lý đồng thời nhận diện biển báo, phát hiện vật cản và phân đoạn làn đường với hiệu suất vượt trội.
Mô hình cải thiện tốc độ xử lý hơn 40 fps và tăng độ chính xác từ 1.1% đến 4% so với các mạng hiện đại đơn nhiệm.
Thiết kế sử dụng ShuffleNetV2 và depthwise separable convolutions giúp giảm tham số và phù hợp với các thiết bị nhúng.
Kết quả thử nghiệm trên bộ dữ liệu mô phỏng đa dạng và trong các điều kiện thời tiết thách thức chứng minh tính ứng dụng thực tế cao.
Đề xuất các hướng phát triển tiếp theo bao gồm triển khai trên thiết bị thực, mở rộng nhiệm vụ đa tác vụ và tích hợp vào hệ thống hỗ trợ tài xế.

Để tiếp tục phát triển, các nhà nghiên cứu và doanh nghiệp nên tập trung vào tối ưu hóa mô hình cho phần cứng thực tế và mở rộng phạm vi ứng dụng. Hãy bắt đầu áp dụng các giải pháp học đa tác vụ để nâng cao hiệu quả và an toàn cho công nghệ xe tự hành trong tương lai.

Bài viết "Hệ thống đa tác vụ cho xe tự hành tại HCMUTE" trình bày một hệ thống tiên tiến giúp xe tự hành thực hiện nhiều nhiệm vụ khác nhau một cách hiệu quả. Hệ thống này không chỉ cải thiện khả năng điều khiển và nhận diện môi trường xung quanh mà còn tối ưu hóa quy trình vận hành, mang lại sự an toàn và tiện lợi cho người sử dụng. Độc giả sẽ tìm thấy những thông tin hữu ích về công nghệ hiện đại trong lĩnh vực xe tự hành, cũng như những ứng dụng thực tiễn của nó trong cuộc sống hàng ngày.

Nếu bạn muốn tìm hiểu thêm về các dự án liên quan, hãy khám phá bài viết Đồ án hcmute nhận diện phương tiện giao thông sử dụng bộ phát hiện single shot multibox, nơi bạn sẽ thấy cách nhận diện phương tiện giao thông được cải tiến. Ngoài ra, bài viết Đồ án hcmute ứng dụng xử lý ảnh trong nhận diện khuôn mặt sẽ giúp bạn hiểu rõ hơn về công nghệ nhận diện khuôn mặt, một phần quan trọng trong hệ thống tự hành. Cuối cùng, bài viết Đồ án hcmute xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng nơ ron tích chập sẽ mở rộng kiến thức của bạn về việc áp dụng mạng nơ ron trong nhận diện cảm xúc, một yếu tố quan trọng trong việc tương tác giữa con người và xe tự hành.

#tự động hóa

#thiết kế hệ thống

#kỹ thuật điều khiển

#robot tự hành

#xe tự hành

#hệ thống đa tác vụ

Chủ đề

Công nghệ tự hành

Kỹ thuật và thiết kế hệ thống

Nghiên cứu và phát triển tại HCMUTE

Ứng dụng của xe tự hành trong đời sống