I. Tổng Quan Về Hệ Thống Nhận Diện Biển Số Xe Thời Gian Thực
Thành phố thông minh đang phát triển mạnh mẽ trên toàn cầu, đặc biệt trong lĩnh vực giao thông. Để quản lý và xử lý các vấn đề giao thông, một hệ thống nhận diện biển số xe thời gian thực là vô cùng cần thiết. Với sự gia tăng của dữ liệu lớn (big data), việc phân tích và xử lý đòi hỏi sự hỗ trợ từ các công cụ dữ liệu lớn (big data) và trí tuệ nhân tạo (AI). Đề tài này tập trung vào việc đề xuất một hệ thống sử dụng mạng RetinaNet và thư viện xử lý dữ liệu lớn (big data) BigDL để xác định biển số xe ô tô di chuyển trên đường thông qua máy tính nhúng Jetson Nano kết nối với camera.
1.1. Mục Tiêu Nghiên Cứu Hệ Thống ALPR ANPR
Mục tiêu chính là đề xuất một hệ thống giao thông thông minh sử dụng công nghệ dữ liệu lớn (big data) để xác định biển số xe ô tô theo thời gian thực. Đồng thời, đặt nền tảng cho việc áp dụng công nghệ dữ liệu lớn (big data) vào việc xây dựng các ứng dụng giao thông thông minh như theo dõi hành trình xe, xử lý vi phạm. Nghiên cứu này hướng đến việc sử dụng các phương pháp học sâu (deep learning) để tăng độ chính xác của việc nhận dạng biển số xe.
1.2. Phạm Vi Nghiên Cứu và Các Công Nghệ Liên Quan
Nghiên cứu này tập trung vào mô hình RetinaNet trong việc nhận dạng biển số xe và BigDL trong tác vụ huấn luyện mô hình. Tuy nhiên, do chưa được thử nghiệm thực tế nên hệ thống đang phát triển sử dụng video quay từ điện thoại thay vì lấy trực tiếp từ camera, và huấn luyện mô hình trên máy tính cá nhân thay vì từ các cụm máy tính như đã đề xuất. Nhiều nghiên cứu trên thế giới đã được thực hiện về chủ đề nhận diện biển số xe từ năm 2012. Các mô hình học sâu (deep learning) cho kết quả tốt hơn các mô hình máy học.
II. Thách Thức Vấn Đề Trong Nhận Diện Biển Số Xe Thực Tế
Các mô hình học sâu (deep learning) đang được sử dụng rộng rãi trong các ứng dụng trí tuệ nhân tạo (AI), mang lại kết quả tốt hơn so với các mô hình máy học truyền thống. Tuy nhiên, tại Việt Nam, việc áp dụng các mô hình học sâu (deep learning) trong việc nhận diện biển số xe vẫn còn hạn chế và thường sử dụng các kỹ thuật thị giác máy tính truyền thống. Sự phát triển của các công cụ xử lý dữ liệu lớn (big data) đã giúp tăng tốc quá trình xây dựng và phát triển ứng dụng trí tuệ nhân tạo (AI). Việc tận dụng các nguồn tài nguyên xử lý dữ liệu lớn (big data) sẽ giảm chi phí và thời gian phát triển ứng dụng.
2.1. Hạn Chế Của Các Nghiên Cứu Hiện Tại Tại Việt Nam
Phạm vi tìm hiểu cho thấy các nghiên cứu áp dụng các mô hình học sâu (deep learning) trong việc nhận diện biển số xe ở Việt Nam vẫn chưa nhiều và còn sử dụng các kỹ thuật thị giác máy tính truyền thống. Nhiều ứng dụng trong lĩnh vực thành phố thông minh đòi hỏi các phương pháp và công cụ xử lý dữ liệu lớn (big data), kết hợp với học sâu (deep learning) để đảm bảo hiệu quả và chính xác.
2.2. Tận Dụng Nguồn Lực Xử Lý Dữ Liệu Lớn Big Data
Trong bối cảnh dữ liệu và ứng dụng trí tuệ nhân tạo (AI) ngày càng tăng, việc tận dụng các nguồn tài nguyên xử lý dữ liệu lớn (big data) để phát triển ứng dụng trí tuệ nhân tạo (AI) sẽ làm giảm chi phí phát triển và nhanh chóng đưa ứng dụng vào sử dụng thực tiễn. Đề tài này tập trung vào việc tìm hiểu và đề xuất một phương pháp mới trong việc xây dựng ứng dụng nhận diện biển số xe sử dụng mô hình học sâu (deep learning) và công cụ xử lý dữ liệu lớn (big data) trong bối cảnh xây dựng thành phố thông minh.
III. Phương Pháp Nhận Diện Biển Số Xe RetinaNet BigDL
Đề tài này đề xuất sử dụng mạng RetinaNet, một mô hình học sâu (deep learning) dựa trên CNN (Convolutional Neural Network), kết hợp với thư viện BigDL để xây dựng hệ thống nhận diện biển số xe thời gian thực. RetinaNet giúp xử lý bài toán mất cân bằng giữa các lớp trong phát hiện đối tượng, tập trung vào những ví dụ khó trong quá trình huấn luyện và bỏ qua các ví dụ dễ. BigDL cho phép tận dụng các cụm máy tính như K8s, Hadoop, Spark, Yarn để giảm thời gian huấn luyện và dự đoán mô hình học sâu (deep learning).
3.1. Ưu Điểm Của Mô Hình RetinaNet Trong ALPR ANPR
RetinaNet là mô hình dựa trên CNN (Convolutional Neural Network) sử dụng độ mất mát để xử lý bài toán mất cân bằng giữa các lớp trong phát hiện đối tượng. Mô hình này đạt được độ chính xác cao bằng cách tập trung vào những ví dụ khó trong quá trình huấn luyện và bỏ qua các ví dụ dễ. Các mô hình nhận diện biển số xe có thể khai thác sự tương quan cao giữa việc phát hiện và nhận dạng biển số xe.
3.2. Ứng Dụng Thư Viện BigDL Để Tăng Tốc Quá Trình
BigDL được phát triển bởi Intel với mục đích tận dụng các cụm máy tính như K8s, Hadoop, Spark, Yarn để làm giảm thời gian huấn luyện và dự đoán mô hình học sâu (deep learning). Ngoài ra, BigDL cũng có các công cụ hỗ trợ cho các ứng dụng về gợi ý/đề xuất và thời gian cũng như các giải pháp bảo mật dữ liệu. BigDL cũng tương thích với các framework phổ biến khác như: Tensorflow, Keras, PyTorch, OpenVINO.
3.3. Cách thức BigDL hoạt động
BigDL có nhiều thành phần, trong đó Orca giúp huấn luyện và dự đoán mô hình DL trên các cụm máy tính. Nano tối ưu hóa các chương trình sử dụng PyTorch hoặc Tensorflow trên Intel XPU. DLIib hỗ trợ viết các chương trình học sâu dưới dạng các chương trình Spark. Chronos hỗ trợ xây dựng ứng dụng liên quan tới phân tích về thời gian. Friesian hỗ trợ xây dựng hệ thống có tính năng gợi ý/đề xuất. PPML hỗ trợ bảo vệ quyền riêng tư bảo mật của dữ liệu.
IV. Xây Dựng Hệ Thống Nhận Diện Biển Số Xe Thời Gian Thực
Để xây dựng hệ thống nhận diện biển số xe thời gian thực, cần có các thành phần sau: camera để ghi lại hình ảnh giao thông, nơi lưu trữ dữ liệu biển số xe được nhận diện, ứng dụng cho người dùng và máy chủ trung gian để xử lý dữ liệu. Camera thu ảnh giao thông, sau đó hình ảnh được đưa qua mô hình nhận diện để nhận biết biển số xe. Kết quả sẽ được lưu trữ tại cơ sở dữ liệu biển số xe của hệ thống.
4.1. Thiết Kế Các Thành Phần Của Hệ Thống ALPR
Camera cần có khả năng thu ảnh chất lượng và tốc độ cao, cũng như có khả năng hoạt động tốt ở ngoài trời. Cơ sở dữ liệu cần có khả năng lưu trữ, xử lý dữ liệu lớn (big data) và mở rộng dung lượng dữ liệu. Máy tính cần có bộ xử lý đồ họa để thực hiện các tác vụ trí tuệ nhân tạo (AI). Đề tài đề xuất dùng camera Logitech C922, nơi lưu trữ dữ liệu bao gồm AWS S3 và DynamoDB, máy tính nhúng Jetson Nano, máy tính EC2 và mô hình nhận diện đối tượng RetinaNet để phát triển hệ thống nhận diện biển số xe.
4.2. Quy Trình Thu Thập Xử Lý Gán Nhãn Dữ Liệu
Các bước thực hiện và triển khai hệ thống bao gồm: Thu thập hình ảnh ô tô từ nhiều nguồn. Đánh giá và gán nhãn bộ dữ liệu thu thập được. Huấn luyện mô hình dựa trên RetinaNet và BigDL. Đánh giá và cải thiện kết quả mô hình trên phép đo mAP. Cài đặt chương trình thu nhận hình ảnh từ camera và nhận diện biển số xe trên máy tính nhúng Jetson Nano. Cài đặt cơ sở dữ liệu (CSDL) DynamoDB và S3. Xây dựng ứng dụng phía người dùng bằng React, Javascript. Xây dựng ứng dụng máy chủ bằng Python, Flask. Đánh giá và cải thiện độ chính xác và hiệu suất của hệ thống.
V. Đánh Giá Hiệu Quả Hệ Thống Nhận Diện Biển Số Xe ALPR
Đề tài đã đánh giá độ chính xác của mô hình phát hiện biển số xe dựa trên mAP với ngưỡng IoU = 0.75 cho kết quả đạt mAP = 0.94, chứng tỏ khả năng phát hiện chính xác biển số xe. Chương trình cũng được đánh giá trên một đoạn video độ phân giải 1080x1920 và cho thấy khả năng nhận diện chính xác 7/9 biển số dài và biển số vuông tương ứng với FPS trung bình đạt 1.
5.1. Kết Quả Đánh Giá Độ Chính Xác Và Tốc Độ
Kết quả đánh giá cho thấy mô hình RetinaNet đạt độ chính xác cao trong việc phát hiện biển số xe. Tốc độ xử lý còn hạn chế, với FPS trung bình là 1 trên video độ phân giải 1080x1920. Cần cải thiện tốc độ xử lý để hệ thống có thể hoạt động hiệu quả hơn trong thực tế.
5.2. So Sánh Với Các Nghiên Cứu Khác Về ALPR ANPR
So với các nghiên cứu khác về nhận diện biển số xe, đề tài này có ưu điểm là sử dụng mô hình học sâu (deep learning) RetinaNet kết hợp với thư viện BigDL để tận dụng khả năng xử lý dữ liệu lớn (big data). Tuy nhiên, cần có thêm nhiều nghiên cứu và thử nghiệm thực tế để so sánh hiệu quả một cách toàn diện.
VI. Kết Luận Hướng Phát Triển Của Hệ Thống Nhận Diện
Đề tài đã đề xuất được một hệ thống nhận diện biển số xe thời gian thực. Bên cạnh đó, đề tài đã đóng góp một bộ dữ liệu về biển số xe đã được gán nhãn mặc dù quá trình hiện thực và triển khai hệ thống gặp nhiều khó khăn. Cần cải thiện tốc độ nhận diện bằng cách nâng cấp cấu hình máy tính nhúng hoặc sử dụng mạng học sâu (deep learning) mới như Yolov8, SSD. Ngoài ra, có thể thêm các tính năng mới như phát hiện vượt đèn đỏ quy định để tăng tính ứng dụng.
6.1. Tóm Tắt Các Kết Quả Đạt Được Đóng Góp
Đề tài đã xây dựng được một hệ thống nhận diện biển số xe sử dụng RetinaNet và BigDL. Đã tạo ra một bộ dữ liệu biển số xe đã được gán nhãn. Đã đánh giá được độ chính xác và tốc độ của hệ thống.
6.2. Các Hướng Phát Triển Nghiên Cứu Trong Tương Lai
Nâng cấp cấu hình phần cứng để tăng tốc độ xử lý. Sử dụng các mô hình học sâu (deep learning) mới và hiệu quả hơn. Thêm các tính năng mới như phát hiện vi phạm giao thông. Nghiên cứu về bảo mật dữ liệu biển số xe. Tích hợp hệ thống với các ứng dụng giao thông thông minh khác.