Tổng quan nghiên cứu

Trong bối cảnh đô thị hóa nhanh chóng, mật độ xe ô tô tại các thành phố lớn ngày càng tăng cao, dẫn đến nhu cầu quản lý bãi đỗ xe hiệu quả trở nên cấp thiết. Theo ước tính, việc tìm kiếm chỗ đỗ xe chiếm phần lớn thời gian của người lái xe, gây ra ùn tắc và lãng phí tài nguyên. Nghiên cứu này tập trung phát triển hệ thống nhận dạng chỗ đỗ xe ô tô bằng camera, nhằm tối ưu hóa việc giám sát và quản lý bãi đỗ xe, đặc biệt tại các khu vực có quy mô lớn như trung tâm thương mại, trường học và khu đô thị. Mục tiêu chính là xây dựng phần mềm xử lý ảnh tự động xác định vị trí các ô đỗ xe và phân loại trạng thái “trống” hoặc “bận” với độ chính xác cao, đồng thời thiết kế giao diện thân thiện, dễ dàng áp dụng cho nhiều bãi đỗ khác nhau mà không cần can thiệp sâu vào mã nguồn.

Phạm vi nghiên cứu tập trung vào việc xử lý hình ảnh thu nhận từ camera giám sát đặt cố định tại các bãi đỗ xe ở Hà Nội, với bộ dữ liệu gồm 678 ảnh chụp từ nhiều vị trí và điều kiện ánh sáng khác nhau. Kết quả thử nghiệm thực tế cho thấy hệ thống đạt độ chính xác 92.5% trong việc nhận diện đủ 4 điểm mốc trên tổng số 67 ảnh đầu vào, đảm bảo khả năng cắt ảnh chính xác từng vị trí đỗ xe. Nghiên cứu có ý nghĩa quan trọng trong việc giảm thiểu thời gian tìm kiếm chỗ đỗ, nâng cao hiệu quả quản lý bãi đỗ và góp phần phát triển các giải pháp thông minh trong lĩnh vực giao thông đô thị.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên hai lý thuyết và mô hình chính:

  1. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN): Đây là mô hình học sâu được sử dụng để phân loại trạng thái vị trí đỗ xe dựa trên ảnh cắt từ camera. CNN có khả năng nhận diện đối tượng với độ chính xác cao, phù hợp cho bài toán nhận dạng hình ảnh trong điều kiện đa dạng về góc chụp và ánh sáng.

  2. Xử lý ảnh kỹ thuật số với OpenCV: Thư viện OpenCV cung cấp hơn 2500 thuật toán xử lý ảnh và thị giác máy tính, hỗ trợ các thao tác như chuyển đổi không gian màu, lọc nhiễu, phát hiện cạnh, biến đổi hình thái (Morphological Transform), và căn chỉnh ảnh (Image Warping, Image Calibration). Các khái niệm chính bao gồm:

    • Không gian màu HSV: Giúp nhận diện màu sắc hiệu quả hơn trong điều kiện ánh sáng thay đổi.
    • Thuật toán Morphological Transform: Erosion, Dilation, Opening, Closing để loại bỏ nhiễu và làm mượt biên ảnh.
    • Thuật toán phát hiện cạnh Canny: Xác định biên giới đối tượng trong ảnh.
    • Phương pháp căn chỉnh ảnh bằng Homography (Image Warping) và mô hình máy ảnh pinhole (Image Calibration) để xử lý sai lệch góc chụp camera.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ ảnh chụp thực tế tại các bãi đỗ xe trong khuôn viên trường Đại học Bách Khoa Hà Nội và một số địa điểm khác tại Hà Nội, gồm 678 ảnh với kích thước 1920x1080 pixel, chụp trong nhiều điều kiện ánh sáng và thời tiết khác nhau. Cỡ mẫu ảnh được chọn nhằm đảm bảo đa dạng về góc chụp và trạng thái đỗ xe.

Phương pháp phân tích gồm các bước:

  • Tiền xử lý ảnh: Chuyển đổi không gian màu từ RGB sang HSV để nhận diện màu sắc điểm mốc, áp dụng Morphological Transform để loại bỏ nhiễu.
  • Xác định điểm mốc: Sử dụng nhận diện màu sắc và kích thước blob để phát hiện 4 điểm mốc cố định trên bãi đỗ, làm cơ sở nội suy tọa độ các vị trí đỗ xe.
  • Nội suy và cắt ảnh: Dựa trên tọa độ điểm mốc, nội suy vị trí các ô đỗ xe và cắt ảnh thành các ảnh nhỏ tương ứng từng vị trí.
  • Phân loại trạng thái: Ảnh cắt được đưa vào mạng CNN để phân loại trạng thái “bận” hoặc “trống”.
  • Kiểm tra và hiệu chỉnh: So sánh tọa độ điểm mốc với ảnh tham chiếu để phát hiện sai lệch góc camera, thực hiện căn chỉnh ảnh khi cần thiết.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ đầu năm 2020 đến giữa năm 2020, với sự hỗ trợ của phần mềm Python và thư viện OpenCV, cùng các công cụ phát triển phần mềm như PyCharm.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác nhận diện điểm mốc: Hệ thống nhận diện đủ 4 điểm mốc trên 92.5% số ảnh trong bộ dữ liệu thử nghiệm gồm 67 ảnh, cho thấy khả năng ổn định trong việc xác định vị trí tham chiếu cho các ô đỗ xe.

  2. Hiệu quả cắt ảnh vị trí đỗ: Việc sử dụng 4 điểm mốc để nội suy tọa độ giúp cắt ảnh chính xác từng vị trí đỗ xe, giảm sai số do lệch góc camera so với phương pháp cố định tọa độ. Tỷ lệ ảnh cắt chính xác đạt khoảng 90% trong điều kiện camera bị xê dịch nhẹ.

  3. Khả năng phân loại trạng thái: Mạng CNN được huấn luyện trên bộ dữ liệu ảnh đa dạng cho kết quả phân loại trạng thái “bận” hoặc “trống” với độ chính xác cao, gần tương đương với nhận dạng thủ công.

  4. Khả năng thích ứng với điều kiện thực tế: Hệ thống hoạt động hiệu quả trong nhiều điều kiện ánh sáng và thời tiết khác nhau, nhờ vào việc sử dụng không gian màu HSV và các thuật toán xử lý ảnh nâng cao.

Thảo luận kết quả

Nguyên nhân chính giúp hệ thống đạt được độ chính xác cao là việc kết hợp hiệu quả giữa xử lý ảnh truyền thống và học sâu. Việc sử dụng không gian màu HSV giúp nhận diện điểm mốc màu vàng ổn định hơn so với RGB, giảm thiểu ảnh hưởng của ánh sáng thay đổi. Thuật toán Morphological Transform loại bỏ nhiễu hiệu quả, đảm bảo các điểm mốc được phát hiện chính xác.

So sánh với các nghiên cứu khác sử dụng cảm biến mặt đất hoặc camera nhiệt, phương pháp sử dụng camera giám sát với xử lý ảnh và CNN có ưu điểm về chi phí, khả năng giám sát diện rộng và độ chính xác cao hơn. Tuy nhiên, nhược điểm là cần bộ dữ liệu lớn để huấn luyện mạng CNN và yêu cầu camera có độ phân giải cao.

Dữ liệu có thể được trình bày qua biểu đồ tỷ lệ nhận diện điểm mốc thành công theo từng điều kiện ánh sáng, hoặc bảng so sánh độ chính xác phân loại trạng thái giữa các phương pháp khác nhau. Điều này giúp minh họa rõ ràng hiệu quả của hệ thống trong thực tế.

Đề xuất và khuyến nghị

  1. Mở rộng bộ dữ liệu huấn luyện: Thu thập thêm ảnh từ nhiều bãi đỗ xe với đa dạng góc chụp, điều kiện ánh sáng và thời tiết để tăng độ chính xác và khả năng tổng quát hóa của mạng CNN. Thời gian thực hiện dự kiến 6-12 tháng, do nhóm nghiên cứu và các đối tác triển khai.

  2. Tăng kích thước và đa dạng điểm mốc: Nghiên cứu sử dụng các điểm mốc có kích thước lớn hơn hoặc đa dạng về màu sắc để giảm thiểu nhầm lẫn với màu xe, nâng cao độ chính xác nhận diện điểm mốc. Chủ thể thực hiện là nhóm phát triển phần mềm, trong vòng 3-6 tháng.

  3. Phát triển thuật toán xử lý ảnh nâng cao: Áp dụng các kỹ thuật học máy để tự động nhận diện điểm mốc thay vì dựa vào màu sắc cố định, giúp hệ thống thích ứng tốt hơn với các bãi đỗ xe có đặc điểm khác nhau. Thời gian nghiên cứu 6 tháng, do nhóm nghiên cứu chính đảm nhiệm.

  4. Triển khai hệ thống thực tế và đánh giá liên tục: Lắp đặt hệ thống tại các bãi đỗ xe lớn, thu thập phản hồi và dữ liệu vận hành để điều chỉnh, cải tiến phần mềm và phần cứng. Chủ thể là đơn vị quản lý bãi đỗ và nhóm nghiên cứu, thực hiện trong vòng 12 tháng.

Đối tượng nên tham khảo luận văn

  1. Các nhà quản lý bãi đỗ xe đô thị: Giúp họ hiểu rõ về công nghệ nhận dạng chỗ đỗ xe bằng camera, từ đó áp dụng giải pháp hiệu quả để nâng cao năng suất quản lý và phục vụ người dùng.

  2. Nhà phát triển phần mềm và kỹ sư xử lý ảnh: Cung cấp kiến thức chuyên sâu về xử lý ảnh, thuật toán Morphological Transform, căn chỉnh ảnh và ứng dụng CNN trong nhận dạng vị trí đỗ xe.

  3. Các nhà nghiên cứu trong lĩnh vực thị giác máy tính và học sâu: Tham khảo phương pháp kết hợp xử lý ảnh truyền thống và mạng nơ-ron tích chập, cũng như các thách thức thực tế trong triển khai hệ thống nhận dạng.

  4. Các đơn vị cung cấp giải pháp giao thông thông minh: Hỗ trợ phát triển các sản phẩm quản lý bãi đỗ xe tự động, tiết kiệm chi phí và nâng cao trải nghiệm người dùng.

Câu hỏi thường gặp

  1. Hệ thống có thể hoạt động trong điều kiện ánh sáng yếu hoặc ban đêm không?
    Hệ thống sử dụng không gian màu HSV và các thuật toán xử lý ảnh nâng cao giúp nhận diện điểm mốc và vị trí đỗ xe trong nhiều điều kiện ánh sáng, bao gồm cả ban đêm có đèn chiếu sáng. Tuy nhiên, độ chính xác có thể giảm nhẹ khi ánh sáng quá yếu.

  2. Làm thế nào để hệ thống xử lý khi camera bị lệch vị trí?
    Hệ thống sử dụng 4 điểm mốc cố định để nội suy tọa độ vị trí đỗ xe, cho phép phát hiện và căn chỉnh sai lệch góc chụp camera khi ít nhất 3 điểm mốc được nhận diện, đảm bảo cắt ảnh chính xác.

  3. Có thể áp dụng hệ thống cho các bãi đỗ xe có bố trí không cố định không?
    Hệ thống phù hợp với các bãi đỗ xe có vị trí đỗ cố định và camera đặt cố định. Với bãi đỗ xe không cố định, cần điều chỉnh thuật toán hoặc bổ sung dữ liệu huấn luyện phù hợp.

  4. Độ chính xác phân loại trạng thái “trống” và “bận” là bao nhiêu?
    Mạng CNN được huấn luyện trên bộ dữ liệu đa dạng đạt độ chính xác phân loại cao, gần tương đương với nhận dạng thủ công, giúp hệ thống hoạt động hiệu quả trong thực tế.

  5. Hệ thống có thể mở rộng cho nhiều camera và bãi đỗ xe lớn không?
    Có thể mở rộng bằng cách đồng bộ dữ liệu từ nhiều camera và áp dụng thuật toán xử lý phân tán. Việc này giúp giám sát diện rộng và quản lý nhiều bãi đỗ xe cùng lúc.

Kết luận

  • Hệ thống nhận dạng chỗ đỗ xe ô tô bằng camera sử dụng mạng nơ-ron tích chập CNN kết hợp xử lý ảnh truyền thống đạt độ chính xác nhận diện điểm mốc 92.5% và phân loại trạng thái vị trí đỗ hiệu quả.
  • Phương pháp sử dụng 4 điểm mốc để nội suy tọa độ giúp giảm sai số do lệch góc camera, nâng cao độ chính xác cắt ảnh vị trí đỗ.
  • Bộ dữ liệu ảnh đa dạng về góc chụp, điều kiện ánh sáng và thời tiết là yếu tố quan trọng giúp mạng CNN hoạt động ổn định.
  • Nghiên cứu đề xuất các giải pháp mở rộng và cải tiến nhằm nâng cao hiệu quả và khả năng ứng dụng thực tế của hệ thống.
  • Các bước tiếp theo bao gồm mở rộng bộ dữ liệu, phát triển thuật toán nhận diện điểm mốc tự động và triển khai thực tế tại các bãi đỗ xe lớn.

Để tiếp tục phát triển và ứng dụng hệ thống, các nhà quản lý và nhà phát triển phần mềm được khuyến khích phối hợp triển khai thử nghiệm thực tế, thu thập dữ liệu vận hành và cải tiến liên tục nhằm đáp ứng nhu cầu ngày càng cao của đô thị thông minh.