Tái cấu trúc 3D từ hình ảnh stereo camera tại HCMUTE

I. Giới thiệu về Tái cấu trúc 3D từ hình ảnh stereo camera tại HCMUTE

Luận văn nghiên cứu tái cấu trúc 3D từ cặp hình ảnh stereo camera tại HCMUTE (Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh). Nghiên cứu tập trung vào việc xây dựng mô hình 3D từ dữ liệu thu thập bởi hệ thống stereo camera, bao gồm các bước xử lý ảnh quan trọng như hiệu chỉnh camera, phân tích hình ảnh stereo, và thuật toán tái cấu trúc 3D. Mục tiêu chính là tạo ra mô hình 3D chính xác và hiệu quả, có thể ứng dụng trong nhiều lĩnh vực khác nhau. Nghiên cứu tái cấu trúc 3D tại HCMUTE đóng góp vào sự phát triển của công nghệ Computer Vision và stereo vision trong nước.

1.1. Bối cảnh và tầm quan trọng của nghiên cứu

Nghiên cứu tái cấu trúc 3D đang thu hút sự quan tâm lớn trên toàn cầu. Ứng dụng của công nghệ này rất rộng rãi, bao gồm tự lái, thực tế ảo (VR), y tế, công nghiệp sản xuất. Tái cấu trúc 3D từ hình ảnh stereo là một phương pháp hiệu quả, chi phí thấp hơn so với các phương pháp khác. Việc ứng dụng camera stereo cho phép thu thập thông tin chiều sâu một cách trực tiếp, thuận tiện hơn so với việc sử dụng các cảm biến độ sâu khác. Tại Việt Nam, công nghệ này còn đang trong giai đoạn phát triển. Nghiên cứu này tại HCMUTE góp phần thúc đẩy sự phát triển của lĩnh vực Computer Vision và stereo vision trong nước, tạo ra các giải pháp công nghệ tiên tiến, đáp ứng nhu cầu thực tiễn. Các ứng dụng thực tiễn của tái cấu trúc 3D bao gồm việc đo lường chính xác kích thước vật thể, tạo ra mô hình 3D cho thiết kế kỹ thuật, và mô phỏng môi trường 3D.

1.2. Phương pháp nghiên cứu

Nghiên cứu sử dụng hai camera Logitech C310 HD để thu thập cặp hình ảnh stereo. Dữ liệu thu được trải qua các bước xử lý như cân bằng sáng, hiệu chỉnh camera stereo, và phân tích hình ảnh stereo sử dụng thư viện OpenCV. Thuật toán Semi-global matching (SGM) được áp dụng để tính toán bản đồ chênh lệch (disparity map). Từ bản đồ chênh lệch, mô hình 3D (point cloud) được tạo ra. Thuật toán SGM được chọn vì tính hiệu quả và chất lượng cao. Các bước xử lý hình ảnh cơ bản như lọc nhiễu (ví dụ: bộ lọc trung vị) cũng được sử dụng để nâng cao chất lượng dữ liệu đầu vào. MATLAB có thể được sử dụng để hỗ trợ quá trình xử lý và phân tích kết quả. Việc đánh giá hiệu quả được thực hiện thông qua so sánh kết quả với dữ liệu thực tế. Kết quả tái cấu trúc 3D được hiển thị dưới dạng point cloud và có thể được chuyển đổi thành mô hình mesh 3D.

II. Xử lý hình ảnh và tái cấu trúc 3D

Phần này tập trung vào các bước xử lý hình ảnh và thuật toán tái cấu trúc 3D. Xử lý ảnh stereo bao gồm hiệu chỉnh stereo camera để loại bỏ hiện tượng méo ảnh, phân tích hình ảnh stereo để tìm các điểm tương ứng giữa hai ảnh, và cuối cùng là tái cấu trúc 3D để tạo ra mô hình 3D từ các điểm tương ứng. Các thuật toán được sử dụng trong mỗi bước sẽ được mô tả chi tiết. Chất lượng của mô hình 3D cuối cùng phụ thuộc rất nhiều vào chất lượng của các bước xử lý hình ảnh này. Độ chính xác của đo lường chiều sâu là yếu tố quan trọng cần được xem xét kỹ lưỡng.

2.1. Hiệu chỉnh camera và hiệu chỉnh stereo camera

Hiệu chỉnh camera là bước quan trọng để loại bỏ các méo ảnh do ống kính gây ra. Quá trình này xác định các thông số nội tại và ngoại tại của camera. Mô hình Pinhole camera thường được sử dụng để mô tả quá trình hình thành ảnh. Hiệu chỉnh stereo camera bao gồm việc hiệu chỉnh riêng lẻ cho mỗi camera và sau đó tìm kiếm ma trận biến đổi giữa hai camera. Kết quả của bước này là hai ảnh đã được hiệu chỉnh, thuận lợi cho việc tìm kiếm điểm tương ứng trong bước tiếp theo. Các phương pháp hiệu chỉnh phổ biến như phương pháp tối thiểu bình phương được sử dụng. Các tham số hiệu chỉnh bao gồm tiêu cự, tâm ảnh, và các hệ số méo ảnh (radial distortion, tangential distortion). Chất lượng hiệu chỉnh ảnh hưởng trực tiếp đến độ chính xác của tái cấu trúc 3D.

2.2. Phân tích hình ảnh stereo và thuật toán Semi global matching

Sau khi hiệu chỉnh, cần tìm các điểm tương ứng giữa hai ảnh stereo. Thuật toán Semi-global matching (SGM) là một phương pháp hiệu quả để giải quyết vấn đề này. SGM tìm kiếm độ chênh lệch (disparity) giữa các pixel tương ứng trong hai ảnh, tạo ra bản đồ chênh lệch (disparity map). Bản đồ chênh lệch thể hiện thông tin về chiều sâu của các điểm trong ảnh. SGM tính toán độ chênh lệch dựa trên sự tương đồng giữa các vùng lân cận của các pixel. Phương pháp này cho phép xử lý các vùng có kết cấu phức tạp và giảm thiểu hiện tượng nhiễu. Các tham số của SGM như độ phạt chi phí (penalty cost) và kích thước cửa sổ tìm kiếm (search window size) ảnh hưởng đến chất lượng bản đồ chênh lệch. Thuật toán SGM được tối ưu hóa để đảm bảo hiệu quả xử lý, đặc biệt quan trọng khi xử lý ảnh độ phân giải cao.

III. Kết quả và ứng dụng

Phần này trình bày kết quả tái cấu trúc 3D thu được, bao gồm các hình ảnh minh họa và phân tích chất lượng. Chất lượng được đánh giá dựa trên độ chính xác của mô hình 3D và thời gian xử lý. Kết quả được so sánh với các phương pháp khác để chứng minh tính hiệu quả của phương pháp được đề xuất. Ứng dụng của tái cấu trúc 3D trong thực tế được thảo luận. Khả năng mở rộng của phương pháp này cho các ứng dụng khác nhau cũng được đề cập.

3.1. Phân tích kết quả tái cấu trúc 3D

Kết quả tái cấu trúc 3D được thể hiện dưới dạng point cloud. Chất lượng của point cloud được đánh giá dựa trên độ chi tiết, độ chính xác, và sự liền mạch của mô hình. Các chỉ số đánh giá như độ sai lệch trung bình (mean error) và độ lệch chuẩn (standard deviation) được sử dụng để đánh giá độ chính xác của mô hình 3D. Hình ảnh minh họa point cloud được cung cấp để chứng minh chất lượng của kết quả. Các yếu tố ảnh hưởng đến chất lượng tái cấu trúc 3D như điều kiện ánh sáng, khoảng cách vật thể đến camera, và chất lượng ảnh đầu vào được phân tích. So sánh kết quả với các phương pháp khác được thực hiện để chứng minh tính vượt trội của phương pháp được sử dụng. Point cloud có thể được sử dụng để tạo ra mô hình mesh 3D chi tiết hơn.

3.2. Ứng dụng thực tiễn và hướng phát triển

Tái cấu trúc 3D từ hình ảnh stereo camera có nhiều ứng dụng thực tiễn, bao gồm: đo lường 3D, tạo mô hình 3D cho thiết kế kỹ thuật, thực tế ảo (VR), robot tự hành, và phân tích hình ảnh y tế. Nghiên cứu này đóng góp vào sự phát triển của công nghệ tái cấu trúc 3D trong nước, tạo ra cơ sở cho các nghiên cứu và ứng dụng tiếp theo. Các hướng phát triển trong tương lai bao gồm: nâng cao độ chính xác của tái cấu trúc 3D, xử lý các trường hợp phức tạp như ánh sáng yếu hoặc vật thể chuyển động, và tích hợp với các hệ thống thông minh khác. Tối ưu hóa thuật toán để giảm thời gian xử lý và tăng hiệu quả là một hướng phát triển quan trọng. Nghiên cứu tích hợp với các ứng dụng thực tiễn cụ thể sẽ mở ra nhiều cơ hội ứng dụng công nghệ này trong thực tế.

Tái cấu trúc vật thể 3D từ cặp hình ảnh stereo camera tại HCMUTE

I. Giới thiệu về Tái cấu trúc 3D từ hình ảnh stereo camera tại HCMUTE

1.1. Bối cảnh và tầm quan trọng của nghiên cứu

1.2. Phương pháp nghiên cứu

II. Xử lý hình ảnh và tái cấu trúc 3D

2.1. Hiệu chỉnh camera và hiệu chỉnh stereo camera

2.2. Phân tích hình ảnh stereo và thuật toán Semi global matching

III. Kết quả và ứng dụng

3.1. Phân tích kết quả tái cấu trúc 3D

3.2. Ứng dụng thực tiễn và hướng phát triển

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Nguyễn Tấn Lực

Người hướng dẫn: PGS.TS Lê Mỹ Hà

Trường học: Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành: Công nghệ kỹ thuật điều khiển và tự động hoá

Đề tài: Tái Cấu Trúc Vật Thể 3D Từ Cặp Hình Ảnh Stereo Camera

Loại tài liệu: luận văn

Năm xuất bản: 2021

Địa điểm: Thành Phố Hồ Chí Minh