Luận Án Tiến Sĩ Nghiên Cứu Phát Triển Kỹ Thuật Theo Bám Đối Tượng Sử Dụng Kiến Trúc Mạng Siamese

Trường đại học

Đại học Quốc gia Hà Nội

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2023

145
1
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN THEO BÁM ĐƠN ĐỐI TƯỢNG

1.1. Bài toán theo bám đơn đối tượng trong video

1.1.1. Định nghĩa bài toán

1.1.2. Ứng dụng và thách thức

1.1.3. Các chỉ số và bộ dữ liệu đánh giá

1.1.3.1. Các chỉ số đánh giá mô hình theo bám đối tượng
1.1.3.2. Các bộ dữ liệu đánh giá mô hình theo bám đối tượng

1.1.4. Các kỹ thuật học sâu tiên tiến

1.1.4.1. Tối ưu và học sâu
1.1.4.2. Phát hiện đối tượng
1.1.4.3. Mạng chuyển đổi (transformer)
1.1.4.4. Mạng học sâu Siamese

1.1.5. Các hướng tiếp cận nghiên cứu bài toán theo bám đối tượng trong video

1.1.5.1. Phương pháp học máy truyền thống
1.1.5.2. Phương pháp dựa trên học sâu
1.1.5.3. So sánh các phương pháp theo bám
1.1.5.4. Tình hình nghiên cứu trong nước
1.1.5.5. Những vấn đề còn tồn tại và hướng nghiên cứu
1.1.5.5.1. Những vấn đề còn tồn tại
1.1.5.5.2. Đề xuất hướng nghiên cứu

1.1.6. Kết luận chương 1

2. CHƯƠNG 2: ĐỀ XUẤT MÔ HÌNH HỌC SÂU THEO BÁM ĐỐI TƯỢNG SỬ DỤNG KIẾN TRÚC MẠNG SIAMESE

2.1. Mô hình học sâu theo bám chuyển động của UAV trong video chống UAV hồng ngoại dựa trên kiến trúc mạng Siamese

2.1.1. Mô hình TrackingUAV

2.1.2. Thuật toán theo bám UAV

2.1.3. Đánh giá độ chính xác của mô hình TrackingUAV

2.1.4. Minh họa kết quả theo bám của TrackingUAV

2.2. Mô hình học sâu thời gian thực theo bám đối tượng sử dụng cơ chế tập trung và không dùng khung neo dựa trên kiến trúc Siamese

2.2.1. Mô hình SiamAPN

2.2.2. Mô-đun tăng cường dữ liệu ảnh mẫu và ảnh tìm kiếm dùng cơ chế tập trung

2.2.3. Mô-đun hồi quy và phân loại đối tượng dùng thể hiện điểm

2.2.4. Quá trình theo bám

2.3. Mạng Siamese theo bám đối tượng sử dụng cơ chế tập trung để kết hợp và tăng cường đặc trưng giữa hai nhánh của mạng Siamese

2.3.1. Mô hình SiamAAM

2.3.2. Mô-đun tăng cường và kết hợp dữ liệu ảnh hai nhánh Siamese

2.3.3. Mạng dự đoán khung bao đối tượng

2.3.4. Quá trình theo bám

2.3.5. Thuật toán theo bám đối tượng theo mô hình SiamAPN và SiamAAM

2.3.6. Đánh giá độ chính xác của mô hình SiamAPN và SiamAAM

2.3.6.1. Cài đặt thực nghiệm
2.3.6.2. So sánh kết quả thực nghiệm của mô hình SiamAPN và SiamAAM
2.3.6.3. Vai trò của các mô-đun đề xuất
2.3.6.4. Minh họa kết quả

2.4. Kết luận chương 2

3. CHƯƠNG 3: ĐỀ XUẤT MÔ HÌNH HỌC SÂU THEO BÁM ĐỐI TƯỢNG SỬ DỤNG MẠNG CHUYỂN ĐỔI TUYẾN TÍNH

3.1. Mô hình theo bám đối tượng thời gian thực sử dụng mạng chuyển đổi tuyến tính

3.1.1. Mô hình SiamTLT

3.1.2. Mô-đun tăng cường và kết hợp đặc trưng hai nhánh Siamese sử dụng mạng chuyển đổi tuyến tính

3.1.3. Quá trình theo bám

3.1.4. Thuật toán theo bám đối tượng theo mô hình SiamTLT

3.2. Nâng cao độ chính xác của trình theo bám bằng mạng chuyển đổi hình ảnh tuyến tính

3.2.1. Mô hình TrackerLT

3.2.2. Trích chọn đặc trưng

3.2.3. Mô-đun tăng cường và kết hợp dữ liệu ảnh hai nhánh Siamese

3.2.4. Mạng dự đoán khung bao đối tượng

3.2.5. Quá trình theo bám

3.2.6. Thuật toán theo bám đối tượng theo mô hình TrackerLT

3.3. Cài đặt thực nghiệm và đánh giá kết quả

3.3.1. Đánh giá độ chính xác của mô hình SiamTLT

3.3.2. Vai trò của các mô-đun đề xuất trong SiamTLT

3.3.3. Minh họa kết quả theo bám của SiamTLT

3.3.4. Đánh giá độ chính xác của mô hình TrackerLT

3.3.5. Vai trò của mô-đun đề xuất trong TrackerLT

3.3.6. Minh họa kết quả theo bám của TrạckerLT

3.4. Kết luận chương 3

KẾT LUẬN

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Phát triển kỹ thuật

Luận án tập trung vào phát triển kỹ thuật theo bám đối tượng dựa trên mạng Siamese. Các kỹ thuật này nhằm nâng cao hiệu quả của bài toán theo bám đối tượng trong video, đặc biệt trong các tình huống thực tế phức tạp như thay đổi ánh sáng, che lấp, và chuyển động nhanh. Học sâumạng nơ-ron được sử dụng để tối ưu hóa các mô hình, giúp cải thiện độ chính xác và tốc độ xử lý.

1.1. Mạng Siamese trong theo bám đối tượng

Mạng Siamese là một kiến trúc mạng nơ-ron được thiết kế để so sánh hai đầu vào và xác định mức độ tương đồng giữa chúng. Trong bài toán theo bám đối tượng, mạng này được sử dụng để so sánh đối tượng mục tiêu với các vùng tìm kiếm trong video. Ưu điểm của mạng Siamese là khả năng xử lý thời gian thực và độ chính xác cao, đặc biệt khi kết hợp với các kỹ thuật học sâu.

1.2. Tối ưu hóa thuật toán

Luận án đề xuất các phương pháp tối ưu hóa thuật toán để cải thiện hiệu suất của mô hình. Các kỹ thuật như phân loại đối tượngnhận diện hình ảnh được tích hợp để tăng cường khả năng nhận diện và theo bám đối tượng trong các điều kiện khác nhau. Mô hình hóa dữ liệuphân tích dữ liệu cũng được sử dụng để đảm bảo tính chính xác của các thuật toán.

II. Ứng dụng thực tiễn

Luận án không chỉ tập trung vào lý thuyết mà còn nhấn mạnh vào ứng dụng thực tiễn của các kỹ thuật được đề xuất. Các mô hình được phát triển có thể áp dụng trong các lĩnh vực như giám sát an ninh, chống máy bay không người lái (UAV), và xe tự lái. Học máymạng nơ-ron đóng vai trò quan trọng trong việc triển khai các ứng dụng này.

2.1. Giám sát an ninh

Các mô hình theo bám đối tượng dựa trên mạng Siamese được sử dụng để giám sát an ninh trong các khu vực công cộng. Khả năng xử lý thời gian thực và độ chính xác cao giúp phát hiện và theo dõi các đối tượng đáng ngờ một cách hiệu quả. Nhận diện hình ảnhphân loại đối tượng là các công nghệ chính được áp dụng trong lĩnh vực này.

2.2. Chống UAV

Trong lĩnh vực quân sự, các mô hình theo bám đối tượng được sử dụng để chống lại các mối đe dọa từ máy bay không người lái (UAV). Mạng Siamese giúp theo dõi và xác định vị trí của UAV trong thời gian thực, từ đó đưa ra các biện pháp phòng thủ kịp thời. Học sâutối ưu hóa thuật toán là các yếu tố then chốt trong việc phát triển các hệ thống này.

III. Đánh giá và kết quả

Luận án đưa ra các đánh giá chi tiết về hiệu quả của các mô hình được đề xuất. Các kết quả thực nghiệm được so sánh với các phương pháp hiện có trên các bộ dữ liệu chuẩn như VOT2018, UAV123, và OTB100. Phân tích dữ liệumô hình hóa dữ liệu được sử dụng để đảm bảo tính khách quan và chính xác của các đánh giá.

3.1. So sánh với các phương pháp hiện có

Các mô hình được đề xuất trong luận án được so sánh với các phương pháp hiện có trên các bộ dữ liệu chuẩn. Kết quả cho thấy các mô hình dựa trên mạng Siamese có độ chính xác cao hơn và tốc độ xử lý nhanh hơn. Học sâutối ưu hóa thuật toán là các yếu tố chính giúp cải thiện hiệu suất của các mô hình này.

3.2. Kết quả thực nghiệm

Các kết quả thực nghiệm được trình bày chi tiết trong luận án, bao gồm các chỉ số đánh giá như độ chính xác, tốc độ xử lý, và khả năng xử lý các tình huống phức tạp. Phân tích dữ liệumô hình hóa dữ liệu được sử dụng để đảm bảo tính khách quan và chính xác của các kết quả này.

13/02/2025
Luận án tiến sĩ nghiên cứu phát triển một số kỹ thuật theo bám đối tượng dựa trên kiến trúc mạng siamese

Bạn đang xem trước tài liệu:

Luận án tiến sĩ nghiên cứu phát triển một số kỹ thuật theo bám đối tượng dựa trên kiến trúc mạng siamese

Luận án tiến sĩ "Phát Triển Kỹ Thuật Theo Bám Đối Tượng Dựa Trên Mạng Siamese" tập trung vào việc nghiên cứu và phát triển các kỹ thuật theo dõi đối tượng sử dụng mạng Siamese, một phương pháp tiên tiến trong lĩnh vực xử lý ảnh và thị giác máy tính. Nghiên cứu này mang lại những đóng góp quan trọng trong việc cải thiện độ chính xác và hiệu suất của các hệ thống theo dõi đối tượng, đặc biệt trong các ứng dụng thời gian thực và môi trường phức tạp. Độc giả sẽ hiểu rõ hơn về cách mạng Siamese được ứng dụng để giải quyết các thách thức trong việc bám đối tượng, đồng thời nhận được cái nhìn sâu sắc về các thuật toán và kỹ thuật liên quan.

Để mở rộng kiến thức về các chủ đề liên quan, bạn có thể tham khảo Luận văn thạc sĩ kỹ thuật điện tử ứng dụng xử lý ảnh nhận dạng vật thể theo màu sắc và hình dạng cho robot tay máy, nghiên cứu này cung cấp thêm thông tin về việc ứng dụng xử lý ảnh trong nhận dạng vật thể. Ngoài ra, Đồ án hcmute điều khiển robot sử dụng xử lý ảnh sẽ giúp bạn hiểu rõ hơn về cách xử lý ảnh được tích hợp vào các hệ thống điều khiển robot. Cuối cùng, Luận văn thạc sĩ phương pháp phân đoạn ảnh hiệu quả dựa trên đồ thị là một tài liệu hữu ích để khám phá các phương pháp phân đoạn ảnh tiên tiến, bổ sung kiến thức về xử lý ảnh và thị giác máy tính.