Kiến Trúc Transformer Đơn Giản Hóa Phát Hiện Tương Tác Giữa Người Và Đối Tượng

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

2023

88
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: ĐỘNG LỰC NGHIÊN CỨU

1.1. Phát biểu bài toán

1.2. Các thách thức

1.3. Mục tiêu và phạm vi nghiên cứu

1.4. Đóng góp của nghiên cứu

1.5. Bố cục của luận văn

2. CHƯƠNG 2: CÁC NGHIÊN CỨU LIÊN QUAN

2.1. Các bài toán Nhận thức thị giác (Visual Perception Tasks)

2.2. Bài toán Phân loại hình ảnh (Image Classification)

2.3. Bài toán Phát hiện đối tượng (Object Detection)

2.4. Bài toán Ước lượng tư thế người (Human Pose Estimation)

2.5. Các bài toán Hiểu thị giác (Visual Understanding Tasks)

2.6. Bài toán Phát hiện tương tác giữa con người và đối tượng (Human-Object Interaction Detection)

2.6.1. Mô hình hoá bài toán

2.6.2. Các hướng tiếp cận chính

2.6.2.1. Hướng tiếp cận với các mô hình tuần tự
2.6.2.2. Hướng tiếp cận với các mô hình song song
2.6.2.3. Hướng tiếp cận với mô hình dựa trên Transformer

2.6.3. Bộ dữ liệu và độ đo

3. CHƯƠNG 3: PHƯƠNG PHÁP ĐỀ XUẤT

3.1. Tổng quan phương pháp đề xuất

3.2. Phương pháp cơ sở HOTR

3.3. Mô-đun Semantic-Guided

3.4. Mô-đun Multi-Level Cross-Attention

3.5. Mô-đun Enhanced Instance Pointers

3.6. Mô-đun Cross-Attention Semantic Queries

3.7. Bộ dữ liệu

3.7.1. Bộ dữ liệu V-COCO

3.7.2. Bộ dữ liệu HICO-DET

3.8. Intersection over Union (IOU)

3.9. Recall và Precision

3.10. True Positive trong bài toán phát hiện tương tác người vật

3.11. Cài đặt chi tiết

4. CHƯƠNG 4: CÁC KẾT QUẢ CHÍNH

4.1. Phân tích kết quả trực quan hóa

4.2. Nghiên cứu tác động của từng mô-đun

4.2.1. Enhanced Instance Pointers (EIP)

4.2.2. Semantic-guided mechanism (S)

4.2.3. Multi-level cross-attention (MCA)

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

PHỤ LỤC CÔNG TRÌNH NGHIÊN CỨU

Phụ lục 1: Toàn văn bài báo của nhóm tác giả tại tạp chí Pattern Recognition Letters (2023) (Đang phản biện round 2)

Phụ lục 2: Toàn văn bài báo của nhóm tác giả tại hội nghị MAPR 2023 (Đã Cuộc cố ẦỐ)

DANH MỤC CÔNG TRÌNH CỦA NHÓM TÁC GIẢ

TÀI LIỆU THAM KHẢO

Khóa luận tốt nghiệp khoa học máy tính kiến trúc transformer thống nhất cho bài toán phát hiện tương tác giữa người và đối tượng

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học máy tính kiến trúc transformer thống nhất cho bài toán phát hiện tương tác giữa người và đối tượng

Tài liệu "Kiến Trúc Transformer Đơn Giản Hóa Phát Hiện Tương Tác Giữa Người Và Đối Tượng" cung cấp cái nhìn sâu sắc về cách mà kiến trúc Transformer có thể được áp dụng để cải thiện khả năng phát hiện tương tác giữa con người và các đối tượng trong môi trường xung quanh. Bài viết nhấn mạnh những lợi ích của việc sử dụng mô hình này, bao gồm khả năng xử lý thông tin hiệu quả và chính xác hơn, từ đó nâng cao trải nghiệm người dùng trong các ứng dụng thực tế.

Để mở rộng kiến thức của bạn về các kỹ thuật liên quan, bạn có thể tham khảo tài liệu Khóa luận tốt nghiệp khoa học máy tính chuyển đổi phong cách ảnh dựa trên câu mô tả tự nhiên khai thác lớp ngữ nghĩa cục bộ, nơi khám phá cách chuyển đổi phong cách ảnh thông qua ngữ nghĩa. Ngoài ra, tài liệu Nghiên cứu một số kỹ thuật xử lý ảnh trong phát hiện và theo vết đối tượng dựa vào camera sẽ cung cấp thêm thông tin về các kỹ thuật xử lý ảnh hữu ích trong việc phát hiện và theo dõi đối tượng. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về lĩnh vực này và mở rộng kiến thức của mình.