Luận Văn Thạc Sĩ: Truy Tìm Đối Tượng Dựa Vào Thuộc Tính Cho Dãy Camera Quan Sát

Trường đại học

Đại học Bách Khoa

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

73
1
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu đề tài

Đề tài "Truy tìm đối tượng dựa vào thuộc tính cho dãy camera quan sát" tập trung vào việc áp dụng công nghệ học sâu để giải quyết bài toán phân loại thuộc tính của người đi bộ. Bài toán này mang tính chất cấp bách trong bối cảnh an ninh hiện đại, nơi mà việc phân tích hình ảnh từ hệ thống camera ngày càng trở nên quan trọng. Mục tiêu nghiên cứu là phát triển một mô hình có khả năng nhận diện và phân loại thuộc tính của người đi bộ dựa trên các đặc điểm hình ảnh. Đề tài này không chỉ giúp nâng cao hiệu quả trong việc giám sát an ninh mà còn tiết kiệm thời gian và công sức cho các cơ quan chức năng. Theo đó, việc truy vết đối tượng sẽ được thực hiện một cách nhanh chóng và chính xác hơn.

1.1 Mục tiêu nghiên cứu

Mục tiêu chính của nghiên cứu là phát triển một mô hình mạng nơ-ron học sâu có khả năng phân loại thuộc tính của người đi bộ. Điều này bao gồm việc xây dựng các phương pháp trích xuất đặc trưng hiệu quả từ hình ảnh để phục vụ cho việc truy tìm đối tượng. Nghiên cứu sẽ sử dụng các tập dữ liệu như PA100K và PETA để huấn luyện và đánh giá mô hình. Việc phân loại thuộc tính sẽ hỗ trợ cho các ứng dụng trong hệ thống giám sát và đảm bảo an ninh, đồng thời mở ra hướng nghiên cứu mới trong lĩnh vực này.

II. Cơ sở lý thuyết

Chương này trình bày các lý thuyết nền tảng liên quan đến mạng nơ-ron đa tầng và mạng nơ-ron tích chập (CNN). Mạng nơ-ron đa tầng là cấu trúc cơ bản trong học sâu, nơi mà các perceptron được kết nối với nhau để xử lý thông tin. Trong khi đó, mạng nơ-ron học sâu với các hàm kích hoạt phi tuyến giúp khắc phục những hạn chế của mạng nơ-ron đa tầng, cho phép mô hình hóa các mối quan hệ phức tạp trong dữ liệu. Việc áp dụng các kiến thức này vào bài toán phân loại thuộc tính sẽ giúp tăng cường khả năng nhận diện và phân loại các đối tượng trong hình ảnh từ hệ thống camera.

2.1 Mạng nơ ron tích chập

Mạng nơ-ron tích chập (CNN) là một trong những kiến trúc mạnh mẽ nhất hiện nay trong lĩnh vực xử lý hình ảnh. CNN có khả năng tự động trích xuất các đặc trưng từ hình ảnh mà không cần đến sự can thiệp của con người. Điều này rất quan trọng trong việc phân loại thuộc tính của người đi bộ, vì các thuộc tính này có thể rất đa dạng và phức tạp. Sử dụng CNN, mô hình có thể học được những đặc điểm quan trọng từ hình ảnh, từ đó cải thiện độ chính xác trong việc phân loại đối tượnggiám sát an ninh.

III. Phương pháp nghiên cứu

Phương pháp nghiên cứu được đề xuất trong luận văn này bao gồm việc xây dựng mô hình Top DropBlock, kế thừa từ các nghiên cứu trước đó. Mô hình này gồm ba nhánh: nhánh toàn cục để học thông tin từ các dữ liệu đã được huấn luyện trước, nhánh Top DropBlock để tăng cường khả năng phân biệt các thuộc tính từ các vùng ít thông tin, và nhánh regularization để giảm thiểu nhiễu trong quá trình học. Phương pháp này không yêu cầu tạo thêm chú thích cho dữ liệu, giúp đơn giản hóa quy trình huấn luyện và đánh giá. Kết quả thử nghiệm cho thấy mô hình có khả năng phân loại tốt, góp phần vào việc truy tìm đối tượng hiệu quả trong hệ thống camera.

3.1 Thiết kế thử nghiệm

Thiết kế thử nghiệm bao gồm việc lựa chọn các tập dữ liệu PA100K và PETA, hai tập dữ liệu phổ biến trong lĩnh vực phân loại thuộc tính. Các tiêu chí đánh giá được sử dụng bao gồm Mean Accuracy (mA) để đo lường độ chính xác của mô hình. Thử nghiệm sẽ được thực hiện qua nhiều giai đoạn khác nhau, bao gồm việc huấn luyện mô hình, kiểm tra và so sánh với các phương pháp hiện có. Kết quả từ thử nghiệm sẽ cung cấp cái nhìn tổng quát về hiệu quả của mô hình trong việc giám sát an ninhtruy tìm đối tượng.

IV. Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy mô hình Top DropBlock đạt được độ chính xác cao trong việc phân loại các thuộc tính của người đi bộ. So với các phương pháp trước đó, mô hình này không chỉ cải thiện độ chính xác mà còn giảm thiểu thời gian xử lý. Các thử nghiệm trên hai tập dữ liệu PA100K và PETA cho thấy mô hình có khả năng hoạt động tốt trong các điều kiện khác nhau, từ đó khẳng định tính khả thi của phương pháp trong thực tiễn. Điều này có ý nghĩa quan trọng trong việc ứng dụng công nghệ vào hệ thống camera nhằm nâng cao hiệu quả giám sát an ninh.

4.1 So sánh với các công trình liên quan

Khi so sánh với các mô hình gần đây, mô hình Top DropBlock cho thấy sự vượt trội về độ chính xác và khả năng phân loại. Các kết quả thực nghiệm cho thấy rằng mô hình không chỉ đơn thuần đạt được hiệu suất tốt mà còn có khả năng ứng dụng rộng rãi trong thực tế. Điều này chứng tỏ rằng việc áp dụng các phương pháp học sâu vào bài toán phân loại thuộc tính có thể mang lại những giải pháp hiệu quả cho việc truy tìm đối tượng trong hệ thống camera.

05/01/2025
Luận văn thạc sĩ khoa học máy tính truy tìm đối tượng dựa vào thuộc tính cho dãy camera quan sát
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính truy tìm đối tượng dựa vào thuộc tính cho dãy camera quan sát

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài luận văn thạc sĩ mang tiêu đề Luận Văn Thạc Sĩ: Truy Tìm Đối Tượng Dựa Vào Thuộc Tính Cho Dãy Camera Quan Sát của tác giả Nguyễn Trọng Tính, dưới sự hướng dẫn của TS. Lê Thành Sách, được thực hiện tại Đại học Bách Khoa vào năm 2021. Bài viết tập trung vào việc phát triển các phương pháp và kỹ thuật truy tìm đối tượng trong video từ camera quan sát dựa trên các thuộc tính của đối tượng. Điều này không chỉ giúp cải thiện khả năng nhận diện và theo dõi đối tượng mà còn nâng cao hiệu quả trong các ứng dụng an ninh và giám sát.

Để mở rộng thêm kiến thức về lĩnh vực này, bạn có thể tham khảo các bài viết liên quan như Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói, nơi mà các phương pháp học máy được áp dụng để cải thiện việc nhận diện giọng nói, tương tự như cách mà bài luận văn đang nghiên cứu truy tìm đối tượng. Một bài viết khác là Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ, sẽ cung cấp cái nhìn sâu sắc về việc ứng dụng học sâu trong nhận diện ngữ âm, có thể có nhiều điểm tương đồng trong kỹ thuật với việc nhận diện đối tượng. Cuối cùng, Nghiên cứu ứng dụng học sâu vào dịch từ vựng mà không cần dữ liệu song ngữ cũng là một tài liệu hữu ích, giúp bạn hiểu thêm về cách mà các kỹ thuật học sâu có thể được áp dụng trong nhiều lĩnh vực khác nhau trong khoa học máy tính.

Những bài viết này không chỉ liên quan đến lĩnh vực khoa học máy tính mà còn mở rộng thêm các khía cạnh ứng dụng công nghệ hiện đại trong các lĩnh vực khác nhau, từ nhận diện hình ảnh đến xử lý ngôn ngữ tự nhiên.

Tải xuống (73 Trang - 1.33 MB)