I. Giới thiệu và Đặt vấn đề
Luận văn "Theo dõi đối tượng dựa trên giải thuật di truyền và tối ưu hoá bầy đàn" tập trung vào việc nghiên cứu và xây dựng giải thuật theo dõi tự động các đối tượng trong video. Mục tiêu là đạt được độ chính xác cao với chi phí tính toán thấp, hướng đến ứng dụng thời gian thực. Luận văn nhấn mạnh tầm quan trọng của học máy và thị giác máy tính, đặc biệt trong bối cảnh phát triển của trí tuệ nhân tạo. Các ứng dụng thực tế của lĩnh vực này, như tự động hóa công nghiệp, viễn thám, giám sát giao thông, được đề cập đến như động lực nghiên cứu.
Tác giả chỉ ra những hạn chế của các hệ thống giám sát hiện tại ở Việt Nam, chủ yếu vẫn dựa vào con người, và đề xuất việc ứng dụng công nghệ theo dõi đối tượng tự động để nâng cao hiệu quả và giảm chi phí. Luận văn cũng phân tích các hướng tiếp cận khác nhau trong bài toán phát hiện đối tượng, bao gồm phát hiện điểm quan trọng, phân đoạn ảnh, mô hình nền và phân loại có giám sát. Mỗi phương pháp đều có ưu nhược điểm riêng, ví dụ như phương pháp mô hình trộn Gaussian (Mixture of Gaussian) hiệu quả nhưng gặp khó khăn trong việc xác định đối tượng cần phát hiện. Việc lựa chọn phương pháp tối ưu phụ thuộc vào tình huống cụ thể. Luận văn cũng đề cập đến việc sử dụng các phương pháp học máy như mạng nơ-ron, cây quyết định và máy hỗ trợ vectơ, nhưng cũng chỉ ra khó khăn trong việc thu thập dữ liệu huấn luyện. Cuối cùng, luận văn đặt ra mục tiêu nghiên cứu, xây dựng giải thuật theo dõi đối tượng có độ chính xác cao và chi phí tính toán thấp, phù hợp với ứng dụng thời gian thực.
II. Cơ sở lý thuyết
Chương này trình bày nền tảng lý thuyết cho luận văn, bao gồm phân hoạch mờ, giải thuật di truyền (GA) và giải thuật tối ưu bầy đàn (PSO). Phân hoạch mờ được giới thiệu như một phương pháp hiệu quả để xử lý các bài toán phức tạp trong thực tế, nơi logic nhị phân truyền thống không đủ. Luận văn trình bày các bước thực hiện giải thuật phân hoạch mờ, bao gồm khởi tạo ma trận phân hoạch, tính toán vectơ trọng tâm, cập nhật ma trận và kiểm tra hội tụ. Ưu điểm của phương pháp này là cho kết quả tốt với dữ liệu chồng chéo, tránh sai số tích lũy. Tuy nhiên, nhược điểm là cần xác định trước số lượng cụm và chi phí tính toán cao.
Về giải thuật di truyền, luận văn mô tả các bước chính: khởi tạo quần thể, lai ghép chéo, đột biến, đấu tranh sinh tồn và điều kiện dừng. GA được so sánh với các phương pháp truyền thống như liệt kê, giải tích và tìm kiếm ngẫu nhiên, cho thấy ưu điểm của GA trong việc tìm kiếm trên nhiều điểm song song và khả năng leo lên nhiều cực trị cùng lúc. Việc mã hóa thông số thành chuỗi và sử dụng thông tin về tiêu chuẩn tối ưu của hàm mục tiêu là những điểm khác biệt của GA. Tuy nhiên, luận văn chưa đi sâu vào chi tiết các toán tử của GA và cách lựa chọn các tham số.
III. Áp dụng GA và PSO trong bài toán theo dõi đối tượng
Chương này tập trung vào việc áp dụng GA và PSO vào bài toán theo dõi đối tượng, cụ thể là phương tiện giao thông từ ảnh UAV. Luận văn đề cập đến việc sử dụng các kỹ thuật tối ưu để tăng độ chính xác và hiệu quả của bước phát hiện đối tượng. Quá trình theo dõi bao gồm phát hiện đối tượng chuyển động (Object Detection) và theo dõi đối tượng (Object Tracking). Việc phát hiện đối tượng được xem là yếu tố quyết định độ chính xác của hệ thống. Theo dõi đối tượng bao gồm việc tìm đường chuyển động, dự đoán chuyển động và xử lý nhập nhằng. Luận văn nhấn mạnh việc khảo sát các đặc trưng của video, ảnh, đối tượng chuyển động và nền để áp dụng thuật toán phù hợp, rút ngắn thời gian tính toán và chi phí bộ nhớ, hướng đến ứng dụng thời gian thực.
Tuy nhiên, luận văn chưa mô tả cụ thể cách thức kết hợp GA và PSO trong bài toán, cũng như các đặc trưng được sử dụng. Việc thiếu chi tiết này khiến người đọc khó hình dung được cách thức hoạt động của giải thuật được đề xuất.
IV. Cài đặt và Kết quả
Chương này trình bày về cài đặt thử nghiệm và kết quả đạt được. Luận văn đề cập đến việc sử dụng Matlab làm công cụ hỗ trợ và mô tả cấu trúc công cụ thử nghiệm GAObjectTracking. Các bước xử lý ảnh, bao gồm phân vùng màu, nhị phân hóa và lọc, được nêu ra. Kết quả thử nghiệm được thể hiện qua các hình ảnh minh họa, bao gồm ảnh phân vùng, ảnh nhị phân và bao của đối tượng trích xuất. Tuy nhiên, luận văn chưa cung cấp các số liệu đánh giá định lượng về hiệu quả của giải thuật, chẳng hạn như độ chính xác, thời gian xử lý, so sánh với các phương pháp khác. Việc thiếu các số liệu này làm giảm tính thuyết phục của kết quả nghiên cứu. Cần bổ sung thêm các phân tích định lượng để đánh giá khách quan hơn về hiệu quả của giải thuật được đề xuất.