Nghiên Cứu và Xây Dựng Giải Thuật Phân Lớp Tập Mở Tại Đại Học Bách Khoa Hà Nội

Trường đại học

Đại học Bách Khoa Hà Nội

Chuyên ngành

Toán Tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2023

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. PHẦN I: GIỚI THIỆU

2. PHẦN II: NỘI DUNG

2.1. Chương 1: VẤN ĐỀ PHÂN LỚP, NHẬN DẠNG VÀ TẬP MỞ

2.1.1. Giới thiệu về bài toán phân lớp, nhận dạng và tập mở

2.1.1.1. Bài toán phân lớp, nhận dạng trong học máy, học sâu và bài toán nhận dạng khuôn mặt

2.1.1.2. Giới thiệu về tập mở

2.1.1.3. Các định nghĩa và công thức liên quan đến tập mở

2.1.2. Các phương pháp cho bài toán phân lớp trong tập mở

2.1.2.1. Nhóm các phương pháp sử dụng thống kê và các thuật toán học máy cổ điển

2.1.2.1.1. Thuật toán SVM và biến thể

2.1.2.1.2. Thuật toán dựa trên dữ liệu đặc trưng

2.1.2.1.3. Thuật toán dựa trên khoảng cách

2.1.2.1.4. Thuật toán dựa trên phân phối

2.1.2.2. Nhóm các phương pháp sử dụng mạng nơ-ron học sâu (deep neural network)

2.1.2.3. Nhóm các phương pháp sử dụng mô hình sinh (generative model)

2.1.2.3.1. Các mô hình Instance generation

2.1.2.3.2. Các mô hình Non-instance generation

2.1.3. Sử dụng phân lớp tập mở trong mô hình nhận dạng khuôn mặt

2.1.3.1. Những vấn đề trong việc áp dụng mô hình học sâu trong sản phẩm nhận diện khuôn mặt và kiểm soát vào ra

2.1.3.1.1. Xây dựng hệ thống nhận dạng khuôn mặt

2.1.3.1.2. Sử dụng mô hình MTCNN và FaceNet cho hệ thống nhân dạng khuôn mặt

2.1.3.2. Áp dụng mạng GAN trong tập mở cải tiến mô hình nhận dạng khuôn mặt

2.1.3.3. Sản phẩm nhận diện khuôn mặt và kiểm soát vào ra có sử dụng mô hình phân lớp tập mở

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Nghiên Cứu Giải Thuật Phân Lớp Tập Mở Hiện Nay

Hiện nay, trí tuệ nhân tạo (AI) và học máy (Machine Learning) đang phát triển mạnh mẽ, được ứng dụng rộng rãi trong nhiều lĩnh vực. Các hệ thống nhận dạng giọng nói, nhận dạng khuôn mặt được sử dụng trong trợ lý ảo, kiểm soát vào ra, điểm danh, chấm công. Giải thuật phân lớp là một trong những nhóm giải thuật cơ bản nhất của học máy, với mục tiêu phân loại đối tượng vào các lớp xác định trước. Tuy nhiên, các giải thuật này chủ yếu tập trung vào việc chia miền kết quả thành các lớp xác định, dẫn đến hiệu quả thấp khi áp dụng vào thực tế với các đối tượng ngoài các lớp đã biết. Điều này thúc đẩy nghiên cứu phát triển các giải thuật có khả năng phân loại tốt các đối tượng thuộc lớp chưa biết, hay còn gọi là bài toán phân lớp tập mở (Open Set Recognition). Bài toán này có ý nghĩa lớn trong thực tế, đặc biệt trong các bài toán bảo mật, nhận dạng khuôn mặt, sinh trắc học trong khu vực có kiểm soát an ninh. Luận văn này tập trung vào nghiên cứu và xây dựng giải thuật phân lớp tập mở.

1.1. Bài Toán Phân Lớp Truyền Thống và Hạn Chế Cần Khắc Phục

Bài toán phân lớp truyền thống giả định rằng tất cả các đối tượng đều thuộc một trong các lớp đã được xác định trước. Ví dụ, một thuật toán phân loại chữ số viết tay sẽ cố gắng phân loại một hình ảnh vào một trong các số từ 0 đến 9, ngay cả khi hình ảnh đó chứa một chữ cái. Tương tự, trong bài toán kiểm soát vào ra bằng khuôn mặt, hệ thống có thể đạt kết quả cao với cư dân đã đăng ký, nhưng lại gặp khó khăn với người lạ. Hạn chế này thúc đẩy sự phát triển của phân lớp tập mở, nhằm giải quyết vấn đề phân loại các đối tượng chưa biết.

1.2. Sự Khác Biệt Giữa Phân Lớp Tập Mở và Các Bài Toán Liên Quan

Phân lớp tập mở khác với các bài toán semi-supervised learning, trong đó chúng ta có một lượng lớn dữ liệu, nhưng chỉ một phần được gán nhãn. Trong semi-supervised learning, chúng ta giả định rằng dữ liệu chưa được gán nhãn thuộc một trong các lớp đã được gán nhãn. Tuy nhiên, trong phân lớp tập mở, chúng ta không có giả định này. Dữ liệu trong tập mở có thể có phân phối xác suất bất kỳ. Điều này làm cho bài toán phân lớp tập mở trở nên phức tạp hơn, nhưng cũng mang lại tính ứng dụng cao hơn trong thực tế.

II. Thách Thức Trong Nghiên Cứu Giải Thuật Phân Lớp Tập Mở

Việc xây dựng một mô hình phân lớp, đặc biệt là phân lớp tập mở, đòi hỏi nhiều bước, mỗi bước đều có những thách thức riêng. Chất lượng của mô hình phụ thuộc vào cả bộ dữ liệu và thuật toán được lựa chọn. Việc xây dựng bộ dữ liệu phù hợp, tiền xử lý dữ liệu, lựa chọn thuật toán, đánh giá và cải thiện mô hình đều là những yếu tố quan trọng. Các bộ dữ liệu ngày càng lớn và phức tạp, đòi hỏi các mô hình phải liên tục được cải tiến. Việc lựa chọn các phương pháp tiền xử lý dữ liệu và lựa chọn dữ liệu hiệu quả sẽ giúp giảm bớt kích thước bộ dữ liệu, làm tăng khả năng học của thuật toán, giúp khai thác hiệu quả bộ dữ liệu, đặc biệt là các thuật toán cần xử lý trên những tập dữ liệu lớn.

2.1. Xây Dựng Bộ Dữ Liệu Huấn Luyện Chất Lượng Cao Cho AI

Việc thu thập và xây dựng bộ dữ liệu là bước đầu tiên và quan trọng nhất. Một bộ dữ liệu tốt cần có đầy đủ các thuộc tính, tính năng quan trọng, số lượng dữ liệu đủ lớn để đảm bảo hiệu quả của mô hình. Nếu không, chúng ta có thể sử dụng phương pháp "brute-force", thu thập tất cả các dữ liệu liên quan và kiểm tra xem những đặc trưng nào là quan trọng. Tuy nhiên, phương pháp này có nhiều nhược điểm như tốn thời gian, khối lượng dữ liệu lớn, xuất hiện dữ liệu nhiễu. Do đó, việc thu thập được một bộ dữ liệu có giá trị, chất lượng phù hợp với bài toán là một thách thức lớn.

2.2. Tiền Xử Lý Dữ Liệu và Loại Bỏ Dữ Liệu Nhiễu Trong Machine Learning

Dữ liệu thu thập được có thể chứa các giá trị sai, không hợp lý, thiếu dữ liệu hoặc không liên quan. Việc tiền xử lý dữ liệu là cần thiết để làm sạch dữ liệu, đảm bảo chất lượng của bộ dữ liệu. Các phương pháp tiền xử lý bao gồm kiểm tra và chỉnh sửa dữ liệu, loại bỏ dữ liệu không thể chỉnh sửa, phát hiện và loại bỏ các giá trị nhiễu. Việc lựa chọn các phương pháp tiền xử lý dữ liệu hiệu quả sẽ giúp giảm kích thước bộ dữ liệu, tăng khả năng học của thuật toán.

2.3. Lựa Chọn Thuật Toán Phân Lớp Phù Hợp Với Bài Toán

Việc lựa chọn thuật toán phân lớp phù hợp cũng là một thách thức quan trọng. Việc đánh giá kết quả thuật toán thường dựa vào độ chính xác dự đoán. Có nhiều kỹ thuật được sử dụng để đánh giá độ chính xác của mô hình, như chia bộ dữ liệu thành hai phần (huấn luyện và kiểm tra), sử dụng kỹ thuật xác thực chéo. Nếu hiệu quả mô hình không cao, chúng ta cần xem xét một loạt các yếu tố như đặc trưng không được sử dụng, cần tập huấn luyện lớn hơn, số chiều của dữ liệu quá lớn, thuật toán không thích hợp.

III. Phương Pháp SVM và Biến Thể Trong Phân Lớp Tập Mở

Các phương pháp cho bài toán phân lớp trong tập mở có thể được chia thành nhiều nhóm, bao gồm các phương pháp sử dụng thống kê và các thuật toán học máy cổ điển, các phương pháp sử dụng mạng nơ-ron học sâu (Deep Learning), và các phương pháp sử dụng mô hình sinh (Generative Model). Trong đó, Support Vector Machine (SVM) và các biến thể của nó là một trong những thuật toán được sử dụng phổ biến trong phân lớp tập mở. SVM là một thuật toán học máy có giám sát, được sử dụng để phân loại dữ liệu bằng cách tìm ra một siêu phẳng (hyperplane) tối ưu để phân tách các lớp dữ liệu.

3.1. Ưu Điểm và Hạn Chế Của Thuật Toán SVM Trong Open Set Recognition

SVM có nhiều ưu điểm như khả năng xử lý dữ liệu có số chiều cao, khả năng khái quát hóa tốt, và hiệu quả tính toán. Tuy nhiên, SVM cũng có một số hạn chế, đặc biệt trong phân lớp tập mở. SVM giả định rằng tất cả các đối tượng đều thuộc một trong các lớp đã được xác định trước, do đó không thể phân loại các đối tượng chưa biết. Ngoài ra, SVM có thể bị ảnh hưởng bởi các giá trị ngoại lai (outliers) trong dữ liệu.

3.2. Các Biến Thể Của SVM Thích Ứng Với Bài Toán Phân Lớp Tập Mở

Để khắc phục những hạn chế của SVM trong phân lớp tập mở, nhiều biến thể của SVM đã được phát triển. Một trong những biến thể phổ biến nhất là One-Class SVM, được sử dụng để phát hiện các đối tượng ngoại lai. One-Class SVM học một biên giới xung quanh các đối tượng thuộc một lớp duy nhất, và coi bất kỳ đối tượng nào nằm ngoài biên giới này là ngoại lai. Các biến thể khác của SVM bao gồm Nearest Neighbor SVM, Fuzzy SVM, và Kernel SVM.

IV. Ứng Dụng Mạng GAN Cải Tiến Mô Hình Nhận Dạng Khuôn Mặt

Luận văn đề cập đến việc sử dụng mạng Generative Adversarial Networks (GAN) trong phân lớp tập mở, đặc biệt là trong bài toán nhận dạng khuôn mặt. GAN là một mô hình sinh, bao gồm hai mạng nơ-ron: một mạng sinh (generator) và một mạng phân biệt (discriminator). Mạng sinh tạo ra các mẫu dữ liệu giả, trong khi mạng phân biệt cố gắng phân biệt giữa các mẫu dữ liệu thật và giả. Bằng cách huấn luyện hai mạng này cùng nhau, GAN có thể tạo ra các mẫu dữ liệu giả rất giống với dữ liệu thật.

4.1. Mô Hình OpenGAN Trong Phân Lớp Tập Mở và Nhận Dạng Khuôn Mặt

Mô hình OpenGAN là một ứng dụng của GAN trong phân lớp tập mở. OpenGAN sử dụng mạng sinh để tạo ra các mẫu dữ liệu giả cho các lớp chưa biết, và sử dụng mạng phân biệt để phân biệt giữa các mẫu dữ liệu thật và giả, cũng như giữa các lớp đã biết và chưa biết. Bằng cách này, OpenGAN có thể cải thiện khả năng phân loại các đối tượng chưa biết trong bài toán nhận dạng khuôn mặt.

4.2. Xây Dựng Hệ Thống Nhận Dạng Khuôn Mặt Sử Dụng MTCNN và FaceNet

Luận văn cũng đề cập đến việc xây dựng hệ thống nhận dạng khuôn mặt sử dụng MTCNN (Multi-Task Cascaded Convolutional Networks) và FaceNet. MTCNN là một mạng nơ-ron được sử dụng để phát hiện khuôn mặt trong ảnh. FaceNet là một mạng nơ-ron được sử dụng để tạo ra các biểu diễn nhúng (embeddings) của khuôn mặt, cho phép so sánh và nhận dạng khuôn mặt một cách hiệu quả. Việc kết hợp MTCNN, FaceNet và OpenGAN có thể tạo ra một hệ thống nhận dạng khuôn mặt mạnh mẽ, có khả năng xử lý các đối tượng chưa biết.

V. Kết Quả Nghiên Cứu và Ứng Dụng Thực Tế Của Giải Thuật

Luận văn trình bày kết quả nghiên cứu và ứng dụng thực tế của giải thuật phân lớp tập mở trong mô hình nhận dạng khuôn mặt. Hệ thống nhận dạng khuôn mặt được phát triển có khả năng nhận diện khuôn mặt của người lạ, những người không có trong cơ sở dữ liệu. Điều này có ý nghĩa quan trọng trong các ứng dụng kiểm soát vào ra, an ninh, và giám sát. Sản phẩm nhận diện khuôn mặt và kiểm soát vào ra có sử dụng mô hình phân lớp tập mở.

5.1. Đánh Giá Độ Chính Xác và Thời Gian Thực Thi Của Giải Thuật

Việc đánh giá độ chính xác và thời gian thực thi của giải thuật là rất quan trọng để đảm bảo tính hiệu quả của hệ thống. Luận văn trình bày các kết quả đánh giá trên các bộ dữ liệu thử nghiệm khác nhau, so sánh với các thuật toán phân lớp truyền thống. Kết quả cho thấy giải thuật phân lớp tập mở có độ chính xác cao hơn trong việc nhận diện các đối tượng chưa biết, đồng thời vẫn duy trì được độ chính xác tốt trong việc nhận diện các đối tượng đã biết.

5.2. Ứng Dụng Giải Thuật Trong Hệ Thống Kiểm Soát Vào Ra và An Ninh

Giải thuật phân lớp tập mở có thể được ứng dụng trong nhiều hệ thống kiểm soát vào ra và an ninh. Ví dụ, trong hệ thống kiểm soát vào ra khu chung cư, giải thuật có thể nhận diện cư dân đã đăng ký và từ chối người lạ. Trong hệ thống an ninh, giải thuật có thể phát hiện các đối tượng khả nghi, những người không có trong danh sách cho phép. Điều này giúp tăng cường an ninh và bảo vệ tài sản.

VI. Kết Luận và Hướng Phát Triển Nghiên Cứu Phân Lớp Tập Mở

Luận văn đã trình bày một nghiên cứu về giải thuật phân lớp tập mở, tập trung vào các phương pháp sử dụng SVM và GAN. Kết quả nghiên cứu cho thấy các giải thuật này có tiềm năng lớn trong việc giải quyết bài toán phân lớp trong môi trường thực tế, nơi mà các đối tượng chưa biết có thể xuất hiện. Tuy nhiên, vẫn còn nhiều thách thức cần giải quyết, như cải thiện độ chính xác, giảm thời gian thực thi, và xử lý dữ liệu phức tạp.

6.1. Tóm Tắt Những Đóng Góp Chính Của Luận Văn Về AI

Luận văn đã đóng góp vào lĩnh vực phân lớp tập mở bằng cách trình bày một tổng quan về các phương pháp hiện có, đề xuất một giải thuật mới dựa trên GAN, và đánh giá hiệu quả của giải thuật trên các bộ dữ liệu thực tế. Luận văn cũng đã chỉ ra những hướng nghiên cứu tiềm năng trong tương lai, như sử dụng các kiến trúc mạng nơ-ron mới, kết hợp với các phương pháp học máy khác, và phát triển các ứng dụng thực tế.

6.2. Hướng Nghiên Cứu Tiếp Theo Để Nâng Cao Hiệu Quả Giải Thuật

Trong tương lai, có thể tập trung vào việc nghiên cứu các kiến trúc mạng nơ-ron mới, như Transformer, để cải thiện khả năng biểu diễn dữ liệu và phân loại các đối tượng chưa biết. Ngoài ra, có thể kết hợp các phương pháp học máy khác, như Transfer Learning và Semi-Supervised Learning, để tận dụng dữ liệu đã được gán nhãn và chưa được gán nhãn. Cuối cùng, cần phát triển các ứng dụng thực tế của giải thuật phân lớp tập mở trong nhiều lĩnh vực khác nhau, như y tế, tài chính, và giao thông vận tải.

05/06/2025

Bạn đang xem trước tài liệu:

Nghiên cứu và xây dựng giải thuật phân lớp tập mở

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của trí tuệ nhân tạo và học máy, bài toán phân lớp và nhận dạng đóng vai trò then chốt trong nhiều ứng dụng thực tiễn như nhận dạng khuôn mặt, kiểm soát vào ra, và sinh trắc học. Theo ước tính, các bộ dữ liệu tiêu chuẩn như MNIST và CIFAR-10 với hàng chục nghìn ảnh đã được sử dụng rộng rãi để huấn luyện các mô hình phân lớp truyền thống. Tuy nhiên, các mô hình này thường giả định rằng tất cả dữ liệu kiểm tra đều thuộc về các lớp đã biết trong tập huấn luyện, dẫn đến hiệu quả thấp khi gặp dữ liệu mới không thuộc các lớp đó. Đây chính là vấn đề của bài toán phân lớp trong tập mở (open set classification), nơi mà mô hình phải nhận diện và phân biệt các đối tượng thuộc các lớp chưa biết trước đó.

Mục tiêu nghiên cứu của luận văn là phát triển và xây dựng giải thuật phân lớp tập mở nhằm nâng cao khả năng nhận dạng chính xác các đối tượng thuộc cả lớp đã biết và lớp chưa biết trong môi trường thực tế. Phạm vi nghiên cứu tập trung vào các mô hình học máy và học sâu, đặc biệt là ứng dụng trong nhận dạng khuôn mặt và kiểm soát vào ra tại các khu vực có an ninh cao. Nghiên cứu được thực hiện trong giai đoạn 2021-2023 tại Viện Toán ứng dụng và Tin học, Trường Đại học Bách Khoa Hà Nội.

Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác nhận dạng trong môi trường tập mở, giảm thiểu sai sót khi gặp dữ liệu mới, từ đó nâng cao hiệu quả và độ tin cậy của các hệ thống nhận dạng khuôn mặt và các ứng dụng an ninh khác. Các chỉ số đánh giá như tỷ lệ nhận dạng chính xác và tỷ lệ từ chối sai được cải thiện rõ rệt, góp phần thúc đẩy ứng dụng trí tuệ nhân tạo trong thực tế.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu sau:

Phân lớp tập mở (Open Set Classification): Khái niệm tập mở được định nghĩa là môi trường mà ngoài các lớp đã biết (Known Known Classes - KKCs), còn tồn tại các lớp chưa biết (Unknown Unknown Classes - UUCs) không có trong tập huấn luyện. Mục tiêu là xây dựng hàm phân lớp có khả năng nhận diện và từ chối các mẫu thuộc lớp chưa biết, giảm thiểu rủi ro trong không gian mở (Open Space Risk).
Lý thuyết giá trị cực đại (Extreme Value Theory - EVT): Được sử dụng để mô hình hóa phân phối xác suất của các điểm dữ liệu cận biên, giúp xác định ranh giới phân lớp trong không gian mở. EVT hỗ trợ hiệu chuẩn các mô hình phân lớp nhằm phân biệt chính xác giữa các lớp đã biết và các mẫu chưa biết.
Mạng nơ-ron học sâu (Deep Neural Networks - DNNs): Các mô hình CNN như MTCNN, FaceNet được áp dụng để trích xuất đặc trưng khuôn mặt. Lớp OpenMax thay thế lớp Softmax truyền thống nhằm cải thiện khả năng nhận dạng trong tập mở bằng cách tính toán xác suất thuộc lớp chưa biết dựa trên phân phối Weibull.
Mô hình sinh (Generative Models): Mạng Generative Adversarial Networks (GAN) được sử dụng để tạo ra các mẫu dữ liệu giả lập thuộc lớp chưa biết, hỗ trợ huấn luyện mô hình phân lớp tập mở hiệu quả hơn.

Các khái niệm chính bao gồm: tập mở, rủi ro không gian mở, hàm phân lớp, phân phối Weibull, mạng OpenMax, mạng GAN, và các thuật toán học máy truyền thống như SVM, SRC.

Phương pháp nghiên cứu

Nguồn dữ liệu chính bao gồm các bộ dữ liệu chuẩn như MNIST, CIFAR-10, SVHN, cùng với dữ liệu thực tế về khuôn mặt và phương tiện giao thông tại một số địa phương. Bộ dữ liệu khuôn mặt được thu thập và xử lý qua các bước tiền xử lý như loại bỏ dữ liệu nhiễu, bổ sung dữ liệu thiếu bằng phương pháp trung bình hoặc hồi quy, và lựa chọn tập con bằng lấy mẫu ngẫu nhiên.

Phương pháp phân tích bao gồm:

Xây dựng và huấn luyện các mô hình phân lớp truyền thống (SVM, KNN) và mô hình học sâu (MTCNN, FaceNet).
Áp dụng lớp OpenMax để thay thế Softmax trong mạng học sâu nhằm xử lý bài toán phân lớp tập mở.
Sử dụng mạng GAN để tạo dữ liệu giả lập thuộc lớp chưa biết, tăng cường khả năng nhận dạng.
Đánh giá mô hình qua các chỉ số như độ chính xác phân lớp, tỷ lệ từ chối sai, và chỉ số Youden.

Quá trình nghiên cứu kéo dài từ tháng 01/2021 đến 04/2023, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, huấn luyện, kiểm thử và tối ưu hóa.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả của mô hình phân lớp tập mở: Mô hình OpenMax kết hợp với mạng FaceNet đạt độ chính xác nhận dạng khuôn mặt trên 95% trong môi trường tập mở, cao hơn khoảng 10% so với mô hình sử dụng lớp Softmax truyền thống. Tỷ lệ từ chối sai (false rejection) giảm xuống dưới 5%, cho thấy khả năng phân biệt tốt các mẫu chưa biết.
Ứng dụng mạng GAN trong tạo dữ liệu giả lập: Việc sử dụng mạng GAN để sinh dữ liệu thuộc lớp chưa biết giúp cải thiện độ chính xác nhận dạng thêm khoảng 7%, đồng thời giảm thiểu sai số phân lớp nhầm lẫn giữa các lớp KKCs và UUCs.
So sánh các thuật toán học máy cổ điển: Thuật toán SVM biến thể W-SVM và POS-SVM cho thấy khả năng kiểm soát rủi ro không gian mở tốt hơn, với tỷ lệ nhận dạng chính xác đạt khoảng 85-88%, cao hơn 15% so với SVM truyền thống khi xử lý dữ liệu tập mở.
Ảnh hưởng của tiền xử lý dữ liệu: Việc xử lý dữ liệu thiếu và loại bỏ dữ liệu nhiễu trước khi huấn luyện giúp tăng hiệu suất mô hình lên khoảng 8%, đồng thời giảm thời gian huấn luyện xuống 20%.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu quả mô hình phân lớp tập mở là do việc áp dụng lớp OpenMax và mô hình GAN giúp mô hình nhận diện được các mẫu chưa biết và từ chối phân lớp sai. So với các nghiên cứu trước đây chỉ tập trung vào phân lớp tập đóng, kết quả này cho thấy bước tiến quan trọng trong việc ứng dụng học sâu cho bài toán phân lớp tập mở.

Biểu đồ so sánh độ chính xác giữa các mô hình truyền thống và mô hình đề xuất minh họa rõ ràng sự vượt trội của mô hình OpenMax + GAN. Bảng số liệu chi tiết cũng cho thấy tỷ lệ từ chối sai giảm đáng kể, góp phần nâng cao độ tin cậy của hệ thống nhận dạng khuôn mặt trong thực tế.

Tuy nhiên, việc lựa chọn ngưỡng phân lớp trong mô hình OpenMax và W-SVM vẫn còn phụ thuộc vào kinh nghiệm và đặc điểm dữ liệu, đây là điểm cần cải tiến trong các nghiên cứu tiếp theo. Ngoài ra, sự mất cân bằng dữ liệu giữa các lớp KKCs và UUCs cũng ảnh hưởng đến hiệu suất mô hình, đòi hỏi các kỹ thuật cân bằng dữ liệu hoặc học tăng cường được áp dụng.

Đề xuất và khuyến nghị

Phát triển mô hình phân lớp tập mở tích hợp GAN và OpenMax: Tiếp tục hoàn thiện và tối ưu hóa mô hình kết hợp mạng GAN để tạo dữ liệu giả lập và lớp OpenMax nhằm nâng cao độ chính xác nhận dạng khuôn mặt trong môi trường tập mở. Mục tiêu đạt độ chính xác trên 97% trong vòng 12 tháng tới. Chủ thể thực hiện: nhóm nghiên cứu tại Viện Toán ứng dụng và Tin học.
Xây dựng bộ dữ liệu đa dạng và cân bằng hơn: Thu thập và xử lý thêm dữ liệu khuôn mặt và các đối tượng chưa biết từ nhiều nguồn khác nhau, đảm bảo cân bằng giữa các lớp KKCs và UUCs để giảm thiểu sai số phân lớp. Thời gian thực hiện: 6 tháng. Chủ thể: phòng dữ liệu và nhóm phát triển sản phẩm.
Tối ưu hóa thuật toán lựa chọn ngưỡng phân lớp: Nghiên cứu và áp dụng các phương pháp tự động hiệu chuẩn ngưỡng dựa trên học máy hoặc tối ưu hóa đa mục tiêu để giảm sự phụ thuộc vào kinh nghiệm và đặc điểm dữ liệu. Mục tiêu giảm sai số phân lớp nhầm dưới 3%. Thời gian: 9 tháng. Chủ thể: nhóm nghiên cứu thuật toán.
Tích hợp mô hình vào hệ thống kiểm soát vào ra thực tế: Triển khai mô hình phân lớp tập mở vào sản phẩm nhận dạng khuôn mặt và kiểm soát vào ra tại các khu chung cư, nhà máy với quy mô thử nghiệm khoảng 5000 người dùng trong 6 tháng. Chủ thể: công ty công nghệ cao Skymap phối hợp với Viện Toán ứng dụng và Tin học.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành trí tuệ nhân tạo, học máy: Luận văn cung cấp cơ sở lý thuyết và các phương pháp hiện đại trong phân lớp tập mở, giúp mở rộng kiến thức và ứng dụng trong các đề tài nghiên cứu liên quan.
Chuyên gia phát triển sản phẩm nhận dạng khuôn mặt và an ninh: Các giải thuật và mô hình được đề xuất có thể áp dụng trực tiếp vào các hệ thống nhận dạng khuôn mặt, kiểm soát an ninh, giúp nâng cao hiệu quả và độ tin cậy sản phẩm.
Doanh nghiệp công nghệ và startup trong lĩnh vực AI: Tham khảo để phát triển các giải pháp phân lớp tập mở, đặc biệt trong các ứng dụng thực tế như quản lý truy cập, điểm danh tự động, và giám sát an ninh.
Cơ quan quản lý và tổ chức nghiên cứu ứng dụng AI: Hiểu rõ hơn về thách thức và giải pháp trong phân lớp tập mở, từ đó xây dựng chính sách, định hướng nghiên cứu và đầu tư phù hợp.

Câu hỏi thường gặp

Phân lớp tập mở khác gì so với phân lớp truyền thống?
Phân lớp truyền thống giả định tất cả dữ liệu kiểm tra thuộc các lớp đã biết trong tập huấn luyện, trong khi phân lớp tập mở cho phép nhận diện và từ chối các mẫu thuộc lớp chưa biết, giúp giảm sai sót khi gặp dữ liệu mới.
Làm thế nào để mô hình phân lớp tập mở nhận biết được dữ liệu chưa biết?
Các mô hình sử dụng kỹ thuật như lớp OpenMax thay thế Softmax, kết hợp phân phối Weibull và mạng GAN để tạo dữ liệu giả lập, từ đó xác định và từ chối các mẫu không thuộc lớp đã biết.
Tại sao cần sử dụng mạng GAN trong phân lớp tập mở?
Mạng GAN giúp tạo ra các mẫu dữ liệu giả lập thuộc lớp chưa biết, hỗ trợ mô hình học sâu nhận diện tốt hơn các đối tượng mới, cải thiện độ chính xác và khả năng từ chối sai.
Ngưỡng phân lớp trong mô hình OpenMax được xác định như thế nào?
Ngưỡng thường được hiệu chuẩn dựa trên dữ liệu huấn luyện và tập mở, tuy nhiên hiện nay vẫn còn phụ thuộc vào kinh nghiệm và đặc điểm dữ liệu, cần nghiên cứu thêm để tự động hóa quá trình này.
Ứng dụng thực tế của phân lớp tập mở là gì?
Phân lớp tập mở được ứng dụng trong nhận dạng khuôn mặt tại các khu vực an ninh, kiểm soát vào ra, sinh trắc học, giúp hệ thống nhận diện chính xác người dùng đã đăng ký và từ chối người lạ, nâng cao an toàn và hiệu quả quản lý.

Kết luận

Luận văn đã nghiên cứu và xây dựng thành công giải thuật phân lớp tập mở, kết hợp mạng học sâu và mô hình sinh để nâng cao hiệu quả nhận dạng trong môi trường thực tế.
Mô hình OpenMax và mạng GAN được áp dụng hiệu quả, cải thiện độ chính xác nhận dạng khuôn mặt trên 95% và giảm tỷ lệ từ chối sai dưới 5%.
Các thuật toán học máy truyền thống như SVM biến thể cũng được cải tiến để phù hợp với bài toán phân lớp tập mở.
Đề xuất các giải pháp phát triển mô hình, xây dựng bộ dữ liệu cân bằng, tối ưu ngưỡng phân lớp và triển khai thực tế trong vòng 1-2 năm tới.
Kêu gọi các nhà nghiên cứu, doanh nghiệp và tổ chức ứng dụng AI tiếp tục hợp tác để hoàn thiện và mở rộng ứng dụng phân lớp tập mở trong nhiều lĩnh vực.

Tài liệu "Nghiên Cứu Giải Thuật Phân Lớp Tập Mở Tại Đại Học Bách Khoa Hà Nội" cung cấp cái nhìn sâu sắc về các thuật toán phân lớp trong bối cảnh học máy, đặc biệt là trong việc xử lý dữ liệu mở. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về các phương pháp phân lớp hiện đại mà còn chỉ ra những ứng dụng thực tiễn của chúng trong nhiều lĩnh vực khác nhau. Độc giả sẽ tìm thấy những lợi ích từ việc áp dụng các thuật toán này để cải thiện độ chính xác và hiệu suất trong các bài toán phân loại.

Để mở rộng kiến thức của bạn về lĩnh vực này, bạn có thể tham khảo thêm tài liệu Luận văn thạc sĩ học máy bằng phương pháp hồi quy logistic và ứng dụng trong phân luồng học sinh phổ thông, nơi bạn sẽ tìm thấy những ứng dụng cụ thể của học máy trong giáo dục. Ngoài ra, tài liệu Phương thức học máy trực tuyến dựa trên mô hình bayes sẽ giúp bạn hiểu rõ hơn về các phương pháp học máy tiên tiến. Cuối cùng, tài liệu Luan van thac si khoa hoc may tinh nghien cuu mo hinh relevance vector machine rvm ap dung giai mot so bai toan thuc te sẽ cung cấp cái nhìn sâu sắc về mô hình RVM và ứng dụng của nó trong giải quyết các bài toán thực tiễn. Những tài liệu này sẽ là cơ hội tuyệt vời để bạn khám phá thêm về các khía cạnh khác nhau của học máy và phân lớp.

#Phân tích dữ liệu

#công nghệ thông tin

#Đại học Bách Khoa Hà Nội

#ứng dụng giải thuật

#nghiên cứu học máy

#giải thuật phân lớp

Chủ đề

Nghiên cứu về học máy

Giải thuật và ứng dụng

Đào tạo và nghiên cứu tại Đại học

Phân lớp trong dữ liệu lớn