Luận văn thạc sĩ: Nghiên cứu học máy cho phân cụm hình ảnh tương tác

Luận văn thạc sĩ VNU nghiên cứu phương pháp học metric cho clustering bán giám sát tương tác trên hình ảnh, nâng cao hiệu quả phân loại.

Trường đại học

Université Nationale Du Vietnam, Hanoi Institut Francophone International

Chuyên ngành

Systèmes Intelligents Multimédia

Người đăng

Ẩn danh

Thể loại

Mémoire de fin d’études du master informatique

2015

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: INTRODUCTION

1.1. Problématique et Motivation

1.2. Objectifs et Principales Contributions

2. CHƯƠNG 2: CLUSTERING SEMI-SUPERVISÉ INTERACTIF INCRÉMENTAL

2.1. Introduction

2.2. Clustering non-supervisé

2.2.1. Différents types de méthodes

2.2.2. Présentation des méthodes de clustering non-supervisé utilisées

2.3. Clustering semi-supervisé

2.3.1. Différents types de méthodes

2.3.2. Présentation de HMRF-KMeans

2.4. Modèle de clustering semi-supervisé interactif de LAI Hien Phuong

2.4.1. Introduction et Motivation

2.4.2. Stratégies de déduction des contraintes

2.4.3. Méthode de clustering semi-supervisé interactif incrémental

3. CHƯƠNG 3: APPRENTISSAGE DE MÉTRIQUE

3.1. Introduction

3.2. Distance de Mahalanobis

3.3. Différents types d'approches d'apprentissage de métrique

3.4. Choix d'une méthode d'apprentissage de métrique dans notre contexte

4. CHƯƠNG 4: INTÉGRATION DE L'APPRENTISSAGE DE MÉTRIQUE DANS LE SYSTÈME EXISTANT

4.1. Présentation de la méthode

4.2. Implémentation de la méthode

4.3. Analyses des résultats obtenus

4.4. Discussion et Conclusion

5. CHƯƠNG 5: CONCLUSION

A: ILLUSTRATION DES MÉTHODES DE CLUSTERING NON-SUPERVISÉ

B: MESURES DE QUALITÉ DE CLUSTERING

C: RÉSULTAT EXPÉRIMENTAL DE L'ALGORITHME MPCKMEANS

D: RÉSULTATS DÉTAILLÉS DE QUELQUES MÉTHODES D'APPRENTISSAGE DE MÉTRIQUE

BIBLIOGRAPHIE

Tóm tắt

I. Tổng quan về Nghiên cứu Học máy và Phân cụm Hình ảnh

Nghiên cứu về học máy và phân cụm hình ảnh đang trở thành một lĩnh vực quan trọng trong công nghệ thông tin. Học máy cho phép máy tính học hỏi từ dữ liệu mà không cần lập trình cụ thể. Phân cụm hình ảnh là một trong những ứng dụng chính của học máy, giúp tổ chức và phân loại hình ảnh dựa trên các đặc điểm tương đồng. Việc áp dụng các thuật toán học máy trong phân cụm hình ảnh không chỉ giúp cải thiện hiệu suất mà còn mở ra nhiều cơ hội mới trong việc xử lý và phân tích dữ liệu hình ảnh.

1.1. Khái niệm cơ bản về Học máy và Phân cụm Hình ảnh

Học máy là một nhánh của trí tuệ nhân tạo, cho phép máy tính tự động cải thiện hiệu suất thông qua việc học từ dữ liệu. Phân cụm hình ảnh là quá trình nhóm các hình ảnh tương tự lại với nhau, giúp dễ dàng quản lý và tìm kiếm. Các thuật toán như K-means, DBSCAN và phân cụm hierarchique thường được sử dụng trong lĩnh vực này.

1.2. Tầm quan trọng của Nghiên cứu trong lĩnh vực này

Nghiên cứu về học máy và phân cụm hình ảnh có vai trò quan trọng trong nhiều lĩnh vực như y tế, an ninh, và thương mại điện tử. Việc phân tích hình ảnh giúp phát hiện các mẫu và xu hướng, từ đó hỗ trợ ra quyết định chính xác hơn.

II. Thách thức trong Nghiên cứu Học máy và Phân cụm Hình ảnh

Mặc dù có nhiều tiến bộ, nhưng vẫn tồn tại nhiều thách thức trong nghiên cứu học máy và phân cụm hình ảnh. Một trong những vấn đề lớn nhất là việc xử lý dữ liệu lớn và không đồng nhất. Các thuật toán hiện tại đôi khi không thể xử lý hiệu quả các tập dữ liệu lớn hoặc dữ liệu có nhiều biến thể. Ngoài ra, việc lựa chọn các đặc trưng phù hợp để phân cụm cũng là một thách thức lớn.

2.1. Vấn đề về Dữ liệu lớn và Không đồng nhất

Dữ liệu lớn đòi hỏi các thuật toán phải có khả năng xử lý nhanh chóng và hiệu quả. Dữ liệu không đồng nhất có thể gây khó khăn trong việc xác định các đặc trưng chính xác cho phân cụm, dẫn đến kết quả không chính xác.

2.2. Khó khăn trong việc Lựa chọn Đặc trưng

Việc lựa chọn các đặc trưng phù hợp là rất quan trọng trong phân cụm hình ảnh. Nếu các đặc trưng không chính xác, kết quả phân cụm sẽ không phản ánh đúng thực tế, gây khó khăn trong việc áp dụng vào thực tiễn.

III. Phương pháp Học máy trong Phân cụm Hình ảnh

Có nhiều phương pháp học máy được áp dụng trong phân cụm hình ảnh, bao gồm học sâu và học không giám sát. Học sâu sử dụng các mạng nơ-ron để tự động trích xuất đặc trưng từ hình ảnh, trong khi học không giám sát giúp phân nhóm hình ảnh mà không cần nhãn. Các phương pháp này đã chứng minh được hiệu quả trong việc cải thiện độ chính xác của phân cụm.

3.1. Học sâu và Mạng nơ ron trong Phân cụm

Học sâu sử dụng các mạng nơ-ron để tự động trích xuất đặc trưng từ hình ảnh. Các mô hình như CNN (Convolutional Neural Networks) đã được chứng minh là rất hiệu quả trong việc phân loại và phân cụm hình ảnh.

3.2. Học không giám sát và Các Thuật toán Phân cụm

Học không giám sát cho phép phân nhóm hình ảnh mà không cần nhãn. Các thuật toán như K-means, DBSCAN và HMRF-KMeans được sử dụng để cải thiện kết quả phân cụm, giúp người dùng dễ dàng tương tác và điều chỉnh kết quả.

IV. Ứng dụng thực tiễn của Nghiên cứu Học máy và Phân cụm Hình ảnh

Nghiên cứu về học máy và phân cụm hình ảnh đã được áp dụng rộng rãi trong nhiều lĩnh vực. Trong y tế, phân tích hình ảnh y khoa giúp phát hiện sớm các bệnh lý. Trong thương mại điện tử, phân cụm hình ảnh giúp cải thiện trải nghiệm người dùng bằng cách gợi ý sản phẩm tương tự. Các ứng dụng này không chỉ nâng cao hiệu quả mà còn tạo ra giá trị thực tiễn cho người dùng.

4.1. Ứng dụng trong Y tế

Trong y tế, phân tích hình ảnh y khoa giúp phát hiện sớm các bệnh lý như ung thư thông qua việc phân tích hình ảnh từ máy chụp X-quang hoặc MRI. Việc áp dụng học máy trong lĩnh vực này đã giúp cải thiện độ chính xác và tốc độ chẩn đoán.

4.2. Ứng dụng trong Thương mại điện tử

Trong thương mại điện tử, phân cụm hình ảnh giúp cải thiện trải nghiệm người dùng bằng cách gợi ý sản phẩm tương tự dựa trên hình ảnh. Điều này không chỉ tăng cường sự hài lòng của khách hàng mà còn thúc đẩy doanh số bán hàng.

V. Kết luận và Tương lai của Nghiên cứu Học máy và Phân cụm Hình ảnh

Nghiên cứu về học máy và phân cụm hình ảnh đang trên đà phát triển mạnh mẽ. Tương lai của lĩnh vực này hứa hẹn sẽ mang lại nhiều đột phá mới, đặc biệt là trong việc cải thiện độ chính xác và hiệu quả của các thuật toán. Việc kết hợp giữa học sâu và các phương pháp phân cụm hiện tại sẽ mở ra nhiều cơ hội mới cho nghiên cứu và ứng dụng thực tiễn.

5.1. Xu hướng phát triển trong Nghiên cứu

Xu hướng phát triển trong nghiên cứu học máy và phân cụm hình ảnh sẽ tập trung vào việc cải thiện các thuật toán hiện tại, đồng thời phát triển các phương pháp mới để xử lý dữ liệu lớn và không đồng nhất.

5.2. Tương lai của Ứng dụng Học máy

Tương lai của ứng dụng học máy trong phân cụm hình ảnh sẽ mở ra nhiều cơ hội mới trong các lĩnh vực như y tế, an ninh và thương mại điện tử. Việc áp dụng các công nghệ mới sẽ giúp nâng cao hiệu quả và độ chính xác trong phân tích hình ảnh.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu mise en place dun apprentissage de metrique pour du clustering semi supervise interactif dimages

Tải đầy đủ

Trích đoạn nội dung tài liệu

UNIVERSITE NATIONALE DU VIETNAM, HANOI INSTITUT FRANCOPHONE INTERNATIONAL VŨ VIẾT MINH MISE EN PLACE D'UN APPRENTISSAGE DE METRIQUE POUR DU CLUSTERING SEMI-SUPERVISE INTERACTIF D'IMAGES THIẾT LẬP MỘT THUẬT TOÁN HỌC TỰ ĐỘNG CÁC CHỈ SỐ PHỤC VỤ CHO PHÂN LOẠI ẢNH TỰ ĐỘNG VÀ TƯƠNG TÁC MEMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE HANOI – 2015 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com UNIVERSITE NATIONALE DU VIETNAM, HANOI INSTITUT FRANCOPHONE INTERNATIONAL VŨ VIẾT MINH MISE EN PLACE D'UN APPRENTISSAGE DE METRIQUE POUR DU CLUSTERING SEMI-SUPERVISE INTERACTIF D'IMAGES THIẾT LẬP MỘT THUẬT TOÁN HỌC TỰ ĐỘNG CÁC CHỈ SỐ PHỤC VỤ CHO PHÂN LOẠI ẢNH TỰ ĐỘNG VÀ TƯƠNG TÁC Spécialité: Systèmes Intelligents Multimédia Code: Programme pilote MEMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE Sous la direction de: Mme Muriel Visani, Maître de Conférences HDR, Laboratoire L3i - Département Informatique, Université de La Rochelle HANOI – 2015 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ATTESTATION SUR L’HONNEUR J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que les données et les résultats qui y sont présentés sont exacts et n’ont jamais été publiés ailleurs. La source des informations citées dans ce mémoire a été bien précisée. LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác.

Các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc. Signature de l’étudiant LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Table des matières Table des gures iii Liste de Tableaux iv 1 Introduction 1 1.1 Problématique et Motivation .2 Objectifs et Principales Contributions. 2 2 Clustering semi-supervisé interactif incrémental 4 2.2 Clustering non-supervisé .1 Diérents types de méthodes .2 Présentation des méthodes de clustering non-supervisé utilisées .3 Clustering semi-supervisé .1 Diérents types de méthodes .2 Présentation de HMRF-KMeans .4 Modèle de clustering semi-supervisé interactif de LAI Hien Phuong .1 Introduction et Motivation .3 Stratégies de déduction des contraintes .4 Méthode de clustering semi-supervisé interactif incrémental. 23 3 Apprentissage de métrique 25 3.2 Distance de Mahalanobis .2 Diérents types d'approches d'apprentissage de métrique .3 Choix d'une méthode d'apprentissage de métrique dans notre contexte.

31 4 Intégration de l'apprentissage de métrique dans le système existant 34 4.2 Présentation de la méthode .2 Implémentation de la méthode. 38 i LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Contents ii 4.2 Analyses des résultats obtenus .4 Discussion et Conclusion. 47 5 Conclusion 50 A Illustration des méthodes de clustering non-supervisé 53 B Mesures de qualité de clustering 55 C Résultat expérimental de l'algorithme MPCKMeans 57 D Résultats détaillés de quelques méthodes d'apprentissage de métrique 58 Bibliographie 62 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Table des gures 2.1 Illustration des méthodes de clustering non-supervisé hiérarchiques 1 .2 Illustration des méthodes basées sur les grilles .3 Comparaison des méthodes de clustering non supervisé .4 L'algorithme BIRCH : Construction de l'arbre CF-Tree .5 L'interface interactive du système de LAI Hien Phuong .6 Les résultats de la méthode de LAI Hien Phuong avec 6 stratégies diérentes 24 3.1 Une vue globale de l'apprentissage de métrique .2 Un exemple de la distance de Mahalanobis .3 Illustration de la méthode LMNN 2 .1 La méthode Baseline .2 MPCKMEANS_GLOBAL_DIAGONAL avec la distance Euclidienne .3 MPCKMEANS_GLOBAL_DIAGONAL avec la distance de Mahalanobis 46 4.4 Comparaison du temps d'exécution de toutes les méthodes .5 Comparaison de la performance .1 Illustration de l'algorithme BIRCH 3 .1 L'algorithme MPCKMeans appliqué sur la base Wang .2 Comparaison avec la méthode Baseline (DistE) .3 Comparaison avec la méthode Baseline (DistE et DistM). 61 iii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Liste de Tableaux 2.1 Résumé des 6 stratégies de déduction de contraintes .1 Les méthodes pour l'expérimentation sur la base Wang .2 Les résultats expérimentaux sur la base Wang (1) .3 Les résultats expérimentaux sur la base Wang (2).

43 iv LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chapitre 1 Introduction Ce stage en recherche d'information multimédia, se place dans la suite de la thèse de LAI Hien Phuong, qui traite de l'analyse d'images par le contenu, et plus précisément du clustering semi-supervisé interactif d'images en vue de l'utilisation d'outils de navigation dans des bases d'images, ou de recherche par exemple. Son travail dans sa thèse est une étude complète sur les méthodes de clustering non-supervisé et semi-supervisé. Elle a proposé une nouvelle méthode de clustering semi-supervisé interactif dans le but de combler le fossé sémantique entre les concepts de haut niveau perçus par l'utilisateur dans la collection d'images, et les signatures de bas niveau extraites à partir des images originales. Dans un contexte interactif incrémental, sa méthode implique l'utilisateur dans la phase de clustering pour qu'il puisse interagir avec le système an d'améliorer les résultats fournis par le modèle de clustering semi-supervisé automatique.

Son système convertit en contraintes entre paires de groupes d'images les informations supervisées fournies par l'utilisateur et procède itérativement au reclustering semi-supervisé en pénalisant ces contraintes. Tout d'abord, son système construit un modèle de clustering non-supervisé hiérarchique grâce à l'algorithme BIRCH pour représenter des images d'entrée dans une structure hiérarchique où les images similaires sont automatiquement regroupées dans des groupes compacts et représentatifs. Ensuite, les résultats de ce modèle de clustering non-supervisé sont présentés de façon visuelle à l'utilisateur pour qu'il puisse donner ses retours via des clics positifs et négatifs sur les images achées ou via le déplacement des images entre des clusters. Beaucoup de stratégies de déduction des contraintes à partir des retours de l'utilisateur sont étudiées et expérimentées.

En tenant compte des contraintes par paires générées par ce moteur de déduction, le système réorganise la structure hiérarchique des données et refait le clustering en bénéciant d'une méthode de 1 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Introduction 2 clustering semi-supervisé. La boucle d'interaction peut être répétée jusqu'à la satisfaction de l'utilisateur.1 Problématique et Motivation Les mesures de la similarité et de la distance entre des observations jouent un rôle impor- tant dans les processus cognitifs humains et les systèmes articiels pour la reconnaissance et la catégorisation. La question de comment mesurer de manière appropriée la distance ou la similarité est cruciale pour la performance de nombreuses méthodes d'apprentis- sage et de fouille de données. La tâche principale dans tous les algorithmes de clustering est de déterminer à quel cluster appartient un point de données, c'est-à-dire que l'on a besoin d'une mesure de similarité / dissimilarité entre des points dans un ensemble de données.

La distance Euclidienne est une mesure de dissimilarité qui est largement utilisée. Mais cette distance géométrique n'est pas toujours parfaite, par exemple dans l'espace de données non-sphériques ou hétérogènes. Lorsque l'on travaille avec des don- nées multidimensionnelles, la distance Euclidienne traite toutes les dimensions de façon égale, mais dans quelques situations, on doit considérer quelques dimensions en priorité, on a donc besoin d'une métrique paramétrable. L'apprentissage de métrique qui uti- lise systématiquement la distance de Mahalanobis est une solution prometteuse.

L'idée principale des algorithmes d'apprentissage de métrique est d'apprendre un ensemble de paramètres qui contrôle une fonction de distance particulière, et le cas échéant de mettre à jour incrémentalement ces paramètres en fonction de nouvelles informations. Cette idée est compatible avec le système interactif incrémental où les nouvelles informations supervisées (sous forme de retours de l'utilisateur) sont fournies dans chaque itération et sont utilisées pour entraîner la métrique pour rendre le résultat du modèle de clustering plus satisfaisant pour l'utilisateur.2 Objectifs et Principales Contributions L'objectif principal du stage est de mettre en place un apprentissage de métrique grâce aux informations données incrémentalement par l'utilisateur, an d'améliorer la per- formance de la phase de clustering. Ce travail de stage a pour principale contribution d'enrichir une méthode existante de clustering semi-supervisé dans un contexte interactif incrémental par des méthodes d'apprentissage de métrique. Les activités réalisées dans ce stage sont les suivantes : (1)Étude de l'état de l'art et du système existant proposé dans le contexte de la thèse de LAI Hien Phuong.

(2) Choix de l'algorithme d'appren- tissage de métrique à mettre en ÷uvre, et de la manière de l'articuler avec le système LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Introduction 3 existant. Après une étude sur les méthodes de clustering non-supervisé, semi-supervisé et semi-supervisé interactif et sur diérentes approches d'apprentissage de métrique, l'al- gorithme MPCKMeans (présenté dans la section 3. (3) L'implémentation d'un prototype permettant d'intégrer l'algorithme d'apprentissage de métrique dans le système existant. L'adaptation de l'algorithme MPCKMeans sur la structure de données hiérarchique qui est disponible dans le système existant est proposée.

Les résultats ex- périmentaux de cet algorithme avec diérentes congurations sont analysés et comparés avec la méthode existante de LAI Hien Phuong. Les autres chapitres dans ce mémoire sont organisés comme suit : Le chapitre 2 présente l'état de l'art des méthodes de clustering non-supervisé, semi-supervisé et la méthode de clustering semi-supervisé interactif récemment proposée par LAI Hien Phuong. Le chapitre 3 présente l'état de l'art des algorithmes d'apprentissage de métrique et le choix d'une méthode adaptée à notre contexte applicatif. Le chapitre 4 présente l'intégration de la méthode d'apprentissage de métrique choisie dans le système existant et les résultats expérimentaux.

Le chapitre 5 termine ce travail par une conclusion. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chapitre 2 Clustering semi-supervisé interactif incrémental 2.1 Introduction L'apprentissage non supervisé consiste à inférer des connaissances sur les données. Car aucune information n'est fournie sur l'appartenance des données à telle ou telle classe, on souhaite trouver des groupes compacts et bien séparés et aecter à chaque observation une étiquette de classe (label). Les techniques de clustering non supervisé qui cherchent à décomposer un ensemble d'individus en plusieurs sous ensembles les plus homogènes possible sont présentées dans la section 2.

Quand on ajoute des informations supervisées incomplètes comme les étiquettes de quelques points ou des relations explicites entre quelques points, on s'oriente vers des méthodes de clustering semi-supervisé (cf. Comme dans la méthode semi-supervisée on a plus de connaissances données, on souhaite améliorer le résultat du clustering non-supervisé. LAI Hien Phuong a proposé un nouveau modèle de clustering semi-supervisé interactif incrémental (cf. Dans son système, les connaissances fournies par l'utilisateur qui interagit avec le système sont utilisées dans les itérations suivantes pour améliorer la performance du modèle.

Le dernier point que l'on doit clarier avant d'étudier les méthodes précisées, c'est le concept de "Incrémental versus non-incrémental" : Une méthode incrémentale va être exécutée de façon continue, et va intégrer les données au fur et à mesure de leur arrivée dans l'algorithme. C'est-à-dire, après chaque itération interactive, si on a des nouvelles données (peut être des informations supplémentaires, ou des retours d'utilisateur, .) elles seront utilisées dans l'itération suivante. À l'inverse, une méthode non-incrémentale va considérer un ensemble de données fournies en entrée, et sera exécutée sur cet ensemble. 4 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Clustering semi-supervisé interactif incrémental 5 Si, par la suite, une nouvelle donnée est fournie, celle-ci devrait être relancée en repartant de zéro.2 Clustering non-supervisé En général, le clustering automatique d'objets se base sur une mesure de similarité (ou distance) pour grouper les données.

Le clustering non supervisé est une analyse multi- dimensionnelle qui vise à partitionner l'ensemble des objets sans besoin d'informations supervisées comme des étiquettes des objets. Une partition ou bien un cluster est une division de l'ensemble en sous-ensembles, telle que chaque objet appartienne à un seul groupe. Les principales méthodes de clustering non supervisé comprennent : 1. Méthodes par partitionnement : Construire K partitions et les corriger jusqu'à obtenir une similarité satisfaisante.

Méthodes hiérarchiques : Créer une décomposition hiérarchique par agglomération ou division de groupes similaires ou dissimilaires. Méthodes basées sur la densité : Grouper les objets tant que la densité de voisinage excède une certaine limite.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Nghiên cứu học máy và phân cụm hình ảnh

Phân cụm hình ảnh tương tác nâng cao

Học khoảng cách trong trí tuệ nhân tạo

Phân tích dữ liệu đa phương tiện