Institut de la Francophonie pour l'Informatique TELECOM & Management SudParis MEMOIRE DE STAGE DE FIN D’ETUDES MASTER EN INFORMATIQUE DISTRIBUTION ET ÉVALUATION DE DONNÉES BIOMÉTRIQUES Stagiaire : Thanh-Lam HOANG Encadrant : Aurélien MAYOUE Pierre-Olivier LADOUX Directrice : Bernadette DORIZZI Ce stage a été réalisé au sein de l’équipe InterMedia du département Électronique et Physique (EPH) de TELECOM & Management SudParis Évry, Mars – Octobre, 2009 Page 1 TIEU LUAN MOI download : skknchat@gmail.com Table de manière Remercie Résumé Abstrait Liste de figures Liste de tableaux I. Contexte du stage. Objectif du stage. Plan du document.
Base de données. Problèmes et solutions. Validation de fichiers. Sélection de personnes.
Mis en forme. Évaluation basées sur l'observation. Netteté d'une image. Évaluation de résultat.
Performance du système. Évaluation basée sur le contenu. Qualité de l'iris. Qualité de la signature.
Qualité de l'empreinte. Conclusion et perspective .49 Références Page 2 TIEU LUAN MOI download : skknchat@gmail.com Remerciements Je tiens particulièrement à remercier professeur Betnadette DORIZZI, la directrice de stage, et deux encadrant Aurélien MAYOUE et Pierre-Olivier LADOUX pour les aides, les conseils précieux pendant 8 mois de mon stage. Je tiens également à remercier PHAN Viet Anh, Nesma HOUMANI qui ont travaillé avec moi pendant ce stage, et qui m'ont beaucoup aidé grâce à ses explications, ses conseils utiles et les documents. J’adresse mes sincères remerciements à tous les professeurs de l’Institut de la Francophonie pour l’Informatique (IFI) pour m'avoir enseigné et me donnée les cours intéressants pendant mes études au niveau master.
Je profite de cette occasion pour dire remercier à tous les personnels de l’IFI qui m'ont apporté de l’aide. Finalement, je voudrais remercier ma famille, mes parents et mes amis qui sont toujours près de moi et m'ont apporté de courage dans les moments difficiles. Page 3 TIEU LUAN MOI download : skknchat@gmail.com RESUME La biométrie est un domaine d'authentification et de vérification d'identification utilisant des physiques ou/et des comportements des personnes. Dans le département EPH, nous avons la base de données de biométrie.
Les types des fichiers dans cette base de données sont : des images, des audio-videos, des fichiers texte. de biométrie telle que des visages, des signatures,. Il est nécessaire à distribuer cette base de données. Concrètement, il y a 3 modalités complètes qui sont prêtes à distribuer, c'est l'iris, la signature et l'empreinte.
Après la distribution, un système de références est appliqué pour évaluer des bases de données distribuées pour savoir si ces bases de données sont faciles à reconnaître. Mots-clés : biométrie, évaluation, distribution, base de données, qualité d'image, système de références, iris, visage, empreintes. Page 4 TIEU LUAN MOI download : skknchat@gmail.com ABSTRACT Biometrics is a domain of identity authentication and identity verification using physical and / or behavior of individuals. In the EPH department, we have a database of biometrics.
The files in this database are images, audio, videos, text files. of faces, signatures. It is necessary to distribute this database. Specifically, there are 3 full modalities that are ready to distribute, it is the iris, signature and fingerprint.
After distribution, a reference system is applied to evaluate the distributed database to see if these databases are easy to recognize. Keywords: biometrics, evaluation, distribution, database, image quality, system references, iris, face, fingerprint. Page 5 TIEU LUAN MOI download : skknchat@gmail.com Liste de figures Figure 1.1 : Des capteurs utilisés dans DS2 .2 : Des capteurs utilisés dans DS3 .3 : Exemples des images dans la modalité de visage .4 : Exemples des images dans la modalité d'iris .5 : Exemple d'une image dans la modalité de main .6 : Exemples des images dans la modalité d'empreinte .1 : Le processus global du système de distribution .2 : Image non-lisible .3 : Les exemples des images de la main dans les conditions différentes .6 : Description de l'algorithme 2 à la fin d'une boucle dont r=2 .7 : Distributions des id dans ds2 et ds3 .8 : Structure de répertoire dans ds3 .1 : Image floue et image nette .2 : Schémas du résultat de comparaison .3 : La netteté entre des images contrôlées et non-contrôlées .4 : La netteté entre des images capturées par webcam et par appareil photo Canon .5 : La netteté entre des visages capturés par webcam à l'extérieur et à l'intérieur .6 : La netteté entre des images capturées par appareil photo Canon avec flash et sans flash .7 : Œil et iris .8 : La netteté entre des yeux dans DS2 et dans ICE .36 Page 6 TIEU LUAN MOI download : skknchat@gmail.9 : La netteté entre des iris dans DS2 et dans ICE .1 : Exemple de résultat dans la phase segmentation du système OIRIS .2 : Iris en géométrie ronde et en géométrie rectangulaire .3 : Transformer ligne AB de la région circulaire à la ligne AB du rectangle .4 : Courbe DET sur la base Iris-ds2 .5 : Courbe DET sur la base Signature-DS2 .6 : Courbe DET sur la base Signature-DS3 .7 : Les types de minuties .46 Page 7 TIEU LUAN MOI download : skknchat@gmail.com Liste de tableaux Table 1.1 : Les distributions demandées .2 : Les distributions actuelles .3 : Les valeurs possibles pour chaque partie dans le nom de fichiers .1 : 25 caractéristiques dynamiques extraites d'un point de la signature .2 : Comparaison les bases ds2, ds3 et les bases de références dans la modalité Signature.3 : Résultats des protocoles dans la modalité Empreinte .4 : Comparaison ds2, ds3 avec MYCT dans la modalité Empreinte .1 : Les bases distribuées .2 : Bases distribuées avec des systèmes utilisés pour l'évaluation.49 Page 8 TIEU LUAN MOI download : skknchat@gmail. Contexte du stage L'authentification et la vérification d'identification sont appliquées dans beaucoup d'établissements tels que le gouvernement, l'entreprise, l'université,.
On peut montrer ici des exemples actuels. À TELEMECOM & Management SudParis, chaque personne utilise son propre badge d'entrée pour payer ses repas à la cantine. C'est une application d'authentification d'identification. Ou bien, dans un laboratoire, on équipe un système de sécurité basant sur l'empreinte.
Si quelqu'un veut accéder au laboratoire, son empreinte doit être validée. C'est un exemple d'une application de vérification d'identification. Actuellement, il y a des méthodes différentes pour l'authentification et la vérification d'identification : - Les méthodes basées sur ce qu'on possède : badge, carte d'identité, passeport. - Les méthodes basées sur ce qu'on connait : mots de passe, code secret,.
- Les méthodes basées sur ce qu'on est disponible : iris, main, voix, signature. La Biométrie est une méthode qui se base sur des caractéristiques physiques ou/et comportementales de l'homme telles que la main, l'iris, la marche, la signature,. Au département EPH de l'université TELECOM & Management SudParis, un projet dans le domaine de la biométrie est en cours de développement, c'est le projet InterMedia (http://biosecure. Mon stage fait une partie de ce projet.
Actuellement, le projet utilise la base de données BioSecure. Les détails de cette base sont présentés dans la partie II. Brièvement, c'est une base des données des européennes réalisée par 11 universités. Elle est grande et comprend beaucoup d'erreurs.
Il est nécessaire d'avoir une base de données sans erreur pour expérimentation ou application. Donc, il vaut mieux générer une base sans erreur à partir de la base BioSecure. De plus, afin de mieux utiliser, la base générée doit satisfaire quelques critères selon le projet. Objectif du stage Dans le stage, je suis en charge deux parties : distribuer la base de données BioSecure et appliquer des systèmes proposés par l'équipe pour évaluer les bases distribuées.
Page 9 TIEU LUAN MOI download : skknchat@gmail.com Concernant le terme « distribution » dans le cadre de mon stage, il est considéré comme une action de repartir des données des personnes dans la base BioSecure selon des critères définies pour générer une nouvelle base de données. Après la distribution, les nouvelles bases de données sont complètes et elles sont prêtes à donner aux autres départements ou aux personnes pour utiliser. Dans l'équipe, je charge complètement la création des bases de données complètes. Pour avoir une nouvelle base de données, je devrai remplir les actions suivantes : − Mettre en place d'un algorithme qui détecte automatiquement si les données originales ont des erreurs; − Sélectionner des données de façon adéquate (même nombre d'hommes et de femmes, même nombre de données par site d'acquisition) pour créer les bases BioSecure à distribuer; − Renommer les données originales sélectionnées suivant le format proposé.
En effet, pour donner les bases de données complètes aux récepteurs, il faut donner le résultat de l'évaluation et le protocole utilisé. Cela permet aux récepteurs de tester leurs systèmes en utilisant ces bases de données. Concernant le terme « évaluation » et « protocole », quand on a une base de données complète, on retire quelques données à partir de cette base de façon régulière. La façon de retrait des données est dit « protocole ».
L'évaluation est le fait de tester si une base de données est facile à reconnaître (en utilisant les données retirés par un protocole là) et la comparaison entre son résultat de reconnaissance avec le résultat de reconnaissance des autres bases de données (bases de références). Des outils pour l'évaluation sont disponibles et sont proposés par l'équipe (il ne faut pas rechercher ou développer), ce sont des systèmes de reconnaissance : OSIRIS [8] pour l'iris, NIST [3],[7] pour l'empreinte et signature_GET_INT [6] pour la signature. Le rôle de mon stage dans cette partie est de suivre un protocole prédéfini pour retirer des données. Ces données sont les entrées des systèmes de reconnaissance abordés.
Après, j'utilise ces systèmes pour extraire les scores des bases de données distribuées. Ensuite, c'est une comparaison de résultat avec des bases de références. Les bases de références sont ICE pour l'iris, MYCT-100 pour l'empreinte et MYCT-100, MYCT-300, BIOMET pour la signature. Le protocole et mon résultat de l'évaluation sont nécessaires dans le travail de donner les bases de données complètes aux récepteurs.
Concernant la comparaison, on applique la valeur EER (Equal Error Rate) de la courbe DET (Detection Error Trade-off). Page 10 TIEU LUAN MOI download : skknchat@gmail.1 : Courbe DET [9] Cette courbe présente la corrélation entre FRR (False Rejection Rate) et FAR (False Acceptance Rate) dans un système de reconnaissance. FRR, c'est la possibilité qu'on refuse incorrectement un client. FAR, c'est la possibilité qu'on accepte un imposteur.
Si FRR est grand, le système refuse incorrectement beaucoup de clients. Ça veut aussi dire que la possibilité d'acceptation d'imposteur du système est très petite. Le système de reconnaissance a donc une trop forte sécurité. Si FAR est grand, beaucoup d'imposteurs sont validés.
Le système a donc une sécurité mauvaise. C'est mieux si tous les deux FAR et FRR sont petits. C'est impossible et une valeur de compromis est extraite pour les deux. C'est la valeur EER.
Pour la courbe DET, deux scores sont nécessaires, ce sont les scores de client et les scores d'imposteur. Les scores de client sont extraits à partir de la comparaison entre des données du même client. Par contre, les scores d'imposteur sont extraits à partir de la comparaison entre les données d'un imposteur avec les données d'un client. Pour l'évaluation des données en effet, j'utilise non seulement des systèmes de références disponibles mais encore un système de moi-même, le système de netteté.
Ce système ne fonctionne que sur des bases d'images. Il s'agit à mesurer les scores de netteté des images. Grâce à ces scores, on peut savoir si des images dans la base A sont plus nettes que celles dans la base B. Page 11 TIEU LUAN MOI download : skknchat@gmail.
Plan du document Ce rapport se compose de quatre parties suivantes : – Introduction : dans cette partie, vous pouvez trouver le contexte du stage, l'objectif du stage et mes travaux dans l'équipe. J'aborde aussi quelques définitions globales telles que la distribution, le protocole, l'évaluation.