Institut de la Francophonie pour l’Informatique Ecole Nationale Supérieure des Télécommunications de Bretagne Bâtiment D, ruelle 42, Ta Quang Buu Département Logiques des Usages, Hanoï, Vietnam Sciences Sociales et Sciences de l’Information Technopôle de Brest-Iroise, CS 83818, 29238 Brest CEDEX Rapport de stage DEPA LA COMPOSITION SEMANTIQUE DANS LES DOCUMENTS VIRTUELS ADAPTATIFS APPLIQUEE AU PROJET KMP Etudiante : NGUYEN Thi Ngoc Tu – Promotion 8 Responsable de stage : Segre GARLATTI Brest – Août 2004 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Remerciements Je tiens, tout d’abord, à remercier M. Serge Garlatti, mon maı̂tre de stage, pour m’avoir accepté à ce stage et fait en sorte qu’il se passe dans les meilleures conditions et pour ses conseils sur les directions à suivre tout au long du stage en portant une grande attention à l’ensemble de mes réalisations. Je remercie tout particulièrement M. Sébastien Iksal, M.
Sébas- tien Bigaret pour les connaissances qu’ils m’ont apportées. Merci également à tous les stagiaires au sein de département LUSSI pour le très bon accueil qu’ils m’ont réservé. J’adresse mes sincères remerciements aux professeurs de l’IFI pour leur soutiens pen- dant mes études de DEPA et mes camarades pour les bons moments passés avec eux. Je n’oublie pas de remercier tous les personnels de l’IFI qui m’apportent de l’aide.
Finallement, je ne remercierai jamais assez mes parents, mon grand frère et mon petit ami. Ils sont toujours près de moi dans les moments difficiles. ii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Résumé L’objectif du projet de KMP (Knowlegde Management Portal) est de construire un service web de compétences qui permet de faciliter le partage des compétences au sein d’une communauté - la vallée de télécommunication (Telecom Valley) - qui recueille des entreprises, des institutionnels et des organismes académiques intéressés par le domaine de télécommunications. Ainsi, pour modéliser le savoir-faire des entreprises et pour assurer la réutilisation et le partage des ressources, il est nécessaire de développer un environnement de type hypermédia adaptatifs fondé sur les documents virtuels et le web sémantique.
Ce mémoire de stage présente principalement – la réutilisation et la mise en oeuvre des ontologies pour décrire et chercher des compétences – la construction d’un moteur de composition sémantique pour analyser et rassem- bler des données liées aux compétences des organismes fondés sur l’environnement SCARCE (SemantiC & Adaptive Retrieval and Composition Engine). iii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Abstract The goal of KMP (Knowlegde Management Portal) project is to design a web site facilitating the sharing of competences within a community - the Telecom Valley - which gathers firms, local institutions, and academic organizations working in the telecommu- nications domain. Thus, for modeling the know-how of the organisations and re-using, collecting of the resources, it is necessary to develop an adaptive environment hypermédia based on the virtual documents and the semantic Web. This study focuses on – reuse and building of ontologies for describing and seeking on competences, – construction of a semantic engine for collecting and analyzing data related to the competences of the organizations based on the environment SCARCE (SemantiC & Adaptive Retrieval and Composition Engine).
iv LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Table des matières Remerciement ii Résumé iii Abstract iv Table des matières v Table des figures vii 1 Introduction 1 2 Survol des méthodes existantes 4 2.1 Représentation de connaissances pour le Web sémantique .2 Adaptation/personnalisation pour le Web sémantique .1 Les documents virtuels adaptatifs .2 Les hypermédias adaptatifs. 9 3 Solution pour le projet KMP 14 3.1 Une approche fondée sur quatre types d’ontologies : moteur de composition SCARCE .1 Représentation de connaissances .2 Composition et adaptation dans moteur de composition de SCARCE 16 3.2 Les problèmes liées au projet KMP et la partie de mon travail. 19 4 Mise en oeuvre du projet KMP 21 4.1 Réorganisation de 4 types d’ontologies pour KMP .1 Les ontologies particulières de KMP et les modifications .2 Réorganisation de quatre types d’ontologies au sein du prototype SCARCE .3 Mise en oeuvre d’ontologies en F-logic .2 Développement du moteur de composition sémantique pour KMP .1 Description du code source SCARCE - partie sémantique .2 Re-engineering de code source SCARCE - partie sémantique .3 Mise en oeuvre de moteur de composition sémantique pour KMP .3 Analyse des résultats. 33 5 Conclusion 40 v LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Bibliographie 41 Annexes 41 vi LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Table des figures 2.1 Représentation des connaissances à partir des ressources existantes .2 Un example d’ontologies .3 Instances avec attribut ”aCapitale” .4 Processus de composition d’un document virtuel .5 Une technique de présentation adaptative .6 Une technique de navigation adaptative .7 Stratégie d’adaptation : Guidage direct .8 Stratégie d’adaptation : Tri .1 4 types d’ontologies de SCARCE .2 Présentation d’une page Web .3 Architecture de moteur de composition SCARCE .1 Ontologies de KMP .2 Ontologies des réseaux .3 Ontologies des compétences .4 Ontologies des échanges de valeurs .5 Nouvels ontologies des KMP .6 Modélisation des connaissances en F-logic .7 Des ressources modéliés en F-logic .8 Les paquets pour le moteur de composition sémantique SCARCE .9 Nouvelle structure de paquets de services sémantiques .10 Nouvelle structure des paquets SCARCE .11 Le code source KMP .12 La fonction ”récupérer les informations d’une organisme” .13 Page d’entrée du site KMP .14 Page d’accueil du site .15 La navigation dans la Chaine de Valeur .16 Représentation des entreprises sur une segment .18 Listes des entreprises de recherche .19 Les informations d’entreprise .20 Liste de compétences d’une entreprise .21 Les informations de compétences.
39 vii LUAN VAN CHAT LUONG download : add luanvanchat@agmail. INTRODUCTION Chapitre 1 Introduction De nos jours, Internet fait une intrusion remarquable dans la vie quotidienne. Les besoins en recherche d’informations sont de plus en plus importants et les ressources sur Internet s’accroissent. Ainsi, il est important de trouver une meilleure solution pour la recherche d’information sur Internet.
D’ailleurs, les informations fournies sur Internet sont présentées de la même manière pour tous les utilisateurs même s’ils ne sont pas intéressés par les mêmes informations. Alors, en plus du problème des ressources, il faut trouver une solution pour fournir les informations adaptées aux besoins de l’utilisateur. Les situations proposées permettent donc aux utilisateurs d’Internet d’accéder à l’in- formation pertinente, de naviguer dans un grand espace d’information sur Internet. Le Web sémantique et les méthodes d’adaptation/personnalisation permettent de résoudre ces problèmes.
Telecom Valley1 est une association professionnelle qui, avec environ 70 membres re- présentant plus de 10.000 emplois, supporte activement le développement d’un pôle de compétences unique, à vocation internationale, dans les domaines des Télécommunications et des Technologies de l’Information. Afin de capturer le renseignement des compétences des membres de Telecom Valley, il s’agit de créer une plate-forme permettant de carto- graphier les compétences dans le domaine des télécommunications existantes au sein de l’association et de favoriser ainsi les partenariats entre entreprises, puis entre entreprises et laboratoires de recherche. Ainsi, les problèmes liées au plate-forme sont – de capturer les connaissances explicites d’une organisation pour en faciliter l’accès, le partage et la réutilisation, – d’améliorer le partage des connaissances et le travail coopératif au sein de l’organi- sation, – d’améliorer les relations avec le monde externe (en particulier, les clients ou les partenaires), – de préserver les connaissances passées de l’entreprise pour les réutiliser et améliorer la qualité des projets. Alors, KMP (Knowledge Management Portal) est un projet de la Telecom Valley qui 1 Telecom Valley est une association loi 1901 fondée en 1991 par 7 majors des télécommunications présents à et autour de Sophia Antipolis : Aérospatiale (Alcatel Space), AT&T Paradyne, Digital (Compaq puis HP), ETSI (Institut Européen de Normes des Télécommunications), France Telecom, IBM, Texas Instruments.
Telecom Valley rassemble aujourd’hui plus de 70 membres industriels et institutionnels NGUYEN Thi Ngoc Tu 1 Mémoire de fin d’études LUAN VAN CHAT LUONG download : add luanvanchat@agmail. INTRODUCTION se propose les mécanismes de partage de connaissances au sein de la communauté Telecom Valley et de les renforcer par un usage des technologies multimédia. Une tendance actuelle est de créer des applications web du genre portails et services fondées sur des ontologies. Le projet KMP repose sur les travaux réalisés dans le cadre de 5 Sous-Projets : 1.
Construction d’ontologies pour la représentation des compétences 2. Cartographie des compétences 3. Réalisation informatique d’un service web de compétences 4. Evaluation du service web sur la dynamique communautaire 5.
Evaluation du service web sur la création de valeur et la dynamique des connais- sances au sein d’une communauté de pratique Notre travail repose sur le sous-projet 3 : développement un service web de compé- tences. Objectifs du stage Le stage a pour but de mettre en place un service web de compétence interactif pour modéliser le savoir-faire des membres de la Telecom Valley et pour assurer la réutilisation et le partage des ressources entre eux. Fondé sur le premier prototype du KMP, les processus d’identification, de description des fonctionnalités importantes pour les utilisateurs, et de spécification et de conception des interfaces sont auparavant réalisés. Notre travail est de gérer, d’identifier, de composer, de sélectionner les données liées aux compétences et d’adapter aux besoins de l’utilisateur.
Le prototype développé sera fondé sur l’environnement SCARCE 2. C’est un environne- ment de type hypermédia adaptatif fondé sur les documents virtuels et le web sémantique. Contribution personnelle du stagiaire Nous sommes trois stagiaires de l’IFI, M. Bui Huy Duc, M.
Dinh Van Hoan et moi- même, qui travaillent en équipe sur le projet KMP. Pendant la durée du stage, nous travaillons ensemble, discutons et résolvons les problèmes liées au projet pour mieux le comprendre. Et puis, nous divisons ce projet en trois parties et chacun est responsable d’une partie dans le projet. Dans le cadre de mon stage, je suis responsable de la réutilisation et de la mise en oeuvre des ontologies pour décrire et chercher les compétences et de l’étude et du dévelop- pement d’un moteur de composition sémantique pour analyser et rassembler des données liées aux compétences des organismes basés sur l’environnement SCARCE.
Le travail de M. Duc est l’étude et le développement de moteur de composition logique pour récupérer les gabarits de page au format XML que définit l’organisation de la page locale. Le travail de M. Hoan est l’étude et le développement de modèle de document basé sur l’environnement SCARCE.
2 SemantiC & Adaptive Retrieval and Composition Engine. NGUYEN Thi Ngoc Tu 2 Mémoire de fin d’études LUAN VAN CHAT LUONG download : add luanvanchat@agmail. INTRODUCTION Environnement de stage Ce stage est effectué au sein du département LUSSI (Logiques des Usages, Sciences So- ciales et Sciences de l’Information) à l’Ecole Nationale Supérieur des Télécommunications (ENST) de Bretagne, situé à Brest pour la période du 1er avril au 31 août 2004. L’ENST Bretagne offre un large programme de formations (Ingénieurs, Mastères, MSc, DEA, Thèses, Formation Continue) dans les domaines liés aux technologies de l’informa- tion.
Elle est également un des acteurs principaux de la recherche dans le domaine et travaille en partenariat avec les plus grandes entreprises du secteur privé ou public. Le département LUSSI a été formé par les deux département IASC (Intelligence Ar- tificielle et Sciences Cognitives) et département ECO (Économie et Sciences Humaines) depuis le mois d’avril 2004. Les activités du département LUSSI s’appuient sur des re- cherches en sciences cognitives, en algorithmique, en modélisation mathématique et in- formatique autour du thème ”Modélisation des systèmes anthropocentrés” dans lesquels l’homme, plus qu’un simple utilisateur, est vraiment au centre du système. L’adresse du site Web de LUSSI est http ://www-iasc.fr/ Organisation du mémoire Ce mémoire est composé de 5 chapitres : – La première partie aborde les problématiques, les objectifs généraux du travail et puis, elle présente également le lieu d’accueil où s’est déroulé notre travail et la contribution personnelle de mon travail dans l’équipe de trois personnes.
– La deuxième partie passe en revue les méthodes existantes que nous allons dévelop- per pour le projet KMP.