Institut de la francophonie pour l’informatique Rapport de stage de fin d’études Application des méthodes d'intelligence artificielle à l'analyse des données concernant les canalisations de gaz CHU Thanh-Quang Lieu du stage: Gaz de France, Direction de la Recherche, 361 Av. du Pdt Wilson - BP. 33 93211 La Plaine Saint Denis Cedex Période du stage: du 01/03/2006 au 31/08/2006 Tutrice de stage: Marketa PICHLOVA TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation REMERCIEMENTS Je tiens tout d’abord à remercier monsieur Yves MELQUIOND, chef du pôle Statistiques et Intelligence Artificielle à la Direction de la Recherche de Gaz de France, pour m’avoir permis d’effectuer mon stage ici. Je voudrais exprimer mes reconnaissances à Marketa PICHLOVA, mon maître de stage, qui a dirigé mon travail de recherche et qui m'a donné de bons conseils et des aides précieuses tout au long de mon stage de fin d’études.
Je souhaite également remercier chaleureusement toute l’équipe du projet RPCI&IA: Emmanuel CHATEAU, chef de projet, Michel MEYER, expert corrosion et Mures ZAREA. Leur cordialité et leur écoute m’ont permis de m’intégrer rapidement, et de travailler dans une ambiance agréable. Je tiens également à exprimer toute ma sympathie à l’ensemble des collègues du pôle, pour leur accueil et leur attitude ouverte vis-à-vis des stagiaires, que l’ensemble du personnel de l’entreprise soit aussi remercié, pour permettre de faire perdurer cette politique d’ouverture enrichissante. J’adresse mes reconnaissances aux professeurs de l’Institut de la Francophonie pour l’Informatique, pour m’avoir aidé à effectuer ce stage à Gaz de France.
Paris, juillet - 2006 Chu Thanh Quang CHU Thanh-Quang Page 2 sur 82 TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation Résumé Etudiant en deuxième année à l'Institut de la Francophonie pour l'Informatique au Vietnam, je prépare le diplôme de master en informatique. J’ai fait mon stage de fin d’études chez Gaz de France – Direction de la Recherche dans le Pôle Statistiques et Intelligence artificielle. J’ai travaillé pendant 6 mois sur le sujet « Application des méthodes d'intelligence artificielle à l'analyse des données concernant les canalisations de gaz ». L’objectif du stage est de l’explorer des informations intéressantes concernant le problème de corrosion des canalisations de gaz.
Il s’agit d’utiliser différentes méthodes d’Intelligence Artificielle pour analyser une base de données des défauts de revêtements sur les tubes transportant du gaz. Il y a deux parties dans mon travail. La première partie, consistait à étudier la présence de la corrosion sur les défauts de revêtement en utilisant des méthodes qui peuvent faire la prédiction de la corrosion telles que les réseaux de neurones, les arbres de décision, les machines à vecteur support, k-plus proches voisins, etc. Ces méthodes non-explicatives ne sont pas capables d’expliquer les causes de la corrosion.
Et dans la deuxième partie, j’ai utilisé la méthode de réseaux bayésiens pour expliquer les causes de la corrosion sur les canalisations en analysant les relations découvertes entre les variables de la base de données. Abstract In my second year at the Information Technology Institute of the Francophone in Vietnam, I’ve prepared the master program on IT. I have an internship at Gaz de France - Research Direction, in the Pole Statistics and artificial Intelligence. I’ve been working for 6 months on the subject “Applying the artificial intelligence method on the data analysis of the gas pipelines”.
The internship objective is to indicate some interesting information concerning the corrosion problem on the gas pipelines. It is a question of using various Artificial Intelligence methods to analyze a database of the coatings defects on the tubes transporting of gas. There are two parts in my work. The first part, I studied the presence of corrosion on the coatings defects by using the methods, which can predict corrosion problem such as Neural Network, Decision Tree, Support Vector Machine, and K-Nearest Neighbors etc.
However, these methods cannot be good explanations for the corrosion problem. Therefore, in the second part, I use the Bayesian Network method to explain the causes of corrosion on the tubes by analyzing the found relationship among the variables of data. CHU Thanh-Quang Page 3 sur 82 TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation TABLE DES MATIERES 1. PRESENTATION DE L’ENTREPRISE.
Présentation de Gaz de France. Etre leader du GNL en Europe. Gérer des infrastructures. Recherche et Développement.
Présentation de la Direction de la Recherche. Matrice Recherche et Développement. Accueil des stagiaires. CONTEXTE DU STAGE.
Canalisations de transport de gaz et leur protection contre la corrosion. Protection par revêtement externe. Méthodes de détection de la corrosion. Piston instrumenté – inspection de la corrosion par voie interne.
Excavation – inspection directe de la corrosion externe. Mesures de surface. Fiche de constat sur Fouille. Projet PRCI&IA.
Base de données REX (Retour d’Expérience). Objectifs du stage et déroulement des travaux. ETUDES DES METHODES D’INTELLIGENCE ARTIFICIELLE. Réseaux de neurones.
Réseaux de fonction à base radiale. Arbre de décision. 18 CHU Thanh-Quang Page 4 sur 82 TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation 3. Machine à vecteurs supports.
K-plus proches voisins. Classifieurs Naïfs bayésiens. Exemple très simple dans la modélisation des risques. Construction et utilisation des réseaux bayésiens.
Comparaison des méthodes d’intelligence artificielle. Définition du problème d’analyse de données de canalisation. Définir le problème de détection de la corrosion. Essayer la prédiction de l’atteinte au métal.
Essayer la prédiction de la corrosion. Réduire le nombre de variables à analyser. Pré-traitement de données. Problèmes liés aux données.
Taille de données. Incohérence de données. Déséquilibre de données. Gestion des valeurs manquantes.
Rectification des données incohérentes. Réplication des corrosions. Analyse des données par les méthodes de classification. Construction des modèles d’analyse de données.
Echantillonnage de données avec différentes tailles de données. Apprentissage des modèles de classification. Choix des critères de comparaison entre les méthodes. Analyse des résultats.
Influence de la taille d’échantillon sur le taux de classification. Taux de classification de l’ensemble de test et de l’ensemble global. Taux de classification des classes corrosion et non-corrosion. Analyse des données par Réseaux bayésiens.
Discrétisation des variables continues. Discrétisation « égales distances ». Discrétisation « égales fréquences ». Rectification de discrétisation.
Apprentissage sans échantillonnage et comparaison des réseaux différents. 39 CHU Thanh-Quang Page 5 sur 82 TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation 4. Analyse des résultats. Analyse des relations découvertes.
Analyse des causes de la corrosion. Analyse des évidences et des contradictions dans les observations. Exécution des requêtes sur réseaux bayésiens. Echantillonnage de données, calcul de la performance des réseaux bayésiens.
Conclusion sur les réseaux bayésiens. PERSPECTIVES POUR LA POURSUITE DES RECHERCHES. Amélioration des données d’entrées. Intégration des connaissances de l’expert dans le processus d’apprentissage du réseau bayésien.
Simulation temporelle de la corrosion. BILAN DU STAGE. LISTE DES TABLEAUX. LISTE DES FIGURES.
Description de la base de Rex. Incohérences de données dans la base de Rex. Règles d’intégrité de la base de Rex. Sélection des variables pour le problème de classification.
Rapport d’analyse des relations des variables. Discrétisation égales distances. Discrétisation égales fréquences. Discrétisation manuelle rectifiée.
Rapport d’analyse de la variable Corrosion. Discrétisation égales distances. Discrétisation égales fréquences. Discrétisation manuelle rectifiée.
80 CHU Thanh-Quang Page 6 sur 82 TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation 1. PRESENTATION DE L’ENTREPRISE 1. Présentation de Gaz de France Gaz de France est un acteur majeur de l'énergie en Europe. Le Groupe produit, transporte, distribue et commercialise du gaz, de l'électricité et des services auprès de 13,8 millions de clients (particuliers, entreprises, collectivités).
Organisation Le management de Gaz de France repose sur un Comité exécutif et 4 Branches opérationnelles. Quatre fonctions de pilotage sont également rattachées au Président Directeur Général: stratégie, communication, audit et risques et délégation aux cadres dirigeants Groupe. L'organisation opérationnelle du Groupe s'articule aujourd'hui autour d'un Comité exécutif, organe de pilotage du groupe Gaz de France et de 4 Branches opérationnelles: Approvisionnements et Production, Infrastructures, Clientèles, International. Ambition Gaz de France a pour ambition de fournir de l'énergie et des services à ses clients au meilleur prix, de s'imposer comme un gestionnaire d'infrastructures de référence en Europe, d’être un acteur engagé du développement durable et de créer de la valeur pour ses actionnaires.
Activités Le Groupe produit, transporte, distribue et vend du gaz, de l'électricité et des services auprès de 13,8 millions de clients (particuliers, entreprises, collectivités locales) en Europe. Il intervient sur l'ensemble de la chaîne gazière. Acheter Gaz de France est le 4ème acheteur mondial de gaz naturel et dispose du portefeuille d'approvisionnement le plus diversifié en Europe. C'est pourquoi Gaz de France peut garantir à ses clients la fourniture d'une énergie compétitive.
Vendre Gaz de France vend à ses clients du gaz, de l'électricité et des services en France et en Europe. Le Groupe est le 3ème opérateur de services énergétiques en France et le 2ème en Italie. Produire Etre producteur est le fruit d'une politique volontariste de diversification du portefeuille d'approvisionnements du Groupe. Depuis 2005, Gaz de France produit également de l'électricité.
Etre leader du GNL en Europe Gaz de France est le 2ème acteur du gaz naturel liquéfié (GNL), le 2ème opérateur de réception de GNL en Europe et le 5ème importateur mondial. En 2005, le GNL a représenté 26 % des approvisionnements de long terme de Gaz de France. CHU Thanh-Quang Page 7 sur 82 TIEU LUAN MOI download : skknchat@gmail.com Application des méthodes d'intelligence artificielle à l'analyse des données de canalisation 1. Gérer des infrastructures Gaz de France investit significativement sur son réseau en France et renforce ses positions en Europe, pour s'imposer comme un gestionnaire d'infrastructures de référence.
Recherche et Développement La Direction de la recherche de Gaz de France joue un rôle décisif car elle prépare l'avenir du Groupe en anticipant les évolutions et en contribuant à construire des avantages concurrentiels. Les 4 priorités de la Direction de la recherche de Gaz de France sont la sécurité, la performance économique (tant pour Gaz de France que pour ses clients), la construction d'avantages concurrentiels pour les activités commerciales du Groupe et la préparation de l'avenir énergétique dans une perspective de développement durable. Présentation de la Direction de la Recherche La Direction de la Recherche est le Centre de recherche de Gaz de France, modèle choisi d'une R&D intégrée au Groupe, dont la finalité est d'apporter son expertise sur tous les métiers du domaine gazier et de l'énergie, de façon à favoriser le développement du Groupe comme la DR le fait depuis l'origine de Gaz de France. Le centre de recherche est réparti sur 2 sites, tous les 2 dédiés à la recherche appliquée : l'un situé à Saint Denis et l'autre à Alfortville (France).
Des programmes de recherche fondamentale sont également menés en partenariat avec des organismes comme le CNRS, des grandes écoles et des universités, des fondations ou des pôles de compétitivité. Gaz de France joue également un rôle majeur dans la recherche énergétique européenne et figure parmi les leaders mondiaux de la recherche gazière. La Direction de la recherche de Gaz de France a environ de 590 collaborateurs et effectue 40 % des recrutements ingénieurs chez Gaz de France 1. Organisation La Direction de la Recherche est organisée selon une structure matricielle constituée d'un axe «programme de recherche» et d'un axe «compétences».
Les 7 programmes de recherche couvrent l'ensemble de la chaîne gazière : Gaz Naturel Liquéfié (GNL), Transport, Distribution, Clients Industriels, Clients Résidentiels et Tertiaires, Nouveaux Marchés, Etudes Economiques et Générales. Ils incluent les 80 projets de recherche définis par le Contrat de Recherche triennal.