Luận văn thạc sĩ: Nghiên cứu và thực hiện phân đoạn tài liệu dựa trên học máy

2020

55
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

Remerciements

Résumé

Abstract

Acronymes

1. CHAPITRE 1: PRÉSENTATION DU PROJET

1.1. Structure d’accueil

1.2. Contexte du projet

1.3. Problématique

2. CHAPITRE 2: ÉTAT DE L’ART

2.1. Généralités sur l’apprentissage automatique

2.2. Les réseaux de neurones

2.2.1. Le perceptron multi couches

2.2.2. Réseau de neurones à convolution (CNN)

2.2.3. Les réseaux de neurones récurrents

2.3. Quelques articles connexes pertinents

2.3.1. Article 1 : Document Flow Segmentation for Business Applications

2.3.2. Article 2 : An Approach to the Segmentation of Multi-page Document Flow Using Binary Classification

2.3.3. Article 3 : Page Stream Segmentation with Convolutional Neural Nets Combining Textual and Visual Features

2.3.4. Bilan récapitulatif des articles les plus pertinents étudiés

2.4. Préparation des données

2.4.1. Collecte des données

2.4.2. Labélisation des données

3. CHAPITRE 3: SOLUTION PROPOSÉE

3.1. Vecteurs de caractéristiques de transition

3.2. Prédiction sans logique métier associée

3.3. Prédiction avec logique métier associée

3.4. Evaluation des modèles

4. CHAPITRE 4: EXPÉRIMENTATION ET ANALYSE DES RÉSULTATS

4.1. Pré-traitement des données

4.2. Première phase de réalisation

4.2.1. Vecteurs de caractéristiques de transition

4.2.2. Tests suivant les différents modèles d’extraction de caractéristiques

4.3. Deuxième phase de réalisation

4.3.1. Test sur le corpus global

4.3.2. Prise en compte de la logique métier

4.3.3. Outils et environnement de travail

4.3.4. Difficultés du stage

Luận văn thạc sĩ vnu etude et mise en oeuvre de segmentation documentaire par ma chine learning nghiên cứu và thực hiện phân đoạn tài liệu dựa trên học máy