Nghiên cứu về Tóm tắt Tự động và Tương đồng giữa các Câu

Trường đại học

Université de Bretagne-Sud

Chuyên ngành

Informatique

Người đăng

Ẩn danh

Thể loại

thesis

2016

111
1
0

Phí lưu trữ

30 Point

Mục lục chi tiết

RÉSUMÉ

REMERCIEMENTS

TABLE DES MATIÈRES

1. CHAPITRE 1: INTRODUCTION

2. CHAPITRE 2: REPRÉSENTATION SÉMANTIQUE D’UN TERME

2.1. Quelques approches de la sémantique lexicale

2.1.1. Modèles graphiques

2.1.2. Modèles d’espaces vectoriels et modèles neuronaux

2.1.3. Modèles géométriques

2.1.4. Modèles logico-algébriques

2.2. Les espaces vectoriels sémantiques

2.2.1. Différentes représentations sémantiques

2.2.1.1. Matrice terme-document et similarité entre documents
2.2.1.2. Matrice mot-contexte et similarité entre mots
2.2.1.3. Matrice paire-patron et similarité relationnelle
2.2.1.4. Autres représentations

2.2.2. VSM et types de similarité

2.2.3. Traitements mathématiques des VSM

2.2.3.1. Construction de la matrice des fréquences brutes
2.2.3.2. Pondération des fréquences brutes
2.2.3.3. Lissage de la matrice
2.2.3.4. Comparaison des vecteurs
2.2.3.5. Algorithmes aléatoires

2.4. Notre approche pour la représentation des mots

2.4.1. Wikipédia comme ressource linguistique
2.4.2. Random Indexing pondéré

3. ESPACE SÉMANTIQUE ET SÉLECTION AUTOMATIQUE DES ARTICLES WIKIPÉDIA

3.2. Construction du Web crawler

3.3. Calcul de la relation entre concepts Wikipédia

4. CALCULS DE SIMILARITÉ ENTRE PHRASES

4.2. Similarité par définition d’un vecteur sémantique de phrase

4.2.1. Expérimentations concernant les groupes de deux termes et modification des pondérations

4.2.1.1. Introduction du paramètre α
4.2.1.2. Introduction de deux paramètres : α et
4.2.1.3. Similarité par optimisation des similarités entre termes

5. WIKIRI ET SIMILARITÉ ENTRE PHRASES : ÉVALUATIONS

5.1. Évaluations du calcul de similarités entre phrases : langue anglaise

5.1.1. Les corpus SemEval

5.1.2. Étude des paramètres α et (WikiRI1)

5.1.2.1. Introduction du paramètre

5.1.3. Résultats obtenus par les différentes versions de WikiRI sur les corpus de SemEval 2014

5.2. Évaluations du calcul de similarités entre phrases : langue française

5.2.1. Les corpus d’évaluation

5.2.2. Résultats obtenus par les différentes versions de WikiRI sur les corpus de langue française

5.2.2.1. WikiRI sur sélection d’articles
5.2.2.2. Comparaison entre WikiRI1 et WikiRI2

6. APPLICATION DE WIKIRI À UNE TÂCHE DE RÉSUMÉ MULTI-DOCUMENTS

6.1. Principes généraux

6.2. Description de l’algorithme DivRank

6.3. Expérimentations en langue française

6.3.1. Le corpus de tests

6.3.2. Les résultats

6.4. Expérimentations en langue anglaise

6.4.1. Les données de test

6.4.2. Les résultats de WikiRI1

7. BILAN ET PERSPECTIVES

7.1. Objectifs initiaux et déroulement des travaux

7.3. Pistes d’amélioration et perspectives

A LISTE DES PUBLICATIONS

BIBLIOGRAPHIE

TABLE DES FIGURES

LISTE DES TABLEAUX

Indexation al´eatoire et similarit´e inter phrases appliqu´ees au r´esum´e automatique

Tài liệu "Nghiên cứu về Tóm tắt Tự động và Tương đồng giữa các Câu trong Xử lý Ngôn ngữ Tự nhiên" cung cấp cái nhìn sâu sắc về các phương pháp tóm tắt tự động và cách đánh giá sự tương đồng giữa các câu trong lĩnh vực xử lý ngôn ngữ tự nhiên. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về các kỹ thuật hiện đại trong việc xử lý ngôn ngữ mà còn chỉ ra những ứng dụng thực tiễn của chúng trong việc cải thiện hiệu suất của các hệ thống thông tin.

Để mở rộng kiến thức của bạn về chủ đề này, bạn có thể tham khảo thêm tài liệu Luận văn thạc sĩ khoa học máy tính application of large language model in texttosql, nơi khám phá ứng dụng của mô hình ngôn ngữ lớn trong việc chuyển đổi văn bản thành SQL. Bên cạnh đó, tài liệu Luận văn thạc sĩ khoa học máy tính xây dựng và đánh giá hiệu suất chương trình phân tích cảm xúc tiếng việt kết hợp khía cạnh bằng vietnamese treebank cũng sẽ giúp bạn hiểu rõ hơn về phân tích cảm xúc trong ngôn ngữ tiếng Việt. Cuối cùng, tài liệu Luận án đánh giá mức độ giống nhau của văn bản tiếng việt sẽ cung cấp thêm thông tin về cách đánh giá sự tương đồng giữa các văn bản, một khía cạnh quan trọng trong nghiên cứu này. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về các khía cạnh khác nhau của xử lý ngôn ngữ tự nhiên.