Luận Văn Tốt Nghiệp Ngành Khoa Học Máy Tính của Trương Minh Châu và Lê Đoàn Thiên Nhân

2023

101
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CÁM ƠN

1. CHƯƠNG 1: TỔNG QUAN

1.1. Giới thiệu

1.2. Mô tả đề tài

1.3. Phạm vi và mục tiêu đề tài

1.4. Thách thức của đề tài

1.5. Các đóng góp của đề tài

1.6. Cấu trúc luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Tổng quan về phân tích cú pháp

2.2. Các dạng cú pháp khác

2.3. Ngữ liệu cho bài toán phân tích cú pháp phụ thuộc

2.3.1. Giới thiệu các kho ngữ liệu trên thế giới

2.3.2. Giới thiệu các kho ngữ liệu trong nước

2.4. Các hướng tiếp cận cho bài toán phân tích cú pháp phụ thuộc

2.4.1. Phân tích cú pháp phụ thuộc dựa trên đồ thị (Graph-based)

2.4.1.1. Thuật toán Eisner
2.4.1.2. Thuật toán Chu-Liu Edmons

2.4.2. Phân tích cú pháp phụ thuộc dựa trên bước chuyển (Transition-based)

2.4.2.1. Thuật toán Naive
2.4.2.2. Thuật toán Nirve

2.5. Kỹ thuật phát triển kho ngữ liệu

2.5.1. Các phương pháp phát triển ngữ liệu

2.5.2. Tài liệu hướng dẫn chuyển đổi tự động (Conversion Guidelines)

2.5.3. Tài liệu hướng dẫn gán nhãn thủ công (Annotation Guidelines)

2.5.4. Công cụ chuyển đổi tự động (Converter)

2.5.5. Người gán nhãn (Annotators)

2.5.6. Quy trình gán nhãn (Annotation process)

2.5.7. Chọn ngữ liệu

2.6. Kho cú pháp thành tố VLSP

2.7. Kho cú pháp thành tố NIVTB

2.8. Phương pháp đánh giá kho ngữ liệu cú pháp phụ thuộc

2.8.1. Unlabelled Attachment Score (UAS)

2.8.2. Labelled Attachment Score (LAS)

2.8.3. Đánh giá công cụ

2.8.4. Đánh giá người làm ngữ liệu

3. CHƯƠNG 3: XÂY DỰNG CÔNG CỤ CHUYỂN ĐỔI TỰ ĐỘNG

3.1. Quy trình phát triển ngữ liệu

3.2. Xây dựng bộ luật tìm head

3.2.1. Bộ luật tìm Head

3.2.2. So sánh với bộ luật của VnDT

3.3. Xây dựng bộ luật gán nhãn

3.3.1. Bộ luật gán nhãn

3.4. Công cụ chuyển đổi tự động

3.4.1. Mô tả thuật toán

3.4.2. Rà soát các trường hợp nhập nhằng

3.4.3. Xóa các phần tử rỗng (Null elements)

3.4.4. Độ phức tạp thuật toán

4. CHƯƠNG 4: XÂY DỰNG TÀI LIỆU HƯỚNG DẪN GÁN NHÃN THỦ CÔNG

4.1. Phương pháp xây dựng tài liệu hướng dẫn gán nhãn thủ công

4.2. Thách thức trong việc gán nhãn tự động

4.3. Quy trình gán nhãn thủ công

4.4. Quy tắc gán nhãn

4.4.1. Sơ đồ nhãn

4.4.2. Tân ngữ và Bonet

4.4.3. Giải quyết nhập nhằng

4.4.4. Quy trình đảm bảo chất lượng ngữ liệu

4.5. Huấn luyện người gán nhãn ngữ liệu

5. CHƯƠNG 5: BÀI TOÁN PHÂN TÍCH CÚ PHÁP PHỤ THUỘC TIẾNG VIỆT

5.1. Các phương pháp máy học

5.1.1. Support Vector Machine (SVM)

5.1.2. Ý tưởng chính của SVM

5.1.3. Các dạng SVM

5.2. Các tham số mô hình máy học SVM

5.3. Cài đặt mô hình MaltParser và MSTParser

5.3.1. Mô hình MaltParser

5.3.1.1. Đầu vào của mô hình

5.3.2. Mô hình MSTParser

5.3.2.1. Đầu vào của mô hình

6. CHƯƠNG 6: THỰC NGHIỆM, ĐÁNH GIÁ VÀ PHÂN TÍCH

6.1. Chuẩn bị dữ liệu thực nghiệm

6.1.1. Mô tả dữ liệu thực nghiệm

6.1.2. Phân chia tập dữ liệu

6.2. Các mô hình phân tích cú pháp phụ thuộc

6.3. Đánh giá kết quả thực nghiệm

6.3.1. Đánh giá công cụ chuyển đổi tự động

6.3.2. Đánh giá kho ngữ liệu qua mô hình phân tích cú pháp phụ thuộc

7. CHƯƠNG 7: KẾT LUẬN

7.1. Kết luận

7.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

Khóa luận tốt nghiệp khoa học máy tính xây dựng kho ngữ liệu cho bài toán phân tích cú pháp phụ thuộc tiếng việt

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học máy tính xây dựng kho ngữ liệu cho bài toán phân tích cú pháp phụ thuộc tiếng việt

Tài liệu "Luận Văn Tốt Nghiệp Ngành Khoa Học Máy Tính - Trường Đại Học Quốc Gia TP.HCM" cung cấp cái nhìn sâu sắc về các vấn đề và xu hướng hiện tại trong lĩnh vực khoa học máy tính. Nó không chỉ giúp sinh viên hiểu rõ hơn về các khái niệm cơ bản mà còn mở rộng kiến thức về các ứng dụng thực tiễn của công nghệ thông tin. Đặc biệt, tài liệu này nhấn mạnh tầm quan trọng của việc nghiên cứu và phát triển trong ngành, từ đó khuyến khích người đọc tìm hiểu thêm về các chủ đề liên quan.

Để mở rộng kiến thức của bạn, bạn có thể tham khảo tài liệu Luận văn thạc sĩ khoa học máy tính tìm kiếm và xếp hạng đối tượng trên web. Tài liệu này sẽ giúp bạn hiểu rõ hơn về các phương pháp tìm kiếm và xếp hạng trong môi trường web, một khía cạnh quan trọng trong khoa học máy tính hiện đại. Mỗi liên kết là một cơ hội để bạn khám phá sâu hơn và nâng cao kiến thức của mình trong lĩnh vực này.