Luận án tiến sĩ: Cải tiến phân lớp đa nhãn văn bản và ứng dụng trong công nghệ thông tin

2017

151
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN

1.1. Từ phân lớp đơn nhãn tới phân lớp đa nhãn

1.2. Giới thiệu chung về phân lớp đa nhãn

1.3. Kỹ thuật phân lớp đa nhãn

1.3.1. Tiếp cận chuyển đổi bài toán

1.3.2. Tiếp cận thích nghi thuật toán

1.3.3. Tóm tắt về các thuật toán được giới thiệu

1.4. Dữ liệu đa nhãn

1.4.1. Các độ đo dữ liệu đa nhãn

1.4.2. Phân bố nhãn

1.4.3. Mối quan hệ giữa các nhãn

1.5. Đánh giá phân lớp đa nhãn

1.5.1. Các độ đo dựa trên mẫu

1.5.2. Các độ đo dựa trên nhãn

1.6. Giảm chiều dữ liệu trong phân lớp đa nhãn

1.6.1. Tiếp cận giảm chiều không gian đặc trưng đầu vào

1.6.2. Tiếp cận giảm chiều không gian nhãn đầu ra

1.7. Học bán giám sát cho phân lớp đa nhãn

1.8. Kết luận chương 1

2. CHƯƠNG 2: HAI MÔ HÌNH PHÂN LỚP ĐƠN NHÃN VĂN BẢN TIẾNG VIỆT

2.1. Mô hình nhận diện thực thể có tên dựa trên trường ngẫu nhiên có điều kiện và tiêu chuẩn kỳ vọng tổng quát

2.2. Nhận diện thực thể có tên

2.3. Mô hình đề xuất

2.4. Sử dụng tiêu chuẩn kỳ vọng tổng quát vào mô hình trường ngẫu nhiên có điều kiện CRFs

2.5. Xây dựng tập ràng buộc cho tiêu chuẩn kỳ vọng tổng quát

2.6. Mô hình đề xuất cho bài toán nhận diện thực thể có tên

2.7. Ứng dụng mô hình

2.8. Một mô hình phân lớp đơn nhãn trong hệ tư vấn xã hội

2.9. Sơ bộ về tư vấn xã hội

2.10. Mô hình đề xuất

2.11. Ứng dụng mô hình

2.12. Kết luận chương 2

3. CHƯƠNG 3: PHÂN LỚP ĐA NHÃN VĂN BẢN DỰA TRÊN BIỂU DIỄN DỮ LIỆU THEO CHỦ ĐỀ ẨN

3.1. Phân lớp đa nhãn văn bản dựa trên biểu diễn dữ liệu theo chủ đề ẩn

3.2. Biểu diễn dữ liệu theo chủ đề ẩn

3.3. Mô hình phân lớp đa nhãn văn bản dựa trên biểu diễn dữ liệu theo chủ đề ẩn

3.4. Pha 1 – Huấn luyện mô hình

3.5. Pha 2 – Đánh giá mô hình huấn luyện

3.6. Ứng dụng phân lớp đa nhãn đánh giá khách sạn

3.7. Xây dựng tập dữ liệu thực nghiệm

3.8. Kết quả thực nghiệm

3.9. Phân lớp đa nhãn văn bản dựa trên biểu diễn dữ liệu theo đồ thị khoảng cách các chủ đề ẩn

3.10. Mô hình biểu diễn văn bản theo đồ thị khoảng cách

3.11. Biểu diễn dữ liệu theo đồ thị khoảng cách

3.12. Mô hình đồ thị khoảng cách và mô hình n-gram

3.13. Mô hình phân lớp đa nhãn văn bản dựa trên biểu diễn dữ liệu theo đồ thị khoảng cách chủ đề ẩn

3.14. Pha huấn luyện mô hình

3.15. Pha phân lớp sử dụng mô hình huấn luyện

3.16. Ứng dụng phân lớp đa nhãn đánh giá khách sạn

3.17. Kết luận chương 3

4. CHƯƠNG 4: KỸ THUẬT BÁN GIÁM SÁT PHÂN LỚP ĐA NHÃN VĂN BẢN TIẾNG VIỆT

4.1. Tiếp cận phân cụm bán giám sát

4.2. Tiếp cận dựa trên ràng buộc

4.3. Tiếp cận dựa trên khoảng cách

4.4. Mô hình phân lớp đa nhãn bán giám sát

4.5. Phát biểu bài toán phân lớp đa nhãn bán giám sát

4.6. Thuật toán phân lớp đa nhãn dựa trên kỹ thuật phân cụm bán giám sát

4.7. Thuật toán TESC và LIFT

4.8. Thuật toán phân lớp đa nhãn bán giám sát

4.9. Mô hình phân lớp đa nhãn bán giám sát đề xuất

4.10. Một mô hình ứng dụng phân lớp đa nhãn văn bản bán giám sát

4.11. Mô hình đề xuất

4.12. Huấn luyện mô hình

4.13. Phân lớp sử dụng mô hình huấn luyện

4.14. Ứng dụng phân lớp đa nhãn sử dụng mô hình đề xuất

4.15. Kết luận chương 4

DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN TỚI LUẬN ÁN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Cải tiến phân lớp đa nhãn văn bản

Luận án tập trung vào cải tiến phân lớp đa nhãn văn bản, một lĩnh vực quan trọng trong học máyxử lý ngôn ngữ tự nhiên. Phân lớp đa nhãn cho phép một văn bản được gán nhiều nhãn cùng lúc, phản ánh tính đa dạng và phức tạp của dữ liệu thực tế. Các phương pháp truyền thống như phân lớp đơn nhãn không đủ để xử lý các bài toán này. Luận án đề xuất các kỹ thuật mới để nâng cao hiệu quả của phân lớp đa nhãn, bao gồm việc tối ưu hóa các thuật toán và cải thiện độ chính xác trong việc gán nhãn.

1.1. Phân lớp đa nhãn và thách thức

Phân lớp đa nhãn đối mặt với nhiều thách thức như mối quan hệ giữa các nhãn, chi phí tính toán, và sự mất cân bằng nhãn. Các phương pháp truyền thống như phân lớp nhị phân hoặc phân lớp đơn nhãn không thể giải quyết hiệu quả các vấn đề này. Luận án đề xuất các giải pháp như tiếp cận chuyển đổi bài toántiếp cận thích nghi thuật toán để cải thiện hiệu quả phân lớp.

1.2. Kỹ thuật phân lớp đa nhãn

Các kỹ thuật phân lớp đa nhãn được đề xuất bao gồm phân tích dữ liệuhọc bán giám sát. Các phương pháp này giúp tận dụng dữ liệu chưa được gán nhãn để cải thiện độ chính xác của mô hình. Luận án cũng đề cập đến việc sử dụng trí tuệ nhân tạohọc máy để tự động hóa quá trình phân lớp.

II. Ứng dụng trong công nghệ thông tin

Luận án không chỉ tập trung vào lý thuyết mà còn đề cập đến ứng dụng công nghệ thông tin của các kỹ thuật phân lớp đa nhãn. Các ứng dụng bao gồm phân tích dữ liệu trong các hệ thống thông tin, xử lý ngôn ngữ tự nhiên, và tối ưu hóa nội dung. Các kết quả nghiên cứu có thể được áp dụng trong nhiều lĩnh vực như khai phá dữ liệu, hệ thống tư vấn, và phân loại văn bản tự động.

2.1. Phân tích dữ liệu đa nhãn

Phân tích dữ liệu đa nhãn giúp xử lý các tập dữ liệu phức tạp với nhiều nhãn khác nhau. Luận án đề xuất các phương pháp như giảm chiều dữ liệuphân bố nhãn để cải thiện hiệu quả phân tích. Các kỹ thuật này có thể được áp dụng trong các hệ thống thông tin lớn để tối ưu hóa quá trình xử lý dữ liệu.

2.2. Ứng dụng trong xử lý ngôn ngữ tự nhiên

Xử lý ngôn ngữ tự nhiên là một lĩnh vực quan trọng trong công nghệ thông tin. Luận án đề xuất các kỹ thuật phân lớp đa nhãn để cải thiện độ chính xác trong việc phân loại văn bản và nhận dạng thực thể. Các ứng dụng này có thể được sử dụng trong các hệ thống dịch tự động, tìm kiếm thông tin, và phân tích cảm xúc.

III. Đánh giá và kết quả thực nghiệm

Luận án đưa ra các kết quả thực nghiệm để đánh giá hiệu quả của các phương pháp đề xuất. Các thí nghiệm được thực hiện trên các tập dữ liệu đa nhãn, bao gồm dữ liệu văn bảndữ liệu đa phương tiện. Kết quả cho thấy các phương pháp đề xuất đạt được độ chính xác cao hơn so với các phương pháp truyền thống.

3.1. Độ đo đánh giá

Các độ đo đánh giá được sử dụng bao gồm độ đo dựa trên mẫuđộ đo dựa trên nhãn. Các độ đo này giúp đánh giá toàn diện hiệu quả của các phương pháp phân lớp đa nhãn. Luận án cũng đề xuất các độ đo mới để phản ánh chính xác hơn chất lượng của mô hình.

3.2. Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy các phương pháp đề xuất đạt được độ chính xác cao hơn so với các phương pháp truyền thống. Các kết quả này được minh họa qua các bảng và biểu đồ, giúp người đọc dễ dàng so sánh và đánh giá hiệu quả của các phương pháp.

01/03/2025
Luận án tiến sĩ công nghệ thông tin nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng

Bạn đang xem trước tài liệu:

Luận án tiến sĩ công nghệ thông tin nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng

Tài liệu "Nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng trong công nghệ thông tin" trình bày những phương pháp mới trong việc phân lớp văn bản với nhiều nhãn, giúp nâng cao độ chính xác và hiệu quả trong việc xử lý dữ liệu lớn. Nghiên cứu này không chỉ mang lại cái nhìn sâu sắc về các kỹ thuật hiện đại trong lĩnh vực học máy mà còn mở ra cơ hội ứng dụng trong nhiều lĩnh vực khác nhau của công nghệ thông tin, từ phân tích dữ liệu đến phát triển ứng dụng.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ thông tin, bạn có thể tham khảo tài liệu Luận văn tốt nghiệp ứng dụng công nghệ tin học trong thành lập bản đồ địa chính, nơi nghiên cứu ứng dụng công nghệ trong việc tạo lập bản đồ địa chính. Ngoài ra, tài liệu Luận văn thạc sĩ nghiên cứu ứng dụng IoT vào hệ thống quản lý trạm BTS sẽ giúp bạn hiểu rõ hơn về việc ứng dụng công nghệ IoT trong quản lý hạ tầng viễn thông. Cuối cùng, tài liệu Luận văn thạc sĩ nghiên cứu phối hợp hai phương pháp nén và mã hóa thông tin sẽ cung cấp cái nhìn sâu sắc về các phương pháp tối ưu hóa dữ liệu, rất phù hợp với những ai quan tâm đến việc cải tiến quy trình xử lý thông tin.

Những tài liệu này không chỉ bổ sung kiến thức mà còn mở ra nhiều hướng nghiên cứu và ứng dụng mới trong lĩnh vực công nghệ thông tin.