Luận án tiến sĩ: Hệ thống tổng hợp tin tức thể thao dựa trên web ngữ nghĩa

2019

130
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

DANH MỤC CÁC TỪ VIẾT TẮT

MỤC LỤC

DANH MỤC CÁC HÌNH VẼ

DANH MỤC CÁC BẢNG

MỞ ĐẦU

1. KIẾN THỨC NỀN TẢNG VÀ TIẾP CẬN PHÁT TRIỂN HỆ THỐNG TIN TỨC THỂ THAO DỰA TRÊN WEB NGỮ NGHĨA

1.1. Giới thiệu về Web ngữ nghĩa

1.1.1. Nguồn gốc Web ngữ nghĩa

1.1.2. Khái niệm Web ngữ nghĩa

1.1.3. Kiến trúc Web ngữ nghĩa

1.2. Các lĩnh vực ứng dụng và vai trò của ontology

1.3. Các phương pháp luận phát triển ontology

1.3.1. Phương pháp luận Methontology

1.3.2. Phương pháp luận Uschold và King

1.3.3. Phương pháp luận Grüninger và Fox

1.3.4. Các công cụ phát triển ontology

1.4. Ngôn ngữ biểu diễn ontology và dữ liệu ngữ nghĩa

1.4.1. Các khái niệm và cú pháp trừu tượng của RDF

1.4.2. Sử dụng các URI cho các đối tượng thế giới thực

1.4.3. Phân lớp tường minh các tài nguyên

1.4.4. Tài nguyên URI, nút trắng, và giá trị hằng

1.4.4.1. Các lớp và các thuộc tính
1.4.4.2. Miền áp dụng và phạm vi giá trị của các thuộc tính (Domain and Range of Properties)
1.4.4.3. Hệ thống kiểu (Type System)

1.4.5. Tiên đề và các luật suy diễn kéo theo

1.4.6. Các tính năng của OWL

1.4.7. Những tính năng bổ sung trong OWL Full và OWL-DL

1.5. Tìm kiếm ngữ nghĩa

1.5.1. Các ngôn ngữ truy vấn RDF

1.5.1.1. Truy vấn SELECT…WHERE
1.5.1.2. Truy vấn ASK

1.6. Kho dữ liệu ngữ nghĩa mở

1.7. Một số lĩnh vực ứng dụng Web ngữ nghĩa

1.7.1. Thương mại điện tử

1.7.2. Chăm sóc sức khỏe và khoa học đời sống (HCLS)

1.7.3. Chính phủ điện tử

1.8. Một số nghiên cứu Web ngữ nghĩa tiêu biểu

1.8.1. Kho nội dung Web ngữ nghĩa cho nghiên cứu lâm sàng

1.8.2. Ứng dụng Web ngữ nghĩa trong lĩnh vực nông nghiệp của tổ chức nông-lương thực Liên hiệp quốc (FAO)

1.9. Website và cổng thông tin tin tức có ngữ nghĩa

1.9.1. Cổng thông tin Esperonto

1.10. Ứng dụng Web ngữ nghĩa trong lĩnh vực thể thao

1.11. Tiếp cận Web ngữ nghĩa xây dựng hệ thống tin tức thể thao

1.11.1. Mô hình kiến trúc hệ thống tổng hợp tin tức thể thao

1.11.2. Ontology thể thao

1.11.3. Sinh chú thích ngữ nghĩa

1.11.4. Cổng thông tin ngữ nghĩa

1.11.5. Mô tơ suy diễn và tìm kiếm ngữ nghĩa

1.11.6. Kho dữ liệu ngữ nghĩa

1.12. Kết luận chương

2. SINH CHÚ THÍCH NGỮ NGHĨA CHO TIN TỨC THỂ THAO

2.1. Chú thích ngữ nghĩa cho tài liệu

2.2. Các phương pháp tạo chú thích ngữ nghĩa

2.3. Một số nghiên cứu liên quan

2.4. Một phương pháp sinh chú thích ngữ nghĩa cho tin tức thể thao dựa trên ontology và luật trích chọn

2.4.1. Tổng quan về phương pháp đề xuất

2.4.2. Xây dựng Ontology cho hệ thống

2.4.2.1. Ontology thể thao của hãng BBC
2.4.2.2. Xây dựng Ontology BKSport

2.4.3. Thu thập và tiền xử lý tin tức

2.4.4. Xây dựng cơ sở tri thức thể thao

2.4.5. Nhận dạng, trích rút và xác định lớp ngữ nghĩa cho thực thể có tên

2.4.5.1. Nhận dạng thực thể có tên trong tin tức như là một thể hiện thuộc cơ sở tri thức
2.4.5.2. Phát hiện bí danh của thực thể
2.4.5.3. Nhận dạng các thực thể ở mức khái niệm chi tiết
2.4.5.4. Cải tiến nhận dạng thực thể có tên ở dạng rút gọn
2.4.5.5. Nhận dạng thực thể cùng tên khác kiểu
2.4.5.6. Trích rút “ngữ nghĩa” từ tin tức
2.4.5.6.1. Các ngữ nghĩa bộ ba đơn giản
2.4.5.6.2. Ngữ nghĩa về thực thể quan trọng trong tin tức
2.4.5.6.3. Chú thích ngữ nghĩa về tuyên bố gián tiếp
2.4.5.6.4. Chú thích ngữ nghĩa về tin tức chuyển nhượng
2.4.5.6.4.1. Nhận dạng thực thể có tên trong tin tức
2.4.5.6.4.2. Trích rút ngữ nghĩa từ tin tức thể thao

2.4.6. Đánh giá chung

2.5. Kết luận chương

3. MỘT PHƯƠNG PHÁP TRUY VẤN TIN TỨC THỂ THAO VỚI NGÔN NGỮ TỰ NHIÊN

3.1. Các nghiên cứu liên quan

3.2. Phân loại câu hỏi đầu vào và cấu trúc truy vấn đầu ra

3.2.1. Phân loại câu hỏi

3.2.2. Chú thích và truy vấn ngữ nghĩa về tin tức thể thao

3.3. Phương pháp chuyển đổi câu hỏi ngôn ngữ tự nhiên sang truy vấn SPARQL

3.3.1. Tiền xử lý câu hỏi

3.3.2. Phân tích cú pháp

3.3.3. Biểu diễn ngữ nghĩa cho câu hỏi

3.3.3.1. Mô hình biểu diễn ngữ nghĩa cho câu hỏi
3.3.3.2. Chuyển từ cấu trúc ngữ pháp sang biểu diễn ngữ nghĩa

3.3.4. Sinh câu truy vấn SPARQL trung gian

3.3.4.1. Xác định mệnh đề hỏi
3.3.4.2. Xây dựng mệnh đề điều kiện – Mệnh đề WHERE

3.3.5. Xác định thực thể, khái niệm và vị từ

3.3.5.1. Nhận dạng các lớp
3.3.5.2. Nhận dạng thuộc tính

3.3.6. Sinh truy vấn SPARQL hoàn chỉnh

3.4. Thử nghiệm và đánh giá

3.4.1. Kịch bản thử nghiệm và kết quả

3.4.2. Nhận xét và đánh giá

3.4.2.1. Phân tích cú pháp
3.4.2.2. Nhận dạng quan hệ phụ thuộc bộ ba
3.4.2.3. Nhận dạng khái niệm và vị từ
3.4.2.4. Xử lý nhãn thời gian
3.4.2.5. Một số trường hợp đặc biệt chưa xử lý được

3.5. Kết luận chương

4. GỢI Ý TIN TỨC DỰA TRÊN NGỮ NGHĨA CHO HỆ THỐNG TỔNG HỢP TIN TỨC THỂ THAO

4.1. Nghiên cứu liên quan

4.2. Độ tương đồng giữa các tin

4.2.1. Độ tương đồng về ngữ nghĩa

4.2.1.1. Quan hệ ngữ nghĩa giữa các thực thể
4.2.1.2. Loại thực thể xuất hiện trong tin
4.2.1.3. Các chú thích ngữ nghĩa của tin

4.2.2. Độ tương đồng về nội dung

4.3. Thuật toán gợi ý tin tức với độ tương đồng kết hợp

4.4. Cài đặt thử nghiệm và đánh giá

4.4.1. Kịch bản thử nghiệm

4.4.2. Kết quả thử nghiệm và đánh giá

4.5. Kết luận chương

Các kết quả đạt được của luận án

Hướng phát triển

DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về Web ngữ nghĩa

Web ngữ nghĩa là một khái niệm quan trọng trong việc phát triển công nghệ thông tin hiện đại. Nó không chỉ đơn thuần là một phần mở rộng của Web hiện tại mà còn là một nền tảng cho phép máy tính hiểu và xử lý thông tin một cách thông minh hơn. Hệ thống tin tức thể thao cần phải tận dụng công nghệ này để cải thiện khả năng tìm kiếm và tổng hợp thông tin. Theo đó, công nghệ thông tin sẽ giúp người dùng dễ dàng tiếp cận các tin tức thể thao một cách nhanh chóng và chính xác hơn. Việc áp dụng web ngữ nghĩa vào lĩnh vực thể thao sẽ tạo ra một hệ thống thông tin phong phú, giúp người dùng không chỉ tìm kiếm thông tin mà còn hiểu rõ hơn về ngữ cảnh và ý nghĩa của các tin tức thể thao.

1.1 Nguồn gốc Web ngữ nghĩa

Web ngữ nghĩa ra đời từ nhu cầu cần thiết trong việc cải thiện khả năng tìm kiếm thông tin trên Internet. Với sự gia tăng nhanh chóng của dữ liệu, việc tìm kiếm thông tin chính xác trở nên khó khăn hơn. Công nghệ web truyền thống chỉ cho phép người dùng tìm kiếm dựa trên từ khóa mà không thể hiểu được ngữ nghĩa của thông tin. Do đó, web ngữ nghĩa được phát triển nhằm cung cấp một cách tiếp cận mới, cho phép máy tính hiểu và xử lý thông tin một cách thông minh hơn. Điều này đặc biệt quan trọng trong lĩnh vực thể thao, nơi mà thông tin cần được tổng hợp và phân tích một cách nhanh chóng và chính xác.

II. Các phương pháp luận phát triển ontology

Ontology là một phần không thể thiếu trong việc xây dựng hệ thống tổng hợp tin tức thể thao. Nó giúp định nghĩa các khái niệm và mối quan hệ giữa chúng trong một lĩnh vực cụ thể. Các phương pháp luận như Methontology, Uschold và King, và Grüninger và Fox đã được áp dụng để phát triển ontology cho các hệ thống thông tin. Việc xây dựng ontology cho tin tức thể thao không chỉ giúp tổ chức thông tin mà còn tạo điều kiện cho việc tìm kiếm và truy vấn thông tin một cách hiệu quả hơn. Công nghệ thông tin hiện đại cho phép tích hợp các ontology này vào các hệ thống, giúp cải thiện khả năng truy cập và phân tích dữ liệu.

2.1 Phương pháp luận Methontology

Methontology là một phương pháp luận được sử dụng để phát triển ontology một cách có hệ thống. Nó bao gồm các bước từ việc xác định yêu cầu, thiết kế, triển khai cho đến bảo trì ontology. Trong bối cảnh hệ thống tin tức thể thao, việc áp dụng Methontology giúp đảm bảo rằng các khái niệm và mối quan hệ trong lĩnh vực thể thao được định nghĩa rõ ràng và chính xác. Điều này không chỉ giúp cải thiện khả năng tìm kiếm mà còn nâng cao chất lượng thông tin mà người dùng nhận được. Công nghệ thông tin hiện đại cho phép việc triển khai các ontology này một cách linh hoạt và hiệu quả.

III. Tìm kiếm ngữ nghĩa

Tìm kiếm ngữ nghĩa là một trong những ứng dụng quan trọng của web ngữ nghĩa trong việc phát triển hệ thống tổng hợp tin tức thể thao. Thay vì chỉ dựa vào từ khóa, tìm kiếm ngữ nghĩa cho phép người dùng tìm kiếm thông tin dựa trên ý nghĩa và ngữ cảnh. Điều này giúp cải thiện độ chính xác của kết quả tìm kiếm, giảm thiểu tình trạng thông tin không liên quan. Các ngôn ngữ truy vấn như SPARQL được sử dụng để thực hiện các truy vấn phức tạp, cho phép người dùng truy cập vào các dữ liệu ngữ nghĩa một cách dễ dàng. Việc áp dụng tìm kiếm ngữ nghĩa trong lĩnh vực thể thao sẽ giúp người dùng nhanh chóng tìm thấy các tin tức liên quan đến các sự kiện thể thao, cầu thủ, và đội bóng mà họ quan tâm.

3.1 Các ngôn ngữ truy vấn RDF

RDF (Resource Description Framework) là một ngôn ngữ quan trọng trong việc mô tả dữ liệu ngữ nghĩa. Nó cho phép người dùng định nghĩa các tài nguyên và mối quan hệ giữa chúng một cách rõ ràng. Trong bối cảnh hệ thống tổng hợp tin tức thể thao, việc sử dụng RDF giúp tổ chức thông tin một cách có hệ thống, từ đó cải thiện khả năng tìm kiếm và truy vấn. Các truy vấn RDF có thể được thực hiện thông qua SPARQL, cho phép người dùng truy cập vào các dữ liệu ngữ nghĩa một cách hiệu quả. Điều này không chỉ giúp người dùng tìm kiếm thông tin một cách nhanh chóng mà còn nâng cao trải nghiệm người dùng trong việc tiếp cận các tin tức thể thao.

25/01/2025
Luận án tiến sĩ một tiếp cận xây dựng hệ thống tổng hợp tin tức thể thao dựa trên web ngữ nghĩa

Bạn đang xem trước tài liệu:

Luận án tiến sĩ một tiếp cận xây dựng hệ thống tổng hợp tin tức thể thao dựa trên web ngữ nghĩa

Luận án tiến sĩ mang tiêu đề "Hệ thống tổng hợp tin tức thể thao dựa trên web ngữ nghĩa" của tác giả Nguyễn Quang Minh, dưới sự hướng dẫn của PGS. TS Ngô Hồng Sơn và PGS. TS Cao Tuấn Dũng, được thực hiện tại Trường Đại Học Bách Khoa Hà Nội vào năm 2019. Bài luận án này tập trung vào việc xây dựng một hệ thống tổng hợp tin tức thể thao sử dụng công nghệ web ngữ nghĩa, nhằm cải thiện khả năng truy cập và phân tích thông tin thể thao cho người dùng. Hệ thống này không chỉ giúp người đọc dễ dàng tìm kiếm thông tin mà còn cung cấp những cái nhìn sâu sắc hơn về các sự kiện thể thao, từ đó nâng cao trải nghiệm người dùng.

Để mở rộng thêm kiến thức về lĩnh vực thể thao và các phương pháp quản lý, bạn có thể tham khảo các tài liệu liên quan như "Luận văn thạc sĩ về nghiên cứu thuật ngữ thể thao trong tiếng Hán và phương pháp chuyển dịch sang tiếng Việt", nơi nghiên cứu về thuật ngữ thể thao và cách chuyển dịch, hay "Luận án tiến sĩ về giải pháp nâng cao hiệu quả quản lý vận động viên tại trung tâm đào tạo thể thao Hải Dương", cung cấp những giải pháp quản lý hiệu quả cho vận động viên. Cuối cùng, bạn cũng có thể tìm hiểu thêm về "Đánh giá hoạt động thể dục thể thao dưới tác động của chính sách phát triển", để nắm bắt được ảnh hưởng của chính sách đến hoạt động thể thao. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về các khía cạnh khác nhau trong lĩnh vực thể thao.