I. Tính Cấp Thiết Của Luận Án
Trong kỷ nguyên big-data, việc tìm kiếm thực thể trở thành một nhu cầu thiết yếu. Lượng dữ liệu khổng lồ trên Internet yêu cầu các công nghệ tìm kiếm phải cải tiến để đáp ứng nhu cầu của người dùng. Cơ chế tìm kiếm truyền thống dựa vào từ khóa không thể suy diễn thông tin ẩn. Thực tế, nhiều truy vấn ngắn gọn và mơ hồ, dẫn đến việc cần thiết phải phát triển các phương pháp mới. Theo thống kê, khoảng 71% câu tìm kiếm chứa tên thực thể, cho thấy tầm quan trọng của việc khai thác thông tin từ các thực thể này. Việc nghiên cứu khả năng suy diễn thông tin từ các thực thể có quan hệ ngữ nghĩa ẩn là một trong những mục tiêu chính của luận án này.
1.1. Nhu Cầu Cải Tiến Kỹ Thuật Tìm Kiếm
Nhu cầu tìm kiếm thông tin ngày càng cao, đặc biệt là trong bối cảnh người dùng thường xuyên sử dụng các truy vấn ngắn gọn. Các kỹ thuật tìm kiếm hiện tại không thể đáp ứng được yêu cầu này. Việc phát triển các phương pháp như xử lý ngôn ngữ tự nhiên và học máy là cần thiết để cải thiện khả năng tìm kiếm. Các nghiên cứu hiện tại cho thấy rằng việc khai thác dữ liệu từ các thực thể có thể giúp nâng cao chất lượng kết quả tìm kiếm. Điều này không chỉ giúp người dùng tìm thấy thông tin chính xác hơn mà còn giúp máy tìm kiếm hiểu rõ hơn về ngữ cảnh của truy vấn.
II. Mục Tiêu Của Luận Án
Mục tiêu tổng quát của luận án là nghiên cứu và thực nghiệm các phương pháp nhằm giải quyết hai bài toán chính: tìm kiếm thực thể dựa trên quan hệ ngữ nghĩa ẩn và gợi ý truy vấn theo ngữ cảnh. Việc xây dựng các kỹ thuật mới sẽ giúp cải thiện hiệu quả tìm kiếm và nâng cao chất lượng gợi ý cho người dùng. Các phương pháp sẽ được áp dụng trong các lĩnh vực như khai thác dữ liệu và xử lý ngôn ngữ tự nhiên. Đặc biệt, luận án sẽ tập trung vào việc phát triển các mô hình có khả năng suy diễn thông tin từ các thực thể có quan hệ ngữ nghĩa ẩn.
2.1. Giải Quyết Bài Toán Tìm Kiếm Thực Thể
Bài toán tìm kiếm thực thể dựa trên quan hệ ngữ nghĩa ẩn sẽ được nghiên cứu nhằm mô phỏng khả năng suy diễn thông tin chưa biết. Mô hình tìm kiếm sẽ sử dụng các cặp thực thể để xác định mối quan hệ ngữ nghĩa giữa chúng. Việc áp dụng các phương pháp như mạng nơ-ron và học sâu sẽ giúp cải thiện khả năng tìm kiếm. Mục tiêu là phát triển một hệ thống có thể tự động suy diễn và tìm kiếm thông tin từ các thực thể có liên quan, từ đó nâng cao trải nghiệm người dùng.
III. Đóng Góp Của Luận Án
Luận án này đóng góp vào lĩnh vực tìm kiếm thực thể và gợi ý truy vấn bằng cách phát triển các kỹ thuật mới. Đầu tiên, việc xây dựng kỹ thuật tìm kiếm thực thể dựa trên quan hệ ngữ nghĩa ẩn sẽ giúp nâng cao hiệu quả tìm kiếm. Thứ hai, đề xuất độ đo tương đồng tổ hợp trong bài toán gợi ý truy vấn sẽ cải thiện chất lượng gợi ý. Cuối cùng, ứng dụng các kỹ thuật hướng ngữ cảnh trong miền cơ sở tri thức riêng sẽ mở ra hướng đi mới cho các hệ thống tìm kiếm chuyên sâu.
3.1. Kỹ Thuật Tìm Kiếm Thực Thể
Kỹ thuật tìm kiếm thực thể dựa trên quan hệ ngữ nghĩa ẩn sẽ được phát triển nhằm nâng cao khả năng suy diễn thông tin. Việc áp dụng các phương pháp như phân cụm và khai thác dữ liệu sẽ giúp xác định mối quan hệ giữa các thực thể. Điều này không chỉ giúp cải thiện kết quả tìm kiếm mà còn giúp người dùng dễ dàng tìm thấy thông tin mà họ cần.