Luận án tiến sĩ: Nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng ontology và ứng dụng trong hệ thống tra cứu văn bản mẫu bệnh

Trường đại học

Học viện Kỹ thuật Quân sự

Người đăng

Ẩn danh

Thể loại

luận án

2020

115
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Tìm kiếm ngữ nghĩa và ontology

Nghiên cứu về tìm kiếm ngữ nghĩa với sự hỗ trợ của ontology đã trở thành một lĩnh vực quan trọng trong công nghệ thông tin. Ontology cung cấp một cấu trúc có tổ chức cho tri thức, cho phép hệ thống hiểu và xử lý thông tin một cách chính xác hơn. Việc áp dụng ontology trong hệ thống tra cứu giúp cải thiện khả năng tìm kiếm thông tin, đặc biệt trong các lĩnh vực như y tế, nơi mà thông tin có thể rất phức tạp và đa dạng. Theo nghiên cứu, việc sử dụng ontology không chỉ giúp tăng cường độ chính xác của kết quả tìm kiếm mà còn hỗ trợ người dùng trong việc xác định các truy vấn một cách hiệu quả hơn. Một trong những điểm mạnh của ontology là khả năng mô hình hóa các mối quan hệ giữa các thực thể, từ đó giúp hệ thống có thể hiểu được ngữ nghĩa của các từ khóa mà người dùng nhập vào. Điều này đặc biệt quan trọng trong việc tìm kiếm thông tin bệnh, nơi mà người dùng thường không thể diễn đạt chính xác triệu chứng hoặc bệnh lý mà họ đang quan tâm.

1.1. Khái niệm về ontology

Ontology là một khái niệm trong tri thức học, được sử dụng để mô tả các thực thể và mối quan hệ giữa chúng trong một lĩnh vực cụ thể. Trong bối cảnh tìm kiếm ngữ nghĩa, ontology giúp định nghĩa các khái niệm và mối quan hệ giữa chúng, từ đó tạo ra một cơ sở tri thức phong phú cho hệ thống. Việc xây dựng ontology cho lĩnh vực y tế không chỉ giúp tổ chức thông tin một cách có hệ thống mà còn tạo điều kiện cho việc khai thác và sử dụng thông tin một cách hiệu quả. Các ngôn ngữ như OWL (Web Ontology Language) thường được sử dụng để xây dựng ontology, cho phép mô hình hóa các khái niệm phức tạp và mối quan hệ giữa chúng. Điều này giúp hệ thống có thể hiểu được ngữ nghĩa của các từ khóa và cung cấp kết quả tìm kiếm chính xác hơn cho người dùng.

II. Phương pháp tìm kiếm ngữ nghĩa

Phương pháp tìm kiếm ngữ nghĩa dựa trên nội dung văn bản đã được nghiên cứu và phát triển để cải thiện khả năng tìm kiếm thông tin. Một trong những phương pháp chính là trích rút các bộ ba (triple) từ văn bản, cho phép hệ thống xác định các thực thể và mối quan hệ giữa chúng. Việc trích rút này không chỉ giúp tổ chức thông tin mà còn tạo ra các chỉ số để đánh giá độ chính xác của kết quả tìm kiếm. Hệ thống có thể sử dụng các thuật toán như Apriori để khai thác các luật kết hợp giữa các triệu chứng và bệnh lý, từ đó gợi ý cho người dùng các triệu chứng liên quan. Điều này không chỉ giúp người dùng dễ dàng tìm kiếm thông tin mà còn hỗ trợ họ trong việc xác định các truy vấn một cách chính xác hơn. Kết quả thực nghiệm cho thấy rằng phương pháp này có thể cải thiện đáng kể độ chính xác và độ bao phủ của hệ thống tìm kiếm.

2.1. Trích rút thông tin từ văn bản

Trích rút thông tin từ văn bản là một bước quan trọng trong quá trình xây dựng hệ thống tìm kiếm ngữ nghĩa. Phương pháp này cho phép hệ thống xác định các thực thể và mối quan hệ giữa chúng từ các văn bản không cấu trúc. Việc sử dụng các mô hình cú pháp để trích rút các bộ ba (triple) giúp hệ thống có thể tổ chức thông tin một cách có hệ thống. Các bộ ba này sẽ được sử dụng để xây dựng ontology, từ đó tạo ra một cơ sở tri thức phong phú cho hệ thống. Kết quả từ quá trình trích rút này sẽ được sử dụng để cải thiện khả năng tìm kiếm thông tin, giúp người dùng dễ dàng tìm thấy các tài liệu liên quan đến triệu chứng hoặc bệnh lý mà họ đang quan tâm.

III. Xây dựng hệ thống tra cứu thông tin bệnh

Việc xây dựng hệ thống tra cứu thông tin bệnh dựa trên tìm kiếm ngữ nghĩa là một bước tiến quan trọng trong việc cải thiện khả năng tìm kiếm thông tin y tế. Hệ thống này không chỉ cho phép người dùng tìm kiếm thông tin một cách nhanh chóng mà còn cung cấp các gợi ý dựa trên các triệu chứng mà họ nhập vào. Sử dụng ontology bệnh, hệ thống có thể xác định các mối quan hệ giữa các triệu chứng và bệnh lý, từ đó gợi ý cho người dùng các triệu chứng liên quan. Điều này giúp người dùng có thể xác định được bệnh lý mà họ đang quan tâm một cách chính xác hơn. Hệ thống cũng có thể sử dụng các thuật toán khai thác luật kết hợp để cải thiện độ chính xác của kết quả tìm kiếm, từ đó nâng cao trải nghiệm người dùng.

3.1. Cấu trúc cơ sở dữ liệu

Cấu trúc cơ sở dữ liệu trong hệ thống tra cứu thông tin bệnh đóng vai trò quan trọng trong việc tổ chức và quản lý thông tin. Cơ sở dữ liệu này sẽ chứa các thông tin về triệu chứng, bệnh lý và các mối quan hệ giữa chúng, được xây dựng dựa trên ontology bệnh. Việc tổ chức thông tin một cách có hệ thống giúp hệ thống có thể truy xuất thông tin một cách nhanh chóng và chính xác. Hệ thống cũng cần có khả năng mở rộng để có thể cập nhật thông tin mới và cải thiện khả năng tìm kiếm. Các thuật toán tìm kiếm ngữ nghĩa sẽ được áp dụng để tối ưu hóa quá trình truy xuất thông tin, từ đó nâng cao hiệu quả của hệ thống.

25/01/2025

TÀI LIỆU LIÊN QUAN

Luận án tiến sĩ nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng ontology và ứng dụng xây dựng hệ thống tra cứu tìm kiếm văn bản mẫu bệnh
Bạn đang xem trước tài liệu : Luận án tiến sĩ nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng ontology và ứng dụng xây dựng hệ thống tra cứu tìm kiếm văn bản mẫu bệnh

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Luận án tiến sĩ của Nguyễn Hồng Sơn, mang tiêu đề "Nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng ontology và ứng dụng trong hệ thống tra cứu văn bản mẫu bệnh", tập trung vào việc phát triển các phương pháp tìm kiếm ngữ nghĩa dựa trên ontology, nhằm cải thiện hiệu quả trong việc tra cứu thông tin y tế. Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về cách thức hoạt động của các hệ thống tra cứu văn bản mà còn mở ra hướng đi mới cho việc ứng dụng công nghệ thông tin trong lĩnh vực y tế, giúp nâng cao chất lượng dịch vụ chăm sóc sức khỏe.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ thông tin trong giáo dục và quản lý, bạn có thể tham khảo bài viết Luận văn thạc sĩ về quản lý giáo dục và ứng dụng công nghệ thông tin trong dạy học ở huyện Phong Điền, TP Cần Thơ, nơi nghiên cứu về việc áp dụng công nghệ thông tin trong giáo dục. Ngoài ra, bài viết Nghiên cứu phát triển kỹ thuật hỗ trợ phát hiện đạo văn trong văn bản tiếng Việt cũng liên quan đến việc ứng dụng công nghệ thông tin trong lĩnh vực văn bản, giúp bạn hiểu rõ hơn về các kỹ thuật xử lý ngữ nghĩa. Cuối cùng, bài viết Luận văn về quản lý điều hành khoa học công nghệ thông tin và nguồn lực thông tin sẽ cung cấp thêm thông tin về quản lý và ứng dụng công nghệ trong các lĩnh vực khác nhau. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về sự giao thoa giữa công nghệ thông tin và các lĩnh vực khác trong xã hội.

Tải xuống (115 Trang - 3.07 MB)