Chương 1 trình bày tổng quan về xử lý tri thức không nhất quán trong 6 ontology theo hai hướng: (1) lập luận với ontology không nhất quán sử dụng chiến lược mở rộng tuyến tính tập tiên đề diễn giải theo truy vấn đầu vào, và (2) xử lý tri thức không nhất quán trong quá trình tích hợp ontology theo phương pháp đồng thuận. Trong chương này luận án trình bày các khái niệm cơ bản về khung lập luận với ontology không nhất quán sử dụng hàm chọn để mở rộng tuyến tính tập tiên đề diễn giải. Hàm chọn dựa trên sự liên quan cú pháp được giới thiệu trong chương như là ví dụ áp dụng khung lập luận và cũng làm cơ sở để so sánh với hàm chọn dựa trên khoảng cách ngữ nghĩa sẽ được xây dựng trong luận án. Luận án cũng trình bày phương pháp biểu diễn sự không nhất quán tri thức theo mô hình hồ sơ xung đột.
Phương pháp xây dựng đồng thuận từ hồ sơ xung đột thông qua hàm đồng thuận cùng với các tiêu chuẩn cho hàm đồng thuận cũng sẽ được trình bày trong chương. Các cơ sở lý thuyết này được liên hệ đến bài toán xử lý tri thức không nhất quán trong quá trình tích hợp ontology theo phương pháp đồng thuận. Trong Chương 2, luận án trình bày cách xác định khoảng cách ngữ nghĩa giữa hai thực thể trên ontology (dựa vào số cung nối của chúng trên cây phân cấp). Trên cơ sở đó luận án xây dựng phương pháp hiệu quả để tính khoảng cách ngữ nghĩa giữa hai biểu thức thực thể bất kỳ khi đặt trên cây phân cấp của ontology này – gọi là ontology tham chiếu.
Biểu thức thực thể ở đây có thể là biểu thức lớp, biểu thức thuộc tính đối tượng hoặc thuộc tính dữ liệu trong ontology OWL. Phần nội dung quan trọng của chương trình bày phương pháp xác định tập biểu thức thực thể của một tiên đề trong ontology OWL và xây dựng hàm chọn tập tiên đề diễn giải dựa vào khoảng cách ngữ nghĩa theo ontology tham chiếu. Chương này cũng trình bày các kết quả thực nghiệm cho việc áp dụng hàm chọn được đề xuất của luận án khi truy vấn với một số ontology không nhất quán. Chương 3 trình bày phương pháp đồng thuận xử lý tri thức không nhất quán mức khái niệm trong quá trình tích hợp ontology.
Trong chương này, luận án giới thiệu mô hình tổng quát tích hợp tri thức theo phương pháp đồng thuận. Luận án áp dụng mô hình này để xử lý tri thức không nhất quán mức khái niệm theo hai khía cạnh: về danh sách thuộc tính và về miền giá trị của thuộc tính trong đặc tả khái niệm cần tích hợp. Phương pháp xác định khoảng cách 7 giữa hai miền giá trị của thuộc tính đối tượng và thuộc tính dữ liệu trong các ontology OWL cũng được trình bày trong chương này. Trong Chương 4, luận án trình bày mô hình biểu diễn sự không nhất quán tri thức mà trong đó một trạng thái tri thức được biểu diễn bằng một cấu trúc hội của các literal.
Sau khi xây dựng hàm đánh giá khoảng cách với cấu trúc này, luận án phân tích các tiêu chuẩn của hàm đồng thuận và đưa ra phương pháp xây dựng đồng thuận của hồ sơ các cấu trúc hội. Áp dụng kết quả này luận án đề xuất phương pháp xử lý sự không nhất quán mức tiên đề trong quá trình tích hợp ontology. Phần kết luận trình bày tóm tắt những đóng góp chính của luận án, hướng phát triển và những vấn đề cần giải quyết trong tương lai. TỔNG QUAN VỀ XỬ LÝ TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY 1.
Ontology và tri thức không nhất quán Có nhiều định nghĩa về ontology, nhưng định nghĩa thể hiện rõ bản chất của ontology và được trích dẫn nhiều nhất là của T. Brost [5, 14]: “Ontology là một đặc tả hình thức, tường minh về một sự khái niệm hoá được chia sẻ”. Một “sự khái niệm hoá” nói đến một mô hình trừu tượng của một hiện tượng, chủ đề cụ thể bằng cách chỉ ra các khái niệm có liên quan của chủ đề đó. Tính “tường minh” được hiểu theo nghĩa, các kiểu khái niệm được sử dụng, các ràng buộc giữa chúng là được định nghĩa rõ ràng.
Tính “hình thức” cho phép ontology có thể được sử dụng bởi máy tính. Cuối cùng, tính “được chia sẻ” cho biết, tri thức được mô tả bởi ontology được sự chấp nhận của một cộng đồng chứ không phải một cá nhân đơn lẻ. Các thành phần cấu trúc nên một ontology bao gồm tập các khái niệm, tập các cá thể, tập các quan hệ và tập các tiên đề như định nghĩa dưới đây. Một ontology là một bộ bốn hC, I, R, Zi, trong đó: • C là tập hợp các khái niệm (các lớp).
• I là tập hợp các cá thể của các khái niệm. • R là tập hợp các quan hệ. • Z là tập hợp các tiên đề biểu diễn các ràng buộc toàn vẹn dùng để mô tả các thực thể (khái niệm, cá thể, quan hệ).1, R còn được gọi là tập thuộc tính. Các thuộc tính p ∈ R được định nghĩa bởi ánh xạ p : D → R, trong đó: D ⊆ C được gọi là miền xác định của thuộc tính và R được gọi là miền giá trị của thuộc tính.
Người ta phân biệt hai loại thuộc tính: thuộc tính đối tượng dùng để liên kết các cá thể với nhau, và thuộc tính dữ liệu dùng để liên kết các cá thể với các giá trị dữ liệu. Một ontology có thể được xem là một tập tiên đề mô tả một tình huống cụ thể, gọi là một trạng thái tri thức – trong một lĩnh vực đang được quan tâm nào đó [26]. Chẳng hạn, ontology ở ví dụ dưới đây mô tả trạng thái tri thức cụ thể thuộc lĩnh vực sở hữu thú nuôi của con người. Xét ontology Σ = hC, I, R, Zi với: • C = {Animal, Person, AnimalLover, Pet, Cat, Dog }.
• I = { TOM, KITTY, MARY, JOHN }. • Z = { Person v Animal, Pet v Animal, Cat v Pet, Dog v Pet, AnimalLover ≡ Person u (>3 hasPet.>), Pet u Person v ⊥, Dog u Cat v ⊥, ∃hasPet. 10 Ý nghĩa của các tiên đề trong ontology Σ là như sau: • Cat(TOM), Cat(KITTY): TOM và KITTY là các cá thể của khái niệm Cat. • Person(MARY), Person(JOHN): MARY và JOHN là các cá thể của khái niệm Person.
• AnimalLover ≡ Person u (>3 hasPet.>): Khái niệm AnimalLover gồm những cá thể thuộc khái niệm Person và có quan hệ với ít nhất 3 cá thể tuỳ ý thông qua thuộc tính hasPet.> v Person: miền xác định của thuộc tính hasPet là khái niệm Person.Pet: miền giá trị của thuộc tính hasPet là khái niệm Pet.> v Person: miền xác định của thuộc tính hasAge là khái niệm Person.unsignedInt: miền giá trị của thuộc tính hasAge là tập số nguyên không âm. • Pet u Person v ⊥: hai khái niệm Pet và Person không có chung cá thể nào. • Cat u Dog v ⊥: hai khái niệm Cat và Dog không có chung cá thể nào. • hasPet(MARY, KITTY): Cá thể MARY có quan hệ với cá thể KITTY thông qua thuộc tính hasPet.
• hasAge(MARY, 25): Cá thể MARY có quan hệ với cá thể số không âm 25 thông qua thuộc tính hasAge. Các thuộc tính hasPet, hasAge trong ontology tương ứng là thuộc tính đối tượng và thuộc tính dữ liệu. Ý nghĩa hình thức của các tiên đề trong ontology được quy định cụ thể bởi ngôn ngữ xây dựng nên ontology. Ngôn ngữ ontology thông dụng nhất hiện nay là OWL 2 được dựa trên logic mô tả SROIQ(D).
Ngữ nghĩa của OWL 2 được định nghĩa thông qua các phép diễn dịch, theo đó, các phép diễn dịch sẽ nêu tường minh mối quan hệ giữa cú pháp và ngữ nghĩa [19]: Một phép diễn dịch I = h∆I , ·I i gồm một miền diễn dịch khác rỗng 11 ∆I và một hàm diễn dịch ·I. Hàm diễn dịch ánh xạ (1) mỗi tên khái niệm A với một tập AI là tập con của ∆I , (2) mỗi tên thuộc tính p với một tập pI là tập con của một quan hệ nhị phân trên ∆I , và (3) mỗi tên khái niệm a với một đối tượng aI trong miền diễn dịch ∆I. Hàm diễn dịch được mở rộng với các khái niệm phức, vai trò phức (thông qua các tạo tử khái niệm, tạo tử vai trò của ngôn ngữ ontology) cũng như các tiên đề trong ontology. Định nghĩa chi tiết về ngữ nghĩa của OWL 2 được nêu ở https://www.org/TR/2012/ REC-owl2-direct-semantics-20121211.
Một phép diễn dịch thoả tất cả các tiên đề trong ontology được gọi là một mô hình của ontology đó. Một ontology được gọi là không nhất quán nếu không có mô hình nào. Nguyên nhân dẫn đến điều này là do tập tiên đề của ontology có chứa mâu thuẫn. Tri thức không được phát biểu tường minh bởi các tiên đề trong ontology có thể được kiểm tra bằng cách đánh giá kết quả truy vấn: Gọi α là một tiên đề.
Truy vấn α với ontology O được viết là “ O |= α?” có kết quả “Đúng” nếu α là hệ quả logic của tập tiên đề trong O, viết là O |= α. Khi đó ta cũng nói, α được suy dẫn từ O. Ngược lại, nếu α không phải là hệ quả logic của tập tiên đề trong O, kết quả của truy vấn là “Sai” và ta viết O 6|= α. Theo Giả thiết Thế giới Mở, O 6|= α không đồng nghĩa với O |= ¬α.
Chẳng hạn, ở Ví dụ 1.1 ta có: Σ |= Cat v Animal và Σ 6|= AnimalLover(MARY). Điều đặc biệt, khi ontology là không nhất quán, thì mọi tiên đề đều là hệ quả logic của ontology đó [26]. Như vậy, việc truy vấn một ontology không nhất quán là không có nghĩa.2 dưới đây mô tả một ontology không nhất quán và các kết quả truy vấn với ontology này. Gọi Σ0 = hC, I, R, Z0 i là ontology với C, I, R, Z được định nghĩa như ở Ví dụ 1.
Có thể thấy rằng, tập con sau đây gồm các tiên đề của Z0 dưới đây là có chứa mâu thuẫn: { Cat v Pet, Pet u Person v ⊥, Person(TOM), Cat(TOM) } Do vậy, Σ0 là không có mô hình nào, hay Σ0 là ontology không nhất quán.1 mô tả các kết quả truy vấn với ontology không nhất quán Σ0. Kết quả 12 cho thấy kết quả các truy vấn này đều là “Đúng”, hay các tiên đề đều là hệ quả logic của ontology không nhất quán Σ0 .1: Truy vấn với ontology không nhất quán 13 Người ta phân các phương pháp xử lý tri thức không nhất quán trong ontology làm hai nhóm: (1) chấp nhận tồn tại tri thức không nhất quán trong ontology, và (2) tìm cách loại bỏ tri thức không nhất quán để xây dựng ontology mới, nhất quán.