I. Tổng quan về phương pháp chuyển đổi mô hình mức khái niệm và ontology
Phương pháp chuyển đổi giữa mô hình mức khái niệm và ontology là chủ đề nghiên cứu trọng tâm trong lĩnh vực khoa học máy tính hiện đại. Mô hình mức khái niệm bao gồm các công cụ thiết kế như mô hình thực thể - mối quan hệ (ER), mô hình ER mở rộng (EER), biểu đồ lớp UML và mô hình TimeER. Ontology, được biểu diễn qua ngôn ngữ OWL, đóng vai trò quan trọng trong Web ngữ nghĩa và trí tuệ nhân tạo. Nhu cầu chuyển đổi giữa hai loại mô hình này ngày càng cấp thiết. Hệ thống thông tin truyền thống sử dụng mô hình mức khái niệm để thiết kế cơ sở dữ liệu. Trong khi đó, các ứng dụng Web ngữ nghĩa đòi hỏi ontology. Việc chuyển đổi tự động giúp tiết kiệm thời gian và giảm sai sót. Nghiên cứu này đề xuất các quy tắc chuyển đổi toàn diện. Các quy tắc đảm bảo bảo toàn ngữ nghĩa giữa hai mô hình. Kết quả nghiên cứu có giá trị cả về lý thuyết lẫn thực tiễn.
1.1. Mô hình mức khái niệm trong thiết kế cơ sở dữ liệu
Mô hình mức khái niệm là công cụ quan trọng trong thiết kế hệ thống thông tin. Mô hình thực thể - mối quan hệ (ER) do Peter Chen đề xuất năm 1976 được sử dụng rộng rãi. Mô hình ER mở rộng (EER) bổ sung thêm khái niệm thực thể yếu, thuộc tính đa trị và quan hệ kế thừa. Biểu đồ lớp UML cung cấp cách mô tả trực quan với lớp, thuộc tính và phương thức. Mô hình TimeER mở rộng thêm yếu tố thời gian. Các mô hình này giúp nhà phát triển hiểu rõ cấu trúc dữ liệu trước khi triển khai hệ thống.
1.2. Ontology và vai trò trong Web ngữ nghĩa
Ontology là phương thức mô hình hóa tri thức trong lĩnh vực Web ngữ nghĩa. Ontology sử dụng ngôn ngữ OWL (Web Ontology Language) để biểu diễn khái niệm, thuộc tính và quan hệ. OWL có ba phiên bản chính: OWL Lite, OWL DL và OWL Full. Công cụ soạn thảo ontology phổ biến là Protégé. Ontology cho phép suy luận tự động dựa trên logic mô tả. Hệ thống dựa trên ontology có khả năng tìm kiếm ngữ nghĩa và tích hợp dữ liệu thông minh. Đây là nền tảng cho các ứng dụng trí tuệ nhân tạo hiện đại.
II. Phân tích vấn đề chuyển đổi mô hình mức khái niệm sang ontology
Quá trình chuyển đổi mô hình mức khái niệm sang ontology gặp nhiều thách thức phức tạp. Sự khác biệt về mặt khái niệm giữa hai loại mô hình là rào cản chính. Mô hình ER tập trung vào cấu trúc dữ liệu và ràng buộc toàn vẹn. Ontology nhấn mạnh vào tri thức và khả năng suy luận logic. Các nghiên cứu trước đây đã đề xuất nhiều phương pháp chuyển đổi khác nhau. Tuy nhiên, hầu hết chỉ xử lý được các trường hợp cơ bản. Các trường hợp phức tạp thường bị bỏ qua hoặc xử lý chưa triệt để. Thực thể yếu và mối quan hệ định danh chưa được chuyển đổi đầy đủ. Thuộc tính đa trị phức hợp lồng nhau thiếu quy tắc chuyển đổi rõ ràng. Quan hệ phản xạ và quan hệ đệ quy cũng chưa được đề xuất chi tiết. Mô hình có yếu tố thời gian đòi hỏi cách tiếp cận đặc biệt. Nghiên cứu cần xây dựng bộ quy tắc toàn diện hơn. Các quy tắc mới phải đảm bảo tính đầy đủ và bảo toàn ngữ nghĩa.
2.1. Hạn chế của các phương pháp chuyển đổi hiện có
Các phương pháp chuyển đổi hiện tại tồn tại nhiều hạn chế đáng kể. Phương pháp chuyển đổi từ ER sang OWL chỉ xử lý thực thể, thuộc tính và quan hệ cơ bản. Các trường hợp đặc biệt như thực thể yếu, quan hệ định danh bị bỏ qua. Phương pháp chuyển đổi từ UML sang OWL chưa đề cập đến thuộc tính có kiểu dữ liệu là lớp. Quan hệ kết hợp có lớp kết hợp cũng thiếu quy tắc chuyển đổi. Các nghiên cứu về TimeER sang OWL rất hạn chế. Sự thiếu hụt này tạo khoảng trống lớn trong lĩnh vực nghiên cứu.
2.2. Khoảng trống nghiên cứu về chuyển đổi mô hình thời gian
Mô hình thời gian như TimeER đặt ra thách thức đặc biệt cho quá trình chuyển đổi. TimeER mở rộng mô hình ER bằng cách thêm các chiều thời gian. Thời gian sống, thời gian hợp lệ và thời gian giao tác cần được biểu diễn chính xác. Các nghiên cứu hiện tại chưa có phương pháp chuyển đổi toàn diện từ TimeER sang ontology. Việc bảo toàn ngữ nghĩa thời gian trong ontology đòi hỏi cách tiếp cận sáng tạo. OWL cần các cơ chế mở để biểu diễn đầy đủ thông tin thời gian. Khoảng trống nghiên cứu này cần được lấp đầy bằng các quy tắc chuyển đổi mới.
III. Đề xuất giải pháp chuyển đổi mô hình mức khái niệm sang ontology
Nghiên cứu đề xuất bộ quy tắc chuyển đổi toàn diện từ mô hình mức khái niệm sang ontology. Phương pháp tiếp cận dựa trên phân tích sự tương đồng và khác biệt giữa hai loại mô hình. Quy tắc chuyển đổi từ ER sang OWL xử lý đầy đủ các thành phần cơ bản. Tập thực thể chuyển đổi thành class trong ontology. Thuộc tính được ánh xạ thành datatype property hoặc object property. Quan hệ kế thừa (Is-A) sử dụng cơ chế subClassOf của OWL. Đối với các trường hợp phức tạp, nghiên cứu đưa ra giải pháp mới. Thực thể yếu và mối quan hệ định danh được xử lý bằng pattern đặc biệt. Thuộc tính đa trị phức hợp lồng nhau sử dụng cấu trúc phức tạp trong OWL. Quan hệ phản xạ được biểu diễn bằng axioms reflexivity. Mô hình TimeER đòi hỏi ontology mở rộng với các class thời gian riêng biệt. Mỗi chiều thời gian được ánh xạ thành property chuyên biệt.
3.1. Quy tắc chuyển đổi từ mô hình ER và EER sang OWL
Quy tắc chuyển đổi từ mô hình ER/EER sang OWL được xây dựng hệ thống. Thực thể chuyển đổi thành OWL Class với đầy đủ thuộc tính. Thuộc tính đơn giản trở thành DatatypeProperty liên kết với class. Thuộc tính đa trị được xử lý bằng cardinality restriction. Quan hệ nhị nguyên chuyển đổi thành ObjectProperty giữa hai class. Quan hệ kế thừa sử dụng rdfs:subClassOf để bảo toàn tính kế thừa. Thực thể yếu được biểu diễn bằng class riêng với existential restriction. Mối quan hệ định danh ánh xạ thành property có functional characteristic. Mỗi quy tắc đi kèm ví dụ minh họa cụ thể.
3.2. Mở rộng phương pháp cho mô hình UML và TimeER
Phương pháp chuyển đổi được mở rộng cho biểu đồ lớp UML và mô hình TimeER. UML Class chuyển đổi thành OWL Class tương tự như thực thể ER. Phương thức trong UML được biểu diễn bằng SWRL rules trong ontology. Quan hệ kết tập trong UML sử dụng object property với domain và range rõ ràng. Quan hệ kết hợp có lớp kết hợp đòi hỏi pattern phức tạp hơn. Đối với TimeER, mỗi chiều thời gian tạo thành ontology riêng biệt. Thông tin thời gian được tích hợp vào ontology chính qua property annotation. Giải pháp này đảm bảo tính mô-đun và dễ bảo trì.
IV. Kết luận và ứng dụng thực tiễn của phương pháp chuyển đổi
Nghiên cứu đã đề xuất thành công bộ quy tắc chuyển đổi toàn diện giữa mô hình mức khái niệm và ontology. Các quy tắc mới bổ sung những trường hợp còn thiếu trong nghiên cứu trước. Quá trình chuyển đổi đảm bảo bảo toàn ngữ nghĩa ở mức cao nhất. Kết quả nghiên cứu có giá trị lý thuyết quan trọng. Bộ quy tắc cung cấp nền tảng cho việc xây dựng công cụ chuyển đổi tự động. Ứng dụng thực tiễn của phương pháp rất đa dạng. Doanh nghiệp có thể tái sử dụng thiết kế cơ sở dữ liệu hiện có cho ứng dụng Web ngữ nghĩa. Việc tích hợp dữ liệu từ nhiều nguồn trở nên dễ dàng hơn. Hệ thống trí tuệ nhân tạo có thể khai thác ontology được chuyển đổi. Giáo dục và đào tạo cũng hưởng lợi từ kết quả nghiên cứu này. Sinh viên hiểu rõ hơn sự liên kết giữa mô hình truyền thống và công nghệ mới. Tương lai, nghiên cứu có thể mở rộng cho các loại mô hình khác nhau.
4.1. Đóng góp khoa học của luận án tiến sĩ 2021
Luận án tiến sĩ năm 2021 của Võ Hoàng Liên Minh có nhiều đóng góp quan trọng. Đóng góp thứ nhất là bộ quy tắc chuyển đổi từ ER/EER sang OWL đầy đủ nhất. Đóng góp thứ hai là phương pháp xử lý mô hình TimeER chưa từng được đề xuất. Đóng góp thứ ba là phân tích so sánh chi tiết giữa các loại mô hình. Nghiên cứu được thực hiện tại Đại học Khoa học - Đại học Huế dưới hướng dẫn của PGS. Hoàng Hữu Hạnh. Kết quả được công bố trên các tạp chí khoa học uy tín. Công trình tạo tiền đề cho các nghiên cứu tiếp theo trong lĩnh vực này.
4.2. Triển vọng phát triển và ứng dụng trong tương lai
Phương pháp chuyển đổi mô hình mức khái niệm và ontology có triển vọng phát triển rộng lớn. Công cụ chuyển đổi tự động dựa trên kết quả nghiên cứu có thể được xây dựng. Tích hợp với hệ thống quản lý cơ sở dữ liệu hiện đại là hướng đi tiềm năng. Ứng dụng trong lĩnh vực IoT và dữ liệu lớn ngày càng cần thiết. Nghiên cứu có thể mở rộng cho các ontology domain-specific như y tế, giáo dục. Cộng đồng Web ngữ nghĩa toàn cầu có thể áp dụng kết quả này. Sự phát triển của trí tuệ nhân tạo sẽ thúc đẩy nhu cầu chuyển đổi mô hình tăng cao.