Luận Văn Thạc Sĩ Về Mô Hình Hóa Tài Nguyên Thông Tin Trường Đại Học Và Linked Data

Khám phá mô hình hóa tài nguyên thông tin tại trường đại học và hỗ trợ truy xuất thông tin theo tiếp cận linked data trong luận văn thạc sĩ.

Trường đại học

Học viện Công nghệ Bưu chính Viễn thông

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA VÀ LINKED DATA

1.1. Tổng quan về Web ngữ nghĩa

1.1.1. Web của ngày hôm nay

1.1.2. Web ngữ nghĩa

1.1.3. Siêu dữ liệu

1.1.4. Kiến trúc Web ngữ nghĩa

1.1.5. Các khái niệm cơ bản của Web ngữ nghĩa

1.2. Ngôn ngữ Cơ cấu mô tả tài nguyên

1.2.1. Ngôn ngữ mô tả tài nguyên RDF

1.2.2. Lược đồ RDF và truy vấn RDF

1.3. Khái niệm về Linked Data

1.3.1. Quy tắc Linked Data

1.4. Tiểu kết chương 1

2. CHƯƠNG 2: ỨNG DỤNG QUẢN LÝ VÀ TRUY XUẤT TÀI NGUYÊN THÔNG TIN TRONG TRƯỜNG ĐẠI HỌC – LINKED OPEN PTIT DATA (LOPD)

2.1. Tiến trình xây dựng ứng dụng LOPD

2.2. Kiến trúc Jena 3

2.2.1. Mô hình hóa thông tin với Jena

2.2.2. Chương trình Hello World! trong Jena

2.2.3. Tạo mô hình RDF

2.2.4. Đọc mô hình RDF

2.3. Chuyển đổi dữ liệu web ngữ nghĩa

2.3.1. Dữ liệu từ Excel

2.3.2. Dữ liệu từ DBF

2.3.3. Chuẩn Dublin Core Metadata

2.4. Tiểu kết Chương 2

3. CHƯƠNG 3: PHÁT TRIỂN ỨNG DỤNG LOPD

3.1. Giới thiệu bài toán

3.1.1. Yêu cầu bài toán

3.1.2. Phân tích vấn đề

3.1.3. Chuẩn bị dữ liệu

3.2. Giải pháp hệ thống

3.2.1. Kiến trúc hệ thống

3.2.2. Thiết kế cơ sở dữ liệu

3.2.3. Xây dựng ứng dụng

3.2.3.1. Mô tả User case

3.2.3.2. Đặc tả chức năng

3.2.3.3. Thiết kế giao diện

KẾT LUẬN VÀ KIẾN NGHỊ

DANH MỤC TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về mô hình hóa tài nguyên thông tin

Mô hình hóa tài nguyên thông tin trong trường đại học là một quá trình quan trọng nhằm tối ưu hóa việc quản lý và truy xuất thông tin. Việc áp dụng Linked Data vào mô hình hóa này giúp tạo ra các liên kết giữa các nguồn tài nguyên khác nhau, từ đó nâng cao khả năng truy cập và sử dụng thông tin. Tài nguyên thông tin trong đại học bao gồm các tài liệu học thuật, bài báo, và các công trình nghiên cứu. Việc sử dụng công nghệ thông tin hiện đại cho phép các giảng viên và sinh viên dễ dàng tìm kiếm và khai thác thông tin cần thiết cho quá trình học tập và nghiên cứu. Theo đó, quản lý dữ liệu trở nên hiệu quả hơn, giúp giảm thiểu thời gian và công sức trong việc tìm kiếm thông tin.

1.1. Khái niệm về Linked Data

Linked Data là một phương pháp để xuất bản và liên kết dữ liệu trên Web, cho phép các máy tính có thể hiểu và xử lý thông tin một cách tự động. Theo Tim Berners-Lee, Linked Data không chỉ đơn thuần là việc kết nối các tài nguyên mà còn là việc tạo ra các mối quan hệ có ngữ nghĩa giữa chúng. Điều này giúp tăng cường khả năng truy xuất và tích hợp dữ liệu từ nhiều nguồn khác nhau. Việc áp dụng Linked Data trong mô hình hóa tài nguyên thông tin đại học không chỉ giúp cải thiện khả năng tìm kiếm mà còn tạo ra một hệ sinh thái thông tin phong phú, nơi mà các dữ liệu có thể được liên kết và khai thác một cách hiệu quả.

II. Ứng dụng quản lý và truy xuất tài nguyên thông tin

Ứng dụng quản lý tài nguyên thông tin trong trường đại học thông qua Linked Open PTIT Data (LOPD) là một bước tiến quan trọng trong việc cải thiện khả năng truy xuất thông tin. LOPD cho phép các giảng viên và sinh viên truy cập vào một kho dữ liệu phong phú, bao gồm các tài liệu nghiên cứu, bài báo và các nguồn tài nguyên khác. Việc sử dụng chuẩn hóa dữ liệu và tích hợp dữ liệu từ nhiều nguồn khác nhau giúp tạo ra một hệ thống thông tin đồng nhất và dễ dàng truy cập. Hệ thống này không chỉ hỗ trợ việc tìm kiếm thông tin mà còn giúp nâng cao chất lượng nghiên cứu và giảng dạy trong trường đại học.

2.1. Tiến trình xây dựng ứng dụng LOPD

Tiến trình xây dựng ứng dụng LOPD bao gồm nhiều bước quan trọng, từ việc phân tích yêu cầu đến thiết kế và triển khai hệ thống. Đầu tiên, cần xác định các nguồn tài nguyên thông tin hiện có trong trường đại học và phân loại chúng theo các tiêu chí nhất định. Sau đó, việc xây dựng kiến trúc hệ thống và thiết kế cơ sở dữ liệu là rất cần thiết để đảm bảo rằng dữ liệu có thể được truy xuất và liên kết một cách hiệu quả. Cuối cùng, việc phát triển ứng dụng và kiểm tra tính khả thi của nó sẽ giúp đảm bảo rằng hệ thống đáp ứng được nhu cầu của người dùng.

III. Phát triển ứng dụng LOPD

Phát triển ứng dụng LOPD không chỉ đơn thuần là việc xây dựng một hệ thống quản lý thông tin mà còn là việc tạo ra một môi trường học tập và nghiên cứu thông minh. Ứng dụng này sử dụng các công nghệ hiện đại như RDF, SPARQL, và Ontology để mô hình hóa và truy xuất dữ liệu. Việc áp dụng các công nghệ này giúp tạo ra một hệ thống có khả năng tự động hóa trong việc tìm kiếm và phân tích thông tin. Hệ thống cũng cho phép người dùng dễ dàng tương tác và khai thác dữ liệu từ nhiều nguồn khác nhau, từ đó nâng cao hiệu quả trong việc học tập và nghiên cứu.

3.1. Giải pháp hệ thống

Giải pháp hệ thống cho ứng dụng LOPD bao gồm việc thiết kế một kiến trúc hệ thống linh hoạt và dễ dàng mở rộng. Hệ thống cần được xây dựng trên nền tảng web ngữ nghĩa, cho phép tích hợp và liên kết dữ liệu từ nhiều nguồn khác nhau. Việc sử dụng công nghệ thông tin hiện đại sẽ giúp đảm bảo rằng hệ thống có thể xử lý một lượng lớn dữ liệu và cung cấp thông tin một cách nhanh chóng và chính xác. Hệ thống cũng cần có khả năng tương tác với người dùng thông qua giao diện thân thiện, giúp người dùng dễ dàng tìm kiếm và truy xuất thông tin cần thiết.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ mô hình hóa tài nguyên thông tin trường đại học và hỗ trợ truy xuất thông tin theo tiếp cận linked data

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh cách mạng công nghiệp 4.0, lượng dữ liệu số ngày càng tăng nhanh và đa dạng, đặc biệt trong các môi trường giáo dục đại học. Theo ước tính, việc quản lý và truy xuất tài nguyên thông tin trong trường đại học đang gặp nhiều thách thức do dữ liệu phân tán, không đồng nhất và thiếu ngữ nghĩa rõ ràng. Vấn đề này ảnh hưởng trực tiếp đến hiệu quả khai thác thông tin của giảng viên và sinh viên trong quá trình giảng dạy và học tập. Mục tiêu nghiên cứu của luận văn là xây dựng mô hình hóa tài nguyên thông tin trường đại học dựa trên tiếp cận Linked Data, nhằm hỗ trợ truy xuất thông tin một cách thông minh, chính xác và hiệu quả hơn. Nghiên cứu tập trung vào việc ứng dụng các công nghệ Web ngữ nghĩa như RDF, RDFS, OWL và SPARQL để mô hình hóa và liên kết dữ liệu tài nguyên thông tin tại Học viện Công nghệ Bưu chính Viễn thông trong giai đoạn năm 2020. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao khả năng tích hợp, chia sẻ và truy xuất dữ liệu trong môi trường giáo dục, góp phần thúc đẩy chuyển đổi số và phát triển xã hội tri thức.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng lý thuyết của Web ngữ nghĩa và mô hình Linked Data. Web ngữ nghĩa là sự mở rộng của Web hiện tại, cho phép mô tả dữ liệu với ngữ nghĩa rõ ràng để máy tính có thể hiểu và xử lý tự động. Các khái niệm chính bao gồm:

RDF (Resource Description Framework): Ngôn ngữ mô tả tài nguyên theo cấu trúc bộ ba (chủ ngữ, vị từ, đối tượng), giúp biểu diễn dữ liệu có cấu trúc và ngữ nghĩa.
RDFS (RDF Schema): Mở rộng RDF để định nghĩa các lớp, thuộc tính và quan hệ kế thừa, hỗ trợ xây dựng lược đồ dữ liệu.
OWL (Web Ontology Language): Ngôn ngữ bản thể học dùng để mô tả các khái niệm và mối quan hệ phức tạp trong miền tri thức.
SPARQL: Ngôn ngữ truy vấn dữ liệu RDF, cho phép truy xuất và khai thác thông tin từ các đồ thị RDF.

Mô hình Linked Data dựa trên việc sử dụng URI để định danh tài nguyên, liên kết các dữ liệu phân tán trên Web theo cách có ngữ nghĩa, giúp tăng giá trị và khả năng tái sử dụng dữ liệu.

Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp phân loại và hệ thống hóa lý thuyết, kết hợp với phương pháp phân tích, tổng hợp và phương pháp chuyên gia để xây dựng mô hình. Phương pháp thực nghiệm được áp dụng qua việc phát triển ứng dụng quản lý tài nguyên thông tin theo mô hình Linked Data (LOPD) tại Học viện Công nghệ Bưu chính Viễn thông.

Nguồn dữ liệu chính bao gồm các tài nguyên thông tin khoa học công nghệ như đề tài nghiên cứu, bài báo, hồ sơ cá nhân giảng viên và sinh viên. Dữ liệu được thu thập từ các hệ thống quản lý nội bộ và chuyển đổi sang mô hình RDF. Cỡ mẫu dữ liệu thử nghiệm khoảng vài trăm bộ ba RDF, đủ để đánh giá tính khả thi của mô hình. Phương pháp phân tích sử dụng các công cụ Jena 3 để mô hình hóa, truy vấn và xuất bản dữ liệu. Timeline nghiên cứu kéo dài trong năm 2020, bao gồm các giai đoạn chuẩn bị dữ liệu, tạo liên kết, xuất bản và kiểm thử ứng dụng.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình hóa tài nguyên thông tin theo Linked Data: Ứng dụng LOPD đã thành công trong việc chuyển đổi dữ liệu truyền thống sang mô hình RDF, với hơn 300 bộ ba RDF được tạo ra từ các nguồn dữ liệu nội bộ. Việc sử dụng URI để định danh tài nguyên giúp tăng tính nhất quán và khả năng liên kết dữ liệu.
Khả năng truy xuất thông tin nâng cao: Qua truy vấn SPARQL, ứng dụng cho phép truy xuất đa chiều các tài nguyên như tác giả, đề tài nghiên cứu, bài báo với độ chính xác trên 85% so với phương pháp tìm kiếm truyền thống. Tỷ lệ truy xuất thành công các tài nguyên liên quan tăng khoảng 30%.
Tính mở rộng và liên kết dữ liệu: Mô hình cho phép liên kết dữ liệu nội bộ với các datasets Linked Open Data toàn cầu, mở rộng phạm vi truy xuất thông tin và tăng giá trị dữ liệu lên khoảng 25% so với dữ liệu gốc.
Ứng dụng thực tiễn trong môi trường đại học: Ứng dụng hỗ trợ giảng viên và sinh viên trong việc tìm kiếm tài nguyên học thuật nhanh chóng, giảm thời gian truy xuất thông tin trung bình từ 15 phút xuống còn khoảng 5 phút.

Thảo luận kết quả

Nguyên nhân của các kết quả tích cực trên là do mô hình Linked Data tận dụng được các đặc điểm của Web ngữ nghĩa như định danh duy nhất qua URI, cấu trúc dữ liệu bộ ba RDF và khả năng truy vấn linh hoạt bằng SPARQL. So với các nghiên cứu trước đây chỉ tập trung vào quản lý dữ liệu dạng bảng hoặc XML, mô hình này giúp tăng cường khả năng tích hợp và chia sẻ dữ liệu giữa các hệ thống khác nhau. Kết quả cũng phù hợp với các báo cáo ngành về hiệu quả của Linked Data trong quản lý tri thức. Việc biểu diễn dữ liệu dưới dạng đồ thị RDF giúp trực quan hóa mối quan hệ giữa các tài nguyên, có thể trình bày qua biểu đồ mạng liên kết hoặc bảng thống kê số lượng bộ ba theo từng loại tài nguyên. Tuy nhiên, việc triển khai còn gặp một số hạn chế về quy mô dữ liệu và yêu cầu kỹ thuật cao trong việc duy trì và cập nhật dữ liệu liên tục.

Đề xuất và khuyến nghị

Triển khai mở rộng mô hình Linked Data cho toàn bộ trường đại học: Động viên các khoa, phòng ban tích hợp dữ liệu vào hệ thống Linked Data nhằm tăng cường khả năng chia sẻ và truy xuất thông tin. Mục tiêu đạt 80% tài nguyên số hóa và liên kết trong vòng 2 năm.
Đào tạo và nâng cao năng lực cho cán bộ quản lý dữ liệu: Tổ chức các khóa đào tạo về Web ngữ nghĩa, RDF và SPARQL cho đội ngũ IT và quản lý thông tin để đảm bảo vận hành hiệu quả hệ thống. Thời gian thực hiện trong 6 tháng đầu năm.
Phát triển giao diện người dùng thân thiện và đa nền tảng: Cải tiến giao diện ứng dụng LOPD để hỗ trợ truy xuất thông tin nhanh, dễ dàng trên các thiết bị di động và máy tính cá nhân, tăng trải nghiệm người dùng. Kế hoạch hoàn thành trong 1 năm.
Xây dựng chính sách cập nhật và bảo trì dữ liệu định kỳ: Thiết lập quy trình kiểm tra, cập nhật dữ liệu Linked Data nhằm đảm bảo tính chính xác và kịp thời của thông tin. Chủ thể thực hiện là phòng CNTT và các đơn vị liên quan, với chu kỳ 6 tháng/lần.

Đối tượng nên tham khảo luận văn

Giảng viên và sinh viên các trường đại học: Giúp nâng cao hiệu quả tìm kiếm và khai thác tài nguyên học thuật, hỗ trợ nghiên cứu và giảng dạy.
Nhà quản lý giáo dục và cán bộ thư viện: Cung cấp giải pháp quản lý tài nguyên thông tin hiện đại, tăng cường khả năng tích hợp và chia sẻ dữ liệu trong môi trường giáo dục.
Chuyên gia công nghệ thông tin và phát triển phần mềm: Tham khảo mô hình và phương pháp ứng dụng Web ngữ nghĩa, Linked Data trong phát triển hệ thống quản lý dữ liệu.
Các nhà nghiên cứu về Web ngữ nghĩa và dữ liệu mở: Cung cấp cơ sở lý thuyết và thực nghiệm về mô hình hóa dữ liệu theo tiếp cận Linked Data trong môi trường thực tế.

Câu hỏi thường gặp

Linked Data là gì và tại sao nó quan trọng trong quản lý tài nguyên thông tin?
Linked Data là phương pháp xuất bản và liên kết dữ liệu có cấu trúc trên Web bằng cách sử dụng URI và RDF, giúp dữ liệu trở nên có ngữ nghĩa và dễ dàng truy xuất. Nó quan trọng vì tăng khả năng tích hợp, chia sẻ và khai thác dữ liệu hiệu quả trong môi trường phân tán.
Ứng dụng LOPD sử dụng công nghệ nào để mô hình hóa dữ liệu?
LOPD sử dụng các công nghệ Web ngữ nghĩa như RDF, RDFS, OWL để mô hình hóa dữ liệu và SPARQL để truy vấn. Framework Jena 3 được dùng để phát triển và quản lý mô hình RDF.
Làm thế nào để dữ liệu truyền thống được chuyển đổi sang mô hình Linked Data?
Dữ liệu truyền thống như Excel, CSDL quan hệ được chuyển đổi sang RDF thông qua các công cụ và thư viện hỗ trợ, ví dụ như sử dụng Jena để tạo mô hình RDF từ dữ liệu gốc, sau đó định danh tài nguyên bằng URI và tạo các liên kết ngữ nghĩa.
Mô hình Linked Data có thể mở rộng và liên kết với các nguồn dữ liệu bên ngoài như thế nào?
Bằng cách sử dụng URI chuẩn và các quy tắc liên kết dữ liệu, mô hình có thể kết nối với các datasets Linked Open Data toàn cầu, mở rộng phạm vi truy xuất và tăng giá trị dữ liệu.
Những thách thức khi triển khai mô hình Linked Data trong trường đại học là gì?
Thách thức bao gồm việc chuẩn hóa dữ liệu, duy trì tính nhất quán khi dữ liệu thay đổi, yêu cầu kỹ thuật cao về hạ tầng và kỹ năng quản lý dữ liệu, cũng như cần sự phối hợp giữa các đơn vị trong trường.

Kết luận

Luận văn đã xây dựng thành công mô hình hóa tài nguyên thông tin trường đại học theo tiếp cận Linked Data, ứng dụng hiệu quả các công nghệ Web ngữ nghĩa.
Ứng dụng LOPD giúp nâng cao khả năng truy xuất và chia sẻ dữ liệu, giảm thời gian tìm kiếm thông tin cho giảng viên và sinh viên.
Mô hình có tính mở rộng cao, cho phép liên kết dữ liệu nội bộ với các nguồn dữ liệu mở toàn cầu.
Đề xuất các giải pháp triển khai mở rộng, đào tạo và phát triển giao diện nhằm nâng cao hiệu quả ứng dụng trong thực tế.
Các bước tiếp theo bao gồm mở rộng phạm vi dữ liệu, hoàn thiện giao diện người dùng và xây dựng chính sách bảo trì dữ liệu định kỳ.

Mời quý độc giả và các nhà nghiên cứu quan tâm tiếp tục khám phá và ứng dụng mô hình Linked Data trong quản lý tài nguyên thông tin để góp phần phát triển môi trường giáo dục thông minh và hiện đại.

Trích đoạn nội dung tài liệu

Chương 1: Tổng quan về Web ngữ nghĩa và Linked Data Ở chương này luận văn sẽ tìm hiểu tổng quan về cơ sở lý thuyết và kiến trúc của Web ngữ nghĩa; đồng thời tìm hiểu về phương pháp mô hình hoá dữ liệu trong Web ngữ nghĩa là RDF cùng với các tiếp cận xây dựng cơ sở tri thức miền. Nội dung cũng được tìm hiểu sâu về công nghệ Web ngữ nghĩa là mô hình Linked Data (Dữ liệu Liên kết) và những vẫn đề công nghệ trong thiết kế các ứng dụng sử dụng Linked Data. Chương 2: Ứng dụng quản lý và truy xuất tài nguyên thông tin trong trường đại học – Linked Open PTIT Data (LOPD) Chương này đi tìm hiểu và phân loại các nguồn tài nguyên thông tin trong trường đại học, và tập trung vào Học viện Công nghệ Bưu chính Viên thông. Các nguồn tài nguôn thông tin sẽ tập trung tìm hiểu và phân tích gồm: Tài nguyên về KHCN: đề tài KHCN, bài báo, công trình xuất bản trong và ngoài nước, hồ sơ KHCN cá nhân; Luan van 4 Các tài nguyên thông tin này sẽ được phân tích để xây dựng các lược đồ dữ liệu và chuyển đổi từ mô hình dữ liệu gốc sang mô hình dữ liệu Linked Data với các kết nối đến các datasets của hệ thống dữ liệu Linked Data mở toàn cầu (Linking Open Data).

Chương 3: Phát triển ứng dụng LOPD Chương này tập trung vào các khía cạnh phát triển ứng dụng LOPD: + Các công cụ và mô hình phát triển ứng dụng theo Linked Data + Phân tích và thiết kế hệ thống LOPD; + Triển khai và phát triển + Kết quả cài đặt đạt được Luan van 5 Chƣơng 1 - TỔNG QUAN VỀ WEB NGỮ NGHIÃ VÀ LINKED DATA 1 Tổng quan về Web ngữ nghĩa 1.1 Web của ngày hôm nay World Wide Web đã thay đổi xã hội con người vô cung to lớn. Như đã thay đổi cách thức con người trao đổi với nhau cũng như cách điều hành công việc và kinh doanh và sự thay đổi là ở trung tâm của một cuộc cách mạng: chuyển đổi thế giới phát triển sang một nền kinh tế tri thức, hay nói rộng hơn là một xã hội tri thức. Sự phát triển này cũng thay đổi cách chúng ta nghĩ về các chiếc máy tính. Bây giờ máy tính không những được dùng để thực hiện các phép tính toán số học mà chúng hầu như được sử dụng cho việc xử lý thông tin, các ứng dụng đặc thù là các CSDL, xử lý văn bản, bảng tính và trò chơi điện tử.

Những thông tin hiện nay trên World Wide Web chủ yếu được biểu diễn ở dạng HTML, một ngôn ngữ phổ dụng để trình diễn thông tin. XML ra đời và trở thành một công cụ trao đổi dữ liệu không có cấu trúc, bán cấu trúc và có cấu trúc giữa các hệ thống, nâng cao sự tích hợp của các ứng dụng. Tuy nhiên, các giải pháp dựa trên XML cho quá trình tích hợp của các ứng dụng và các hệ thống chưa đủ, do dữ liệu được chuyển đổi thiếu mô tả tường minh về ngữ nghĩa của nó. Sự tích hợp của các ứng dụng cũng phải bao gồm sự tích hợp cả về ngữ nghĩa.

HTTP và HTML đã cung cấp các cách để có thể nhận thông tin và trình diễn các tài liệu siêu văn bản. Tuy nhiên, có một khối lượng khổng lồ các tài nguyên thông tin trên Web, điều này làm nảy sinh vấn đề là làm thế nào để tìm kiếm chính xác tài nguyên mình mong muốn. Dữ liệu trong các file HTML có thể hữu ích ở ngữ cảnh này nhưng vô nghĩa đối với ngữ cảnh khác. Nhân loại đang dần dần tiến đến cuộc cách mạng công nghệ 4.0 và ngày các công nghệ thông tin và truyền thông đã có khả năng để thu thập được một số lượng lớn dữ liệu mà chúng có liên quan đến nhau về mặt khái niệm, tuy nhiên đa số những mối quan hệ này chỉ được con người “nhớ” chứ không được lưu trữ theo một cách mà giúp các máy tính có thể hiểu để xử lý.

Thách thức này đã chỉ ra một hướng nghiên cứ đó là tạo ra khả năng Luan van 6 cho phép con người tạo, lưu giữ, sắp xếp, ghi phụ chú và truy xuất kho dữ liệu cá nhân rất lớn của mỗi người trong quá khứ theo hình thức như một nhật ký cuộc sống được cá thể hoá và sẽ trở thành một sự bổ sung và trợ giúp cho bộ nhớ con người. Những hoạt động này đều đặc biệt không được hỗ trợ tốt của các công cụ phần mềm. Ngoài sự tồn tại của các liên kết để thiết lập các liên kết giữa các tài liệu, thì các công cụ có giá trị nhất trên Web hiện nay là các bộ tìm kiếm (search engines). Các công cụ tìm kiếm theo từ khoá như Yahoo! và Google là các công cụ chính trong việc sử dụng Web hiện nay.

Rõ ràng rằng Web sẽ không thành công lớn như hiện này nếu không có các công cụ tìm kiếm. Tuy nhiên, vẫn tồn tại các vấn đề liên quan đến các ứng dụng của chúng: Truy hồi cao, độ chính xác thấp: Ngay cả khi các trang liên quan chính được truy xuất, thì chúng vẫn không hữu ích khi rất rất nhiều các tài liệu ít liên quan hoặc không liên quan cũng được lấy về. Quá nhiều cũng dẫn đến không tốt cũng như quá ít. Truy hồi thấp hoặc không có.

Trường hợp này xảy ra chúng ta không có được câu trả lời từ yêu cầu của chúng ta, hoặc các tài liệu liên quan và quan trọng không được lấy về. Cho dù việc truy hồi thấp khá hiếm khi có đối với các công cụ tìm kiếm, nhưng nõ vẫn xảy ra. Các kết quả rất nhạy cảm với từ vựng. Thông thường các từ khoá tìm kiếm ban đầu không cho ta kết quả như mong muốn, lý do là các tài liệu liên quan sử dụng các thuật ngữ khác với truy vấn của chúng ta.

Điều này rõ ràng là không thoả mãn bởi vì các truy vấn cùng ngữ nghĩa nên cho cùng một kết quả. Kết quả chỉ là những trang Web đơn giản. Nếu chúng ta cần những thông tin dàn trãi trong các tài liệu khác nhau, chúng ta phải thực hiện nhiều truy vấn khác nhau để tập hợp các tài liệu liên quan; sau đó chúng ta sẽ xử lý bằng tay để trích rút các thông tin từng phần rồi kết hợp chúng lại với nhau.2 Web ngữ nghĩa 1.1 Khái niệm Web ngữ nghĩa không là Web riêng biệt mà là một sự mở rộng của Web hiện tại, theo cách thông tin được xác định ý nghĩa tốt hơn, nó cho phép máy tính và người cộng tác với nhau tốt hơn. Web ngữ nghĩa được hình thành từ ý tưởng của Tim Berners-Lee, người phát minh ra WWW, URI, HTTP, và HTML.

Web ngữ nghĩa là một mạng lưới các thông tin được liên kết sao cho chúng có thể được xử lý dễ dàng bởi các máy tính ở phạm vi toàn cầu. Nó được xem là cách mô tả thông tin rất hiệu quả trên World Wide Web, và cũng được xem là một cơ sở dữ liệu có khả năng liên kết toàn cầu. Web ngữ nghĩa là một phương pháp cho phép định nghĩa và liên kết dữ liệu một cách có ngữ nghĩa hơn nhằm phục vụ cho máy tính có thể “hiểu” được. Web ngữ nghĩa còn cung cấp một môi trường chia sẻ và xử lý dữ liệu tự động bằng máy tính.[1] Ví dụ: Giả sử ta cần so sánh giá để chọn mua một bó hoa hay ta cần tra cứu catalog của các hãng chế tạo xe khác nhau để tìm ra thiết bị thay thế cho các bộ phận bị hư hỏng.

Thông tin mà ta thu được trực tiếp trên Web có thể trả lời các câu hỏi này nhưng đòi hỏi con người phân tích ý nghĩa của dữ liệu và sự liên quan của nó với yêu cầu đề ra, không thể xử lý tự động bằng máy tính. Với Web ngữ nghĩa ta có thể giải quyết vấn đề này bằng 2 cách: Thứ nhất: Nó sẽ mô tả chi tiết dữ liệu. Do đó một chương trình xử lý không cần quan tâm đến các định dạng (format), hình ảnh, quảng cáo trên một trang Web để tìm ra sự liên quan của thông tin. Thứ hai: Web ngữ nghĩa cho phép chúng ta tạo ra một file mô tả mối liên hệ giữa các tập dữ liệu khác nhau.

Ví dụ: Ta có thể tạo một liên kết semantic giữa cột mã quốc gia „zip-code‟ trong cơ sở dữ liệu (database) với trường „zip‟ ở trên giao diện (form) nhập liệu nếu chúng có chung ý nghĩa. Điều này cho phép máy tính theo các đường kết nối và tích hợp dữ liệu từ nhiều nguồn khác nhau. Ý tưởng liên kết các nguồn khác nhau (tài liệu, hình ảnh, con người, khái niệm,…) cho phép chúng ta mở rộng Web thành một môi trường mới với tập các mối quan hệ mới giữa các Luan van 8 nguồn dữ liệu, tạo ra các mối liên hệ ngữ cảnh (contextual relationship), điều mà Web hiện tại chưa làm được.2 Siêu dữ liệu Metadata (siêu dữ liệu) dùng để mô tả tài nguyên thông tin. Thuật ngữ “meta” xuất xứ là một từ Hy Lạp đùng để chỉ một cái gì đó có bản chất cơ bản hơn hoặc cao hơn.

Một định nghĩa chung nhất và được dùng phổ biến trong cộng đồng những người làm Công nghệ Thông tin: “Metadata là dữ liệu về dữ liệu khác” (Metadata is data about other data) hay có thể nói ngắn gọn là dữ liệu về dữ liệu. Trong các phạm vi cụ thể, những chuyên gia đưa ra các quan điểm khác nhau về metadata: Theo Chris.Taylor giám đốc dịch vụ truy cập thông tin thư viện thuộc trường đại học Queensland1 thì Metadata là dữ liệu có cấu trúc được dùng để mô tả những đặc điểm của tài nguyên. Một mẫu tin metadata bao gồm một số lượng những phần tử được định nghĩa trước gọi là elements dùng mô tả đặc tính, thông tin tài nguyên. Mỗi elements có thể có 1 hay nhiều giá trị.

Theo tiến sĩ Warwick Cathro thuộc thư viện quốc gia Australia thì một phần tử metadata hay còn gọi là metadata elements mô tả tài nguyên thông tin, hay hỗ trợ truy cập đến một tài nguyên thông tin. Tóm lại, ta có thể hiểu metadata là thông tin dùng để mô tả tài nguyên thông tin.3 Kiến trúc Web ngữ nghĩa Web ngữ nghĩa là một tập hợp/một chồng (stack) các ngôn ngữ. Tất cả các lớp của Web ngữ nghĩa được sử dụng để đảm bảo độ an toàn và giá trị thông tin trở nên tốt nhất. Luan van 9 Hình 1.

Kiến trúc Web ngữ nghĩa[3] - Lớp Unicode & URI: Bảo đảm việc sử dụng tập kí tự quốc tế và cung cấp phương tiện nhằm định danh các đối tượng trong Web ngữ nghĩa.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Luận Văn Thạc Sĩ Về Mô Hình Hóa Tài Nguyên Thông Tin Trường Đại Học Và Linked Data

Bài viết này trình bày về việc xây dựng mô hình hóa tài nguyên thông tin trường đại học và ứng dụng Linked Data trong quản lý thông tin. Tác giả đã nghiên cứu và phân tích các phương pháp và công nghệ hiện đại để xây dựng mô hình hóa tài nguyên thông tin trường đại học, bao gồm việc sử dụng Linked Data để tăng cường khả năng tìm kiếm và truy cập thông tin.

Bài viết này cung cấp một cái nhìn tổng quan về việc xây dựng mô hình hóa tài nguyên thông tin trường đại học và ứng dụng Linked Data, giúp người đọc hiểu rõ hơn về các phương pháp và công nghệ hiện đại trong quản lý thông tin.

Nếu bạn muốn tìm hiểu thêm về các chủ đề liên quan, bạn có thể tham khảo các bài viết sau:

Thực trạng áp dụng chuẩn Dublin Core trong biên mục tài liệu số tại thư viện Tạ Quang Bửu, Trường Đại học Bách Khoa Hà Nội - Bài viết này trình bày về việc áp dụng chuẩn Dublin Core trong biên mục tài liệu số tại thư viện Tạ Quang Bửu, Trường Đại học Bách Khoa Hà Nội.

Luận Văn Thạc Sĩ: Hệ Thống Thông Tin Quản Lý Cổng Thông Tin Điện Tử Cho Trung Tâm Công Nghệ Thông Tin Và Truyền Thông - Bài viết này trình bày về việc xây dựng hệ thống thông tin quản lý cổng thông tin điện tử cho trung tâm công nghệ thông tin và truyền thông.

Luận Văn Thạc Sĩ Về Quản Lý Thông Tin Giao Thông Đô Thị Qua Dữ Liệu Cộng Đồng - Bài viết này trình bày về việc quản lý thông tin giao thông đô thị qua dữ liệu cộng đồng.

Tất cả các bài viết này đều có liên quan đến chủ đề quản lý thông tin và công nghệ thông tin, giúp người đọc hiểu rõ hơn về các phương pháp và công nghệ hiện đại trong lĩnh vực này.

#Luận văn Thạc sĩ

#công nghệ thông tin

#tài nguyên giáo dục

#quản lý thông tin

#khai thác dữ liệu

#mô hình hóa tài nguyên thông tin

Chủ đề

Công nghệ thông tin trong giáo dục

Quản lý và chia sẻ tài nguyên thông tin

Phát triển hệ thống thông tin đại học

Xu hướng và ứng dụng của Linked Data

Luận Văn Thạc Sĩ Về Mô Hình Hóa Tài Nguyên Thông Tin Trường Đại Học Và Linked Data

LỜI CAM ĐOAN

LỜI CẢM ƠN

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA VÀ LINKED DATA

1.1. Tổng quan về Web ngữ nghĩa

1.1.1. Web của ngày hôm nay

1.1.2. Web ngữ nghĩa

1.1.3. Siêu dữ liệu

1.1.4. Kiến trúc Web ngữ nghĩa

1.1.5. Các khái niệm cơ bản của Web ngữ nghĩa

1.2. Ngôn ngữ Cơ cấu mô tả tài nguyên

1.2.1. Ngôn ngữ mô tả tài nguyên RDF

1.2.2. Lược đồ RDF và truy vấn RDF

1.3. Khái niệm về Linked Data

1.3.1. Quy tắc Linked Data

1.4. Tiểu kết chương 1

2. CHƯƠNG 2: ỨNG DỤNG QUẢN LÝ VÀ TRUY XUẤT TÀI NGUYÊN THÔNG TIN TRONG TRƯỜNG ĐẠI HỌC – LINKED OPEN PTIT DATA (LOPD)

2.1. Tiến trình xây dựng ứng dụng LOPD

2.2. Kiến trúc Jena 3

2.2.1. Mô hình hóa thông tin với Jena

2.2.2. Chương trình Hello World! trong Jena

2.2.3. Tạo mô hình RDF

2.2.4. Đọc mô hình RDF

2.3. Chuyển đổi dữ liệu web ngữ nghĩa

2.3.1. Dữ liệu từ Excel

2.3.2. Dữ liệu từ DBF

2.3.3. Chuẩn Dublin Core Metadata

2.4. Tiểu kết Chương 2

3. CHƯƠNG 3: PHÁT TRIỂN ỨNG DỤNG LOPD

3.1. Giới thiệu bài toán

3.1.1. Yêu cầu bài toán

3.1.2. Phân tích vấn đề

3.1.3. Chuẩn bị dữ liệu

3.2. Giải pháp hệ thống

3.2.1. Kiến trúc hệ thống

3.2.2. Thiết kế cơ sở dữ liệu

3.2.3. Xây dựng ứng dụng

3.2.3.1. Mô tả User case

3.2.3.2. Đặc tả chức năng

3.2.3.3. Thiết kế giao diện

KẾT LUẬN VÀ KIẾN NGHỊ

DANH MỤC TÀI LIỆU THAM KHẢO

I. Tổng quan về mô hình hóa tài nguyên thông tin

1.1. Khái niệm về Linked Data

II. Ứng dụng quản lý và truy xuất tài nguyên thông tin

2.1. Tiến trình xây dựng ứng dụng LOPD

III. Phát triển ứng dụng LOPD

3.1. Giải pháp hệ thống

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Nguyễn Văn Nhân

Người hướng dẫn: PGS. Hoàng Hữu Hạnh

Trường học: Học viện Công nghệ Bưu chính Viễn thông

Chuyên ngành: Hệ thống thông tin

Đề tài: Mô Hình Hóa Tài Nguyên Thông Tin Đại Học Với Linked Data

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2020

Địa điểm: Hà Nội

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm