Nghiên cứu đánh giá chất lượng cơ sở dữ liệu thư mục tại Viện Thông tin Khoa học Xã hội (2008)

Chuyên ngành

Khoa học Thư viện

Người đăng

Ẩn danh

Thể loại

Luận văn thạc sĩ

2008

90
0
0

Phí lưu trữ

30 Point

Tóm tắt

I. Toàn cảnh luận văn đánh giá chất lượng CSDL thư mục tại ISSI

Trong bối cảnh thông tin trở thành nguồn lực thiết yếu, luận văn thạc sĩ khoa học thư viện của tác giả Trần Thị Kiều Nga (2008) mang ý nghĩa tiên phong trong việc đánh giá chất lượng cơ sở dữ liệu thư mục tại một trong những cơ quan đầu ngành - Viện Thông tin Khoa học Xã hội (ISSI). Nghiên cứu này ra đời từ nhận thức rằng, mặc dù Viện đã tự động hóa và xây dựng nhiều cơ sở dữ liệu thư mục (CSDL), chất lượng thực sự của chúng vẫn là một câu hỏi chưa có lời giải đáp hệ thống. Luận văn không chỉ là một công trình nghiên cứu khoa học đơn thuần mà còn là một nỗ lực thực tiễn nhằm cải thiện sản phẩm thông tin, đáp ứng nhu cầu ngày càng cao của người dùng tin. Mục tiêu chính của đề tài là xây dựng một bộ tiêu chí đánh giá cụ thể, áp dụng chúng để phân tích hiện trạng và từ đó đề xuất các giải pháp khả thi nhằm nâng cao chất lượng CSDL. Bằng cách tiếp cận này, luận văn đã mở ra một hướng đi quan trọng cho các trung tâm thông tin - thư viện khác trong việc quản lý và tối ưu hóa các nguồn tin thư mục của mình. Tầm quan trọng của việc này càng được nhấn mạnh khi thông tin trong nền kinh tế thị trường được xem như một loại hàng hóa đặc biệt, đòi hỏi chất lượng và sự phù hợp với yêu cầu của "khách hàng" - tức người dùng tin. Nghiên cứu tập trung vào 7 CSDL thư mục được sử dụng nhiều nhất tại Viện, sử dụng các phương pháp phân tích, thống kê, và hệ thống hóa để đưa ra những kết luận xác đáng.

1.1. Tầm quan trọng của cơ sở dữ liệu thư mục trong nghiên cứu KHXH

Các cơ sở dữ liệu thư mục, hay bibliographic database, đóng vai trò xương sống cho hoạt động nghiên cứu khoa học xã hội. Chúng là công cụ giúp các nhà nghiên cứu, sinh viên và cán bộ khoa học nhanh chóng định vị, truy cập các tài liệu quan trọng giữa một biển thông tin khổng lồ. Tại Viện Thông tin Khoa học Xã hội, với nguồn tài liệu quý hiếm kế thừa từ Viện Viễn Đông Bác Cổ, việc xây dựng các CSDL hiệu quả càng trở nên cấp thiết. Một biểu ghi thư mục chất lượng, chứa đầy đủ siêu dữ liệu (metadata) chính xác, giúp rút ngắn thời gian tìm kiếm, tăng hiệu suất làm việc và đảm bảo tính toàn diện của các công trình nghiên cứu. Thiếu một hệ thống CSDL được đánh giá và cải tiến liên tục, các nhà nghiên cứu sẽ gặp khó khăn trong việc khai thác hết tiềm năng của vốn tài liệu, dẫn đến các quyết định nghiên cứu thiếu cơ sở khoa học.

1.2. Giới thiệu Viện Thông tin Khoa học Xã hội ISSI và nguồn lực

Viện Thông tin Khoa học Xã hội (ISSI) là cơ quan thông tin - thư viện đầu ngành về lĩnh vực khoa học xã hội tại Việt Nam. Viện quản lý một khối lượng tài liệu đồ sộ và quý giá, bao gồm sách, tạp chí, ảnh, bản đồ, và các tài liệu chuyên biệt như thần tích, hương ước. Đối tượng người dùng tin của Viện rất đa dạng, từ sinh viên, cán bộ nghiên cứu trong nước đến các học giả quốc tế, với yêu cầu cao về chất lượng thông tin. Để đáp ứng nhu cầu này, Viện đã triển khai tự động hóa và xây dựng 14 CSDL thư mục bằng phần mềm CDS/ISIS. Tuy nhiên, việc phát triển nhanh chóng này cũng đặt ra thách thức về việc đảm bảo tính đồng bộ và chất lượng của các sản phẩm thông tin, tạo tiền đề cho sự ra đời của luận văn thạc sĩ này.

II. Thách thức cốt lõi khi đánh giá chất lượng CSDL thư mục

Thách thức lớn nhất mà luận văn thạc sĩ chỉ ra là sự thiếu vắng một nghiên cứu tổng thể và hệ thống về việc đánh giá chất lượng dịch vụ thông tin tại Viện Thông tin Khoa học Xã hội. Trước đây, các đánh giá chỉ dừng lại ở những phản hồi rời rạc của độc giả hoặc các con số thống kê cuối năm, không phản ánh được bản chất và các vấn đề sâu xa của hệ thống. Luận văn khẳng định, để cải thiện, trước hết cần phải đo lường. Việc thiếu một bộ tiêu chí đánh giá chất lượng chuẩn hóa đã dẫn đến tình trạng các CSDL được nghiệm thu một cách chung chung, không chỉ ra được các điểm yếu cần khắc phục. Một vấn đề khác là sự không đồng đều trong quy trình tạo lập CSDL. Mỗi CSDL, đặc biệt là các CSDL theo chủ đề, được xây dựng như một đề tài khoa học riêng lẻ, thiếu sự chuẩn hóa trong xử lý dữ liệu, từ việc mô tả hình thức đến định từ khóa. Điều này tạo ra sự thiếu nhất quán, gây khó khăn cho người dùng và làm giảm giá trị tổng thể của các nguồn tin thư mục. Thêm vào đó, năng lực không đồng đều của đội ngũ cán bộ cũng là một yếu tố ảnh hưởng trực tiếp đến chất lượng của các biểu ghi thư mụcsiêu dữ liệu.

2.1. Hiện trạng thiếu các nghiên cứu đánh giá CSDL một cách hệ thống

Theo tác giả Trần Thị Kiều Nga, tại thời điểm nghiên cứu (2008), "chưa có một nghiên cứu nào mang tính tổng thể và hệ thống về việc đánh giá chất lượng các CSDL thư mục đang được phục vụ tại Viện". Các nhận xét chủ yếu mang tính cá nhân, thiếu cơ sở khoa học và không được ghi nhận một cách bài bản. Thực trạng này không chỉ xảy ra ở Viện mà còn là vấn đề chung của nhiều thư viện khoa học tại Việt Nam. Việc thiếu các công cụ và phương pháp đánh giá chuyên biệt khiến các nhà quản lý khó có thể xác định được hiệu quả đầu tư và định hướng phát triển cho hệ thống CSDL, một cấu phần quan trọng của thông tin học hiện đại.

2.2. Sự cần thiết của việc xây dựng bộ tiêu chí đánh giá chất lượng

Để khắc phục khoảng trống trên, luận văn nhấn mạnh tính cấp thiết của việc xây dựng một bộ tiêu chí đánh giá chất lượng cụ thể và khoa học. Một bộ tiêu chí rõ ràng sẽ là công cụ để đo lường, so sánh và xác định các điểm mạnh, điểm yếu của từng CSDL. Nó không chỉ phục vụ cho công tác nghiệm thu các đề tài mà còn là kim chỉ nam cho quá trình vận hành, bảo trì và nâng cao chất lượng CSDL trong tương lai. Việc đánh giá này giúp chuyển từ cách làm việc cảm tính sang quản lý dựa trên dữ liệu, đảm bảo các sản phẩm thông tin đáp ứng tốt hơn mức độ hài lòng của người dùng.

III. Phương pháp xây dựng bộ tiêu chí đánh giá CSDL thư mục

Để giải quyết bài toán đánh giá, luận văn đã áp dụng phương pháp tổng hợp, tức là xem xét từng thành phần cấu thành nên một cơ sở dữ liệu thư mục để đánh giá chất lượng tổng thể. Tác giả đã nghiên cứu và đề xuất một bộ khung gồm bốn tiêu chí đánh giá chất lượng chính, được xây dựng dựa trên thực tiễn tại Viện Thông tin Khoa học Xã hội. Bộ tiêu chí này vừa mang tính lý luận của ngành khoa học thư viện, vừa có tính ứng dụng cao. Tiêu chí đầu tiên tập trung vào nền tảng công nghệ và quy trình: Phần mềm và chu trình tạo lập CSDL. Tiêu chí này xem xét sự phù hợp của hệ quản trị CSDL thư viện (cụ thể là CDS/ISIS) và tính hợp lý của quy trình làm việc. Tiêu chí thứ hai là Mức độ bao quát nguồn tin, đo lường sự đầy đủ của dữ liệu được nhập so với tổng thể nguồn tài liệu hiện có. Tiêu chí thứ ba, và cũng là quan trọng nhất, là Chất lượng dữ liệu, phân tích sâu vào độ chính xác của dữ liệu mô tả hình thức và nội dung. Cuối cùng là tiêu chí Khả năng tìm kiếm linh hoạt, đánh giá hiệu quả tương tác giữa người dùng và hệ thống. Mặc dù tiêu chí về khảo sát người dùng tin được công nhận là quan trọng, luận văn cho rằng nó chưa khả thi tại thời điểm đó do người dùng chưa được đào tạo đầy đủ.

3.1. Tiêu chí 1 2 Phần mềm và Mức độ bao quát nguồn tin

Luận văn phân tích việc Viện sử dụng phần mềm CDS/ISIS. Mặc dù là lựa chọn tối ưu về mặt chi phí tại thời điểm ban đầu, CDS/ISIS đã bộc lộ nhiều hạn chế như không tương thích hoàn toàn với chuẩn biên mục MARC 21 và không hỗ trợ Unicode triệt để. Về mức độ bao quát nguồn tin, kết quả đánh giá cho thấy sự không đồng đều. Một số CSDL như Thần tích - Thần sắc đạt 100% mức độ bao quát, trong khi những CSDL lớn và phức tạp hơn như Bài trích tạp chí chỉ đạt khoảng 15%, hay CSDL sách của Viện chỉ đạt 60%. Những con số này cho thấy một bức tranh rõ ràng về những khoảng trống dữ liệu cần được bổ sung.

3.2. Tiêu chí 3 4 Chất lượng dữ liệu và Khả năng tìm kiếm

Chất lượng dữ liệu là tiêu chí được phân tích sâu nhất. Luận văn đã chỉ ra hàng loạt vấn đề: lỗi chính tả nghiêm trọng trong các biểu ghi thư mục, kể cả tiếng Việt và ngoại ngữ; sự không nhất quán trong việc áp dụng chuẩn biên mục MARC 21; và đặc biệt là chất lượng định từ khóa. Các từ khóa được định tự do, không theo một bộ từ chuẩn nào, dẫn đến tình trạng nhiễu tin, sót tin khi tìm kiếm. Về khả năng tìm kiếm, dù phần mềm CDS/ISIS có hỗ trợ các toán tử logic, nhưng chất lượng dữ liệu đầu vào kém đã làm giảm đáng kể hiệu quả tìm kiếm, ảnh hưởng trực tiếp đến mức độ hài lòng của người dùng.

IV. Kết quả nghiên cứu chất lượng các CSDL thư mục tại ISSI

Áp dụng bộ tiêu chí đã xây dựng, luận văn thạc sĩ đã tiến hành đánh giá chi tiết 7 cơ sở dữ liệu thư mục trọng điểm tại Viện. Kết quả cho thấy một bức tranh đa chiều với cả những điểm sáng và những tồn tại lớn cần khắc phục. Về mặt tích cực, các CSDL hồi cố, có phạm vi dữ liệu đóng như Thần tích - Thần sắc và Hương ước có chất lượng tương đối tốt, mức độ bao quát cao và ít lỗi dữ liệu. Tuy nhiên, đối với các CSDL lớn, động và vẫn đang được cập nhật như CSDL sách Viện Thông tin KHXH, CSDL bài trích tạp chí, và CSDL sách Viện KHXH, chất lượng lại là một vấn đề đáng báo động. Các lỗi phổ biến được ghi nhận bao gồm sai chính tả, không tuân thủ quy tắc mô tả ISBD, nhập sai mã ngôn ngữ, và sự không nhất quán trong việc định từ khóa. Ví dụ, khảo sát 200 biểu ghi trong CSDL sách Viện KHXH đã phát hiện 13 biểu ghi có lỗi chính tả. Nghiên cứu cũng chỉ ra sự nhầm lẫn cơ bản giữa 'môn loại' và 'chủ đề' trong thiết kế tìm kiếm, gây khó khăn cho người dùng. Những phát hiện này không chỉ là những con số, mà là bằng chứng cụ thể cho thấy sự cần thiết phải có những giải pháp can thiệp mang tính hệ thống để nâng cao chất lượng CSDL.

4.1. Thực trạng lỗi dữ liệu hình thức Sai chính tả và chuẩn biên mục

Phân tích của luận văn cho thấy lỗi dữ liệu hình thức là vấn đề trầm trọng. Ví dụ, trong CSDL sách kho cũ, các từ trong nhan đề thường bị nhập dính liền ("lighthouse" thay vì "light house"). Trong CSDL sách Viện Thông tin KHXH, có tới 16.790 biểu ghi thư mục nhập sai mã ngôn ngữ tiếng Pháp từ "fre" thành "fr". Những lỗi tưởng chừng nhỏ nhặt này thực chất ảnh hưởng lớn đến khả năng trao đổi dữ liệu và tìm kiếm chính xác, đi ngược lại nguyên tắc của chuẩn biên mục MARC 21 và các tiêu chuẩn thông tin học quốc tế.

4.2. Hạn chế trong xử lý dữ liệu nội dung Từ khóa và phân loại

Về mặt nội dung, vấn đề lớn nhất là việc định từ khóa. Luận văn chỉ ra rằng các từ khóa được định một cách tự do, không có sự kiểm soát, dẫn đến tình trạng cùng một chủ đề nhưng có nhiều cách diễn đạt khác nhau. Hơn nữa, có CSDL hoàn toàn không được định từ khóa nội dung (ví dụ CSDL sách kho cũ). Việc này làm cho tính năng tìm kiếm theo chủ đề trở nên kém hiệu quả, buộc người dùng phải dựa vào các thông tin mô tả hình thức như tác giả, nhan đề. Đây là một hạn chế lớn, làm giảm giá trị sử dụng của cơ sở dữ liệu thư mục trong môi trường thư viện khoa học hiện đại.

V. Top 3 giải pháp nâng cao chất lượng CSDL thư mục hiệu quả

Từ những phân tích sâu sắc về hiện trạng, chương cuối của luận văn thạc sĩ đã đề xuất một hệ thống các giải pháp chiến lược nhằm nâng cao chất lượng CSDL tại Viện Thông tin Khoa học Xã hội. Các giải pháp này không chỉ mang tính kỹ thuật mà còn tập trung vào yếu tố con người và quy trình, tạo ra một sự thay đổi bền vững. Đây là những kinh nghiệm quý báu không chỉ cho ISSI mà còn cho bất kỳ trung tâm thông tin - thư viện nào đang đối mặt với những thách thức tương tự. Ba giải pháp cốt lõi được nhấn mạnh bao gồm: Chuẩn hóa toàn diện các bước trong quy trình tạo lập CSDL, xây dựng và áp dụng quy trình chuẩn hóa cho việc định từ khóa, và cuối cùng là đầu tư vào việc nâng cao năng lực nghiệp vụ cho đội ngũ cán bộ. Việc thực hiện đồng bộ các giải pháp này sẽ giúp giải quyết tận gốc các vấn đề về chất lượng đã được chỉ ra, từ lỗi chính tả, sự thiếu nhất quán trong biên mục, đến hiệu quả tìm kiếm thông tin. Mục tiêu cuối cùng là tạo ra các sản phẩm bibliographic database thực sự tin cậy, hiệu quả và đáp ứng tốt nhất nhu cầu của người dùng tin, khẳng định vai trò của thư viện trong kỷ nguyên số.

5.1. Giải pháp 1 Chuẩn hóa quy trình tạo lập và định từ khóa

Giải pháp quan trọng hàng đầu là chuẩn hóa toàn bộ quy trình, từ khâu lựa chọn dữ liệu, xử lý hình thức, xử lý nội dung đến nhập liệu và kiểm duyệt. Luận văn đề xuất cần xây dựng các văn bản hướng dẫn nghiệp vụ chi tiết. Đặc biệt, cần chuẩn hóa quy trình định từ khóa. Thay vì định từ khóa tự do, Viện cần xây dựng một bộ từ khóa có kiểm soát (controlled vocabulary) hoặc một từ điển thuật ngữ chuẩn cho lĩnh vực khoa học xã hội. Điều này đảm bảo tính nhất quán và đơn nghĩa cho các từ khóa, giúp cải thiện drasticaly hiệu quả tìm kiếm và giảm thiểu nhiễu thông tin trong biểu ghi thư mục.

5.2. Giải pháp 2 Nâng cao năng lực nghiệp vụ cho cán bộ thư viện

Con người là yếu tố quyết định. Luận văn nhấn mạnh sự cần thiết của việc tổ chức các khóa đào tạo, bồi dưỡng thường xuyên cho cán bộ. Nội dung đào tạo cần tập trung vào các kiến thức và kỹ năng mới trong ngành thông tin họckhoa học thư viện, như áp dụng thành thạo chuẩn biên mục MARC 21, kỹ năng định từ khóa chuyên sâu, và các phương pháp kiểm soát chất lượng dữ liệu. Một đội ngũ cán bộ có trình độ đồng đều và chuyên nghiệp là nền tảng vững chắc nhất để đảm bảo chất lượng của các cơ sở dữ liệu thư mục.

5.3. Giải pháp 3 Cải tiến công nghệ và khảo sát người dùng tin

Về lâu dài, Viện cần xem xét nâng cấp hoặc thay thế hệ quản trị CSDL thư viện CDS/ISIS bằng một phần mềm hiện đại hơn, hỗ trợ đầy đủ Unicode, MARC 21 và có khả năng tích hợp tốt hơn. Song song với đó, việc triển khai các hoạt động khảo sát người dùng tin một cách bài bản là vô cùng cần thiết. Thu thập phản hồi từ người dùng sẽ cung cấp những thông tin quý giá để cải tiến giao diện, tính năng tìm kiếm và nội dung của CSDL, đảm bảo mức độ hài lòng của người dùng luôn được đặt lên hàng đầu.

27/07/2025
Luận văn thạc sĩ khoa học thư viện nghiên cứu đánh giá chất lượng cơ sở dữ liệu thư mục tại viện thông tin khoa học xã hội