Tổng quan nghiên cứu

Trong bối cảnh kỷ nguyên thông tin, nguồn tài nguyên số nội sinh (TNSNS) đóng vai trò then chốt trong việc phát triển các trung tâm thông tin khoa học và công nghệ. Trung tâm Thông tin Khoa học và Công nghệ Quốc gia (TTKH&CNQG) là đơn vị đầu ngành tại Việt Nam, với kho tài liệu truyền thống phong phú gồm hơn 450.000 đầu sách, gần 7.000 tên tạp chí và khoảng 9.000 báo cáo kết quả nghiên cứu. Từ năm 1987 đến nay, Trung tâm đã xây dựng và phát triển nhiều cơ sở dữ liệu (CSDL) thư mục và toàn văn, trong đó nguồn TNSNS chiếm tỷ trọng lớn, góp phần hiện đại hóa hoạt động thư viện và nâng cao hiệu quả khai thác thông tin.

Mục tiêu nghiên cứu tập trung vào việc hoàn thiện quy trình xây dựng và quản lý nguồn TNSNS tại Trung tâm, bao gồm quy trình số hóa tài liệu, xây dựng cơ sở dữ liệu và tổ chức khai thác. Phạm vi nghiên cứu từ năm 1987 đến năm 2009, tập trung tại Trung tâm TTKH&CNQG, nhằm đáp ứng nhu cầu phát triển xã hội thông tin và nâng cao chất lượng phục vụ người dùng tin (NDT). Nghiên cứu có ý nghĩa quan trọng trong việc phát triển hệ thống thông tin khoa học công nghệ quốc gia, đồng thời góp phần hoàn thiện lý luận và thực tiễn quản lý nguồn tài nguyên số trong các cơ quan thông tin – thư viện.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn vận dụng hai lý thuyết chủ đạo: duy vật biện chứng và duy vật lịch sử để phân tích quá trình phát triển nguồn TNSNS. Mô hình nghiên cứu tập trung vào ba khái niệm chính:

  • Tài nguyên số nội sinh (TNSNS): Là nguồn tài nguyên do cơ quan tự tạo lập, xử lý và lưu giữ dưới dạng số hóa, bao gồm biểu ghi thư mục, toàn văn và các bản tin điện tử.
  • Bộ sưu tập số (BSTS): Tập hợp có tổ chức các tài liệu số hóa đa phương tiện, cung cấp giao diện truy cập đồng nhất.
  • Quy trình xây dựng và quản lý nguồn TNSNS: Bao gồm các bước lựa chọn tài liệu, số hóa, xây dựng cơ sở dữ liệu, lưu giữ và khai thác.

Khung lý thuyết còn đề cập đến các chuẩn quốc tế về mô tả dữ liệu như MARC21, ISBD, AACR2, và các quy định pháp lý về quyền tác giả nhằm đảm bảo tính pháp lý và chuẩn hóa dữ liệu.

Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp phân tích tổng hợp tài liệu, quan sát và phỏng vấn trực tiếp cán bộ thông tin và người dùng tin tại Trung tâm. Cỡ mẫu khảo sát gồm toàn bộ hoạt động xây dựng và quản lý nguồn TNSNS từ năm 1987 đến 2009. Phương pháp chọn mẫu chủ yếu là chọn lọc các bộ phận chức năng liên quan trực tiếp đến công tác số hóa, xây dựng cơ sở dữ liệu và khai thác thông tin.

Phân tích dữ liệu được thực hiện bằng phương pháp định tính kết hợp định lượng, dựa trên số liệu thống kê về khối lượng tài liệu số hóa, biểu ghi trong các CSDL, số lượt truy cập và khai thác tài nguyên số. Timeline nghiên cứu trải dài từ giai đoạn đầu ứng dụng CNTT (1987) đến năm 2009, tập trung đánh giá thực trạng và đề xuất giải pháp tối ưu.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Nguồn TNSNS phong phú và đa dạng: Trung tâm sở hữu hơn 1 triệu biểu ghi trong các CSDL thư mục và toàn văn, trong đó CSDL thư mục sách có 143.969 biểu ghi, tạp chí 6.938 biểu ghi, báo cáo kết quả nghiên cứu gần 9.851 biểu ghi. CSDL toàn văn STD có gần 55.000 biểu ghi, thƣ viện điện tử phục vụ nông thôn có 112.000 biểu ghi.
  2. Ứng dụng công nghệ số hóa hiện đại: Trung tâm đã đầu tư máy scanner công nghiệp APT BookScan 1200 với tốc độ 1.200 trang/giờ, nâng cao chất lượng số hóa so với máy scanner HP 5590 trước đây.
  3. Khó khăn về khung pháp lý bản quyền: Việc số hóa gần 200.000 tài liệu chưa có sự đồng thuận rõ ràng về bản quyền, gây tranh luận giữa việc hợp pháp phục vụ nghiên cứu và vi phạm quyền tác giả.
  4. Tăng trưởng truy cập tài nguyên số: Năm 2007, Trung tâm phục vụ 70.725 lượt bạn đọc truyền thống, giảm còn 67.824 lượt năm 2008, trong khi lượt truy cập CSDL số tăng mạnh, với 28.998 lượt truy cập trong 6 tháng đầu năm 2009.

Thảo luận kết quả

Việc phát triển nguồn TNSNS tại Trung tâm đã góp phần hiện đại hóa hoạt động thư viện, chuyển đổi từ phục vụ tài liệu truyền thống sang cung cấp tài liệu trực tuyến, phù hợp với xu hướng toàn cầu. Sự đa dạng về loại hình tài liệu số hóa (văn bản, hình ảnh, phim khoa học) và áp dụng các phần mềm quản lý hiện đại như Zope, Libol, Greenstone giúp nâng cao hiệu quả quản lý và khai thác.

Tuy nhiên, các khó khăn về pháp lý bản quyền cần được giải quyết để đảm bảo tính bền vững và hợp pháp của nguồn tài nguyên số. So sánh với các nghiên cứu quốc tế, Trung tâm đã đi đầu trong việc ứng dụng công nghệ số hóa và xây dựng hệ thống CSDL tích hợp, nhưng cần tiếp tục hoàn thiện các chuẩn dữ liệu và quy trình quản lý.

Dữ liệu có thể được trình bày qua biểu đồ tăng trưởng số lượng biểu ghi trong các CSDL và bảng so sánh lượt truy cập tài nguyên số qua các năm, minh họa sự chuyển dịch từ tài liệu truyền thống sang tài liệu số.

Đề xuất và khuyến nghị

  1. Hoàn thiện khung pháp lý bản quyền: Xây dựng cơ chế xin phép và quản lý quyền tác giả rõ ràng, đảm bảo việc số hóa tài liệu tuân thủ luật sở hữu trí tuệ, giảm thiểu rủi ro pháp lý. Chủ thể thực hiện: Ban lãnh đạo Trung tâm phối hợp với Bộ KH&CN, thời gian: 1-2 năm.
  2. Nâng cao chất lượng số hóa: Đầu tư thêm thiết bị số hóa hiện đại, đào tạo kỹ thuật viên vận hành máy APT BookScan 1200 để giảm lỗi kỹ thuật như lệch trang, mờ chữ. Mục tiêu: tăng chất lượng file PDF, thời gian: 6-12 tháng.
  3. Chuẩn hóa và đồng bộ dữ liệu: Áp dụng triệt để các chuẩn quốc tế như MARC21, AACR2, Dublin Core cho tất cả các CSDL, đặc biệt là dữ liệu toàn văn, nhằm tăng khả năng trao đổi và tích hợp dữ liệu. Chủ thể: Phòng CSDL và Phòng Tin học, thời gian: 1 năm.
  4. Phát triển hệ thống khai thác trực tuyến: Mở rộng mạng VINAREN, nâng cấp phần mềm phục vụ truy cập, tăng tốc độ và bảo mật dữ liệu, nhằm nâng cao trải nghiệm người dùng và tăng lượt truy cập. Chủ thể: Phòng Tin học, thời gian: 1-2 năm.
  5. Tăng cường công tác tuyên truyền và đào tạo: Đẩy mạnh giới thiệu nguồn TNSNS tới các đối tượng người dùng, tổ chức các khóa đào tạo nghiệp vụ cho cán bộ và người dùng tin, nâng cao nhận thức về lợi ích và cách khai thác tài nguyên số. Thời gian: liên tục hàng năm.

Đối tượng nên tham khảo luận văn

  1. Cán bộ quản lý thư viện và trung tâm thông tin: Nghiên cứu quy trình xây dựng và quản lý nguồn TNSNS, áp dụng các giải pháp kỹ thuật và pháp lý để nâng cao hiệu quả hoạt động.
  2. Nhà nghiên cứu và học viên ngành khoa học thư viện, thông tin: Tài liệu tham khảo về lý thuyết, phương pháp và thực tiễn phát triển nguồn tài nguyên số trong môi trường thư viện hiện đại.
  3. Chuyên gia công nghệ thông tin trong lĩnh vực thư viện số: Tham khảo các phần mềm quản lý CSDL, kỹ thuật số hóa và chuẩn hóa dữ liệu, từ đó phát triển các giải pháp công nghệ phù hợp.
  4. Cơ quan quản lý nhà nước về khoa học công nghệ và sở hữu trí tuệ: Hiểu rõ các vấn đề pháp lý liên quan đến bản quyền trong số hóa tài liệu, từ đó xây dựng chính sách hỗ trợ phát triển nguồn tài nguyên số.

Câu hỏi thường gặp

  1. Nguồn tài nguyên số nội sinh là gì?
    Nguồn TNSNS là tài nguyên số do cơ quan tự tạo lập, xử lý và lưu giữ, bao gồm các bộ sưu tập số hóa từ tài liệu truyền thống như sách, báo cáo nghiên cứu, bài trích tạp chí và các bản tin điện tử. Ví dụ, Trung tâm TTKH&CNQG có hàng triệu biểu ghi trong các CSDL nội sinh.

  2. Quy trình số hóa tài liệu tại Trung tâm gồm những bước nào?
    Quy trình gồm lựa chọn tài liệu, quét tài liệu bằng máy scanner công nghiệp, xử lý ảnh và file PDF, kiểm tra chất lượng, lưu giữ dữ liệu trên server. Máy APT BookScan 1200 được sử dụng với tốc độ 1.200 trang/giờ, nâng cao hiệu quả số hóa.

  3. Trung tâm đã áp dụng những phần mềm nào để quản lý nguồn tài nguyên số?
    Trung tâm sử dụng nhiều phần mềm như CDS/ISIS, WINISIS, Zope, Libol, Greenstone và OJS để xây dựng, quản lý và phục vụ khai thác các CSDL thư mục và toàn văn, đáp ứng đa dạng nhu cầu người dùng.

  4. Vấn đề bản quyền trong số hóa tài liệu được xử lý ra sao?
    Hiện có hai quan điểm trái ngược về tính hợp pháp của số hóa tài liệu chưa xin phép chủ sở hữu. Luật Sở hữu trí tuệ quy định sao chép để lưu trữ phục vụ nghiên cứu là hợp pháp nhưng không được phân phối bản sao kỹ thuật số. Trung tâm đang tìm kiếm giải pháp phù hợp để tuân thủ pháp luật.

  5. Lợi ích của việc phát triển nguồn tài nguyên số nội sinh đối với Trung tâm là gì?
    Nguồn TNSNS giúp hiện đại hóa thư viện, tăng khả năng truy cập tài liệu truyền thống qua mạng, phục vụ hiệu quả lãnh đạo, quản lý và nghiên cứu khoa học, đồng thời nâng cao chất lượng dịch vụ thông tin cho người dùng trong và ngoài nước.

Kết luận

  • Nguồn tài nguyên số nội sinh tại Trung tâm TTKH&CNQG là tài sản thông tin quý giá, với hàng triệu biểu ghi trong các CSDL thư mục và toàn văn, đóng vai trò trung tâm trong hệ thống thông tin khoa học công nghệ quốc gia.
  • Quy trình xây dựng và quản lý nguồn TNSNS đã được triển khai bài bản, ứng dụng công nghệ số hóa hiện đại và phần mềm quản lý tiên tiến, tuy nhiên còn tồn tại một số hạn chế về chất lượng số hóa và chuẩn hóa dữ liệu.
  • Vấn đề pháp lý bản quyền là thách thức lớn cần được giải quyết để đảm bảo tính hợp pháp và bền vững của nguồn tài nguyên số.
  • Đề xuất các giải pháp hoàn thiện quy trình, nâng cao chất lượng số hóa, chuẩn hóa dữ liệu và phát triển hệ thống khai thác trực tuyến nhằm đáp ứng nhu cầu ngày càng cao của người dùng.
  • Tiếp tục nghiên cứu và triển khai các bước tiếp theo trong giai đoạn 2010-2015 để Trung tâm trở thành trung tâm thông tin khoa học công nghệ tầm cỡ quốc tế, phục vụ hiệu quả cho sự nghiệp phát triển khoa học và công nghệ của đất nước.

Call-to-action: Các cơ quan, tổ chức và cá nhân quan tâm đến phát triển nguồn tài nguyên số nội sinh được khuyến khích tham khảo và áp dụng các giải pháp trong luận văn nhằm nâng cao hiệu quả quản lý và khai thác tài nguyên số trong thời đại số hóa hiện nay.