Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức
Công nghệ thông tin là một trong những động lực quan
trọng nhất và là giải pháp hàng đầu cho sự phát triển, góp phần
biến đổi một cách tích cực nhiều lĩnh vực của đời sống xã hội, trong
đó có hoạt động lưu trữ - thư viện và hoạt động nghiên cứu khoa
học nói chung, nghiên cứu khoa học xã hội và nhân văn nói riêng.
Vai trò và mối liên hệ mật thiết giữa tài liệu lưu trữ và tư liệu với
lĩnh vực nghiên cứu khoa học xã hội và nhân văn đã được khẳng
định và chứng minh. Nếu tài liệu lưu trữ và tư liệu đóng vai trò là
chất liệu, là “bột” thì các kết quả nghiên cứu khoa học xã hội và
nhân văn là “hồ”. Dưới tác động của cuộc cách mạng công nghệ
4.0, hai nhân tố này chắc chắn có những sự ảnh hưởng nhất định.
Bài tham luận này đề cập đến sự tác động của công nghệ số, đặc
biệt là công cụ của Nhân văn số thức đối với mối quan hệ nói trên.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Tóm tắt nội dung tài liệu: Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức
LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC Cam Anh Tuấn1* - Đỗ Thu Hiền** Tóm tắt: Công nghệ thông tin là một trong những động lực quan trọng nhất và là giải pháp hàng đầu cho sự phát triển, góp phần biến đổi một cách tích cực nhiều lĩnh vực của đời sống xã hội, trong đó có hoạt động lưu trữ - thư viện và hoạt động nghiên cứu khoa học nói chung, nghiên cứu khoa học xã hội và nhân văn nói riêng. Vai trò và mối liên hệ mật thiết giữa tài liệu lưu trữ và tư liệu với lĩnh vực nghiên cứu khoa học xã hội và nhân văn đã được khẳng định và chứng minh. Nếu tài liệu lưu trữ và tư liệu đóng vai trò là chất liệu, là “bột” thì các kết quả nghiên cứu khoa học xã hội và nhân văn là “hồ”. Dưới tác động của cuộc cách mạng công nghệ 4.0, hai nhân tố này chắc chắn có những sự ảnh hưởng nhất định. Bài tham luận này đề cập đến sự tác động của công nghệ số, đặc biệt là công cụ của Nhân văn số thức đối với mối quan hệ nói trên. Từ khóa: Lưu trữ số; Thư viện số; Nhân văn số thức; Khai thác dữ liệu. 1. QUAN NIỆM VỀ LƯU TRỮ, THƯ VIỆN SỐ VÀ NHÂN VĂN SỐ THỨC (DIGITAL HUMANITIES) Trong bối cảnh của cuộc cách mạng công nghệ 4.0, ngành thư viện và lưu trữ học chịu nhiều tác động khi việc ứng dụng công nghệ thông tin, trở thành cơ hội nhưng cũng là thách thức. Ngành lưu trữ và thư viện số xuất hiện một cách tất yếu trước sự phát triển như vũ bão của công nghệ thông tin và nhu cầu sử dụng tài liệu lưu trữ, tư liệu của xã * Tiến sĩ, Khoa Lưu trữ học và Quản trị Văn phòng, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Hà Nội. ** Thạc sĩ, Khoa Lưu trữ học và Quản trị Văn phòng, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Hà Nội. 423 LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC hội ngày một gia tăng. Từ số hóa tài liệu lưu trữ đến tài liệu lưu trữ điện tử (born-digital archives) là một sự thay đổi lớn, đánh dấu sự xuất hiện của một dạng thức lưu trữ mới – Lưu trữ số. Sự thay đổi mang tính cách mạng này của ngành Lưu trữ cùng với sự phát triển trước đó của Thư viện số đã khiến việc sử dụng tài liệu lưu trữ, tư liệu không bị bó hẹp trong các phòng đọc “vật lý” mà được mở rộng trong một không gian số rộng lớn vô cực. Thời gian tra tìm dữ liệu có thể tính bằng giây mà kết quả đem lại vô cùng phong phú, đa dạng và toàn diện. Tài liệu lưu trữ sẽ không còn nằm “lặng im” trong các kho lưu trữ mà sẽ có một “đời sống sôi động” cùng với vô số nguồn tư liệu khác như một tất yếu. Sẽ còn quá sớm để khẳng định những điều tích cực đem lại, những rủi ro tiềm ẩn nhưng tựu chung lại, lưu trữ số sẽ là bước ngoặt quan trọng đối với Lưu trữ học và cộng đồng những người làm nghề lưu trữ không chỉ ở Việt Nam mà tất cả các nước trên thế giới. Là hệ quả ra đời bởi sự kết hợp giữa những người làm công nghệ thông tin và các nhà nghiên cứu khoa học xã hội và nhân văn, Nhân văn số thức đã xuất hiện và có sự phát triển vượt bậc trong một thập kỷ gần đây và trở thành “đối tác” quan trọng của nhiều ngành khoa học như lịch sử, văn học – nghệ thuật, ngôn ngữ, thông tin – thư viện, lưu trữ Sự kết hợp giữa Nhân văn số thức và các ngành này đều hướng tới mục đích nâng cao hiệu quả làm việc của người nghiên cứu trong bối cảnh công nghệ số chi phối đời sống xã hội một cách căn bản. Nhân văn số thức (Digital humanities) là thuật ngữ mô tả lĩnh vực liên ngành nghiên cứu sự tác động và mối quan hệ giữa công nghệ máy tính và công việc của những người nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn (Borgan, Friedlander, Presner, 2009). Tại Úc, nhân văn số thức được nghiên cứu ở hai khía cạnh: Một là, phát triển các công cụ phần mềm và ứng dụng các chức năng của nó trong việc thực hiện các phương pháp nghiên cứu của khoa học xã hội và nhân văn. Hai là, nghiên cứu về cách thức mà các công cụ phần mềm làm thay đổi việc thực hiện nghiên cứu khoa học xã hội và nhân văn. Hay nói cách khác, một mặt, nhân văn số thức phát triển các công cụ phục vụ nghiên cứu khoa học xã hội và nhân văn (dưới góc độ công nghệ thông tin). Mặt khác, nhân văn số thức nghiên cứu mọi khía cạnh liên quan đến quản lý: cách thức tạo ra các dự án nhân văn số thức, cách thức biến đổi một cách căn bản việc thực hiện nghiên cứu. 424 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM Nhân văn số thức được coi là công cụ xử lý tất cả các dữ liệu đầu vào, bao gồm các dữ liệu khoa học, dữ liệu xã hội, dữ liệu pháp lý; dữ liệu quá khứ, dữ liệu hiện hành, được thể hiện ở nhiều dạng thức khác nhau. Đầu ra của Nhân văn số thức sẽ là các kết quả nghiên cứu phục vụ cho các nhà khoa học xã hội và nhân văn. Bản chất của các nghiên cứu xã hội và nhân văn là dựa trên kết quả xử lý các dữ liệu đa dạng để tìm thấy quy luật vận động của xã hội và con người. Trong khi, khoa học tự nhiên đi tìm các quy luật vận động của tự nhiên. Khoa học tự nhiên có thể thực nghiệm các giả thuyết nghiên cứu trong phòng thí nghiệm để tìm ra câu trả lời chính xác cho các sự vật, hiện tượng tự nhiên. Đối với khoa học xã hội và nhân văn, gần như là không thể tiến hành các thực nghiệm, do vậy, kết quả nghiên cứu của họ phụ thuộc vào khối lượng và chất lượng của các dữ liệu thu thập được. Hình 1: Mối quan hệ của 03 yếu tố: Dữ liệu đầu vào – Nhân văn số thức – Kết quả nghiên cứu 2. MỐI QUAN HỆ GIỮA LƯU TRỮ, THƯ VIỆN SỐ VÀ NHÂN VĂN SỐ THỨC Tài liệu lưu trữ là nguồn dữ liệu quan trọng hình thành trong hoạt động của các tổ chức, cá nhân, có giá trị và khả năng phục vụ đắc lực cho các nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn, trong đó đặc biệt phải kể đến các ngành khoa học như lịch sử, luật, văn hoá, xã hội Những dữ liệu này cũng như các dạng tư liệu của các thư viện khi tồn tại ở dạng số sẽ là một trong những đầu vào quan trọng của Nhân văn số thức. Đến lượt mình, Nhân văn số thức xử lý các dữ liệu từ tài liệu lưu trữ số, tích hợp kết quả xử lý các dạng tư liệu khác và nhờ đó chiết xuất các kết quả đầu ra phục vụ các nhu cầu khác nhau của những người nghiên cứu trong lĩnh vực khoa học xã 425 LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC hội và nhân văn. Như vậy, Lưu trữ số với nguyên liệu là các loại hình tài liệu lưu trữ và tư liệu số hoá hoặc tài liệu số (born-digital) phong phú, có độ tin cậy cao, được cấu trúc chặt chẽ, quy chuẩn về mặt dữ liệu sẽ đóng vai trò là một trong những nguồn dữ liệu số đầu vào quan trọng của Nhân văn số thức. Lưu trữ số có thể được đánh giá là một trong những nguồn dữ liệu đầu vào chất lượng nhất đối với hoạt động của Nhân văn số thức. Ở một góc tiếp cận khác, nếu xét Nhân văn số thức là sự tổng hoà giữa công nghệ, kỹ thuật, phần cứng, phần mềm, các dữ liệu, siêu dữ liệu hay dữ liệu lớn, thì Lưu trữ số và thư viện số là hai trong những phân hệ quan trọng của Nhân văn số thức. Như vậy, Lưu trữ số là một bước tiến quan trọng, cùng với thư viện số để phát huy giá trị thông tin của tài liệu lưu trữ và tư liệu khác trong các công trình nghiên cứu khoa học xã hội và nhân văn. Để làm được điều này, Lưu trữ và Thư viện số cần được kết nối một cách mạnh mẽ với Nhân văn số thức. Tại Hoa Kỳ, sự thành công của dự án Kho lưu trữ Rossetti và The William Blake Archive (2006) đã đặt Nhân văn số thức đứng trên một góc độ mới đa chiều hơn. Đồng thời, việc xuất bản cuốn A Companion to Digital Humanities là một bước ngoặt đối với nghiên cứu Nhân văn số thức, và đưa Nhân văn số thức trở về với đúng tiềm năng của nó, không chỉ đơn thuần là số hóa tài liệu hay một ngành chỉ hỗ trợ về mặt máy móc đối với người nghiên cứu. Có thể nói, Nhân văn số thức xuất phát từ một vị trí thấp, là một công cụ hỗ trợ phục vụ nghiên cứu trở thành một ngành khoa học với tiềm năng lớn tạo nên cuộc cách mạng trong nghiên cứu khoa học xã hội và nhân văn thông qua việc thay đổi phương thức nghiên cứu của các nhà khoa học. Xét dưới góc độ lợi ích của việc vận dụng thành tựu Nhân văn số thức trong nghiên cứu khoa học xã hội và nhân văn thì Nhân văn số thức cung cấp các công cụ tìm kiếm thông tin đối với một khối lượng dữ liệu lớn, hỗ trợ người nghiên cứu trong tìm kiếm và xử lý một khối lượng lớn dữ liệu phục vụ cho quá trình nghiên cứu của mình. Một dự án nhân văn số thức có thể quy mô như hình thức phòng đọc ảo/ phòng đọc trực tuyến (độc giả có thể truy cập, khai thác tài liệu lưu trữ và tư liệu của một hoặc nhiều kho lưu trữ, thư viện), triển lãm trực tuyến không gian ba chiều được tổ chức tại nhiều quốc gia phát triển như Hoa Kỳ, Anh, 426 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM Úc, Pháp hoặc có thể đơn giản là một tập hợp các dữ liệu có chủ đề cụ thể dưới dạng số (độc giả có thể truy cập, tiếp cận các dữ liệu dưới nhiều dạng khác nhau như văn bản, hình ảnh 3D, biểu đồ, bản vẽ liên quan cùng một chủ đề cụ thể). Với những ứng dụng như vậy, có thể khẳng định rằng, ưu điểm lớn nhất của Nhân văn số thức khi được áp dụng trong các ngành khoa học xã hội và nhân văn, trong đó có lưu trữ học khoa học thư viện, không phải chỉ ở sự thuận lợi trong tìm kiếm, tiếp cận dữ liệu mà là việc tạo ra mối tương quan trong dữ liệu. Sự tương quan, liên kết dữ liệu trong một hoặc nhiều kho dữ liệu lớn mà nhân văn số thức tạo ra đã giúp ngành khoa học mới này có thể mang tính cách mạng trong nghiên cứu khoa học xã hội và nhân văn. Theo GS. Paul Arthur, Trưởng khoa Nhân văn số thức và Khoa học xã hội, Trường Đại học Edith Cowan (Úc), tại các quốc gia phát triển trên thế giới, ngành Nhân văn số thức thường ra đời sau sự thành công của nhiều dự án số hóa tài liệu, tư liệu ở các ngành, lĩnh vực. Sự ra đời của Nhân văn số thức là tất yếu sau khi số hóa tài liệu, tư liệu trở nên phổ biến. Trong lĩnh vực thư viện và lưu trữ, các dự án số hóa sách, tạp chí và tài liệu lưu trữ đã được triển khai ở Úc và nhiều quốc gia phát triển khác. Tại Đài Loan, Thư viện số Lịch sử Đài Loan (Taiwan History Digital Library) là cơ quan được Hội đồng các vấn đề văn hóa (CCA) thuộc Chính phủ Đài Loan giao nhiệm vụ thực hiện hai dự án quan trọng về Kho tàng quốc gia về di sản văn hóa (2003): Số hóa tài liệu triều đình nhà Minh – Thanh về Đài Loan và số hóa các bản khế ước địa phương liên quan. Năm 2005, Trung tâm Nghiên cứu Nhân văn số thức thuộc Đại học Quốc gia Đài Loan tham gia dự án với vai trò tăng số lượng tài liệu, tư liệu liên quan được thu thập từ nhiều tổ chức khác nhau. Tổng số hơn 100.000 tài liệu và tư liệu lưu trữ (chứa 180 triệu ký tự) được thu thập từ 170 nguồn và được số hóa, hoàn chỉnh siêu dữ liệu (metadata). Trung tâm đã xây dựng công cụ Nhân văn số thức hỗ trợ các nhà khoa học trong việc tra tìm và xử lý khối dữ liệu lớn phục vụ nghiên cứu. Một trong những ưu điểm của các công cụ này trong xử lý dữ liệu là các kết quả truy xuất dữ liệu thông qua trực quan hóa dữ liệu bằng bản đồ, biểu đồ, đồ thị Chẳng hạn, phân bổ theo thời gian của toàn bộ tài liệu được ban hành bởi triều đình sẽ cho thấy những thời 427 LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC điểm mà số lượng tài liệu liên quan đến Đài Loan tăng rất nhiều. Các điểm thuộc đồ thị phản ánh những năm số lượng tài liệu tăng, giảm hoặc thậm chí không có Sắc lệnh nào được ban hành. Điều này sẽ phản ánh sự kiện nào đó liên quan đến bối cảnh lịch sử Đài Loan. Nếu tra cứu tư liệu lịch sử, chúng ta sẽ nhận thấy sự kiện Pháp xâm lược miền Bắc Đài Loan năm 1844 và cuộc chiến tranh Trung – Pháp, tương ứng với các mốc thời gian không có dữ liệu thể hiện trên đồ thị, đồng nghĩa với việc không có tài liệu, tư liệu được lưu trữ ở giai đoạn này. Một ví dụ khác minh chứng cho tính ưu việt của công cụ Nhân văn số thức trong hai dự án đề cập ở trên là trải nghiệm tra cứu từ “bạc” xuất hiện trong các giao dịch trao đổi đất đai được thực hiện bởi các chuyên gia thuộc Trung tâm Nghiên cứu Nhân văn số thức thuộc Đại học Quốc gia Đài Loan. Công cụ máy tính có thể truy xuất hơn 20.000 từ “bạc” có các từ đứng kèm trước. Trong đó, 9.127 từ “Phật bạc” xuất hiện và nghiên cứu sâu hơn đã cho thấy những tài liệu lưu trữ này đều có nội dung đề cập tới bạc Mexico. Điều này phản ánh bạc Mexico được dùng nhiều trong các giao dịch đất đai ở Đài Loan vào cuối triều Thanh. Các chuyên gia Nhân văn số thức và công nghệ thông tin thuộc Trung tâm đã trao đổi với các nhà sử học có thẩm quyền nghiên cứu các vấn đề Đài Loan vào thời kỳ nhà Thanh, đặc biệt là lịch sử kinh tế. Kết quả cho thấy, dựa trên kết quả trực quan hóa dữ liệu, các chuyên gia thuộc Trung tâm đã nhận xét chính xác tình hình trong khi một trong số các nhà sử học nói trên thừa nhận rằng có thể kết luận về điều này sau khoảng 10 năm nghiên cứu. [1] Như vậy, sự phát triển của Nhân văn số thức nói chung và các công trình khoa học, dự án với sự cộng tác của lưu trữ, thư viện số nói riêng đã hình thành rõ nét tại các quốc gia phát triển. Lưu trữ, thư viện số đóng vai trò quan trọng trong việc xây dựng cơ sở dữ liệu (gồm siêu dữ liệu) và công cụ tra cứu tích hợp phân tích mối tương quan bên trong một khối lượng lớn dữ liệu. Tất cả tạo nên các dự án Nhân văn số thức ở nhiều cấp độ khác nhau, phục vụ nghiên cứu khoa học xã hội và nhân văn. Điều này đã được khẳng định bởi Arjun Sabharawal (2015): Sử dụng những dữ liệu định lượng trong các mô hình trực quan hóa, dòng thời gian và các biểu đồ có thể mang đến nhiều hiệu quả hơn khi kết hợp sử dụng với các thông tin về địa điểm, thời gian, tiêu đề/ trích dẫn văn bản của 428 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM tài liệu (siêu dữ liệu). Tuy nhiên, những công nghệ này cần phải làm cho chúng thích hợp với các dữ liệu định tính mà các học giả nhân văn thường sử dụng cho phân tích, giải thích và trình bày. [3] Trên đây là một số dự án về Lưu trữ số và Nhân văn số thức của một số quốc gia trên thế giới. Qua các ví dụ này, chúng tôi khẳng định về vai trò của Lưu trữ, Thư viện số đối với việc xây dựng các dự án Nhân văn số thức ở Việt Nam. Cùng với sự khởi động của dự án Hệ tri thức Việt số hoá ngày 01 tháng 01 năm 2018 là việc Thủ tướng Chính phủ ban hành Quyết định 458/QĐ-TTG ngày 03 tháng 4 năm 2020 phê duyệt Đề án “Lưu trữ tài liệu điện tử của các cơ quan nhà nước giai đoạn 2020-2025”. Những đề án nói trên chính là cơ sở pháp lý quan trọng trong lộ trình xây dựng Lưu trữ, Thư viện số và Nhân văn số thức ở Việt Nam. Chúng tôi hi vọng tham luận đã gợi ý được cho các nhà quản lý, những người làm lưu trữ, thư viện về trách nhiệm của mình trước một nền tri thức số mới sẽ trở thành hiện thực ở Việt Nam trong tương lai. TÀI LIỆU THAM KHẢO 1. Jieh Hsiang (2017), “Xây dựng hệ thống lưu trữ cho Nhân văn số thức”, Kỷ yếu Hội thảo khoa học quốc tế Digital Humanities, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. 2. Paul Arthur (2017), “Nhân văn số thức ở Australia và thế giới”, Kỷ yếu Hội thảo khoa học quốc tế Digital Humanities, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. 3. Arjun Sabharawal (2015), Digital Curation in the Digital Humanities, Chan- dos Publishing – Elsevier. Phần 3 CÁC VẤN ĐỀ VỀ THƯ VIỆN HIỆN ĐẠI
File đính kèm:
- luu_tru_va_thu_vien_so_nen_tang_xay_dung_nhan_van_so_thuc.pdf