Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức

Công nghệ thông tin là một trong những động lực quan

trọng nhất và là giải pháp hàng đầu cho sự phát triển, góp phần

biến đổi một cách tích cực nhiều lĩnh vực của đời sống xã hội, trong

đó có hoạt động lưu trữ - thư viện và hoạt động nghiên cứu khoa

học nói chung, nghiên cứu khoa học xã hội và nhân văn nói riêng.

Vai trò và mối liên hệ mật thiết giữa tài liệu lưu trữ và tư liệu với

lĩnh vực nghiên cứu khoa học xã hội và nhân văn đã được khẳng

định và chứng minh. Nếu tài liệu lưu trữ và tư liệu đóng vai trò là

chất liệu, là “bột” thì các kết quả nghiên cứu khoa học xã hội và

nhân văn là “hồ”. Dưới tác động của cuộc cách mạng công nghệ

4.0, hai nhân tố này chắc chắn có những sự ảnh hưởng nhất định.

Bài tham luận này đề cập đến sự tác động của công nghệ số, đặc

biệt là công cụ của Nhân văn số thức đối với mối quan hệ nói trên.

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 1

Trang 1

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 2

Trang 2

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 3

Trang 3

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 4

Trang 4

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 5

Trang 5

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 6

Trang 6

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 7

Trang 7

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức trang 8

Trang 8

pdf 8 trang baonam 7500
Bạn đang xem tài liệu "Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức

Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức
LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC
Cam Anh Tuấn1* - Đỗ Thu Hiền**
Tóm tắt: Công nghệ thông tin là một trong những động lực quan 
trọng nhất và là giải pháp hàng đầu cho sự phát triển, góp phần 
biến đổi một cách tích cực nhiều lĩnh vực của đời sống xã hội, trong 
đó có hoạt động lưu trữ - thư viện và hoạt động nghiên cứu khoa 
học nói chung, nghiên cứu khoa học xã hội và nhân văn nói riêng. 
Vai trò và mối liên hệ mật thiết giữa tài liệu lưu trữ và tư liệu với 
lĩnh vực nghiên cứu khoa học xã hội và nhân văn đã được khẳng 
định và chứng minh. Nếu tài liệu lưu trữ và tư liệu đóng vai trò là 
chất liệu, là “bột” thì các kết quả nghiên cứu khoa học xã hội và 
nhân văn là “hồ”. Dưới tác động của cuộc cách mạng công nghệ 
4.0, hai nhân tố này chắc chắn có những sự ảnh hưởng nhất định. 
Bài tham luận này đề cập đến sự tác động của công nghệ số, đặc 
biệt là công cụ của Nhân văn số thức đối với mối quan hệ nói trên.
Từ khóa: Lưu trữ số; Thư viện số; Nhân văn số thức; Khai thác dữ liệu.
1. QUAN NIỆM VỀ LƯU TRỮ, THƯ VIỆN SỐ VÀ NHÂN VĂN SỐ THỨC 
(DIGITAL HUMANITIES)
Trong bối cảnh của cuộc cách mạng công nghệ 4.0, ngành thư viện 
và lưu trữ học chịu nhiều tác động khi việc ứng dụng công nghệ thông 
tin, trở thành cơ hội nhưng cũng là thách thức. Ngành lưu trữ và thư 
viện số xuất hiện một cách tất yếu trước sự phát triển như vũ bão của 
công nghệ thông tin và nhu cầu sử dụng tài liệu lưu trữ, tư liệu của xã 
* Tiến sĩ, Khoa Lưu trữ học và Quản trị Văn phòng, Trường Đại học Khoa học 
 Xã hội & Nhân văn, Đại học Quốc gia Hà Nội. 
** Thạc sĩ, Khoa Lưu trữ học và Quản trị Văn phòng, Trường Đại học Khoa học 
 Xã hội & Nhân văn, Đại học Quốc gia Hà Nội.
423
LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC
hội ngày một gia tăng. Từ số hóa tài liệu lưu trữ đến tài liệu lưu trữ điện 
tử (born-digital archives) là một sự thay đổi lớn, đánh dấu sự xuất hiện 
của một dạng thức lưu trữ mới – Lưu trữ số. Sự thay đổi mang tính 
cách mạng này của ngành Lưu trữ cùng với sự phát triển trước đó của 
Thư viện số đã khiến việc sử dụng tài liệu lưu trữ, tư liệu không bị bó 
hẹp trong các phòng đọc “vật lý” mà được mở rộng trong một không 
gian số rộng lớn vô cực. Thời gian tra tìm dữ liệu có thể tính bằng giây 
mà kết quả đem lại vô cùng phong phú, đa dạng và toàn diện. Tài liệu 
lưu trữ sẽ không còn nằm “lặng im” trong các kho lưu trữ mà sẽ có một 
“đời sống sôi động” cùng với vô số nguồn tư liệu khác như một tất yếu. 
Sẽ còn quá sớm để khẳng định những điều tích cực đem lại, những 
rủi ro tiềm ẩn nhưng tựu chung lại, lưu trữ số sẽ là bước ngoặt quan 
trọng đối với Lưu trữ học và cộng đồng những người làm nghề lưu trữ 
không chỉ ở Việt Nam mà tất cả các nước trên thế giới.
Là hệ quả ra đời bởi sự kết hợp giữa những người làm công nghệ 
thông tin và các nhà nghiên cứu khoa học xã hội và nhân văn, Nhân 
văn số thức đã xuất hiện và có sự phát triển vượt bậc trong một thập kỷ 
gần đây và trở thành “đối tác” quan trọng của nhiều ngành khoa học 
như lịch sử, văn học – nghệ thuật, ngôn ngữ, thông tin – thư viện, lưu 
trữ Sự kết hợp giữa Nhân văn số thức và các ngành này đều hướng 
tới mục đích nâng cao hiệu quả làm việc của người nghiên cứu trong 
bối cảnh công nghệ số chi phối đời sống xã hội một cách căn bản. Nhân 
văn số thức (Digital humanities) là thuật ngữ mô tả lĩnh vực liên ngành 
nghiên cứu sự tác động và mối quan hệ giữa công nghệ máy tính và công việc 
của những người nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn (Borgan, 
Friedlander, Presner, 2009). Tại Úc, nhân văn số thức được nghiên cứu 
ở hai khía cạnh: Một là, phát triển các công cụ phần mềm và ứng dụng 
các chức năng của nó trong việc thực hiện các phương pháp nghiên 
cứu của khoa học xã hội và nhân văn. Hai là, nghiên cứu về cách thức 
mà các công cụ phần mềm làm thay đổi việc thực hiện nghiên cứu 
khoa học xã hội và nhân văn. Hay nói cách khác, một mặt, nhân văn 
số thức phát triển các công cụ phục vụ nghiên cứu khoa học xã hội và 
nhân văn (dưới góc độ công nghệ thông tin). Mặt khác, nhân văn số 
thức nghiên cứu mọi khía cạnh liên quan đến quản lý: cách thức tạo ra 
các dự án nhân văn số thức, cách thức biến đổi một cách căn bản việc 
thực hiện nghiên cứu.
424
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
Nhân văn số thức được coi là công cụ xử lý tất cả các dữ liệu đầu 
vào, bao gồm các dữ liệu khoa học, dữ liệu xã hội, dữ liệu pháp lý; dữ 
liệu quá khứ, dữ liệu hiện hành, được thể hiện ở nhiều dạng thức 
khác nhau. Đầu ra của Nhân văn số thức sẽ là các kết quả nghiên cứu 
phục vụ cho các nhà khoa học xã hội và nhân văn. Bản chất của các 
nghiên cứu xã hội và nhân văn là dựa trên kết quả xử lý các dữ liệu đa 
dạng để tìm thấy quy luật vận động của xã hội và con người. Trong khi, 
khoa học tự nhiên đi tìm các quy luật vận động của tự nhiên. Khoa học 
tự nhiên có thể thực nghiệm các giả thuyết nghiên cứu trong phòng 
thí nghiệm để tìm ra câu trả lời chính xác cho các sự vật, hiện tượng tự 
nhiên. Đối với khoa học xã hội và nhân văn, gần như là không thể tiến 
hành các thực nghiệm, do vậy, kết quả nghiên cứu của họ phụ thuộc 
vào khối lượng và chất lượng của các dữ liệu thu thập được. 
Hình 1: Mối quan hệ của 03 yếu tố: Dữ liệu đầu vào – Nhân văn số thức – 
Kết quả nghiên cứu
2. MỐI QUAN HỆ GIỮA LƯU TRỮ, THƯ VIỆN SỐ VÀ NHÂN VĂN SỐ THỨC
Tài liệu lưu trữ là nguồn dữ liệu quan trọng hình thành trong 
hoạt động của các tổ chức, cá nhân, có giá trị và khả năng phục vụ đắc 
lực cho các nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn, 
trong đó đặc biệt phải kể đến các ngành khoa học như lịch sử, luật, 
văn hoá, xã hội Những dữ liệu này cũng như các dạng tư liệu của 
các thư viện khi tồn tại ở dạng số sẽ là một trong những đầu vào quan 
trọng của Nhân văn số thức. Đến lượt mình, Nhân văn số thức xử lý 
các dữ liệu từ tài liệu lưu trữ số, tích hợp kết quả xử lý các dạng tư 
liệu khác và nhờ đó chiết xuất các kết quả đầu ra phục vụ các nhu cầu 
khác nhau của những người nghiên cứu trong lĩnh vực khoa học xã 
425
LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC
hội và nhân văn. Như vậy, Lưu trữ số với nguyên liệu là các loại hình 
tài liệu lưu trữ và tư liệu số hoá hoặc tài liệu số (born-digital) phong 
phú, có độ tin cậy cao, được cấu trúc chặt chẽ, quy chuẩn về mặt dữ 
liệu sẽ đóng vai trò là một trong những nguồn dữ liệu số đầu vào 
quan trọng của Nhân văn số thức. Lưu trữ số có thể được đánh giá là 
một trong những nguồn dữ liệu đầu vào chất lượng nhất đối với hoạt 
động của Nhân văn số thức. Ở một góc tiếp cận khác, nếu xét Nhân 
văn số thức là sự tổng hoà giữa công nghệ, kỹ thuật, phần cứng, phần 
mềm, các dữ liệu, siêu dữ liệu hay dữ liệu lớn, thì Lưu trữ số và thư 
viện số là hai trong những phân hệ quan trọng của Nhân văn số thức. 
Như vậy, Lưu trữ số là một bước tiến quan trọng, cùng với thư viện số 
để phát huy giá trị thông tin của tài liệu lưu trữ và tư liệu khác trong 
các công trình nghiên cứu khoa học xã hội và nhân văn. Để làm được 
điều này, Lưu trữ và Thư viện số cần được kết nối một cách mạnh mẽ 
với Nhân văn số thức. 
Tại Hoa Kỳ, sự thành công của dự án Kho lưu trữ Rossetti và The 
William Blake Archive (2006) đã đặt Nhân văn số thức đứng trên một 
góc độ mới đa chiều hơn. Đồng thời, việc xuất bản cuốn A Companion 
to Digital Humanities là một bước ngoặt đối với nghiên cứu Nhân văn 
số thức, và đưa Nhân văn số thức trở về với đúng tiềm năng của nó, 
không chỉ đơn thuần là số hóa tài liệu hay một ngành chỉ hỗ trợ về mặt 
máy móc đối với người nghiên cứu. Có thể nói, Nhân văn số thức xuất 
phát từ một vị trí thấp, là một công cụ hỗ trợ phục vụ nghiên cứu trở 
thành một ngành khoa học với tiềm năng lớn tạo nên cuộc cách mạng 
trong nghiên cứu khoa học xã hội và nhân văn thông qua việc thay đổi 
phương thức nghiên cứu của các nhà khoa học.
Xét dưới góc độ lợi ích của việc vận dụng thành tựu Nhân văn số 
thức trong nghiên cứu khoa học xã hội và nhân văn thì Nhân văn số 
thức cung cấp các công cụ tìm kiếm thông tin đối với một khối lượng dữ 
liệu lớn, hỗ trợ người nghiên cứu trong tìm kiếm và xử lý một khối lượng 
lớn dữ liệu phục vụ cho quá trình nghiên cứu của mình. Một dự án nhân 
văn số thức có thể quy mô như hình thức phòng đọc ảo/ phòng đọc trực 
tuyến (độc giả có thể truy cập, khai thác tài liệu lưu trữ và tư liệu của 
một hoặc nhiều kho lưu trữ, thư viện), triển lãm trực tuyến không gian 
ba chiều được tổ chức tại nhiều quốc gia phát triển như Hoa Kỳ, Anh, 
426
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
Úc, Pháp hoặc có thể đơn giản là một tập hợp các dữ liệu có chủ đề cụ 
thể dưới dạng số (độc giả có thể truy cập, tiếp cận các dữ liệu dưới nhiều 
dạng khác nhau như văn bản, hình ảnh 3D, biểu đồ, bản vẽ liên quan 
cùng một chủ đề cụ thể). Với những ứng dụng như vậy, có thể khẳng 
định rằng, ưu điểm lớn nhất của Nhân văn số thức khi được áp dụng 
trong các ngành khoa học xã hội và nhân văn, trong đó có lưu trữ học 
khoa học thư viện, không phải chỉ ở sự thuận lợi trong tìm kiếm, tiếp cận 
dữ liệu mà là việc tạo ra mối tương quan trong dữ liệu. Sự tương quan, 
liên kết dữ liệu trong một hoặc nhiều kho dữ liệu lớn mà nhân văn số 
thức tạo ra đã giúp ngành khoa học mới này có thể mang tính cách mạng 
trong nghiên cứu khoa học xã hội và nhân văn.
Theo GS. Paul Arthur, Trưởng khoa Nhân văn số thức và Khoa học 
xã hội, Trường Đại học Edith Cowan (Úc), tại các quốc gia phát triển 
trên thế giới, ngành Nhân văn số thức thường ra đời sau sự thành công 
của nhiều dự án số hóa tài liệu, tư liệu ở các ngành, lĩnh vực. Sự ra đời 
của Nhân văn số thức là tất yếu sau khi số hóa tài liệu, tư liệu trở nên 
phổ biến. Trong lĩnh vực thư viện và lưu trữ, các dự án số hóa sách, tạp 
chí và tài liệu lưu trữ đã được triển khai ở Úc và nhiều quốc gia phát 
triển khác. 
Tại Đài Loan, Thư viện số Lịch sử Đài Loan (Taiwan History 
Digital Library) là cơ quan được Hội đồng các vấn đề văn hóa (CCA) 
thuộc Chính phủ Đài Loan giao nhiệm vụ thực hiện hai dự án quan 
trọng về Kho tàng quốc gia về di sản văn hóa (2003): Số hóa tài liệu 
triều đình nhà Minh – Thanh về Đài Loan và số hóa các bản khế ước 
địa phương liên quan. Năm 2005, Trung tâm Nghiên cứu Nhân văn số 
thức thuộc Đại học Quốc gia Đài Loan tham gia dự án với vai trò tăng 
số lượng tài liệu, tư liệu liên quan được thu thập từ nhiều tổ chức khác 
nhau. Tổng số hơn 100.000 tài liệu và tư liệu lưu trữ (chứa 180 triệu ký 
tự) được thu thập từ 170 nguồn và được số hóa, hoàn chỉnh siêu dữ liệu 
(metadata). Trung tâm đã xây dựng công cụ Nhân văn số thức hỗ trợ 
các nhà khoa học trong việc tra tìm và xử lý khối dữ liệu lớn phục vụ 
nghiên cứu. Một trong những ưu điểm của các công cụ này trong xử lý 
dữ liệu là các kết quả truy xuất dữ liệu thông qua trực quan hóa dữ liệu 
bằng bản đồ, biểu đồ, đồ thị Chẳng hạn, phân bổ theo thời gian của 
toàn bộ tài liệu được ban hành bởi triều đình sẽ cho thấy những thời 
427
LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC
điểm mà số lượng tài liệu liên quan đến Đài Loan tăng rất nhiều. Các 
điểm thuộc đồ thị phản ánh những năm số lượng tài liệu tăng, giảm 
hoặc thậm chí không có Sắc lệnh nào được ban hành. Điều này sẽ phản 
ánh sự kiện nào đó liên quan đến bối cảnh lịch sử Đài Loan. Nếu tra 
cứu tư liệu lịch sử, chúng ta sẽ nhận thấy sự kiện Pháp xâm lược miền 
Bắc Đài Loan năm 1844 và cuộc chiến tranh Trung – Pháp, tương ứng 
với các mốc thời gian không có dữ liệu thể hiện trên đồ thị, đồng nghĩa 
với việc không có tài liệu, tư liệu được lưu trữ ở giai đoạn này.
Một ví dụ khác minh chứng cho tính ưu việt của công cụ Nhân 
văn số thức trong hai dự án đề cập ở trên là trải nghiệm tra cứu từ “bạc” 
xuất hiện trong các giao dịch trao đổi đất đai được thực hiện bởi các 
chuyên gia thuộc Trung tâm Nghiên cứu Nhân văn số thức thuộc Đại 
học Quốc gia Đài Loan. Công cụ máy tính có thể truy xuất hơn 20.000 
từ “bạc” có các từ đứng kèm trước. Trong đó, 9.127 từ “Phật bạc” xuất 
hiện và nghiên cứu sâu hơn đã cho thấy những tài liệu lưu trữ này 
đều có nội dung đề cập tới bạc Mexico. Điều này phản ánh bạc Mexico 
được dùng nhiều trong các giao dịch đất đai ở Đài Loan vào cuối triều 
Thanh. Các chuyên gia Nhân văn số thức và công nghệ thông tin thuộc 
Trung tâm đã trao đổi với các nhà sử học có thẩm quyền nghiên cứu các 
vấn đề Đài Loan vào thời kỳ nhà Thanh, đặc biệt là lịch sử kinh tế. Kết 
quả cho thấy, dựa trên kết quả trực quan hóa dữ liệu, các chuyên gia 
thuộc Trung tâm đã nhận xét chính xác tình hình trong khi một trong 
số các nhà sử học nói trên thừa nhận rằng có thể kết luận về điều này 
sau khoảng 10 năm nghiên cứu. [1]
Như vậy, sự phát triển của Nhân văn số thức nói chung và các công 
trình khoa học, dự án với sự cộng tác của lưu trữ, thư viện số nói riêng đã 
hình thành rõ nét tại các quốc gia phát triển. Lưu trữ, thư viện số đóng 
vai trò quan trọng trong việc xây dựng cơ sở dữ liệu (gồm siêu dữ liệu) và 
công cụ tra cứu tích hợp phân tích mối tương quan bên trong một khối 
lượng lớn dữ liệu. Tất cả tạo nên các dự án Nhân văn số thức ở nhiều cấp 
độ khác nhau, phục vụ nghiên cứu khoa học xã hội và nhân văn. Điều 
này đã được khẳng định bởi Arjun Sabharawal (2015): Sử dụng những 
dữ liệu định lượng trong các mô hình trực quan hóa, dòng thời gian và 
các biểu đồ có thể mang đến nhiều hiệu quả hơn khi kết hợp sử dụng 
với các thông tin về địa điểm, thời gian, tiêu đề/ trích dẫn văn bản của 
428
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
tài liệu (siêu dữ liệu). Tuy nhiên, những công nghệ này cần phải làm 
cho chúng thích hợp với các dữ liệu định tính mà các học giả nhân văn 
thường sử dụng cho phân tích, giải thích và trình bày. [3]
Trên đây là một số dự án về Lưu trữ số và Nhân văn số thức của một 
số quốc gia trên thế giới. Qua các ví dụ này, chúng tôi khẳng định về vai 
trò của Lưu trữ, Thư viện số đối với việc xây dựng các dự án Nhân văn 
số thức ở Việt Nam. Cùng với sự khởi động của dự án Hệ tri thức Việt số 
hoá ngày 01 tháng 01 năm 2018 là việc Thủ tướng Chính phủ ban hành 
Quyết định 458/QĐ-TTG ngày 03 tháng 4 năm 2020 phê duyệt Đề án 
“Lưu trữ tài liệu điện tử của các cơ quan nhà nước giai đoạn 2020-2025”. 
Những đề án nói trên chính là cơ sở pháp lý quan trọng trong lộ trình 
xây dựng Lưu trữ, Thư viện số và Nhân văn số thức ở Việt Nam. Chúng 
tôi hi vọng tham luận đã gợi ý được cho các nhà quản lý, những người 
làm lưu trữ, thư viện về trách nhiệm của mình trước một nền tri thức số 
mới sẽ trở thành hiện thực ở Việt Nam trong tương lai. 
TÀI LIỆU THAM KHẢO
1. Jieh Hsiang (2017), “Xây dựng hệ thống lưu trữ cho Nhân văn số thức”, Kỷ 
yếu Hội thảo khoa học quốc tế Digital Humanities, Viện Hàn lâm Khoa học và 
Công nghệ Việt Nam.
2. Paul Arthur (2017), “Nhân văn số thức ở Australia và thế giới”, Kỷ yếu Hội 
thảo khoa học quốc tế Digital Humanities, Viện Hàn lâm Khoa học và Công 
nghệ Việt Nam.
3. Arjun Sabharawal (2015), Digital Curation in the Digital Humanities, Chan-
dos Publishing – Elsevier.
Phần 3 
CÁC VẤN ĐỀ VỀ THƯ VIỆN HIỆN ĐẠI

File đính kèm:

  • pdfluu_tru_va_thu_vien_so_nen_tang_xay_dung_nhan_van_so_thuc.pdf