數字化古籍:走出深閨待人識
這篇文章熱度不減的背后,是讀者對于中國圖書館古籍數字化的殷殷期待:哈佛燕京圖書館的中文古籍只有4200部、5.3萬卷,而國內現存的漢文古籍約300萬部、3000萬冊,中國的古籍數字化能否跟上世界的腳步?
其實,近年來,國內不少圖書館都在對館藏古籍進行數字化,僅國家圖書館“中華古籍資源庫”在線發布的古籍就超過3.2萬部,是哈佛燕京圖書館中文善本的8倍,而全國各圖書館在線發布的古籍總量已達到6.5萬部。中文古籍的故鄉在中國,絕大多數中文古籍存藏在中國,中文古籍數字化的主力也在中國。那些從歷史深處走來的古籍,正在走出善本書庫,走向互聯網,走向更多讀者的閱讀生活。
國圖60%善本數字化——研究生態就此改變
十幾年前,浙江大學藝術與考古學院教授薛龍春還在南京藝術學院任教。連續兩年暑假,他都專程到國圖看書。那時,高鐵還沒開通,從南京到北京,坐特快列車要10個多小時,單程的硬臥票價200多元。到了北京,薛龍春住在國圖附近的一家招待所,設施簡單,每天100元,一住就是半個月。
搭上了時間,花了錢,看書的體驗卻不太好。說是看“書”,實際是看縮微膠卷。為了保護古籍,國圖的大多數善本已經被拍攝成縮微膠卷,讀者要在專門的機器上閱讀這些膠卷。薛龍春關注的明末清初學人著作,很多是大部頭,像張鏡心的《云隱堂文集》和《云隱堂詩集》,加在一起有四十卷。一邊翻動膠片機,一邊閱讀、抄寫,有時需要回頭查看某處文字,也沒辦法隨意跳轉,只能把膠卷一頁一頁地往回倒,其效率可想而知。
2016年9月,當國家圖書館“中華古籍資源庫”上線的消息傳來,薛龍春甚至不太相信會有這樣的好事。直到親自上網檢索測試了一番,他才確定,這并非虛言。
“這幾年,我一直在向熟悉的朋友、學生,還有一些海外學者,推薦這個資源庫,他們都反映非常有用。”薛龍春說,他不僅通過這個資源庫閱讀古籍,有時也通過它進行一些校對,“如果沒有這個庫,或許,為了校對幾個字,都得再跑一趟北京。”
對于中華古籍資源庫的評價,學界有共識。北京大學圖書館研究館員沈乃文說,2016年發布的“中華古籍資源庫”,一舉扭轉了此前我國古籍數字資源庫建設落后的狀況。山東大學文學院教授杜澤遜則認為,“中華古籍資源庫”等古籍數據庫將改變古籍整理研究的生態,具有里程碑意義。
“讀者無論在世界任何角落,只要有互聯網,就可以在注冊后遠程閱覽、調取中華古籍資源庫中的古籍數字影像,完全克服了時間、空間的障礙,真正實現了古籍資源的共享。”國家古籍保護中心辦公室主任林世田介紹,國家圖書館是國內古籍收藏量最大的單位,其收藏的漢文古籍在品種和版本數量上在國內都首屈一指。如今,國家圖書館所藏60%的善本古籍已經在“中華古籍資源庫”在線發布。除了善本古籍的數字化,國圖還在2015年啟動了普通古籍數字化項目和少數民族文字古籍數字化項目。
“古籍數字化服務是圖書館界遲早要做的事,晚做不如早做,封閉不如開放,與其讓社會推著走,不如我們主動前行。”對于古籍數字化,國家圖書館副館長、國家古籍保護中心副主任張志清有這樣的認識。
在古籍數字化的道路上,國家圖書館并不孤單?,F在,上海圖書館在線發布的家譜超過8000種;在云南省圖書館發布的300余部古籍中,大理國寫本《護國司南抄》、元官刻大藏經《大寶積經》這些特色文獻;鎮江市圖書館把讀者利用率最高的20余種方志上網,正在建設中的鎮江歷史文獻數字資源庫、《鎮江文庫》數字化平臺將在近年投入使用……
60億元資金缺口:古籍數字化道阻且長
前不久,張志清開始利用業余時間整理三國時期劉劭的《人物志》,作為一名熟悉圖書館的普通讀者,張志清首先想到的是去查一查中華古籍資源庫——作為副館長的他,并沒有借用原本古籍的特權。剛好,那部明代萬歷刻本《人物志》已經上網。他進入資源庫,點開一頁,打印一頁,點校一頁,再打開一頁,再打印一頁,再點校一頁……沒花太長時間,就把這三卷書進行了初步整理。雖然自己用著還算順手,但張志清也聽過一些讀者向他訴苦:資源庫對瀏覽器、閱讀器都有一定要求,即使按照網站給出的一套煩瑣的“解決辦法”逐步操作,有時也無法正常閱讀古籍。
“我們剛起步做古籍數字化時,采用的是當時的先進技術,但電子信息技術發展很快,幾年之后,原來的技術就已經不能很好地適應新的需要了。”張志清介紹,目前,國家圖書館正在開發一套新的系統,不久就會正式上線,新系統將實現云管理、云服務,中華古籍資源庫的服務也將隨之提升,讀者會有更好的閱讀體驗,“看到華為鴻蒙系統問世的新聞,我感到很振奮。未來,圖書館的數字化服務可以與物聯網系統結合,解決目前的技術傳播短板。”
在很多專家看來,古籍數字化服務的技術問題終究可以解決,如何提供更多高質量的古籍影像,才是圖書館界面臨的真正考驗,這也是讀者更為迫切的需求。
“中華古籍資源庫每年都有一些更新,但速度還可以再快一點。學者的研究領域多種多樣,僅靠這個資源庫,還無法完全滿足日??蒲械男枨?,其他圖書館應該以國圖為表率,讓善本盡快上網。”薛龍春的期待,也是很多讀者的心聲。
讓善本盡快上網,需要更多圖書館更為開放的理念,也需要更多資金支持。國家古籍保護中心辦公室副研究館員趙文友做過一個估算,如果將全國尚未數字化的40萬個版本的古籍全部數字化,采集、組織、加工、存儲、管理等費用大約需要60億元。而國家古籍保護中心每年用于古籍數字化工作的經費不過1000萬元,很多地方圖書館的古籍數字化經費更是捉襟見肘。
“在山東省圖書館,有限的古籍保護經費主要用于古籍普查、古籍修復等內容,古籍數字化的錢大多是從其他項目經費中節省出來的。”山東省圖書館副館長李勇慧說,雖然該館已經建設了易學古籍數據庫、佛經專題數據庫等項目,但是因為沒有古籍數字化的專項經費,今后的古籍數字化做什么、做多少,既沒有具體規劃,也不敢做規劃。
“近年來,古籍數字化工作愈發受到各圖書館的重視,地方財政也給予了一定支持,但古籍數字化經費一般是和古籍保護一般性支出捆綁在一起的,或者是在其他項目建設經費中列支的。”鎮江市圖書館館長褚正東遇到的問題,與李勇慧類似,“對于鎮江市圖書館館藏的18萬冊古籍來講,目前通過多種渠道解決的古籍數字化經費是杯水車薪。財政部門沒有對古籍數字化經費進行單獨立項,是制約發展的首要難點。”
公共圖書館的免費政策,是否會導致古籍數字化的動力不足?北京大學中文系教授張劍提出了這樣的疑問。不過,他也觀察到,一些公司經營的收費古籍數據庫,雖然建設速度很快,但因利益攸關,導致亂象紛呈,造成不少重復建設和浪費,結果是加重了讀者的負擔。
“古籍數字化工作,不能單打獨斗,最好由國家有關部門統一組織協調,使之成為一個可持續發展的國家級文化工程,讓中華優秀傳統文化真正發揚光大。”張劍給出了這樣的建議。
近些年,張志清一直在呼吁圖書館界利用好有限的古籍數字化經費,通過合作共建、資源權益互換等方式實現資源共享,避免重復建設。
“如果實現了數字資源共享,讀者對甲館的服務不滿意,可以選擇去乙館的網站瀏覽;如果甲館的服務器遭遇意外損害,乙館還有副本留存。”張志清說,共享數字資源,不僅是為了提高圖書館服務的效率,也是為了保障國家文化安全。他希望他的呼吁得到更多人的響應。(