国产成人精品a有声小说,在线观看亚洲网站,91最新地址永久入口,欧美精品国产第一区二区

            中國西藏網(wǎng) > 即時(shí)新聞 > 文化

            蘇州圖書(shū)館古籍數字化:藏用并舉 活化新生

            發(fā)布時(shí)間:2023-12-28 13:50:00來(lái)源: 中國文化報

              通過(guò)數字化降低古籍閱讀門(mén)檻,可以讓更多讀者親近古籍,感受中華優(yōu)秀傳統文化的魅力。目前,古籍數字化過(guò)程中還存在諸多問(wèn)題,如缺乏整體規劃、古籍整理成果資源有限、缺乏全國統一的強制性數字化標準等。面對這些問(wèn)題,該如何解決?

              為保護和利用古籍,國家圖書(shū)館(國家古籍保護中心)先后上線(xiàn)了“全國古籍普查登記基本數據庫”“中華古籍資源庫”。2022年,中華書(shū)局推出“3D超寫(xiě)實(shí)數字人蘇東坡”,江蘇常州市圖書(shū)館上線(xiàn)了“家譜古籍數據庫”,山西太原市圖書(shū)館上線(xiàn)了“太原市圖書(shū)館古籍數據庫”。2023年,上海圖書(shū)館、云南省圖書(shū)館以及江蘇省的常熟、昆山、鎮江等地圖書(shū)館,都積極對本館的古籍實(shí)現數字化。

              古籍數字化的難點(diǎn)在哪里?在江蘇蘇州圖書(shū)館古籍保護中心主任、研究館員孫中旺看來(lái),首先是選擇哪些古籍做數字化處理。據悉,蘇州圖書(shū)館主要聚焦珍貴善本和蘇州地方文獻。

              目前國內古籍數字化的通用做法是:通過(guò)非接觸似專(zhuān)業(yè)古籍掃描設備采集古籍數據,形成圖像文件,著(zhù)錄相應的元數據,建立古籍數字化數據庫。但圖像格式存在著(zhù)占用空間大、不能全文檢索等問(wèn)題。而且,數字化的古籍格式無(wú)法呈現古籍排版的原始風(fēng)格,異體字、通假字等也導致時(shí)常在瀏覽器中無(wú)法檢索和查看。

              蘇州圖書(shū)館聯(lián)合江蘇嘉圖網(wǎng)絡(luò )科技股份有限公司(簡(jiǎn)稱(chēng)“嘉圖”)開(kāi)發(fā)了古籍全文數字化平臺,力求原汁原味展現古籍的版式、風(fēng)格、內容等。嘉圖董事長(cháng)徐偉國說(shuō):“這幾年光學(xué)字符識別標準刻本準確率達到99%,嘉圖采用光學(xué)字符識別技術(shù)替代人工錄入,解決錄入過(guò)程中識字、異體字處理、錯誤高、效率低等問(wèn)題。遇到錯別字,系統會(huì )標注出來(lái),還能提供‘這個(gè)字可能是某字’的推薦。”

              光學(xué)字符識別減少了校對工序,但只對楷體、宋體等刻本比較管用。對稿抄本及草、篆、隸等體寫(xiě)刻本,眼下的技術(shù)還無(wú)法完全準確識別。例如,《(乾隆)吳縣志》中有個(gè)序是手寫(xiě)的,很難識別,只能通過(guò)查閱其他古籍及地方志,找出相應文字進(jìn)行研究比對后才完成確認。“嘉圖的做法是,提供與古籍原文對照的圖片,如果某些字顯示不出來(lái),讀者可以對著(zhù)原圖研究。對草、篆、隸等體及刊刻或書(shū)寫(xiě)模糊的古籍,由嘉圖專(zhuān)家團隊完成錄入。同時(shí),采用自動(dòng)化校對技術(shù)來(lái)解決人工校對過(guò)程中效率低、異體字難辨認等問(wèn)題。通過(guò)自動(dòng)化校對實(shí)現簡(jiǎn)繁轉換、圖文定位、異體字的備選,標紅錯字。”徐偉國說(shuō)。目前,嘉圖古籍數字化平臺已助力蘇州圖書(shū)館完成120多萬(wàn)頁(yè)古籍和民國文獻的數字化。

              古籍數字化工作近年來(lái)全面“開(kāi)花”,但由于尚未出臺全國統一的標準,各個(gè)地方在古籍數字化時(shí)采用了不同的規范標準,導致數據的完整性、正確性以及技術(shù)上的兼容性各不相同,難以實(shí)現整合和利用。一位業(yè)內人士表示:“建議國家完善古籍數字化標準,并不斷進(jìn)行調整。各地應建立自己的標準,在國家標準的基礎上更具體、更深入。同時(shí),研究和引入國際標準。”孫中旺也提出:“標準要有前瞻性、兼容性,比如,蘇州圖書(shū)館在字庫、軟件、數字化發(fā)布平臺等方面已深耕20多年,數字化平臺已成規模,不能為了上一個(gè)新系統,又從頭開(kāi)始做。”

              古籍內容免費獲取后如何保護數字版權,是制約古籍數據開(kāi)放的因素之一,需要業(yè)界建立標準完成數據確權。同時(shí),國內雖然有不少圖書(shū)館或其他單位在做古籍數字化產(chǎn)品,但質(zhì)量參差不齊。“有的數字化產(chǎn)品差錯率太高,不能讓這樣的劣質(zhì)產(chǎn)品覆蓋優(yōu)質(zhì)產(chǎn)品。比如,《永樂(lè )大典》等重要文獻,可以由政府牽頭立項,出一個(gè)各方認可的權威數字化產(chǎn)品,在確保質(zhì)量的同時(shí)避免重復建設。”孫中旺說(shuō)。

              古籍在形式上可以更加貼近生活,做一些有趣的嘗試。徐偉國說(shuō):“古籍數字化可以做出地方特色。比如,可以從蘇州圖書(shū)館的文獻中提取出諸如蘇州婚喪嫁娶習俗的演變過(guò)程,蘇州古城在元明清時(shí)代是啥樣,蘇州人民路在古代發(fā)生了什么事……每年做一兩個(gè)專(zhuān)題,以數字化形式在圖書(shū)館展示,讓圖書(shū)館成為一扇了解城市文化的窗口,吸引讀者前來(lái)體驗。”

              “古籍活化,可以以聲光電的形式重新演繹。蘇州圖書(shū)館擬從江南文化著(zhù)手,通過(guò)現代技術(shù),考證還原《清嘉錄》中記錄的古人風(fēng)雅生活。采用先進(jìn)技術(shù)、跨時(shí)空工具和場(chǎng)景,使古籍‘活’起來(lái)。”孫中旺說(shuō)。(本報記者 劉妮麗)

            (責編:常邦麗)

            版權聲明:凡注明“來(lái)源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來(lái)源中國西藏網(wǎng)和署著(zhù)作者名,否則將追究相關(guān)法律責任。