国产成人精品a有声小说,在线观看亚洲网站,91最新地址永久入口,欧美精品国产第一区二区

            中國西藏網(wǎng) > 即時(shí)新聞 > 文化

            數字化,讓古籍觸手可及

            發(fā)布時(shí)間:2024-01-11 11:28:00來(lái)源: 人民日報

              記者 吳 丹

              核心閱讀

              我國現存古籍約有20萬(wàn)種,修復整理現存的全部古籍,可能需要300余年。古籍數字化迫在眉睫。一本古籍,如何從紙頁(yè)“搬”到網(wǎng)頁(yè)?廣泛收集圖像資料、利用現代技術(shù)精細化處理……自2022年10月上線(xiàn)以來(lái),“識典古籍”平臺已陸續匯集經(jīng)、史、子、集等2200余部古籍,免費面向公眾開(kāi)放,為解決古籍保護和利用矛盾進(jìn)行了有益嘗試。

              “青蒿一握,以水二升漬,絞取汁,盡服之”,屠呦呦從古籍中獲得靈感,由此發(fā)現青蒿素;在浩瀚古籍中尋幽入微,竺可楨繪制出一條物候變遷的曲線(xiàn)——“竺可楨曲線(xiàn)”,濃縮出五千年中華大地的冷暖變化圖景。

              卷帙浩繁的中華古籍,凝結著(zhù)先人的智慧,記載著(zhù)璀璨的文化,訴說(shuō)著(zhù)綿延不絕的中華文明。歲月不居,書(shū)闕有間,部分古籍正慢慢“老去”,褪色、脆化、腐蝕,甚至稍一翻閱就會(huì )損毀。

              當古老典籍遇到現代技術(shù),會(huì )產(chǎn)生什么奇妙反應?

              一種“打開(kāi)”古籍的全新方式

              “初見(jiàn)”“流光”“驚鴻”“珠聯(lián)”“綴玉”……點(diǎn)擊網(wǎng)頁(yè)上的標簽,《永樂(lè )大典》的前世今生、編纂方法、歷史價(jià)值等信息,伴隨著(zhù)動(dòng)畫(huà)音效,呈現于眼前。

              點(diǎn)擊頁(yè)面右上角“閱讀大典”,進(jìn)入文本閱讀平臺。《永樂(lè )大典》原本影像與數字化文本相互對照,繁簡(jiǎn)體文字隨時(shí)切換。遇生僻詞句,可選中文本,點(diǎn)擊“查看引用”,出處清晰可考。

              《永樂(lè )大典》是我國古代規模最大的類(lèi)書(shū),匯集先秦至明初各類(lèi)典籍,被譽(yù)為“世界有史以來(lái)最大的百科全書(shū)”。但幾經(jīng)散佚,副本存世不及原書(shū)的4%。對學(xué)者而言,《永樂(lè )大典》是進(jìn)行學(xué)術(shù)研究的重要資料;對普通讀者來(lái)說(shuō),古籍文本往往艱澀難懂,且接觸機會(huì )不多。

              如今,《永樂(lè )大典》高清影像數據庫(第一輯)在古籍數字化平臺“識典古籍”正式上線(xiàn),免費面向公眾開(kāi)放。借助現代數字技術(shù),厚重典籍濃縮在方寸之間,塵封已久的歷史畫(huà)卷徐徐展開(kāi),成為觸手可及的文化資源。

              “互動(dòng)化、可視化的呈現方式更加符合當代人的閱讀習慣,沉浸式閱讀體驗拉近了古籍與普通讀者之間的距離。”“識典古籍”平臺項目負責人之一、北京大學(xué)信息管理系助理教授位通說(shuō)。

              自2022年10月上線(xiàn)以來(lái),“識典古籍”平臺已陸續匯集經(jīng)、史、子、集等2200余部古籍,面向海內外讀者免費開(kāi)放。該平臺由北京大學(xué)與抖音合作共建,致力于為用戶(hù)提供免費、公開(kāi)、穩定、快速、方便的檢索和閱讀古籍服務(wù)。

              “識典古籍”平臺項目負責人、北京大學(xué)數字人文研究中心主任王軍希望,“識典古籍”平臺能推動(dòng)散落海外的中華古籍回流,促成古籍的開(kāi)放共享。

              一次解決保護和利用矛盾的嘗試

              古籍數字化為何迫切?

              王軍算過(guò)一筆賬:我國現存古籍約有20萬(wàn)種,從1949年到2019年,共修復整理出版了近3.8萬(wàn)種,修復整理現存的全部古籍,可能需要300余年。可以說(shuō),古籍修復速度趕不上老化速度。

              修復整理,只是數字化的第一步。古籍具有文物和文獻的雙重屬性,修復好的古籍若只被束之高閣,后續研究就無(wú)法開(kāi)展,更無(wú)法發(fā)揮其文化傳承的價(jià)值。

              因此,數字化是一場(chǎng)生產(chǎn)效率的變革,也是一次解決古籍保護和利用矛盾的嘗試。

              一本古籍,如何從紙頁(yè)“搬”到網(wǎng)頁(yè)?

              進(jìn)入“識典古籍”平臺,平臺設計者、北京大學(xué)人工智能研究院副研究員楊浩開(kāi)始演示:“古籍的數字化分為兩步。一是圖像化,我們與海內外古籍收藏單位合作,廣泛收集古籍數字化圖像資料。二是文本化,利用人工智能技術(shù)對古籍文字進(jìn)行識別、排序、校對、結構整理、標點(diǎn)、實(shí)體識別等,對內容作精細化處理。”

              楊浩上傳了一頁(yè)古籍圖像,不一會(huì )兒,文字自動(dòng)識別處理完成。古籍圖像上顯現出不同顏色的小方框,“每個(gè)方框對應一個(gè)文字,先切分再調整順序。紅色方框是提醒此處需要人工介入,來(lái)進(jìn)一步判斷和處理。”

              與此同時(shí),古籍圖像旁已自動(dòng)識別出一段文字,并可比照原圖像進(jìn)行修改調整。楊浩繼續解釋?zhuān)骸斑@個(gè)過(guò)程中,主要使用了文字識別、自動(dòng)標點(diǎn)和命名實(shí)體識別等人工智能技術(shù)。文字識別技術(shù),是對古籍數字圖像中的文字進(jìn)行單個(gè)切分,再進(jìn)行文字識別和順序讀出;自動(dòng)標點(diǎn)技術(shù),是通過(guò)序列標注的方式對古籍自動(dòng)進(jìn)行現代標點(diǎn);命名實(shí)體識別技術(shù),則是通過(guò)序列標注方法識別出文本中的人名、地名、書(shū)名、時(shí)間、官職等信息。”同時(shí),在機器自動(dòng)識別后,會(huì )有專(zhuān)人復查結果,進(jìn)一步提升準確率。

              據悉,“識典古籍”平臺文字識別的準確率達到96%以上,自動(dòng)句讀的準確率達到94%,命名實(shí)體識別在中古史料上的準確率接近98%。

              “大部分古籍閱讀平臺或只提供掃描文稿,或只提供文本內容,有些商業(yè)數據庫收費高昂,獲取資源十分不便。”北京大學(xué)歷史學(xué)系學(xué)生劉沐含說(shuō),“識典古籍”平臺有著(zhù)豐富的檢索功能以及分類(lèi)與年代篩選功能,可以輔助開(kāi)展學(xué)術(shù)研究。

              一個(gè)全流程的智能化整理平臺

              集納展示古籍數字版本,不是“識典古籍”平臺的全部。團隊有著(zhù)更大的設想——在一個(gè)平臺實(shí)現古籍智能整理的全部環(huán)節。

              “‘識典古籍’平臺由兩部分組成,前端是閱讀平臺,后端是古籍整理平臺。”王軍作了一個(gè)比喻,“就像是餐廳的前廳和后廚。”

              目前,作為“后廚”的古籍整理平臺,已經(jīng)設定了團隊管理員、書(shū)目管理員、審訂員、整理員等各種用戶(hù)角色。下一步,將吸引各行各業(yè)的古籍愛(ài)好者、研究者,以眾包校對、協(xié)同審核等形式,推進(jìn)古籍整理項目和數據庫建設,打造“古籍圖像上傳—文本校對整理—高質(zhì)量標記—文本輸出”的全流程系統。

              哈爾濱師范大學(xué)歷史文化學(xué)院學(xué)生劉鈺昕,提前體驗了一回“整理員”角色。

              “希望能為損毀嚴重的古籍做點(diǎn)力所能及的事情。”2022年4月,看到北大數字人文研究中心的招募信息,劉鈺昕第一時(shí)間報名,成為“識典古籍”平臺的一名志愿者。

              “我參與了《春秋左傳注》《史記》《漢書(shū)》等古籍的校對工作。”談及志愿工作,劉鈺昕的熱愛(ài)之情溢于言表,“印象最深的就是,為了制定魏晉南北朝官職標注規則,我查閱了大量的文獻,還詳細翻閱了《文獻通考》的‘職官考’二十一考。”

              “新時(shí)代古籍事業(yè)發(fā)展,需要一批對古典文獻學(xué)、古籍保護、信息技術(shù)以及數字化流程都比較熟悉,又能將各方面有機融合的復合型人才。”北京大學(xué)中文系教授楊海崢建議,應加強古籍學(xué)科理論構建和課程體系建設,編寫(xiě)適合新時(shí)代古籍工作需要的專(zhuān)業(yè)教材,并多為學(xué)生提供實(shí)踐機會(huì ),以推進(jìn)新時(shí)代古籍人才隊伍建設。

              “古籍是中華文明延續數千年未曾中斷的有力證明,希望通過(guò)‘識典古籍’平臺以及暑期工作坊、學(xué)術(shù)研討等活動(dòng),推動(dòng)中華文明傳承發(fā)展,向世界展示和傳播我們的文化之美。”王軍說(shuō)。

              新年伊始,楊浩寫(xiě)下了新的展望:

              “泱泱中華,歷史何其悠久,文明何其博大。2024年,希望能收集更多古籍、提升整理質(zhì)量,更好守護古籍這個(gè)文明之根!”

              (厲 燁參與采寫(xiě))

            (責編:常邦麗)

            版權聲明:凡注明“來(lái)源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來(lái)源中國西藏網(wǎng)和署著(zhù)作者名,否則將追究相關(guān)法律責任。