用戶登錄投稿

中國(guó)作家協(xié)會(huì)主管

人工智能助力《儒藏》數(shù)字化整理
來(lái)源:北京日?qǐng)?bào) | 何蕊  2024年12月11日09:07

動(dòng)動(dòng)鼠標(biāo),即可隨時(shí)瀏覽查閱古代儒家思想的“大百科全書(shū)”。新中國(guó)成立以來(lái)最大規(guī)模的儒學(xué)典籍整理項(xiàng)目《儒藏》近日啟動(dòng)數(shù)字化。北京大學(xué)表示,《儒藏》“精華編”編纂工作已收官,在全本編纂工作開(kāi)展同時(shí),專業(yè)人員將利用人工智能技術(shù),通過(guò)“識(shí)典古籍”智能整理平臺(tái),開(kāi)展古籍?dāng)?shù)字化整理工作。目前,《永樂(lè)大典》等超1萬(wàn)部古籍已在平臺(tái)上線。

因?yàn)槿斯ぶ悄艿募尤?,此次古籍?dāng)?shù)字化的速度將提升。整理者把相關(guān)文獻(xiàn)的影像上傳至平臺(tái),人工智能會(huì)先進(jìn)行初步整理,標(biāo)注出不確定的部分,專業(yè)人員再進(jìn)行校對(duì)。北京大學(xué)數(shù)字人文研究中心副主任楊浩說(shuō):“專家不再需要花費(fèi)大量時(shí)間用于機(jī)械枯燥的??碑愅?,更多的精力可以集中在關(guān)鍵環(huán)節(jié)上,比如對(duì)重點(diǎn)或存在爭(zhēng)議的標(biāo)點(diǎn)、詞句等做出更有深度的學(xué)術(shù)判斷。”

“識(shí)典古籍”平臺(tái)還開(kāi)發(fā)了協(xié)作整理功能,支持以團(tuán)隊(duì)的形式開(kāi)展工作,節(jié)省了溝通成本。目前,該平臺(tái)部分功能已開(kāi)放,《永樂(lè)大典》等超1萬(wàn)部古籍上線,提供圖文對(duì)照、分詞檢索、實(shí)體百科等服務(wù)。

根據(jù)規(guī)劃,《儒藏》工程先編“精華編”,再編全本?!熬A編”收錄了中、日、韓、越四國(guó)歷史上最具影響力和代表性的儒學(xué)文獻(xiàn),有將近半數(shù)是首次校點(diǎn)整理,填補(bǔ)了學(xué)術(shù)空白。為確保整理文本的可靠性,專家廣泛參考各種古籍目錄,走訪各大圖書(shū)館搜集海內(nèi)外館藏善本,于2022年整理完成并出版了《儒藏》“精華編”中國(guó)部分510種、282冊(cè),總字?jǐn)?shù)近2億字?!度宀亍啡揪幾牍ぷ饕褑?dòng)。包括“精華編”在內(nèi),中國(guó)部分計(jì)劃收書(shū)3000余種,約10億字,將基本囊括我國(guó)歷史上有價(jià)值的儒學(xué)文獻(xiàn)。

“識(shí)典古籍”平臺(tái)是北大于2022年?duì)款^推出的古籍?dāng)?shù)字化平臺(tái),已具備版式識(shí)別、自動(dòng)標(biāo)點(diǎn)、結(jié)構(gòu)整理、??钡壬婕肮偶淼娜鞒坦δ?,能助力專家和機(jī)構(gòu)提高古籍整理效率。