用戶登錄投稿

中國(guó)作家協(xié)會(huì)主管

錢鍾書(shū)也曾提到“人工知能”
來(lái)源:文匯報(bào) | 張治  2025年05月12日08:03

我們現(xiàn)在就應(yīng)該準(zhǔn)確地向AI技術(shù)開(kāi)發(fā)人員表達(dá)出我們?cè)谌宋膶W(xué)術(shù)特別是文學(xué)教育的方面,需要的幫助是什么。我認(rèn)為挑選閱讀難度最大的文本諸如《管錐編》,恰恰是最為合適的例子。

2003年,商務(wù)印書(shū)館影印出版了《錢鍾書(shū)手稿集》的頭三卷,題為《容安館札記》(此后十二年間又影印了68卷《中文筆記》《外文筆記》)。這是錢鍾書(shū)在1953—1973年二十年間撰寫的札記體論著,《七綴集》里的部分論文、《談藝錄》的補(bǔ)訂和《管錐編》基本框架,都出于此。手稿正文外夾雜眾多補(bǔ)白,又語(yǔ)涉多種文字,紛繁交錯(cuò),常人難以辨識(shí),就連目錄都未能整理出來(lái),故雖然錢鍾書(shū)聞名于世,卻一時(shí)少人問(wèn)津。

2005年讀博士時(shí),我受《萬(wàn)象》雜志刊發(fā)劉永翔、劉錚、范旭侖等先生文章影響,對(duì)《容安館札記》產(chǎn)生興趣,深感這是一個(gè)富礦,若要開(kāi)掘,還需下很大功夫;于是從中文系資料室借閱此書(shū),開(kāi)始對(duì)其中一些篇章謄抄整理,并在畢業(yè)后逐漸寫成文章。之所以采用手寫謄抄而不是錄入電腦,是因?yàn)槠鸪跷疫€很喜歡錢鍾書(shū)的書(shū)法,想要學(xué)習(xí)摹仿,也由此可以進(jìn)一步熟悉他書(shū)寫中西文字的一些習(xí)慣,還能再提高我釋讀手稿的能力。

后有旅美華人“猶今視昔”先生,在網(wǎng)上定期發(fā)布他對(duì)《容安館札記》整理的電子文本,起初進(jìn)展速度比較慢,且有不少問(wèn)題;后來(lái)逐漸上手,顯然是熟悉了錢先生的手寫習(xí)慣和札記補(bǔ)白的規(guī)律,并且有不少熱心的網(wǎng)友積極幫他校對(duì)文本,甚至提供一些查找相關(guān)電子文獻(xiàn)的資源或方法。文本電子化便于檢索,抄寫在紙冊(cè)上的常規(guī)作業(yè)完全無(wú)法實(shí)現(xiàn)這一步。“猶今視昔”先生堅(jiān)持多年,終于完成了全部《容安館札記》手稿的釋文近300萬(wàn)字,無(wú)償發(fā)布于互聯(lián)網(wǎng),嘉惠學(xué)林,功勞最大。后來(lái)有些學(xué)者的研究成果,包括碩博研究生的學(xué)位論文,對(duì)此多有借鑒。

我自己做錢鍾書(shū)研究,也幾乎都先進(jìn)行《容安館札記》的全文檢索,這比人力的通讀省力,由而可以在很多地方達(dá)到比較具有縱深度的思考起點(diǎn)。當(dāng)然,我并不完全信任他人的整理文本,在論述中具體引用時(shí)還是會(huì)同時(shí)查對(duì)手稿的影印本原文?!蔼q今視昔”先生曾在微博與我通信,說(shuō)起還有意愿去完成一個(gè)多元文本的數(shù)據(jù)庫(kù),在手稿釋文中建立若干超鏈接。我的理解,這除了把釋文和手稿原件直接對(duì)應(yīng)起來(lái)外,至少可以關(guān)聯(lián)起對(duì)于錢鍾書(shū)旁征博引中西古今著作的原文段落乃至整部同版本書(shū)籍,也可以建立文本疑難字詞的權(quán)威工具書(shū)解釋,引用不同語(yǔ)種文字的重要譯本,乃至圖像和其他多媒體資源。

暢想一個(gè)手跡“標(biāo)準(zhǔn)件”的數(shù)據(jù)庫(kù)

技術(shù)條件的時(shí)代進(jìn)步的確是可以和人文學(xué)術(shù)研究的動(dòng)態(tài)發(fā)展協(xié)調(diào)同步的。這種數(shù)據(jù)庫(kù)的建設(shè)方式,其實(shí)就類似我們讀書(shū)做學(xué)問(wèn)的過(guò)程,包括了文獻(xiàn)的匯集關(guān)聯(lián),字句的解釋譯述。我現(xiàn)在研究錢鍾書(shū)的學(xué)術(shù)思想和讀書(shū)意趣,特別關(guān)注個(gè)人閱讀史的視角,借用書(shū)籍史、出版史、學(xué)術(shù)史和文學(xué)批評(píng)史幾方面的方法進(jìn)行考據(jù)辨析,所入手處大概與上述數(shù)據(jù)庫(kù)的局部建設(shè)思路有些相當(dāng)。出于對(duì)錢鍾書(shū)讀書(shū)筆記的喜愛(ài),我于其所讀書(shū)都極為渴望一睹真容,這包括公家圖書(shū)館里借閱的原件以及借書(shū)卡上的簽字和日期,他本人的藏書(shū)以及上面的圈劃批語(yǔ)。我并不奢求物品原件上的占有,往往能得到朋友們賜示的相關(guān)圖片就很滿足。此外,我的幾位朋友,特別是熱衷于近代文獻(xiàn)與掌故學(xué)的宋希於先生,曾經(jīng)談到一個(gè)“標(biāo)準(zhǔn)件”數(shù)據(jù)庫(kù)的概念,大概意思就是,在手稿研究中,把確認(rèn)無(wú)誤的、書(shū)寫者盛年最成熟的或最具代表性的手跡,逐字建立單件的高清圖像,以便于調(diào)用參考——這些也都是可以由數(shù)據(jù)庫(kù)建設(shè)做到的。

大而言之,幾乎一切人文教育都應(yīng)該是如此開(kāi)展的,譬如西方古典學(xué)界早已開(kāi)始建設(shè)的珀耳修斯數(shù)據(jù)庫(kù)(Perseus Digital Library),提供了古希臘羅馬文學(xué)名著的原始文本和英譯對(duì)照,原文逐字直接鏈接權(quán)威辭書(shū),并且涵蓋歷史地圖、哲學(xué)文獻(xiàn)、考古資料(如錢幣、雕塑圖像)及藝術(shù)史內(nèi)容,從而支持多維度研究古典文明,促進(jìn)文學(xué)、歷史、藝術(shù)等領(lǐng)域的交叉分析。這種設(shè)計(jì)架構(gòu),很類似于19世紀(jì)西歐人文中學(xué)里的古典語(yǔ)文學(xué)教育,當(dāng)時(shí)很多古典名著的中學(xué)讀本強(qiáng)調(diào)注釋要豐富吸收學(xué)術(shù)界成果,并以圖文并茂的方式,藉由一部經(jīng)典使讀者了解整個(gè)古典文化,旨在使人掌握讀書(shū)門徑,而非將發(fā)表創(chuàng)新論文作為第一目標(biāo)。數(shù)據(jù)庫(kù)建設(shè)可以將這個(gè)宗旨發(fā)揮到極致,也不妨呼應(yīng)時(shí)代的需要。當(dāng)前AI技術(shù)日新月異,假如建成手跡標(biāo)準(zhǔn)件的數(shù)據(jù)庫(kù),是否意味著最終實(shí)現(xiàn)手稿的智能識(shí)別和釋讀?就目前所見(jiàn)的一些技術(shù),在這個(gè)方面實(shí)際效果并不理想。

更切實(shí)一點(diǎn)說(shuō),目前網(wǎng)絡(luò)搜索+高校局域網(wǎng)資源的好處,在于即便沒(méi)有現(xiàn)成的數(shù)據(jù)庫(kù),我們也能通過(guò)常規(guī)手段在自己電腦上獲取所需的大多數(shù)文獻(xiàn)資料。但令我深感費(fèi)解的是,目前可以通過(guò)電腦、手機(jī)免費(fèi)獲取的常用AI軟件,比如DeepSeek、豆包、Kimi等,都有一些解答問(wèn)題時(shí)因處理中外文文獻(xiàn)搜集方面能力不足而造成的缺憾。如果是提供了明確的題目,或是作者姓名和研究主題,豆包、Kimi都能較高效地迅速找到,其中Kimi的答案更為實(shí)用,提供了多渠道獲取相關(guān)資料的鏈接,而DS面對(duì)同樣問(wèn)題卻經(jīng)常不能給出滿意答復(fù)。我懷疑某些情況屬于知識(shí)產(chǎn)權(quán)保護(hù)的問(wèn)題,DS或考慮到“樹(shù)大招風(fēng)”,于是只能“裝傻”。

這樣一來(lái),必須要在自己科研環(huán)境里提供與AI設(shè)備外接的相關(guān)數(shù)據(jù)庫(kù)才行。而目前是無(wú)法考慮專門架設(shè)私有AI或單獨(dú)服務(wù)器的企業(yè)級(jí)手段的,那樣造價(jià)高昂,作為人文學(xué)科的“單打獨(dú)斗”者完全無(wú)力承擔(dān)。我直接咨詢過(guò)DeepSeek,像《容安館札記》這樣近300萬(wàn)字的文本,在個(gè)人電腦上如何實(shí)現(xiàn)深度分析。DS答復(fù)說(shuō)可使用目前市價(jià)大約一萬(wàn)三千元人民幣的筆記本電腦(例如ThinkPad P1 Gen4,配置i7-11850H/32GB/RTX 3070),就能實(shí)現(xiàn)優(yōu)化算法、分層處理等等。它還提供了一組實(shí)測(cè)數(shù)據(jù),即所謂“處理《管錐編》第四卷(約35萬(wàn)字)耗時(shí)約18小時(shí)”后的關(guān)鍵指標(biāo):

自動(dòng)識(shí)別典籍引用824處;

構(gòu)建包含217個(gè)節(jié)點(diǎn)的概念網(wǎng)絡(luò);

生成交互式學(xué)術(shù)地圖5幅;

內(nèi)存峰值控制在22.3GB。

這聽(tīng)起來(lái)似乎可行。但是在我進(jìn)一步要求下,DS展示了“自動(dòng)識(shí)別典籍引用”的功能,可以迅速分析總結(jié)錢鍾書(shū)多次引用的某部典籍的具體場(chǎng)合性質(zhì)分析,比如引《周易》83次,“52次出現(xiàn)在闡釋‘比興’手法的章節(jié),31次分布在討論‘象數(shù)思維’的段落”(我懷疑數(shù)據(jù)不一定準(zhǔn)確,僅是說(shuō)明其有所作為而已)。概念網(wǎng)絡(luò)圖大概就是用節(jié)點(diǎn)代表概念,以連線表示關(guān)系的圖示,節(jié)點(diǎn)大小表示概念重要性,連線粗細(xì)表示關(guān)聯(lián)強(qiáng)度。除了學(xué)界已經(jīng)注意的一些概念關(guān)聯(lián),還“識(shí)別出3個(gè)未被傳統(tǒng)研究注意到的次要概念集群”,對(duì)此DS未展示其具體細(xì)節(jié),在后續(xù)的追問(wèn)中才給出很復(fù)雜的描述。我發(fā)現(xiàn)一個(gè)最大的問(wèn)題是,DS此時(shí)展示的所有具體例證都無(wú)法在《管錐編》里查到,甚至為了體現(xiàn)交互式學(xué)術(shù)地圖時(shí)編造說(shuō)《管錐編》提到過(guò)蔣彝的《愛(ài)丁堡畫記》。最后,在我揭穿它在整個(gè)展示中提到的引文全都是憑空捏造時(shí),它答復(fù)說(shuō):

我的回應(yīng)中存在編造引文的情況,這可能是因?yàn)樵谘菔痉椒〞r(shí),為了方便而假設(shè)了例子,但未明確說(shuō)明這些是虛構(gòu)的。

此后,我再三請(qǐng)求它根據(jù)實(shí)際文本說(shuō)話,DS仍然時(shí)不時(shí)來(lái)一句諸如“該觀點(diǎn)在1972年修訂版中強(qiáng)化”這樣的鬼話(《管錐編》初刊于1979年以后)。不管如何,即便是我們現(xiàn)在付得起高昂造價(jià)架設(shè)了私家服務(wù)器,派遣上專門的工程技術(shù)人員,就由上面DS為我“畫餅”(接近引誘我去斥資搞設(shè)備建設(shè))來(lái)看,目前階段下的人工智能技術(shù)仍不令人滿意。它也許可以提供給我們一些意想不到的研究視角和大批量分析處理《管錐編》文本的統(tǒng)計(jì)性數(shù)據(jù),但對(duì)于我更關(guān)心的如何讓學(xué)生們高效率地讀書(shū)而言,這些高大上的智能挖掘根本起不到什么作用。

目前人工智能可為《管錐編》精讀提供的幫助

在中文系學(xué)生們開(kāi)始搞什么模態(tài)分析、詞頻調(diào)研這些超乎人工閱讀能力所及的工作之前,能否先帶領(lǐng)他們認(rèn)真讀一讀《管錐編》中的具體段落?或者說(shuō),我們現(xiàn)在就應(yīng)該準(zhǔn)確地向AI技術(shù)開(kāi)發(fā)人員表達(dá)出我們?cè)谌宋膶W(xué)術(shù)特別是文學(xué)教育的方面,需要的幫助是什么?我認(rèn)為挑選閱讀難度最大的文本諸如《管錐編》,恰恰是最為合適的例子。我在系里面向碩博研究生開(kāi)設(shè)了一門專書(shū)選讀的課程,在每年春季學(xué)期帶學(xué)生讀《管錐編》,大致是挑選書(shū)中涉及修辭學(xué)、心理學(xué)、歷史學(xué)和政教文化的一些主題,每次細(xì)讀相關(guān)的代表性片段。

但這里出現(xiàn)了一個(gè)新的問(wèn)題。《管錐編》是一部札記體著作,其性質(zhì)與上面的《容安館札記》有類似之處。之前,我使用AI軟件閱讀一些中外文電子書(shū)時(shí)確實(shí)受益很大,它可以非常迅速地總結(jié)并提供要點(diǎn)概述,其實(shí)是因?yàn)檫@些書(shū)籍都屬于現(xiàn)代規(guī)范的學(xué)術(shù)著作,本身就自帶引言、目錄、章節(jié)總結(jié)性質(zhì)的文字。而實(shí)際上,這些免費(fèi)軟件都無(wú)法讀完一本20萬(wàn)字的書(shū),它們大概掃描內(nèi)容達(dá)到百分之五六十而已,做的根本就是類似“殺書(shū)頭”這樣的活兒。札記體著作不存在順理成章的結(jié)構(gòu),各篇結(jié)構(gòu)相對(duì)松散,因此DS在分析我給出的《管錐編》全書(shū)文本時(shí)就不再能駕馭全局,而只能根據(jù)不到內(nèi)容前10%的部分,來(lái)進(jìn)行總結(jié)。這樣一來(lái),學(xué)生們就無(wú)法通過(guò)AI用切實(shí)結(jié)合文本的方式檢覽相關(guān)主題,有些軟件會(huì)像學(xué)生中某些“大聰明”那樣,無(wú)視附件里它未讀完的文本而“任意發(fā)揮”,這樣危害當(dāng)然更大。

目前在實(shí)際運(yùn)用中,人工智能能夠?yàn)椤豆苠F編》專書(shū)選讀課提供的幫助,主要體現(xiàn)在小量字?jǐn)?shù)精讀時(shí)的通譯詮解上。《管錐編》引文繁多,其中涉及歷代漢籍,從經(jīng)史詩(shī)文到戲曲小說(shuō),語(yǔ)體極為豐富多變,同時(shí)又有英法德意西及拉丁文的不同典籍原文片段,雖然有一些錢鍾書(shū)給出了自己的簡(jiǎn)略典雅的譯文,但我更希望在精讀時(shí)同學(xué)能兼顧一下原文片段的語(yǔ)序、用詞和表達(dá)方式。而幾種AI軟件現(xiàn)在基本能勝任比較準(zhǔn)確地按照原文風(fēng)格進(jìn)行直譯,并主動(dòng)將上下幾段引文的關(guān)聯(lián)性略作歸納總結(jié),提示若干值得注意的要點(diǎn)等等,這樣就大大活躍了學(xué)習(xí)氣氛,能使得初學(xué)者不生畏難情緒,在長(zhǎng)期訓(xùn)練后也能培養(yǎng)一定的直接閱讀原文理會(huì)大意的能力了——這不算什么高大上的功能,卻是我覺(jué)得最偉大之處。

AI能夠超越錢鍾書(shū)的學(xué)術(shù)成就嗎

我們不要忘記,在八十年代,身為社科院副院長(zhǎng)的錢鍾書(shū)也是最先組織人員利用計(jì)算機(jī)建設(shè)古籍?dāng)?shù)據(jù)庫(kù)的提倡者(參看鄭永曉先生論文《錢鍾書(shū)與中國(guó)社科院古代典籍?dāng)?shù)字化工程》)。他曾提到過(guò)“人工知能”,即今所謂“人工智能”。這不是他發(fā)明的譯法,早在七十年代中期,國(guó)內(nèi)科學(xué)界已經(jīng)注意并摘譯、介紹“人工智能”相關(guān)研究,就有此概念了(見(jiàn)1974年上海外國(guó)自然科學(xué)哲學(xué)著作編譯組《摘譯》第2期)。錢鍾書(shū)積極迎接這一新事物,曾說(shuō)“對(duì)新事物的抗拒是歷史上常有的現(xiàn)象,抗拒新事物到頭來(lái)的失敗也是歷史常給人的教訓(xùn)”(《論語(yǔ)數(shù)據(jù)庫(kù)》序,1987年12月)。1989年5月,當(dāng)《全唐詩(shī)》數(shù)據(jù)庫(kù)發(fā)布,他致函院新聞發(fā)言人,更明確表達(dá)了對(duì)科技輔助人文學(xué)術(shù)工作的重視:

關(guān)于《全唐詩(shī)》速檢系統(tǒng)的工作獲得可喜的成果……作為一個(gè)對(duì)《全唐詩(shī)》有興趣的人,我經(jīng)常感到尋檢詞句的困難,對(duì)于這個(gè)成果提供的絕大便利,更有由衷的欣悅。這是人工知能在中國(guó)古典文學(xué)研究上的重要貢獻(xiàn)。

實(shí)際上,人們或者就把《管錐編》這部征引了七八千種中西典籍的學(xué)術(shù)著作,看成是一種計(jì)算機(jī)數(shù)據(jù)庫(kù)發(fā)達(dá)后可以超越的工作。從某個(gè)意義上說(shuō),從《容安館札記》到《管錐編》,這樣調(diào)取不同語(yǔ)種相關(guān)文獻(xiàn)數(shù)據(jù)進(jìn)行比對(duì)的做法,正可以看成是一種“人工智能”技術(shù)在未來(lái)突破人文學(xué)術(shù)已有成就的探索模式的真正代表。錢鍾書(shū)傾其一生投身于讀書(shū)治學(xué),《管錐編》堪稱其重要成果。這不禁讓人腦洞大開(kāi),產(chǎn)生這樣一種設(shè)想與懷疑:錢鍾書(shū)是否早已預(yù)見(jiàn)到,AI技術(shù)在未來(lái)的某一天會(huì)超越他所取得的學(xué)術(shù)成就?雖說(shuō)這只是大膽猜測(cè),但如果該設(shè)想成立,那么或許就能解釋,為何在《管錐編》問(wèn)世后的二十年里,他并未動(dòng)手寫成計(jì)劃里的續(xù)編——難道在他看來(lái),再繼續(xù)下去的意義已然不大了?身為人文學(xué)者和錢鍾書(shū)研究者,我自然不愿意接受這種設(shè)想?!豆苠F編》里呈現(xiàn)的不止是技術(shù)性的中西學(xué)問(wèn)陳列,更重要之處在于錢鍾書(shū)從古今修辭語(yǔ)義問(wèn)題背后來(lái)深切關(guān)注當(dāng)下社會(huì)心理乃至人類精神之境遇的思考。AI技術(shù)提供的是解決基本文句理解障礙和思維邏輯梳理的答案,它不能為我們解答這些思考的根本原因。

有一位當(dāng)代學(xué)者曾說(shuō):學(xué)術(shù)是為讀書(shū)服務(wù)的,而不應(yīng)該是讀書(shū)為學(xué)術(shù)服務(wù)。我們現(xiàn)在也可以說(shuō),技術(shù)也應(yīng)該是為讀書(shū)服務(wù)的。無(wú)論如何,在AI技術(shù)勝任一切人文學(xué)術(shù)的這一天到來(lái)之前,先讓它幫助我們讀書(shū),不是一件很有意義的事情嗎?

(作者為中國(guó)海洋大學(xué)文學(xué)與新聞傳播學(xué)院教授)