AI創(chuàng)作出百萬(wàn)字小說(shuō),“人人皆能寫(xiě)長(zhǎng)篇”不再是夢(mèng) ——華東師范大學(xué)教授王峰談《天命使徒》
編者按:
2024年6月22日,本版刊發(fā)一組文章,在理論層面從不同維度探討了人工智能(AI)寫(xiě)作帶給網(wǎng)絡(luò)文學(xué)的影響。事實(shí)上,國(guó)內(nèi)已有成功使用人工智能創(chuàng)作網(wǎng)絡(luò)小說(shuō)的實(shí)踐:《天命使徒》長(zhǎng)達(dá)100萬(wàn)字,使人工智能創(chuàng)作長(zhǎng)篇文學(xué)成為現(xiàn)實(shí);《機(jī)憶之地》匿名參加科幻文學(xué)大賽,在評(píng)委不知情的情況下獲二等獎(jiǎng)。本期繼續(xù)圍繞人工智能寫(xiě)作與網(wǎng)絡(luò)文學(xué)的話題進(jìn)行討論,兩篇人工智能小說(shuō)的創(chuàng)作談表達(dá)了未來(lái)人工智能網(wǎng)絡(luò)文學(xué)創(chuàng)作的豐富前景,而青年評(píng)論家康春華則從兩篇小說(shuō)的文本出發(fā),指出了人工智能小說(shuō)創(chuàng)作所面臨的難以逾越的難關(guān)和障礙。
人工智能在短篇文學(xué)尤其是詩(shī)歌創(chuàng)作上有所建樹(shù),但超長(zhǎng)文本創(chuàng)作一直未能實(shí)現(xiàn)。這幾年人工智能技術(shù)突飛猛進(jìn)地迭代,人工智能文學(xué)創(chuàng)作也在不斷打開(kāi)新的可能。
近日,華東師范大學(xué)教授王峰團(tuán)隊(duì)取得一項(xiàng)重大突破——他們成功創(chuàng)作出一部百萬(wàn)字的人工智能小說(shuō)《天命使徒》,標(biāo)志著人工智能在長(zhǎng)篇文學(xué)創(chuàng)作方面邁出重要一步。
《天命使徒》采用“國(guó)內(nèi)人工智能大語(yǔ)言模型(以下簡(jiǎn)稱(chēng)“大模型”)+提示詞工程+人工后期潤(rùn)色”的方式完成,整部小說(shuō)超過(guò)110萬(wàn)字。一個(gè)勤奮的網(wǎng)絡(luò)作家寫(xiě)作如此篇幅的小說(shuō)大約需要一年,而人工智能機(jī)寫(xiě)僅用了一個(gè)半月。王峰團(tuán)隊(duì)的下一個(gè)目標(biāo)是將這一時(shí)間縮短為兩至三周。
“文學(xué)正經(jīng)歷著飛速的變化。我們?cè)跁诚胛磥?lái)的時(shí)候,很可能也正在見(jiàn)證某些奇跡的發(fā)生?!蓖醴迦缡潜磉_(dá)著人工智能網(wǎng)絡(luò)文學(xué)創(chuàng)作的前景。
記者:《天命使徒》講了什么樣的故事?它是怎樣被創(chuàng)作出來(lái)的?
王峰:《天命使徒》描寫(xiě)了修仙者周青不斷發(fā)現(xiàn)自我,在黑暗和光明兩極間搖擺,最后犧牲自我,不再做孤獨(dú)的守護(hù)者,而要做一個(gè)與所愛(ài)之人共享平凡日常的普通人的故事。人工智能小說(shuō),不是全部脫離人,而是人機(jī)協(xié)作,整體結(jié)構(gòu)由人決定,細(xì)節(jié)描寫(xiě)由人工智能完成,這是一種新的創(chuàng)意寫(xiě)作方式。在創(chuàng)作時(shí),我們首先對(duì)網(wǎng)絡(luò)小說(shuō)的結(jié)構(gòu)進(jìn)行了深入研究,分析情節(jié)脈絡(luò),撰寫(xiě)大量提示詞,然后在人工智能大模型中批量生成內(nèi)容,形成整體線索連貫的長(zhǎng)篇小說(shuō)。后期通過(guò)人工介入,對(duì)大模型生成的小說(shuō)進(jìn)行修改,刪除重復(fù)、累贅的部分,為情節(jié)跳躍的部分撰寫(xiě)連接語(yǔ)句,最終打磨成型。
記者:小說(shuō)呈現(xiàn)了什么樣的風(fēng)格,是否實(shí)現(xiàn)了預(yù)期效果?
王峰:小說(shuō)整體線索能夠保持一致,語(yǔ)言具備了一定的文學(xué)性,比如開(kāi)頭這樣寫(xiě)道:“他緊張地握緊了手中的武器,指尖在冰冷的金屬中尋找一絲安慰。他的心跳如同在狂風(fēng)中的鼓點(diǎn),敲擊著他的胸膛。儀式即將開(kāi)始,他需要做的,就是走向山谷中心的火光處。”但是,在細(xì)節(jié)方面還存在大量跳躍和重復(fù)之處,需要人工修改。比如,大模型對(duì)每個(gè)提示詞的生成內(nèi)容都是有始有終的,會(huì)為每次生成內(nèi)容添加一個(gè)結(jié)尾,我們稱(chēng)之為“光明的尾巴”,這個(gè)就需要后期調(diào)整。在語(yǔ)言上,人工智能小說(shuō)表現(xiàn)出一種愣呼呼的風(fēng)格,不少大模型生成的作品都是論文腔,我們只能不斷微調(diào)本地大模型來(lái)提升表達(dá)水平。下一步我們會(huì)訓(xùn)練出一個(gè)專(zhuān)注于文學(xué)(小說(shuō))創(chuàng)作的大模型,讓“人人皆可寫(xiě)作長(zhǎng)篇”成為可能。
記者:人工智能會(huì)根據(jù)提示詞順利生成適合的內(nèi)容嗎?創(chuàng)作過(guò)程中做了哪些調(diào)整?
王峰:提示詞被業(yè)界親切地稱(chēng)為“耳語(yǔ)者”,要提供情節(jié)、環(huán)境、人物情緒及事件等信息。一開(kāi)始,我們希望大模型能夠生成符合我們期望的文本結(jié)果,但現(xiàn)實(shí)是大模型的生成結(jié)果往往顯得有些“失控”。我們努力進(jìn)行控制,但很快發(fā)現(xiàn),幾乎所有的控制都無(wú)法完成任務(wù)。提示詞長(zhǎng)了不行,短了也不行。將提示詞輸入大模型時(shí),每次生成的內(nèi)容都不一樣,如果重復(fù)輸入六七次,所生成的內(nèi)容就開(kāi)始重復(fù)出現(xiàn)了,這讓我們感到有些手足無(wú)措。后來(lái)我們領(lǐng)悟到:既然無(wú)法完全控制大模型的輸出,何苦一味追求符合自己完美構(gòu)想的結(jié)果呢?這或許正是大模型本身的特點(diǎn)?!笆Э亍辈皇撬娜秉c(diǎn),而是它的變量,試圖讓它按照我們的期望產(chǎn)生完美的文本結(jié)果幾乎是不可能的。所以,我們不斷調(diào)整提示詞內(nèi)容,只為小說(shuō)提供一個(gè)大致走向,使情節(jié)保持連續(xù)性,而具體故事細(xì)節(jié)就交給了大模型。
記者:為什么說(shuō)超長(zhǎng)文本輸出仍是人工智能的局限?未來(lái)的人工智能小說(shuō)創(chuàng)作將是什么樣的圖景?
王峰:目前,人工智能創(chuàng)作仍是一問(wèn)一答的形式,無(wú)法實(shí)現(xiàn)持續(xù)輸出,我們要源源不斷提供提示詞。對(duì)每個(gè)提示詞,國(guó)內(nèi)大模型平均會(huì)生成500字的內(nèi)容,所以創(chuàng)作100萬(wàn)字的小說(shuō),就要提供2000個(gè)提示詞。其實(shí),大模型的長(zhǎng)文本處理能力主要體現(xiàn)在其閱讀理解能力上,它首先要理解我們的創(chuàng)作意圖,然后生成連貫性的語(yǔ)句。
技術(shù)是快速迭代的,隨著更多大模型的研發(fā)應(yīng)用,超長(zhǎng)文本輸出和人工智能閱讀理解能力將不是問(wèn)題。舉個(gè)例子說(shuō),我大約在三年前開(kāi)始組建團(tuán)隊(duì),探索智能寫(xiě)作的方法。當(dāng)時(shí),邀請(qǐng)了計(jì)算機(jī)、文學(xué)、語(yǔ)言、哲學(xué)、古籍、數(shù)學(xué)、地理等多個(gè)領(lǐng)域的研究者共同探討,基于當(dāng)時(shí)的大模型技術(shù)制定了創(chuàng)作方案。但是,2022年底,國(guó)外某個(gè)大模型的換代升級(jí)給我們先前的設(shè)計(jì)帶來(lái)巨大沖擊,曾經(jīng)的很多問(wèn)題不再是問(wèn)題。眼下人工智能技術(shù)如龍卷風(fēng)般迭代,我相信現(xiàn)在的很多困惑和難題將來(lái)都會(huì)迎刃而解。
目前,人工智能在文藝創(chuàng)作上主要影響網(wǎng)絡(luò)文學(xué),因?yàn)榫W(wǎng)絡(luò)文學(xué)寫(xiě)作模式化、類(lèi)型化比較強(qiáng),寫(xiě)作者可以借助大模型的幫助進(jìn)行各個(gè)部分的細(xì)節(jié)寫(xiě)作,比如人物生成、物品生成、人物關(guān)系圖譜生成、段落寫(xiě)作等。這些功能都已經(jīng)實(shí)現(xiàn),只是質(zhì)量還不高,留有相當(dāng)大的探索空間。
記者:很多人擔(dān)心人工智能創(chuàng)作的版權(quán)問(wèn)題。您怎么看待這個(gè)問(wèn)題?
王峰:關(guān)于人工智能創(chuàng)作的版權(quán)問(wèn)題,業(yè)界正在探討。我個(gè)人理解大致可分為兩個(gè)方面:一是訓(xùn)練語(yǔ)料的問(wèn)題,二是生成產(chǎn)品的歸屬問(wèn)題。前者目前是最主要的瓶頸,首先我們需要獲得公開(kāi)語(yǔ)料,并對(duì)其進(jìn)行進(jìn)一步加工,這在研究范圍內(nèi)是允許的。如果進(jìn)行商業(yè)化運(yùn)作,就存在備案等問(wèn)題,我認(rèn)為一定要尋找大模型發(fā)展與語(yǔ)料權(quán)利保護(hù)的平衡點(diǎn)。至于后一個(gè)問(wèn)題,生成的產(chǎn)品著作權(quán)到底是部分歸智能平臺(tái)部分歸個(gè)人,還是全部歸個(gè)人,要看具體的約定。這些都是未來(lái)智能寫(xiě)作無(wú)法避開(kāi)的問(wèn)題,需要研究者和實(shí)踐者共同探討。