
美國一項最新研究顯示,大型語言模型(LLM)在接受作家作品的訓練並經人手微調後,其生成的文本不僅能忠實呈現作家的語調與風格,甚至在盲測中比人類作家的模仿作品更受讀者與專家青睞。這項發現在英語寫作領域中,證實了 AI 已具備與人類作家分庭抗禮,甚至勝過人類的實力。
在一項命為《讀者更喜歡經版權書籍訓練的 AI 輸出,而非專業人類作家》(Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers)的研究,由美國石溪大學計算機科學助理教授 Tuhin Chakrabarty、哥倫比亞大學法學院教授 Jane C. Ginsburg 及密西根大學資訊學院副教授 Paramveer Dhillon 共同進行。
研究團隊招募了 28 位來自美國頂尖創意寫作碩士(MFA)課程的候選人,要求他們模仿 50 位享負盛名的作家的風格,當中有諾貝爾文學獎得主韓江、Annie Ernaux,布克獎得主 Salman Rushdie、Margaret Atwood 等,創作 150 篇短文。
同時研究人員使用了ChatGPT、Claude 和 Gemini三種AI工具,在兩種條件下一同生成模仿相同作者的文本:一,「情境提示」,只輸入指導性提示及提供少量範本;二,「微調」,經由研究人員對AI輸入指令,其中在ChatGPT更上載每位作家的所有作品進行訓練。由人類創作創作與AI生成的文本及後交由28名MFA專家作家和131名從 Prolific 平台招募的普通讀者進行盲測,並以「風格忠實度」與「寫作品質」兩項標準來評分。
研究結果顯示,在「情境提示」條件下,MFA 專家偏好人類創作,普通讀者則無明顯偏好。然而,經「微調」後,情況出現了關鍵逆轉:無論是專家還是普通讀者,都明顯更偏好 AI 生成的文本,認為其「風格忠實度(stylistic fidelity)」與「寫作品質(writing quality)」均超越了出自人類作家的模仿作品。
研究分析指出,偏好逆轉的關鍵在於微調過程消除了AI常見的陳詞濫調,即使使用最先進的AI檢測工具,也幾乎無法分辨文本由AI生成。Dhillon在接受媒體採訪時表示,讀者更偏好AI生成的文本,而非人類作品。考慮到AI生成內容的成本較低,這意味著AI文學作品可能與人類創作競爭,甚至取代之。
這項研究展示出經由微調的AI,已經可以在模仿風格領域中生成出與人類分庭抗禮,甚至超越人類的作品。研究估算AI生成一部 10 萬字小說的總成本中位數只需 81 美元(約639港元),相比之下聘請專業作家撰寫同等長度手稿的費用則需要 25,000 美元(約194,345港元) ,AI 將成本暴降了 99.7% 。雖然金額不包括出版作品所需額外的人類編輯費用,但無疑是揭露出AI對創意寫作市場的潛在破壞力。
現時美國已有50多個向AI公司提出侵權的訴訟案。雖然 AI 生成的文本沒有逐字複製原文 ,但研究證實,經過微調的 AI 能夠生成出讀者偏愛的作品,構成了對原作者作品的「市場替代品」 ,AI公司難以以「公平使用(Fair use)」作為法律抗辯。
今年 3 月,日本亞馬遜 Kindle 商店曾出現冒名村上春樹、東野圭吾等作家的 AI 山寨電子書,當時這些作品因風格拙劣、語句不通而被讀者輕易識破。然而,這次研究證實,隨著AI科技不斷,用戶只需提供足夠的訓練樣本並輸入微調的指令,AI 就能精準模仿作家風格,達至真偽難辨的程度。
未來作家的權益將如何獲得法律保障?出版商與電子書平台又會否引入更嚴格的審查機制?讀者不妨持續關注這場 AI 與人類的博弈。