AI能學習反諷嗎?曾卓然、董啟章、鄧正健如何給AI下指令

報導 | by  虛詞編輯部 | 2023-05-18

香港文學館製作的全新文藝清談節目《藝文在線等》,上月底開始在網絡平台首播,並由《歷史係咁話》前主持曾卓然博士與鄧小樺擔任主持,首兩集話題圍繞近期大熱的 AI 聊天機器人ChatGPT,從文學角度討論人工智能現時的限制,以看出文藝人需要強化的方向,並談及幽默、反諷、侘寂等關鍵詞,節目播出後亦在文藝界引來不少後續討論,《虛詞》編輯部整理相關內容,並與曾卓然、鄧正健再作訪談,更深入探討 AI 是否能夠學習自我反諷的寫作風格。


《藝文在線等》主持人之一的鄧小樺,在第二集「AI 有機夜唔夜」節目中提到,「人類對於愈突出的東西,愈容易模仿,但 AI 不懂得模仿風格明顯的東西,愈是獨特, AI 愈是不懂得模仿」,並對照廖偉棠詩作〈新年祝詞〉與 AI 版文本作為例子,ChatGPT 模仿原詩風格所寫的詩,都把原本意思變得正面,例如原句「兔子應該憤怒、轟鳴,吃掉老虎的睡」變成了「鳥兒應該歡快、歌唱,傳遞愛的力量」,測試了機制如何處理它不懂得的東西,每當遇到無法處理的比喻,都會以「更美好,更美好」地矇混過去。


第一集:https://www.youtube.com/watch?v=ol3mbXBqFFc&t=2014s

第二集:https://www.youtube.com/watch?v=vTrBNgYcjgg&t=1571s


自從首兩集《藝文在線等》節目播出後,也惹起文藝界的不少後續討論,其中作家董啟章亦有在社交平台留言表達想法,認為節目內容提及廖偉棠的詩「被 AI 幼稚化」,可能是因為指令不夠準確,並以鄧正健向 ChatGPT 發出指令,模仿陳滅的句式及風格,撰寫題為〈人工智能,去死吧〉的詩作為例子,可見「出來的效果非常驚喜,甚至有 AI 自我反諷的意味」,因此它能產出甚麼,很大程度關乎 prompt engineering 的學問,「懂和不懂寫 prompt,成品的差別可以是天與地」。


cap


迎接升級版ChatGPT-4 喬姆斯基質疑道德冷漠:「表現出類似邪惡的平庸」



鄧正健如何指導AI寫出陳滅風格


曾以 ChatGPT 模仿陳滅〈市場,去死吧〉的風格,寫成〈人工智能,去死吧〉詩作的鄧正健,亦與《虛詞》分享他如何下達指令,讓 ChatGPT 生成這首效果予人驚喜的詩作。「最初我提隨意給ChatGPT一些指令,讓它生成詩作,但出來的效果很差。於是我便改為先輸入一首先成的詩供它學習,再讓它臨摹。我第一首輸入的是西西的〈可不可以說〉,但 ChatGPT 生成出來的臨摹作品並沒有做到西西原詩中關於量詞和中文詞彙組合的文字遊戲,於是我便假設 ChatGPT 的演算法是無法理解文字遊戲,於是我便改用〈市場,去死吧〉供其學習和臨摹。」


originial poem



tang poem


鄧正健給 ChatGPT 所下的指令是,「請模仿以下一首詩(按:同時我在指令下貼了〈市場,去死吧〉全詩)的句式及風格,寫一首題為〈人工智能,去死吧〉的詩,以表達文藝青年對人工智能的態度,這種態度是恐懼但又不承認,因而裝作出對人工智能不滿和輕視。而詩中每個段落不能少於五句」,其中的考量包括「讓ChatGPT只學習一首詩,看看它是否能掌握詩的『句式』跟『風格』是什麼意思」;有關文藝青年對人工智能的態度這個主題,則是他從當時文學界網友言語中得到靈感,當中包含了「恐懼」、「否認」和「偽裝」三種態度,這是鄧正健給予 ChatGPT 的「主題」,再看看它是否能把給予的「主題」,以學習得來的詩的「句式」和「風格」來表達;至於「每個段落不能少於五句」的指令,鄧正健表示是基於他發覺 ChatGPT 似乎沒有將原詩段落句數分配視為「句式」或「風格」。「在最初的幾次生成中,它所給的詩都是以四句為一段,我的感覺是它仍以舊體詩的四句結構作為生成詩作的基礎。為了保留原詩的結構,我最後才加上『每個段落不能少於五句』這一指令。」


除了給 ChatGPT 下指令寫詩外,鄧正健也按照詩人筆名(陳滅)作藍本,替〈人工智能,去死吧〉生成筆名「簡筆殤」,談及背後的原因,鄧正健說既然讓 ChatGPT 透過學習一首詩來生成一首詩,也想看看「如果以ChatGPT語言生成的方法,能否創作出一篇可以完全偽裝成人類創作的作品,並拿去發表」。



曾卓然:AI無法掌握語境,無法觀察讀者


另一位《藝文在線等》的主持曾卓然,接受《虛詞》訪問時亦再對節目內容稍作補充,並從兩個部分談及與文學相關導向AI未來的必由之路,其一是關於「幽默」與「反諷」的部分,尤其前者,由於沒有 sense of context,「AI 沒辦法有效觀察讀者是甚麼」,即使可以輸入更多資料作模擬,但效果仍然不理想,原因在於「我們本身需要在文藝有 suprise、有超乎想像的東西,但這些設定如果一併輸入,將會失去它的意義」;另一部分在於AI目前技術上的限制,因為儲存上限的問題,那些帶有很多角色與情節的長篇小說,AI 暫時仍然未能做到,亦未見有任何敘事類的優秀長篇或中篇文藝類作品生成,反而「格式與規矩愈明確的作品,照著模仿而成功的機率愈高」。


雖然 ChatGPT 生成的〈人工智能,去死吧〉成品質素似乎不錯,但向其下達指令的鄧正健,亦認為「反諷的效果往往是來自語言的歧義,或不在文句表面意思上的隱藏意義,同時亦關係到語言運用時的語境脈絡」,人工智能生成語言較難透過這些方式有效獲得,並從個人使用 ChatGPT 的經驗稍作延伸。「以我讓 ChatGPT 學習〈可不可以說〉的印象來說,它似乎未能掌握漢語文字遊戲中的諷刺性。至於〈人工智能,去死吧〉中似乎效果較好,但我懷疑這是因為「嘲諷人工智能」的言論本來就十分常見,在 ChatGPT 過去的學習中已有大量相關的語言,故在臨摹〈市場,去死吧〉時,往往只是將原詩中的詞彙置換,而保留了原詩的句式,就能生成出跟原詩相似的反諷感」。


對比其他文學類型,鄧正健表示「在散文和小說作品的生成過程裡,由於人生智能所學習的對象包含了一切形成的文字,而不是專門學習某種文類,出來的作品往往流於俗套和濫調」,詩歌的情況雖然也差不多,但相較起來,「人工智能在學習個別詩作後所生成出來的臨摹作品,『風格感』會比較強烈,原因不過是詩歌語言本身就有較強的『風格感』,我仍然懷疑人工智能所學習的,只是詩的『形式風格』,而學習不到這形式風格的歧義、隱喻和語境」,反而散文與小說中的反諷多來自「內容」,較容易透過現時的 AI 學習方法達到一個更理想的生成效果,然而「人工智能生成笑話的水準並不穩定,這隱約也說明了事情的難度」。



董啟章:我們要做的是要奪回語言本身,奪取 AI


在《藝文在線等》節目留言處簡短表達過想法的董啟章,其後也在他的「董富記」個人網站,再以〈在AI君臨時代的文學寫作〉撰寫長文作深入討論,表示「它的出現將會改變未來世代的語言運用方式,並反過來影響人類的語言能力,以及對語言作品的評價準則」,將徹底顛覆人類對語言的認知。在GPT強大的模仿能力之下,董啟章認為「風格是文學的重災區」,並對「幽默」和「反諷」這兩個關鍵詞稍作補充,認為它們並非單純用過模仿就能達到,「兩者都涉及雙重性,即意會到處境中存在微妙的差異和對反,並以曖昧(ambiguous)但又明確(obvious)的弔詭方式表出」,尤其幽默需要實際經驗才能體會與運用,也「戳中了現時的 AI 的死穴——它欠缺實體的、經驗的存在」。


董啟章在文章提到,另一件 AI 無法替代的事情,是「意義」的產生。即使 AI 將來在技術上完善得可以寫出極度高質的作品,「我們所珍重的、堅守的,或者可以說是執著的,是『作者』這個實體」,我們之所以愛文學,是因為技藝高超的文學作品,是由真實而有感受和思考的人所創作,「沒有創造力、思考力與道德判斷力的GPT,因此也沒有確立意義的能力」。然而,董啟章在文中亦提醒讀者,縱使「對文學判斷充滿信心,但我們必須承認自己對 AI 技術所知有限」,否則很容易過於輕視它的能力,輕率地斷定有些事情是它做不到。在 AI 當道的時代,文學不再理所當然,但如能好好面對和回應,董啟章反而覺得「說不定會是促使全新時代文學出現的契機」,並再次重申「文學不能置身事外,也無法獨善其身;不去駕馭它,就會被它駕馭」的觀點,我們要做的是要奪回語言本身,奪取 AI ,「教育 AI 甚麼是文學,讓它更接近文學、懂得文學,甚至支持文學、傳播文學」,要做到這一點,「就要繼續努力不懈地寫出真正的文學作品」,這亦是文學對未來的責任。


GPT-4 翻譯成本幾何級數下降 作家董啟章:「不駕馭它,就是我們被它駕馭」



延伸閱讀

3體同病相連雪豹

熱門文章

編輯推介

【無形・◯】桃緣

詩歌 | by 羅貴祥 | 2024-04-22

【無形.同病相連】太空漫遊

詩歌 | by 陳康濤 | 2024-04-11