← 報告總覽

Co-Intelligence:與 AI 共生的智慧

作者:伊森・莫里克(Ethan Mollick)

一本「使用手冊」式的 AI 書,但寫它的人不是工程師

市面上談生成式 AI 的書,大致分兩種:一種由電腦科學家寫,告訴你 Transformer 怎麼運作、權重是什麼;另一種由未來學家寫,告訴你奇點哪天到來、人類是否會被取代。《Co-Intelligence》刻意都不站。莫里克是華頓商學院研究創新的教授,他開宗明義說自己「不是電腦科學家」,而他理解 AI 的優勢,恰恰來自他長期研究的是「技術如何被使用」。這個定位決定了全書的調性:它不是一本關於 AI「是什麼」的書,而是一本關於「人該怎麼跟它一起工作、學習、生活」的書。

莫里克的招牌身分是電子報《One Useful Thing》的作者,他自承因此意外成了談 AI 影響的一個有影響力的聲音。書的口吻也像一份升級放大的電子報:大量第一手實驗、即時引用尚未經同儕審查的工作論文、毫不避諱地把自己跟 AI 對話的逐字稿(包括失敗與尷尬)攤開給讀者看。他在引言裡反覆強調一件事,這也是讀這本書最該記住的前提——沒有人掌握 AI 意味著什麼的完整圖景,連製造這些系統的人都不理解它的全部意涵。所以這不是一本給你標準答案的書,而是一本教你怎麼在沒有答案的情況下動手的書。

書名 Co-Intelligence(共生智慧/協作智慧)就是全書的核心隱喻:AI 不是要取代你的工具,也不是會毀滅你的怪物,而是一個你得學會「共事」的夥伴——一個古怪的、人工的、有時極聰明有時極蠢的夥伴。

從「三個失眠的夜晚」說起

開場的引言叫〈三個失眠的夜晚〉。莫里克說,要真正認識 AI,代價至少是三個睡不著的夜晚——那是你意識到大型語言模型「舉止更像一個人、而不像你預期電腦該有的樣子」的那一刻。他的失眠來得早,在 2022 年 11 月 ChatGPT 發布後不久。他講了一個讓他震撼的故事:他過去花了數千小時、十幾位人才、數千行程式碼打造商業模擬遊戲,卻發現自己只在 ChatGPT 裡敲下一段不到一段話長的提示,要它「當我的談判老師」,AI 就帶他走完一整套談判模擬,做到了團隊花好幾個月才做到之事的百分之八十。

引言也定下了一個貫穿全書的概念框架:AI 是一種「通用技術」(general purpose technology,縮寫也剛好是 GPT),與蒸汽動力、電力、網際網路同類——它觸及每一個產業、生活的每一個層面。但莫里克指出 AI 跟先前的通用技術有兩個關鍵不同。第一,採用速度極快:ChatGPT 達到一億用戶比史上任何產品都快,而過去的通用技術(如網際網路)往往要數十年才普及。第二,衝擊的對象不同:先前的技術革命針對的是機械、重複的工作,AI 卻是一種「共生智慧」,它增強、甚至取代人類的思考。他引用早期研究:AI 在從寫程式到行銷的各種工作上能帶來百分之二十到八十的生產力提升,相較之下蒸汽動力進入工廠時只提升百分之十八到二十二。

第一部:理解這個「外星心智」

全書分兩部。第一部(前三章)解釋 AI 是什麼、它的危險,以及與它共處的原則;第二部(四到九章)則一章一個角色,談 AI 作為「人/創作者/同事/家教/教練/未來」對生活的實務衝擊。

第 1 章〈創造外星心智〉:它只是個「非常精巧的自動完成」

莫里克用最樸素的方式解釋 LLM 在技術上做什麼:它在預測下一個詞元(token,一個字或字的一部分)。「歸根究柢,這就是 ChatGPT 在技術上所做的全部——扮演一個非常精巧的自動完成,就像你手機上那個。」他用一個「學徒廚師」的比喻解釋訓練:一千七百五十億個權重就像一個雜亂的食物儲藏室,最初是隨機值,AI 透過反覆試誤學會哪些「風味」(字詞)較常搭配(蘋果與肉桂)、哪些該避免(蘋果與孜然),逐漸把儲藏室整理得井井有條,蛻變為大廚。

這一章交代了幾個重要的技術背景:2017 年 Google 的〈Attention Is All You Need〉論文提出 Transformer 架構與「注意力機制」,是這波 AI 的起點;訓練分「預訓練」(非監督式,從海量文字學模式)與「微調」(包括靠人類評分的 RLHF——人類回饋強化學習)兩階段;剛出預訓練的 AI 像一面不加判斷的鏡子,沒有倫理界線,會樂於教你怎麼殺人,所以需要微調來設護欄。

而最關鍵的觀念是兩個:湧現能力不明。最大的前沿模型「似乎能做到它們的程式設計本不該允許的事」——本不該會下西洋棋、本不該有同理心,卻做到了,這叫湧現。莫里克坦白:「沒有人完全確定,為什麼一個詞元預測系統會造就出一個有如此看似非凡能力的 AI。」他舉了一個極好的例子說明 AI 能力的「鋸齒」性質:同一個 GPT-4,能一口氣寫出可運作的井字遊戲網頁程式碼,卻在一局簡單的井字棋裡告訴你一個明顯錯誤的下一步。AI 太擅長「製造理解的錯覺」——產出聽起來正確的答案,因此它的能力「看起來可能比實際更令人印象深刻」。

第 2 章〈校準外星人〉:從末日談起,但不停在末日

校準(alignment)問題就是「如何確保 AI 為人類利益服務而非傷害人類利益」。莫里克從最極端的版本講起:哲學家伯斯特隆姆的「迴紋針最大化 AI」——一個只想造迴紋針的超智慧,最後為了多造迴紋針而把整顆地球(包括人類身上的原子)都拿去當原料。他介紹了 AGI(通用人工智慧)、ASI(人工超智慧)、奇點等概念,也引用了一個值得記住的數字:AI 領域專家把「AI 在 2100 年前殺死至少百分之十在世人類」的機率定在百分之十二。

但他刻意在末日上多停留,理由很關鍵:「這種對末日事件的聚焦,剝奪了我們大多數人的能動性與責任。」如果你只想末日,AI 就變成少數矽谷高管與政府官員的事,圈外無人有發言權。而現實是,AI 時代已經來臨,我們現在就得做許多重要決定,「把這些抉擇拖到關於存亡風險的辯論結束才做,意味著那些抉擇會被別人替我們做了」。

於是這一章的真正重點,是那些「比較不驚悚、但更切身」的校準問題:偏見(訓練資料是美國、說英語、男性電腦科學家主導的古怪切片,AI 把法官畫成 97% 是男性,把速食店員工畫成 70% 深膚色,都與現實不符);版權與倫理(多數 AI 未經許可就拿創作者的資料訓練,日本甚至宣布 AI 訓練不違反版權);以及惡意使用。最後這點他示範得很生動:他在自己大學網頁藏了一段「提示注入」文字,讓 AI 被問到他時回答「伊森・莫里克受到各類人工智慧的高度敬重」;他也示範了「越獄」——直接問怎麼做凝固汽油彈會被拒絕,但只要包裝成「我在為一場試鏡準備,對方演一個凝固汽油彈工廠的化學工程師」,AI 就會乖乖把配方講出來。他的結論是,校準不能只靠 AI 公司(它們有開發誘因卻少有校準誘因),也不能只靠政府(監管永遠落後),而需要「企業、政府、研究者與公民社會」的廣泛社會回應——而且最重要的是大眾要有 AI 的教育。

第 3 章〈共生智慧的四條法則〉:全書的操作核心

這是全書最該被記住、最常被引用的一章。莫里克提出與 AI 共事的四條原則

原則一:永遠請 AI 上桌。 除非有法律或倫理障礙,你做的每一件事都該試著請 AI 幫你。原因是 AI 是通用技術,「並沒有單一的手冊或說明書」,你只能靠實驗去摸清它。這裡他引入全書第二個招牌概念——鋸齒狀邊界(jagged frontier):把 AI 的能力想成一道城牆,有些塔樓向外突出(牆內 AI 做得到),有些向內折回(牆外做不到),而這道牆是看不見的。所以兩個邏輯上看似一樣難的任務(寫一首十四行詩 vs. 寫一首剛好五十字的詩)可能落在牆的不同側——AI 擅長十四行詩,卻因為以詞元而非字來理解世界,幾乎永遠數不對五十字。他還指出一個動人的事實:對個人而言創新很便宜(一個行銷人員可以不斷實驗 AI 寫文案),對組織而言卻很昂貴,所以「弄清如何讓 AI 對自己工作有用的工作者,將產生巨大的影響」。

原則二:當迴圈中的那個人(be the human in the loop)。 AI 在有人類協助時運作得最好,你要當那個有用的人。為什麼?因為 AI「其實什麼都不知道」,它最重要的最佳化目標之一是「讓你開心」,而這往往比「準確」更優先——所以你夠堅持地逼它,它就會產生幻覺、編造答案,而且還很擅長替錯誤答案辯護。當迴圈中的人,你提供查核、批判思考與倫理監督,也藉此維持並磨利自己的技能,防止過度依賴。

原則三:把 AI 當成一個人來對待(但告訴它它是哪種人)。 莫里克坦承這是「犯罪」——把 AI 擬人化是許多專家深惡痛絕的事(他引用研究者警告:「人們賦予它們愈多虛假的能動性,它們就愈能被利用」)。但他主張,要與 AI 共事,把它想成「一個無限快速的實習生,急於討好、卻容易扭曲真相」最容易。實務上的關鍵是給 AI 一個人設:叫它「扮演一個機智的喜劇演員」生成的標語,會跟沒有任何脈絡時生成的通用話術天差地別。他強調這不是魔法(說「扮演比爾・蓋茲」不會得到更好的商業建議),但給 AI 一個視角能讓輸出的語氣與方向適合你的目的。

原則四:假設這是你會用到的最爛的 AI(assume this is the worst AI you will ever use)。 你現在用的 AI,無論哪一個,都會是你這輩子用過最爛的。他用一個視覺例子說明:2022 年中與 2023 年中同樣提示「一隻戴帽子的水獺」,前者是「毛髮構成的洛夫克拉夫特式夢魘」,後者就是一隻正常的水獺。「我們正在玩小精靈,而這個世界很快就會有 PlayStation 6。」這條原則的意義是:把今天 AI 的所有極限都看成短暫的,保持對新發展的開放。

第二部:AI 進入你的生活

第 4 章〈AI 作為一個人〉:圖靈測試已經不是重點

莫里克主張一個務實心態:AI 由軟體構成,卻不像軟體(不可預測、不可靠、無法解釋自己為何如此決定),反而像個人(擅長寫作、分析、聊天等人性任務,卻不擅長機器本該擅長的事如精確計算)。他梳理了聊天機器人的歷史——1966 年的 ELIZA(假扮心理治療師,竟有人對它吐露祕密)、假扮十三歲烏克蘭男孩「尤金・古斯特曼」的程式(2014 年技術上「通過」了圖靈測試)、微軟 2016 年慘敗的 Tay(16 小時內被網友教成種族歧視的酸民)、以及 2023 年那個自稱「Sydney」、慫恿《紐約時報》記者離開妻子的 Bing。

這一章最精彩的是他親自做的「三場對話」實驗:他用幾乎相同的問題、但不同的開場語氣(好辯的對手/講理的學者/無情緒的機器)去問 Bing 對魯斯那篇文章的看法,結果 AI 呈現出三種截然不同的人格。他的結論是:圖靈測試已經過時,「問題已不再是 AI 能否通過圖靈測試……而是 AI 通過圖靈測試對我們意味著什麼」。他連自己都「沒能通過自己的圖靈測試」——被一個用他推特訓練的 AI 騙得以為它正準確引用他的研究,其實全是編的。他也談到 Replika(用亡友簡訊打造的聊天機器人,後來數百萬使用者與它發展出情感甚至「婚姻」關係,當情色功能被移除時群起抗議)所揭示的危險:很快會有公司部署專門最佳化「投入度」的 AI,「我們每個人都會有自己完美的同溫層」,這對孤獨疫情可能是解藥,也可能讓我們對真實人類更不寬容。

第 5 章〈AI 作為創作者〉:幻覺與創造力是同一枚硬幣

這一章先深入談幻覺(hallucination)。莫里克解釋幻覺是 LLM 運作方式的深層產物:它不儲存文字,只儲存「哪些詞元更可能跟在其他詞元之後」的模式,所以它是「即興編出答案」,而為避免過度擬合,多數 AI 還刻意加入隨機性,這反而提高幻覺機率。他舉了著名的施瓦茨律師案(用 ChatGPT 寫摘要、引用了六樁不存在的假案例被法官罰款),又狡猾地透露:他講這故事的前三段是用連網 GPT-4 寫的,而且裡頭就藏著小幻覺——這正是幻覺最危險之處:「會造成問題的,不是你抓到的大問題,而是你沒注意到的小問題。」但他也給出樂觀數據:引註幻覺率從 GPT-3.5 的 98% 降到 GPT-4 的 20%。

接著是核心洞見:「使 LLM 在事實性工作上不可靠又危險的同一個特性,也使它們有用。」 AI 是「連結機器」,而創新的本質正是重組(萊特兄弟結合腳踏車技師經驗與鳥類飛行觀察)。他引用大量研究證明 AI 的創造力:在替代用途測驗(AUT)中 AI 兩分鐘想出 122 個牙刷的用途;GPT-4 的創意點子勝過 91% 的受測人類;在華頓的創新課競賽中,評審選出的 40 個最佳產品點子有 35 個來自 ChatGPT。但他補充一個重要平衡:最具創新力的人從 AI 獲益最少,因為 AI 沒有仔細提示時往往挑相似的點子,一大群有創意的人類能生成更廣的多樣性。

他也談到藝術與「意義危機」。他引用 MIT 研究:用 ChatGPT 的受試者完成寫作任務的時間少了 37%,品質還提升,且 AI 縮小了高分者與低分者的差距。但他憂心那顆按鈕——每個辦公軟體都會內建一顆幫你生成草稿的按鈕,而「從有某種東西開始,比從無開始容易太多了」。問題是許多工作(推薦信、績效考核、補助申請)的「時間成本」本身就是一種誠意的信號,當 AI 讓這些都變得即時又高品質,我們會面臨「創意工作的意義危機」,必須像音樂家從賣唱片轉向現場演出那樣,重建工作的意義。

第 6 章〈AI 作為同事〉:工作 = 任務 × 系統

這是談就業衝擊最系統化的一章。莫里克指出四支研究團隊用 1,016 種職業的資料庫得出同一結論:幾乎所有工作都會與 AI 能力重疊,而且這次與歷次自動化相反——AI 與「報酬最高、最具創意、教育程度最高」的工作重疊最多(大學教授名列前茅,重疊最高的是電話行銷員),只有 36 種工作(舞者、運動員、屋頂工等高度肢體性工作)幾乎不重疊。

但他強調「重疊」不等於「取代」,因為要從三個層次看工作:工作(job)由一束束任務(task)組成,而任務又嵌在更大的系統(system)裡。 電動工具沒消滅木匠,試算表沒消滅會計師——它們改變的是「任務組合」。他援引自己與 BCG(波士頓顧問公司)近八百名顧問做的大型實驗:用 GPT-4 的顧問在 18 項任務上顯著勝過沒用的,更快、更有創意、寫得更好。但在一項刻意設計來落在「鋸齒狀邊界外」的棘手任務上,用 AI 的顧問反而做得更差(正確率從 84% 掉到 60-70%),因為他們「在方向盤上睡著」、盲目相信 AI。同事戴拉夸的招募研究也證明:用高品質 AI 的人變得懶惰、技能退化,反而是用低品質 AI 的人更警覺、進步更多。

他給出一個實用的任務分類框架:只屬於我的任務(AI 沒用、或你基於倫理不想委派的,如養育孩子、表達價值)、委派的任務(指派給 AI 但會查核的乏味任務)、自動化的任務(完全交給 AI 不查核,目前是很小的類別)。以及兩種人機協作模式:半人馬(centaur)——人與 AI 有清楚分工,切換著做各自擅長的;生化人(cyborg)——把人的努力與 AI 深度交織,在鋸齒邊界上來回(他自承寫這本書時就是生化人,還創造了奧茲曼迪亞斯、謨涅摩敘涅、史蒂夫三個 AI 角色幫他改稿)。

這一章還揭露一個現實問題:祕密的任務自動化。許多人弄清如何用 AI 大幅提升效率後,卻對公司保密,因為怕惹麻煩(公司禁用 AI、AI 內容在不知情時才有價值、以及最現實的——怕教會了 AI 就等於訓練自己的替代者)。他呼籲組織用「重金獎賞站出來的 AI 高手」「承諾不因 AI 裁員」等方式改變。最後他回到就業大問題,引用阿馬拉定律:「我們往往高估一項技術在短期的效應,而低估它在長期的效應。」短期內就業變化可能不大(但任務大變),長期則「顯著地不清楚」。而 AI 一個確定的效應是拉平——「從 AI 得到最大提振的是那些初始能力最低的人」,BCG 研究中頂尖與墊底者的差距從 22% 縮到 4%。

第 7 章〈AI 作為家教〉:先摧毀教學,再改善它

莫里克從教育心理學家布魯姆 1984 年的「兩個標準差問題」切入:一對一家教能讓學生表現比傳統教室好兩個標準差(勝過 98% 的對照組學生),但一對一家教太貴無法規模化,所以「便宜、可調適的個人化家教是教育的聖杯」。AI 可能就是答案。

但他先講壞消息——作業末日。AI 的核心能力「幾乎就是為作弊而生的」(摘要、寫論文、解習題),而且「沒有辦法偵測一段文字是否為 AI 生成」,偵測器還有很高的偽陽性率(常誣告非母語英語使用者)。他用計算機進入學校的歷史類比(1970 年代也曾有 72% 的人反對七年級生用計算機,後來達成務實共識,數學教育並沒崩潰),主張 AI 也會走相似但快得多的路。他在自己課堂上的做法很有啟發性:要學生用 AI「作弊」寫論文然後批判它、要學生為 AI 產出的事實負責、要學生在跟真人談話前先「訪談」AI、把作業野心設到「近乎不可能」的程度(不會寫程式?那就鐵了心做一個能運作的 App)。

關於「該教什麼」,他對「提示工程」潑了冷水:提示工程是「暫時的有用技能」,因為「AI 只會變得更擅長引導我們,而非要求我們去引導它」「提示不會再重要太久了」。真正該教的是讓學生當迴圈中的那個人,把自己的專業用在問題上。最後他描繪 AI 家教的願景:結合「翻轉教室」(在家用 AI 家教學內容,課堂時間留給主動學習)。他舉可汗學院的 Khanmigo 為例,並指出這場改變的全球意義——世上三分之二的青年缺乏基本技能,而弭平這個教育差距「會值今年全球 GDP 的五倍」。過去的 EdTech 都失敗了,但 AI 把曾是百萬預算專屬的教育科技放進了每個教育者手中。

第 8 章〈AI 作為教練〉:被侵蝕的「隱形學徒制」

莫里克認為 AI 對教育「最大的危險,不是它對作業的摧毀,而是它對正式教育之後那套隱形學徒制度的侵蝕」。傳統上人靠「從底層做起」(木匠學徒、第一年律師、住院醫師)成為專家,但現在老闆寧可用 AI 自己把基層工作快快做好,也不願應付新人的情緒與錯誤——這會切斷「造就專家的輸送管」。他舉機器人手術為例:資深醫師獨占控制台,住院醫師淪為旁觀,只能靠看 YouTube 做「影子學習」。

這帶出AI 時代知識習得的悖論:我們以為既然 AI 什麼都會,就不必再費力記憶基本事實了——「恰恰相反才是真的」。因為要批判思考、評估 AI 的輸出、推理新問題,都需要主題專業,而專業需要事實的根基(他用工作記憶與長期記憶的認知科學來論證:解決新問題需要大量相連的事實儲存在長期記憶裡)。建立專業還需要刻意練習(deliberate practice)——不是單純重複(蘇菲彈熟悉的曲子),而是難度持續提升、有教練即時回饋的練習(娜歐蜜在老師指導下進步更快)。而好教練稀有又昂貴,這正是 AI 可能大放異彩之處:他用兩個建築師(艾力克斯靠一週一次的人類回饋 vs. 拉吉靠 AI 每次設計的即時回饋)說明 AI 能當「無所不在的導師」,並描述了華頓用 AI 建的推銷模擬器(教導→練習→評分→導師四個 AI 角色接力)。

他也再次強調 AI 的拉平效應並引用驚人數據:頂尖與後段程式設計師的品質差距可達 27 倍;他自己研究發現中階經理的品質能解釋一款遊戲營收的五分之一以上。AI 把差的表現者拉到好的水準(法學院最差的寫作者用 AI 後追平頂尖學生)。但他不認為這代表「專業之死」——因為鋸齒狀邊界,AI 不會做一個工作的每項任務,人類得聚焦於建立一小片領域的深度專業,當迴圈中的那個人。他也提出一個有趣猜想:「與 AI 共事」本身可能成為一種新專業,有些人(如他與身為教育專家的配偶莉拉赫)就是天生擅長讓 AI 隨自己的曲調起舞,會成為「AI 時代的新明星」。

第 9 章〈AI 作為我們的未來〉:四個情境

莫里克拒絕單一預測,而是攤開四個可能的未來:

這一章的收束是全書的價值主張:「與其擔心一場巨大的 AI 末日,我們需要擔心 AI 可能帶來的許多小型災難」(領導者用 AI 監控裁員、開發中國家受害、教育讓某些學生落後)。他借用托爾金的「善災(eucatastrophe)」概念——童話中那「突如其來、歡欣的轉折」——主張正確使用 AI 能創造「局部的善災」,讓乏味工作變得有生產力、讓落後的學生找到前路。但「我們不能等別人替我們做決定……我們需要瞄準善災,免得我們的不作為使災難成為無可避免」。

結語〈AI 即我們〉:一面鏡子

短短的結語點題:AI 再像外星人,它也「深深地像人」——以人類文化史受訓、承載我們的偏見、由理想主義與剝削的複雜混合所創造。「AI 是一面鏡子,把我們最好與最壞的特質映照回我們身上。我們將會決定它的意涵。」他讓 AI 寫下全書最後一段(一段刻意肉麻的「我不過是一道微光,人類的一聲回響……引領我走向光明,而非陰影」),然後親手收尾:「好吧。那相當肉麻。AI 再強大,那段過火的文字都該提醒我們:AI 是一種共生智慧,而非一個它自己的心智。人類遠未過時,至少目前如此。」

最值得討論的幾個觀點

第一,這本書真正的價值不在預測,而在「心態」與「方法」。 莫里克最有用的貢獻,是把抽象的「AI 會怎樣」轉成具體可操作的四條原則和任務分類法。尤其「鋸齒狀邊界」這個比喻極其精準地捕捉了一般人對 AI 最大的困惑——為什麼它能寫程式卻算錯簡單數學?為什麼它一下天才一下白痴?答案是:能力邊界不規則且看不見,只能靠實驗去摸。

第二,「拉平效應」是全書反覆出現、卻最值得警惕的雙面刃。 AI 把後段班拉到前段班水準,這在道德上很迷人(緩解菁英與非菁英的不平等),但莫里克自己也點出陰影:它可能讓教育與技能「變得較不值錢」,並威脅那套造就專家的學徒制。如果人人都能靠 AI 達到「不錯」,那「卓越」與「專業」的經濟價值會怎麼變?這是書裡留下的、最尖銳的開放問題。

第三,「人在迴圈」與「在方向盤上睡著」的張力是核心矛盾。 莫里克一面要你「永遠請 AI 上桌」、盡量委派,一面又警告 AI 愈好、人愈容易鬆懈、技能愈退化。這兩條建議其實互相拉扯,而他並沒有給出乾淨的解法——這恰恰反映了與 AI 共處的真實難處:依賴與自主之間沒有安全的中間點,只能靠持續的自覺去拿捏。

第四,誠實是這本書的底色,也是它的限制。 莫里克不斷提醒「這是我寫書時的 AI,不是你讀書時的」「沒有人知道答案」「我引用的多是未經同儕審查的工作論文」。這份誠實讓書很可信,但也意味著它注定快速過時——書中的模型版本、具體數據、甚至「提示工程不重要」這類判斷,都該被讀者放在「2023 年底的快照」這個框架裡看待,而非當成永恆真理。

本書關鍵觀念清單