← 報告總覽 相關 wiki →

黃仁勳傳:輝達創辦人如何打造全球最搶手的晶片

作者:史帝芬.維特(Stephen Witt) 原書名:The Thinking Machine(會思考的機器)


一本傳記,三條故事線

維特在前言裡把這本書的野心講得很清楚:這同時是三個故事。第一,一個小眾電玩硬體廠商如何登上全球市值王者寶座;第二,一個固執己見的工程師如何花三十多年鍥而不捨推動運算技術,最後躋身全球富豪榜;第三,一種「令人又愛又懼」的新型人工智慧如何誕生。三條線最後在同一個人身上交會——黃仁勳,截至本書寫作時已經當了三十二年輝達執行長,是標普500指數所有科技公司裡任期最長的執行長,「沒有人任期比他長」。

值得先說明的是作者的立場與寫法。維特為這本書「採訪了將近兩百人」——員工、共同創辦人、競爭對手、老友——卻發現黃仁勳本人是「最難採訪的人」之一:他不喜歡談自己,「有一次甚至用逃跑的方式來回應」。維特曾在《紐約客》寫過他的人物特寫,黃仁勳說「他沒讀過,也不想讀」;得知要被寫傳記的反應更是直白:「希望這本書出版前我已經死了。」也因此這不是一本歌功頌德的官方傳記。維特誠實記錄了黃仁勳的暴怒、矛盾、不一致,甚至把全書收在一場黃仁勳對他本人爆發的、長達二十分鐘的雷霆之怒上。這種「帶刺的親近」,反而讓人物立體可信。

更重要的是,維特自己抱著一種「AI恐懼」在寫作。他坦言從 ChatGPT 上線那刻起就覺得自己的職涯將盡,寫這本書部分動機就是要搞清楚「黃仁勳是不是在拿全人類的未來下注」。全書因此有一條貫穿的張力:作者的憂懼 vs. 黃仁勳對 AI 風險近乎倔強的「零」評估。維特把這種張力寫成一個又一個生活化的場景——例如在丹尼餐廳,他看了一段機器人分類積木的影片「不寒而慄」,黃仁勳卻一邊「用手抓著鬆餅把香腸捲起來」,一邊回答:「我知道那個機器人運作的方式,沒什麼好擔心的……這跟微波爐的原理沒什麼兩樣。」再追問,他說:「這不過是數據處理……其他要擔心的事多著呢。」吃完飯黃仁勳預言「第一個有危險的是小說家」,然後留下一堆只吃了一半的餐點,給女服務生「1,000美元的小費」便揚長而去。

維特也藉前言交代了黃仁勳獨特的商業定位。他把黃比作加州第一位百萬富翁山繆爾.布雷能——1849年靠賣淘金工具發財的人;只不過黃賣的不是鏟子,而是「價值高達3萬美元、內建千億顆電晶體的AI訓練晶片」。當時要買最新晶片「起碼得等上一年」,中國黑市售價「甚至高達原價的兩倍」。而 Midjourney、ChatGPT、Copilot「都是在輝達的機器上開發出來的」。一位高階主管形容跟黃仁勳互動的感受:「就像是把手指插進電源插座。」維特甚至說,若黃仁勳從摩天大樓一躍而下去找商機,「我相信他們也會跟著跳下去」。


從肯塔基的吊橋開始

要懂黃仁勳,維特說,得從肯塔基州一所偏鄉學校、而非後來那些「科技大教堂」開始。「今天黃仁勳身上有許多特質早在1973年已經存在」,那一年,「少年的他在沒有父母陪伴下移民美國」。

黃仁勳1963年2月生於台北,父親是化學工程師、母親曾在小學任教,父母都是台南人、母語是台語、成長於日據時代。五歲時父親在泰國煉油廠找到工作,舉家遷曼谷。1960年代末父親到開利公司(Carrier)受訓,順道遊覽曼哈頓,「這趟紐約之旅讓他眼界大開……下定決心日後要在美國安家立業」。母親則用最土法煉鋼的方式替孩子鋪路:她自己「不會說英文」,卻「每晚要兒子從字典中隨機挑選十個新的單字背起來,第二天考他們」。

1973年泰國政局動盪——「那年十月,五十萬名示威者湧入曼谷街頭」,黃仁勳「記得看到坦克在街上行駛」——父母把當時十歲與十二歲的兩兄弟送到美國親戚家。一個誤會把兄弟倆送進肯塔基州歐奈達(Oneida)的浸信會中學(Oneida Baptist Institute),名為中學,實則是收容不良少年的偏鄉感化學校,位於阿帕拉契山區克雷郡,是「全美國數一數二鳥不生蛋的窮鄉僻壤」,當地居民僅三百人。黃仁勳年紀太小,只能讀附設的小學,跳級念六年級。

十歲的黃仁勳是全校唯一的亞裔,英語也不夠流利。校方安排他和一個十七歲、身上有刀疤的文盲室友同住,第一晚室友就「掀起衣服,露出最近打架時被刺傷的多處疤痕」。黃仁勳留下一句後來常被引用的話:「我教他識字,他教我臥推。我也因此養成每晚睡前做一百個伏地挺身的習慣」——這個習慣他至今不輟。校園裡幾乎人人帶刀抽菸,他回憶「我想,我是唯一沒有隨身攜帶摺疊小刀的男生」。針對他的霸凌「參雜種族歧視」,因許多同學家人打過越戰:「那時,人們用『中國佬』這種字眼來稱呼華人……我們每天都被這樣罵。」最驚悚的場景是上學必經的那座「搖搖欲墜的人行吊橋」——老舊腐朽、木板脫落、下方是湍急冰冷的河水,霸凌者站在橋兩端「抓著繩索,用力搖晃,要讓他摔到河裡」。童年好友班恩.貝斯(Ben Bays)卻說:「不知道怎麼回事,他好像沒有受到影響……其實,他看起來似乎樂在其中。」

暑假時哥哥去菸草農場打工,黃仁勳留在宿舍掃廁所、用鐮刀清理灌木叢,他輕描淡寫:「這不是懲罰……這只是我的工作。」即便如此,他歐奈達小學畢業時是「班上第一名」,全校集會「獲頒一枚銀幣」。問他怎麼撐過來,他說:「那時沒有輔導人員,沒人會聽你訴苦,你只能堅強起來,繼續前進。」維特反覆指出黃仁勳的一個核心特質——逆境中異常冷靜:「我發現在逆境時我的頭腦最靈光。這個世界崩塌時,我的心跳反而變慢。」他把這歸功於後來在丹尼餐廳當服務生應付尖峰時段的歷練。

後來在奧勒岡,他高中名列前茅、跳級、成了桌球國手。教練盧.波泉斯基投書《運動畫報》,誇他是「西北地區有史以來最具潛力的青少年桌球選手」;他練成必殺的「正手拉弧圈球」,十六歲以下雙打曾「攻入決賽」。他常在球館過夜、擦地板賺參賽費。即便成績近滿分、又是桌球國手、還曾跳級,他卻選擇了離家近、錄取率超過70%的奧勒岡州立大學——理由很黃仁勳:「我想跟最要好的朋友一起上大學。」在那裡他主修電機工程,遇見實驗搭檔、後來的妻子洛麗.米爾斯(Lori Mills)。他追求洛麗的方式很「工程師」:不靠外表,靠「完成作業的高強能力」——他把寫作業稱為自己的「超能力」,「做了六個月的麵包板實驗,黃仁勳才開口正式約她出去」。這份四十年如一日、由洛麗默默支撐的婚姻,是全書一條溫情的暗線。


三十歲、丹尼餐廳、與一張試算表

黃仁勳二十歲就進 AMD,「那時他甚至還沒到合法飲酒的年齡」。他的起薪是28,700美元——「這必然是讓他畢生難忘的數字,以至於四十年後還能不假思索的說出來」。他工作一年就存夠錢買車與訂婚戒指。後來他跳槽到巨積(LSI Logic),開發出「第一個晶片架構軟體設計工具」,磨練成頂尖的電路設計師與產品經理。德國籍同事霍茨曼(Jens Horstmann)回憶兩人的工作節奏:「我們沒有『週末』的概念……早上七點就到公司,一刻不得閒,直到晚上九點女朋友打電話來。」霍茨曼形容黃仁勳「有能力讓1+1=3」——「不只為客戶做出他們想要的東西,還把這些訂單轉化為工具,再把這些工具變成一套標準的操作方法」,而多數工程師「有1.5就可以偷笑了」。他與眾不同之處還在於「會避免陷入死胡同」——多數工程師「會深深鑽進死路。但黃仁勳不會……一旦看出問題複雜到某個程度,無法繼續突破,他就會改變方向」。

1992年,兩位昇陽(Sun)的晶片設計師——技術鬼才柯蒂斯.普里姆(Curtis Priem)與務實的克里斯.馬拉考斯基(Chris Malachowsky)——想做消費級遊戲晶片,卻自認不會管理,於是找上黃仁勳。普里姆是「晶片的建築師」,能在腦中思考整顆電路;馬拉考斯基是「機械師,有一雙巧手」、「會放心讓他放手去做的人」;黃仁勳則是管生產與量產的「後勤」。馬拉考斯基說,當初巨積「翻遍全公司找出思維最開放的技術人員來為我們服務……那個人就是黃仁勳」。當時黃仁勳財務吃緊——1990年兒子勝斌、1991年女兒敏珊相繼出生,洛麗辭去視算科技的工作帶小孩,「銀行帳戶只剩六個月的生活費」。但他像處理工程問題一樣理性地「做功課」:「對黃仁勳來說,決策是一個客觀、理性的過程,沒有空間容納無用的情緒……商業不過是另一個工程問題。」

1993年,三人在聖荷西一間丹尼餐廳敲定計畫。那家店位於高速公路旁,地毯「點綴著粉紫與酒紅色的圖案」,有些桌上「擺著煙灰缸」,二十四小時全年無休——也是黃仁勳少年時當過洗碗工、後來升服務生的那家連鎖店。當時的市場極其擁擠:圖形加速器「至少有三十五間公司都在開發」,黃仁勳「擔心第三十六間公司可能擠不進市場」;繪圖權威喬恩.佩迪甚至勸他懸崖勒馬,「但他就是不聽」。在這張桌子上,黃仁勳的筆電試算表跑出一個關鍵數字——年營收「5,000萬美元」的生死線,「低於這個數字等於是做白工」。律師吉姆.蓋瑟因公司還沒命名,暫時在文件寫上「NV」(new venture,新創企業)。普里姆後來翻遍多種語言辭典,最後選定 Nvidia,「源於拉丁文 invidia,意思是『嫉妒』」——他們開玩笑要讓對手「嫉妒到臉色發青」。登記資本額時,蓋瑟要黃仁勳把皮夾裡的現金都掏出來,「結果只有200美元左右」。一個彩蛋是:黃仁勳1993年2月就滿三十歲,公司註冊證書卻到四月才核發,「他剛好錯過自己訂下的期限」。

這一段奠定了輝達的兩個文化基因。其一,克里斯汀生的《創新的兩難》幾乎是黃仁勳的聖經(他要求管理團隊都讀、甚至聘作者當顧問)。他學到的不是「破壞性創新」這個流行詞,而是更深的一層——克里斯汀生本人說,「這不是一本教你如何成功的書;而是教你如何避免失敗的書」。大企業(昇陽、視算)瞧不起低利潤的遊戲玩家市場,正是它們的致命錯誤;昇陽傲慢的主管甚至說公司「服務的對象是科學家,不是遊戲玩家」。輝達就要當那個「賣低利潤產品給青少年的本田」。但黃仁勳又有他典型的不馴:當維特把克里斯汀生的影響歸給他,他立刻反駁「克里斯汀生說錯的地方和他說對的一樣多」。

其二,「我們公司再三十天就要倒閉了」。輝達第一款產品 NV1 採用普里姆堅持的非主流「四邊形紋理貼圖」,搭載它的 Diamond Edge 顯卡售價「249美元,比超級任天堂遊戲機還貴」。它一開始靠綑綁《VR快打》衝出十萬顆銷量,員工一度增至百人以上,「那年的聖誕派對特別盛大」。但1995年微軟推出的 DirectX 標準「只支援三角形紋理,等於斬斷輝達的後路」,加上 NV1 無法做深度緩衝、嚴重「穿模」,顧客大量退貨。三位創辦人對它的定評毫不留情:「黃仁勳稱 NV1 為『災難』,馬拉考斯基則說那是『垃圾』。」黃仁勳總結:「我們錯過了一切……我們做的每一個決定都是錯的。」公司從一百多人裁到三十五人,瀕臨破產。

救命的賭注,是用一臺笨重的「硬體模擬器」跳過昂貴的實體晶片原型——「在半導體產業的歷史上,從來沒有一間公司跳過產品原型製作的步驟」。那臺模擬器是黃仁勳「用公司僅剩的資金買的」,太大塞不進實驗室,員工只好把乒乓球桌搬到一邊安置它,迪爾克斯上白班、柯克上夜班,二十四小時運轉。賭注的致命性在於:新晶片「數百萬個電晶體中有一個出錯,實際生產就會失敗,他的公司就毀了」。賭贏了:1997年8月在百思買上市的 Riva 128 一炮而紅——這顆 NV3 晶片「一次傳送128位元的資料給處理器,是業界標準的兩倍」,「頭四個月就售出一百萬張」。黃仁勳由此「了悟到一點,靈感不是勝利之母,絕境才是」,並把「三十天倒閉」變成此後幾十年每場員工大會的開場白與企業箴言。「現在仍是1993年,」他常說,「對我而言,當下永遠是1993年」——提醒自己輝達「過去多次瀕臨失敗,未來仍可能崩壞塌毀」。維特反思道:NV1「完全遵循業界最佳工作流程……結果一敗塗地」,而 NV3「在狂亂中倉促拼湊而成……卻讓輝達一戰成名。有時,你得冒險一搏」。直到今天,「我們仍是全球最大的模擬器用戶」。

這場危機也定型了「黃仁勳之怒」。霍茨曼觀察,黃仁勳「在巨積工作時,不是脾氣暴躁的人;在擔任執行長之後,他才會常常發火」。他會故意在上百人面前公開訓斥犯錯的員工,因為「失敗的經驗必須分享」,讓旁觀者一起學到教訓。有一次一位前員工搞砸小事,黃仁勳當著三十多位主管的面質問他在公司做了多久、領多少薪水,當場心算出在職收入後「要他把領到的薪水全部吐出來」,那位員工「足足三週睡不好」。同時,技術長普里姆因固執與越界,「三年內被降職兩次」、逐出決策圈——三位創辦人中唯一沒進董事會的人。董事會聘的調解人「處理過約翰.史考利和史帝夫.賈伯斯之間的糾紛」,卻說黃、普二人「情況更糟,完全水火不容」。管理層的對策很直接:「永遠不要讓普里姆跟投資人說話,也別讓他跟客戶說話」,連普里姆自己都承認「這兩點都是對的」。


平行運算:一場長達十幾年的孤獨豪賭

輝達真正的技術轉折,是把為遊戲設計的「平行運算」推向通用運算。

故事的引信藏在 1998 年的 Riva TNT 裡:為了滿足《雷神之鎚》傳奇程式設計師卡麥克對多重「像素著色器」的需求,柯克的團隊不在一張卡上塞兩顆晶片(這是對手 3dfx 的做法),而是把像素著色「分成兩個資料集,然後在同一顆晶片上同時對每條管線運行同樣的指令」——也就是在單一晶片上並行運行兩條管線。卡麥克稱讚 TNT 是「最完美的顯卡」,還為它打造了《雷神之鎚III》;維特形容,為這位傳奇程式設計師打造晶片,「就像是為傳奇吉他手吉米.亨德里克斯特別製作一把 Stratocaster 電吉他」。這就是平行運算的種子。

這條路極其孤獨。黃仁勳反覆強調(雖然他承認自己會誇大):「矽谷遍地是平行運算平臺公司的屍骸……除了我們,沒有一間採用平行運算的公司成功過,一間都沒有,前人的成功率就是零。」歷史確實殘酷:西摩.克雷的平行超級電腦「成本高昂且設計過於複雜」;甲骨文創辦人賴瑞.艾利森在新創 nCube 投資「好幾百萬美元」,最後「打水漂」。平行運算難在程式設計——維特用了幾個絕妙比喻來解釋:英特爾的串行 CPU 像「德國三叉牌不鏽鋼高級廚刀」(一次只處理一樣,精緻俐落);輝達的並行 GPU 則像「美膳雅食物調理機」(很吵、不細緻、耗電,但能快速剁碎一整車蔬菜的神器)。而當「大數據」這一整車蔬菜開始堆滿科學的裝卸區,GPU 的時代就到了。平行運算專家比爾.達利的比喻也很精準:要讓軟體跑更快,「你可以把這套軟體移到採用平行運算的電腦,大費周章修改程式。也可以慢慢等,等 CPU 在兩年後變成兩倍快」——前者麻煩,後者免費,所以多年來沒人想走平行這條路。

為什麼偏偏是 3D 繪圖卡倖存下來,成了平行運算的載體?1993年它只是音效卡、網路卡之一,到1990年代後期英特爾把這些功能都整合進主機板;唯獨 3D 繪圖卡「因為貪婪……會吸收所有可動用的運算能力,還貪得無厭,不斷要求更多」。分析師摩西士曼說:「這就是英特爾疏忽的地方……那個領域對處理能力的需求,基本上毫無止盡。」

平行運算之路上有一系列關鍵人物。伊恩.巴克(Ian Buck)是史丹佛研究生,別人想盡辦法降解析度求影格數,他偏要把畫面「愈大愈好」——2000年他把三十二張 GeForce 顯卡串連、透過八臺投影機,造出「第一臺8K解析度的遊戲裝備,完全占據一整面牆」,整套只花約2萬美元。他算過,若用紙筆手工算繪同樣的 8K《雷神之鎚III》,即使每天工作24小時也得「花一萬六千年左右」。2003年他發布開源語言 Brook,2004年左右被黃仁勳延攬:「黃仁勳請我加入輝達,在產業界好好實現我的構想。」比爾.達利是史丹佛電腦科學系主任,2003年黃仁勳親自到他辦公室、初次見面就拿出一張已簽好、抬頭寫上達利姓名的支票;達利說:「即便是你自認為專精的領域,有時他的想法甚至比你更超前。」

但這套構想真正的理論基礎,來自約翰.尼科斯(John Nickolls)——一個滑雪好手、模型火車狂熱收藏家。他用電學原理論證摩爾定律與丹納德縮放(Dennard scaling)即將失效:丹納德縮放是1974年 IBM 的羅伯特.丹納德提出的,尼科斯算出約2005年它將崩潰,因為下一代電晶體將小到僅「一百個原子寬」——那是「人類頭髮直徑的六千分之一,紅血球大小的七百分之一」,小到會漏電,而英特爾對此視而不見。2003年初尼科斯主動寫信給黃仁勳,黃仁勳說:「我們都料到這一天必將到來,但尼科斯讓我確信,摩爾定律確實已死……輝達能有今天,尼科斯厥功甚偉。」更令人動容的是,尼科斯入職才半個月就確診惡性黑色素瘤,一邊化療一邊「每週工作七十二個小時」,還對家人同事隱瞞病情,2011年離世。他主持開發的 CUDA(全名 Compute Unified Domain Architecture,2006年底公開、免費但只跑在輝達硬體上),把遊戲顯卡變成迪爾克斯口中「撥動開關、翻轉顯卡,顯卡就成為一臺超級電腦」的科學工具。

但市場完全不買單。CUDA 在2007年下載量只有一萬三千次——在數以億計的 GeForce 用戶中「甚至不到萬分之一」。最初的客戶是麻省總醫院的「兩位乳癌研究員」,輝達「在先導計畫投資數百萬美元,最後只賣出兩張顯卡」。迪爾克斯說:「但黃仁勳就是喜歡這樣,不是嗎?」這就是黃仁勳鍾愛的「零億美元市場」:就定義而言只有他一個人參與、只有他看到的市場——「黃仁勳打算在玉米田裡蓋一座棒球場,等球員到來」。內部成本叫「CUDA稅」,因為雙用途晶片讓 GeForce 生產成本高過對手——工程師庫恩說:「CUDA 最厲害的地方,是讓遊戲玩家為龐大的晶片開發成本買單。」華爾街則認為 CUDA「不僅毫無價值可言,甚至還覺得是負值」。

財務壓力在 2008 年的「焊點門」(筆電 GPU 焊點瑕疵,幾週就停止運作)達到頂點:黃仁勳「拿出2億美元讓客戶退款」,造成上市以來首次虧損。記者會上他穿著黑牛仔褲與灰運動 T 恤、顯露出做了數十年伏地挺身的結實肌肉,只說:「我只是不想讓消費者感到困擾……其實事情沒那麼複雜。」也是在這段最艱困的時期,他逼出兩個影響深遠的管理法寶:

2013年初,激進投資人星盤價值公司(Starboard Value)來信。投資長傑夫.史密斯(Jeff Smith)是著名的「企業狙擊手」——他曾僅憑不到6%的達登餐飲集團股份、靠一份「兩百九十四頁的投影片報告」換掉全部12名董事,救活了橄欖園(那份傳奇簡報甚至細到批評「煮義大利麵不再加鹽以延長鍋具壽命」)。星盤質疑 CUDA 是錢坑、暗示該換掉黃仁勳。黃仁勳的反應是——加倍投資 CUDA。維特直言:「在黃仁勳職業生涯中做的諸多決定當中,最冒險的就是跟傑夫.史密斯唱反調,加倍投資 CUDA。」他接受史密斯的部分意見,砍掉用3.67億美元買來、卻打不過高通的數據機業務(艾塞拉/Icera),承認「如果我們要在行動裝置市場拼個你死我活,就沒辦法做其他事情了」;但他「壓根沒想過要放棄 CUDA」,因為在這個冷門市場,輝達是唯一的供應商。維特點出這正是克里斯汀生真正的、讀者常錯過的教訓:追求小眾會犧牲獲利、招來質疑,但不做的風險是「別人可能會這麼做」——某個飢渴的小公司,「昏暗的辦公室緊鄰中餐館和一間經常遭到行搶的銀行」,會經年累月服務邊緣的學術客戶,最後顛覆你,「就像輝達扳倒視算科技那樣」。

這條路上最讓人鼻酸的對照,是共同創辦人普里姆的退場。他多年工作受限後不再進辦公室,賣掉輝達股票歸隱,在加州迪亞布羅山區花「600萬美元」買牧場,買了灣流噴射機,人生目標是「修復地球」。但他在2004到2006年間出清持股——「只要價格開始上漲,我就會賣出」。若一直持有,「今天的身價將超過1,000億美元」。他卻不後悔,化身《風雲人物》裡的喬治.貝利自我安慰:「那些股份並未消失,而是流向市場……我為市場經濟貢獻了1,000億美元」「我打算在一生當中捐出5億美元……我甚至不知道如何把那筆錢捐出去」。


共振:在玉米田裡蓋棒球場

把這場孤獨豪賭撐下去的,是黃仁勳一套很難複製的領導哲學,霍茨曼稱之為「共振」:「黃仁勳做的不僅僅是專注……我會稱之為共振。」他透過與客戶、員工高密度互動,「感受到」時機已到。他刻意把自己安排在公司人來人往的中心位置——創業時 CEO 辦公室就設在一樓「廚房旁邊的一張小圓桌」,員工拿飲料零食都得從他身邊經過;開會時讓「科學家坐在前面,記者坐在後面」以調整注意力;常見他在基層員工身旁「用自己的指尖感受公司的脈動」。霍茨曼說:「他能感受到那種共振,看出時機已到。」

維特把黃仁勳和馬斯克做了精彩對比(兩人在2015年 GTC 同臺、私下用「更像是高速資料鏈結,而不是人類之間的對話」交流,旁人完全聽不懂)。馬斯克「想從幻想中退後一步」——先想像自己站在火星地表,再反推所需科技;黃仁勳則「想從現實中前進一步」——「從眼前電路的效能著手,依循邏輯推演到極限」。對極限之外(如人類滅絕),他乾脆「不去看、也不去想像」。

為了把平行運算推向世界,黃仁勳2009年在聖荷西費爾蒙飯店辦了第一屆 GTC 大會(GPU Technology Conference),開場白是:「歡迎來到高效能運算的胡士托音樂節。」他甚至請《流言終結者》主持人現場示範串行 vs 平行:遙控機器人一次射一發漆彈、約一分鐘才畫出粗糙笑臉;固定砲陣「一次可以發射1,100發漆彈」,一瞬間就畫出像素版蒙娜麗莎。但市場依舊冷淡——MIT 教授平托用 CUDA 改良神經網路的論文「在2009年發表後,頭兩年只被引用十五次」。CUDA 下載量更是一路探底:2009年超過三十萬次,2012年跌到谷底、新增安裝「僅略高於十萬次」。 Podcast《Acquired》的主持人後來總結這段歲月:「他們投入數十億美元資金在學術與科學運算,當時這並不是一個龐大的市場,規模甚至不及他們投入的數十億資金。」

招來達利接掌首席科學家本身就是一場逆勢押注:當時(2009年)輝達股價已跌至個位數,史丹佛工程學院院長、同時是英特爾董事的普拉默勸阻達利:「比爾,你瘋了嗎……英特爾會摧毀輝達的。」達利卻說:「黃仁勳是那種天生的領導人……無論他去哪裡,你都願意跟隨他。」這位「文藝復興人」發表過250篇技術論文、出版4本教科書、有120項專利,還會開飛機——1992年他駕單引擎賽斯納在長島灣上空引擎熄火,迫降撞斷鼻子、打破機艙窗跳海逃生被帆船救起,「撿回一條命的兩天後,他就回到工作崗位」。他把輝達研究團隊擴張到「超過三百人」,研究範圍橫跨機器人、汽車、氣候模型與生物化學。

維特在這一章還埋了一個動人的小故事,說明黃仁勳為什麼不放棄:台灣大學物理系趙挺偉教授為了模擬宇宙大爆炸,「在辦公室旁的實驗室裡自己組裝了一臺超級電腦」,用 GeForce 包裝盒和桌上型電風扇散熱。趙挺偉說:「因為他,我這一生的研究才得以從理論變成現實。」這句話後來縈繞在黃仁勳心頭,多年後寫進輝達年報:「我們希望員工在輝達建立一生的職涯。我們的員工經常是來了就不會離開。」


AlexNet:兩個棄兒技術的 DNA 交纏

2012年,兩股「爹不疼娘不愛、沒名聲又沒經費」的技術意外結合,引爆一切。

一邊是神經網路。傑佛瑞.辛頓在「論科技重鎮可能連前十名都排不進去」的多倫多大學,苦守這條被視為「異端」「無稽之談」的路線。當時的 AI 教科書約1,100頁,神經網路「只占十頁」;為了申請經費與掩飾,研究者乾脆把工作改稱「機器學習」或「深度學習」,「反正不要說是『人工智慧』就行了」。辛頓的學生亞歷克斯.克里澤夫斯基(Alex Krizhevsky)——一個前蘇聯猶太家庭出身、厭惡曝光「幾乎到病態的程度」、過著修士般生活的人——被辛頓評為「或許是我見過最傑出的程式設計師」。他和搭檔伊利亞.蘇茨克維(Ilya Sutskever)一起,用兩張零售的 GeForce GTX 580(網路上約「500美元一個」、各內含三十億個電晶體、三十二核心平行架構)插進「臥室裡的桌上型電腦」,全力跑了一整週,訓練出名為 SuperVision(後改名 AlexNet)的卷積神經網路。辛頓打趣:「說來,得感謝他父母幫忙付清可觀的電費。」維特寫道:「黃仁勳夢寐以求的客戶終於出現:一個窮到只能用遊戲顯卡做實驗的程式設計師。」

這個網路「大約有六十五萬個獨立的神經元,相當於一隻蜜蜂的神經元數目」,靠的是不斷重複的「矩陣乘法」(科學家形容像「在轉動一個大到難以想像的魔術方塊」)。它的辨識成功率一路爬升——從0%、1%、10%、40%、60%,「最後在80%趨於穩定」,比當時最先進技術「多出十個百分點」。ImageNet 競賽的參賽隊數正逐年萎縮(2010年35隊、2011年15隊、2012年僅剩7隊),而 AlexNet 一舉輾壓全場。ImageNet 創建者李飛飛剛看到結果時懷疑「是不是數字出錯了」,要求工作人員重算好幾次,還請指導教授寫信問辛頓是否「百分之百確定」;她在自傳裡寫:「這就像是有人告訴你,最快的陸地行車紀錄居然被一輛本田喜美打破,而且一下還把最高時速往上拉了100公里。」這篇由克里澤夫斯基、蘇茨克維、辛頓共同署名的論文「迄今已經被引用超過十五萬次」,被視為「電腦科學史上最重要的發現」,其最關鍵的一句結論是:「用 GPU 來訓練神經網路比用 CPU 快幾百倍。」

值得一提的是,這項突破差點與輝達擦身而過。辛頓曾在 NIPS 大會告訴上千名專家「應該放下手中的工作,趕快去買輝達顯卡」,還寫信向輝達索取一張免費顯卡,結果輝達拒絕了——當時公司「連一名 AI 研究人員都沒有」,連回信都沒有。技術成熟後,三人成立的公司 DNNResearch「沒有客戶、沒有董事會、沒有營收,也沒有網站」,卻在2012年12月於太浩湖一間飯店七樓客房被祕密拍賣,Google 與百度激烈拉鋸,最後 Google 以「4,400萬美元」成交。辛頓說:「那像是一個大爆發的時刻……那就是典範轉移。」

另一邊就是 CUDA/平行運算。維特反覆強調的核心洞見來自蘇茨克維:克里澤夫斯基把經典圖像辨識網路改到 CUDA 上後,「GPU 只花三十秒就完成訓練」,比以前見過的快「數百倍」;而同樣的運算,英特爾的 CPU 要花一小時,生物神經系統(人腦)「恐怕需要十萬年」。蘇茨克維由此推斷:「如果你願意相信人工神經元有點像生物神經元,那麼人工神經元應該能做到我們能做的一切……這就等於是在訓練大腦。」既然如此,就必須把運算能力擴展到極限——這就是 AI 的方向。

黃仁勳的反應堪稱本書最戲劇性的「轉身」,而它的觸發者是布萊恩.卡坦察羅(Bryan Catanzaro)——輝達首位專門研究 AI 的研究員,「我在輝達遇到唯一有人文學位的工程師」。他是摩門教徒,高中後曾去西伯利亞傳教兩年「只講俄語」、讀俄文原版《罪與罰》,在楊百翰大學拿了俄羅斯文學學位,名言是「杜斯妥也夫斯基、托爾斯泰、普希金,這就是我心目中的前三名」。早在2001年於英特爾實習時,他就算出英特爾「每秒能產生一百億次脈衝的晶片」根本不可能,主管卻說「你肯定研究得還不夠」——「但連我都看得出來,傳統的電腦架構要走進死路了。」他後來在柏克萊苦思「既渴求運算力、卻又永遠無法得到滿足」的應用,由下而上、從電路角度推論出:「答案就是 AI。」

2013年3月 GTC 上,黃仁勳只談天氣模型與行動繪圖,「壓根沒提到神經網路」;但卡坦察羅一說起神經網路,「黃仁勳一聽,眼睛就亮了起來」。原本對 AI 所知甚少的他,會後「清空行事曆,花上一整個週末閱讀相關書籍」,下次開會時的理解已「和他不相上下,甚至還有過之而無不及」。同年中,他把卡坦察羅叫到當辦公室用的會議室,抹去白板上所有圖表,用「完美字體」寫下神祕縮寫 O.I.A.L.O.(Once in a Lifetime Opportunity,一生一次的機會),宣布卡坦察羅獨力打造的 cuDNN 是「輝達這二十年來最重要的計畫」,並要他想像「把輝達八千名員工全部請到停車場……再讓我從停車場裡自由挑選任何人,加入我的團隊」。副總裁艾斯特斯描述那場轉向:「他在週五晚上發了一封電子郵件,說要把全部資源投入深度學習領域,輝達不再是一間圖形處理公司……到了週一早上,我們就成為一間 AI 公司。真的,就是這麼快。」柯克則說,當年要說服黃仁勳買單平行運算、CUDA 都「花了不少心力」,但這次黃仁勳「像是得到神啟」——「他立即看出潛力,比所有人都早一步……他真的就是第一人。」黃仁勳自己的解釋仍是工程師式的第一原理:「能夠解決完全非結構性的電腦視覺問題之後,自然就要問:『我們還能教電腦什麼?』」答案是:「一切,萬事萬物。」

維特對這場「幸運」有番冷靜的拆解。連深諳兩種技術的工程師都不敢相信兩者如此水乳交融——輝達「根本沒有在這方面下過半點心力,怎麼可能就和深度學習如此合拍!」黃仁勳的版本是:「運氣,但有遠見作為基礎。」而九十二歲、穿紫色針織毛衣的張忠謀,給的答案最簡單:「他就是比較聰明。」維特最後把深度學習革命比作「一種全新強大生物的兩股 DNA 交纏在一起」——神經網路與平行電腦,這兩個被學界與業界各自冷落多年的棄兒,「即將吞下全世界所有的資料數據」。


Transformer 與大型語言模型:從會射怪物的晶片到會思考的大腦

如果說 AlexNet 是「史上第一架飛機」,那麼2017年 Google 一群研究員做出的 transformer 架構,就像「噴射引擎」。它的源頭是研究員雅寇布.烏斯克瑞特對語言的洞察:人腦約「上千億個神經元,但專門用來處理語言的還不到1%」,意義不來自單字本身(孤立時「只是隨機幾個聲音湊在一起」),而來自字詞之間的連結。他主張把字詞拆成「符元」(token)、用「自注意力機制」(self-attention)建模——這套構想偏偏「專為 GPU 設計」,因為它能「平行執行大量簡單的運算」。

Google 內部一開始反應冷淡,連烏斯克瑞特的父親都懷疑。但團隊愈做愈驚奇:資深員工薩澤爾說「我們看到的是,隨著它的規模愈來愈大,它顯然也好像愈來愈聰明!我們以前寫出的程式可不是這樣」;他更興奮地說:「他們本來做這些晶片是要射擊怪物,但我們現在要用這些晶片來製作大腦!」這套架構的核心不過是「根據機率關係,不斷準確的預測下一個字詞」。團隊用披頭四歌曲得來靈感,把2017年那篇影響深遠的論文命名為「Attention Is All You Need」,後來「甚至有人把這句話變成手臂上的刺青」。最精簡的 transformer「程式碼只有短短二十幾行」。諷刺的是,「到2023年最初的八名研究人員已經全部離開 Google」——管理階層始終看不出它的價值,「他們就像是『嘿,我們可不能推出任何一個不適合放進搜尋框的玩意』」。

接棒的是 OpenAI。蘇茨克維在某研討會看到 transformer 展示,「真的就是隔天」就回 OpenAI 建議全面改用它,結合「生成式預訓練」的目的,就成了 GPT(Generative Pre-trained Transformer)。模型規模一路膨脹,能力也隨之「湧現」:GPT-1(2018)約「一億個參數」、相當於昆蟲大腦;GPT-2(八個月後)「十五億個參數」、相當於小蜥蜴;接著目標衝向「一千億個參數」(囓齒動物等級)——對照人腦突觸約「兩百兆個」。OpenAI 在雲端跑一項訓練可「占用一千個 GPU 長達一個月,費用高達500萬美元」,模型比過去最大的語言模型「大了差不多一百倍」,這正是「大型」語言模型一詞的由來。黃仁勳則不再稱它們為超級電腦或資料中心,而說這是「AI 工廠」。

2022年11月30日,ChatGPT 以「灰階背景的網站」加閃爍游標的樸素模樣低調上線——無行銷、無訂閱。「五天內,註冊試用的人數就超過百萬人」,到2023年1月「每月活躍用戶人數已經來到一億人」。它能寫詩、寫劇本、寫程式碼、給育兒建議。蘇茨克維形容:「第一次用 ChatGPT 的時候,我會說那堪稱是靈性體驗。你會覺得『天哪,這臺電腦好像真的懂耶。』」2023年3月的 GPT-4 更通過律師資格考、多項 AP 考試「得到滿分5分」、GRE 語文「前1%」;OpenAI 訓練 GPT-4 投入「超過1億美元,而大部分的錢都透過微軟流向輝達」。維特坦白:「然而,我並沒有用 ChatGPT 來寫這本書,我實在不敢。」

這場「寒武紀大爆發」也帶來陰影:語音複製、深偽色情、詐騙集團假冒綁架勒贖;香港甚至有公司財務人員應「電話會議上同事」要求轉出「2,500萬美元」,事後才發現整場會議都是深偽。海明威《太陽依舊升起》裡形容破產的那句話,被維特借來形容黃仁勳的致富軌跡:分兩階段,「先是慢慢的,然後是突然的」——「二十年投資的逐漸累積,現在帶來無比豐厚的紅利」。


超大規模:護城河其實是軟體

當需求引爆,輝達的回應是「擴大規模」。它的晶片架構全以科學家命名(居禮、特斯拉、費米、克卜勒、馬克士威、帕斯卡、伏特、安培、勒夫蕾絲、霍普、布萊克威爾),且「每六個月就跑過一次升級循環」,逼得雲端巨頭「恐慌性的購買」。黃仁勳把零售口號搬進財報會:「買愈多,省愈多。」

不過維特反覆點明,輝達真正的護城河並非電路,而是軟體。2012到2022年間,單晶片 AI 推論效能「加速了一千倍」,但「只有兩倍半的加速來自電晶體;剩下的四百倍多半都是出自輝達的數學工具」。硬體工程總監普拉布坦言:「老實說,AMD 能做的晶片並不輸我們,但他們就是沒辦法把運算速度提高到跟我們一樣快。」輝達還針對各領域免費送出「高達近三百款」專門工具組(汽車 Drive、藥物 BioNeMo、醫學影像 Clara、網路安全 Morpheus……),黃仁勳稱之為他的「寶藏」,送起來「簡直像是阿嬤在勸乖孫多吃一點」——目的是「綁住研究者,讓他們跳不出輝達的硬體升級週期」。2024年初加州理工的資料中心管理員說,等一張 H100 要等「將近十八個月」,但教授們「寧可等這些硬體,也不想放棄 CUDA」。軟體工程主管迪爾克斯手下有「高達萬名的程式設計師」,他感嘆:「很多人就是不懂,我們其實是軟體公司。」

為了打通幾千個 GPU 之間的資料傳輸瓶頸,輝達2019年以「70億美元的報價打敗英特爾」,收購以色列的邁倫公司(Mellanox),拿下全世界最快的網路標準 Infiniband——維特說 Infiniband「和 CUDA 一樣,都是功能強大,但當下還沒有客戶懂得欣賞」。曾經狙擊輝達的星盤價值公司這次站在賣方,事後在文件裡寫道:「黃仁勳確實在這個領域具有遠見。」黃仁勳也曾想用「400億美元」收購英國的 ARM(「半導體領域史上規模最大的併購案」),但2021年遭美國當局以不利創新為由阻擋,他很快打消念頭。

這段超大規模擴張期,也是黃仁勳管理風格最極致的時期。約2020年起他要求每位員工每週提交「最重要的五項工作」清單,他每週五會收到「兩萬封電子郵件」,隨機抽看到半夜,每天回「幾百封」像俳句一樣短的訊息。達利形容他的回信速度:「你半夜2:00寫信給他,2:05就會收到回信;早上6:00再寫信給他,6:05他又回了。」2020年7月輝達市值「超車英特爾」,但黃仁勳因為小弟仁哲還在英特爾工作,「在家人前不敢得意,只帶兩隻狗去散步」。


經營與技術洞見:這本書真正的乾貨

撇開故事主線,這本傳記散落著一批值得反覆咀嚼的經營與技術觀點:

1. 從第一原理出發,而非從願景反推。 黃仁勳「從眼前電路的效能著手,依循邏輯推演到極限」,「唯有走到理性的盡頭,才讓自己邁出那一步」。對極限之外(如人類滅絕),他乾脆「不去看、也不去想像」,視為地圖上「畫上惡龍」的未探索區。他自學商業沒有正式商學教育,「有時候連基本的會計概念都搞不清楚」,卻把辦公室當書房、四壁堆滿商業書——曾與一位企管碩士主管吵訂價,他要對方列出三本最愛的訂價書,「那人支支吾吾,一本都說不出來」,而黃仁勳「可能已經讀了十到十五本」。

2. 共振,而非只是專注。 霍茨曼說黃仁勳的本事不只是專注,而是「共振」——透過與客戶、員工高密度互動,他能「感受到」時機已到。他刻意把自己安排在公司人來人往的中心位置;開會時讓科學家坐前、記者坐後以調整注意力。

3. 極度扁平、刻意不留接班人的組織。 輝達沒有營運長、科技長、二把手或幕僚長,「長字輩的最高管理階層基本上只有他一人」,黃仁勳一人有多達五十五名直屬部屬(管理學建議只有8–12人)。他要每個人「永遠不知道,什麼時候自己會突然成為這間公司最重要的人」。這帶來敏捷與全員投入,代價是——一旦出錯「沒有人可以作為代罪羔羊」,而且3兆美元市值「等於把一個巨大、簡直是 GDP 規模的賭注,單押在一位六十一歲長者的能力上」。

4. 商用晶片模式 + 台積電的命運共同體。 1990年代末,因 Riva 顯卡供不應求、歐洲供應商產能不足,黃仁勳留語音訊息無回應後,親筆寫信給台積電董事長張忠謀。週五傍晚回電打進辦公室時,他對著正在打電動的員工喊:「他媽的都給我閉嘴,我在跟張忠謀通電話!」這開啟了綿延數十年的合作——維特形容這像「美國浪子如何高攀台灣的名門淑女台積電」。兩人都是在白人主導的美國科技業打拼的華裔移民(玄珍所謂「竹子天花板」:2010年亞裔僅占美國管理職位的0.3%、卻占技術勞動力5%以上,但兩人都拒絕談這話題;黃仁勳說「以前我沒想過這樣的問題,現在也不會去想」)。輝達只做晶片設計與品管、把製造交給台積電,因此能輕裝快跑(六個月一個 GPU 升級循環),這也讓它免於「亞洲的製造商開始仿製他們的晶片」。張忠謀對黃仁勳印象極佳:「我發現這個年輕人真誠、坦率、有話直說。」他甚至在2013年問黃仁勳要不要接掌台積電,黃以「我已有工作」婉拒。兩人交情深到「黃仁勳常在家訂披薩,和張忠謀一起享用」。

5. 「買愈多,省愈多」與兆級基礎建設。 黃仁勳把 AI 框定為「新工業革命」,輝達的 AI 超級電腦是「這次工業革命中的 AI 生產工廠」,如同上次革命的交流電廠。2024年2月21日那場被高盛稱為「地球上最重要的股票」的財報——年營收破600億美元、所有產品毛利率超70%(蘋果僅46%)、淨利近300億「超過輝達過去三十年的淨利總和」、三萬員工「每人每年足足創造出百萬美元獲利」——隔天「在六個半小時交易內市值增加2,770億美元」(等同可口可樂整間公司的市值),「華爾街史上,從來沒有任何一間公司能夠在單日累積如此巨額的財富」。當日收盤,全球市值前三名是微軟、蘋果、輝達。一位華爾街分析師說:「AI 領域的戰爭開打,而輝達是唯一的軍火商。」黃仁勳賣的不是淘金的鏟子,而是內建千億顆電晶體、要價數萬美元的 AI 訓練晶片。

6. 最大的風險不是競爭,而是「讓人失望」。 維特在「電力」與「AI恐懼」兩章給了難得的逆風視角:輝達3兆市值「大部分基於投資人預期未來可能的表現」而非已實現的事。企業因「害怕錯過」而買卡,再硬要做出產品自證;一旦事與願違、需求走弱,股價可能一瀉千里。全球頂尖避險基金艾略特管理公司2024年夏天直指科技股尤其輝達處於「泡沫之地」(bubble land),許多 AI 應用「過度炒作,許多應用都還不夠可靠成熟」「將會浪費太多能源……將會被證明它們不值得信賴」,並認為輝達「只要有任何一個季度的表現不理想」就會讓整個科技業像「洩氣的輪胎」。但維特也誠實指出:這波投資的主導者「不是漫天叫價的騙子,而是擁有數十年經驗的資深電腦能手」,用的是累積獲利而非冒險發債,與網路泡沫不同;他訪談的學術界電腦科學家「無一例外」都認為神經網路是人類文明的進步。

7. 電力是最後的瓶頸。 GPU 突破了運算速度、Infiniband 突破了資料傳輸,剩下的限制純粹是電——「電力正是最後的限制」。晶片功耗一路狂飆:2020年 A100 的「250瓦」→ 2022年 H100 的「350瓦」→ B100 的「700瓦」→ B200 的「1,000瓦」;DGX 從2016年第一代用電「只等於一臺烘衣機」,到2024年版本用電「等於一整戶住宅」;最大的超大規模資料中心「每年耗電量以十億瓦為單位」,超過單一核電機組發電量,足以供電給整個明尼亞波里斯市。一項分析預測,滿足生成式 AI 的需求,須在「未來十年間讓美國核電發電量翻倍」。諷刺的是,人類對氣候變遷的理解本身就建立在耗電的超級電腦上(真鍋淑郎1960年代末用的 IBM 電腦「重達70噸,耗電量足以供應十個街區」)——而這正是首席科學家達利最憂心的議題:「如果要說有哪個問題,是我認為全世界所有人都應該為此輾轉反側,那就是氣候變遷。整個地球能不能活下去,必須是我們首要關心的問題。」


一個與表外甥女、太空船、自駕車交織的時代

這本書也記下了幾段精彩的產業插曲。輝達唯一真正的對手是 AMD,「GeForce 與 Radeon 就像是 GPU 領域的可口可樂與百事可樂」;而 AMD 的執行長蘇姿丰,竟與黃仁勳有親戚關係——黃仁勳母親有「至少十一位兄姊」,其中一位是蘇姿丰的外公,「黃仁勳其實是蘇姿丰的表舅」。黃仁勳對她滿口讚美(「她太棒了……我們不算太競爭吧」),但分析師摩西士曼看穿:「黃仁勳的確不喜歡輸……而且還特別不想輸給蘇姿丰。」他「歡迎」這位表外甥女的方式,是搶走 AMD 的老客戶任天堂——歷代任天堂主機的圖形硬體都由 ATI/AMD 供應,但 Nintendo Switch 改用了輝達的 Tegra 晶片,「包括蘇姿丰在內,所有人都大吃一驚」。Switch 後來銷量「飆上一億四千萬臺」,成為任天堂至今最賺錢的產品。

黃仁勳與馬斯克的關係,則是另一條若即若離的線。OpenAI 於2015年創立,非營利募款共1.35億美元,馬斯克捐約4,500萬美元是最大單一捐款人。2016年8月,黃仁勳穿著皮衣親自把「全世界第一臺 DGX-1」(重60公斤、售價12萬9,000美元、「耗電量相當於一臺乾衣機」)用手推車送到 OpenAI 舊金山總部交給馬斯克,並用麥克筆落款:「致伊隆與 OpenAI 團隊!為了運算與人類的未來。我為各位帶來全世界第一臺 DGX-1!」下一週又送了一臺到史丹佛李飛飛的實驗室。維特對比兩人:馬斯克某週日下午「突如其來開除整個星鏈工程團隊」,黃仁勳則「幾乎沒開除過任何員工」,要開除也先安排績效輔導;馬斯克「至少和三位不同的女性生下至少十一個孩子」、愛抽大麻、捐款給川普,黃仁勳則愛喝威士忌、不發推文、「有長達四十年從未發表任何政治觀點」、查無政治獻金紀錄。

地緣政治的陰影也籠罩全書。2023年10月哈瑪斯入侵以色列時,輝達約有3,000名以色列員工,「400名以色列員工被徵召」,邁倫創辦人瓦德曼的小女兒在襲擊中喪命。台灣風險方面,後勤主管蕭奎斯特坦言輝達「並沒有應付這種可能性的緊急計畫」,黃仁勳要她別花半個腦細胞去想,「就像是要我回答如果加州掉進海裡要怎麼辦一樣」。張忠謀則直言半導體「全球化已經沒有了……最重要的還是國家安全」,並稱台積電集中台灣是「矽盾」。從1999年1月22日 IPO 到2024年中,輝達股價「上漲超過三十萬倍」——早期員工迪爾克斯在 IPO 時賣股給父親買了一輛凱迪拉克,如今回頭看,「那輛凱迪拉克可說是價值十億美元」;而早早賣光持股的普里姆,則成了「錯失最多財富的人」。


兩個賭注,一份倔強:AI 風險之爭

全書的思想核心,是黃仁勳與幾乎整個 AI 學界泰斗之間的對立。

辛頓、班吉歐、蘇茨克維——「目前仍在世的電腦科學家當中,論文得到引用次數最多的前三名」——都嚴重擔心 AI 可能消滅人類。班吉歐在2023年初一次蒙特婁的清晨散步中經歷「信仰上的轉變」:那天天氣比平常溫暖、街上半融雪水、樹葉落盡,他「突然被一股莫名奇妙、從未感受過的情緒給淹沒」,想到「我的兒輩與孫輩,他們在二十年後要面對怎樣的世界?他們還能有自己的人生嗎?」他認為這是「核戰等級、甚至有過之」的威脅——核戰至少一部分人活得下來,但 AI 若決定消滅人類,「大可設計出致命的病原體,把地球上所有人趕盡殺絕」。散步後他聯絡辛頓,發現辛頓「幾乎是在同一個時刻、以同樣的方式、得到同樣的結論」,不久就辭去 Google 工作專心示警。

維特用「p(末日)」這個框架來呈現這場分歧:它代表評估 AI 某天消滅人類的可能性。圖靈獎第三位共同得主楊立昆(Yann LeCun)說 p(末日)=0,認為「人類在為 AI 設定目標,而我們並不會想要為 AI 設定任何能讓他們支配一切的內在目標」,承認 AI「可能」有支配欲,但「打造這樣的功能實在太蠢了……根本不會有人買啊」。班吉歐則說 p(末日)=50%——「只要大於0,任何數字都值得憂心」。辛頓2023年初也是50%,後來降到10–20%,理由很耐人尋味:「許多我所敬重且才智過人的人竭力反對,當然,最重要的就是黃仁勳。」

黃仁勳給的 p(末日)=0。維特特別點出:「雖然理論上這項預測不可能有負值,但他正是這麼想。」他對這個話題「不怎麼容許不同的意見」,認為這是「假想一些沒有證據的事情」、是在阻礙人類發展。他的論據很硬核:神經網路只模仿神經元,沒有神經膠質細胞、自主神經系統、下視丘、海馬迴、松果體;「神經網路不會受到任何荷爾蒙的影響,沒有性欲、不會睡覺、沒辦法愛它的孩子、也從來不會作夢」;它沒有感覺記憶、情緒、想像力、生殖能力與生存本能,「就連最原始的單細胞生物所具備的自我存續能力,神經網路也付之闕如」——更關鍵的是,AI 沒經歷過生物那種「殺或被殺、吃或被吃」的殘酷演化,「不能說它有生命」。班吉歐的反駁同樣有力:當黃仁勳說「沒有資料佐證」時,他幾乎動怒:「當然不會有資料啊!人類又還沒滅亡!難道要等到一再出現人類喪命的案例,我們才能說,哦,現在有資料了?!」維特補充道:在 AlexNet 與 transformer 突破之前,世界同樣沒有資料能預料到它們——「短短十年間,AI 的能力就出現了兩次人類未曾預見的永久升級」。辛頓的擔憂則更幽微:他警告災難可能在無意間發生,只要 AI 有「最微弱、最不起眼的那一點點」幫助自己的衝動,就會勝出——「最自私的那些 AI,就會得到最傑出的成果……後果將會一發不可收拾。」他留下一句讓人心驚的觀察:「現在就是有九十九個非常聰明的人在努力讓 AI 變得更好,但只有一個非常聰明的人在努力避免讓 AI 主宰一切。」

維特也給了較樂觀的另一面。卡坦察羅相信 AI 不會跟人類玩零和遊戲——「這個宇宙要做的事情還多著呢」,AI 大可去地底或太空建資料中心,「AI 並不會有興趣從人類身上拿走什麼東西,反而還會想要照顧人類」。牛津哲學家伯斯特隆姆(曾提出著名的「迴紋針最大化」思想實驗)2024年的新書《深度烏托邦》,則設想一個 AI 不受限、所有問題都被解決的世界裡,人類該做什麼。李飛飛處理完影像辨識後,正用 Omniverse 訓練機器人去做「大家最不喜歡的工作」——她的 Behavior-1K 計畫調查上千件日常活動,人們最想交給機器人的前幾名是「掃廁所、洗地板、派對後打掃家裡」。維特自嘲:「我想不想要有個掃廁所機器人?不想要才怪。」但他仍誠實承認,一個擁有上百兆突觸的機械大腦,「在歷史、宗教或哲學上都是沒有先例的頭一遭」。


雷霆之怒,與全書最後一句

這場爭論在全書最後一章(與書名同名的〈會思考的機器〉)達到高潮,也是維特寫作上的神來之筆。

2024年 GTC 結束後的最後一次採訪,在輝達總部一間權充辦公室的會議室裡進行,四面是黃仁勳親手寫在牆上的運算堆疊圖表(從 GPU 一路畫到微服務,「文字延伸環繞到牆與磨砂玻璃」)。訪談一開始和樂融融,談台灣生活、家庭與適應名氣。直到維特問了一個看似平常的問題——「AI 可能創造哪些新的就業機會?」黃仁勳反問:「如果做數學的邊際成本為零,你接下來會做些什麼?」維特答不出來,於是決定播放科幻作家亞瑟.克拉克1964年談「機器思考能力終將超越人類」的影片。「我也看著黃仁勳的臉上逐漸失去血色。」

地雷引爆了。黃仁勳冷冷地說:「我覺得你訪錯人了。你似乎是在訪談馬斯克,但我不是他。」接著是長達二十分鐘、「時而指責、時而憤怒、時而輕蔑」的雷霆之怒。他怒吼:「計算機會毀掉數學嗎?這話題搞了這麼久,我真的是受夠了。我再也不想談這個話題!」他用第一原理替自己辯護:「人類發明農業,讓生產糧食的邊際成本降到零……我們也讓計算的邊際成本變成零,現在誰還做什麼長除法!」然後是對科幻小說的徹底鄙夷:「我們都是一群嚴肅的人,在做嚴肅的工作!這才不是什麼玩笑話……我沒讀過他那些該死的書。我才不管那些書!這間公司不是什麼《星艦迷航》!」他甚至指責維特對他做精神分析:「我不喜歡這些挖人隱私的問題。我不喜歡談我自己,好嗎?!」即使證據明擺在眼前,他仍堅稱:「你看,我這個人,我就是個超級普通人啊。」維特回他「我從來沒遇過你這樣的人」,黃仁勳只重複:「我就是超普通。」全程在場的兩位公關代表「沒有任何打算插手的跡象」。

維特事後的解讀很深刻:他回想對話,發現「黃仁勳並不是一下子沒控制住情緒就爆發,而是用了幾分鐘,似乎是有意讓自己的怒火不斷累積」。柯克也說黃仁勳發怒「背後有所盤算」。維特認為,「在表演開始之後,他的怒火確實是出於真心,但一切都只是為了表達他背後一個更大的重點:他非但不讀科幻小說,其實更對科幻小說深惡痛絕」。正因為他不接受對未來的空想,「從第一原理出發,冷靜審視各種技術,不為樂觀或恐懼所動,只談冷酷而有耐心的商業邏輯」,才能在別人鎩羽而歸的領域成功。 在維特看來,輝達高層最大的恐懼也呼應了這一點——「比起可能消滅人類,這些高層更害怕黃仁勳的雷霆之怒。」

訪談後,維特驅車到附近的資料中心,走進那臺名為 Eos、裝載一萬顆晶片的超級電腦內部。工程師告訴他,Eos 正在模仿 GPT-4 訓練輝達內部的語言模型,「運算速度快到離譜;如果用 GPT-3 模型當標準,訓練完成只需要不到四分鐘」。維特站在「身邊的電路每秒運算次數總和高達一千萬兆次」的機器裡,數千風扇發出「沉悶而不斷累積的轟鳴,彷彿遠處傳來掌聲」,意識到自己正被一套「正在追趕著我、應該很快就會取代我」的語言模型包圍。他把黃仁勳稱為「美國的代達羅斯」——那位神話中造迷宮、也造飛行翅膀的工匠,只有他「才真正看清全局」。全書最後一句,令人發涼:「這就是一臺已經擁有思考能力的機器,而且隨著風扇的每次轉動、電路的每次脈衝,它還會持續演進,愈來愈聰明。」


一個「超級普通人」的肖像

維特筆下的黃仁勳充滿矛盾,而他不掩飾這些矛盾。

他身價千億,當被問起打算怎麼用這筆財富時,他只說「我不知道,想都沒想過」;他把金錢視為「暫時的保險,用以防範未來災難」,真正的恐懼是「害怕讓員工失望,害怕敗壞家門聲譽」。他行事低調,回台灣必逛夜市、「一有機會就去逛夜市,在路邊坐下來喝碗湯,跟當地人沒什麼兩樣」,臉頰上還留著四歲逛夜市時靠近攤販、被刀子劃傷的疤痕。他在內心深處始終認同台灣:「在內心深處,你永遠是個移民……我心裡一直覺得自己是台灣人。」他四十年不發政治言論、查無政治獻金,愛威士忌與料理(曾被朋友安排到四季酒店給米其林大廚操練一整天,回家累到在副駕駛座睡著)。他甚至為了把開球這種小事做到完美,請太太洛麗陪他在自家後院練投——2024年初他穿著「93號球衣」(代表輝達創辦的1993年)為味全龍隊開球,第一次球偏了幾英尺、露出靦腆笑容;同年秋天為舊金山巨人隊開球時,「球滑出一個完美弧線,啪的一聲正中捕手的手套」。他對此的註腳是:「只要肯下功夫,成果自然手到擒來。」

他又是那個讓高階主管「像鋼琴琴弦一樣緊繃」、會在一百多人面前罵架構師近兩小時的暴君。他講話前後不一、自相矛盾,「甚至在同一次訪談中就可能講出完全相反的論點」,但霍茨曼解釋這不是政客式的迎合,而是「根據當下輸入的資訊來思索,而且也願意暫時接受想法上的矛盾」——他大聲說出的常只是思考過程。唯有當一個概念開始被他反覆重複(如「零億美元市場」「光速排程法」),才代表它經過數月打磨、成了要灌輸給全員的「教義」。離職多年的員工,到了新公司聽簡報甚至會受不了:「我的天啊,這也太無聊了吧……你們根本不知道自己錯過了什麼好東西。」

2023年起,他正式把英文名字定為單名「Jensen」,讓招牌打扮(黑皮衣、黑襯衫、黑牛仔褲、黑皮鞋、金屬框眼鏡)和這個名字一起成為品牌——那身造型他「在幾年間對各種穿著進行 A/B 測試」,約莫2015年定調,當年一次買了二十四件同款 T 恤、輪穿四年。他凌晨三點半就醒(一隻狗睡在他兩腿之間),四點起床先處理最重要的長期專案,每天自問:「有什麼事會在今天就把我們搞破產嗎?」他堅稱自己「超級普通」,但每一個認識他的人——從童年好友貝斯到張忠謀——都不這麼認為。維特問他為何家中三兄弟唯獨他學業出眾,他聳肩拒答;張忠謀的結論最簡單:「他就是比較聰明。」霍茨曼則說,黃仁勳「成為一位偉大的執行長,既非天生,也非宿命,而是他讓自己走上這樣的轉變」。

這本書最終留給讀者的,不是一個該被崇拜或恐懼的偶像,而是一個把「不斷擴大增強」當成人生主題、用三十年勤奮與勇氣把一連串豪賭一一兌現、卻對自己一手釋放出的力量拒絕多想的人。他的成就「從原子的尺度、一路到機器意識的曙光」——而那道曙光是福是禍,連他自己也選擇不去回答。


本書關鍵觀念清單