第93章 車用人工智慧


第93章 車用人工智慧 2022至2023年,實現新里程碑 讓自動駕駛汽車像人一樣思考 「它就和ChatGPT一樣,只不過是給汽車使用,」自動輔助駕駛團隊成員什羅夫對馬斯克說。他將自己在特斯拉的專案,拿來與OpenAI新推出的人工智慧聊天機器人做比較。OpenAI是馬斯克和奧特曼在2015年共同創立的實驗室。馬斯克花費將近十年的時間,開發各種不同形式的人工智慧,包括自動駕駛車、機器人Optimus、腦機介面Neuralink等。什羅夫的專案主要是開發最先進的機器學習技術,也就是設計能夠學習人類行為的自動駕駛系統,他說:「我們處理了大量資料,都是關於真實人類如何應對複雜的駕駛情境,然後訓練電腦神經網路模仿人類的行為。」 什羅夫偶爾會加入三劍客詹姆斯、安德魯及諾迪恩的行列,組成四劍客。馬斯克要求和什羅夫見面,想說服他離開特斯拉自動輔助駕駛團隊,去推特工作。但什羅夫想留在特斯拉,他希望說服馬斯克相信,自己負責的專案對特斯拉甚至整個世界來說,都非常重要。他將提出的新技術稱為「神經網路路徑規劃器」(neural network path planner),將賦予特斯拉的自動駕駛軟體「向人類學習」的能力。 他們兩人預定在2022年12月2日週五會面,實際上馬斯克當天的行程早已爆滿,只能硬塞進去。那一天,也是獨立記者泰比預計發表第一批推特文件的日子。當天早上,什羅夫依馬斯克的要求抵達推特總部,馬斯克剛參加完電動皮卡Cybertruck發表會,從內華達趕回來。他向什羅夫道歉,表示自己忘記要飛到紐奧良和法國總統馬克宏見面,討論歐洲的內容審核規範。他請什羅夫當天傍晚再回來。當馬斯克等待與馬克宏會面時,傳簡訊給什羅夫,再度要求延後會面時間。他在某個時間點寫道:「我會遲到四個小時,你願意等我嗎?」但就在同一個時間,他又突如其來地傳簡訊給獨立記者維斯夫婦,請他們當晚飛到舊金山與他會面,協助處理推特文件。 當天深夜,馬斯克回到舊金山,終於有機會坐下來與什羅夫談一談。什羅夫解釋,他正在開發的神經網路路徑規劃器專案細節。「我認為,讓我繼續進行目前的工作,真的超重要。」什羅夫說。馬斯克聽了他的說明之後,再度燃起對這個專案的熱情,也認同什羅夫的說法。他明白,未來特斯拉不只是一家汽車公司,也不只是一家乾淨能源公司。如果能整合全自動輔助駕駛、Optimus機器人與Dojo機器學習超級電腦,它將會成為一家人工智慧公司,不僅能透過聊天機器人在虛擬世界運作,也能在實體工廠與道路上運作。他早已在考慮雇用一批人工智慧專家,與OpenAI正面對決,特斯拉的神經網路路徑規劃團隊將能補足他們的工作。 多年來,特斯拉的自動輔助駕駛系統一向採取規則基準法(rule-based approach)。系統由攝影機取得視覺資料,辨識車道標線、行人、車輛、交通號誌等各種標的,以及八台攝影機可拍到的任何物件。接著,軟體會依據一套規則運作,例如:紅燈亮時要停車,綠燈亮時要開車;保持在車道標線中間;不能跨越雙黃線駛進對向車道;只在任何車輛的速度都不足以撞到你時,才通過路口等等。特斯拉工程師手動撰寫和更新數十萬行C++程式碼,將這些規則應用在各種複雜情境中。 什羅夫正在開發的神經網路路徑規劃器專案,可為軟體增加新能力。「汽車不再只是根據規則決定適合的路徑,」什羅夫說,「還會倚賴神經網路,而神經網路是根據數百萬個人類行為的案例進行學習。」換句話說,神經網路會模仿人類。每當面對某個情境,神經網路會依據人類在成千上萬種類似情境中的行為,選擇其中一條路徑。就和人類學習說話、開車、下棋、吃義大利麵和幾乎其他所有事情一樣,我們或許會遵循某套既定規則,但多數時候,我們都是觀察其他人怎麼做才漸漸學會技能。這是電腦科學之父圖靈在1950年發表的〈計算機與智慧〉論文中,設想的機器學習方法。 特斯拉擁有全球名列前茅的強大超級電腦,用來訓練神經網路,裡面採用的是晶片大廠輝達(Nvidia)設計的圖形處理器(GPU)。馬斯克的目標是在2023年改用Dojo,也就是特斯拉從零打造的超級電腦,以視覺資料訓練人工智慧系統。Dojo用的晶片與基礎設備全都是特斯拉人工智慧團隊自行設計,運算效能高達約8 exaflops(一個exaflops為每秒百萬兆次浮點運算),是全球性能最強大的人工智慧超級電腦之一。這台超級電腦將可用來訓練自動駕駛軟體及Optimus機器人。「能夠同時訓練它們真的很有趣,就好像它們正在努力探索世界。」馬斯克說。 到了2023年初,神經網路路徑規劃器專案已經分析了從特斯拉顧客車上取得的1,000萬幅影片畫面。這是不是表示系統的表現只能達到一般人類駕駛的平均水準?「不是,因為我們只用了人類成功應對某個情境的資料。」什羅夫解釋。人類標記員會評估所有影像畫面,然後給予評分;許多標記員的工作地點在紐約水牛城。馬斯克告訴他們,找出「Uber五星駕駛會採取的行動」,然後利用這些影片訓練電腦。 馬斯克會定期巡視特斯拉位在帕羅奧圖的辦公大樓,自動輔助駕駛團隊就在其中一個開放空間工作。他會蹲跪在一旁,即興地討論。有一天,什羅夫向馬斯克展示他們最新的開發進度。馬斯克覺得很不錯,但有個問題:真的需要採用這個新方法嗎?會不會有點過頭?他有個座右銘:絕不用巡弋飛彈宰殺蒼蠅,用蒼蠅拍就夠了。使用神經網路規劃路徑,只為了應付少數不太可能發生的極端情況,是否過度複雜而沒有必要? 什羅夫向馬斯克展示,在哪些情況下,神經網路的表現會優於規則基準法。在一個模擬情境中,道路上散布著垃圾箱、掉落的交通錐,以及任意丟棄的垃圾。由神經網路路徑規劃器引導的汽車,在必要時會打破某些規則,跨越車道線,藉此避開障礙物。「當我們從規則轉為神經網路時,就能做到這一點,」什羅夫對馬斯克說,「如果使用神經網路,汽車永遠不會撞到任何東西,即使是在混亂的情境下。」 每次看到類似的技術大躍進,馬斯克就會變得異常的興奮。「我們應該舉辦一場詹姆斯.龐德風格的展示會。四周炸彈全部爆炸,幽浮從天而降,然後我們的汽車疾駛而過,完全沒撞到任何東西。」他說。 機器學習系統在自行訓練時,通常需要有目標或指標做為引導。馬斯克偏愛的管理方法,正好是直接指定哪些指標最重要。他告訴團隊的指標是:使用特斯拉全自動輔助駕駛的汽車,在沒有人為干預下的行駛里程。「我希望每次開會時,第一張投影片能夠顯示最新的無人為干預里程數,」他下令,「當我們訓練人工智慧時,要優化的目標是什麼?答案是提高兩次人為干預之間的里程數。」他告訴他們,要和電玩遊戲一樣,讓玩家每天都可以看到分數,「看不到分數的電玩遊戲很無聊。如果每天都能看到無人為干預的里程數持續增加,會讓大家更有動力。」 於是團隊成員在工作空間安裝了幾台巨大的85吋電視螢幕,即時顯示全自動輔助駕駛汽車在不受人為干預的情況下,平均可行駛多少里程數。每當他們看到某種類型的干預行為反覆發生,例如駕駛在變換車道、車道合併或轉進複雜路口時,握住了方向盤,他們就會同時啟用規則及神經網路路徑規劃器,試著解決問題。他們在辦公區擺了一面銅鑼,每當成功解決人為干預的問題時,就敲鑼慶祝。 人工智慧的應變反應比真人更好 2023年4月中,馬斯克決定測試新的神經網路路徑規劃器,讓電動車在帕羅奧圖市區繞行。什羅夫和自動輔助駕駛團隊已經裝配好一台車,其中的自動駕駛軟體接受過神經網路訓練,有能力模仿人類駕駛的行為。在這個軟體裡,遵循規則基準法的傳統程式碼占比非常低。 馬斯克坐在駕駛座,旁邊坐著的是自動輔助駕駛軟體總監亞索克.艾魯斯瓦米(Ashok Elluswamy)。什羅夫與其他兩位團隊成員麥特.鮑赫(Matt Bauch)及克里斯.佩恩(Chris Payne)坐在後座,他們三人已在特斯拉工作了八年,辦公桌彼此相鄰,都住在舊金山,住所僅相隔幾個街區。多數人的辦公桌都會放上家人相片,他們三人的辦公桌卻放著同一張照片:三人在萬聖夜派對上的合影。詹姆斯在馬斯克收購推特、徵調他去那裡工作之前,曾是這個團隊的第四名成員,什羅夫一直避免自己落入和詹姆斯相同的命運。 在他們離開特斯拉帕羅奧圖辦公園區的停車場時,馬斯克在地圖上選定了電動車行駛的目的地、點擊全自動輔助駕駛,然後雙手離開方向盤。當電動車駛入主要幹道時,立即面臨第一個可怕的挑戰:一台單車正朝向他們而來。「我們所有人屏住呼吸,因為騎單車的人會怎麼反應很難預料,」什羅夫說。但是馬斯克一點也不在意,也沒有把手放回方向盤。結果這台車自動禮讓單車先行。「完全是真人駕駛會採取的做法,」什羅夫說。 什羅夫和他的兩位團隊成員開始詳細解說,他們如何從顧客車上的攝影機蒐集數百萬支影片片段,才訓練出車上的全自動輔助駕駛軟體。相較於以人工撰寫程式、設定數千條規則的傳統軟體,新軟體的架構簡單許多。「它的運作速度快了10倍,而且最後可刪除30萬行程式碼。」什羅夫說。鮑赫表示,這就好比人工智慧機器人在玩某種極其無聊的電玩遊戲。馬斯克聽了,撲哧笑了出來。電動車繼續在車流中自行向前行駛,馬斯克拿出他的手機,開始發送推文。 電動車行駛了25分鐘,經過大街小巷,完成複雜的轉彎,成功避開單車、行人和寵物。行駛過程中,馬斯克完全沒有碰觸方向盤,只有幾次去踩油門,因為他覺得這台車過度謹慎,例如:在四向停車號誌前過度遵守規則。 電動車一度採取的應變行動,甚至讓馬斯克覺得比自己可能做出的反應更好。他說:「哇,太棒了,即使是我的人類神經網絡,都可能反應不過來,但是這台車做對了。」他實在太開心了,開始用口哨吹著莫札特的G大調〈小夜曲〉。 擁有兩大即時資料庫 馬斯克對在場的所有人說:「各位做得太棒了,真的非常了不起。」接著,所有人一起參加自動輔助駕駛團隊的週會,20名成員幾乎全穿著黑色T恤,圍著會議桌而坐,聆聽最後的裁決。許多人原本不相信神經網路專案能成功。馬斯克宣布,現在他相信了,他們應該投入大量資源,繼續推動這項專案。 討論過程中,馬斯克抓住了團隊發現的一個關鍵要點:神經網路必須接受至少100萬支影片片段的訓練,才能運作順暢,如果超過150萬支,則會表現得非常優異。這意味著相較於其他車廠與人工智慧企業,特斯拉擁有極大的競爭優勢。因為特斯拉每天可從全球將近200萬台的電動車上,蒐集到數十億幅影片畫面。「在這點上,我們占有獨一無二的地位。」自動輔助駕駛軟體總監艾魯斯瓦米在會議上說。 不論是開發哪種形式的人工智慧,從自動駕駛汽車到Optimus機器人,以及類似ChatGPT的機器人程式,都必須具備蒐集與分析大量即時資料的能力。現在,馬斯克已擁有兩個強大的即時資料庫:自動駕駛車的影片,以及推特平台上每週高達數十億則的推文。會中他告訴自動輔助駕駛團隊,剛完成一筆重要採購案,是為推特添購了上萬個GPU晶片。他同時宣布未來將增加開會頻率,討論特斯拉正在設計中的Dojo晶片,Dojo晶片可望展現更強大的效能。他也懊悔地承認,不該在聖誕節期間,衝動地關閉推特位於沙加緬度的資料中心。 當天在會議中參與旁聽的,有位人工智慧領域的超級明星工程師。馬斯克當週才把他挖角過來,參與即將推出的祕密專案。 * * * 1 所有車輛在通過交叉口時,必須先停車,確認安全後再開車。