亞洲資本網(wǎng) > 資訊 > 圖片 > 正文
特斯拉 FSD V12 試駕平平無(wú)奇?
2023-09-01 04:02:32來(lái)源: 賽博汽車

作者 | EatElephant

編輯 | 章漣漪

當(dāng)?shù)貢r(shí)間 8 月 26 日,特斯拉 CEO 馬斯克親自上線,開啟了一場(chǎng)路測(cè)特斯拉 FSD V12 的直播。試駕過(guò)程中,馬斯克多次表示現(xiàn)在的系統(tǒng)沒(méi)有一行規(guī)則和條件判斷代碼,不需要高清地圖,甚至不需要聯(lián)網(wǎng)就可以完成一切。


(資料圖)

直播全程 45 分鐘,吸引超 1000 萬(wàn)人在線圍觀。其中,馬斯克只有一次駕駛干預(yù),這發(fā)生在一個(gè)繁忙的十字路口,馬斯克所駕駛的特斯拉試圖闖紅燈,他立即控制了車輛。

從技術(shù)上看,特斯拉 FSD V12 版本采用的是端到端的大模型技術(shù),即:一端輸入環(huán)境圖像,一端輸出控制指令,中間是一個(gè)神經(jīng)網(wǎng)絡(luò)大模型,這幾乎是接近人類真實(shí)駕駛。

針對(duì)這一事件,以及特斯拉 FSD V12 技術(shù)背后的邏輯,AI 算法工程師 EatElephant 進(jìn)行了解讀,賽博汽車授權(quán)進(jìn)行編發(fā)。

以下為《賽博汽車》依照 EatElephant 的文章整理改編而成——

其實(shí)挺驚訝對(duì)這次 demo 的評(píng)價(jià)目前看來(lái)還是比較負(fù)面的,從消費(fèi)者角度其實(shí)這可以理解,畢竟 19min 就接管一次,還是闖紅燈這種極其普遍的駕駛場(chǎng)景中的致命錯(cuò)誤,不過(guò)要知道這并非發(fā)布的用戶版本,而是研發(fā)內(nèi)測(cè)的 Alpha 版本,說(shuō)一個(gè)研發(fā)版本不夠完善穩(wěn)定我個(gè)人感覺(jué)是有點(diǎn)吹毛求疵了。

作為技術(shù)從業(yè)者,我們更應(yīng)該從更加技術(shù)的角度去看待 FSD Version 12 的這次 demo,我個(gè)人認(rèn)為這次 demo 給我?guī)?lái)的沖擊和引起的思考是比較大的,甚至不輸于以往的幾次 AI Day 和 Autonomous Day。

首先要知道為什么大家對(duì) V12 如此感興趣。原 因是老馬在今年 5 月份就爆了一劑猛料,F(xiàn)SD V12 會(huì)徹底轉(zhuǎn)向端到端的自動(dòng)駕駛技術(shù)方案,并且他還說(shuō) V12 會(huì)令 FSD 走出 Beta 階段徹底成為一個(gè)正式版的產(chǎn)品。

老馬 5 月宣布 Version12 將轉(zhuǎn)為端到端系統(tǒng)的 Twitter(X)

這個(gè)消息的噱頭有多大呢,我感覺(jué)吧其實(shí)不輸于 2020 年公布 FSD Beta 將于當(dāng)年 10 月發(fā)布, 畢竟端到端的自動(dòng)駕駛長(zhǎng)期以來(lái)一直局限于學(xué)術(shù)研究中,Tesla 之前唯二的先行者 Comma 僅僅只能進(jìn)行高速方面的簡(jiǎn)單駕駛動(dòng)作,Wayve 則局限于英國(guó)少數(shù)地區(qū)的內(nèi)部測(cè)試,而要知道 FSD 可是在廣大的北美大陸可以任意開啟的,這需要端到端系統(tǒng)體現(xiàn)的泛化性可以說(shuō)和前兩者相比要高出一個(gè)層級(jí) 。

業(yè)內(nèi)普遍共識(shí),端到端的自動(dòng)駕駛系統(tǒng)理論上有比現(xiàn)今模塊化的自動(dòng)駕駛系統(tǒng)更高的能力上限,那么端到端系統(tǒng)為什么并沒(méi)有成為業(yè)界主流呢?

原因是端到端系統(tǒng)在提高模型上限的同時(shí)也無(wú)限放大了神經(jīng)網(wǎng)絡(luò)黑盒的不可解釋的問(wèn)題,而不可解釋性會(huì)給研發(fā)迭代和問(wèn)題解決造成巨大的負(fù)面影響,同時(shí)業(yè)界也沒(méi)有端到端系統(tǒng)的成功先例,對(duì)于這種處于前沿科技無(wú)人區(qū)的技術(shù)方案絕大多數(shù)公司是沒(méi)有勇氣和實(shí)力敢為天下先的。

那作為端到端的 V12 首次公開亮相,我認(rèn)為這次 demo 是毫無(wú)疑問(wèn)的成功的,甚至是驚艷的 。 我的理由主要有以下三點(diǎn):

1. 本次 Demo 展現(xiàn)了 FSD V12 端到端系統(tǒng)的成熟度

很多國(guó)內(nèi)外的網(wǎng)友質(zhì)疑這次 Demo 的路況場(chǎng)景都十分簡(jiǎn)單,Palo Alto 的交通即使在下班高峰看起來(lái)也遠(yuǎn)遠(yuǎn)比不了國(guó)內(nèi)大城市道路的擁擠繁雜,在這種情況下甚至還有一次嚴(yán)重問(wèn)題接管 ,其實(shí)算不上優(yōu)秀,對(duì)于這個(gè)觀點(diǎn)我其實(shí)很認(rèn)同。

然而作為自動(dòng)駕駛的算法從業(yè)者,我對(duì)于這次 demo 的關(guān)注點(diǎn)其實(shí)不在場(chǎng)景的困難程度,因?yàn)槔碚撋隙说蕉说南到y(tǒng)自然比基于規(guī)則和搜索的現(xiàn)今主流自動(dòng)駕駛系統(tǒng)上限高很多,其核心問(wèn)題在于下限可能很低 。

端到端系統(tǒng)起步慢但上限高

今年 CVPR 小鵬的 Patrick 有這樣一個(gè)圖表很好的說(shuō)明了端到端系統(tǒng)的特性,可以看到端到端的系統(tǒng)最大問(wèn)題在于模型能力起步較慢,同時(shí)黑盒不可解釋不可控的性質(zhì)會(huì)導(dǎo)致系統(tǒng)雖然能夠處理復(fù)雜場(chǎng)景,但是簡(jiǎn)單場(chǎng)景很可能相比目前主流系統(tǒng)會(huì)產(chǎn)生退步,甚至是犯很多 " 弱智 " 的錯(cuò)誤,同時(shí)因?yàn)闃I(yè)界缺乏端到端系統(tǒng)的工程實(shí)踐經(jīng)驗(yàn),一些看似簡(jiǎn)單的 fix 無(wú)法通過(guò)增加規(guī)則代碼迅速解決,因此嘗試端端到端的方案大多數(shù)時(shí)候可能會(huì)是死在起跑線。

實(shí)際上我甚至認(rèn)為如果哪家公司能夠利用端到端的新技術(shù)架構(gòu)來(lái)獲得一個(gè)功能穩(wěn)定性匹敵現(xiàn)有技術(shù)架構(gòu)的自動(dòng)駕駛系統(tǒng),那么基本可以證明端到端系統(tǒng)是未來(lái)方向。

因?yàn)?,理論上端到端系統(tǒng)在達(dá)到現(xiàn)有技術(shù)水平的那個(gè)時(shí)間點(diǎn)之后會(huì)很快繼續(xù)提高水平將現(xiàn)有技術(shù)棧甩在身后,所以上圖紅藍(lán)線交叉的點(diǎn)我認(rèn)為可以稱作端到端系統(tǒng)正收益的爆發(fā)點(diǎn),一旦達(dá)到這一點(diǎn)基本上主流的技術(shù)范式就會(huì)被顛覆。

所以,考慮到 Tesla V12 應(yīng)該研發(fā)時(shí)間不長(zhǎng),我對(duì)于 V12 首秀能在隨機(jī)選取的測(cè)試路線上在眾多基礎(chǔ)的轉(zhuǎn)彎,變道,環(huán)島,與行人交互等場(chǎng)景表現(xiàn)十分穩(wěn)定平順其實(shí)是非常驚訝的,而 FSD V12 的這次初次亮相部分說(shuō)明了 Tesla 已經(jīng)比較接近這個(gè)爆發(fā)點(diǎn)了,而這是我認(rèn)為本次 Demo 傳遞的十分重要的信號(hào)。

2. 透露了 Tesla 端到端自動(dòng)駕駛的一些重要的思路,理念和實(shí)踐經(jīng)驗(yàn)

這次 Demo 另一個(gè)關(guān)鍵意義在于,通過(guò) Demo 的一些細(xì)節(jié)以及直播過(guò)程中老馬和 Ashok 的聊天透露了很多 Tesla 對(duì)于端到端系統(tǒng)的實(shí)操經(jīng)驗(yàn)和理解,而在端到端系統(tǒng)嚴(yán)重缺乏行業(yè)最佳實(shí)踐的現(xiàn)在,這毫無(wú)疑問(wèn)是對(duì)技術(shù)從業(yè)者具有啟發(fā)意義的。

比如說(shuō),很多人以為端到端是一個(gè)中間完全不透明的黑盒,但是實(shí)際上目前大多數(shù)比較深入的端到端實(shí)踐都表明保持端到端系統(tǒng)中間結(jié)果的可解釋性是很重要的。

今年 CVPR Best Paper UniAD 就設(shè)計(jì)了一個(gè)端到端可導(dǎo)但是保留了中間子網(wǎng)絡(luò)輸出的端到端系統(tǒng),而從直播中可以發(fā)現(xiàn) V12 幾乎完整的保留了當(dāng)前 FSD 的感知結(jié)果輸出,很顯然至少在目前階段 Tesla 的端到端技術(shù)方案也是保留中間功能子網(wǎng)絡(luò)的路徑。

那這個(gè)方案和普通的模塊化方案有什么區(qū)別呢?

其實(shí)重要區(qū)別在于各模塊都去除了基于規(guī)則的代碼,使得整個(gè)系統(tǒng)端到端可導(dǎo),這使得整個(gè)系統(tǒng)作為一個(gè)整體直接對(duì)于駕駛動(dòng)作進(jìn)行訓(xùn)練優(yōu)化成為可能 。而傳統(tǒng)的自動(dòng)駕駛架構(gòu)由于模塊化以及并非端到端可導(dǎo),使得各個(gè)功能模塊只能通過(guò)各自訓(xùn)練優(yōu)化自己的任務(wù),最終結(jié)果是多個(gè)局部最優(yōu)無(wú)法實(shí)現(xiàn)整個(gè)系統(tǒng)的全局最優(yōu)。

CVPR 2023 Best Paper UniAD 保留了整個(gè)系統(tǒng)中間的各個(gè)功能網(wǎng)絡(luò)

這樣的方案其實(shí)比較好理解,保留中間結(jié)果相當(dāng)于通過(guò)人類先驗(yàn)知識(shí)把人類覺(jué)得有用的駕駛概念提取出來(lái),給到端到端下游網(wǎng)絡(luò),也給到網(wǎng)絡(luò)的還有可能包括更加前端基礎(chǔ)的輸入,由下游決策規(guī)劃網(wǎng)絡(luò)自由選擇使用哪些信息進(jìn)行判斷,這樣的技術(shù)方案通過(guò)人類先驗(yàn)加快了端到端系統(tǒng)訓(xùn)練時(shí)性能起步速度,但是又保留了原始信息直接輸入下游,減少了傳統(tǒng)模塊話系統(tǒng)中間輸輸出導(dǎo)致的信息損失。

同時(shí),對(duì)中間結(jié)果進(jìn)行分析也有助于確定系統(tǒng)犯錯(cuò)時(shí)問(wèn)題的原因,提高解決問(wèn)題的效率。

V12 幾乎保留全部 FSD 感知結(jié)果可視化效果,但似乎沒(méi)有紅綠燈可視化

另外馬斯克和 Ashok 在聊天過(guò)程中反復(fù)強(qiáng)調(diào) V12 沒(méi)有顯式的把車道線,環(huán)島,減速帶等概念的處理辦法灌輸給系統(tǒng),對(duì)于這點(diǎn)我的理解是 V12 并不是沒(méi)有檢測(cè)這些內(nèi)容,而是在規(guī)控網(wǎng)絡(luò)中沒(méi)有顯式的添加如何應(yīng)對(duì)這些概念的規(guī)則,應(yīng)對(duì)方法是由網(wǎng)絡(luò)自己通過(guò)駕駛員視頻學(xué)習(xí)得到的。

例如,軟件沒(méi)有顯示要求自車要在車道線居中,模型自己從人類駕駛視頻中學(xué)習(xí)何時(shí)應(yīng)該居中,何時(shí)可以適當(dāng)偏離中線以達(dá)成更加擬人的駕駛決策。

3. 展現(xiàn)了端到端自動(dòng)駕駛系統(tǒng)相比傳統(tǒng)架構(gòu)優(yōu)勢(shì)的一些閃光點(diǎn)

雖然上面說(shuō)了,我更加關(guān)注的是 V12 相比現(xiàn)有 FSD 是否在基礎(chǔ)功能上存在性能回退,但是在這次 Demo 中我們也看到了很多 V12 的閃光點(diǎn)。

這次的一個(gè)大家容易忽略的亮點(diǎn)其實(shí)就發(fā)生在老馬第 19min 紅綠燈接管之前。

當(dāng)時(shí)的場(chǎng)景是這樣的,直行的綠燈亮起但是前方路口擁堵,這時(shí)比較合理的駕駛決策是不要進(jìn)入路口,等待目標(biāo)路口空間出現(xiàn)再選擇通過(guò)路口,而 FSD V12 也正是這樣做(不要糾結(jié)國(guó)內(nèi)國(guó)情,實(shí)際上我國(guó)的交規(guī)也是這樣建議的,雖然很少有人按照?qǐng)?zhí)行),不過(guò)這也導(dǎo)致了這次綠燈 V12 沒(méi)能通行,一直到綠燈變紅,再下一次左轉(zhuǎn)綠燈亮起的時(shí)候 V12 出現(xiàn)了誤判。

上述情況出行的原因是:V12 目前似乎并不直接檢測(cè)紅綠燈的狀態(tài)(可視化界面中好像不再出現(xiàn)紅綠燈檢測(cè)結(jié)果),而是綜合參考了紅綠燈情況和周圍其他這輛行為來(lái)判斷是否應(yīng)該通行,所以當(dāng)有紅燈變綠,且周圍左轉(zhuǎn)車輛開始移動(dòng)的時(shí)候,V12 產(chǎn)生了錯(cuò)誤判斷,認(rèn)為直行也已經(jīng)可以通行,造成接管。

直行綠燈但路口擁堵,V12 選擇等待,沒(méi)有進(jìn)入路口

第二個(gè)亮點(diǎn)出現(xiàn)在一次途徑點(diǎn)到達(dá)過(guò)程中,V12 可以進(jìn)行靠邊停車的操作,而這也是目前的 FSD 所不具備的功能 。

而且 Ashok 在直播過(guò)程還透露,未來(lái) FSD 甚至可以響應(yīng)用戶語(yǔ)音指令輸入。例如用戶可以告訴 FSD 向左換道,或者告訴 FSD 帶自己到達(dá)前面沃爾瑪,F(xiàn)SD 就會(huì)根據(jù)語(yǔ)音指令分析其中語(yǔ)義信息并執(zhí)行相應(yīng)動(dòng)作。這里我的猜測(cè)是有可能在 V12 的模型中也有文字模態(tài)的加入,這也是目前自動(dòng)駕駛系統(tǒng)中很少使用的新技術(shù),隨著大語(yǔ)言模型的爆炸式發(fā)展,在自動(dòng)駕駛中融入語(yǔ)言模型這一方向也給人很大的遐想空間。

總之這次 FSD V12 的 Demo 可以說(shuō)是自動(dòng)駕駛行業(yè)內(nèi)一次具有顛覆性的事件,雖然本次 demo 依然存在問(wèn)題,也還無(wú)法完全證明端到端系統(tǒng)就是自動(dòng)駕駛未來(lái)的前進(jìn)方向,但是隨著本次 demo 的展示,我相信端到端的自動(dòng)駕駛很可能將擺脫空中樓閣的尷尬境地,有潛力成為未來(lái)幾年內(nèi)行業(yè)爭(zhēng)先投入的重點(diǎn)。

作為行業(yè)領(lǐng)軍的 Tesla(也許有人不認(rèn)同,但是我身邊的從業(yè)者絕大多數(shù)對(duì)此是承認(rèn)或者默認(rèn)的)再次扮演了敢為天下先的角色,后續(xù)自動(dòng)駕駛技術(shù)范式到底如何迭代,這次 demo 的意義可能比很多人想象的更加深遠(yuǎn)。

關(guān)鍵詞:

專題新聞
  • 首屆“蒙陜甘寧晉”五省區(qū)農(nóng)牧民排球邀請(qǐng)賽開幕
  • 民生證券給予立高食品推薦評(píng)級(jí)
  • 庚星股份:主營(yíng)業(yè)務(wù)未發(fā)生重大變化,新能源充電業(yè)務(wù)尚未產(chǎn)生收入
  • 兒童重疾險(xiǎn)哪個(gè)好?
  • 安陽(yáng)曙光小區(qū)屬于哪個(gè)區(qū)?
  • 鎖龍消防2023年上半年凈利578.5萬(wàn) 同比增加75.09%
最近更新

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com