Momenta CEO 曹旭東:已量產(chǎn)一段式端到端,交付多個客戶
端到端會是自動駕駛的終極解決方案嗎?如何解決端到端方案上限高下限低的問題?
自今年以來,端到端無疑是智能駕駛行業(yè)最熱的詞,也是諸多智駕玩家的兵家必爭之地。9月29日,在全球智能汽車產(chǎn)業(yè)大會(GIV2024)上,Momenta CEO曹旭東發(fā)布了首個量產(chǎn)智駕大模型,將感知與規(guī)劃整合進(jìn)一個大模型中,即一段式端到端。太平洋汽車獲悉,其實(shí)早在今年上半年,Momenta 的一段式端到端方案已經(jīng)量產(chǎn),并交付給了客戶。
那么Momenta的端到端方案究竟有何特點(diǎn)?真的如傳言中超出華為智駕0.5到1個段位嗎?端到端方案為何不是自動駕駛的終極方案……對此,太平洋汽車與曹旭東進(jìn)行了深度對話。
“這個不是出自我們公司的表達(dá)。”
當(dāng)被問及外界傳言Momenta智駕方案領(lǐng)先華為智駕0.5到1個段位是否是真的時,曹旭東連忙笑著說道。一旁的工作人員也對媒體表示,Momenta從未這樣宣傳過。
不過曹旭東在采訪中也透露,主機(jī)廠確實(shí)非常關(guān)注華為和Momenta的智駕方案,基本上都會拿兩者去做對標(biāo)。
“對標(biāo)也非常簡單,時間一般都是一兩周,場景包括鄉(xiāng)村道路、小鎮(zhèn)、小城市、大城市。”曹旭東說,對標(biāo)時,主機(jī)廠會把自動駕駛分成幾十上百個場景,比如路口的話會劃分成左轉(zhuǎn)、直行、右轉(zhuǎn)、占道車的繞行還有鬼探頭。每個場景都會有對應(yīng)的KPI,類似于成功率的概念??蛻魰鶕?jù)最終的成功率來做出選擇。
當(dāng)被追問在對標(biāo)中哪家方案表現(xiàn)更好時,曹旭東沒有直接給出答案。他只是說,主機(jī)廠在上百個場景一一對標(biāo)后,發(fā)現(xiàn)Momenta 在三個大類表現(xiàn)不錯。
第一是絲滑繞行。在城市NOA場景中,占道車輛、逆行的兩輪車非常多,如果車輛不能絲滑繞行,通行效率就非常低。“Momenta的絲滑繞行還有街道繞行能力非常好,甚至超過了人類的很多中等水平司機(jī),達(dá)到了老司機(jī)甚至超過老司機(jī)的水平。”
第二點(diǎn)是路口的靈活交互。在中國,路口車流人流密度特別高,右轉(zhuǎn)時,不論紅燈還是綠燈,可能都有很多人過馬路。如果你100%停下來的話,那你傳遞的信息就是我等著,那這樣會永遠(yuǎn)走不動。Momenta在右轉(zhuǎn)時會以1公里每小時的速度去蠕行,去判斷時機(jī)跟行人博弈。
第三點(diǎn)是預(yù)判。在城市中有很多鬼探頭場景。Momenta的方案有3個優(yōu)勢。第一,它能夠把所有有用的預(yù)判信息都用上。第二,它的整個算法延遲會很短。第三,它會有一些學(xué)習(xí)出來的防御性駕駛的行為。
太平洋汽車獲悉,Momenta的智駕方案確實(shí)得到了諸多主機(jī)廠的親睞。目前國際上奔馳、寶馬、通用,國內(nèi)比亞迪、北汽、吉利、廣汽都是Momenta的客戶。業(yè)內(nèi)數(shù)據(jù)顯示,Momenta已經(jīng)與全球排名前十的汽車集團(tuán)中的一半展開量產(chǎn)合作,成為了交付車型最多的智能駕駛公司。
為何Momenta的智駕方案能達(dá)到這樣的效果?答案還要從大會當(dāng)天曹旭東發(fā)布的首個量產(chǎn)智駕大模型,將感知與規(guī)劃整合進(jìn)一個大模型中,即一段式端到端說起。
盡管端到端今年才被特斯拉帶火,但它并不是一個新東西。早在2016年,自動駕駛剛剛興起時,業(yè)內(nèi)人士想到的也是用端到端方案來做自動駕駛。但受限于當(dāng)時的軟硬件,大家沒法解決該方案上限高但下限低的問題,于是就逐漸變成做分模塊化的方案。
Momenta在端到端架構(gòu)上探索很早,在2020年的時候就已經(jīng)用深度學(xué)習(xí)的方式去做自動駕駛的規(guī)控。到2023年上半年,Momenta已經(jīng)量產(chǎn)了兩段式端到端。一年后,又量產(chǎn)了一段式端到端。
與分模塊化方案相比,一段式端到端的上限更高。因?yàn)樗∠撕芏嗳藶樵O(shè)定的(先驗(yàn)),當(dāng)你數(shù)據(jù)少的時候這些先驗(yàn)會起到一些好的效果,但是一旦你的數(shù)據(jù)量大的時候,先驗(yàn)就會變成一些約束項(xiàng)目,它會約束你整個系統(tǒng)的上限。曹旭東說,用端到端就相當(dāng)于把這些先驗(yàn)給去除掉,這樣會更進(jìn)一步提升系統(tǒng)的上限。這也是為什么Momenta智駕現(xiàn)在的水平已經(jīng)比去年年底超越了幾十倍。
那么該如何解決一段式端到端方案下限低的問題呢?Momenta的的處理方案類似于人類學(xué)習(xí)的邏輯。人類大腦既有短期記憶,又有長期記憶,當(dāng)一個新的數(shù)據(jù)進(jìn)來,它會先進(jìn)入短期記憶,等到數(shù)據(jù)和方法被驗(yàn)證之后才會進(jìn)入長期記憶去學(xué)習(xí)。Momenta的端到端模型也受此啟發(fā),分為短期記憶和長期記憶。短期記憶的訓(xùn)練周期是以天為級別的。好的數(shù)據(jù)和好的方法得到驗(yàn)證之后再進(jìn)入長期記憶的模型學(xué)習(xí)。
根據(jù)官方說法,Momenta智駕大模型(一段式端到端)可支持在各種復(fù)雜道路環(huán)境下,準(zhǔn)確預(yù)判車輛或行人的通行意圖,自動調(diào)整車速、靈活變道、從容避讓障礙物,極大減輕駕駛員的負(fù)擔(dān)。無論是在應(yīng)對復(fù)雜路口還是動態(tài)橫穿場景,都能從容應(yīng)對,顯著提升駕駛安全和通行效率。即使在夜間極窄車位,斷頭路車位等極限場景,也可實(shí)現(xiàn)精準(zhǔn)泊車,讓停車變得更加簡單和高效。
據(jù)悉,Momenta一段式端到端方案已經(jīng)在多個汽車品牌商實(shí)現(xiàn)量產(chǎn)交付。
既然端到端的優(yōu)勢這么多,那它會是自動駕駛的終極解決方案嗎?
曹旭東的答案是否定的。“端到端只是一個開始。”
曹旭東以端到端類比整個深度學(xué)習(xí)為例,深度學(xué)習(xí)其實(shí)在2012年就已經(jīng)是一個端到端模型,只是那時候模型的架構(gòu)還是AlexNet。從2012年到2015年整個模型架構(gòu)會持續(xù)升級和演進(jìn),到2015年的時候出現(xiàn)ResNet。ResNet再往后滲透到了2018年,出現(xiàn)了Transformer。到最近比如2022年又有了GPT?;旧厦咳甓紩幸粋€比較大的進(jìn)步。
因此,曹旭東判斷,端到端僅僅是自動駕駛的一個開始,未來不管是在端到端的模型架構(gòu)上,還是在訓(xùn)練監(jiān)督的方式上,訓(xùn)練的數(shù)據(jù)上,都存在很多可能性。
不可否認(rèn)的是,隨著端到端方案的快速推進(jìn),城市智駕的體驗(yàn)也得到了很大的提升。同時,由于智駕成本的下降,高階智駕也搭載在了售價更低的車型上。
基于對行業(yè)的長期洞察,曹旭東提出了智駕摩爾定律。智駕摩爾定律包含軟件和硬件部分。在軟件方面,智駕行業(yè)的水平每兩年提升10倍,四年100倍,六年1000倍,會是一個指數(shù)級的提升。10倍是什么概念呢?曹旭東舉例說,兩年前有客戶體驗(yàn)Momenta的智駕方案,結(jié)果體驗(yàn)完之后滿頭大汗。前段時間這個客戶再來體驗(yàn),出來后說是頭等艙的體驗(yàn)。“軟件的摩爾定律每兩年10倍增長是沒有上限的,未來一定會實(shí)現(xiàn)零事故的自動駕駛。”
在硬件方面,更多的是體現(xiàn)在降本上。曹旭東稱,硬件的BOM成本兩年會減半。比如一兩年前實(shí)現(xiàn)城市NOA需要兩個OrinX雙激光雷達(dá),整個硬件的BOM成本大概2萬元出頭。現(xiàn)在實(shí)現(xiàn)城市NOA整個硬件BOM成本可以做到1萬左右。未來判斷在2025年底,2026年初的時候,實(shí)現(xiàn)城市NOA BOM成本可以做到5000塊錢左右,硬件成本在迅速兩年減半的速度下降。當(dāng)然,硬件成本的下降是有極限的,預(yù)估到四五千元可能就到硬件BOM成本的極限。
“當(dāng)前可能30萬以上的車標(biāo)配城市NOA,可能到2025年底,20萬以上的車都會標(biāo)配城市NOA,可能有的車企會在15萬以上的車標(biāo)配,有的車企會選配。”曹旭東對城市NOA的普及速度持樂觀態(tài)度。他判斷,能夠?qū)崿F(xiàn)城市NOA的高階智駕未來五年將呈爆發(fā)式的增長態(tài)勢,比電動化、新能源化的速度更快。新能源用了五年時間滲透率增加到50%以上。預(yù)判高階智駕速度更快,未來五年的時間滲透率會增加到70%—80%。
而這,不僅僅是對于Momenta,對于所有中國智駕玩家來說,都是一個機(jī)會。
>>點(diǎn)擊查看今日優(yōu)惠<<