Momenta CEO 曹旭東：已量產(chǎn)一段式端到端，交付多個客戶

2024-09-30 00:44:50 作者：喻欽濤

　　端到端會是自動駕駛的終極解決方案嗎？如何解決端到端方案上限高下限低的問題？

　　自今年以來，端到端無疑是智能駕駛行業(yè)最熱的詞，也是諸多智駕玩家的兵家必爭之地。9月29日，在全球智能汽車產(chǎn)業(yè)大會（GIV2024）上，Momenta CEO曹旭東發(fā)布了首個量產(chǎn)智駕大模型，將感知與規(guī)劃整合進(jìn)一個大模型中，即一段式端到端。太平洋汽車獲悉，其實(shí)早在今年上半年，Momenta 的一段式端到端方案已經(jīng)量產(chǎn)，并交付給了客戶。

　　那么Momenta的端到端方案究竟有何特點(diǎn)？真的如傳言中超出華為智駕0.5到1個段位嗎？端到端方案為何不是自動駕駛的終極方案……對此，太平洋汽車與曹旭東進(jìn)行了深度對話。

超越華為智駕1個段位？

　　“這個不是出自我們公司的表達(dá)。”

　　當(dāng)被問及外界傳言Momenta智駕方案領(lǐng)先華為智駕0.5到1個段位是否是真的時，曹旭東連忙笑著說道。一旁的工作人員也對媒體表示，Momenta從未這樣宣傳過。

　　不過曹旭東在采訪中也透露，主機(jī)廠確實(shí)非常關(guān)注華為和Momenta的智駕方案，基本上都會拿兩者去做對標(biāo)。

　　“對標(biāo)也非常簡單，時間一般都是一兩周，場景包括鄉(xiāng)村道路、小鎮(zhèn)、小城市、大城市。”曹旭東說，對標(biāo)時，主機(jī)廠會把自動駕駛分成幾十上百個場景，比如路口的話會劃分成左轉(zhuǎn)、直行、右轉(zhuǎn)、占道車的繞行還有鬼探頭。每個場景都會有對應(yīng)的KPI，類似于成功率的概念?？蛻魰鶕?jù)最終的成功率來做出選擇。

　　當(dāng)被追問在對標(biāo)中哪家方案表現(xiàn)更好時，曹旭東沒有直接給出答案。他只是說，主機(jī)廠在上百個場景一一對標(biāo)后，發(fā)現(xiàn)Momenta 在三個大類表現(xiàn)不錯。

　　第一是絲滑繞行。在城市NOA場景中，占道車輛、逆行的兩輪車非常多，如果車輛不能絲滑繞行，通行效率就非常低。“Momenta的絲滑繞行還有街道繞行能力非常好，甚至超過了人類的很多中等水平司機(jī)，達(dá)到了老司機(jī)甚至超過老司機(jī)的水平。”

　　第二點(diǎn)是路口的靈活交互。在中國，路口車流人流密度特別高，右轉(zhuǎn)時，不論紅燈還是綠燈，可能都有很多人過馬路。如果你100%停下來的話，那你傳遞的信息就是我等著，那這樣會永遠(yuǎn)走不動。Momenta在右轉(zhuǎn)時會以1公里每小時的速度去蠕行，去判斷時機(jī)跟行人博弈。

　　第三點(diǎn)是預(yù)判。在城市中有很多鬼探頭場景。Momenta的方案有3個優(yōu)勢。第一，它能夠把所有有用的預(yù)判信息都用上。第二，它的整個算法延遲會很短。第三，它會有一些學(xué)習(xí)出來的防御性駕駛的行為。

　　太平洋汽車獲悉，Momenta的智駕方案確實(shí)得到了諸多主機(jī)廠的親睞。目前國際上奔馳、寶馬、通用，國內(nèi)比亞迪、北汽、吉利、廣汽都是Momenta的客戶。業(yè)內(nèi)數(shù)據(jù)顯示，Momenta已經(jīng)與全球排名前十的汽車集團(tuán)中的一半展開量產(chǎn)合作，成為了交付車型最多的智能駕駛公司。

已量產(chǎn)一段式端到端

　　為何Momenta的智駕方案能達(dá)到這樣的效果？答案還要從大會當(dāng)天曹旭東發(fā)布的首個量產(chǎn)智駕大模型，將感知與規(guī)劃整合進(jìn)一個大模型中，即一段式端到端說起。

　　盡管端到端今年才被特斯拉帶火，但它并不是一個新東西。早在2016年，自動駕駛剛剛興起時，業(yè)內(nèi)人士想到的也是用端到端方案來做自動駕駛。但受限于當(dāng)時的軟硬件，大家沒法解決該方案上限高但下限低的問題，于是就逐漸變成做分模塊化的方案。

　　Momenta在端到端架構(gòu)上探索很早，在2020年的時候就已經(jīng)用深度學(xué)習(xí)的方式去做自動駕駛的規(guī)控。到2023年上半年，Momenta已經(jīng)量產(chǎn)了兩段式端到端。一年后，又量產(chǎn)了一段式端到端。

　　與分模塊化方案相比，一段式端到端的上限更高。因?yàn)樗∠撕芏嗳藶樵O(shè)定的（先驗(yàn)），當(dāng)你數(shù)據(jù)少的時候這些先驗(yàn)會起到一些好的效果，但是一旦你的數(shù)據(jù)量大的時候，先驗(yàn)就會變成一些約束項(xiàng)目，它會約束你整個系統(tǒng)的上限。曹旭東說，用端到端就相當(dāng)于把這些先驗(yàn)給去除掉，這樣會更進(jìn)一步提升系統(tǒng)的上限。這也是為什么Momenta智駕現(xiàn)在的水平已經(jīng)比去年年底超越了幾十倍。

　　那么該如何解決一段式端到端方案下限低的問題呢？Momenta的的處理方案類似于人類學(xué)習(xí)的邏輯。人類大腦既有短期記憶，又有長期記憶，當(dāng)一個新的數(shù)據(jù)進(jìn)來，它會先進(jìn)入短期記憶，等到數(shù)據(jù)和方法被驗(yàn)證之后才會進(jìn)入長期記憶去學(xué)習(xí)。Momenta的端到端模型也受此啟發(fā)，分為短期記憶和長期記憶。短期記憶的訓(xùn)練周期是以天為級別的。好的數(shù)據(jù)和好的方法得到驗(yàn)證之后再進(jìn)入長期記憶的模型學(xué)習(xí)。

　　根據(jù)官方說法，Momenta智駕大模型（一段式端到端）可支持在各種復(fù)雜道路環(huán)境下，準(zhǔn)確預(yù)判車輛或行人的通行意圖，自動調(diào)整車速、靈活變道、從容避讓障礙物，極大減輕駕駛員的負(fù)擔(dān)。無論是在應(yīng)對復(fù)雜路口還是動態(tài)橫穿場景，都能從容應(yīng)對，顯著提升駕駛安全和通行效率。即使在夜間極窄車位，斷頭路車位等極限場景，也可實(shí)現(xiàn)精準(zhǔn)泊車，讓停車變得更加簡單和高效。

　　據(jù)悉，Momenta一段式端到端方案已經(jīng)在多個汽車品牌商實(shí)現(xiàn)量產(chǎn)交付。

　　既然端到端的優(yōu)勢這么多，那它會是自動駕駛的終極解決方案嗎？

　　曹旭東的答案是否定的。“端到端只是一個開始。”

　　曹旭東以端到端類比整個深度學(xué)習(xí)為例，深度學(xué)習(xí)其實(shí)在2012年就已經(jīng)是一個端到端模型，只是那時候模型的架構(gòu)還是AlexNet。從2012年到2015年整個模型架構(gòu)會持續(xù)升級和演進(jìn)，到2015年的時候出現(xiàn)ResNet。ResNet再往后滲透到了2018年，出現(xiàn)了Transformer。到最近比如2022年又有了GPT?；旧厦咳甓紩幸粋€比較大的進(jìn)步。

　　因此，曹旭東判斷，端到端僅僅是自動駕駛的一個開始，未來不管是在端到端的模型架構(gòu)上，還是在訓(xùn)練監(jiān)督的方式上，訓(xùn)練的數(shù)據(jù)上，都存在很多可能性。

高階智駕滲透速度會超電動化

　　不可否認(rèn)的是，隨著端到端方案的快速推進(jìn)，城市智駕的體驗(yàn)也得到了很大的提升。同時，由于智駕成本的下降，高階智駕也搭載在了售價更低的車型上。

　　基于對行業(yè)的長期洞察，曹旭東提出了智駕摩爾定律。智駕摩爾定律包含軟件和硬件部分。在軟件方面，智駕行業(yè)的水平每兩年提升10倍，四年100倍，六年1000倍，會是一個指數(shù)級的提升。10倍是什么概念呢？曹旭東舉例說，兩年前有客戶體驗(yàn)Momenta的智駕方案，結(jié)果體驗(yàn)完之后滿頭大汗。前段時間這個客戶再來體驗(yàn)，出來后說是頭等艙的體驗(yàn)。“軟件的摩爾定律每兩年10倍增長是沒有上限的，未來一定會實(shí)現(xiàn)零事故的自動駕駛。”

　　在硬件方面，更多的是體現(xiàn)在降本上。曹旭東稱，硬件的BOM成本兩年會減半。比如一兩年前實(shí)現(xiàn)城市NOA需要兩個OrinX雙激光雷達(dá)，整個硬件的BOM成本大概2萬元出頭。現(xiàn)在實(shí)現(xiàn)城市NOA整個硬件BOM成本可以做到1萬左右。未來判斷在2025年底，2026年初的時候，實(shí)現(xiàn)城市NOA BOM成本可以做到5000塊錢左右，硬件成本在迅速兩年減半的速度下降。當(dāng)然，硬件成本的下降是有極限的，預(yù)估到四五千元可能就到硬件BOM成本的極限。

　　“當(dāng)前可能30萬以上的車標(biāo)配城市NOA，可能到2025年底，20萬以上的車都會標(biāo)配城市NOA，可能有的車企會在15萬以上的車標(biāo)配，有的車企會選配。”曹旭東對城市NOA的普及速度持樂觀態(tài)度。他判斷，能夠?qū)崿F(xiàn)城市NOA的高階智駕未來五年將呈爆發(fā)式的增長態(tài)勢，比電動化、新能源化的速度更快。新能源用了五年時間滲透率增加到50%以上。預(yù)判高階智駕速度更快，未來五年的時間滲透率會增加到70%—80%。

　　而這，不僅僅是對于Momenta，對于所有中國智駕玩家來說，都是一個機(jī)會。

>>點(diǎn)擊查看今日優(yōu)惠<<

本文導(dǎo)航