小P更擬人/有情緒 小鵬汽車新語音系統(tǒng)

2021-12-22 16:43:36 作者:問答叫獸

起初,駕駛員只能通過物理按鈕和旋鈕給車輛下達指令,沒有其他辦法。隨著智能聯(lián)網(wǎng)汽車的發(fā)展,“語音助手”逐漸成為人機交互的重要方式,而在未來的自動駕駛時代,語音交互似乎有了更高的地位。甚至到現(xiàn)在,Xpeng Motors給出的數(shù)據(jù)顯示,用戶智能語音的日使用率都在90%以上。如何讓大家喜歡的語音系統(tǒng)變得更好?Xpeng Motors即將通過在線旅行社給出答案。

本次OTA推送僅針對2021年4月27日首次上市的Xpeng Motors P7。截至2021年6月,該車累計銷量已超過3萬輛。除了706公里的NEDC續(xù)航里程,該車的輔助駕駛能力和語音識別系統(tǒng)也有出色的表現(xiàn)。比如小鵬P7查成交價|參配|優(yōu)惠政策)的副駕具備高速NGP能力,其語音系統(tǒng)具備全場景語音能力,新語音系統(tǒng)的升級將進一步增強這一能力。

●新的語音系統(tǒng)有什么變化?

2021年7月下旬,Xpeng Motors將通過OTA將新語音系統(tǒng)推向P7的所有車型。語音系統(tǒng)最重要的變化是語音助手的音色更加擬人化,同時可以實現(xiàn)帶有情緒變化的語音輸出。至于語音助手的響應速度、識別率和功能實現(xiàn),新系統(tǒng)基本保持了之前的水平,不會有明顯的優(yōu)化。

更多精彩視頻,均在車載家庭視頻頻道。

“Xpeng汽車新語音系統(tǒng)官方展示視頻”

其實語音系統(tǒng)OTA的目的很好理解,就像我們可以改變小P的面貌一樣,是增強人機交互體驗和情感交流的一種方式。對于傳統(tǒng)意義上的語音助手來說,可能只是一個用來幫你完成功能操作的機器人,說話死板,機械音色強,沒有情緒變化。拋開語音助手的強大功能不談,你有沒有和“純機器人”交流的欲望?如果語音助手聽起來像真正的“小秘書”,結(jié)果會不會不一樣?

這次我們的新發(fā)音能達到什么水平?第一,音色和音色。我們可以通過上面的視頻大致了解一下音色。這種擬人化的程度,確實和目前其他汽車語音助手不一樣。與之前的小P相比,也大大降低了機械感。至于音質(zhì)方面,Xpeng Motors官方表示,新聲采用了24K采樣技術,實現(xiàn)了高保真音質(zhì)。

在音質(zhì)和音色水平方面,我們有參考。Microsoft MOS語音質(zhì)量評估是國際公認的語音質(zhì)量評估方法。與真人和機器人的聲音相比,越接近真人的聲音,得分越高,滿分5分。Xpeng Motors的新語音助手獲得4.49分。官方稱是MOS測評中得分最高的車載智能語音助手。不過,Xpeng Motors也提到,這種MOS評價體系只是主觀評價參考,但從專業(yè)角度來看,并不意味著100%準確。

此外,官方分享稱,升級后的語音助手可以表達情感變化。目前所有的車載語音助手都是簡單的將文字轉(zhuǎn)換成語音,語氣平淡不變,但“新小P”將具備轉(zhuǎn)換快樂、溫柔、親密、抒情、嚴肅、不滿、憤怒、恐懼、悲傷、冷靜等14種強烈情緒的能力。,并能實現(xiàn)情緒轉(zhuǎn)換、速度變化、抑揚頓挫等。這些將增強語音助手的擬人屬性。不過我預計類似情感轉(zhuǎn)換的能力可能還是只能覆蓋部分內(nèi)容,不會實現(xiàn)全覆蓋。

據(jù)Xpeng Motors介紹,目前這種語音系統(tǒng)還具備“根據(jù)實際情況自行調(diào)節(jié)語速和情緒”的能力,但這種能力距離上車還有很長的路要走,后期還需要不斷培養(yǎng)和調(diào)整。到目前為止,我們只有官方的樣本視頻供參考。我們將在7月下旬與您分享新語音系統(tǒng)的實際體驗。敬請期待。

Xpeng Motors是如何實現(xiàn)這些變化的?

此次,Xpeng Motors的語音系統(tǒng)采用了“超大規(guī)模在線神經(jīng)網(wǎng)絡引擎+小型離線拼接引擎”的技術組合,這也是實現(xiàn)新語音的關鍵因素之一。然而,該方案對于計算、時延、網(wǎng)絡抖動、與應用結(jié)合、聲音一致性等問題具有較高的R&D工作量和難度。,所以這樣的技術方案并不是目前車企的普遍選擇。

“在線神經(jīng)網(wǎng)絡引擎+離線拼接引擎”能給語音系統(tǒng)帶來什么幫助?首先是發(fā)音方式和質(zhì)量。新語音助手的所有發(fā)音都是由AI合成的。現(xiàn)在,一些語音設備的擬人化音色可以通過錄音來實現(xiàn)。一旦涉及到前期沒有錄制的內(nèi)容,呈現(xiàn)出來的聲音就會不一樣,這是AI合成所避免的。此外,傳統(tǒng)的離線引擎沒有大的計算能力,帶來了音質(zhì)普通的缺點。不過這次Xpeng Motors使用了云引擎,巨大的計算能力可以支持高質(zhì)量的聲音輸出。

在溝通會上,我們也提到了新聲是否會對網(wǎng)絡有很強的需求。地下室、隧道等場景一旦網(wǎng)絡中斷,語音系統(tǒng)是否會降級?據(jù)說官方的新聲音對網(wǎng)絡的依賴度更低。網(wǎng)絡抖動嚴重時,語音系統(tǒng)會使用離線引擎作為保障,屆時語音確實會降級。Xpeng Motors R&D人員表示,在初步測試中,這種情況的比例非常低,大概只有1%或2%左右。實車表現(xiàn)如何?后續(xù)我們也會給大家?guī)韺嵺`經(jīng)驗。

●對新語音系統(tǒng)的其他好奇

從小P的角色定位和情感需求來看。),Xpeng Motors從多種音色中選擇了小P。目前語音系統(tǒng)不支持幾種不同音色的擬人化語音之間的切換,因為Xpeng Motors認為很難把每一個語音都打磨得很好,這就需要很高的AI訓練、服務器占用、延時降低等諸多方面,所以“打磨出好的語音”比“個性化”有更高的優(yōu)先級。

但是作為一個彩蛋,R&D人員表示,在一些功能和情況下,小P中還是會有一些不同的情緒和聲音,這就要看用戶自己了。

Xpeng Motors中的R&D人員表示,他們內(nèi)部也考慮過這個問題,但除了技術難度和成本,還有小P的定位,誰是助理?秘書?還是用戶的親戚?用戶希望親戚或朋友的聲音出現(xiàn)在語音系統(tǒng)中嗎?Xpeng Motors仍在思考這些問題。屏幕前的朋友們,你們怎么看?

到目前為止,這款語音系統(tǒng)只會在Xpeng Motors P7上全面發(fā)布。至于其他車型,未來還是以實際車型規(guī)劃為準,目前還不確定。

總結(jié):

我還記得,Xpeng Motors P7語音系統(tǒng)的最后一大OTA增加了全場景語音功能,也就是說你可以通過語音控制中控屏幕上的所有元素,不用記住那些死板的指令,只需要看你看到的就可以了。

“全場景語音”可以說在車載語音助手中達到了一流的功能實現(xiàn)水平,進一步提升了語音助手的功能豐富性;這一次,更加擬人化、情緒化、情感化的P從人機情感交流的角度大大提升了用戶體驗。“全場景語音”+“擬人化語音輸出”,小P又長大了,希望7月下旬的實車體驗能給我們驚喜。

熱門閱讀

>>點擊查看今日優(yōu)惠<<

    相關閱讀
    點擊加載更多