- A+
2023年1月5日,第七屆HAOMO AI DAY強勢來襲。新年伊始,毫末智行為中國自動駕駛行業(yè)帶來了一場精彩的技術盛宴。本屆AI DAY上,毫末首次公布了數(shù)據(jù)智能驅動體系的六大閉環(huán)系統(tǒng)以及全新升級的MANA五大模型,在這兩大技術的助力下,毫末智行有信心成為中國第一個邁入自動駕駛3.0時代的自動駕駛公司。毫末在乘用車領域產品高速迭代的背后,是毫末打造的業(yè)內獨有的產品能力迭代鐵三角:即場景化用戶體驗設計、人工智能技術、技術工程化能力。其中,毫末的數(shù)據(jù)驅動體系成為提高研發(fā)迭代效率,驅動產品精準迭代,持續(xù)提高智駕產品用戶價值的重要支撐。張凱表示,基于此,毫末將進入“產品越好用,用戶越愛用”精準迭代的正向循環(huán)。目前,毫末數(shù)據(jù)智能體系MANA已形成了強大的數(shù)據(jù)智能驅動體系,包含了六大閉環(huán)系統(tǒng):用戶需求閉環(huán)、研發(fā)效能閉環(huán)、產品自完善閉環(huán)、數(shù)據(jù)積累閉環(huán)、數(shù)據(jù)價值閉環(huán)、業(yè)務工程化閉環(huán),全部聚焦用戶的典型使用場景。用戶需求閉環(huán)中,毫末已建立5大維度、264類核心用戶需求,日??梢詮拇罅亢诵膱鼍皵?shù)據(jù)中提取核心問題;研發(fā)效能閉環(huán)則通過仿真工具提升研發(fā)效能。目前毫末仿真在研發(fā)中覆蓋率超過70%,研發(fā)效能較兩年前提升8倍;產品自完善閉環(huán),讓毫末的產品自完善閉環(huán)率超過70%,助力客戶成功實現(xiàn)7次OTA在線升級;數(shù)據(jù)積累閉環(huán)中,毫末通過自研自動化數(shù)據(jù)采集、自動化數(shù)據(jù)標注工具,在2022年底數(shù)據(jù)成本降低98%;數(shù)據(jù)價值閉環(huán),讓毫末的全新車型復用開發(fā)只需4個月時間即達到量產落地狀態(tài),全新車型匹配標定2個月內匹配完成,標定效率全行業(yè)第一;業(yè)務工程化閉環(huán),讓毫末可以做到智駕產品100%一次性過線率,毫末成為國內唯一的智能駕駛技術工程化經驗最豐富的公司。張凱表示,毫末數(shù)據(jù)智能驅動體系的六大閉環(huán)能力,助力客戶的智能汽車快速規(guī)模化量產,真正為用戶釋放價值,使智能汽車的智能駕駛系統(tǒng)從用戶嘗鮮階段過渡到用戶依賴階段。此外,本屆HAOMO AI DAY上,毫末還宣布了中國自動駕駛行業(yè)最大智算中心“雪湖·綠洲”(MANA OASIS)成立的重磅消息。在MANA OASIS的加持下,毫末MANA五大模型迎來全新亮相升級。首先,視頻自監(jiān)督大模型,讓毫末4D Clip標注實現(xiàn)100%自動化,人工標注成本降低98%。為了更低成本、更高效獲取更多高價值數(shù)據(jù),需要解決從離散幀自動化擴充到Clips形態(tài)的問題。毫末首先利用海量videoClip,通過視頻自監(jiān)督方式,預訓練出一個大模型,用少量人工標注好的Clip數(shù)據(jù)進行Finetune(微調),訓練檢測跟蹤模型,使得模型具備自動標注的能力;然后,將已經標注好的千萬級單幀數(shù)據(jù)所對應的原始視頻提取出來組織成Clip,其中10%是標注幀,90%是未標注幀,再將這些Clip輸入到模型,完成對90%未標注幀的自動標注,進而實現(xiàn)所有單幀標注向Clip標注的100%的自動轉化,同時降低98%的Clip標注成本。毫末視頻自監(jiān)督大模型的泛化性效果極佳,即使是在一些非常困難的場景,例如嚴重遮擋的騎行者,遠處的小目標,惡劣的天氣和光照,都能準確地完成自動標注。其次,3D重建大模型,讓毫末實現(xiàn)了數(shù)據(jù)“無中生有”,獲得海量corner case(長尾場景)不再是難事。面對“完全從真實數(shù)據(jù)中積累的corner case困難且昂貴”的行業(yè)難題,毫末將爆火的三維重建NeRF技術應用在自動駕駛場景重建和數(shù)據(jù)生成中,它通過改變視角、光照、紋理材質的方法,生成高真實感數(shù)據(jù),實現(xiàn)以低成本獲取normal case,生成各種高成本corner case。3D重建大模型生成的數(shù)據(jù),不僅比傳統(tǒng)的人工顯式建模再渲染紋理的方法效果更好、成本更低,增加NeRF生成的數(shù)據(jù)后,還可將感知的錯誤率降低30%以上。第三,多模態(tài)互監(jiān)督大模型,能夠精準識別異形障礙物,讓車輛“火眼金睛”。在成功實現(xiàn)車道線和常見障礙物的精準檢測后,針對城市多種異形障礙物的穩(wěn)定檢測問題,毫末正在思考和探索更加通用的解決方案。多模態(tài)互監(jiān)督大模型引入了激光雷達作為視覺監(jiān)督信號,直接使用視頻數(shù)據(jù)來推理場景的通用結構表達。通用結構的檢測,可以很好地補充已有的語義障礙物檢測,有效提升自動駕駛系統(tǒng)在城市復雜工況下的通過率。第四,動態(tài)環(huán)境大模型,可以精準預測道路的拓撲關系,讓車輛始終行駛在正確的車道中。在重感知技術路線下,毫末為了將對高精地圖的依賴度降到最低,面臨著“道路拓撲結構實時推斷”的挑戰(zhàn)。為此,毫末在BEV(鳥瞰圖)的feature map(特征圖)基礎上,以標精地圖作為引導信息,使用自回歸編解碼網絡,將BEV特征,解碼為結構化的拓撲點序列,實現(xiàn)車道拓撲預測,讓毫末的感知能力,能像人類一樣在標準地圖的導航提示下就可以實現(xiàn)對道路拓撲結構的實時推斷。毫末認為,解決了路口問題實際就解決了大部分城市NOH問題,目前在保定、北京,毫末對于85%的路口拓撲推斷準確率高達95%。即便是非常復雜、非常不規(guī)則的路口,毫末也能準確預測。第五,人駕自監(jiān)督認知大模型,掌握高水平司機的開車技法,讓駕駛決策更聰明。在探索“使用大量人駕數(shù)據(jù),直接訓練模型做出擬人化決策”方面,毫末為了讓模型能夠學習到高水平司機的優(yōu)秀開車方法,全新引入了用戶真實的接管數(shù)據(jù),同時用RLHF(從人類反饋中強化學習)思路先訓練一個reward model(獎勵模型)來挑選出更好的駕駛決策。通過這種方式,使毫末在掉頭、環(huán)島等公認的困難場景中,通過率提升30%以上。這與AGI領域爆火的ChatGPT的思路相同,通過人類行為反饋來選出最優(yōu)答案。MANA五大模型全面提升了毫末感知和認知層面系統(tǒng)化的底層技術能力?!霸谖宕竽P椭ο?MANA最新的車端感知架構,從過去分散的多個下游任務集成到了一起,形成一個更加端到端的架構,包括通用障礙物識別、局部路網、行為預測等任務,毫末車端感知架構實現(xiàn)了跨代升級?!鳖櫨S灝表示,這也意味著毫末的感知能力更強,產品力更強,產品可以通過快速迭代向全無人駕駛加速邁進。隨著毫末智算中心MANA OASIS的落地,數(shù)據(jù)智能體系MANA也實現(xiàn)了脫胎換骨的升級。在未來的日子里,不斷進化的MANA作為毫末產品迭代的核心動力,將持續(xù)助力毫末發(fā)揮核心技術優(yōu)勢,早日實現(xiàn)毫末“讓機器智能移動,給生活更多美好”的最新美好愿景。
相關話題(文章)