chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛上常提的VLA與世界模型有什么區(qū)別?

智駕最前沿 ? 來源:智駕最前沿 ? 2025-10-18 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

VLA:把“看”和“說”連到“做”上

[首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛中常提的VLA,全稱是Vision-Language-Action,直譯就是“視覺-語(yǔ)言-動(dòng)作”。VLA的目標(biāo)是把相機(jī)或傳感器看到的畫面、能理解和處理自然語(yǔ)言的大模型能力,和最終控制車輛的動(dòng)作輸出連到一起。這樣一套模型既能把路面情況轉(zhuǎn)成語(yǔ)義信息(比如識(shí)別行人、車道、交通標(biāo)志),又能在內(nèi)部用類語(yǔ)言的方式做推理(比如判斷行人的意圖是否會(huì)橫穿),最后直接輸出控制量或軌跡建議,從而完成從感知到?jīng)Q策到動(dòng)作的閉環(huán)。

VLA常把視覺特征先經(jīng)過編碼器變成一組向量,然后把這些向量與語(yǔ)言模型連接,語(yǔ)言模型負(fù)責(zé)做高層推理或上下文理解,最后再用一個(gè)動(dòng)作生成模塊把推理結(jié)果映射到可執(zhí)行的控制指令。因?yàn)橛小罢Z(yǔ)言”這條中間線索,VLA在解釋模型為什么這樣決策、把決策用人能看懂的方式表達(dá)方面有天然優(yōu)勢(shì),這對(duì)事故回溯、人工審查和人機(jī)交互都很有幫助。

世界模型:在“腦?!崩?a href="http://m.brongaenegriffin.com/analog/" target="_blank">模擬未來

世界模型的核心是讓系統(tǒng)學(xué)會(huì)預(yù)測(cè)環(huán)境會(huì)如何變化。給定當(dāng)前的觀測(cè)和一系列動(dòng)作,世界模型嘗試預(yù)測(cè)接下來一段時(shí)間內(nèi)的感知輸出或場(chǎng)景演化,例周圍車輛會(huì)怎么走、行人會(huì)如何移動(dòng),或者道路上的占用情況會(huì)如何變化等。它更像是一個(gè)可以在內(nèi)部反復(fù)“試驗(yàn)”的模擬器。

世界模型可以是像素級(jí)的,也可以是抽象的潛在空間表示。像素級(jí)的會(huì)直接生成未來幾幀圖像,抽象的潛在表示則在更緊湊的編碼下預(yù)測(cè)物體的狀態(tài)和動(dòng)力學(xué)。自動(dòng)駕駛中常把世界模型用來做兩件事,一是在線短時(shí)預(yù)測(cè),輔助規(guī)劃器評(píng)估當(dāng)前動(dòng)作的后果;二是離線大規(guī)模仿真,用來生成難例、做策略評(píng)估和安全驗(yàn)證。世界模型的強(qiáng)項(xiàng)在于對(duì)因果關(guān)系和動(dòng)力學(xué)的建模,它能回答“如果我這么做,環(huán)境會(huì)怎樣”,這對(duì)安全評(píng)估非常關(guān)鍵。

兩者的核心差別與各自擅長(zhǎng)的事

把VLA和世界模型放在一起對(duì)比,其實(shí)有非常大的差別。VLA更強(qiáng)調(diào)把復(fù)雜語(yǔ)義和推理能力直接引入決策鏈,善于解釋性和把人類語(yǔ)義知識(shí)(比如規(guī)則、常識(shí))融入行為判斷;世界模型更強(qiáng)調(diào)動(dòng)力學(xué)與未來狀態(tài)的預(yù)測(cè),擅長(zhǎng)評(píng)估動(dòng)作后果和生成訓(xùn)練用的極端場(chǎng)景。

因?yàn)檎Z(yǔ)言式推理要靠語(yǔ)料和場(chǎng)景標(biāo)簽來訓(xùn)練,因此VLA需要大量多模態(tài)、標(biāo)注或與人類語(yǔ)義對(duì)齊的數(shù)據(jù);世界模型更依賴連續(xù)的時(shí)序數(shù)據(jù)與準(zhǔn)確的動(dòng)力學(xué)反饋,或是高保真仿真器來補(bǔ)足現(xiàn)實(shí)數(shù)據(jù)不足。

對(duì)于自動(dòng)駕駛行業(yè)來說,VLA能讓系統(tǒng)“說出理由”,有利于合規(guī)和用戶信任;世界模型能把長(zhǎng)期風(fēng)險(xiǎn)提前顯現(xiàn),有利于安全驗(yàn)證和策略穩(wěn)健性。兩者在算力和實(shí)時(shí)性上的要求也不同,端到端的VLA若要部署在車端,需要在多模態(tài)推理與延時(shí)之間做平衡;高保真世界模型若用于在線預(yù)測(cè),也要保證預(yù)測(cè)速度和穩(wěn)定性,否則實(shí)時(shí)控制就受影響。

如何將這兩者用好?

自動(dòng)駕駛行業(yè)常見做法是把世界模型放在云端或仿真平臺(tái),用來大規(guī)模生成極端和稀有場(chǎng)景,做訓(xùn)練數(shù)據(jù)擴(kuò)充和策略評(píng)估;把VLA或其它決策模型放到車端,負(fù)責(zé)實(shí)時(shí)感知-推理-動(dòng)作映射,并把可解釋的中間表示(例如“為什么剎車”)記錄下來,用于審計(jì)。還有一種做法是在車端保留一個(gè)輕量的世界模型,用于短時(shí)軌跡預(yù)測(cè)和冗余校驗(yàn),作為主決策器的安全網(wǎng)。

在選擇技術(shù)路線時(shí),務(wù)必要考慮幾個(gè)現(xiàn)實(shí)問題,即目標(biāo)場(chǎng)景是什么(城市復(fù)雜路況還是高速長(zhǎng)途)、能否承擔(dān)大量真實(shí)路測(cè)、對(duì)可解釋性和監(jiān)管合規(guī)的要求有多高。面向消費(fèi)者的駕駛輔助系統(tǒng)可能更重視用戶體驗(yàn)和自然交互,VLA能提高語(yǔ)義層面的表現(xiàn);面向商用車隊(duì)或?qū)Π踩弦?guī)嚴(yán)格的場(chǎng)景,則更需要強(qiáng)大的世界模型做仿真與驗(yàn)證。無論哪條路,一定要建立嚴(yán)格的sim-to-real校準(zhǔn)流程、冗余策略以及持續(xù)的在線/離線評(píng)估體系,避免把過擬合的語(yǔ)言推理或低保真仿真直接當(dāng)成“能上路”的決策依據(jù)。

對(duì)于自動(dòng)駕駛企業(yè)來說,可以用世界模型生成的極端場(chǎng)景來補(bǔ)齊訓(xùn)練集,但要用真實(shí)數(shù)據(jù)來校準(zhǔn);在車端實(shí)現(xiàn)可解釋性輸出和異常檢測(cè)機(jī)制,以便監(jiān)管和事后分析;在設(shè)計(jì)系統(tǒng)邊界時(shí)明確何時(shí)由人工接管、何時(shí)由系統(tǒng)限制能力,避免模型在不確定情況下做出過激動(dòng)作?;旌鲜褂脙烧卟⑼ㄟ^嚴(yán)格驗(yàn)證可以讓自動(dòng)駕駛系統(tǒng)既能“想清楚后果”,又能“把理由講清楚”,是比較穩(wěn)妥的路線。

最后的話

VLA和世界模型不是誰替代誰,而是兩種互補(bǔ)的工具。VLA把語(yǔ)言式的推理能力帶進(jìn)決策里,提升對(duì)復(fù)雜語(yǔ)義場(chǎng)景的處理和可解釋性;世界模型讓系統(tǒng)能在“腦子里”模擬未來,提升對(duì)風(fēng)險(xiǎn)和后果的評(píng)估能力。對(duì)于自動(dòng)駕駛行業(yè)來說,更實(shí)際的做法是把兩者的優(yōu)點(diǎn)結(jié)合起來,用世界模型來補(bǔ)數(shù)據(jù)、做驗(yàn)證,用VLA提升語(yǔ)義理解與交互,同時(shí)確保有清晰的安全邊界和多層冗余。這樣既能提高功能性,也能把安全性和可審計(jì)性放在首位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3810

    瀏覽量

    52253
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14972

    瀏覽量

    181316
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小鵬發(fā)布 X-World 世界模型:已全面應(yīng)用第二代VLA

    第二代 VLA 自動(dòng)駕駛系統(tǒng)的研發(fā)、仿真與驗(yàn)證,標(biāo)志著自動(dòng)駕駛從 路測(cè)驅(qū)動(dòng) 邁入 世界模型驅(qū)動(dòng) 的新階段。 何為 X-World? X-Wo
    的頭像 發(fā)表于 04-14 10:11 ?5753次閱讀

    理想汽車發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

    下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動(dòng)駕駛基礎(chǔ)模型,讓
    的頭像 發(fā)表于 03-18 11:51 ?1455次閱讀
    理想汽車發(fā)布下一代<b class='flag-5'>自動(dòng)駕駛</b>基礎(chǔ)<b class='flag-5'>模型</b>MindVLA-o1

    如何構(gòu)建適合自動(dòng)駕駛世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    已有VLM,自動(dòng)駕駛為什么還要探索VLA?

    時(shí)(長(zhǎng)尾場(chǎng)景),會(huì)因規(guī)則覆蓋不足而表現(xiàn)僵化。 隨著大語(yǔ)言模型和視覺語(yǔ)言模型(VLM)的爆發(fā),開發(fā)者們意識(shí)到,如果車輛能像人類一樣擁有常識(shí),理解什么是“潮汐車道”,知道“救護(hù)車在后方鳴笛需要避讓”,那么自動(dòng)駕駛的上限將
    的頭像 發(fā)表于 02-03 09:04 ?336次閱讀
    已有VLM,<b class='flag-5'>自動(dòng)駕駛</b>為什么還要探索<b class='flag-5'>VLA</b>?

    自動(dòng)駕駛中常的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),經(jīng)常會(huì)提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動(dòng)駕駛中的模仿學(xué)習(xí),就是把人類司機(jī)在各種路況下的行為做成范例,記錄下看到了什么
    的頭像 發(fā)表于 01-16 16:41 ?2119次閱讀

    自動(dòng)駕駛中常世界模型是什么?

    在很多廠家的技術(shù)方案中,會(huì)提到世界模型的介紹。世界模型,就是自動(dòng)駕駛系統(tǒng)內(nèi)部用來表示外部世界并預(yù)
    的頭像 發(fā)表于 01-05 16:23 ?1061次閱讀

    VLA世界模型什么不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]當(dāng)前自動(dòng)駕駛行業(yè),各車企的技術(shù)路徑普遍選擇了單車智能方向。而在實(shí)際落地過程中,不同企業(yè)選擇了差異化的技術(shù)實(shí)現(xiàn)方式,部分車企側(cè)重于視覺—語(yǔ)言—?jiǎng)幼?b class='flag-5'>模型(Vision
    的頭像 發(fā)表于 12-17 09:13 ?851次閱讀
    <b class='flag-5'>VLA</b>與<b class='flag-5'>世界</b><b class='flag-5'>模型</b><b class='flag-5'>有</b>什么不同?

    世界模型是讓自動(dòng)駕駛汽車?yán)斫?b class='flag-5'>世界還是預(yù)測(cè)未來?

    ? [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型自動(dòng)駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對(duì)自動(dòng)駕駛的作用時(shí),難免會(huì)出現(xiàn)分歧。它到底是讓自動(dòng)駕駛汽車
    的頭像 發(fā)表于 12-16 09:27 ?1001次閱讀
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是讓<b class='flag-5'>自動(dòng)駕駛</b>汽車?yán)斫?b class='flag-5'>世界</b>還是預(yù)測(cè)未來?

    VLA能解決自動(dòng)駕駛中的哪些問題?

    [首發(fā)于智駕最前沿微信公眾號(hào)]很多從事自動(dòng)駕駛的小伙伴應(yīng)該對(duì)VLA這個(gè)概念已經(jīng)非常熟悉了。VLA即“Visual-Language-Action”(視覺—語(yǔ)言—?jiǎng)幼鳎?b class='flag-5'>模型,它的核心是將
    的頭像 發(fā)表于 11-25 08:53 ?614次閱讀
    <b class='flag-5'>VLA</b>能解決<b class='flag-5'>自動(dòng)駕駛</b>中的哪些問題?

    模型中常的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語(yǔ)言模型世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的智能
    的頭像 發(fā)表于 11-22 10:59 ?2613次閱讀
    大<b class='flag-5'>模型</b>中常<b class='flag-5'>提</b>的快慢思考會(huì)對(duì)<b class='flag-5'>自動(dòng)駕駛</b>產(chǎn)生什么影響?

    VLA世界模型,誰才是自動(dòng)駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)發(fā)展,其實(shí)現(xiàn)路徑也呈現(xiàn)出兩種趨勢(shì),一邊是以理想、小鵬、小米為代表的VLA(視覺—語(yǔ)言—行動(dòng))模型路線;另一邊則是以華為、蔚來為主導(dǎo)的世界
    的頭像 發(fā)表于 11-05 08:55 ?914次閱讀
    <b class='flag-5'>VLA</b>和<b class='flag-5'>世界</b><b class='flag-5'>模型</b>,誰才是<b class='flag-5'>自動(dòng)駕駛</b>的最優(yōu)解?

    自動(dòng)駕駛中常的ODD是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛中,經(jīng)常會(huì)聽到一個(gè)概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文譯為“運(yùn)行設(shè)計(jì)域”或者“作業(yè)域”。直觀一點(diǎn)
    的頭像 發(fā)表于 09-22 09:04 ?1062次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常<b class='flag-5'>提</b>的ODD是個(gè)啥?

    車規(guī)級(jí)和消費(fèi)級(jí)什么區(qū)別?為什么自動(dòng)駕駛需要車規(guī)級(jí)?

    區(qū)別主要體現(xiàn)在可靠性、環(huán)境適應(yīng)、質(zhì)量管理與安全保障等多個(gè)方面。對(duì)于汽車,尤其是自動(dòng)駕駛系統(tǒng)而言,任何一次失效都可能帶來嚴(yán)重后果,因此必須選用符合車規(guī)級(jí)標(biāo)準(zhǔn)的硬件與軟件。那什么是車規(guī)級(jí)?什么是消費(fèi)級(jí)?為什么自動(dòng)駕駛需要車規(guī)級(jí)?
    的頭像 發(fā)表于 07-15 08:55 ?1976次閱讀
    車規(guī)級(jí)和消費(fèi)級(jí)<b class='flag-5'>有</b><b class='flag-5'>什么區(qū)別</b>?為什么<b class='flag-5'>自動(dòng)駕駛</b>需要車規(guī)級(jí)?

    自動(dòng)駕駛中常世界模型是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測(cè)”未來的變化。世界模型
    的頭像 發(fā)表于 06-24 08:53 ?1365次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常<b class='flag-5'>提</b>的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個(gè)啥?

    VLA,是完全自動(dòng)駕駛的必經(jīng)之路?

    芯片,以及英偉達(dá)Thor的上車,越來越多的智駕方案選擇VLA的路徑。 ? 那么本文就梳理一下當(dāng)前智駕領(lǐng)域集中主流的大模型技術(shù)路線,以及各家廠商實(shí)現(xiàn)方式的區(qū)別和發(fā)展。 ? VLA 和VL
    的頭像 發(fā)表于 06-18 00:06 ?9712次閱讀