當(dāng)大模型開(kāi)始“看懂”圖像、理解語(yǔ)言,是否意味著AI已經(jīng)足夠強(qiáng)大?答案顯然是否定的。真正決定下一階段產(chǎn)業(yè)格局的,不是模型在屏幕里的推理能力,而是它是否能夠走進(jìn)物理世界,理解環(huán)境、規(guī)劃行動(dòng),并穩(wěn)定、可靠地完成任務(wù)——即我們所謂的具身智能。
從“看見(jiàn)世界”到“動(dòng)手改變世界”,中間跨越的是一整套從算法、數(shù)據(jù)到硬件系統(tǒng)的工程體系。圍繞這一目標(biāo),軟通天擎構(gòu)建了覆蓋機(jī)器人本體、數(shù)據(jù)平臺(tái)與算法模型的全棧能力,并以軟通天擎ArtisanBrain-X0 為核心小腦模型,推動(dòng)視覺(jué)-語(yǔ)言-動(dòng)作(VLA)能力的真正落地。

軟通天擎全棧能力架構(gòu)圖
從大模型能力走向具身落地:
軟通天擎的全棧布局
軟通天擎是一家聚焦具身智能的科技企業(yè),致力于成為國(guó)內(nèi)領(lǐng)先的具身智能人形機(jī)器人產(chǎn)品與場(chǎng)景應(yīng)用解決方案提供商。公司以大模型的泛化能力為核心驅(qū)動(dòng),構(gòu)建覆蓋以下四大方向的全棧技術(shù)體系:
具身智能數(shù)據(jù)采集平臺(tái)
具身數(shù)據(jù)模型與算法
機(jī)器人操作系統(tǒng)
人形機(jī)器人本體硬件與關(guān)鍵部件設(shè)計(jì)制造
當(dāng)前,公司聚焦三大主營(yíng)業(yè)務(wù)方向:
具身智能數(shù)據(jù)基礎(chǔ)設(shè)施解決方案與技術(shù)服務(wù)
具身智能人形機(jī)器人本體及關(guān)鍵部件研發(fā)與生產(chǎn)制造(天擎 A/T 系列)
面向工業(yè)智造、康養(yǎng)、教育科研等具身智能場(chǎng)景應(yīng)用解決方案與技術(shù)服務(wù)
在真實(shí)產(chǎn)業(yè)推進(jìn)過(guò)程中,軟通天擎深刻認(rèn)識(shí)到具身智能的落地并非簡(jiǎn)單的模型訓(xùn)練問(wèn)題,而是一個(gè)系統(tǒng)工程問(wèn)題。圍繞行業(yè)現(xiàn)狀,公司總結(jié)出四大核心壁壘:
本體硬件穩(wěn)定性與成本控制難題
高質(zhì)量真實(shí)數(shù)據(jù)匱乏
采集—訓(xùn)練—推理部署流程割裂
缺乏真正可泛化的具身大模型
針對(duì)這些問(wèn)題,軟通天擎打造了“采-訓(xùn)-推”一體化閉環(huán)體系,并推出Artisan一站式具身智能開(kāi)發(fā)平臺(tái),實(shí)現(xiàn)從數(shù)據(jù)采集到模型部署的全流程打通。
軟通天擎認(rèn)為只有當(dāng)硬件本體、數(shù)據(jù)與模型形成統(tǒng)一協(xié)同體系,具身智能才能真正實(shí)現(xiàn)規(guī)模化復(fù)制。
ArtisanBrain-X0:
跨本體泛化的小腦核心
具身智能領(lǐng)域長(zhǎng)期存在一個(gè)關(guān)鍵問(wèn)題——模型能力被“鎖死”在單一本體上。不同機(jī)器人結(jié)構(gòu)差異巨大:自由度不同、動(dòng)力學(xué)不同、控制接口不同。這導(dǎo)致每適配一種新本體,都需要重新采集數(shù)據(jù)、重新訓(xùn)練模型,難以形成數(shù)據(jù)飛輪。ArtisanBrain-X0 正是在這樣的背景下提出跨本體統(tǒng)一建模方案。
1統(tǒng)一動(dòng)作空間:打破本體差異
傳統(tǒng)機(jī)器人模型多基于關(guān)節(jié)空間建模,本體之間難以共享數(shù)據(jù)。ArtisanBrain-X0 將不同機(jī)器人控制信號(hào)統(tǒng)一抽象為末端執(zhí)行器(EE)位姿表示——即三維空間中的位置與姿態(tài)變化。這意味著:
? 單臂、雙臂、移動(dòng)底盤系統(tǒng)
? 不同自由度結(jié)構(gòu)
? 不同驅(qū)動(dòng)形式
在模型視角中都使用同一種“動(dòng)作語(yǔ)言”。這一抽象使模型不再依賴具體關(guān)節(jié)結(jié)構(gòu),而直接面向物理世界交互目標(biāo)進(jìn)行建模。
2動(dòng)作Tokenizer:離散化物理行為
連續(xù)高維控制軌跡直接建模存在泛化困難,ArtisanBrain-X0 引入分組殘差量化(GRVQ)機(jī)制,將連續(xù)軌跡壓縮為離散動(dòng)作原語(yǔ) token。這一機(jī)制帶來(lái)三大核心收益:
? 長(zhǎng)時(shí)序控制更加穩(wěn)定
? 計(jì)算效率顯著提升
? 動(dòng)作知識(shí)可遷移共享
模型輸出的不再是復(fù)雜控制流,而是一組“接近—抓取—放置”等可解釋動(dòng)作詞匯序列。
3三層閉環(huán)推理:從語(yǔ)言到執(zhí)行
ArtisanBrain-X0 采用分層決策架構(gòu),實(shí)現(xiàn)從自然語(yǔ)言到物理控制的閉環(huán):
? 高層:任務(wù)理解與語(yǔ)義拆解
? 中層:動(dòng)作原語(yǔ)生成
? 底層:控制信號(hào)解碼
通過(guò)“語(yǔ)義一致—控制一致—執(zhí)行一致”的三層對(duì)齊機(jī)制,模型能夠穩(wěn)定完成復(fù)雜任務(wù)。在 Libero 仿真評(píng)測(cè)中,ArtisanBrain-X0 綜合成功率達(dá) 96.3%,在真實(shí)機(jī)器人測(cè)試中總體成功率達(dá) 48.9%,幾乎是基線 π0 的 2.5 倍。這意味著跨本體泛化不再停留在理論層面,而是具備真實(shí)世界可行性。
采-訓(xùn)-推閉環(huán):
從模型能力到工程體系
模型能力只是第一步,真正決定產(chǎn)業(yè)化速度的是是否具備規(guī)?;瘡?fù)制能力。軟通天擎將 ArtisanBrain 2.0 作為“大腦”基礎(chǔ)模型,將 ArtisanBrain-X0 作為“小腦”執(zhí)行模塊,并集成至 ArtisanBrain Platform系統(tǒng),實(shí)現(xiàn)模型訓(xùn)練與部署閉環(huán)。
1采:高質(zhì)量數(shù)據(jù)資產(chǎn)體系
我們構(gòu)建“四維融合”采集策略:
? 視覺(jué)數(shù)據(jù)(RGB、深度、點(diǎn)云)
? 控制數(shù)據(jù)(關(guān)節(jié)角度、末端位姿、力矩)
? 環(huán)境信號(hào)
? 仿真合成數(shù)據(jù)
通過(guò)數(shù)據(jù)治理、版本管理、自動(dòng)清洗、智能標(biāo)注和合成,實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)資產(chǎn)化管理。數(shù)據(jù)不再是一次性消耗品,而是成為持續(xù)驅(qū)動(dòng)模型迭代的核心燃料。
2訓(xùn):自動(dòng)化訓(xùn)練與遷移學(xué)習(xí)
軟通天擎ArtisanBrain Training 子系統(tǒng)支持:
? 預(yù)訓(xùn)練
? 小樣本微調(diào)
? 遷移學(xué)習(xí)
? 多模型適配(支持 ArtisanBrain-X0、π0.5 等)
典型工業(yè)場(chǎng)景適配約 48 卡天即可完成訓(xùn)練與部署。通過(guò)自動(dòng)觸發(fā)訓(xùn)練與雙軌驗(yàn)證機(jī)制(離線驗(yàn)證+真機(jī)驗(yàn)證),確保模型“學(xué)得快、用得穩(wěn)”。
3推:跨芯片部署與實(shí)時(shí)控制
軟通天擎ArtisanBrain Infer 子系統(tǒng)支持:
? 云端部署
? 邊緣推理
? 本體側(cè)實(shí)時(shí)控制
? OTA 升級(jí)與生命周期監(jiān)控
實(shí)現(xiàn)模型從云端到真機(jī)環(huán)境的無(wú)縫遷移,這一能力使模型具備持續(xù)演進(jìn)能力。
工業(yè)柔性智造實(shí)踐:
從實(shí)驗(yàn)到產(chǎn)線
在工業(yè)場(chǎng)景中,基于軟通天擎Artisan一站式具身智能開(kāi)發(fā)平臺(tái),實(shí)現(xiàn)機(jī)器人視覺(jué)-語(yǔ)言-動(dòng)作(VLA)的閉環(huán)實(shí)踐。通過(guò)VR設(shè)備與機(jī)器人本體的協(xié)同,軟通天擎自主研發(fā)的天擎A2作業(yè)版機(jī)器人將進(jìn)行高精度的動(dòng)作捕捉與多模態(tài)數(shù)據(jù)采集,重點(diǎn)攻克顯卡、鼠標(biāo)等異形物料的分揀、抓取與裝箱放置等核心工序。采集到的海量原始數(shù)據(jù)通過(guò)數(shù)據(jù)平臺(tái)進(jìn)行清洗、標(biāo)注與合成,轉(zhuǎn)化為高質(zhì)量、標(biāo)準(zhǔn)化的工業(yè)場(chǎng)景數(shù)據(jù)集,再通過(guò)模型訓(xùn)練、推理驗(yàn)證,最終實(shí)現(xiàn)機(jī)器人全自主無(wú)人化作業(yè)。
具身智能的競(jìng)爭(zhēng),已經(jīng)從“模型參數(shù)規(guī)?!鞭D(zhuǎn)向“工程閉環(huán)能力”。從“看見(jiàn)”到“動(dòng)手”,軟通天擎正以 ArtisanBrain-X0 為核心,構(gòu)建真正可泛化、可部署、可持續(xù)進(jìn)化的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)閉環(huán)體系。具身智能的時(shí)代已經(jīng)開(kāi)啟,而我們正在推動(dòng)它加速到來(lái)。
-
人形機(jī)器人
+關(guān)注
關(guān)注
7文章
961瀏覽量
18485 -
軟通動(dòng)力
+關(guān)注
關(guān)注
1文章
1187瀏覽量
16474 -
具身智能
+關(guān)注
關(guān)注
0文章
383瀏覽量
854
原文標(biāo)題:從“看見(jiàn)”到“動(dòng)手”:軟通天擎具身智能人形機(jī)器人的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)閉環(huán)實(shí)踐
文章出處:【微信號(hào):isoftstone-group,微信公眾號(hào):軟通動(dòng)力】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于軟通天擎Artisan平臺(tái)實(shí)現(xiàn)機(jī)器人VLA閉環(huán)實(shí)踐
評(píng)論