chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

商湯科技正式開(kāi)源多模態(tài)自主推理模型SenseNova-MARS

商湯科技SenseTime ? 來(lái)源:商湯科技SenseTime ? 2026-01-30 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今日,商湯正式開(kāi)源多模態(tài)自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在多模態(tài)搜索與推理的核心基準(zhǔn)測(cè)試中以 69.74 分超越Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。

SenseNova-MARS是首個(gè)支持動(dòng)態(tài)視覺(jué)推理和圖文搜索深度融合的 Agentic VLM 模型,它能自己規(guī)劃步驟、調(diào)用工具,輕松搞定各種復(fù)雜任務(wù),讓AI真正具備“執(zhí)行能力”。

在 MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等基準(zhǔn)測(cè)試中,SenseNova-MARS取得開(kāi)源模型中的SOTA 成績(jī),還超越Gemini-3.0-Pro、GPT-5.2等頂級(jí)閉源模型,在搜索推理和視覺(jué)理解兩大核心領(lǐng)域全面領(lǐng)跑。更多細(xì)節(jié)請(qǐng)參見(jiàn)技術(shù)報(bào)告(https://arxiv.org/abs/2512.24330),歡迎開(kāi)發(fā)者、各行業(yè)用戶測(cè)試與體驗(yàn)。

全能冠軍,自主解決復(fù)雜問(wèn)題

SenseNova-MARS在多項(xiàng)多模態(tài)搜索評(píng)測(cè)中展現(xiàn)出明顯的領(lǐng)先優(yōu)勢(shì),平均得分達(dá)到 69.74 分,成功超過(guò)了 Gemini-3-Pro 的 69.06 分與 GPT-5.2 的 67.64 分。

0d8ae30c-fd24-11f0-92de-92fbcf53809c.png

在MMSearch 榜單(圖文搜索核心評(píng)測(cè))中,模型以 74.27 分登頂,超越GPT-5.2(66.08 分);HR-MMSearch(高清細(xì)節(jié)搜索評(píng)測(cè))中 54.43 分領(lǐng)先,顯著拉開(kāi)與閉源模型的差距。

0df07820-fd24-11f0-92de-92fbcf53809c.png

HR-MMSearch的測(cè)試題目堪稱“AI界的奧林匹克”:采用305張2025年最新的4K超高清圖片,確保AI無(wú)法依賴舊知識(shí)“作弊”;所有問(wèn)題都針對(duì)圖片中占比不到5%的細(xì)節(jié),比如小標(biāo)志、小字、微小物體,必須用圖像裁剪工具才能看清;覆蓋體育、娛樂(lè)文化、科學(xué)技術(shù)、商業(yè)金融、游戲、學(xué)術(shù)研究、地理旅行等八大領(lǐng)域,60%的問(wèn)題都需要至少使用三種工具才能解答。

簡(jiǎn)單說(shuō),無(wú)論是需要“查遍全網(wǎng)”的知識(shí)密集型任務(wù),還是需要“火眼金睛”的細(xì)粒度視覺(jué)分析,它都是當(dāng)前的“全能冠軍”。

用組合拳,解決真實(shí)場(chǎng)景問(wèn)題

SenseNova-MARS還能實(shí)實(shí)在在落地到我們生活和工作的場(chǎng)景,解決需要“多步驟推理+多工具協(xié)作”的問(wèn)題。

普通AI的工具調(diào)用,要么只能搜文字,要么只能看圖片,遇到需要“先放大細(xì)節(jié)、再識(shí)別物體、最后查背景”的復(fù)雜任務(wù)就束手無(wú)策。

面對(duì)識(shí)別賽車服微小logo +查詢公司成立年份+匹配車手出生年月+計(jì)算差值’的復(fù)雜任務(wù),SenseNova-MARS可自主調(diào)用圖像裁剪、文本/圖像搜索工具,無(wú)需人工干預(yù)完成閉環(huán)解答。

SenseNova-MARS能從產(chǎn)品和行業(yè)峰會(huì)的照片中,識(shí)別企業(yè)的標(biāo)志,快速搜集產(chǎn)品、企業(yè)的信息,以及時(shí)間、數(shù)量、參數(shù)等細(xì)節(jié)要素,輔助分析行業(yè)情況和格局。

SenseNova-MARS能從賽事照片中識(shí)別畫(huà)面中的logo、人物等信息,追溯比賽或人員背景信息,幫助快速補(bǔ)充重要細(xì)節(jié)。

SenseNova-MARS甚至能夠輕松處理,這類超長(zhǎng)步驟的多模態(tài)推理,和超過(guò)三種工具調(diào)用,自動(dòng)裁剪分析細(xì)節(jié)、搜索相關(guān)研究數(shù)據(jù),快速驗(yàn)證假設(shè),得出關(guān)鍵判斷。

擁有這種“自主思考+多工具協(xié)作”的能力,SenseNova-MARS能夠自動(dòng)解決“細(xì)節(jié)識(shí)別 + 信息檢索 + 邏輯推理”復(fù)雜任務(wù),幫助實(shí)現(xiàn)工作效率提升。

圖像裁剪:能精準(zhǔn)聚焦圖片上的微小細(xì)節(jié),哪怕是占比不到5%的細(xì)節(jié)——比如賽車手衣服上的微小logo、賽事照片里觀眾席的標(biāo)語(yǔ),都可通過(guò)裁剪放大清晰分析。

圖像搜索:能在看到物體、人物或場(chǎng)景,的瞬間自動(dòng)匹配相關(guān)信息——比如識(shí)別出賽車手的身份,或是某款冷門(mén)設(shè)備的型號(hào)。

文本搜索:能快速抓取精準(zhǔn)信息——無(wú)論是公司成立年份、人物出生年月,還是最新的行業(yè)數(shù)據(jù),都能秒級(jí)獲取。

從練中學(xué),形成“經(jīng)驗(yàn)”和“直覺(jué)”

SenseNova-MARS采用了“因材施教”的訓(xùn)練方法。

第一階段:打基礎(chǔ)。針對(duì)跨模態(tài)多跳搜索推理訓(xùn)練數(shù)據(jù)稀缺的痛點(diǎn),創(chuàng)新性的提出了基于多模智能體的自動(dòng)化數(shù)據(jù)合成引擎,采用細(xì)粒度視覺(jué)錨點(diǎn)+ 多跳深度關(guān)聯(lián)檢索的機(jī)制,動(dòng)態(tài)挖掘并關(guān)聯(lián)跨網(wǎng)頁(yè)實(shí)體的邏輯,自動(dòng)化構(gòu)建高復(fù)雜度的多跳推理鏈路,同時(shí)引入閉環(huán)自洽性校驗(yàn)來(lái)去除幻覺(jué)數(shù)據(jù),構(gòu)造出具備嚴(yán)密邏輯鏈條與高知識(shí)密度的多跳搜索問(wèn)答數(shù)據(jù)。用精心篩選的“高難度案例”做教材,每個(gè)案例都標(biāo)注了“該用什么工具、步驟是什么”,讓AI先學(xué)會(huì)基本的“破案邏輯”。這些案例都是從海量數(shù)據(jù)中挑出的“硬骨頭”,確保AI一開(kāi)始就接觸真實(shí)復(fù)雜場(chǎng)景。

第二階段:練實(shí)戰(zhàn)。采用“強(qiáng)化學(xué)習(xí)”——就像偵探在一次次破案中積累經(jīng)驗(yàn),AI每做對(duì)一次決策(比如選對(duì)工具、步驟合理)就會(huì)獲得獎(jiǎng)勵(lì),做錯(cuò)了就調(diào)整策略。為了避免AI“學(xué)偏”,研究團(tuán)隊(duì)還加了個(gè)“穩(wěn)定器”——BN-GSPO算法,讓它在處理簡(jiǎn)單題和復(fù)雜題時(shí)都能保持穩(wěn)定進(jìn)步,不會(huì)出現(xiàn)“偏科”。 這種基于雙階段歸一化的優(yōu)雅機(jī)制有效平滑了動(dòng)態(tài)工具調(diào)用返回分布多樣性帶來(lái)的優(yōu)化波動(dòng)并確保了學(xué)習(xí)信號(hào)分布的一致性,從而成功解決了跨模態(tài)多步多工具智能體訓(xùn)練過(guò)程中的收斂性難題。

經(jīng)過(guò)這樣的訓(xùn)練,AI不僅學(xué)會(huì)了用工具,更培養(yǎng)"工具使用直覺(jué)"——知道在什么情況下應(yīng)該使用哪些工具,以及如何將不同工具的結(jié)果有機(jī)結(jié)合起來(lái)。

模型、代碼、數(shù)據(jù)全開(kāi)源

商湯日日新SenseNova-MARS模型、代碼、數(shù)據(jù)集全開(kāi)源,支持 Hugging Face 直接下載。

Github 倉(cāng)庫(kù):

https://github.com/OpenSenseNova/SenseNova-MARS

模型倉(cāng)庫(kù):

32B:

https://huggingface.co/sensenova/SenseNova-MARS-32B

8B:

https://huggingface.co/sensenova/SenseNova-MARS-8B

技術(shù)報(bào)告點(diǎn)擊“閱讀原文”

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    4182

    瀏覽量

    46034
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3740

    瀏覽量

    52068
  • 商湯科技
    +關(guān)注

    關(guān)注

    8

    文章

    608

    瀏覽量

    37532

原文標(biāo)題:商湯開(kāi)源SenseNova-MARS:突破多模態(tài)搜索推理天花板

文章出處:【微信號(hào):SenseTime2017,微信公眾號(hào):商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    商湯技正開(kāi)源空間智能模型日日新SenseNova-SI-1.3

    商湯技正開(kāi)源空間智能模型日日新SenseNova-SI-1.3,在空間測(cè)量、視角轉(zhuǎn)換、綜合推理
    的頭像 發(fā)表于 02-10 14:12 ?269次閱讀
    <b class='flag-5'>商湯</b>科<b class='flag-5'>技正</b>式<b class='flag-5'>開(kāi)源</b>空間智能<b class='flag-5'>模型</b>日日新<b class='flag-5'>SenseNova</b>-SI-1.3

    商湯開(kāi)源SenseNova-MARS:突破模態(tài)搜索推理天花板

    今日,商湯正式開(kāi)源模態(tài)自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在
    的頭像 發(fā)表于 01-29 23:53 ?143次閱讀
    <b class='flag-5'>商湯</b><b class='flag-5'>開(kāi)源</b><b class='flag-5'>SenseNova-MARS</b>:突破<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>搜索<b class='flag-5'>推理</b>天花板

    阿里巴巴發(fā)布通義千問(wèn)旗艦推理模型Qwen3-Max-Thinking

    今天,我們正式發(fā)布千問(wèn)旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項(xiàng)權(quán)威評(píng)測(cè)全球新紀(jì)錄。
    的頭像 發(fā)表于 01-27 15:47 ?323次閱讀
    阿里巴巴發(fā)布通義千問(wèn)旗艦<b class='flag-5'>推理模型</b>Qwen3-Max-Thinking

    LLM推理模型是如何推理的?

    這篇文章《(How)DoReasoningModelsReason?》對(duì)當(dāng)前大型推理模型(LRM)進(jìn)行了深刻的剖析,超越了表面的性能宣傳,直指其技術(shù)本質(zhì)和核心局限。以下是基于原文的詳細(xì)技術(shù)原理、關(guān)鍵
    的頭像 發(fā)表于 01-19 15:33 ?433次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    商湯科技日日新V6.5榮獲2025年模態(tài)模型全國(guó)第一

    近日,權(quán)威大模型評(píng)測(cè)基準(zhǔn) SuperCLUE 發(fā)布《中文模態(tài)視覺(jué)語(yǔ)言模型測(cè)評(píng)基準(zhǔn)12月報(bào)告》,商湯日日新V6.5(
    的頭像 發(fā)表于 01-06 14:44 ?563次閱讀
    <b class='flag-5'>商湯</b>科技日日新V6.5榮獲2025年<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>全國(guó)第一

    模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)的應(yīng)用與未來(lái)發(fā)展

    ? ? 模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng) ? ?北京華盛恒輝模態(tài)感知大
    的頭像 發(fā)表于 12-29 11:27 ?281次閱讀

    商湯技正式發(fā)布并開(kāi)源全新模態(tài)模型架構(gòu)NEO

    商湯技正式發(fā)布并開(kāi)源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新模態(tài)模型架構(gòu) —— NEO,為日
    的頭像 發(fā)表于 12-08 11:19 ?998次閱讀
    <b class='flag-5'>商湯</b>科<b class='flag-5'>技正</b>式發(fā)布并<b class='flag-5'>開(kāi)源</b>全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b>架構(gòu)NEO

    商湯日日新V6.5模態(tài)模型登頂全球權(quán)威榜單

    根據(jù)權(quán)威評(píng)測(cè)平臺(tái)OpenCompass模態(tài)模型學(xué)術(shù)榜單(Multi-modal Academic Leaderboard)最新數(shù)據(jù)顯示,商湯「日日新 V6.5」(
    的頭像 發(fā)表于 09-10 09:55 ?770次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1755次閱讀
    NVIDIA Nemotron Nano 2<b class='flag-5'>推理模型</b>發(fā)布

    澎峰科技完成OpenAI最新開(kāi)源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開(kāi)源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機(jī)上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企業(yè)級(jí) AI 生產(chǎn)力!
    的頭像 發(fā)表于 08-14 11:34 ?1389次閱讀

    商湯科技模態(tài)通用智能戰(zhàn)略思考

    時(shí)間是最好的試金石,AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí),商湯早已錨定“模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路徑。
    的頭像 發(fā)表于 08-14 09:33 ?1166次閱讀

    利用NVIDIA推理模型構(gòu)建AI智能體

    開(kāi)放式推理模型能夠更快、更廣泛地進(jìn)行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機(jī)器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。
    的頭像 發(fā)表于 08-13 14:32 ?1569次閱讀
    利用NVIDIA<b class='flag-5'>推理模型</b>構(gòu)建AI智能體

    商湯日日新SenseNova融合模態(tài)模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)完成可信AI模態(tài)模型首輪評(píng)估。 商湯日日新SenseNova融合
    的頭像 發(fā)表于 06-11 11:57 ?1383次閱讀

    商湯科技日日新大模型SenseNova上線聲網(wǎng)云市場(chǎng)

    日前,商湯科技日日新大模型SenseNova即將正式上線聲網(wǎng)云市場(chǎng),開(kāi)發(fā)者和企業(yè)用戶可通過(guò)聲網(wǎng)的實(shí)時(shí)互動(dòng)云服務(wù)進(jìn)行調(diào)用,將商湯領(lǐng)先的模型能力
    的頭像 發(fā)表于 04-08 17:24 ?1475次閱讀

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進(jìn)展,特別是自DeepSeekR1發(fā)布后興起的推理時(shí)間計(jì)算擴(kuò)展相關(guān)內(nèi)容。在LLM中實(shí)施和改進(jìn)推理簡(jiǎn)單來(lái)說(shuō),基于LLM的推理模型是一種旨在通過(guò)生成中間
    的頭像 發(fā)表于 04-03 12:09 ?1579次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀