chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

0.7元/百萬(wàn)token碾壓競(jìng)品! 小米新開(kāi)源大模型,卷出AI普惠關(guān)鍵密碼

章鷹觀察 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:章鷹 ? 2025-12-21 07:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(電子發(fā)燒友網(wǎng)報(bào)道 文/ 章鷹)12月17日,2025小米人車(chē)家全生態(tài)合作伙伴大會(huì)舉行,小米MiMo大模型負(fù)責(zé)人羅福莉首次登場(chǎng),她解讀小米最新開(kāi)源大模型MiMo-V2-Flash,拋出“全球開(kāi)源模型Top2”“推理成本僅為標(biāo)桿模型2.5%”等重磅信息。

wKgZO2lFIKmAfaFdAAa2E25RUaY801.png

截至2025年12月19日,小米發(fā)布的 MiMo-V2-Flash、深度求索(DeepSeek)的 DeepSeek-V3.2,以及阿里巴巴的 Qwen-3均為當(dāng)前國(guó)產(chǎn)大模型中的代表性產(chǎn)品。在與DeepSeek V3.2、千問(wèn)Qwen-3對(duì)比當(dāng)中,小米開(kāi)源大模型到底有哪些優(yōu)勢(shì)和應(yīng)用價(jià)值?本文進(jìn)行詳細(xì)分析。

全球開(kāi)源模型Top2,主打超絕性價(jià)比

MiMo-V2-Flash是小米全新一代面向Agent的基座模型,總參數(shù)309B,激活參數(shù)15B,支持256k上下文窗口,整體針對(duì)推理、編碼和Agent場(chǎng)景構(gòu)建,支持混合思維模式,允許用戶切換“思考”和即時(shí)回答模式。

目前,MiMo-V2-Flash推理吞吐速度為每秒150個(gè)token,成本定價(jià)0.7元/每百萬(wàn)輸入token,2.1元/每百萬(wàn)輸出token,主打超絕性價(jià)比。

在架構(gòu)設(shè)計(jì)上,小米MiMo-V2-Flash采用了混合注意力機(jī)制。其混合模塊設(shè)計(jì)包含8個(gè)混合塊,其中每5個(gè)滑動(dòng)窗口注意力(SWA)層對(duì)應(yīng)1個(gè)全局注意力層。在上下文支持能力上,該模型原生支持32K的訓(xùn)練,并且能夠擴(kuò)展到256K的上下文支持。

從性能表現(xiàn)來(lái)看,小米MiMo-V2-Flash在通用基準(zhǔn)測(cè)試中,與DeepSeek-V3.2不相上下,同時(shí)延遲大幅降低。在SWE-Bench驗(yàn)證和多語(yǔ)言集中分別取得了73.4%和71.7%的成績(jī)。尤為突出的是其速度優(yōu)勢(shì),在Day-0時(shí),輸出速度高達(dá)每秒150個(gè)token,這一速度在同類模型中處于領(lǐng)先地位。

圖來(lái)自小米官方微信

在多個(gè)Agent測(cè)評(píng)基準(zhǔn)上,MiMo-V2-Flash進(jìn)入全球開(kāi)源模型Top 2;編碼能力超過(guò)所有開(kāi)源模型,比肩標(biāo)桿閉源模型Claude 4.5 Sonnet,但推理成本僅為其2.5%,生成速度提升2倍。

小米MiMo-V2-Flash推理效率高,來(lái)源兩大創(chuàng)新

羅福莉指出,我們要圍繞極致的推理效率去重新設(shè)計(jì)模型結(jié)構(gòu)。模型結(jié)構(gòu)主要源自兩大創(chuàng)新:一、模型注意力機(jī)制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑動(dòng)窗口注意力機(jī)制),其中SWA與Full Attention(全局注意力機(jī)制)的比例是5:1,滑動(dòng)窗口只看 128 個(gè) token。相較于一些復(fù)雜的Linear Attention(線性注意力機(jī)制),SWA在兼顧長(zhǎng)短文的推理、知識(shí)檢索等方面更勝一籌。

二是在于MTP(Multi-Token Prediction)。羅福莉表示,團(tuán)隊(duì)在訓(xùn)練時(shí)加入了一層MTP層以提高基座模型能力,并在微調(diào)時(shí)也加入了更多MTP層,最終在推理時(shí)加入了3層MTP,以加速并行token驗(yàn)證的方式實(shí)現(xiàn)了2-2.6倍推理速度的提升。

還有,為了提高強(qiáng)化學(xué)習(xí)訓(xùn)練的穩(wěn)定性,MiMo團(tuán)隊(duì)提出了一種叫做Multi-Teacher On-Policy Distillation(MOPD)的后訓(xùn)練范式。相較于傳統(tǒng)SFT+RL(微調(diào)+強(qiáng)化學(xué)習(xí))的后訓(xùn)練方式,它可以提供稠密的token level監(jiān)督學(xué)習(xí)信號(hào),以簡(jiǎn)單快速的方式獲得各個(gè)專家模型的能力。

此外,小米并推出線上AI聊天服務(wù)“Xiaomi MiMO Studio”,用戶可在其中體驗(yàn)“MiMo-V2-Flash”。

羅福莉在社交平臺(tái)上透露了更多信息,MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖上的第二步。

小米發(fā)布MiMo-V2-Flash,不僅僅是一次大模型領(lǐng)域的技術(shù)創(chuàng)新,更是其“人車(chē)家全生態(tài)”戰(zhàn)略的關(guān)鍵支點(diǎn)。該模型通過(guò)多項(xiàng)架構(gòu)創(chuàng)新與成本優(yōu)化,為 AI智能體(AI Agent)在終端設(shè)備上的落地提供了前所未有的賦能能力。

我們認(rèn)為,MiMo-V2-Flash 不只是“一個(gè)更快的大模型”,而是小米打造 “終端原生智能體操作系統(tǒng)” 的基石。它有機(jī)會(huì)讓每一臺(tái)小米設(shè)備都可能成為一個(gè) 有記憶、會(huì)思考、能行動(dòng)的智能體節(jié)點(diǎn),最終助力實(shí)現(xiàn)雷軍所說(shuō)的“AI for All Devices, All the Time”。

本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。微信號(hào)zy1052625525。需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱zhangying@huaqiu.com。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 小米
    +關(guān)注

    關(guān)注

    70

    文章

    14515

    瀏覽量

    151313
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    今日看點(diǎn):小米正式發(fā)布并開(kāi)源模型 MiMo-V2-Flash;磷酸鐵鋰開(kāi)啟漲價(jià)潮

    小米正式發(fā)布并開(kāi)源模型 MiMo-V2-Flash 近日小米正式發(fā)布并開(kāi)源模型 MiMo-V
    的頭像 發(fā)表于 12-17 09:42 ?1742次閱讀

    NVIDIA推出面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源AI技術(shù)

    NVIDIA 秉持對(duì)開(kāi)源的長(zhǎng)期承諾,推出了面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源 AI 技術(shù),為構(gòu)建開(kāi)源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展 AI 的普及并推
    的頭像 發(fā)表于 11-06 11:49 ?785次閱讀

    澎峰科技完成OpenAI最新開(kāi)源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開(kāi)源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機(jī)上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企業(yè)級(jí) A
    的頭像 發(fā)表于 08-14 11:34 ?1189次閱讀

    Arm率先適配騰訊混開(kāi)源模型,助力端側(cè)AI創(chuàng)新開(kāi)發(fā)

    本周初,騰訊混宣布開(kāi)源四款小尺寸模型(參數(shù)分別為 0.5B、1.8B、4B、7B),可無(wú)縫運(yùn)行于消費(fèi)級(jí)顯卡上。作為全球應(yīng)用范圍最為廣泛的計(jì)算平臺(tái),Arm 在開(kāi)源首日就已率先實(shí)現(xiàn)適配,
    的頭像 發(fā)表于 08-08 09:16 ?1186次閱讀
    Arm率先適配騰訊混<b class='flag-5'>元</b><b class='flag-5'>開(kāi)源</b><b class='flag-5'>模型</b>,助力端側(cè)<b class='flag-5'>AI</b>創(chuàng)<b class='flag-5'>新開(kāi)</b>發(fā)

    中興通訊加速算力AI應(yīng)用普及

    網(wǎng)絡(luò)連接和智能算力的領(lǐng)導(dǎo)者” 的戰(zhàn)略愿景,全面投入AI,加速AI和ICT的融合,以AI技術(shù)賦能實(shí)體經(jīng)濟(jì),加速算力
    的頭像 發(fā)表于 05-06 14:10 ?792次閱讀

    華為助力醫(yī)療行業(yè)智慧化轉(zhuǎn)型

    當(dāng)今世界,全球AI模型數(shù)量高速增長(zhǎng),隨著DeepSeek工程技術(shù)創(chuàng)新帶來(lái)的效率大幅提升,訓(xùn)練成本下降至1/10,每百萬(wàn)token單價(jià)降幅超過(guò)99%,同時(shí)大
    的頭像 發(fā)表于 04-28 10:07 ?751次閱讀
    華為助力醫(yī)療行業(yè)智慧化轉(zhuǎn)型

    迅龍軟件參加開(kāi)源中國(guó)《數(shù)智漫談》,探討AI如何邁進(jìn)大模型時(shí)代

    當(dāng)前,人工智能技術(shù)正加速向大模型時(shí)代邁進(jìn),在政務(wù)、金融、醫(yī)療、工業(yè)等領(lǐng)域展現(xiàn)出顛覆性潛力。然而,大模型的訓(xùn)練與部署面臨算力成本高、技術(shù)生態(tài)依賴性強(qiáng)、行業(yè)落地門(mén)檻高三大挑戰(zhàn)。為加速技術(shù)
    的頭像 發(fā)表于 04-24 15:08 ?658次閱讀
    迅龍軟件參加<b class='flag-5'>開(kāi)源</b>中國(guó)《數(shù)智漫談》,探討<b class='flag-5'>AI</b>如何邁進(jìn)大<b class='flag-5'>模型</b>時(shí)代

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn),從通用模型向場(chǎng)景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無(wú)界”為主題召開(kāi)天璣開(kāi)發(fā)者大會(huì)2025(MDDC 2025),不僅聚合了全球生態(tài)
    發(fā)表于 04-13 19:52

    聯(lián)想集團(tuán)領(lǐng)跑AI新時(shí)代

    近日,以“混合式AI 創(chuàng)新向未來(lái)”為主題的聯(lián)想集團(tuán)2025/26財(cái)年誓師大會(huì)在北京國(guó)家網(wǎng)球中心舉行。大會(huì)現(xiàn)場(chǎng),聯(lián)想集團(tuán)執(zhí)行副總裁兼中國(guó)區(qū)總裁劉軍發(fā)表《人智共創(chuàng) 領(lǐng)跑AI新時(shí)代》主題
    的頭像 發(fā)表于 04-02 16:14 ?769次閱讀

    華為全光網(wǎng)加速AI千行萬(wàn)業(yè)

    近日,在“華為中國(guó)合作伙伴大會(huì)2025”期間,華為光產(chǎn)品線總裁陳幫華發(fā)表了“無(wú)光不AI,全光網(wǎng)加速AI千行萬(wàn)業(yè)”主題演講。他表示,各行各業(yè)都在積極擁抱
    的頭像 發(fā)表于 04-01 15:32 ?880次閱讀

    AI開(kāi)源模型庫(kù)有什么用

    AI開(kāi)源模型庫(kù)作為推動(dòng)AI技術(shù)發(fā)展的重要力量,正深刻改變著我們的生產(chǎn)生活方式。接下來(lái),AI部落小編帶您了解
    的頭像 發(fā)表于 02-24 11:50 ?946次閱讀

    科技云報(bào)到:科技潮流漸起,“開(kāi)源”將帶我們走向何方?

    科技云報(bào)到:科技潮流漸起,“開(kāi)源”將帶我們走向何方?
    的頭像 發(fā)表于 02-17 12:34 ?474次閱讀

    DeepSeek大模型攜手廣和通,加速AI化進(jìn)程

    近期,國(guó)產(chǎn)大模型DeepSeek憑借其開(kāi)放性、低訓(xùn)練成本以及端側(cè)部署的顯著優(yōu)勢(shì),迅速嶄露頭角,成為增速最為迅猛的AI應(yīng)用之一。這一突破性進(jìn)展,為AI技術(shù)的
    的頭像 發(fā)表于 02-11 14:47 ?1333次閱讀

    DeepSeek R1在壁仞科技AI算力平臺(tái)發(fā)布

    DeepSeek開(kāi)源模型的推出,不僅為AI技術(shù)的普及和應(yīng)用提供了強(qiáng)有力的支持,也開(kāi)啟了行業(yè)創(chuàng)新與變革的新篇章。憑借其開(kāi)放性、高效性和易用性,DeepSeek開(kāi)源
    的頭像 發(fā)表于 02-06 09:10 ?1606次閱讀

    模型進(jìn)化論:AI產(chǎn)業(yè)落地將向何方?

    模型進(jìn)化論:AI產(chǎn)業(yè)落地將向何方?
    的頭像 發(fā)表于 01-24 09:28 ?521次閱讀