chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

面壁小鋼炮模型MiniCPM4.0發(fā)布,端側智能更進一步

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-06-08 08:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網報道(文/李彎彎)2025年6月6日,面壁智能CEO李大海在北京智源大會上發(fā)布有史以來最具想象力的面壁小鋼炮模型MiniCPM4.0,代號“前進四”,開源兩個版本,8B閃電稀疏版和0.5B最強小小鋼炮。





李大海表示,面壁智能是第一個把全模態(tài)模型帶到端側的公司。面壁智能小鋼炮,旨在把大模型放到離用戶最近的地方,做高效的端側智能。

MiniCPM4.0最大的特點——快

2019年面壁智能超前入局大模型,發(fā)布世界首個知識增強大模型ERNE,2020年發(fā)布國內首個中文大模型CPM-1,2021年發(fā)布持續(xù)學習發(fā)模型CPM-2,2022年發(fā)布可控生成大模型CPM-3;2023年,面壁智能又發(fā)布CPM-Bee多語言百億大模型,之后還發(fā)布了第三代千億參數多模態(tài)大模型CPM-Cricket,評分超越GPT-3.5,邏輯能力比肩GPT-4。

2024年面壁智能領先走向端側智能。2月發(fā)布MiniCPM-2B旗艦級端側模型;4月發(fā)布MiniCPM 2.0;9月發(fā)布MiniCPM-V 2.6,在端側性能實現全面對標 GPT-4V;12月發(fā)布MiniCPM 3.0,在包括自然語言理解、知識、代碼、數學等多項能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能發(fā)布MiniCPM-o 2.6端側全模態(tài)模型,性能比肩GPT-4o;2025年3月發(fā)布cpmGO,首個純端側智能體助手。



李大海介紹,面壁智能端側大模型面壁小鋼炮包括基座模型MiniCPM、旗艦多模態(tài)模型MiniCPM-V、旗艦全模態(tài)模型MiniCPM-o。截至目前,面壁小鋼炮旗艦端側大模型有超過1000萬下載量。李大海表示:“這是千千萬萬開發(fā)者對我們的認可,未來還會持續(xù)發(fā)布更好的端側大模型,賦能智能硬件的創(chuàng)新和開發(fā)?!?br />


“這次發(fā)布的面壁小鋼炮模型MiniCPM4.0版本,最大的特點就是快?!崩畲蠛U劦?,“相比其他模型,MiniCPM4.0-8B僅22%訓練開銷,在同等參數下,性能更強,可對標Qwen3-8B,超越Gemma3-12B?!?br />
MiniCPM4-MCP支持15個主流應用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端側版表現比肩DeepResearch。



面壁小鋼炮正在進行廣泛的生態(tài)適配,適配主流芯片與開源框架部署,芯片如括華為、英特爾、聯發(fā)科、高通;開源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海強調,依托分塊稀疏注意力機制,MiniCPM4.0在英特爾平臺上推理深度優(yōu)化實現兩倍加速。

多維度技術創(chuàng)新——架構高效、推理高效

MiniCPM4.0之所以能夠做到又快又好,源于系統級層層效率優(yōu)化,包括四個層面:架構高效、推理高效、學習高效、數據高效。



架構高效方面,MiniCPM4.0采用InfLLM升級版InfLLM 2.0稀疏注意力結構。李大海介紹說,稀疏度越高,計算量越小,速度越快。傳統Transformer模型每token需和序列中所有token進行相關性計算逐字重復計算,效率低下。InfLLM 稀疏注意力機制,對文本分塊分區(qū)域處理,只對最具相關性重點區(qū)城進行注意力計算“抽查”,更高效。

而且MiniCPM4.0采用高效雙頻換擋,即長文本用稀疏,短文本用稠密。



推理高效方面,面壁智能自研全套端側高性能推理框架。CPM.cu自研極速端側推理框架,稀疏、投機和量化的高效結合,FR-Spec輕量化投機采樣,并給小模型減負加速,使得速度提升5倍;BitCPM極致低位寬量化,端側極致內存容量友好,4-bit量化達業(yè)界SOTA等級,瘦身90%;Arklnfer自研跨平臺部署框架,面向多平臺端側芯片極致優(yōu)化,跨平臺高效投機采樣和限制解碼,端側多平臺 ModelZoo絲滑使用,速度提升2倍。

李大海表示,與云端不同,云端多采用英偉達、昇騰的芯片,而端側較為復雜,這種跨平臺部署框架對于大模型端側部署來說就極為重要。在他看來,面壁智能新帶來的面壁小鋼炮模型MiniCPM4.0,在多項技術的加持下,使用更少的數據,需要更少的訓練、更少的算力,因而成本也會下降,這有助于大模型能在更多場景實現落地。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3658

    瀏覽量

    51804
  • 云模型
    +關注

    關注

    0

    文章

    10

    瀏覽量

    7120
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BlackBerry QNX與眾森軟件進一步深化戰(zhàn)略合作

    今日,深圳市眾森軟件有限公司(以下簡稱"眾森軟件")正式宣布與全球領先的實時操作系統與嵌入式軟件供應商 QNX(BlackBerry有限公司旗下部門QNX)進一步深化戰(zhàn)略合作。此次合作將進一步推動下
    的頭像 發(fā)表于 12-04 16:40 ?1720次閱讀

    上汽奧迪與創(chuàng)維汽車智能合作進一步深化升級

    近日,創(chuàng)維汽車智能迎來重要突破:上汽奧迪客戶將當前公司開發(fā)的顯示屏項目沿用至上汽奧迪其他主力車型。這決定不僅體現了客戶對創(chuàng)維汽車智能技術實力與服務品質的高度認可,更標志著雙方合作進一步
    的頭像 發(fā)表于 11-25 10:32 ?514次閱讀

    廣和通發(fā)布情感對話大模型FiboEmo-LLM

    9月,廣和通正式發(fā)布自主研發(fā)的情感對話大模型FiboEmo-LLM。該模型專注于情感計算與自然語言交互融合,致力于為AI玩具、
    的頭像 發(fā)表于 09-26 13:37 ?1630次閱讀

    蔚來進一步拓展其全球業(yè)務

    8月18日,蔚來公司宣布將于2025年至2026年期間陸續(xù)進入新加坡、烏茲別克斯坦和哥斯達黎加三個市場,進一步拓展其全球業(yè)務,為當地用戶帶來創(chuàng)新、可持續(xù)、高品質的智能電動出行體驗。
    的頭像 發(fā)表于 08-20 17:00 ?1161次閱讀

    模型迎來“輕”革命!移遠通信 × RWKV 打造“輕量AI大腦”

    (WAIC)首次亮相,標志著模型解決方案向更高性能、更廣場景的應用邁出關鍵一步。RWKV(ReceptanceWeightedKeyValue)是全球領先的RN
    的頭像 發(fā)表于 07-27 19:02 ?699次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側</b>大<b class='flag-5'>模型</b>迎來“輕”革命!移遠通信 × RWKV 打造“輕量AI大腦”

    Nordic PMIC全家桶,讓電源管理和節(jié)能更進一步!

    使用 nPM2100 開始設計和開發(fā)應用。此外,nPM2100 評估套件 (EK) 也已全面上市,多家分銷商在發(fā)布當天提供庫存套件并進行銷售。 nPM2100 是款電源管理集成電路 (PMIC),旨在
    發(fā)表于 06-29 17:19

    恩智浦技術賦能下代家庭能源管理系統

    2024年11月發(fā)布了Matter 1.4版本,其中大亮點是它極大地擴展了對家庭能源管理系統 (HEMS) 的支持。Matter 1.3引入了能源報告功能,實現大型家電和供電設備能源管理用例,而Matter 1.4則更進一步
    的頭像 發(fā)表于 06-10 09:34 ?1058次閱讀

    德賽西威與面壁智能發(fā)布模型語音交互方案

    日前,全球領先的移動出行科技公司德賽西威與模型技術領軍企業(yè)面壁智能共同發(fā)布業(yè)界首個基于高通
    的頭像 發(fā)表于 05-14 17:40 ?1058次閱讀

    中科創(chuàng)達與面壁智能達成戰(zhàn)略合作

    近日,全球領先的智能操作系統及智能產品和技術提供商中科創(chuàng)達(股票代碼:300496)與人工智能模型
    的頭像 發(fā)表于 04-29 10:43 ?1197次閱讀

    CoT 數據集如何讓大模型學會一步一步思考?

    目前,大模型的回答路徑基本遵循 input-output 的方式,在面對復雜任務時表現不佳。反之,人類會遵循套有條理的思維流程,逐步推理得出正確答案。這種差異促使人們深入思考:如何才能讓大模型
    的頭像 發(fā)表于 04-24 16:51 ?1103次閱讀
    CoT 數據集如何讓大<b class='flag-5'>模型</b>學會<b class='flag-5'>一步</b><b class='flag-5'>一步</b>思考?

    英特爾與面壁智能宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端原生智能座艙,定義下代車載AI

    今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達成戰(zhàn)略級合作伙伴關系,旨在打造端原生智能座艙,定義下代車載AI。目前,雙方已合作推出“英
    的頭像 發(fā)表于 04-23 21:46 ?966次閱讀
    英特爾與<b class='flag-5'>面壁</b><b class='flag-5'>智能</b>宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端<b class='flag-5'>側</b>原生<b class='flag-5'>智能</b>座艙,定義下<b class='flag-5'>一</b>代車載AI

    誠邁科技、智達誠遠隆重推出ArraymoAIOS 2.0 AI操作系統,開啟智能體協作新時代

    隨著生成式AI技術的日益成熟,目前大模型正在從云側向云協同遷移。2025年,AI進一步加速向終端下沉,AI大模型將直接部署在各類終端設備
    的頭像 發(fā)表于 04-22 17:31 ?1113次閱讀
    誠邁科技、智達誠遠隆重推出ArraymoAIOS 2.0 <b class='flag-5'>端</b><b class='flag-5'>側</b>AI操作系統,開啟<b class='flag-5'>智能</b>體協作新時代

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓AI模型接入得心應手

    AI巨頭強強聯手,勢必為智能體化AI體驗時代按下超級加速鍵。 AI終端的下一步是“普適智能”,而不是“極限性能”。聯發(fā)科憑借天璣9400+強悍的
    發(fā)表于 04-13 19:52

    運算放大器LM358的常見電路

    本文主要學習LM358的幾種外圍電路設計,希望能幫助大家更進一步的了解和使用LM358。
    的頭像 發(fā)表于 03-17 14:48 ?7911次閱讀

    廣和通CES 2025發(fā)布Fibocom AI Stack,賦能千行百業(yè)應用

    近日盛大舉行的國際消費電子產品展覽會(CES 2025)上,廣和通隆重發(fā)布了其創(chuàng)新的Fibocom AI Stack解決方案。這方案的發(fā)布,標志著廣和通在推動
    的頭像 發(fā)表于 01-08 15:18 ?1154次閱讀