今天,科大訊飛正式發(fā)布基于全國產(chǎn)算力訓練的星火X2大模型。
從X1.5到X2,升級有兩大亮點:
通用能力全面升級,星火X2整體能力對標國際頂尖模型水平,在數(shù)學、推理、語言理解、智能體等能力上媲美國際最優(yōu);130+多語言綜合能力繼續(xù)提升,拉美、東盟等地區(qū)重點語種效果保持業(yè)界領先水平。
依托星火X2的算法突破、行業(yè)高質(zhì)量數(shù)據(jù)集以及專業(yè)思維鏈的強化學習,星火行業(yè)大模型持續(xù)升級,產(chǎn)品應用方案取得顯著進步。
這次面向關鍵行業(yè)落地的實用化升級,標志著我國基于全國產(chǎn)算力訓練的大模型底座在算法和工程創(chuàng)新方面邁入新階段。星火X2在實現(xiàn)通用能力全面升級的同時,更加專注于教育、醫(yī)療、汽車、智能體等高專業(yè)性、高體驗性場景,致力于為這些領域提供領先、可靠的技術(shù)方案與支撐。
賦能醫(yī)療,專業(yè)能力持續(xù)提升并保持業(yè)界領先,個人健康助手各項能力在業(yè)界率先通過權(quán)威評測驗證,“訊飛曉醫(yī)”APP全面升級;
賦能教育,步驟級批改、錯因定位等技術(shù)進一步擴大全球領先優(yōu)勢,業(yè)界首發(fā)錯因貫穿的個性化學習能力,讓啟發(fā)式講解更契合學生思路,推動AI學習機等產(chǎn)品實現(xiàn)更精準的自主學習閉環(huán),進一步提升孩子學習興趣與學習效率;
面向汽車智能座艙的星火中小尺寸模型同步升級,智能交互實車評測行業(yè)全面領先,模糊意圖效果從完全不可用達到基本好用,讓汽車像老朋友聊天一樣精準聽懂你的“潛臺詞”;
星辰Agent平臺全新升級,進一步強化了“會思考能執(zhí)行”的精品智能體構(gòu)建能力。智能體數(shù)量已經(jīng)超過130萬,作為企業(yè)級智能體平臺,在復雜行業(yè)場景任務上進一步解決用戶關鍵剛需。
即日起,星火X2的最新能力可直接在訊飛星火網(wǎng)頁版和APP體驗,全新API也已上線訊飛開放平臺,持續(xù)解放生產(chǎn)力;星火APP5.2.0新版本同步上線,進一步強化了更懂你的AI助手,歡迎大家來體驗。
此次星火X2通用能力全面升級,整體能力對標國際頂尖模型水平,在數(shù)學、推理、語言理解、智能體等能力上媲美國際最優(yōu);同時,星火X2的130+多語言綜合能力繼續(xù)提升,拉美、東盟等地區(qū)重點語種效果保持業(yè)界領先水平,為跨語言教育、醫(yī)療與產(chǎn)業(yè)應用提供可靠支撐。
星火X2通過量化單臺昇騰服務器即可運行。星火X2采用293B MoE稀疏架構(gòu),結(jié)合權(quán)重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信等多種工程化創(chuàng)新,實現(xiàn)了國產(chǎn)大EP并行部署,推理性能相比X1.5提升50%。
星火大模型多尺寸中小模型同步升級,在辦公本、翻譯機、汽車座艙交互等場景的核心效果顯著提升。
通用大模型核心能力效果對比
外部公開高難任務效果對比
*測試集合來源:基礎能力測試集(滾動刷新),來自海量真實大模型請求任務脫敏數(shù)據(jù),包括訊飛星火APP、API真實開發(fā)者場景、以及教育、醫(yī)療等行業(yè)核心任務。公開測試集以數(shù)學、答題、推理、代碼、智能體等外部典型Benchmarks為主。
還是用一道題來試試效果
這是2025年11月哈佛-麻省理工數(shù)學錦標賽(HMMT)里的一道英文題目,難倒國內(nèi)主流模型,但星火X2在分析思考后,不僅給出了正確答案,還給出了詳盡的解題過程。
再來看看星火X2能不能解答西班牙語數(shù)學題
依舊是快速給出詳細解題過程以及正確答案
星火X2能力的顯著升級離不開技術(shù)的持續(xù)創(chuàng)新突破,典型工作包括:
訓推采樣校準強化學習算法
針對MoE大模型RL訓練中的訓推分布不一致問題,提出訓練與推理概率重采樣自適應校準算法,大幅提升強化學習訓練準確率和穩(wěn)定性。
遞歸式高難數(shù)據(jù)合成方法
針對高難任務數(shù)據(jù)稀缺問題,設計多輪迭代式推導的數(shù)據(jù)合成方案,實現(xiàn)推理錯誤逐步糾正與收斂,持續(xù)構(gòu)建稀缺型高質(zhì)量數(shù)據(jù),提升模型深度推理準確率。
多階段RL高吞吐采樣方法
設計P/D(Prefill/Decoder)兩階段分離的多階段推理采樣方案,解決國產(chǎn)化平臺強化學習高吞吐采樣情況下的效率干擾問題,訓練效率提升10%。
服務高性能部署優(yōu)化算法
通過模型輕量化壓縮,完成國產(chǎn)機器的單機大EP并行部署,推理性能相比星火X1.5提升50%,實現(xiàn)大模型在國產(chǎn)平臺的輕量化落地與高效推理雙重突破。
實用性是檢驗大模型能力的硬標準。依托星火X2的算法突破、行業(yè)高質(zhì)量數(shù)據(jù)集以及專業(yè)思維鏈的強化學習,星火行業(yè)大模型持續(xù)升級,在教育、醫(yī)療、司法、汽車交互、企業(yè)智能體應用等關鍵場景表現(xiàn)一新,在功能和效果層面實現(xiàn)全面升級,“更懂你的AI”再進一步。
賦能醫(yī)療
各項能力持續(xù)保持顯著領先
星火X2底座賦能醫(yī)療,助力星火醫(yī)療大模型核心能力全面提升并持續(xù)保持業(yè)界領先?;诰用窠】禉n案的智能健康分析、智能報告解讀、運動飲食建議、輔助診療、智能用藥審核等關鍵任務上,模型能力均顯著超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。
*測試集合來源:按照《醫(yī)療健康行業(yè)大模型應用技術(shù)要求》,基于脫敏真實用戶數(shù)據(jù)及居民健康檔案,構(gòu)建全新測試集合MedLLM-EHR-EVAL-V2。
星火醫(yī)療大模型圍繞個人健康助手的各項能力已率先通過上海市醫(yī)療大模型應用檢測驗證中心評測驗證。(備注:上海市醫(yī)療大模型應用檢測驗證中心為國內(nèi)首個面向醫(yī)療大模型應用評測和驗證的平臺,由上海AI實驗室牽頭打造,華山醫(yī)院、中山醫(yī)院、瑞金醫(yī)院等12所醫(yī)療機構(gòu)成為中心首批驗證單位。)
在此基礎上,“訊飛曉醫(yī)”APP各項能力全面升級,多輪主動問診、多輪咨詢問答、問用藥、檢查檢驗單解讀、體檢報告單解讀等健康咨詢?nèi)蝿赵跇I(yè)界持續(xù)保持顯著領先。
*測試集合來源:測試集合基于線上個人健康咨詢的真實場景脫敏數(shù)據(jù)隨機抽樣。
以檢查檢驗單解讀為例,來看看“訊飛曉醫(yī)”APP是如何做的
另外,訊飛曉醫(yī)的語音交互對話能力也是本次升級的一個重要特色,歡迎大家體驗。
面向用戶的健康剛需,訊飛曉醫(yī)因為更專業(yè)所以更讓人放心
賦能教育
率先實現(xiàn)錯因貫穿個性化學習能力
新版本的星火X2底座全面賦能教育,步驟級批改、錯因定位等技術(shù)進一步擴大全球領先優(yōu)勢。結(jié)合領先的多學科答題及推理能力,業(yè)界率先發(fā)布錯因貫穿的個性化學習能力。數(shù)學步驟級批改效果進一步提升,同時支持更精準的錯因定位,在答疑上實現(xiàn)契合學生本人思路的啟發(fā)式講解,相關技術(shù)持續(xù)保持業(yè)界領先,并推動應用成效顯著提升。
*測試集合來源:測試集合基于備授課、考試、作業(yè)、學習等真實場景脫敏數(shù)據(jù)隨機抽樣。
面向?qū)W生自主學習場景,科大訊飛AI學習機在1對1精準學、答疑輔導和互動課等效果持續(xù)提升。依托更精準的步驟級批改能力,診斷精準率、規(guī)劃合理率和輔學啟發(fā)性效果領先行業(yè),實現(xiàn)個性化、啟發(fā)式、規(guī)劃性教學,進一步提升孩子學習興趣與學習效率。
賦能汽車
智能座艙交互系統(tǒng)全面升級
基于星火X2升級,在汽車領域,2B、7B、30B-A3等多尺寸中小模型同步升級,助力汽車智能座艙交互系統(tǒng)全面提升,在人人/人機對話判斷、模糊意圖理解、高情商回復等方面交互體驗顯著提升。特別是模糊意圖交互效果實現(xiàn)跨越式突破,從完全不可用提升至基本好用水平,實車評測業(yè)內(nèi)全面領先,結(jié)合星火多模態(tài)大模型感知理解能力,真正實現(xiàn)座艙內(nèi)自由、自然的人機交互體驗。
星辰Agent平臺和精品智能體
效果全新升級
星火X2的智能體能力,在長時復雜任務規(guī)劃、多工具組合調(diào)用以及長上下文等方面均實現(xiàn)了顯著提升。
星辰Agent平臺全新升級,進一步強化了“會思考能執(zhí)行”的精品智能體構(gòu)建能力。當前智能體數(shù)量已經(jīng)超過130萬,作為企業(yè)級智能體平臺,已整合語音交互、語音識別、圖像理解等百余種精品開放平臺能力,豐富企業(yè)級場景應用工具生態(tài),支撐快速構(gòu)建企業(yè)場景中的更復雜、更實用的精品智能體。
面向企業(yè)采購場景的招采智能體,在招標文件合規(guī)檢測、供應商資質(zhì)核驗、投標異常行為檢測等核心場景,效率提升超3倍。同時,支持企業(yè)像搭積木一樣極速定制專屬招采專家,專用智能體開發(fā)從原來的幾天壓縮至分鐘級,助力企業(yè)精準風控、高效降本。
面向行業(yè)深度分析的星火行業(yè)大師產(chǎn)品,針對能源、農(nóng)糧等行業(yè)的專業(yè)商情分析領域進行深度融合,結(jié)合產(chǎn)業(yè)圖譜推理和分析,顯著降低幻覺。商情信息洞察及輔助決策時間從“周”降低到“天”,為客戶快速決策提供及時的技術(shù)支撐。
訊飛星火已上線最新的星火X2,持續(xù)打造更懂你的AI助手。一鍵開啟語音對話,快速響應你的需求。特別是面向年輕人求職和學習提升需求,本次重點升級了科研助手和求職助手,全流程輔助用戶找工作和寫論文。
訊飛開放平臺已正式上線星火X2 API。訊飛開放平臺新注冊開發(fā)者可以領取最多100萬Tokens免費額度,讓模型能力以更低成本進入真實開發(fā)與規(guī)模化驗證。從模型進化到API規(guī)模化開放,再到真實場景的持續(xù)落地,星火X2面向全球超1000萬開發(fā)者共享更強理解力與執(zhí)行力的深度推理能力。
星火X2升級,不僅是一次算法和工程的創(chuàng)新,更是基于全國產(chǎn)算力訓練的大模型在解決行業(yè)剛需問題上的躍升。
我們誠邀每一位用戶、開發(fā)者、行業(yè)伙伴共同體驗,在真實的業(yè)務場景中檢驗實用價值,持續(xù)將全棧自主可控的國產(chǎn)大模型推向安全可信、高效穩(wěn)定的規(guī)?;瘧谩?/p>
*文中數(shù)據(jù)來源于實際應用
-
科大訊飛
+關注
關注
19文章
865瀏覽量
63907 -
算力
+關注
關注
2文章
1657瀏覽量
16831 -
大模型
+關注
關注
2文章
3746瀏覽量
5266
原文標題:訊飛星火X2來了:基于全國產(chǎn)算力 、直面行業(yè)剛需硬核升級
文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
國產(chǎn)算力首證具身大腦模型訓練實力:摩爾線程聯(lián)合智源研究院完成RoboBrain 2.5全流程訓練
科大訊飛設立子公司:加碼AI與集成電路業(yè)務布局
2025科大訊飛全球1024開發(fā)者節(jié)精彩回顧
科大訊飛正式發(fā)布基于全國產(chǎn)算力訓練的星火X2大模型
評論