chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

百度騰訊搶灘布局!DeepSeek-R1升級和開源背后,國產(chǎn)AI的逆襲之路

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-06-03 06:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,當前版本為DeepSeek-R1-0528。次日,DeepSeek-R1-0528正式在Hugging Face平臺開源。用戶可通過官方網(wǎng)頁、App、小程序進入對話界面后,開啟“深度思考”功能體驗最新版本。API也已同步更新,調(diào)用方式不變。

DeepSeek-R1-0528編程能力提升最為顯著

DeepSeek-R1-0528仍然以2024年12月發(fā)布的DeepSeek V3 Base模型為基座,通過在后訓練過程中投入更多算力,顯著提升了模型的思維深度與推理能力。

官方稱,在數(shù)學、編程與通用邏輯等多個基準測評中,DeepSeek-R1-0528取得了當前國內(nèi)所有模型中首屈一指的優(yōu)異成績,并且在整體表現(xiàn)上接近其他國際頂尖模型,如OpenAI的o3 高版本與o4 mini模型、Google的Gemini-2.5-Pro等。

在編程能力方面,DeepSeek-R1-0528能力的提升最為顯著。知名代碼測試平臺Live CodeBench顯示,新版本性能可以媲美OpenAIo3模型的高版本。據(jù)測試者反饋,DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼,且在HTML/CSS/JS動態(tài)交互實現(xiàn)(如天氣卡片動畫、數(shù)據(jù)可視化)中更加精準。另外,在模擬物理碰撞的編程任務中,其表現(xiàn)優(yōu)于一些其他模型。它還能用Python 編寫將Word文檔中的圖片提取到固定路徑的小程序,在短時間內(nèi)完成任務。

在復雜推理任務中,DeepSeek-R1-0528的表現(xiàn)也有顯著提升。在AIME 2025測試中,新版模型的準確率從舊版的70%提升至87.5%。這一提升得益于模型在解題過程中進行了更為詳盡和深入的思考,舊版模型平均每題使用12K tokens,而新版模型平均每題使用 23K tokens。此外,它還能正確回答“9.9 - 9.11 = ?”這類難倒其他頂流大模型的數(shù)字新難題。

創(chuàng)意寫作能力上,DeepSeek-R1-0528 輸出的文本更加自然,結(jié)構(gòu)更有層次感,展現(xiàn)出了獨特的推理風格,不僅速度很快,而且進行了充分的思考。在舊版R1的基礎上,DeepSeek-R1-0528 針對議論文、小說、散文等文體進行了進一步優(yōu)化,能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品,同時呈現(xiàn)出更加貼近人類偏好的寫作風格。

在其他能力方面,如幻覺改善,DeepSeek-R1-0528針對幻覺問題進行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低了45~50%左右,能夠有效地提供更為準確、可靠的結(jié)果。

此外,DeepSeek-R1-0528 還支持工具調(diào)用功能,盡管不支持在 thinking 中進行工具調(diào)用,但在Tau-Bench測評中表現(xiàn)良好,與OpenAI o1-high相當。API方面,DeepSeek-R1-0528已同步更新,接口與調(diào)用方式保持不變,但增加了Function Calling 和JsonOutput的支持。

目前,百度智能云千帆大模型平臺正式上架了DeepSeek最新的R1-0528大模型。千帆模型開發(fā)平臺同步支持DeepSeek-R1最新版的批量推理、模型評估、推理日志挖掘分析以及模型蒸餾功能,全流程工具鏈支持企業(yè)構(gòu)建自己的專屬大模型;千帆應用開發(fā)平臺上的企業(yè)級RAG、Agent、工作流、百度AI搜索組件等功能也完成對DeepSeek新模型全鏈路接入,支持企業(yè)基于DeepSeek-R1-0528定制專屬應用。文小言App也全面接入了DeepSeek最新模型。

騰訊旗下元寶、ima、搜狗輸入法、QQ瀏覽器等多款產(chǎn)品也已接入了 DeepSeek R1-0528版本。用戶打開元寶(電腦版、網(wǎng)頁版可搶先體驗)、ima、搜狗輸入法(Windows版?zhèn)冗厵冢?、QQ瀏覽器,選擇DeepSeek模型R1深度思考,即可免費不限量使用。

全球AI大模型技術能力持續(xù)突破

近些年,全球大模型技術能力持續(xù)突破,原生多模態(tài)大模型成為技術演進的重要方向,通過打通視覺、音頻、3D等模態(tài)數(shù)據(jù),實現(xiàn)端到端輸入輸出。例如,百度文心大模型4.5系列實現(xiàn)了文本、圖像和視頻的混合訓練,顯著提升了多模態(tài)理解能力。

基于長思維鏈的“慢思考”技術成為提升模型邏輯推理能力的關鍵。例如,OpenAI的o1模型通過強化學習和思維鏈技術,在STEM領域的推理能力顯著增強,并具備自我反思與錯誤修正能力。

模型參數(shù)量呈指數(shù)級增長,例如從GPT-2的15億參數(shù)躍升到GPT-4的數(shù)千億參數(shù)。同時,訓練數(shù)據(jù)集規(guī)模每八個月翻一番,推動了模型性能的持續(xù)提升。

目前全球各大模型呈現(xiàn)多元化競爭態(tài)勢,國內(nèi)外模型在不同唯獨展開激烈競爭。從技術能力上來看,在國外,OpenAI的GPT系列(如GPT - 4)通過大規(guī)模訓練和計算資源,在生成文本和理解語言方面表現(xiàn)出色,具備強大的語言理解和生成能力,在復雜的文本生成和學術研究領域占據(jù)優(yōu)勢。Google的Gemini系列結(jié)合了Google Brain和DeepMind技術,追求極致的多模態(tài)和推理性能,在多模態(tài)支持方面具備最全面的能力,如原生支持文本、圖像、音頻、視頻和代碼等多種模態(tài)輸入輸出。

在國內(nèi),DeepSeek通過創(chuàng)新的算法優(yōu)化和高效的資源利用,提供了具備競爭力的選擇。其DeepSeek - R1模型在推理速度和計算資源消耗方面具有顯著優(yōu)勢,在推理能力、編程表現(xiàn)及交互體驗方面實現(xiàn)顯著突破,在數(shù)學、編程與通用邏輯等多個基準測評中取得了國內(nèi)領先的成績。百度的文心大模型在自然語言處理、知識圖譜構(gòu)建等方面技術成熟,廣泛應用于智能搜索、智能寫作、智能客服等領域。商湯科技專注于計算機視覺深度學習技術,在圖像識別、視頻分析等方面的技術實力強勁,其大模型在智能安防、智慧城市等領域有廣泛應用。

從應用場景上來看,國外GPT - 4適用于跨國智庫咨詢、新藥研發(fā)分子關系推理等場景。摩根士丹利使用GPT - 4.5生成投行報告,分析師效率提升70%。Gemini系列適用于跨境電商客服、全球輿情監(jiān)控等場景,沃爾瑪定制Gemini客服系統(tǒng),支持50種語言實時翻譯。

國內(nèi)DeepSeek在智能客服、醫(yī)療健康等領域具有強大潛力。文心一言深度綁定政企市場,覆蓋98%部委合規(guī)標準,在國企流程自動化、醫(yī)療病歷結(jié)構(gòu)化分析等場景有應用,如國家衛(wèi)健委疫情政策解讀報告生成。通義千問在電商場景表現(xiàn)突出,是電商場景霸主,在直播腳本生成、競品輿情分析準確率超90%,如天貓雙11自動生成百萬級個性化商品描述。

從生態(tài)方面來看,國外OpenAI憑借其強大的語言理解和生成能力,吸引了全球的開發(fā)者和企業(yè)。Google依托谷歌TPU算力壟斷和搜索數(shù)據(jù)優(yōu)勢,推動Gemini系列的發(fā)展。

國內(nèi)百度匯聚了大量高端人才,平臺技術發(fā)展全面且快速,文心大模型在內(nèi)部和外部應用方面雙向發(fā)力,積累了較多行業(yè)應用案例。阿里電商生態(tài)加持通義千問,使其與阿里云無縫集成,可一鍵調(diào)用云計算、支付、物流接口。騰訊整合微信、游戲生態(tài),調(diào)用微信社交語料,生成“網(wǎng)感”最強內(nèi)容,在游戲NPC交互方面,實時生成劇情對話,玩家留存率提升25%。

寫在最后

可以預見,隨著產(chǎn)業(yè)鏈技術的不斷成熟,大模型將在更多行業(yè)得到廣泛應用,推動各行業(yè)的智能化發(fā)展。隨著生成式模型在圖像、視頻側(cè)的處理能力提升,疊加推理優(yōu)化帶來的降本,AI超級應用有望出現(xiàn),改變?nèi)藱C交互方式。從市場趨勢來看,全球大模型行業(yè)市場規(guī)模將持續(xù)擴大,頭部企業(yè)將鞏固地位,新興企業(yè)將尋求突破。開源社區(qū)、合作伙伴和應用開發(fā)者將成為生態(tài)競爭的關鍵。完善的生態(tài)系統(tǒng)將增強用戶粘性,促進技術創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40908

    瀏覽量

    302485
  • 百度
    +關注

    關注

    9

    文章

    2387

    瀏覽量

    95173
  • DeepSeek
    +關注

    關注

    2

    文章

    837

    瀏覽量

    3390
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瀚博半導體宣布深度參與百度飛槳黑客松生態(tài)活動

    近日,瀚博半導體正式宣布深度參與百度飛槳主辦的黑客松生態(tài)活動。面向全球開發(fā)者開放旗下載天系列加速卡開發(fā)環(huán)境,支持部署百度文心ERNIE-4.5 系列開源模型與PP-OCRv4 文檔理解模型,打造
    的頭像 發(fā)表于 04-11 09:41 ?556次閱讀

    百度智能云推出首個國產(chǎn)企業(yè)滿血版OpenClaw產(chǎn)品DuMate

    今天,首個國產(chǎn)企業(yè)滿血版OpenClaw——百度智能云DuMate(中文名:搭子)正式上線,全量開放。你的專屬AI搭子來了!
    的頭像 發(fā)表于 03-24 10:27 ?593次閱讀

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI

    年,持續(xù)為行業(yè)搭建起交流前沿技術、碰撞創(chuàng)新思維、洞察未來趨勢的重要平臺。 今日(11月13日)Baidu World 2025在北京舉辦。在這里,可以體驗AI應用的價值涌現(xiàn),見證AI能力的創(chuàng)新爆發(fā)。 今年的百度世界2025以“效
    的頭像 發(fā)表于 11-13 15:47 ?1862次閱讀

    百度智能云全面升級舸5.0和千帆4.0

    大會上,百度智能云全面升級AI計算平臺5.0、千帆企業(yè)AI開發(fā)平臺4.0兩大
    的頭像 發(fā)表于 08-30 09:18 ?1949次閱讀

    速看!EASY-EAI教你離線部署Deepseek R1大模型

    和自然語言推理等復雜任務。作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術,在全球人工智能領域引發(fā)廣泛關注。本文主要說明DeepSeek-R1
    的頭像 發(fā)表于 07-25 15:22 ?1550次閱讀
    速看!EASY-EAI教你離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    【「DeepSeek 核心技術揭秘」閱讀體驗】--全書概覽

    講解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架構(gòu)、訓練框架、推理階段優(yōu)化、后訓練優(yōu)化等關鍵技術 第四章關于DeepSeek-R1的技術剖析 第五章 從宏觀角度分析
    發(fā)表于 07-21 00:04

    【「DeepSeek 核心技術揭秘」閱讀體驗】書籍介紹+第一章讀后心得

    DeepSeek-V3的MoE架構(gòu)革新與DeepSeek-R1的強化學習突破,更揭開了中國大模型“五百萬美元創(chuàng)造GPT-4性能”的工程奇跡。 書中讓我們看到國產(chǎn)模型如何在架構(gòu)設計、訓
    發(fā)表于 07-17 11:59

    信而泰×DeepSeekAI推理引擎驅(qū)動網(wǎng)絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度
    發(fā)表于 07-09 18:30

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務。
    的頭像 發(fā)表于 07-03 14:37 ?1405次閱讀
    Arm Neoverse N2平臺實現(xiàn)<b class='flag-5'>DeepSeek-R1</b>滿血版部署

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀錄:在 GTC 2025
    的頭像 發(fā)表于 07-02 19:31 ?3533次閱讀
    NVIDIA Blackwell GPU優(yōu)化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延遲場景中的性能紀錄

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘

    2025年年初,DeepSeek 成為全球人工智能(AI)領域的焦點,其DeepSeek-V3 和DeepSeek-R1 版本在行業(yè)內(nèi)引發(fā)了結(jié)構(gòu)性震動。
    發(fā)表于 06-09 14:38

    百度發(fā)布文心4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發(fā)者大會在武漢舉辦。百度創(chuàng)始人李彥宏發(fā)布了文心大模型4.5 Turbo及深度思考模型X1 Turbo兩大模型,以及多款
    的頭像 發(fā)表于 04-30 10:16 ?1290次閱讀

    百度AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度AI領域的新進展。
    的頭像 發(fā)表于 04-30 10:14 ?1451次閱讀

    SAP實施專家解答:如何用DeepSeek-R1實現(xiàn)需求溝通效率倍增

    工博科技分享AI工具鏈在IT項目中的深度應用:通過DeepSeek-R1實現(xiàn)智能會議記錄結(jié)構(gòu)化(2小時會議5分鐘生成決策表)和精準多語言文檔翻譯(錯誤率降低14%),幫助IT團隊將重復性工作耗時減少
    的頭像 發(fā)表于 04-28 09:13 ?800次閱讀