chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RAG、MCP與智能體:大模型落地的三道關(guān)

工程師高培 ? 來源:工程師高培 ? 作者:工程師高培 ? 2026-03-19 13:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大模型能力越來越強,但落地沒那么快。從單次對話到多步任務,中間隔著系統(tǒng)工程。這篇文章聊三個繞不開的技術(shù)方向:RAG、MCP和智能體。

一、RAG:讓模型學會翻資料

大模型的知識截止于訓練時刻,這是天生局限。RAG的思路很簡單:用戶提問時,先從知識庫里檢索相關(guān)內(nèi)容,再讓模型基于這些資料生成答案。

數(shù)據(jù)分片是關(guān)鍵第一步。文檔切太碎,上下文割裂;切太整,檢索不精準。技術(shù)手冊按章節(jié)切,問答對按條目切,不同類型策略不同。分片后生成向量,存入向量數(shù)據(jù)庫。

檢索不是終點。召回的片段需要排序篩選。兩階段檢索常見:先用向量召回一批,再用重排模型精排。重排能更細粒度判斷相關(guān)性,但計算成本高。

指令理解很關(guān)鍵?!霸趺磁洹焙汀芭溴e了怎么辦”指向不同文檔。只匹配關(guān)鍵詞容易跑偏,有的系統(tǒng)會在檢索前加一層意圖識別。

進階方向是GraphRAG——用知識圖譜組織信息。實體關(guān)系預先抽取,檢索時沿著圖譜走,能回答更復雜的問題。比如“A和B合作過哪些項目”,文檔片段難拼湊,圖譜能直接列出來。

二、MCP:讓模型學會用工具

大模型不能直接操作外部系統(tǒng),這是硬傷。不能查數(shù)據(jù)庫,不能調(diào)API,不能執(zhí)行代碼。MCP這類協(xié)議解決的,就是模型與外部世界交互的問題。

MCP定義客戶端-服務器架構(gòu)。模型作為客戶端,通過標準協(xié)議調(diào)用各種工具服務器。工具服務器封裝數(shù)據(jù)庫查詢、代碼執(zhí)行、API調(diào)用等能力。模型只需知道“有什么工具、怎么調(diào)用”,實現(xiàn)由服務器完成。

工具描述要規(guī)范。每個工具需清晰的名稱、描述、參數(shù)列表。模型根據(jù)問題判斷調(diào)用哪個、填什么參數(shù),描述不清容易選錯。有的團隊會寫few-shot樣例幫助理解。

多步驟任務要管理。復雜問題常需多次工具調(diào)用,且后面依賴前面。“查某公司去年營收,再和同行比”,需先查數(shù)據(jù)庫拿到數(shù)據(jù),再調(diào)分析工具對比。MCP支持任務鏈式調(diào)用,中間結(jié)果可在上下文傳遞。

安全是底線。工具調(diào)用可能帶來風險。協(xié)議通常支持沙盒隔離、權(quán)限控制。敏感操作需用戶二次確認,或限定特定環(huán)境執(zhí)行。

Google新推出的A2A協(xié)議也值得關(guān)注,它關(guān)注多智能體協(xié)作:一個智能體可把子任務委派給另一個,任務狀態(tài)可同步,為構(gòu)建復雜多智能體系統(tǒng)提供了標準化基礎(chǔ)。

三、智能體:從回答問題到完成任務

RAG讓模型能查資料,MCP讓模型能調(diào)工具,兩者結(jié)合,就能做出真正干活的智能體。

智能體與問答系統(tǒng)的區(qū)別在于:它有狀態(tài),能規(guī)劃,能執(zhí)行多步驟任務。“幫我訂下周去上海的機票”需要查時間、比價格、填信息、下單支付。每一步可能調(diào)用不同工具,過程中可能要追問用戶。

任務規(guī)劃是核心。模型需把大目標拆解成可執(zhí)行子任務。有的用CoT提示工程讓模型一步步想,有的用專門規(guī)劃器把拆解和調(diào)用分離。規(guī)劃質(zhì)量直接影響成功率。

記憶管理要分層。多輪對話里,用戶可能中途修改需求,或同一個智能體處理多個任務。短期記憶緩存最近幾輪,長期記憶存儲用戶偏好。MemGPT等框架把記憶做成層級結(jié)構(gòu),重要信息持久化,臨時信息隨對話過期。

多模態(tài)支持很實用。用戶可能發(fā)截圖問“這按鈕為什么點不了”,或語音描述故障。多模態(tài)智能體需對齊文本、圖像、音頻信息,跨模態(tài)理解后統(tǒng)一決策。模態(tài)對齊和融合是底層關(guān)鍵技術(shù)。

群體智能是更高階形態(tài)。單個智能體能力有限,復雜任務需多角色協(xié)作。AutoGen等框架支持多智能體協(xié)同:一個負責計劃,一個執(zhí)行,一個質(zhì)檢,互相討論修正。多智能體通信需高效消息傳遞和任務狀態(tài)同步,集中訓練、分散執(zhí)行是常見范式。

四、從原型到產(chǎn)品還有多遠

RAG、MCP、智能體,每項單看都不陌生,但整合到產(chǎn)品里會碰到一連串工程問題。

速度。多步推理意味著多次模型調(diào)用,延遲累加。緩存策略、負載均衡、推理加速,每一層都得優(yōu)化。

穩(wěn)定性。模型生成不穩(wěn)定,同樣輸入可能不同輸出。用在自動化流程需加校驗和兜底。置信度低于閾值時觸發(fā)人工接管,關(guān)鍵操作后讓用戶確認。

成本。模型調(diào)用次數(shù)多,API開銷不小。蒸餾模型、本地部署、小型模型處理常規(guī)任務、復雜問題交給大模型,都是控制成本的手段。

評估。怎么判斷智能體做得好不好?不能只看單次回答質(zhì)量,要看任務完成率、多輪對話成功率、資源消耗。領(lǐng)域不同,指標需定制。

大模型的能力邊界還在擴展,但技術(shù)關(guān)注點正從“模型多強”轉(zhuǎn)向“系統(tǒng)多穩(wěn)”。RAG讓知識庫活起來,MCP讓工具鏈打通,智能體讓自動化升級。這三塊拼圖拼起來,才可能做出真正落地的應用。

工程師高培覺得理論是骨架,落地才是血肉。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    550

    瀏覽量

    11642
  • MCP
    MCP
    +關(guān)注

    關(guān)注

    0

    文章

    293

    瀏覽量

    15077
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3746

    瀏覽量

    5268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【2025夏季班正課】大模型Agent智能開發(fā)實戰(zhàn) 課分享

    【2025年12月班】大模型與Agent智能開發(fā)實戰(zhàn)] 拒絕碎片化:體系化學 Agent 開發(fā)方法的技術(shù)深度剖析 在當今的人工智能應用開發(fā)領(lǐng)域,一種浮躁的“碎片化”風氣正在蔓延。許多
    發(fā)表于 03-29 16:12

    RAG(檢索增強生成)原理與實踐

    持續(xù)迭代 :基于用戶反饋和評估結(jié)果不斷改進 選擇合適的工具棧 :根據(jù)實際需求選擇Embedding模型、向量數(shù)據(jù)庫和LLM RAG技術(shù)正在快速發(fā)展,掌握其原理與實踐,將幫助你構(gòu)建更智能、更可靠的AI應用。
    發(fā)表于 02-11 12:46

    鴻蒙智能上/下架、升級流程介紹

    編輯后再次提交上架申請。 上架前注意事項: 受隱私風險影響,當前暫不支持上架包含私有云插件及私有MCP插件的個人智能。僅支持頁面調(diào)試能力。 智能
    發(fā)表于 02-10 10:38

    開發(fā)智能配置-內(nèi)容合規(guī)

    智能上架前,需完成“人工智能生成合成內(nèi)容標識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能
    發(fā)表于 02-07 11:44

    使用NVIDIA Nemotron模型構(gòu)建語音驅(qū)動RAG智能

    構(gòu)建智能不僅僅是“調(diào)用 API”,而是需要將檢索、語音、安全和推理組件整合在一起,使其像一個統(tǒng)一并互相協(xié)同的系統(tǒng)一樣運行。每一層都有自己的接口、延遲限制和集成挑戰(zhàn),一旦跨過簡單的原型就會開始感受到這些挑戰(zhàn)。
    的頭像 發(fā)表于 01-14 09:28 ?613次閱讀
    使用NVIDIA Nemotron<b class='flag-5'>模型</b>構(gòu)建語音驅(qū)動<b class='flag-5'>RAG</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    端側(cè)大模型上車:從“語音助手”到“車內(nèi) AI 智能”的躍遷革命

    2025年,智能汽車的座艙不再只是“語音助手”的舞臺,而是一個搭載生成式AI和大語言模型(LLM)的智能。從云端示范到車內(nèi)落地,這一跨越不
    的頭像 發(fā)表于 01-13 09:10 ?676次閱讀

    智能設計模式和智能框架,你會了么?

    ,DeepResearch種模式,以實現(xiàn)靈活的任務執(zhí)行 。 DataJuicer 智能是一個數(shù)據(jù)專員,由 數(shù)據(jù)處理智能,代碼開發(fā)
    的頭像 發(fā)表于 11-12 16:30 ?1353次閱讀
    多<b class='flag-5'>智能</b><b class='flag-5'>體</b>設計模式和<b class='flag-5'>智能</b><b class='flag-5'>體</b>框架,你會了么?

    RAG實踐:一文掌握大模型RAG過程

    RAG(Retrieval-Augmented Generation,檢索增強生成), 一種AI框架,將傳統(tǒng)的信息檢索系統(tǒng)(例如數(shù)據(jù)庫)的優(yōu)勢與生成式大語言模型(LLM)的功能結(jié)合在一起。不再
    的頭像 發(fā)表于 10-27 18:23 ?1696次閱讀
    <b class='flag-5'>RAG</b>實踐:一文掌握大<b class='flag-5'>模型</b><b class='flag-5'>RAG</b>過程

    圖解AI核心技術(shù):大模型、RAG、智能、MCP

    和使用AI。 大模型 Transformer vs. Mixture of Experts 混合專家 (MoE) 是一種流行的架構(gòu),它使用不同的“專家”來改進 Transformer 模型。 下圖解釋了
    的頭像 發(fā)表于 10-21 09:48 ?948次閱讀
    圖解AI核心技術(shù):大<b class='flag-5'>模型</b>、<b class='flag-5'>RAG</b>、<b class='flag-5'>智能</b><b class='flag-5'>體</b>、<b class='flag-5'>MCP</b>

    曠視借助大模型智能推動算法落地

    當下,AI技術(shù)繁榮無比,但無數(shù)企業(yè)卻陷入“叫好不叫座”的困境:算法模型很先進,但一到真實的行業(yè)場景中就“水土不服”。問題究竟出在哪?大模型智能的興起,又為我們提供了怎樣的新解題思路
    的頭像 發(fā)表于 10-11 14:04 ?733次閱讀

    【內(nèi)測活動同步開啟】這么小?這么強?新一代大模型MCP開發(fā)板來啦!

    ,將碰撞出怎樣的智能火花?關(guān)注并私信獲得內(nèi)測資格! 視頻: 「Arcs-Mini」聆思打造全新大模型MCP開發(fā)板小巧機身,蘊含強大能量 實現(xiàn)真人般自然對話體驗,會感知、會表達、會表情、懂共情,獨家人聲濾
    發(fā)表于 09-25 11:47

    開普云「開悟智核」:極致性價比的智能機,破局大模型應用難題

    當下,AI一機憑借開箱即用、數(shù)據(jù)可控等優(yōu)勢,成為行業(yè)大模型落地的重要載體之一。然而實際應用時,用戶卻面臨諸多問題:算力成本與性能難以平衡;非滿血版模型存在“幻覺”、精度低等問題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1289次閱讀
    開普云「開悟智核」:極致性價比的<b class='flag-5'>智能</b><b class='flag-5'>體</b>一<b class='flag-5'>體</b>機,破局大<b class='flag-5'>模型</b>應用難題

    AI耳機邁入智能時代,2037年65%應用將為智能驅(qū)動

    近期發(fā)布的TWS耳機。隨著智能的到來,AI耳機行業(yè)進入新的發(fā)展階段。 ? 基礎(chǔ)NLP 大模型能力差距縮小,2037 年65% 應用將為智能
    的頭像 發(fā)表于 05-24 01:15 ?7360次閱讀
    AI耳機邁入<b class='flag-5'>智能</b><b class='flag-5'>體</b>時代,2037年65%應用將為<b class='flag-5'>智能</b><b class='flag-5'>體</b>驅(qū)動

    在Cherry Studio中快速使用markitdown MCP Server?

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 Cherry Studio是一款跨平臺的集成了AI大模型和知識庫、網(wǎng)絡搜索、MCP服務器等相關(guān)工具桌面客戶端應用程序,方便用戶配置出自己的AI智能
    的頭像 發(fā)表于 05-15 10:39 ?1667次閱讀
    在Cherry Studio中快速使用markitdown <b class='flag-5'>MCP</b> Server?

    如何用FastMCP快速開發(fā)自己的MCP Server?

    的感受到了基于AI大模型MCP可以非常方便的構(gòu)建自己的AI智能工作流。在此基礎(chǔ)上,不少讀者咨詢,如何將自己已有的工具或函數(shù),制作成MCP
    的頭像 發(fā)表于 05-07 16:07 ?3028次閱讀
    如何用FastMCP快速開發(fā)自己的<b class='flag-5'>MCP</b> Server?