chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

穿過幻覺荒野,大模型RAG越野賽

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-01-28 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZO2eYdsOAClSbAAm48a8Dapo467.jpg

2025年初,大模型賽場(chǎng)熱度不減,有拼成本優(yōu)勢(shì),拼Tokens調(diào)用量的短跑賽;有比慢思考,比大模型推理能力的長(zhǎng)跑賽。但在觀看這些“經(jīng)典賽事”的同時(shí),我們還需要注意另一場(chǎng)正在舉行中,并且對(duì)大模型行業(yè)未來至關(guān)重要的比賽——RAG越野賽。

所謂RAG,是指Retrieval-Augmented Generation檢索增強(qiáng)生成。顧名思義,RAG是將大語言模型的生成能力與搜索引擎的信息檢索能力進(jìn)行結(jié)合,這已經(jīng)成為目前主流大模型的標(biāo)配。

之所以說RAG是一場(chǎng)越野賽,是因?yàn)榇竽P妥畋蝗速|(zhì)疑的問題,就是生成內(nèi)容時(shí)經(jīng)常會(huì)出現(xiàn)有明顯訛誤的大模型幻覺。這些幻覺就像崇山峻嶺,遮擋了大模型的進(jìn)化之路。

而RAG的戰(zhàn)略價(jià)值,就在于它是克服大模型幻覺的核心方案。換言之,誰能贏得RAG越野賽,誰就能解決大模型的核心痛點(diǎn),將AI帶到下一個(gè)時(shí)代。

讓我們進(jìn)入大模型RAG的賽道,看看這場(chǎng)越野將把AI帶向何方。

wKgZO2eYdsSABPYqAAI-dQPcEXI563.jpg

讓我們先把時(shí)針調(diào)回到你第一次接觸大語言模型的時(shí)候。初次嘗試與大模型聊天,驚艷之外,是不是感覺好像有哪里不對(duì)?

這種不適感,很可能來自大模型的三個(gè)問題:

1.胡言亂語。對(duì)話過程中,我們經(jīng)常會(huì)發(fā)現(xiàn)大模型說一些明顯不符合常識(shí)的話,比如“林黛玉的哥哥是林沖”“魯智深是法國(guó)文學(xué)家”之類的。這就是LLM模型的運(yùn)行原理,導(dǎo)致其在內(nèi)容生成過程中會(huì)為了生成而生成,不管信息正確與否。這也就是廣受詬病的大模型幻覺。業(yè)內(nèi)普遍認(rèn)為,幻覺不除,大模型就始終是玩具而非工具。

2.信息落后。大模型還有一個(gè)問題,就是知識(shí)庫更新較慢,從而導(dǎo)致如果我們問近期發(fā)生的新聞與實(shí)時(shí)熱點(diǎn)它都無法回答。但問題在于,我們工作生活中的主要問題都具有時(shí)效性,這導(dǎo)致大模型的實(shí)用價(jià)值大打折扣。

3.缺乏根據(jù)。另一種情況是,大模型給出了回答,但我們無法判斷這些回答的真?zhèn)魏涂煽啃?。畢竟我們知道有大模型幻覺的存在,進(jìn)而會(huì)對(duì)AGIC產(chǎn)生疑慮。我們更希望能夠讓大模型像論文一樣標(biāo)注每條信息的來源,從而降低辨別成本。

這些問題可以被統(tǒng)稱為“幻覺荒野”。而想要穿越這片荒野,最佳途徑就是將大模型的理解、生成能力,與搜索引擎的信息檢索融合在一起。

因?yàn)樾畔z索能夠給大模型提供具有時(shí)效性的信息,并且指明每條信息的來源。在檢索帶來的信息庫加持下,大模型也可以不再“胡言亂語”。

檢索是方法,生成是目的,通過高質(zhì)量的檢索系統(tǒng),大模型有望克服幻覺這個(gè)最大挑戰(zhàn)。

于是,RAG技術(shù)應(yīng)運(yùn)而生。

wKgZO2eYdsSANADTAAHx4SYgNEY985.jpg

在RAG賽道上,檢索的優(yōu)劣將很大程度上影響生成模型最終生成結(jié)果的優(yōu)劣。比如說,百度在中文搜索領(lǐng)域的積累,帶來了語料、語義理解、知識(shí)圖譜等方面的積淀。這些積淀有助于提升中文RAG的質(zhì)量,從而讓RAG技術(shù)更快在中文大模型中落地。在搜索引擎領(lǐng)域,百度構(gòu)建了龐大的知識(shí)庫與實(shí)時(shí)數(shù)據(jù)體系,在眾多需要專業(yè)檢索的垂直領(lǐng)域進(jìn)行了重點(diǎn)布局。

其實(shí),把搜索領(lǐng)域的積累,第一時(shí)間帶到大模型領(lǐng)域,這一點(diǎn)并不容易。因?yàn)槲覀兌贾溃嫦蛉祟惖乃阉鹘Y(jié)果并不適合大模型來閱讀理解。想要實(shí)現(xiàn)高質(zhì)量的RAG,就需要尋找能夠高效支持搜索業(yè)務(wù)場(chǎng)景和大模型生成場(chǎng)景的架構(gòu)解決方案。

wKgZPGeYdsWAXRTcAALi0gt4N3o472.jpg

百度早在2023年3月發(fā)布文心一言時(shí)就提出了檢索增強(qiáng),大模型發(fā)展到今天,檢索增強(qiáng)也早成為業(yè)界共識(shí)。百度檢索增強(qiáng)融合了大模型能力和搜索系統(tǒng),構(gòu)建了“理解-檢索-生成”的協(xié)同優(yōu)化技術(shù),提升了模型技術(shù)及應(yīng)用效果。通俗來看,理解階段,基于大模型理解用戶需求,對(duì)知識(shí)點(diǎn)進(jìn)行拆解;檢索階段,面向大模型進(jìn)行搜索排序優(yōu)化,并將搜索返回的異構(gòu)信息統(tǒng)一表示,送給大模型;生成階段,綜合不同來源的信息做出判斷,并基于大模型邏輯推理能力,解決信息沖突等問題,從而生成準(zhǔn)確率高、時(shí)效性好的答案。

就這樣,RAG成為百度文心大模型的核心差異化技術(shù)路徑??梢哉f,檢索增強(qiáng)成為文心大模型的一張名片。

讓我們隨便問個(gè)問題,測(cè)測(cè)

如今,基本主流大模型都會(huì)提供RAG體驗(yàn),比如告知用戶模型調(diào)用了多少個(gè)網(wǎng)頁,檢索信息的出處在哪里等。但RAG這場(chǎng)越野賽依舊有著鮮明的身位差距,想要知道這個(gè)排位方法也非常簡(jiǎn)單,隨便問各款大模型一個(gè)相同的問題就可以。

比如說,春節(jié)將至,逛廟會(huì)是北京春節(jié)必不可少的一部分。但北京春節(jié)廟會(huì)眾多,小伙伴們肯定會(huì)想知道哪個(gè)廟會(huì)更適合自己,以及他們的營(yíng)業(yè)時(shí)間是怎么樣的。

于是,我把“北京春節(jié)廟會(huì)哪個(gè)更推薦?它們的營(yíng)業(yè)時(shí)間是什么?”分別提問給百度文心一言、豆包、Kimi、DeepSeek等。在這里,文心一言我們使用的是付費(fèi)版,文心大模型4.0 Turbo。

文心一言的答案是這樣的,首先它結(jié)合檢索到的信息,推薦了數(shù)十個(gè)北京的春節(jié)廟會(huì),并且列出了每個(gè)廟會(huì)的地點(diǎn)、時(shí)間等信息。

wKgZO2eYdsWAfRJsAAHHUJQ1MYE296.jpg

wKgZPGeYdsWAEJ_6AAFZTl5NAU0333.jpg

wKgZO2eYdsWAIMoeAAINGyXGG3Y416.jpg

wKgZPGeYdsaAcdhKAAF3B1ODOXc385.jpg

但到這里還沒有結(jié)束,接下來文心一言還進(jìn)行了總結(jié)。

wKgZO2eYdsaAW2n1AAH8uS3-DhY274.jpg

wKgZPGeYdsaAL9WyAAMKB2UfBoA519.jpg

可以看到,文心一言理解了我“最推薦”的提問,給出眾多選項(xiàng)的同時(shí),還主要推薦了東岳廟廟會(huì)、地壇廟會(huì)、娘娘廟廟會(huì)、石景山游樂園廟會(huì),并且給出了相應(yīng)的推薦理由,做到了在信息全面化與推薦個(gè)性化之間達(dá)成平衡。

同樣的問題給到豆包,則會(huì)發(fā)現(xiàn)它的回答也非常不錯(cuò),但內(nèi)容完整度上有所欠缺。

wKgZO2eYdsaAOF2GAAIk07NPKXY438.jpg

豆包的答案,是按照每類愛好者應(yīng)該去哪個(gè)廟會(huì)進(jìn)行分類,總共給出了7個(gè)廟會(huì)的信息。但需要注意的是,一方面豆包的答案在廟會(huì)數(shù)量和對(duì)每個(gè)廟會(huì)特色的介紹上都不夠詳盡。另外豆包沒有進(jìn)行總結(jié),并不符合問題中“哪個(gè)最推薦”的訴求。

同樣的問題給Kimi則是另一種景象。

wKgZPGeYdseAIJRLAAJps6J4ThE174.jpg

不知道為什么,Kimi的答案里只回答了廠甸廟會(huì)一個(gè)答案,完全沒有提及其他廟會(huì)。這樣確實(shí)符合“最推薦”的需求,但未免過分片面和武斷,沒有讓用戶完整了解北京春節(jié)廟會(huì)的信息。

同樣的問題來問最近火熱的DeepSeek R1大模型,會(huì)發(fā)現(xiàn)它也能進(jìn)行RAG深度聯(lián)網(wǎng)檢索,并且給出了思考過程,最終給出了10個(gè)廟會(huì)的推薦信息。

wKgZO2eYdseAbeBlAANocnQ01pI425.jpg

wKgZPGeYdseAUtAeAAEX6E68I3Y164.jpg

唯一稍顯不足的是,其最終也是只給出了幾個(gè)廟會(huì)的基本情況,沒有呼應(yīng)“最推薦”哪個(gè)廟會(huì)的提問,并且其思考過程稍顯冗長(zhǎng),閱讀體驗(yàn)也有待提升。

從中不難看出,在“今年春節(jié)去哪個(gè)廟會(huì)”這樣非常具有時(shí)效性與實(shí)用性的問答上,幾家大模型回答得都還可以,但還是有差異的。這背后就是RAG技術(shù)能力的差異。

單看RAG能力,文心一言在檢索增強(qiáng),尤其是上面這類問答類需求上更顯優(yōu)勢(shì),另外我們也能看到,文心一言在結(jié)果呈現(xiàn)上調(diào)用了表格工具來結(jié)構(gòu)化呈現(xiàn)結(jié)果。整體來說,在深度思考和工具調(diào)用上,文心一言表現(xiàn)不錯(cuò)。

不難看出,檢索增強(qiáng)對(duì)大模型實(shí)用性和體驗(yàn)感有著非常重要的影響。

wKgZO2eYdsiAXivoAAJTzIXvvw4463.jpg

RAG越野賽的持續(xù),或許將會(huì)給整個(gè)數(shù)字世界帶來新的驚喜。

比如說,RAG可能是——

1.搜索引擎的新引擎。讓大模型理解信息檢索,也將反向帶給搜索引擎與全新發(fā)展動(dòng)力,用戶的模糊性搜索、提問性搜索、多模態(tài)搜索將被更好滿足。

2.大語言模型的新支點(diǎn)。大模型不僅要生成內(nèi)容,更要生成可信、可靠、即時(shí)的內(nèi)容,想要實(shí)現(xiàn)這些目標(biāo),RAG是已經(jīng)得到驗(yàn)證的核心方向。

3.通往未來的一張船票。預(yù)訓(xùn)練大模型只是故事的起點(diǎn),而故事的高潮則在于創(chuàng)造AI原生應(yīng)用的無盡可能性。理解、生成、檢索這些數(shù)智核心能力的相遇與融合,或許才能真正揭示出AI原生應(yīng)用的底層邏輯與未來形態(tài)。

基礎(chǔ)模型本身是需要靠應(yīng)用才能顯現(xiàn)出來價(jià)值。這個(gè)時(shí)代無數(shù)人在好奇,AI原生應(yīng)用的核心載體應(yīng)該是什么?

或許,理解、檢索與生成的結(jié)合就是方向。

又或許,RAG越野賽的盡頭就是答案。

wKgZO2eYdsiAOFYtAAIHOMGMcWg384.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40908

    瀏覽量

    302489
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3746

    瀏覽量

    5268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RAG、MCP與智能體:大模型落地的三道關(guān)

    模型能力越來越強(qiáng),但落地沒那么快。從單次對(duì)話到多步任務(wù),中間隔著系統(tǒng)工程。這篇文章聊三個(gè)繞不開的技術(shù)方向:RAG、MCP和智能體。 一、RAG:讓模型學(xué)會(huì)翻資料 大
    的頭像 發(fā)表于 03-19 13:55 ?123次閱讀

    嵌入式AI開發(fā)必看:杜絕幻覺,才是工業(yè)級(jí)IDE的核心底氣

    AI浪潮正在重塑嵌入式開發(fā)范式,代碼生成效率大幅提升的同時(shí),“AI幻覺”問題卻成為工業(yè)場(chǎng)景落地的核心阻礙——看似合規(guī)的代碼暗藏時(shí)序錯(cuò)誤、硬件邏輯沖突等隱性風(fēng)險(xiǎn),傳統(tǒng) IDE 缺乏工業(yè)級(jí)校驗(yàn)?zāi)芰?,?/div>
    發(fā)表于 03-18 13:49

    RAG(檢索增強(qiáng)生成)原理與實(shí)踐

    開卷考試而不是閉卷考試——它可以查閱資料后再作答。 1.2 為什么需要RAG? 傳統(tǒng)LLM面臨幾個(gè)關(guān)鍵問題: 知識(shí)時(shí)效性 :模型的知識(shí)截止于訓(xùn)練時(shí)間,無法獲取最新信息 幻覺問題 :模型
    發(fā)表于 02-11 12:46

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開放模型集合無縫連接,這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性
    的頭像 發(fā)表于 12-01 09:31 ?989次閱讀
    使用NVIDIA Nemotron <b class='flag-5'>RAG</b>和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    openDACS 2025 開源EDA與芯片項(xiàng) 題七:基于大模型的生成式原理圖設(shè)計(jì)

    領(lǐng)域,對(duì)促進(jìn)產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要意義。本項(xiàng)包含7道題,下面是題七 基于大模型的生成式原理圖設(shè)計(jì)的介紹。 2. 命題單位及題Chai
    發(fā)表于 11-13 11:49

    亞馬遜云科技上線Amazon Nova多模態(tài)嵌入模型

    Embeddings多模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線,這是一款專為Agentic RAG與語義搜索應(yīng)用打造的頂尖多模態(tài)嵌入模型。該模型是首個(gè)通過單一
    的頭像 發(fā)表于 10-29 17:15 ?350次閱讀
    亞馬遜云科技上線Amazon Nova多模態(tài)嵌入<b class='flag-5'>模型</b>

    RAG實(shí)踐:一文掌握大模型RAG過程

    RAG(Retrieval-Augmented Generation,檢索增強(qiáng)生成), 一種AI框架,將傳統(tǒng)的信息檢索系統(tǒng)(例如數(shù)據(jù)庫)的優(yōu)勢(shì)與生成式大語言模型(LLM)的功能結(jié)合在一起。不再
    的頭像 發(fā)表于 10-27 18:23 ?1696次閱讀
    <b class='flag-5'>RAG</b>實(shí)踐:一文掌握大<b class='flag-5'>模型</b><b class='flag-5'>RAG</b>過程

    全新坦克400智享版搭載禾科技激光雷達(dá)

    2025 年 10 月 21 日,主題為“潮酷越野新時(shí)代”的全新坦克 400 預(yù)售發(fā)布會(huì)成功舉行,長(zhǎng)城汽車推出全新坦克 400 Hi4-Z 智享版和全新坦克 400 Hi4-T 智享版,標(biāo)配禾
    的頭像 發(fā)表于 10-23 16:56 ?964次閱讀

    越野賽車中使用齒輪傳感器

    作者:Ramaditya Kotha 測(cè)量非常快速旋轉(zhuǎn)的系統(tǒng)是車輛系統(tǒng)中的普遍挑戰(zhàn)。為了準(zhǔn)確地衡量某物在不觸摸編碼器(例如編碼器)的情況下旋轉(zhuǎn)的速度,UCLA Baja賽車團(tuán)隊(duì)利用了Littelfuse 55075系列的齒輪齒傳感器。在本文中,我們將探討齒輪齒傳感器如何使用大廳效果運(yùn)行,以及我們?nèi)绾卧谫愜嚿鲜褂盟鼈兊膶?shí)例。閱讀本文后,您應(yīng)該能夠?qū)嵤┳约旱凝X輪齒傳感器解決方案! 理論 齒輪傳感器(例如Littelfuse 55075)使用大廳效果來檢測(cè)亞鐵材料。這是一個(gè)密集的陳
    的頭像 發(fā)表于 10-01 15:17 ?1903次閱讀
    在<b class='flag-5'>越野賽</b>車中使用齒輪傳感器

    軒轅智駕出席越野安全生態(tài)聯(lián)盟成立大會(huì)

    近日,一場(chǎng)關(guān)于越野安全與科技融合的盛會(huì),在武漢高德紅外隆重啟幕。
    的頭像 發(fā)表于 09-26 10:40 ?731次閱讀

    2025寧夏沙坡頭半馬收官 神眸無線AI攝像機(jī)打造智能賽道新體驗(yàn)

    ,PT2S保障物理安全,BC6+增強(qiáng)情感連接,小智升華賽事敘事。這種“無電無網(wǎng)全智能”的解決方案,不僅適用于馬拉松,更為越野賽、汽車登山等極限運(yùn)動(dòng)提供了可復(fù)用的智能賽道
    的頭像 發(fā)表于 09-02 12:31 ?1207次閱讀
    2025寧夏沙坡頭半馬收官 神眸無線AI攝像機(jī)打造智能賽道新體驗(yàn)

    AI智能體+AIoT:智能時(shí)代的關(guān)鍵聯(lián)結(jié),還是又一場(chǎng)幻覺與泡沫?

    從大模型的爆發(fā),到邊緣計(jì)算的逐漸普及,從智能語音助手走進(jìn)家庭,到智能設(shè)備接入云端,AI智能體與AIoT的結(jié)合,正成為產(chǎn)業(yè)界的新熱點(diǎn)。但在技術(shù)熱潮的背后,我們必須提出一個(gè)冷靜的問題:我們是為了更好
    的頭像 發(fā)表于 07-11 14:57 ?1894次閱讀
    AI智能體+AIoT:智能時(shí)代的關(guān)鍵聯(lián)結(jié),還是又一場(chǎng)<b class='flag-5'>幻覺</b>與泡沫?

    使用 llm-agent-rag-llamaindex 筆記本時(shí)收到的 NPU 錯(cuò)誤怎么解決?

    使用 conda create -n ov-nb-demos python=3.11 創(chuàng)建運(yùn)行 llm-agent-rag-llamaindex notebook 的環(huán)境。 執(zhí)行“創(chuàng)建
    發(fā)表于 06-23 06:26

    軟通動(dòng)力發(fā)布智慧園區(qū)RAG解決方案

    近日,鯤鵬昇騰開發(fā)者大會(huì)2025(KADC 2025)在北京正式啟幕。軟通動(dòng)力作為鯤鵬路線堅(jiān)定的擁護(hù)者與實(shí)踐者,受邀出席大會(huì),正式發(fā)布軟通動(dòng)力智慧園區(qū)RAG(Retrieval Augmented Generation 檢索增強(qiáng)生成)解決方案。
    的頭像 發(fā)表于 05-29 10:00 ?1001次閱讀
    軟通動(dòng)力發(fā)布智慧園區(qū)<b class='flag-5'>RAG</b>解決方案

    西威端側(cè)大模型重塑智能座艙體驗(yàn)

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴(kuò)張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動(dòng)的智能化升級(jí)將成為產(chǎn)業(yè)突破的核心引擎。在日前召開的2025上海車展國(guó)際汽車關(guān)鍵技術(shù)論壇上,德西威技術(shù)中心人工智能實(shí)驗(yàn)室專家張書赫博士以《端側(cè)智能·重塑體驗(yàn)》為題,分享了對(duì)大模型
    的頭像 發(fā)表于 05-15 09:13 ?1904次閱讀