chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI 軟件TLDR:可用一句話概括文章

ss ? 來源:學(xué)術(shù)頭條 ? 作者:學(xué)術(shù)頭條 ? 2020-11-27 17:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要在一篇文章中有著至關(guān)重要的作用,它濃縮了整篇文章的精華,可以讓你快速了解該篇文章的研究背景、研究意義和研究亮點(diǎn),進(jìn)而決定了你是否會(huì)點(diǎn)開這篇文章仔細(xì)閱讀。

如果摘要太長(zhǎng)或者邏輯混亂,就會(huì)失去它讓人快速瀏覽的意義,很有可能讓人忽略掉一篇正文內(nèi)容還不錯(cuò)的文章。那么,是否可以在摘要的基礎(chǔ)上進(jìn)一步提煉,用一句話概括文章?

答案是:AI 可以做到。

近日,一款科學(xué)搜索引擎在其官網(wǎng)上就推出了這樣一款 AI 軟件——TLDR,即“太長(zhǎng)了,沒有讀”(too long,didn’t read)的意思,該軟件可以自動(dòng)生成研究論文的一句話總結(jié)。這款軟件的開發(fā)者認(rèn)為,這樣可以幫助研究人員更快地瀏覽論文,減少閱讀摘要的時(shí)間。

TLDR 經(jīng)常被用于網(wǎng)上關(guān)于科學(xué)論文的非正式討論(比如,Twitter 或 Reddit)。

本周,這款軟件在華盛頓州西雅圖的非營(yíng)利性艾倫人工智能研究所(AI2)創(chuàng)建的搜索引擎 Semantic Scholar 的搜索結(jié)果中開始上線使用。目前,該軟件只為 Semantic Scholar 所覆蓋的 1000 萬篇計(jì)算機(jī)科學(xué)論文生成一句話摘要。

AI2 管理 Semantic Scholar 小組的 Dan Weld 表示,他們目前正在優(yōu)化 TLDR,預(yù)計(jì)一個(gè)月左右的時(shí)間后,TLDR 將陸續(xù)涵蓋其他學(xué)科領(lǐng)域的論文。

圖 | TLDR 與普通總結(jié)的對(duì)比 (來源:Semantic Scholar)

初步測(cè)試表明,該工具可以幫助讀者比查看標(biāo)題和摘要的方式更快地整理搜索結(jié)果,特別是在手機(jī)上。

圖 | TLDR 在手機(jī)上的效果(來源:Nature)

介紹該軟件的預(yù)印本于 4 月 1 日首次發(fā)表在 arXiv 預(yù)印本服務(wù)器上,并在 11 月舉行的自然語言處理會(huì)議上經(jīng)過同行評(píng)審后被接收發(fā)表。研究人員免費(fèi)提供了他們的代碼,以及一個(gè)測(cè)試 demo,任何人都可以嘗試使用。

圖 | 生成 TLDR 的測(cè)試 (來源:SCITDLR)

如何訓(xùn)練 TLDR?

TLDR 本質(zhì)上就是對(duì)科學(xué)論文的一種新的總結(jié)。Weld 創(chuàng)建 TLDR 軟件的靈感一部分來自于他的同事,其在 Twitter 上分享標(biāo)記文章的活潑句子。與其他語言生成軟件一樣,該軟件是利用深度神經(jīng)網(wǎng)絡(luò),通過進(jìn)行大量的訓(xùn)練而生成。

圖 | TLDR 的介紹 (來源:arxiv)

為了訓(xùn)練 TLDR,研究人員準(zhǔn)備了 SCITLDR,這是一個(gè)多目標(biāo)數(shù)據(jù)集,包含5411篇TLDR,覆蓋計(jì)算機(jī)科學(xué)領(lǐng)域的 3229 篇科學(xué)論文。

其中,訓(xùn)練集包含 1992 篇論文,每篇論文都有一個(gè)“黃金”TLDR,也就是最佳 TLDR。開發(fā)集和測(cè)試集分別包含 619 篇和 618 篇論文,分別有 1452 個(gè)和 1967 個(gè) TLDR。

通常情況下,總結(jié)數(shù)據(jù)集會(huì)假設(shè)一個(gè)給定文檔只有一個(gè)黃金總結(jié),而 SCITLDR 與大多數(shù)現(xiàn)有的總結(jié)數(shù)據(jù)集不同。正如早期的摘要評(píng)估工作所證明的那樣,人類撰寫的摘要具有可變性。

將每篇論文只考慮一個(gè)黃金 TLDR 作為自動(dòng)評(píng)估的基礎(chǔ),可能會(huì)導(dǎo)致系統(tǒng)質(zhì)量評(píng)估不準(zhǔn)確,因?yàn)榭赡艹霈F(xiàn)在 TLDR 中的內(nèi)容可能具有很大的可變性。此外,為每份文件提供多個(gè)黃金摘要,可以進(jìn)行更深入的分析和徹底的評(píng)估。

為了解決這個(gè)問題,SCITLDR 包含了從作者角度撰寫的 TLDR("TLDR-Auth")和從同行評(píng)審者角度撰寫的 TLDR("TLDR-PR")。

TLDR-Auth 可在各種在線平臺(tái)上獲得。在公開的科學(xué)評(píng)審平臺(tái) OpenReview.org 上,作者提交其論文的 TLDR,為審稿人和其他感興趣的學(xué)者總結(jié)主要內(nèi)容。學(xué)者們也會(huì)在Twitter 和 Reddit 等社交媒體平臺(tái)上分享 TLDR。

TLDR-PR 是將同行評(píng)審員已經(jīng)仔細(xì)檢查了源論文后寫的評(píng)論中的總結(jié)重寫成 TLDR。為了完成這項(xiàng)任務(wù),研究人員從華盛頓大學(xué)招募了 28 名計(jì)算機(jī)科學(xué)專業(yè)的本科生,他們有自我報(bào)告的閱讀科學(xué)論文的經(jīng)驗(yàn)。在接受一個(gè)小時(shí)的一對(duì)一寫作訓(xùn)練并篩選后完成 TLDR 的寫作工作。

圖 | TLDR-Auth 和 TLDR-PR的對(duì)比(來源:arxiv)

圖 | TLDR-Auth 和 TLDR-PR的對(duì)比(來源:arxiv)

TLDR-Auth 和 TLDR-PR 即使包含相同的信息內(nèi)容,也會(huì)有很大的差異??偟膩碚f,TLDR-PR 總結(jié)的更為抽象。

引入 CATTS 對(duì) TLDR 進(jìn)行優(yōu)化

CATTS(Controlled Abstraction for TLDRs with Title Scaffolding),這是一種簡(jiǎn)單而有效的學(xué)習(xí)生成 TLDR 的方法,它可以在以上介紹的數(shù)據(jù)集訓(xùn)練的基礎(chǔ)上進(jìn)行補(bǔ)充訓(xùn)練。該方法解決了兩個(gè)主要挑戰(zhàn):(1) 訓(xùn)練數(shù)據(jù)的大小是有限的;(2) 為了編寫高質(zhì)量的黃金 TLDR,需要領(lǐng)域知識(shí)。

為了解決這些挑戰(zhàn),研究人員提出使用科學(xué)論文的標(biāo)題作為額外的生成目標(biāo)。由于標(biāo)題通常包含有關(guān)論文的關(guān)鍵信息,假設(shè)訓(xùn)練模型生成標(biāo)題將允許它學(xué)習(xí)如何定位論文中的突出信息,這些信息對(duì)生成 TLDR 也很有用。

通過多任務(wù)學(xué)習(xí)納入輔助腳手架任務(wù)之前已經(jīng)研究過,用于改進(jìn)跨度標(biāo)注和文本分類 。與多任務(wù)學(xué)習(xí)類似,在帶有控制代碼注釋的異質(zhì)數(shù)據(jù)上進(jìn)行訓(xùn)練已經(jīng)被證明可以改善自回歸語言模型中的控制生成。

為了讓標(biāo)題生成完成輔助 TLDR 生成的任務(wù),研究人員提出用標(biāo)題生成數(shù)據(jù)集洗牌 SCITLDR,然后分別用控制代碼 <|TLDR|> 和 <|TITLE|> 附加每個(gè)源。這使得模型的參數(shù)可以學(xué)習(xí)生成 TLDR 和標(biāo)題。在生成時(shí),適當(dāng)?shù)目刂拼a被附加到源中。此外,上采樣特定任務(wù)可以被視為應(yīng)用特定任務(wù)的權(quán)重,類似于多任務(wù)學(xué)習(xí)設(shè)置中的權(quán)重?fù)p失。

圖 | CATTS引入可視化(來源:arxiv)

對(duì) TLDR 未來的期待

"我預(yù)測(cè),在不久的將來,這種工具將成為學(xué)術(shù)搜索的標(biāo)準(zhǔn)功能。事實(shí)上,考慮到科研人員實(shí)際的需求,我很驚訝等了這么長(zhǎng)時(shí)間才看到它的實(shí)際應(yīng)用。" 西雅圖華盛頓大學(xué)的信息科學(xué)家杰文 - 韋斯特(Jevin West)說,他應(yīng)《自然》雜志的要求測(cè)試了該工具。"雖然它并不完美,但它絕對(duì)是朝著正確方向邁出的重要一步。" 他說。

Weld 指出,TLDR 軟件并不是唯一的科學(xué)總結(jié)工具:自 2018 年以來,網(wǎng)站 Paper Digest 也一直提供論文摘要,但它似乎是從文本中提取關(guān)鍵句子,而不是生成新句子。

TLDR 可以從論文的摘要、引言和結(jié)論中生成一句話。它的摘要往往是根據(jù)文章文本中的關(guān)鍵短語建立起來的,所以它的受眾人群是已經(jīng)了解論文行話的專業(yè)的科研人員。對(duì)于普通人來說,閱讀起來依舊存在一些難度。但 Weld 表示,該團(tuán)隊(duì)正在努力為非專家受眾提供更為簡(jiǎn)單易懂的升級(jí)版產(chǎn)品。

研究人員還計(jì)劃將該技術(shù)授權(quán)給出版商,并將其服務(wù)擴(kuò)展到提供個(gè)性化的研究簡(jiǎn)報(bào),總結(jié)某個(gè)領(lǐng)域的關(guān)鍵論文。"我們只是到了人工智能可以以人們可以接受的水平生成新穎的摘要的階段,"Weld 說。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5329

    瀏覽量

    91500
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39535

    瀏覽量

    301080
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小藝開放平臺(tái)鴻蒙智能體開發(fā)智能體配置-基礎(chǔ)信息

    創(chuàng)建智能體后,開發(fā)者可以進(jìn)入智能體配置頁面對(duì)智能體基礎(chǔ)信息進(jìn)行編輯。支持編輯智能體圖標(biāo)、智能體名稱、智能體一句話描述、智能體支持的設(shè)備和系統(tǒng)、創(chuàng)建者昵稱、智能體分類、智能體別名、AgentCard
    發(fā)表于 02-02 16:47

    SeaVerse發(fā)布全球首個(gè)AI Native平臺(tái),“All in AI Native”引領(lǐng)AI創(chuàng)作前瞻革命

    建設(shè)實(shí)現(xiàn)"只通過一句話"就能將所有的創(chuàng)意封裝成產(chǎn)品,無論它是Demo,應(yīng)用,還是網(wǎng)頁。開發(fā)團(tuán)隊(duì)表示,SeaVerse是為了解決現(xiàn)在AI工具多且雜、能力各有不同的問題而出現(xiàn)的,而
    的頭像 發(fā)表于 01-14 17:41 ?1206次閱讀

    EMMI-InGaAs 與 OBIRCH:分鐘教你看懂兩款失效定位設(shè)備原理與應(yīng)用

    一句話區(qū)別總結(jié) EMMI 看光 → 漏電、擊穿這類“會(huì)發(fā)光的異?!? OBIRCH 看熱 → 金屬短路、高阻這類“無光但致命的問題”
    的頭像 發(fā)表于 12-05 16:21 ?873次閱讀
    EMMI-InGaAs 與 OBIRCH:<b class='flag-5'>一</b>分鐘教你看懂兩款失效定位設(shè)備原理與應(yīng)用

    為啥 AI 計(jì)算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計(jì)算

    ”。比如張圖片里的每個(gè)像素、段語音里的每段聲波、一句話里的每個(gè)詞,都得單獨(dú)拿出來計(jì)算。而且這些任務(wù)可不是幾十個(gè),而是幾百萬、幾億甚至更多,數(shù)量特別驚人。CPUG
    的頭像 發(fā)表于 12-05 14:35 ?825次閱讀
    為啥 <b class='flag-5'>AI</b> 計(jì)算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計(jì)算

    儲(chǔ)能,不只是存電那么簡(jiǎn)單

    、到底啥是儲(chǔ)能? 一句話概括:儲(chǔ)能,就是把能量先存起來,等到需要的時(shí)候再拿出來用的技術(shù)。 您可以把它想象成個(gè)超級(jí)“能量銀行”或“能量充電寶”。 充電(儲(chǔ)存能量):當(dāng)能量充足、便宜甚
    的頭像 發(fā)表于 11-06 16:49 ?1237次閱讀
    儲(chǔ)能,不只是存電那么簡(jiǎn)單

    一句話,多個(gè)命令同時(shí)執(zhí)行,AI語音模組也能多任務(wù)處理?

    -WV01-32S 、 Ai-WV02-32S ? 將語音識(shí)別、喚醒、語義理解等核心功能, 濃縮在顆小小的模組中。 安信可AI語音模組支持 MCP 協(xié)議(Multi Command Processing,多命令并行處理) ,讓
    的頭像 發(fā)表于 10-31 14:45 ?510次閱讀
    <b class='flag-5'>一句話</b>,多個(gè)命令同時(shí)執(zhí)行,<b class='flag-5'>AI</b>語音模組也能多任務(wù)處理?

    真正免費(fèi)的AI生成PPT工具盤點(diǎn):告別收費(fèi)陷阱

    的戰(zhàn)斗機(jī)",其他9款工具也各有絕活,保證讓你告別收費(fèi)陷阱,輕松做出專業(yè)級(jí)PPT! 、AiPPT:一句話生成PPT的"時(shí)間管理大師" 一句話生成,分鐘出片 作為北京餅干科技旗下的"
    的頭像 發(fā)表于 10-30 15:43 ?6492次閱讀
    真正免費(fèi)的<b class='flag-5'>AI</b>生成PPT工具盤點(diǎn):告別收費(fèi)陷阱

    示波器問題解答干貨

    問:示波器的波形代表什么意義? 一句話概括:水平坐標(biāo)代表時(shí)間,垂直坐標(biāo)代表電壓(般是電壓),電壓隨時(shí)間變化的曲線就是示波器顯示的波形。 垂直坐標(biāo)比較好理解,就是電壓的大小。水平坐
    的頭像 發(fā)表于 10-13 14:51 ?823次閱讀
    示波器問題解答干貨

    智多晶SA5T-200 FPGA開發(fā)板重磅發(fā)布

    在科技飛速發(fā)展的今天,硬件與軟件的融合正不斷重塑我們的世界。而在芯片領(lǐng)域,流傳著這樣一句話:“軟件定義世界,F(xiàn)PGA定義未來”。
    的頭像 發(fā)表于 10-11 11:45 ?903次閱讀

    批準(zhǔn)L3級(jí)自動(dòng)駕駛上路意味著什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]最近,工業(yè)和信息化部等八部門印發(fā)的《汽車行業(yè)穩(wěn)增長(zhǎng)工作方案(2025—2026年)》里有一句話,引起了不少人的注意,那就是“有條件批準(zhǔn)L3級(jí)車型生產(chǎn)準(zhǔn)入”。看似不經(jīng)意
    的頭像 發(fā)表于 09-16 09:28 ?738次閱讀
    批準(zhǔn)L3級(jí)自動(dòng)駕駛上路意味著什么?

    一句話了解21種計(jì)算模式

    、智能化趨勢(shì)、安全與可持續(xù)四個(gè)維度,梳理了21種計(jì)算模式,并盡量用通俗易懂的一句話向您介紹每種模式的定義。架構(gòu)與資源維度并行計(jì)算:把大任務(wù)拆成多個(gè)小任務(wù),讓多顆處理器
    的頭像 發(fā)表于 08-06 14:31 ?723次閱讀
    <b class='flag-5'>一句話</b>了解21種計(jì)算模式

    2025 AI主戰(zhàn)場(chǎng),連鎖門店“變形記”

    讓業(yè)務(wù)駕馭AI,當(dāng)大模型的價(jià)值通過“取漢堡更快”“一句話點(diǎn)咖啡”來實(shí)現(xiàn),這場(chǎng)技術(shù)變革才算真正落地
    的頭像 發(fā)表于 07-24 12:41 ?1256次閱讀
    2025 <b class='flag-5'>AI</b>主戰(zhàn)場(chǎng),連鎖門店“變形記”

    一句話秒出PPT“的榮耀YOYO,AI生產(chǎn)力有多強(qiáng)?

    釋放AI生產(chǎn)力,榮耀讓智能體告別發(fā)布會(huì)炫技
    的頭像 發(fā)表于 07-14 14:15 ?2582次閱讀
    “<b class='flag-5'>一句話</b>秒出PPT“的榮耀YOYO,<b class='flag-5'>AI</b>生產(chǎn)力有多強(qiáng)?

    CYW55513是否支持linux4.4?

    開始支持55513的驅(qū)動(dòng)版本是Infineon Linux Wi-Fi驅(qū)動(dòng)程序(FMAC)(v2024_1115) 但在發(fā)行說明中有一句話 從內(nèi)核版本 4.14 到內(nèi)核版本 6.1.97 的反向移植支持 說明backport是不支持4.4的,我想確認(rèn)下是否有驅(qū)動(dòng)能支持l
    發(fā)表于 06-05 07:26

    使用FX3 SDK發(fā)布源代碼是否違反許可?

    使用 FX3 SDK 發(fā)布源代碼是否違反許可? CYPRESS?EZ-USB? FX3 SDK1.3licenselicense.txt ”4. 專有權(quán)利; 到“您同意對(duì)源代碼保密?!?那里寫著一句話,所以我想問下以確定。
    發(fā)表于 05-08 06:54