chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI 軟件TLDR:可用一句話概括文章

ss ? 來源:學術頭條 ? 作者:學術頭條 ? 2020-11-27 17:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要在一篇文章中有著至關重要的作用,它濃縮了整篇文章的精華,可以讓你快速了解該篇文章的研究背景、研究意義和研究亮點,進而決定了你是否會點開這篇文章仔細閱讀。

如果摘要太長或者邏輯混亂,就會失去它讓人快速瀏覽的意義,很有可能讓人忽略掉一篇正文內(nèi)容還不錯的文章。那么,是否可以在摘要的基礎上進一步提煉,用一句話概括文章?

答案是:AI 可以做到。

近日,一款科學搜索引擎在其官網(wǎng)上就推出了這樣一款 AI 軟件——TLDR,即“太長了,沒有讀”(too long,didn’t read)的意思,該軟件可以自動生成研究論文的一句話總結(jié)。這款軟件的開發(fā)者認為,這樣可以幫助研究人員更快地瀏覽論文,減少閱讀摘要的時間。

TLDR 經(jīng)常被用于網(wǎng)上關于科學論文的非正式討論(比如,Twitter 或 Reddit)。

本周,這款軟件在華盛頓州西雅圖的非營利性艾倫人工智能研究所(AI2)創(chuàng)建的搜索引擎 Semantic Scholar 的搜索結(jié)果中開始上線使用。目前,該軟件只為 Semantic Scholar 所覆蓋的 1000 萬篇計算機科學論文生成一句話摘要。

AI2 管理 Semantic Scholar 小組的 Dan Weld 表示,他們目前正在優(yōu)化 TLDR,預計一個月左右的時間后,TLDR 將陸續(xù)涵蓋其他學科領域的論文。

圖 | TLDR 與普通總結(jié)的對比 (來源:Semantic Scholar)

初步測試表明,該工具可以幫助讀者比查看標題和摘要的方式更快地整理搜索結(jié)果,特別是在手機上。

圖 | TLDR 在手機上的效果(來源:Nature)

介紹該軟件的預印本于 4 月 1 日首次發(fā)表在 arXiv 預印本服務器上,并在 11 月舉行的自然語言處理會議上經(jīng)過同行評審后被接收發(fā)表。研究人員免費提供了他們的代碼,以及一個測試 demo,任何人都可以嘗試使用。

圖 | 生成 TLDR 的測試 (來源:SCITDLR)

如何訓練 TLDR?

TLDR 本質(zhì)上就是對科學論文的一種新的總結(jié)。Weld 創(chuàng)建 TLDR 軟件的靈感一部分來自于他的同事,其在 Twitter 上分享標記文章的活潑句子。與其他語言生成軟件一樣,該軟件是利用深度神經(jīng)網(wǎng)絡,通過進行大量的訓練而生成。

圖 | TLDR 的介紹 (來源:arxiv)

為了訓練 TLDR,研究人員準備了 SCITLDR,這是一個多目標數(shù)據(jù)集,包含5411篇TLDR,覆蓋計算機科學領域的 3229 篇科學論文。

其中,訓練集包含 1992 篇論文,每篇論文都有一個“黃金”TLDR,也就是最佳 TLDR。開發(fā)集和測試集分別包含 619 篇和 618 篇論文,分別有 1452 個和 1967 個 TLDR。

通常情況下,總結(jié)數(shù)據(jù)集會假設一個給定文檔只有一個黃金總結(jié),而 SCITLDR 與大多數(shù)現(xiàn)有的總結(jié)數(shù)據(jù)集不同。正如早期的摘要評估工作所證明的那樣,人類撰寫的摘要具有可變性。

將每篇論文只考慮一個黃金 TLDR 作為自動評估的基礎,可能會導致系統(tǒng)質(zhì)量評估不準確,因為可能出現(xiàn)在 TLDR 中的內(nèi)容可能具有很大的可變性。此外,為每份文件提供多個黃金摘要,可以進行更深入的分析和徹底的評估。

為了解決這個問題,SCITLDR 包含了從作者角度撰寫的 TLDR("TLDR-Auth")和從同行評審者角度撰寫的 TLDR("TLDR-PR")。

TLDR-Auth 可在各種在線平臺上獲得。在公開的科學評審平臺 OpenReview.org 上,作者提交其論文的 TLDR,為審稿人和其他感興趣的學者總結(jié)主要內(nèi)容。學者們也會在Twitter 和 Reddit 等社交媒體平臺上分享 TLDR。

TLDR-PR 是將同行評審員已經(jīng)仔細檢查了源論文后寫的評論中的總結(jié)重寫成 TLDR。為了完成這項任務,研究人員從華盛頓大學招募了 28 名計算機科學專業(yè)的本科生,他們有自我報告的閱讀科學論文的經(jīng)驗。在接受一個小時的一對一寫作訓練并篩選后完成 TLDR 的寫作工作。

圖 | TLDR-Auth 和 TLDR-PR的對比(來源:arxiv)

圖 | TLDR-Auth 和 TLDR-PR的對比(來源:arxiv)

TLDR-Auth 和 TLDR-PR 即使包含相同的信息內(nèi)容,也會有很大的差異。總的來說,TLDR-PR 總結(jié)的更為抽象。

引入 CATTS 對 TLDR 進行優(yōu)化

CATTS(Controlled Abstraction for TLDRs with Title Scaffolding),這是一種簡單而有效的學習生成 TLDR 的方法,它可以在以上介紹的數(shù)據(jù)集訓練的基礎上進行補充訓練。該方法解決了兩個主要挑戰(zhàn):(1) 訓練數(shù)據(jù)的大小是有限的;(2) 為了編寫高質(zhì)量的黃金 TLDR,需要領域知識。

為了解決這些挑戰(zhàn),研究人員提出使用科學論文的標題作為額外的生成目標。由于標題通常包含有關論文的關鍵信息,假設訓練模型生成標題將允許它學習如何定位論文中的突出信息,這些信息對生成 TLDR 也很有用。

通過多任務學習納入輔助腳手架任務之前已經(jīng)研究過,用于改進跨度標注和文本分類 。與多任務學習類似,在帶有控制代碼注釋的異質(zhì)數(shù)據(jù)上進行訓練已經(jīng)被證明可以改善自回歸語言模型中的控制生成。

為了讓標題生成完成輔助 TLDR 生成的任務,研究人員提出用標題生成數(shù)據(jù)集洗牌 SCITLDR,然后分別用控制代碼 <|TLDR|> 和 <|TITLE|> 附加每個源。這使得模型的參數(shù)可以學習生成 TLDR 和標題。在生成時,適當?shù)目刂拼a被附加到源中。此外,上采樣特定任務可以被視為應用特定任務的權(quán)重,類似于多任務學習設置中的權(quán)重損失。

圖 | CATTS引入可視化(來源:arxiv)

對 TLDR 未來的期待

"我預測,在不久的將來,這種工具將成為學術搜索的標準功能。事實上,考慮到科研人員實際的需求,我很驚訝等了這么長時間才看到它的實際應用。" 西雅圖華盛頓大學的信息科學家杰文 - 韋斯特(Jevin West)說,他應《自然》雜志的要求測試了該工具。"雖然它并不完美,但它絕對是朝著正確方向邁出的重要一步。" 他說。

Weld 指出,TLDR 軟件并不是唯一的科學總結(jié)工具:自 2018 年以來,網(wǎng)站 Paper Digest 也一直提供論文摘要,但它似乎是從文本中提取關鍵句子,而不是生成新句子。

TLDR 可以從論文的摘要、引言和結(jié)論中生成一句話。它的摘要往往是根據(jù)文章文本中的關鍵短語建立起來的,所以它的受眾人群是已經(jīng)了解論文行話的專業(yè)的科研人員。對于普通人來說,閱讀起來依舊存在一些難度。但 Weld 表示,該團隊正在努力為非專家受眾提供更為簡單易懂的升級版產(chǎn)品。

研究人員還計劃將該技術授權(quán)給出版商,并將其服務擴展到提供個性化的研究簡報,總結(jié)某個領域的關鍵論文。"我們只是到了人工智能可以以人們可以接受的水平生成新穎的摘要的階段,"Weld 說。

責任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 軟件
    +關注

    關注

    69

    文章

    5329

    瀏覽量

    91500
  • AI
    AI
    +關注

    關注

    91

    文章

    39535

    瀏覽量

    301080
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    小藝開放平臺鴻蒙智能體開發(fā)智能體配置-基礎信息

    創(chuàng)建智能體后,開發(fā)者可以進入智能體配置頁面對智能體基礎信息進行編輯。支持編輯智能體圖標、智能體名稱、智能體一句話描述、智能體支持的設備和系統(tǒng)、創(chuàng)建者昵稱、智能體分類、智能體別名、AgentCard
    發(fā)表于 02-02 16:47

    SeaVerse發(fā)布全球首個AI Native平臺,“All in AI Native”引領AI創(chuàng)作前瞻革命

    建設實現(xiàn)"只通過一句話"就能將所有的創(chuàng)意封裝成產(chǎn)品,無論它是Demo,應用,還是網(wǎng)頁。開發(fā)團隊表示,SeaVerse是為了解決現(xiàn)在AI工具多且雜、能力各有不同的問題而出現(xiàn)的,而
    的頭像 發(fā)表于 01-14 17:41 ?1206次閱讀

    EMMI-InGaAs 與 OBIRCH:分鐘教你看懂兩款失效定位設備原理與應用

    一句話區(qū)別總結(jié) EMMI 看光 → 漏電、擊穿這類“會發(fā)光的異常” OBIRCH 看熱 → 金屬短路、高阻這類“無光但致命的問題”
    的頭像 發(fā)表于 12-05 16:21 ?873次閱讀
    EMMI-InGaAs 與 OBIRCH:<b class='flag-5'>一</b>分鐘教你看懂兩款失效定位設備原理與應用

    為啥 AI 計算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計算

    ”。比如張圖片里的每個像素、段語音里的每段聲波、一句話里的每個詞,都得單獨拿出來計算。而且這些任務可不是幾十個,而是幾百萬、幾億甚至更多,數(shù)量特別驚人。CPUG
    的頭像 發(fā)表于 12-05 14:35 ?825次閱讀
    為啥 <b class='flag-5'>AI</b> 計算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計算

    儲能,不只是存電那么簡單

    、到底啥是儲能? 一句話概括:儲能,就是把能量先存起來,等到需要的時候再拿出來用的技術。 您可以把它想象成個超級“能量銀行”或“能量充電寶”。 充電(儲存能量):當能量充足、便宜甚
    的頭像 發(fā)表于 11-06 16:49 ?1237次閱讀
    儲能,不只是存電那么簡單

    一句話,多個命令同時執(zhí)行,AI語音模組也能多任務處理?

    -WV01-32S 、 Ai-WV02-32S ? 將語音識別、喚醒、語義理解等核心功能, 濃縮在顆小小的模組中。 安信可AI語音模組支持 MCP 協(xié)議(Multi Command Processing,多命令并行處理) ,讓
    的頭像 發(fā)表于 10-31 14:45 ?510次閱讀
    <b class='flag-5'>一句話</b>,多個命令同時執(zhí)行,<b class='flag-5'>AI</b>語音模組也能多任務處理?

    真正免費的AI生成PPT工具盤點:告別收費陷阱

    的戰(zhàn)斗機",其他9款工具也各有絕活,保證讓你告別收費陷阱,輕松做出專業(yè)級PPT! 、AiPPT:一句話生成PPT的"時間管理大師" 一句話生成,分鐘出片 作為北京餅干科技旗下的"
    的頭像 發(fā)表于 10-30 15:43 ?6492次閱讀
    真正免費的<b class='flag-5'>AI</b>生成PPT工具盤點:告別收費陷阱

    示波器問題解答干貨

    問:示波器的波形代表什么意義? 一句話概括:水平坐標代表時間,垂直坐標代表電壓(般是電壓),電壓隨時間變化的曲線就是示波器顯示的波形。 垂直坐標比較好理解,就是電壓的大小。水平坐
    的頭像 發(fā)表于 10-13 14:51 ?823次閱讀
    示波器問題解答干貨

    智多晶SA5T-200 FPGA開發(fā)板重磅發(fā)布

    在科技飛速發(fā)展的今天,硬件與軟件的融合正不斷重塑我們的世界。而在芯片領域,流傳著這樣一句話:“軟件定義世界,F(xiàn)PGA定義未來”。
    的頭像 發(fā)表于 10-11 11:45 ?903次閱讀

    批準L3級自動駕駛上路意味著什么?

    [首發(fā)于智駕最前沿微信公眾號]最近,工業(yè)和信息化部等八部門印發(fā)的《汽車行業(yè)穩(wěn)增長工作方案(2025—2026年)》里有一句話,引起了不少人的注意,那就是“有條件批準L3級車型生產(chǎn)準入”??此撇唤?jīng)意
    的頭像 發(fā)表于 09-16 09:28 ?738次閱讀
    批準L3級自動駕駛上路意味著什么?

    一句話了解21種計算模式

    、智能化趨勢、安全與可持續(xù)四個維度,梳理了21種計算模式,并盡量用通俗易懂的一句話向您介紹每種模式的定義。架構(gòu)與資源維度并行計算:把大任務拆成多個小任務,讓多顆處理器
    的頭像 發(fā)表于 08-06 14:31 ?723次閱讀
    <b class='flag-5'>一句話</b>了解21種計算模式

    2025 AI主戰(zhàn)場,連鎖門店“變形記”

    讓業(yè)務駕馭AI,當大模型的價值通過“取漢堡更快”“一句話點咖啡”來實現(xiàn),這場技術變革才算真正落地
    的頭像 發(fā)表于 07-24 12:41 ?1256次閱讀
    2025 <b class='flag-5'>AI</b>主戰(zhàn)場,連鎖門店“變形記”

    一句話秒出PPT“的榮耀YOYO,AI生產(chǎn)力有多強?

    釋放AI生產(chǎn)力,榮耀讓智能體告別發(fā)布會炫技
    的頭像 發(fā)表于 07-14 14:15 ?2582次閱讀
    “<b class='flag-5'>一句話</b>秒出PPT“的榮耀YOYO,<b class='flag-5'>AI</b>生產(chǎn)力有多強?

    CYW55513是否支持linux4.4?

    開始支持55513的驅(qū)動版本是Infineon Linux Wi-Fi驅(qū)動程序(FMAC)(v2024_1115) 但在發(fā)行說明中有一句話 從內(nèi)核版本 4.14 到內(nèi)核版本 6.1.97 的反向移植支持 說明backport是不支持4.4的,我想確認下是否有驅(qū)動能支持l
    發(fā)表于 06-05 07:26

    使用FX3 SDK發(fā)布源代碼是否違反許可?

    使用 FX3 SDK 發(fā)布源代碼是否違反許可? CYPRESS?EZ-USB? FX3 SDK1.3licenselicense.txt ”4. 專有權(quán)利; 到“您同意對源代碼保密?!?那里寫著一句話,所以我想問下以確定。
    發(fā)表于 05-08 06:54