沈阳45老熟女高潮叫声没谁了,一级A爱免费视频在线观看,成人国产在线观看不卡

復(fù)旦大學自然語言處理實驗室桂韜、張奇課題組發(fā)布信息抽取統(tǒng)一大模型 Instruct-UIE，在領(lǐng)域大模型上取得突破性進展。Instruct-UIE 在信息抽取精度上全面大幅度超越ChatGPT以及基于預(yù)訓練微調(diào)的單一小模型。

自2022年11月 ChatGPT 橫空出世以來，其在對話、閱讀理解、對話、代碼生成等方面優(yōu)異性能，受到了極大的關(guān)注。大模型所展現(xiàn)出來的長文本建模能力以及多任務(wù)統(tǒng)一學習能力使得自然語言處理范式正在發(fā)生快速變革。

在對 GPT 系列工作進行了詳細分析[1][2]后，我們發(fā)現(xiàn)雖然 ChatGPT 在很多任務(wù)上都展現(xiàn)出了良好的性能，但是在包括命名實體識別、關(guān)系抽取、事件抽取等在工業(yè)界有廣泛應(yīng)用的信息抽取任務(wù)上效果卻亟待提升。ChatGPT 在某些命名實體識別數(shù)據(jù)集合上的的精度甚至只有不到20%。但是大模型所展示出來的多任務(wù)統(tǒng)一學習能力，驅(qū)使我們針對信息抽取領(lǐng)域的統(tǒng)一大模開展了深入研究。

實驗結(jié) 果

針對信息抽取任務(wù)，我們收集了包括 ACE 2005、ConLL 2003 等在內(nèi)的41種評測集合，針對Flan-T5、Bloomz、LLama 等大模型進行了系統(tǒng)研究，構(gòu)建了信息抽取統(tǒng)一大模型Instruct-UIE。該模型在絕大部分信息抽取任務(wù)中（85%以上）都超越了單個小模型的預(yù)訓練微調(diào)結(jié)果。

Instruct-UIE 統(tǒng)一了信息抽取任務(wù)訓練方法，可以融合不同類型任務(wù)以及不同的標注規(guī)范，統(tǒng)一進行訓練。針對新的任務(wù)需求，僅需要少量的數(shù)據(jù)進行增量式學習，即可完成模型的升級。

小模型時代任務(wù)，模型開發(fā)需要經(jīng)過標注數(shù)據(jù)，訓練模型，模型評測和模型部署等多個步驟。其顯著缺點是成本高、時間周期長；相同任務(wù)的微小需求變化，需要30%-70%的重新開發(fā)成本；模型開發(fā)和維護成本高等問題都極大地制約了自然語言處理產(chǎn)品化。

而在大模型時代，我們可以將大量各類型任務(wù)，統(tǒng)一為生成式自然語言理解框架，并構(gòu)造訓練語料進行微調(diào)。由于大模型所展現(xiàn)出來的通用任務(wù)理解能力和未知任務(wù)泛化能力，使得未來自然語言處理的研究范式進一步發(fā)生變化。這樣的研究范式使得小模型時代所面臨的問題可以在一定程度上可以得到解決。針對新任務(wù)和需求，基于大模型的方法可以快速訓練，并且不需要部署新的模型，從而實現(xiàn)自然語言處理的低成本產(chǎn)品化。

InstructUIE 工作驗證了領(lǐng)域大模型的可行性，針對B端場景，百億級領(lǐng)域模型具有高效、成本低、可私有化部署等優(yōu)勢，在行業(yè)應(yīng)用中具有廣闊前景。我們將近期開源相關(guān)代碼和模型。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3810

瀏覽量
52253
自然語言處理

自然語言處理

+關(guān)注

關(guān)注
1

文章
630

瀏覽量
14712
ChatGPT

ChatGPT

+關(guān)注

關(guān)注
31

文章
1599

瀏覽量
10388

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

Instruct-UIE：信息抽取統(tǒng)一大模型

評論