chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用領(lǐng)域大規(guī)模條件性知識(shí)圖譜數(shù)據(jù)集

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:哈工大SCIR 張寧 ? 作者:哈工大SCIR 張寧 ? 2021-06-08 15:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.摘要

本數(shù)據(jù)集由哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心(哈工大SCIR)秦兵教授和劉銘教授主持開(kāi)發(fā),是一個(gè)通用領(lǐng)域大規(guī)模條件性知識(shí)圖譜數(shù)據(jù)集。本數(shù)據(jù)集源自于AG News文本分類(lèi)語(yǔ)料,包含四個(gè)類(lèi)別,2440 條數(shù)據(jù),每條數(shù)據(jù)都是人工標(biāo)注的條件知識(shí)圖譜。該數(shù)據(jù)集的提出能夠?yàn)闂l件性知識(shí)圖譜的研究提供數(shù)據(jù)支持。

2.條件性知識(shí)圖譜

在大多數(shù)情況下,事實(shí)的成立都是有條件的。條件和事實(shí)起著同樣重要的作用,然而目前的知識(shí)圖譜只關(guān)注事實(shí)而忽略了條件的存在。與此同時(shí),信息提取技術(shù)也只關(guān)注從給定文本中提取事實(shí),而忽略了條件信息。

為了能夠讓知識(shí)圖譜建模條件信息更加充分,我們提出了一個(gè)三層的網(wǎng)絡(luò)結(jié)構(gòu)條件性知識(shí)圖譜(Conditional-KG)。條件性知識(shí)圖譜和傳統(tǒng)知識(shí)圖譜都是由三元組組成,但是條件性知識(shí)圖譜同時(shí)包含事實(shí)元組和條件元組,以及元組之間的條件關(guān)系。

3.數(shù)據(jù)集

為了支持條件性知識(shí)圖譜的研究,我們手動(dòng)標(biāo)注了一個(gè)條件性知識(shí)圖譜數(shù)據(jù)集。我們選擇了AG News文本分類(lèi)語(yǔ)料作為條件性知識(shí)圖譜的語(yǔ)料。AG News語(yǔ)料具有三大優(yōu)勢(shì):

AG News中的數(shù)據(jù)是新聞的標(biāo)題和一部分正文,每條數(shù)據(jù)平均包含2.1個(gè)句子、6.4個(gè)元組和3.5個(gè)條件關(guān)系;

AG News中的數(shù)據(jù)具有完整的語(yǔ)法結(jié)構(gòu),長(zhǎng)度較長(zhǎng),語(yǔ)言嚴(yán)謹(jǐn),代詞、口語(yǔ)、習(xí)語(yǔ)等較少。

AG News的文本數(shù)量足夠大,多樣性豐富。它包含12萬(wàn)條訓(xùn)練數(shù)據(jù)和7600條測(cè)試數(shù)據(jù),涉及World、Sports、Business、 和Sci/Tech四個(gè)類(lèi)別。

我們標(biāo)注的數(shù)據(jù)集追求信息的完整性和元組的原子性。完整性的意思是標(biāo)注者應(yīng)該嘗試從句子中提取所有斷言和條件,我們將原子性定義為每個(gè)元組必須是一個(gè)不可分割的單元。只要有可能,標(biāo)注者必須從帶有連詞的句子中提取多個(gè)原子元組。

我們通過(guò)兩輪標(biāo)注最終得到了人工標(biāo)注的通用領(lǐng)域條件性知識(shí)圖譜數(shù)據(jù)集。本數(shù)據(jù)集源自于AG News文本分類(lèi)語(yǔ)料,包含四個(gè)類(lèi)別,2440 條數(shù)據(jù),每條數(shù)據(jù)都是人工標(biāo)注的條件知識(shí)圖譜。

4.結(jié)語(yǔ)

為了建模條件信息,我們提出了一個(gè)具有三層網(wǎng)絡(luò)結(jié)構(gòu)的條件性知識(shí)圖譜,并且為社區(qū)貢獻(xiàn)了一個(gè)人工標(biāo)注的通用領(lǐng)域大規(guī)模條件性知識(shí)圖譜。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26171
  • 知識(shí)圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8305

原文標(biāo)題:賽爾筆記 | 通用領(lǐng)域條件性知識(shí)圖譜數(shù)據(jù)集

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球首個(gè)最大規(guī)模跨本體視觸覺(jué)多模態(tài)數(shù)據(jù)白虎-VTouch發(fā)布

    全球首個(gè)最大規(guī)模跨本體視觸覺(jué)多模態(tài)數(shù)據(jù)——白虎-VTouch(Vision-Based Tactile Sensor),總規(guī)模超過(guò)60,000分鐘。
    的頭像 發(fā)表于 01-29 14:41 ?405次閱讀

    SimData:基于aiSim的高保真虛擬數(shù)據(jù)生成方案

    01前言在自動(dòng)駕駛感知系統(tǒng)的研發(fā)過(guò)程中,模型的性能高度依賴(lài)于大規(guī)模、高質(zhì)量的感知數(shù)據(jù)。目前業(yè)界常用的數(shù)據(jù)包括KITTI、nuScenes
    的頭像 發(fā)表于 11-07 17:35 ?5342次閱讀
    SimData:基于aiSim的高保真虛擬<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>生成方案

    TensorRT-LLM的大規(guī)模專(zhuān)家并行架構(gòu)設(shè)計(jì)

    之前文章已介紹引入大規(guī)模 EP 的初衷,本篇將繼續(xù)深入介紹 TensorRT-LLM 的大規(guī)模專(zhuān)家并行架構(gòu)設(shè)計(jì)與創(chuàng)新實(shí)現(xiàn)。
    的頭像 發(fā)表于 09-23 14:42 ?1073次閱讀
    TensorRT-LLM的<b class='flag-5'>大規(guī)模</b>專(zhuān)家并行架構(gòu)設(shè)計(jì)

    大規(guī)模專(zhuān)家并行模型在TensorRT-LLM的設(shè)計(jì)

    DeepSeek-V3 / R1 等模型采用大規(guī)模細(xì)粒度混合專(zhuān)家模型 (MoE) 架構(gòu),大幅提升了開(kāi)源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)布的開(kāi)源模型的設(shè)計(jì)原則也采用了類(lèi)似的大規(guī)模細(xì)粒度 MoE 架構(gòu)。但大規(guī)模 M
    的頭像 發(fā)表于 09-06 15:21 ?1192次閱讀
    <b class='flag-5'>大規(guī)模</b>專(zhuān)家并行模型在TensorRT-LLM的設(shè)計(jì)

    基于大規(guī)模人類(lèi)操作數(shù)據(jù)預(yù)訓(xùn)練的VLA模型H-RDT

    近年來(lái),機(jī)器人操作領(lǐng)域的VLA模型普遍基于跨本體機(jī)器人數(shù)據(jù)預(yù)訓(xùn)練,這類(lèi)方法存在兩大局限:不同機(jī)器人本體和動(dòng)作空間的差異導(dǎo)致統(tǒng)一訓(xùn)練困難;現(xiàn)有大規(guī)模機(jī)器人演示
    的頭像 發(fā)表于 08-21 09:56 ?1046次閱讀
    基于<b class='flag-5'>大規(guī)模</b>人類(lèi)操作<b class='flag-5'>數(shù)據(jù)</b>預(yù)訓(xùn)練的VLA模型H-RDT

    偉創(chuàng)力高效電源模塊在超大規(guī)模數(shù)據(jù)中心的應(yīng)用

    受云端存儲(chǔ)和數(shù)據(jù)處理需求持續(xù)增長(zhǎng)的推動(dòng),數(shù)據(jù)中心正以前所未有的速度擴(kuò)張。當(dāng)前全球超大規(guī)模數(shù)據(jù)中心,即規(guī)模最大的那些數(shù)據(jù)中心,總?cè)萘吭谶^(guò)去四年
    的頭像 發(fā)表于 07-07 15:41 ?1233次閱讀

    CMOS超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識(shí)

    本節(jié)將介紹 CMOS 超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識(shí),重點(diǎn)將放在工藝流程的概要和不同工藝步驟對(duì)器件及電路性能的影響上。
    的頭像 發(fā)表于 06-04 15:01 ?2514次閱讀
    CMOS超<b class='flag-5'>大規(guī)模</b>集成電路制造工藝流程的基礎(chǔ)<b class='flag-5'>知識(shí)</b>

    三維高斯?jié)姙R大規(guī)模視覺(jué)SLAM系統(tǒng)解析

    仍未得到探索。本文提出一種基于立體相機(jī)的三維高斯?jié)姙R大規(guī)模視覺(jué)SLAM系統(tǒng)LSG-SLAM。通過(guò)在EuRoC數(shù)據(jù)上的廣泛評(píng)估,LSG-SLAM展示了其在大規(guī)模室外場(chǎng)景中的優(yōu)越性能。在
    的頭像 發(fā)表于 05-27 14:13 ?1533次閱讀
    三維高斯?jié)姙R<b class='flag-5'>大規(guī)模</b>視覺(jué)SLAM系統(tǒng)解析

    薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,薄型、多頻段、大規(guī)模
    發(fā)表于 05-15 18:32
    薄型、多頻段、<b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)前端模塊 skyworksinc

    帶耦合器的大規(guī)模物聯(lián)網(wǎng)半雙工前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()帶耦合器的大規(guī)模物聯(lián)網(wǎng)半雙工前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有帶耦合器的大規(guī)模物聯(lián)網(wǎng)半雙工前端模塊的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,帶耦合器的大規(guī)模
    發(fā)表于 05-09 18:35
    帶耦合器的<b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)半雙工前端模塊 skyworksinc

    輕輕松松學(xué)電工(識(shí)圖篇)

    內(nèi)容介紹 結(jié)合廣大電工人員的實(shí)際需要,主要介紹了常用電工電路識(shí)圖的基礎(chǔ)知識(shí)、方法及技巧,內(nèi)容包括常用電氣符號(hào)、電工識(shí)圖基本方法,以及識(shí)讀供配電系統(tǒng)圖、建筑電氣圖、電力拖動(dòng)系統(tǒng)電氣圖、PLC梯形圖
    發(fā)表于 04-30 17:18

    典型電路原理、電路識(shí)圖從入門(mén)到精通等資料

    1、電路識(shí)圖從入門(mén)到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的
    的頭像 發(fā)表于 04-15 15:53 ?2.4w次閱讀
    典型電路原理、電路<b class='flag-5'>識(shí)圖</b>從入門(mén)到精通等資料

    5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝
    發(fā)表于 04-11 15:21
    5G <b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝 skyworksinc

    電路識(shí)圖從入門(mén)到精通高清電子資料

    由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,以及典型小家電、電動(dòng)車(chē)、洗衣機(jī)、
    發(fā)表于 04-10 16:22

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模數(shù)據(jù)平臺(tái)

    的匱乏,制約了通用操縱能力的突破。上海人工智能實(shí)驗(yàn)室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺(tái),通過(guò)構(gòu)建大規(guī)模、多模態(tài)的真實(shí)世界數(shù)據(jù)
    的頭像 發(fā)表于 03-12 11:42 ?1955次閱讀
    AgiBot World Colosseo:構(gòu)建<b class='flag-5'>通用</b>機(jī)器人智能的<b class='flag-5'>規(guī)模</b>化<b class='flag-5'>數(shù)據(jù)</b>平臺(tái)