chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

KIOXIA單服務(wù)器實(shí)現(xiàn)48億高維向量搜索數(shù)據(jù)庫,借助GPU實(shí)現(xiàn)索引構(gòu)建時(shí)間加速7.8倍

文傳商訊 ? 來源:文傳商訊 ? 作者:文傳商訊 ? 2026-03-18 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Kioxia Corporation今日宣布,憑借其開源的KIOXIA AiSAQ?近似最近鄰搜索(ANNS)技術(shù),成功演示在單臺(tái)服務(wù)器上實(shí)現(xiàn)48億向量的高維向量搜索擴(kuò)展。此外,Kioxia還展示了通過NVIDIA cuVS利用GPU加速,顯著縮短索引構(gòu)建時(shí)間的成果。這兩項(xiàng)成果標(biāo)志著檢索增強(qiáng)生成(RAG)搜索解決方案取得了重大進(jìn)展。目前公司正持續(xù)開發(fā),以支持超過48億向量的更大規(guī)模部署。

大規(guī)模向量數(shù)據(jù)庫的索引構(gòu)建時(shí)間是行業(yè)的核心痛點(diǎn)。Kioxia與NVIDIA合作,演示了其在1024維高維向量的KIOXIA AiSAQ索引構(gòu)建時(shí)間上最多20倍的改進(jìn),以及端到端構(gòu)建時(shí)間上最多7.8倍的改進(jìn)。這20倍的改進(jìn)意味著,構(gòu)建索引的時(shí)間從使用CPU的28.4天縮短至使用4塊NVIDIAHopperGPU的1.4天,端到端測試時(shí)間從31天縮短至4天。

如今,AI應(yīng)用可依賴存儲(chǔ)在固態(tài)硬盤上的更大規(guī)模向量化信息(可達(dá)數(shù)百億向量及以上),而僅靠DRAM即便在十億級(jí)規(guī)模下也已不再適用。Kioxia借助KIOXIA AiSAQ技術(shù),實(shí)現(xiàn)了十億級(jí)搜索的高可擴(kuò)展存儲(chǔ)架構(gòu),在Milvus向量數(shù)據(jù)庫環(huán)境中,使用單臺(tái)查詢服務(wù)器即可滿足RAG應(yīng)用的延遲要求。其索引構(gòu)建依托GPU加速,讓大規(guī)模部署變得切實(shí)可行。

NVIDIA存儲(chǔ)技術(shù)副總裁Jason Hardy表示:“向量數(shù)據(jù)庫是那些需要在海量非結(jié)構(gòu)化數(shù)據(jù)集中實(shí)時(shí)理解意圖、上下文和相似度的應(yīng)用的核心支撐。通過借助NVIDIA cuVS庫實(shí)現(xiàn)GPU加速索引,Kioxia支持高維向量數(shù)據(jù)庫實(shí)現(xiàn)擴(kuò)展,并以前所未有的效率構(gòu)建索引?!?/p>

KIOXIA AiSAQ開源軟件技術(shù)于去年首次發(fā)布,通過支持直接從固態(tài)硬盤進(jìn)行向量搜索并降低DRAM用量,解決了RAG技術(shù)的可擴(kuò)展性挑戰(zhàn)。KIOXIA AiSAQ技術(shù)具備高可擴(kuò)展性,非常適合多租戶環(huán)境和大規(guī)模單體索引部署。該技術(shù)采用創(chuàng)新的全局索引(Global Index)算法,結(jié)合混合聚類和圖搜索,在超大規(guī)模下實(shí)現(xiàn)高效向量搜索。KIOXIA AiSAQ軟件提供靈活的調(diào)優(yōu)選項(xiàng),可在性能與大規(guī)模向量可擴(kuò)展性之間取得平衡,讓大規(guī)模部署更易實(shí)現(xiàn)和擴(kuò)展。

Kioxia Corporation常務(wù)執(zhí)行董事、固態(tài)硬盤事業(yè)部副總裁Masashi Yokotsuka表示:“將向量數(shù)據(jù)庫擴(kuò)展至十億級(jí)規(guī)模,需要重新思考內(nèi)存和計(jì)算方案。通過將基于KIOXIA AiSAQ固態(tài)硬盤的向量搜索與NVIDIA用于索引構(gòu)建的GPU加速相結(jié)合,我們實(shí)現(xiàn)了大規(guī)模部署下切實(shí)可行的索引構(gòu)建。作為行業(yè)創(chuàng)新者,我們將繼續(xù)利用閃存技術(shù)突破AI的邊界?!?/p>

Kioxia始終致力于推進(jìn)由存儲(chǔ)驅(qū)動(dòng)的AI解決方案,以支持大規(guī)模智能數(shù)據(jù)處理,并持續(xù)推動(dòng)KIOXIA AiSAQ向萬億向量級(jí)部署邁進(jìn)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5258

    瀏覽量

    136032
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10339

    瀏覽量

    91731
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    4078

    瀏覽量

    68519
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理

    Oracle 和 NVIDIA 正在與客戶合作,將 GPU 加速向量索引構(gòu)建應(yīng)用于實(shí)際工作負(fù)載。Oracle Private AI Ser
    的頭像 發(fā)表于 03-23 15:26 ?389次閱讀

    不用編程不用聯(lián)網(wǎng),快速實(shí)現(xiàn)PLC與數(shù)據(jù)庫雙向數(shù)據(jù)通訊的案例

    智能網(wǎng)關(guān)IGT-DSER實(shí)現(xiàn)S7-1200/1500系列的PLC與數(shù)據(jù)庫服務(wù)器雙向通訊,網(wǎng)關(guān)支持MySQL和SQLServer、PostgreSQL,以及Oracle、達(dá)夢(mèng)數(shù)據(jù)庫等。這
    發(fā)表于 01-14 10:51

    恒訊科技解析:如何在日本服務(wù)器上安裝和配置數(shù)據(jù)庫(如MySQL)?

    為您的業(yè)務(wù)部署日本服務(wù)器后,下一個(gè)關(guān)鍵步驟就是安裝和配置數(shù)據(jù)庫。無論是用于網(wǎng)站、應(yīng)用程序還是數(shù)據(jù)分析,一個(gè)穩(wěn)定高效的數(shù)據(jù)庫是業(yè)務(wù)的核心。恒訊科技將以最流行的MySQL為例,提供一份在日
    的頭像 發(fā)表于 11-04 11:07 ?780次閱讀

    華納云香港服務(wù)器數(shù)據(jù)庫索引優(yōu)化策略

    在香港服務(wù)器環(huán)境中,數(shù)據(jù)庫索引優(yōu)化是提升整體性能的關(guān)鍵因素。隨著企業(yè)數(shù)據(jù)量的不斷增長,高效的索引管理能顯著提高查詢速度并降低
    的頭像 發(fā)表于 10-16 17:06 ?614次閱讀

    不用編程不用聯(lián)網(wǎng),實(shí)現(xiàn)福(BECKHOFF)PLC對(duì)接SQL數(shù)據(jù)庫,上報(bào)和查詢數(shù)據(jù)的案例

    、SQLServer、PostgreSQL,以及Oracle。 網(wǎng)關(guān)安裝在設(shè)備側(cè),與設(shè)備同時(shí)起停,不擔(dān)心數(shù)據(jù)丟失;在斷網(wǎng)、服務(wù)器維護(hù)上報(bào)數(shù)據(jù)有異常時(shí),網(wǎng)關(guān)主動(dòng)將數(shù)據(jù)緩存,待故障解除后自
    發(fā)表于 10-10 11:14

    多達(dá) 48 個(gè)計(jì)算節(jié)點(diǎn)!Firefly 推出 CSC2-N48 AI 算力服務(wù)器

    和分析數(shù)據(jù),具有小型化、低延遲、可靠等特點(diǎn)。內(nèi)置48個(gè)計(jì)算節(jié)點(diǎn)服務(wù)器內(nèi)置48個(gè)分布式計(jì)算節(jié)點(diǎn),算力處理
    的頭像 發(fā)表于 08-20 16:37 ?1773次閱讀
    多達(dá) <b class='flag-5'>48</b> 個(gè)計(jì)算節(jié)點(diǎn)!Firefly 推出 CSC2-N<b class='flag-5'>48</b> AI 算力<b class='flag-5'>服務(wù)器</b>

    不用編程序無需聯(lián)外網(wǎng),將Rockwell羅克韋爾(AB)PLC的標(biāo)簽數(shù)據(jù)存入SQL數(shù)據(jù)庫

    、SQLServer、PostgreSQL,以及Oracle。 網(wǎng)關(guān)安裝在設(shè)備側(cè),與設(shè)備同時(shí)起停,不擔(dān)心數(shù)據(jù)丟失;在斷網(wǎng)、服務(wù)器維護(hù)上報(bào)數(shù)據(jù)有異常時(shí),網(wǎng)關(guān)主動(dòng)將數(shù)據(jù)緩存,待故障解除后
    發(fā)表于 07-31 10:33

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫故障的數(shù)據(jù)恢復(fù)案例

    Oracle數(shù)據(jù)庫故障: 某公司一臺(tái)服務(wù)器上部署Oracle數(shù)據(jù)庫。服務(wù)器意外斷電導(dǎo)致數(shù)據(jù)庫報(bào)錯(cuò),報(bào)錯(cuò)內(nèi)容為“system01.dbf需要
    的頭像 發(fā)表于 07-24 11:12 ?815次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—<b class='flag-5'>服務(wù)器</b>異常斷電導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫</b>故障的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

    Milvus 是一個(gè)開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計(jì)。它適用于需要高效存儲(chǔ)、檢索和管理向量
    的頭像 發(fā)表于 07-04 11:36 ?1215次閱讀
    milvus<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>的主要特性和應(yīng)用場景

    硅谷GPU服務(wù)器是什么意思?使用指南詳解

    硅谷GPU服務(wù)器本質(zhì)上是一種IaaS(基礎(chǔ)設(shè)施即服務(wù))產(chǎn)品,它將物理服務(wù)器上的GPU資源通過虛擬化技術(shù)分割成可彈性調(diào)配的云
    的頭像 發(fā)表于 06-16 09:41 ?701次閱讀

    通SoC陣列服務(wù)器

    通SoC陣列服務(wù)器是基于通系統(tǒng)級(jí)芯片(SoC)構(gòu)建的高密度計(jì)算解決方案,核心特點(diǎn)為低功耗、算力集成與模塊化設(shè)計(jì),主要應(yīng)用于邊緣計(jì)算和云
    的頭像 發(fā)表于 06-03 07:37 ?1403次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: linux操作系統(tǒng)服務(wù)器中有一組由4塊SAS接口硬盤組建的raid5陣列。 服務(wù)器故障: 服務(wù)器工作過程中突
    的頭像 發(fā)表于 05-20 15:46 ?979次閱讀

    Redis 8 向量搜索實(shí)測:輕松擴(kuò)展至 10 向量

    艾體寶Redis 8 向量搜索實(shí)測輕松支持 10 向量,仍保持低延遲與吞吐。中位延遲僅200毫秒,90%精確度;處理50并發(fā)
    的頭像 發(fā)表于 05-13 14:00 ?889次閱讀
    Redis 8 <b class='flag-5'>向量</b><b class='flag-5'>搜索</b>實(shí)測:輕松擴(kuò)展至 10 <b class='flag-5'>億</b><b class='flag-5'>向量</b>

    數(shù)據(jù)采集到MYSQL和SQLSERVER數(shù)據(jù)庫可以實(shí)現(xiàn)哪些功能

    將工業(yè)設(shè)備數(shù)據(jù)采集到MySQL和SQLServer數(shù)據(jù)庫后,可實(shí)現(xiàn)生產(chǎn)管理、設(shè)備運(yùn)、決策支持等多維度功能。對(duì)此,數(shù)之能提供多種工業(yè)設(shè)備數(shù)據(jù)
    的頭像 發(fā)表于 05-07 15:32 ?667次閱讀

    RAKsmart服務(wù)器SEO優(yōu)化優(yōu)勢(shì)分析

    在RAKsmart服務(wù)器上搭建SEO網(wǎng)站,可以借助其基礎(chǔ)設(shè)施和服務(wù)特性,從技術(shù)層面優(yōu)化搜索引擎排名。以下是具體優(yōu)勢(shì)及分析,主機(jī)推薦小編為您整理發(fā)布RAKsmart
    的頭像 發(fā)表于 04-22 10:12 ?764次閱讀