chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

云原生是大模型“降本增效”的解藥嗎?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2024-02-20 09:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報道原創(chuàng)。

在過去一兩年里,以GPT和Diffusion model為代表的大語言模型和生成式AI,將人們對AI的期待推向了一個新高峰,并吸引了千行百業(yè)嘗試在業(yè)務中利用大模型。

國內(nèi)各家大廠在大模型領域展開了激烈的軍備競賽,如:文心大模型、通義千問、混元大模型、盤古大模型等等,這些超大規(guī)模的模型訓練參數(shù)都在千億以上,有的甚至超過萬億級。

即便訓練一次千億參數(shù)量模型的成本可能就高達數(shù)百萬美元,但大廠們依然拼盡全力,除此之外也有很多行業(yè)企業(yè)希望擁有自己的專屬大模型。

對于企業(yè)來說,要想在大模型的競爭中勝出,就必須充分利用算力,并且構建高效穩(wěn)定的服務運行環(huán)境,這就對IT基礎設施能力提出了更高的要求。

而云原生正是比拼的重要一環(huán)。云原生技術的自動化部署和管理、彈性伸縮等功能,能夠有效提高大模型應用效率并降低成本。

據(jù)Gartner預測,2023年70%的AI應用會基于容器和Serverless技術開發(fā)。在實際生產(chǎn)中,越來越多的AI業(yè)務,比如自動駕駛、NLP等,也正在轉向容器化部署。

那么,云原生是如何幫助大模型降本增效,在這個過程中又遇到了哪些挑戰(zhàn)?

云原生成為大模型的標配

近年來,容器和Kubernetes已經(jīng)成為越來越多AI應用首選的運行環(huán)境和平臺。

一方面,Kubernetes幫助用戶標準化異構資源和運行時環(huán)境、簡化運維流程;另一方面,AI這種重度依賴GPU的場景可以利用K8s的彈性優(yōu)勢節(jié)省資源成本。

隨著大模型浪潮的到來,以云原生環(huán)境運行AI應用正在變成一種事實標準。

彈性伸縮與資源管理

大模型訓練往往需要大量的計算資源,而云原生環(huán)境通過容器化和編排工具可以實現(xiàn)資源的彈性調(diào)度與自動擴縮容。

這意味著在大模型訓練過程中可以迅速獲取所需資源,并在任務完成后釋放資源,降低閑置成本。

分布式計算支持

云原生架構天然支持分布式系統(tǒng),大模型訓練過程中的并行計算需求可以通過云上的分布式集群輕松實現(xiàn),從而加速模型收斂速度。

微服務架構與模塊化設計

大模型推理服務可以被分解為多個微服務,比如預處理服務、模型加載服務和后處理服務等,這些服務能夠在云原生環(huán)境中獨立部署、升級和擴展,提高系統(tǒng)的可維護性和迭代效率。

持續(xù)集成/持續(xù)部署(CI/CD)

云原生理念強調(diào)快速迭代和自動化運維,借助CI/CD流程,大模型的研發(fā)團隊能夠以更高效的方式構建、測試和部署模型版本,確保模型更新的敏捷性。

存儲與數(shù)據(jù)處理

云原生提供了多種數(shù)據(jù)持久化和臨時存儲解決方案,有助于解決大模型所需的大量數(shù)據(jù)讀取和寫入問題。

同時,利用云上大數(shù)據(jù)處理和流式計算能力可以對大規(guī)模數(shù)據(jù)進行有效預處理和后處理。

可觀測性和故障恢復

在云原生環(huán)境下,監(jiān)控、日志和追蹤功能完善,使得大模型服務的狀態(tài)更加透明,遇到問題時能更快地定位和修復,保證服務高可用性。

總體而言,云原生架構的諸多優(yōu)勢契合了大模型在計算密集、數(shù)據(jù)驅動、迭代頻繁等方面的需求,能夠為大模型帶來成本、性能、效率等多方面的價值,因而成為大模型發(fā)展的標配。

大模型對云原生能力提出新挑戰(zhàn)

盡管云原生對于大模型有著天然的優(yōu)勢,但是面對LLM、AIGC這樣的新領域,依然對云原生能力提出了更多挑戰(zhàn)。

在訓練階段,大模型對計算、存儲、網(wǎng)絡等基礎架構的要求都更高。

規(guī)模上,要訓練出具有廣泛知識和專業(yè)領域理解及推理能力的大語言模型,往往需要高達萬卡級別的GPU集群和PB級的數(shù)據(jù)存儲以及TB級的數(shù)據(jù)吞吐。

此外,高性能網(wǎng)絡也將達到單機800Gbps甚至3.2Tbps的RDMA互聯(lián)。

性能方面,隨著模型體積和參數(shù)量的增長,單張顯卡已無法承載完整的模型。因此需要使用多張顯卡進行分布式訓練,并采用各種混合并行策略進行加速。

這些策略包括數(shù)據(jù)并行、模型并行、流水線并行以及針對語言模型的序列并行等,以及各種復雜的組合策略。

在推理階段,大模型需要提供高效且穩(wěn)定的推理服務,這需要不斷優(yōu)化其性能,并確保服務質(zhì)量(QoS)得到保證。

在此基礎上,最重要的目標是提高資源效率和工程效率。一方面,持續(xù)提高資源利用效率,并通過彈性擴展資源規(guī)模,以應對突發(fā)的計算需求。

另一方面,要最優(yōu)化算法人員的工作效率,提高模型迭代速度和質(zhì)量。

由此可見,大模型對云原生技術提出了新的能力要求:

一是,統(tǒng)一管理異構資源,提升資源利用率。

從異構資源管理的角度,對IaaS云服務或者IDC內(nèi)的各種異構計算(如 CPU,GPU,NPU,VPU,FPGAASIC)、存儲(OSS,NAS, CPFS,HDFS)、網(wǎng)絡(TCP, RDMA)資源進行抽象,統(tǒng)一管理、運維和分配,通過彈性和軟硬協(xié)同優(yōu)化,持續(xù)提升資源利用率。

在運維過程中,需要多維度的異構資源可觀測性,包括監(jiān)控、健康檢查、告警、自愈等自動化運維能力。

對于寶貴的計算資源,如GPU和NPU等加速器,需要通過各種調(diào)度、隔離和共享的方法,最大限度地提高其利用率。

在此過程中,還需要持續(xù)利用云資源的彈性特征,持續(xù)提高資源的交付和使用效率。

二是,通過統(tǒng)一工作流和調(diào)度,實現(xiàn) AI、大數(shù)據(jù)等多類復雜任務的高效管理。

對于大規(guī)模分布式AI任務,需要提供豐富的任務調(diào)度策略,如Gang scheduling、Capacity scheduling、Topology aware scheduling、優(yōu)先級隊列等,并使用工作流或數(shù)據(jù)流的方式串聯(lián)起整個任務流水線。

同時,需兼容Tensorflow,Pytorch,Horovod,ONNX,Spark,F(xiàn)link等各種計算引擎和運行時,統(tǒng)一運行各類異構工作負載流程,統(tǒng)一管理作業(yè)生命周期,統(tǒng)一調(diào)度任務工作流,保證任務規(guī)模和性能。

一方面不斷提升運行任務的性價比,另一方面持續(xù)改善開發(fā)運維體驗和工程效率。

此外,在計算框架與算法層面適配資源彈性能力,提供彈性訓練和彈性推理服務,優(yōu)化任務整體運行成本。

除了計算任務優(yōu)化,還應關注數(shù)據(jù)使用效率的優(yōu)化。為此,需要統(tǒng)一的數(shù)據(jù)集管理、模型管理和訪問性能優(yōu)化等功能,并通過標準API和開放式架構使其易于被業(yè)務應用程序集成。

對于大模型還有一個主要能力,就是能夠在分鐘級內(nèi)準備好開發(fā)環(huán)境和集群測試環(huán)境,幫助算法工程師開始執(zhí)行深度學習任務。

把端到端的 AI 生產(chǎn)過程通過相同的編程模型、運維方式進行交付。

結語

隨著大模型等AI技術的不斷發(fā)展,云原生技術將面臨一些新的挑戰(zhàn)和需求。例如,如何快速適應新的開源大模型訓練方法,以及如何提高大模型推理性能并確保其質(zhì)量和穩(wěn)定性。

同時,也需要關注一些前沿技術和創(chuàng)新能力,通過標準化和可編程的方式來集成,不斷迭代業(yè)務應用,形成 AI+ 或 LLM+ 的新應用開發(fā)模式和編程模型。

但無論技術如何發(fā)展,為大模型提供快速、準確、穩(wěn)定且成本可控的服務,保證大模型訓練和推理的成本、性能和效率,都將成為企業(yè)為其價值買單的根本。

【關于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領域。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40908

    瀏覽量

    302489
  • 云原生
    +關注

    關注

    0

    文章

    266

    瀏覽量

    8645
  • 大模型
    +關注

    關注

    2

    文章

    3746

    瀏覽量

    5268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產(chǎn)隔離器強勢突圍:助力降本增效

    由國際領先品牌主導,但其高昂成本常為項目預算帶來壓力。如今,國產(chǎn)隔離器憑借顯著的成本優(yōu)勢與躍升的性能表現(xiàn),為行業(yè)提供高性價比解決方案,助力企業(yè)降本增效
    的頭像 發(fā)表于 03-20 16:09 ?182次閱讀

    降本增效的底層邏輯:Acrel EMS 3.0 重新定義能源管理

    降本增效的底層邏輯:Acrel EMS 3.0 重新定義能源管理 摘要 在“雙碳”目標引領下,企業(yè)能源管理正邁向智能化、綠色化。企業(yè)面對光伏、儲能、充電樁等多類設備協(xié)同難、能效低、運維成本高等
    的頭像 發(fā)表于 03-12 16:44 ?163次閱讀
    <b class='flag-5'>降本增效</b>的底層邏輯:Acrel EMS 3.0 重新定義能源管理

    開工即沖刺!超高頻 RFID 如何幫企業(yè)降本增效?

    居高不下、庫存盤點賬實不符、資產(chǎn)流失嚴重、生產(chǎn)追溯信息斷裂…… 在激烈的市場競爭中,如何通過數(shù)字化轉型真正實現(xiàn)“降本增效”,成為開工首季的必修課。 此時,一種被譽為“工業(yè)感知神經(jīng)”的技術—— 超高頻RFID ,正從選配
    的頭像 發(fā)表于 02-24 18:05 ?155次閱讀

    千方集團持續(xù)推動公路貨運實現(xiàn)降本增效

    公路貨運作為我國物流體系的支柱,是推動全社會物流降本增效的關鍵領域。千方集團通過整合“車、路、貨、能、運”等關鍵要素資源,構建了完整的產(chǎn)業(yè)生態(tài),并通過智能化升級與全局優(yōu)化,持續(xù)推動公路貨運實現(xiàn)降本增效。
    的頭像 發(fā)表于 01-26 10:18 ?625次閱讀

    ERP上云 = 降本增效?一文讀懂ERP云業(yè)務應用&amp;遷移核心優(yōu)勢

    云ERP讓企業(yè)轉型更輕盈:無需自建服務器,專業(yè)團隊保障數(shù)據(jù)安全,按需擴展隨業(yè)務增長。SNP的Kyano平臺提供一站式遷移方案,全球3000+企業(yè)驗證,助力快速實現(xiàn)降本增效與業(yè)務創(chuàng)新。
    的頭像 發(fā)表于 01-14 14:03 ?245次閱讀

    觸拓科技工控一體機:智能工廠降本增效的核心引擎

    - 倉儲” 全鏈路數(shù)字化解決方案,憑借工業(yè)級穩(wěn)定性能與高效協(xié)同能力,成為智能工廠的 “數(shù)字神經(jīng)末梢”,助力企業(yè)降本增效
    的頭像 發(fā)表于 11-21 17:51 ?585次閱讀
    觸拓科技工控一體機:智能工廠<b class='flag-5'>降本增效</b>的核心引擎

    RFID資產(chǎn)管理:企業(yè)降本增效的隱形引擎(2025最新實踐)

    “自動化采集、實時化追蹤、數(shù)字化管控” 的核心能力,成為企業(yè)降本增效的隱形引擎,更構建起支撐數(shù)字化轉型的資產(chǎn)管理基石。
    的頭像 發(fā)表于 10-16 15:41 ?743次閱讀

    企業(yè)能耗管理破局之道:安科瑞Acrel-5000能耗管理系統(tǒng)如何成為降本增效利器?

    的能耗管理方式,早已難以滿足企業(yè)實現(xiàn)可持續(xù)發(fā)展與降本增效的迫切需求。 (一)數(shù)據(jù)采集粗放,精細化管理成空談 傳統(tǒng)人工抄表模式耗時耗力,電表、水表、燃氣表數(shù)據(jù)分散在不同臺賬,錯記漏記頻發(fā)。 (二)能耗分析滯后,節(jié)能
    的頭像 發(fā)表于 09-22 16:28 ?774次閱讀
    企業(yè)能耗管理破局之道:安科瑞Acrel-5000能耗管理系統(tǒng)如何成為<b class='flag-5'>降本增效</b>利器?

    停車場照明煥新記:晶映節(jié)能改造的降本增效實踐?

    晶映節(jié)能停車場照明改造以技術創(chuàng)新破傳統(tǒng)困境,通過智能感應與數(shù)字化管理,實現(xiàn)電費大降、維護成本銳減,同步提升安全與用戶體驗,彰顯降本增效深層價值。
    的頭像 發(fā)表于 08-21 16:18 ?912次閱讀
    停車場照明煥新記:晶映節(jié)能改造的<b class='flag-5'>降本增效</b>實踐?

    云原生環(huán)境里Nginx的故障排查思路

    本文聚焦于云原生環(huán)境下Nginx的故障排查思路。隨著云原生技術的廣泛應用,Nginx作為常用的高性能Web服務器和反向代理服務器,在容器化和編排的環(huán)境中面臨著新的故障場景和挑戰(zhàn)。
    的頭像 發(fā)表于 06-17 13:53 ?1128次閱讀
    <b class='flag-5'>云原生</b>環(huán)境里Nginx的故障排查思路

    IBM探索AI驅動的降本增效新路徑

    AI 驅動已成為企業(yè)降本增效的戰(zhàn)略級引擎,其價值實現(xiàn)不在于技術本身,而在于與業(yè)務場景的深度融合。IBM 咨詢提出的"戰(zhàn)略規(guī)劃+運營管理"雙軌并行模式,突破傳統(tǒng)單點優(yōu)化的局限,構建
    的頭像 發(fā)表于 05-22 15:29 ?1074次閱讀

    降本增效利器!揭秘流程行業(yè)MES解決方案的5大核心應用場景

    在流程行業(yè)的數(shù)字化轉型中,MES解決方案是實現(xiàn)降本增效的關鍵技術。以下是流程行業(yè)MES解決方案的5大核心應用場景:精準工藝參數(shù)控制:流程生產(chǎn)中,溫度、壓力、流量等工藝參數(shù)直接決定產(chǎn)品質(zhì)量和生產(chǎn)效率
    的頭像 發(fā)表于 05-20 14:44 ?816次閱讀
    <b class='flag-5'>降本增效</b>利器!揭秘流程行業(yè)MES解決方案的5大核心應用場景

    福田歐曼銀河5助力物流運輸行業(yè)降本增效

    在物流運輸行業(yè)競爭日趨白熱化的當下,每一分成本削減與效率提升都直接關乎用戶的生存空間,而運輸效率與運營效益已成為檢驗重卡性能的核心指標。面對行業(yè)降本增效的迫切需求,歐曼銀河5精準錨定用戶痛點,從動
    的頭像 發(fā)表于 05-20 09:23 ?1048次閱讀

    PLC遠程維護上下載,降本增效減少出差的利器

    PLC(可編程邏輯控制器)遠程維護上下載技術已成為現(xiàn)代工業(yè)領域降本增效、減少出差的核心工具,尤其在工業(yè)4.0與物聯(lián)網(wǎng)技術推動下,價值愈發(fā)凸顯。對此,數(shù)之能提供PLC遠程編程調(diào)試和遠程上下載程序等
    的頭像 發(fā)表于 05-19 11:17 ?735次閱讀
    PLC遠程維護上下載,<b class='flag-5'>降本增效</b>減少出差的利器

    從防爆到智能:頂堅防爆pda終端如何助力易燃易爆行業(yè)降本增效

    從防爆到智能,頂堅防爆PDA終端通過集成多重安全防護技術、智能化功能與工業(yè)級設計,為高危易燃易爆行業(yè)提供了降本增效的核心解決方案。以下從安全成本降低、作業(yè)效率提升、管理決策優(yōu)化三個維度展開分析:頂堅
    的頭像 發(fā)表于 05-12 11:08 ?1000次閱讀
    從防爆到智能:頂堅防爆pda終端如何助力易燃易爆行業(yè)<b class='flag-5'>降本增效</b>