chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在AI基礎(chǔ)設(shè)施中部署大語言模型的三大舉措

穎脈Imgtec ? 2026-02-09 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文:Gartner研究副總裁周玲


中國企業(yè)機構(gòu)已逐步在生產(chǎn)環(huán)境中運行或者計劃運行大語言模型,但在AI基礎(chǔ)設(shè)施的生產(chǎn)部署與高效運營方面仍面臨諸多挑戰(zhàn)。目前,中國正加速提升其生成式AI能力,覆蓋大語言模型、軟件開發(fā)、生態(tài)集成與硬件革新。隨著DeepSeek、通義千問(Qwen)等高性價比模型日益普及和本地部署的深入推進,越來越多的中國企業(yè)將重心放在數(shù)據(jù)隱私、數(shù)據(jù)主權(quán)、安全性、可擴展性和低延遲等核心需求上。2025年Gartner首席信息官(CIO)和技術(shù)高管調(diào)研顯示,2025年中國企業(yè)計劃大幅增加在生成式AI和AI領(lǐng)域的技術(shù)投資,其平均增幅分別達到40.3%和33.3%(見圖1),這一數(shù)據(jù)表明,相關(guān)技術(shù)將在短期內(nèi)得到廣泛采用。

3e6abd4c-0591-11f1-96ea-92fbcf53809c.png

Gartner預(yù)測,到2028年,中國70%的大型企業(yè)將為大語言模型在AI基礎(chǔ)設(shè)施上的部署建立完善的治理框架,而2025年這一比例不足10%。

然而,要成功實現(xiàn)大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署并非易事,需要制定復(fù)雜的技術(shù)、運維和治理戰(zhàn)略,以確保模型達到性能指標(例如GPU算力利用率),同時保障數(shù)據(jù)安全與合規(guī)。

中國企業(yè)與全球企業(yè)的一個關(guān)鍵區(qū)別在于,其更傾向于在本地AI基礎(chǔ)設(shè)施環(huán)境中部署大語言模型,這對I&O團隊提出了更高要求,需要他們對重要AI基礎(chǔ)設(shè)施技術(shù)棧有更深入的理解。AI基礎(chǔ)設(shè)施是指AI應(yīng)用構(gòu)建、測試、訓(xùn)練與部署所需的最新、最先進的硬軟件技術(shù)棧。

為了在新的AI基礎(chǔ)設(shè)施上成功實現(xiàn)大語言模型的生產(chǎn)部署,企業(yè)應(yīng)從以下三個方面著手:構(gòu)建全面的生產(chǎn)發(fā)布策略;制定健全的治理框架;并加強與法律、安全、AI、數(shù)據(jù)團隊及生態(tài)伙伴的緊密協(xié)作。這些舉措為大語言模型在生產(chǎn)環(huán)境中的高效運行提供了堅實的保障。


構(gòu)建全面的部署戰(zhàn)略

隨著企業(yè)開始在AI基礎(chǔ)設(shè)施上部署大語言模型,I&O領(lǐng)導(dǎo)者所面臨的壓力日益增大,需要幫助AI開發(fā)人員和工程師在全企業(yè)范圍內(nèi)以更快的速度、更大的規(guī)模來推進AI項目的開發(fā)和部署。與此同時,針對不同用戶和應(yīng)用場景不斷涌現(xiàn)的各種AI工具和服務(wù),顯著增加了評估與選擇的難度和復(fù)雜性。此外,傳統(tǒng)的生產(chǎn)發(fā)布策略與流程已無法有效支持大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需求。因此,I&O領(lǐng)導(dǎo)者亟需制定完善的生產(chǎn)發(fā)布戰(zhàn)略,以保障部署工作的順利進行。

然而,要為大語言模型在AI基礎(chǔ)設(shè)施上的部署構(gòu)建一套穩(wěn)健的戰(zhàn)略,就需要從整體視角出發(fā),包括適配AI基礎(chǔ)設(shè)施環(huán)境、為特定場景設(shè)計架構(gòu)、實施技術(shù)優(yōu)化以及確保符合監(jiān)管框架要求。

中國的I&O領(lǐng)導(dǎo)者應(yīng):

使部署策略與企業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略保持一致

按照使用場景構(gòu)建多層次部署架構(gòu)以優(yōu)化性能

優(yōu)化模型與推理以提升效率

使用云原生技術(shù)實現(xiàn)靈活調(diào)度

加強合規(guī)并強化安全管理

建立全鏈路監(jiān)控與成本控制機制


制定穩(wěn)健的部署治理流程

大語言模型已經(jīng)從研究原型轉(zhuǎn)變?yōu)槎喾N任務(wù)的關(guān)鍵核心組件,包括客戶支持AI智能體、法律文檔摘要、代碼生成或測試工具、企業(yè)級代理型AI用例以及多模態(tài)應(yīng)用等領(lǐng)域。然而,大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需要解決如下幾個固有挑戰(zhàn):

資源密集

非確定性行為與提示敏感

延遲與吞吐限制

安全與隱私

因此,為了成功將大語言模型部署到AI基礎(chǔ)設(shè)施的生產(chǎn)環(huán)境中,中國的I&O部門必須建立一套穩(wěn)健的治理流程,采取切實可行的步驟促進資源管理、持續(xù)監(jiān)控以及敏捷更新。比如:

提前規(guī)劃并進行試點

確定產(chǎn)品部署位置

建立高效的資源管理

在大語言模型生產(chǎn)發(fā)布流程中嵌入安全治理與提示治理

管理版本并執(zhí)行A/B測試

采用持續(xù)集成/持續(xù)交付流程

實施生產(chǎn)監(jiān)控


促進關(guān)鍵利益相關(guān)方之間的緊密協(xié)作

部署大語言模型十分復(fù)雜,要求業(yè)務(wù)、法務(wù)、安全以及AI與數(shù)據(jù)團隊以協(xié)同一致的方式共同工作。過去各自獨立的部門如今必須從大語言模型項目的啟動階段就開展合作,以確保技術(shù)開發(fā)能夠反映法律和安全方面的考量。建立跨職能的AI治理委員會至關(guān)重要,成員應(yīng)包括法務(wù)、安全、數(shù)據(jù)工程與數(shù)據(jù)科學(xué)、產(chǎn)品管理、軟件開發(fā)以及高管層的代表。

文章來源:Gartner

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39531

    瀏覽量

    301056
  • 人工智能
    +關(guān)注

    關(guān)注

    1816

    文章

    50062

    瀏覽量

    264945
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11304
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    模型 ai coding 比較

    方裁判更客觀 樣本量說明:當(dāng)前樣本量30題,統(tǒng)計意義有限,建議后續(xù)擴大到100+題 數(shù)據(jù)污染風(fēng)險:評估經(jīng)典題目被模型訓(xùn)練集見過的可能性 6. 環(huán)境一致性維度 所有模型完全相同的環(huán)
    發(fā)表于 02-19 13:43

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 http
    發(fā)表于 01-15 10:31

    亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能AI環(huán)境

    亞馬遜云科技2025 re:Invent全球大會上,宣布推出全新的Amazon AI Factories,助力企業(yè)將現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能的AI環(huán)境。
    的頭像 發(fā)表于 12-13 13:44 ?707次閱讀

    使用瑞薩RUHMI工具實現(xiàn)AI模型部署過程

    AI無處不在。你部署AI,你的競爭對手也部署AI
    的頭像 發(fā)表于 10-17 10:00 ?2736次閱讀
    使用瑞薩RUHMI工具實現(xiàn)<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>過程

    GlobalData與華為探討AI對網(wǎng)絡(luò)基礎(chǔ)設(shè)施的機遇與挑戰(zhàn)

    GlobalData 研究總監(jiān)Emir Halilovic 與華為數(shù)據(jù)通信產(chǎn)品線NCE數(shù)據(jù)通信領(lǐng)域總裁王輝共同探討了人工智能(AI)對網(wǎng)絡(luò)基礎(chǔ)設(shè)施帶來的機遇(高性能網(wǎng)絡(luò)需求、AI增強的網(wǎng)絡(luò)能力
    的頭像 發(fā)表于 10-14 14:24 ?578次閱讀

    科士達全棧解決方案亮相2025 ODCC,驅(qū)動綠色AI智算基礎(chǔ)設(shè)施革新

    2025年開放數(shù)據(jù)中心大會(ODCC)于9月9日-11日北京國際會議中心盛大啟幕。本屆峰會以“擁抱AI變革,點燃算網(wǎng)引擎”為主題,聚焦AI爆發(fā)背景下算力基礎(chǔ)設(shè)施面臨的能效、
    的頭像 發(fā)表于 09-17 15:40 ?1217次閱讀
    科士達全棧解決方案亮相2025 ODCC,驅(qū)動綠色<b class='flag-5'>AI</b>智算<b class='flag-5'>基礎(chǔ)設(shè)施</b>革新

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發(fā)表于 07-30 08:15

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    演講中表示,為應(yīng)對生成式AI爆發(fā)式增長下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時代打造生產(chǎn)先進
    發(fā)表于 07-28 10:34 ?2768次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級創(chuàng)新定義新一代<b class='flag-5'>AI</b><b class='flag-5'>基礎(chǔ)設(shè)施</b>

    Arm如何助力AI基礎(chǔ)設(shè)施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個基本事實:支撐傳統(tǒng)計算的基礎(chǔ)設(shè)施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?952次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎(chǔ)設(shè)施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業(yè)領(lǐng)導(dǎo)者,共同建造 NVIDIA Blackwell AI 基礎(chǔ)設(shè)施,以強化數(shù)字主權(quán)、支撐經(jīng)濟增長,并推動歐洲大陸成為 AI 工業(yè)革命的領(lǐng)導(dǎo)者。
    的頭像 發(fā)表于 06-16 14:25 ?1401次閱讀

    NVIDIA MGX變革AI工廠設(shè)計與部署

    生成式 AI、大語言模型和高性能計算呈指數(shù)級增長,這對數(shù)據(jù)中心基礎(chǔ)設(shè)施提出了前所未有的要求。傳統(tǒng)服務(wù)器架構(gòu)難以滿足現(xiàn)代加速計算在功率密度、散熱需求和快速迭代周期方面的要求。
    的頭像 發(fā)表于 06-06 15:07 ?1126次閱讀

    企業(yè)部署AI模型怎么做

    當(dāng)下,AI模型已成為驅(qū)動決策自動化、服務(wù)智能化與產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對動輒數(shù)百億參數(shù)的大模型部署時,常陷入算力不足、響應(yīng)延遲高、成本失控等困境。如何突破瓶頸,實現(xiàn)高效、穩(wěn)
    的頭像 發(fā)表于 06-04 09:26 ?875次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    模型全鏈路分析功能,針對AI應(yīng)用開發(fā)的大痛點逐個擊破。 當(dāng)前AI應(yīng)用開發(fā)者使用開發(fā)工具時會面臨一個很頭疼的問題,種類多、功能不聚合、過
    發(fā)表于 04-13 19:52

    PoE交換機如何助力智慧城市基礎(chǔ)設(shè)施建設(shè)?

    簡化部署流程,降低基礎(chǔ)設(shè)施成本。借助PoE交換機,城市規(guī)劃者和網(wǎng)絡(luò)管理員可以高效位置部署設(shè)備,而無需受到電源插座可用性的限制。 PoE 交換機
    發(fā)表于 03-25 10:20

    英偉達與xAI簽AI基建協(xié)議 加入全球人工智能基礎(chǔ)設(shè)施投資合作伙伴聯(lián)盟

    共同發(fā)起。他們計劃建立300億美元的私募股權(quán)資本,并期望能夠撬動超1000億美元的投資;以共同建設(shè)數(shù)據(jù)中心和其他AI基礎(chǔ)設(shè)施。? 美東時間周,微軟和貝萊德宣布了一項重要合作事項;英
    的頭像 發(fā)表于 03-20 13:58 ?1140次閱讀