文:Gartner研究副總裁周玲
中國企業(yè)機構(gòu)已逐步在生產(chǎn)環(huán)境中運行或者計劃運行大語言模型,但在AI基礎(chǔ)設(shè)施的生產(chǎn)部署與高效運營方面仍面臨諸多挑戰(zhàn)。目前,中國正加速提升其生成式AI能力,覆蓋大語言模型、軟件開發(fā)、生態(tài)集成與硬件革新。隨著DeepSeek、通義千問(Qwen)等高性價比模型日益普及和本地部署的深入推進,越來越多的中國企業(yè)將重心放在數(shù)據(jù)隱私、數(shù)據(jù)主權(quán)、安全性、可擴展性和低延遲等核心需求上。2025年Gartner首席信息官(CIO)和技術(shù)高管調(diào)研顯示,2025年中國企業(yè)計劃大幅增加在生成式AI和AI領(lǐng)域的技術(shù)投資,其平均增幅分別達到40.3%和33.3%(見圖1),這一數(shù)據(jù)表明,相關(guān)技術(shù)將在短期內(nèi)得到廣泛采用。

Gartner預(yù)測,到2028年,中國70%的大型企業(yè)將為大語言模型在AI基礎(chǔ)設(shè)施上的部署建立完善的治理框架,而2025年這一比例不足10%。
然而,要成功實現(xiàn)大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署并非易事,需要制定復(fù)雜的技術(shù)、運維和治理戰(zhàn)略,以確保模型達到性能指標(例如GPU算力利用率),同時保障數(shù)據(jù)安全與合規(guī)。
中國企業(yè)與全球企業(yè)的一個關(guān)鍵區(qū)別在于,其更傾向于在本地AI基礎(chǔ)設(shè)施環(huán)境中部署大語言模型,這對I&O團隊提出了更高要求,需要他們對重要AI基礎(chǔ)設(shè)施技術(shù)棧有更深入的理解。AI基礎(chǔ)設(shè)施是指AI應(yīng)用構(gòu)建、測試、訓(xùn)練與部署所需的最新、最先進的硬軟件技術(shù)棧。
為了在新的AI基礎(chǔ)設(shè)施上成功實現(xiàn)大語言模型的生產(chǎn)部署,企業(yè)應(yīng)從以下三個方面著手:構(gòu)建全面的生產(chǎn)發(fā)布策略;制定健全的治理框架;并加強與法律、安全、AI、數(shù)據(jù)團隊及生態(tài)伙伴的緊密協(xié)作。這些舉措為大語言模型在生產(chǎn)環(huán)境中的高效運行提供了堅實的保障。
構(gòu)建全面的部署戰(zhàn)略
隨著企業(yè)開始在AI基礎(chǔ)設(shè)施上部署大語言模型,I&O領(lǐng)導(dǎo)者所面臨的壓力日益增大,需要幫助AI開發(fā)人員和工程師在全企業(yè)范圍內(nèi)以更快的速度、更大的規(guī)模來推進AI項目的開發(fā)和部署。與此同時,針對不同用戶和應(yīng)用場景不斷涌現(xiàn)的各種AI工具和服務(wù),顯著增加了評估與選擇的難度和復(fù)雜性。此外,傳統(tǒng)的生產(chǎn)發(fā)布策略與流程已無法有效支持大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需求。因此,I&O領(lǐng)導(dǎo)者亟需制定完善的生產(chǎn)發(fā)布戰(zhàn)略,以保障部署工作的順利進行。
然而,要為大語言模型在AI基礎(chǔ)設(shè)施上的部署構(gòu)建一套穩(wěn)健的戰(zhàn)略,就需要從整體視角出發(fā),包括適配AI基礎(chǔ)設(shè)施環(huán)境、為特定場景設(shè)計架構(gòu)、實施技術(shù)優(yōu)化以及確保符合監(jiān)管框架要求。
中國的I&O領(lǐng)導(dǎo)者應(yīng):
使部署策略與企業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略保持一致
按照使用場景構(gòu)建多層次部署架構(gòu)以優(yōu)化性能
優(yōu)化模型與推理以提升效率
使用云原生技術(shù)實現(xiàn)靈活調(diào)度
加強合規(guī)并強化安全管理
建立全鏈路監(jiān)控與成本控制機制
制定穩(wěn)健的部署治理流程
大語言模型已經(jīng)從研究原型轉(zhuǎn)變?yōu)槎喾N任務(wù)的關(guān)鍵核心組件,包括客戶支持AI智能體、法律文檔摘要、代碼生成或測試工具、企業(yè)級代理型AI用例以及多模態(tài)應(yīng)用等領(lǐng)域。然而,大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需要解決如下幾個固有挑戰(zhàn):
資源密集
非確定性行為與提示敏感
延遲與吞吐限制
安全與隱私
因此,為了成功將大語言模型部署到AI基礎(chǔ)設(shè)施的生產(chǎn)環(huán)境中,中國的I&O部門必須建立一套穩(wěn)健的治理流程,采取切實可行的步驟促進資源管理、持續(xù)監(jiān)控以及敏捷更新。比如:
提前規(guī)劃并進行試點
確定產(chǎn)品部署位置
建立高效的資源管理
在大語言模型生產(chǎn)發(fā)布流程中嵌入安全治理與提示治理
管理版本并執(zhí)行A/B測試
采用持續(xù)集成/持續(xù)交付流程
實施生產(chǎn)監(jiān)控
促進關(guān)鍵利益相關(guān)方之間的緊密協(xié)作
部署大語言模型十分復(fù)雜,要求業(yè)務(wù)、法務(wù)、安全以及AI與數(shù)據(jù)團隊以協(xié)同一致的方式共同工作。過去各自獨立的部門如今必須從大語言模型項目的啟動階段就開展合作,以確保技術(shù)開發(fā)能夠反映法律和安全方面的考量。建立跨職能的AI治理委員會至關(guān)重要,成員應(yīng)包括法務(wù)、安全、數(shù)據(jù)工程與數(shù)據(jù)科學(xué)、產(chǎn)品管理、軟件開發(fā)以及高管層的代表。
文章來源:Gartner
-
AI
+關(guān)注
關(guān)注
91文章
39531瀏覽量
301056 -
人工智能
+關(guān)注
關(guān)注
1816文章
50062瀏覽量
264945 -
語言模型
+關(guān)注
關(guān)注
0文章
571瀏覽量
11304
發(fā)布評論請先 登錄
大模型 ai coding 比較
AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版
亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能AI環(huán)境
GlobalData與華為探討AI對網(wǎng)絡(luò)基礎(chǔ)設(shè)施的機遇與挑戰(zhàn)
科士達全棧解決方案亮相2025 ODCC,驅(qū)動綠色AI智算基礎(chǔ)設(shè)施革新
ai_cube訓(xùn)練模型最后部署失敗是什么原因?
摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施
在AI基礎(chǔ)設(shè)施中部署大語言模型的三大舉措
評論