案例介紹
金山辦公與 NVIDIA 團(tuán)隊(duì)合作,通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率;借助 NVIDIA Triton 推理服務(wù)器的部署,成功優(yōu)化 GPU 利用率,提供高推理吞吐量。
客戶簡介及應(yīng)用背景
金山辦公是一家辦公軟件和服務(wù)提供商,主要從事 WPS Office 辦公軟件產(chǎn)品及服務(wù)的設(shè)計(jì)研發(fā)及銷售推?。產(chǎn)品包括 WPS Office 辦公軟件、???檔等協(xié)同辦公產(chǎn)品、圖像文檔識別與理解業(yè)務(wù),可在 Windows、Linux、macOS、Android、iOS 、Harmony 等眾多主流操作平臺上應(yīng)?,于全球也有越來越多的用戶樂享金山辦公提供的產(chǎn)品和服務(wù)。
在辦公場景中,文檔類型圖像被廣泛使用,比如證件、發(fā)票、合同、保險(xiǎn)單、掃描書籍、拍攝的表格等,這類圖像包含了大量的純文本信息,還包含有表格、圖片、印章、手寫、公式等復(fù)雜的版面布局和結(jié)構(gòu)信息。早前這些信息均采用人工來處理,需要耗費(fèi)大量人力,很大程度上阻礙了企業(yè)的辦公效率 。其圖像文檔識別與內(nèi)容理解業(yè)務(wù)就是為了解決此類用戶痛點(diǎn)。
自 2017 年以來的不斷耕耘,金山辦公在圖像文檔識別與理解領(lǐng)域已達(dá)到了國內(nèi)領(lǐng)先水平。其主要使用了 CV(Computer Vision)與 VIE(Visual Information Extraction 視覺信息抽?。?等相關(guān)深度學(xué)習(xí)技術(shù),例如通過 CV 技術(shù)識別發(fā)票和 PDF 大綱并獲取其中的數(shù)據(jù)關(guān)系,其日請求次數(shù)已達(dá)上億次。
客戶挑戰(zhàn)
圖像識別與理解是一個(gè)很復(fù)雜的過程,一個(gè)任務(wù)的 pipeline 用到的深度學(xué)習(xí)模型多達(dá) 20+ 個(gè),且日請求量級較大(上億級別)需要大量的計(jì)算資源。當(dāng)業(yè)務(wù)落地時(shí),團(tuán)隊(duì)主要面臨以下兩個(gè)挑戰(zhàn):
1、任務(wù)的絕對耗時(shí)不能過長。
2、成本問題。
應(yīng)用方案
為了解決上訴的兩個(gè)挑戰(zhàn),金山辦公采用了 NVIDIA T4 Tensor Core GPU 進(jìn)行推理、NVIDIA TensorRT 8.2.4 進(jìn)行模型加速、NVIDIA Triton 推理服務(wù)器 22.04 在 K8S 上進(jìn)行模型部署與編排。
長鏈路(多達(dá) 20+ 個(gè)模型的 pipeline)意味著長耗時(shí),若基于 CPU 推理的話,pipeline 耗時(shí)會長達(dá) 15 秒左右,通過 GPU 推理和 TensorRT 加速,成功將耗時(shí)降低到了 2.4 秒左右。
模型部署的時(shí)候,常見的做法是推理與業(yè)務(wù)代碼(前后處理)放在一個(gè)進(jìn)程空間里,每個(gè)模型需要在每個(gè)進(jìn)程中加載一次,由于顯存的限制,很多時(shí)候難以得到較高的單卡 GPU 使用率。就算采用了進(jìn)程池的方式提高了單卡的 GPU 利用率,也會因 CPU 的限制,出現(xiàn)機(jī)器整體的 GPU 利用率不高。而在引入了 Triton 推理服務(wù)器進(jìn)行推理部署后,將推理與業(yè)務(wù)代碼解耦,初步實(shí)現(xiàn)將 GPU 資源池化調(diào)度。最終在同等業(yè)務(wù)規(guī)模情況下,部署成本節(jié)省了 23%。
模型耗時(shí)

表1 模型耗時(shí)
模型吞吐量對比圖



WPS 生成式 AI 的最新進(jìn)展
WPS AI 緊跟業(yè)界潮流,再發(fā)布新 AI 能力,覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問答、人機(jī)交互等方面。在 PPT 中,WPS AI 現(xiàn)已支持輸入主題,一鍵生成 PPT 演示文稿,并會根據(jù)用戶要求進(jìn)行細(xì)化調(diào)節(jié),如更改主題風(fēng)格、單頁美化、更改字體、更改配色、生成演講稿等等。
在 PDF 中,WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔,用戶以問答方式則可以獲得關(guān)鍵信息。并且,問答助手也會提供文檔溯源功能,確保用戶能夠得知信息來源。
用戶能夠通過手機(jī)等移動設(shè)備拍攝相關(guān)文檔,而后 WPS 給出相關(guān)翻譯、概括、分析等功能。
圖 1. WPS-AI 隨手拍與文檔問答

圖 2. WPS-AI 大綱生成
圖 3. WPS-AI PPT 美化
圖 4. WPS-AI PPT 生成
使用效果及影響
金山辦公圖像文檔識別與理解業(yè)務(wù),通過采用 NVIDIA T4 Tensor Core GPU 及 TensorRT加速,相比于 CPU 其 pipleline 耗時(shí)共下降 84%;而采用 NVIDIA Triton 推理服務(wù)器部署,其部署成本節(jié)省了 23% 。
金山辦公 CV 團(tuán)隊(duì)總監(jiān)熊龍飛表示:”我們有多個(gè)業(yè)務(wù)后邊的 AI 服務(wù)已經(jīng)通過采用該方案提高了速度和資源利用率,不僅給用戶端帶去了更高的速度響應(yīng),提高了用戶體驗(yàn),也為公司節(jié)約了大量的服務(wù)端 GPU 資源,收獲了更高的效益。我們在文檔識別與理解領(lǐng)域的應(yīng)用案例也可以啟發(fā)到 OCR 和版式識別領(lǐng)域的其他公司和學(xué)者,相信隨著更多客戶通過采用 TensorRT 加速會給行業(yè)帶來很大的收益?!?/em>
*本文中圖片均來源于金山辦公,如果您有任何疑問或需要使用本文中的圖片,請聯(lián)系金山辦公。
點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!
原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)
文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4112瀏覽量
99591
原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序
Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理
NVIDIA加速計(jì)算平臺助力從地球到太空的AI應(yīng)用
生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅(qū)動的藥物研發(fā)
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)
評論