作者 / 資深研究科學(xué)家David Vilar,產(chǎn)品經(jīng)理Kat Black
我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問世標(biāo)志著開放翻譯領(lǐng)域邁出了重要一步,它可幫助人們跨越 55 種語言進(jìn)行交流,無論身在何處或使用何種設(shè)備均可輕松實(shí)現(xiàn)。
我們將最先進(jìn)的大模型相關(guān)知識提煉到緊湊的高性能開放模型中,由此打造出了這套效率與質(zhì)量兼?zhèn)涞哪P汀?/p>
性能表現(xiàn)勝于其規(guī)模兩倍的模型
在我們的技術(shù)評估中,最引人注目的一項(xiàng)發(fā)現(xiàn)是這些模型的效率。得益于專項(xiàng)訓(xùn)練流程,TranslateGemma 12B 模型在 WMT24++ 基準(zhǔn)測試中的表現(xiàn)遠(yuǎn)超 Gemma 3 27B 基準(zhǔn)模型 (基于 MetricX 指標(biāo)衡量)。
對于開發(fā)者而言,這是一項(xiàng)重大突破。僅需不到基準(zhǔn)模型一半的參數(shù)量,即可實(shí)現(xiàn)高保真級的翻譯質(zhì)量。這項(xiàng)效率突破可在不影響準(zhǔn)確率的前提下,顯著提高吞吐量并降低延遲。同樣地,4B 模型的性能可與規(guī)模較大的 12B 基準(zhǔn)模型的性能相媲美,這也使其成為適合移動端推理的強(qiáng)大模型。
我們基于 WMT24++ 數(shù)據(jù)集對 TranslateGemma 進(jìn)行了全面評估。該數(shù)據(jù)集包含 55 種語言,涵蓋多種語系,高資源、中資源和低資源語言應(yīng)有盡有。與 Gemma 基準(zhǔn)模型相比,TranslateGemma 在所有語言中均可大幅降低錯(cuò)誤率,并能以更高效率實(shí)現(xiàn)更高質(zhì)量。
基于 Gemini 構(gòu)建
這種智能密度究竟是如何實(shí)現(xiàn)的?這要?dú)w功于一套獨(dú)特的兩階段微調(diào)過程,此過程將 Gemini 模型的 "直覺" 提煉到一個(gè)開放架構(gòu)當(dāng)中。
監(jiān)督微調(diào) (SFT): 我們在一個(gè)多樣化的平行數(shù)據(jù)數(shù)據(jù)集上對 Gemma 3 基準(zhǔn)模型進(jìn)行了微調(diào)。此數(shù)據(jù)集包含大量人工翻譯文本,并結(jié)合由最先進(jìn)的 Gemini 模型生成的高質(zhì)量合成翻譯,即使在低資源語言中也能實(shí)現(xiàn)廣泛的語言覆蓋率和高保真度。
強(qiáng)化學(xué)習(xí) (RL): 為了進(jìn)一步優(yōu)化翻譯質(zhì)量,我們引入了一個(gè)新穎的強(qiáng)化學(xué)習(xí)階段。我們使用包含 MetricX-QE 和 AutoMQM 等高級指標(biāo)在內(nèi)的多種獎(jiǎng)勵(lì)模型,來引導(dǎo)模型產(chǎn)生更符合語境且聽起來更自然的翻譯。
前所未有的語言覆蓋率
我們對 TranslateGemma 在 55 個(gè)語言對上進(jìn)行了嚴(yán)格的訓(xùn)練和評估,以確保它能在主要語言 (如西班牙語、法語、中文和印地語) 以及多種低資源語言中均提供高質(zhì)量的可靠性能。
除了這些核心語言外,我們還通過針對近 500 個(gè)其他語言對進(jìn)行訓(xùn)練來突破極限。TranslateGemma 的設(shè)計(jì)定位是成為深度優(yōu)化的堅(jiān)實(shí)基礎(chǔ),使其成為研究人員針對特定語言對微調(diào)其前沿模型,或提升低資源語言翻譯質(zhì)量的理想起點(diǎn)。雖然我們尚未確認(rèn)此擴(kuò)展集合的評估指標(biāo),但我們已將完整列表納入技術(shù)報(bào)告,以此鼓勵(lì)社區(qū)進(jìn)行探索和深度研究。
強(qiáng)大的多模態(tài)能力
TranslateGemma 模型延續(xù)了 Gemma 3 強(qiáng)大的多模態(tài)功能。我們根據(jù) Vistra 圖像翻譯基準(zhǔn)執(zhí)行的測試表明,文本翻譯能力的提升也會對圖像內(nèi)文本的翻譯能力產(chǎn)生積極影響,即使在 TranslateGemma 訓(xùn)練過程中未進(jìn)行特定的多模態(tài)微調(diào)亦是如此。
全場景靈活部署
TranslateGemma 為開放翻譯模型樹立了全新標(biāo)準(zhǔn),并在最優(yōu)性能與卓越效率之間取得平衡。這些模型專為多樣化的部署環(huán)境而設(shè)計(jì),還有三種規(guī)模任您選擇:
4B 模型: 針對移動端和邊緣部署進(jìn)行了優(yōu)化。
12B 模型: 設(shè)計(jì)為可在消費(fèi)級筆記本電腦上流暢運(yùn)行,為本地開發(fā)環(huán)境帶來研究級的強(qiáng)大性能。
27B 模型: 旨在提供最大保真度,能夠在云端的單個(gè) H100 GPU 或 TPU 上運(yùn)行。
即刻體驗(yàn) TranslateGemma
TranslateGemma 版本的發(fā)布為研究人員和開發(fā)者提供了功能強(qiáng)大且適配靈活的工具,以滿足各種翻譯相關(guān)任務(wù)的需求。我們期待看到社區(qū)在這些模型的基礎(chǔ)上進(jìn)行構(gòu)建并加以利用,共同打破語言障礙并促進(jìn)跨文化深度理解。具體試用方式如下:
-
開源
+關(guān)注
關(guān)注
3文章
4180瀏覽量
46032 -
模型
+關(guān)注
關(guān)注
1文章
3738瀏覽量
52068
原文標(biāo)題:TranslateGemma: 全新開放翻譯模型系列,助您實(shí)現(xiàn)高效的多模態(tài)翻譯
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
谷歌正式推出Gemini 3 Flash模型
NVIDIA在CES 2026發(fā)布全新開放模型、數(shù)據(jù)和工具
深入解析NVIDIA Nemotron 3系列開放模型
NVIDIA 推出 Nemotron 3 系列開放模型
NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列
面向科學(xué)仿真的開放模型系列NVIDIA Apollo正式發(fā)布
NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)
騰訊地圖推出全新時(shí)空智能開放平臺“蓋亞”
谷歌推出AI模型Gemma 3 270M
當(dāng)翻譯失去網(wǎng)絡(luò),時(shí)空壺新T1翻譯機(jī)開創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)
TDK推出全新SmartMotion ICM-536xx系列高性能六軸IMU
2025聯(lián)想創(chuàng)新開放日正式開啟
亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型
翼輝信息推出全新開發(fā)環(huán)境RealEvo-Stream
谷歌推出TranslateGemma全新開放翻譯模型系列
評論