亚洲AV高清HD,yellow资源大全

作者 / 資深研究科學(xué)家David Vilar,產(chǎn)品經(jīng)理Kat Black

我們已正式推出 TranslateGemma，這一全新的開放翻譯模型系列基于 Gemma 3 構(gòu)建，并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問世標(biāo)志著開放翻譯領(lǐng)域邁出了重要一步，它可幫助人們跨越 55 種語言進(jìn)行交流，無論身在何處或使用何種設(shè)備均可輕松實(shí)現(xiàn)。

我們將最先進(jìn)的大模型相關(guān)知識提煉到緊湊的高性能開放模型中，由此打造出了這套效率與質(zhì)量兼?zhèn)涞哪Ｐ汀?/p>

性能表現(xiàn)勝于其規(guī)模兩倍的模型

在我們的技術(shù)評估中，最引人注目的一項(xiàng)發(fā)現(xiàn)是這些模型的效率。得益于專項(xiàng)訓(xùn)練流程，TranslateGemma 12B 模型在 WMT24++ 基準(zhǔn)測試中的表現(xiàn)遠(yuǎn)超 Gemma 3 27B 基準(zhǔn)模型 (基于 MetricX 指標(biāo)衡量)。

對于開發(fā)者而言，這是一項(xiàng)重大突破。僅需不到基準(zhǔn)模型一半的參數(shù)量，即可實(shí)現(xiàn)高保真級的翻譯質(zhì)量。這項(xiàng)效率突破可在不影響準(zhǔn)確率的前提下，顯著提高吞吐量并降低延遲。同樣地，4B 模型的性能可與規(guī)模較大的 12B 基準(zhǔn)模型的性能相媲美，這也使其成為適合移動端推理的強(qiáng)大模型。

我們基于 WMT24++ 數(shù)據(jù)集對 TranslateGemma 進(jìn)行了全面評估。該數(shù)據(jù)集包含 55 種語言，涵蓋多種語系，高資源、中資源和低資源語言應(yīng)有盡有。與 Gemma 基準(zhǔn)模型相比，TranslateGemma 在所有語言中均可大幅降低錯(cuò)誤率，并能以更高效率實(shí)現(xiàn)更高質(zhì)量。

基于 Gemini 構(gòu)建

這種智能密度究竟是如何實(shí)現(xiàn)的？這要?dú)w功于一套獨(dú)特的兩階段微調(diào)過程，此過程將 Gemini 模型的 "直覺" 提煉到一個(gè)開放架構(gòu)當(dāng)中。

監(jiān)督微調(diào) (SFT): 我們在一個(gè)多樣化的平行數(shù)據(jù)數(shù)據(jù)集上對 Gemma 3 基準(zhǔn)模型進(jìn)行了微調(diào)。此數(shù)據(jù)集包含大量人工翻譯文本，并結(jié)合由最先進(jìn)的 Gemini 模型生成的高質(zhì)量合成翻譯，即使在低資源語言中也能實(shí)現(xiàn)廣泛的語言覆蓋率和高保真度。

強(qiáng)化學(xué)習(xí) (RL): 為了進(jìn)一步優(yōu)化翻譯質(zhì)量，我們引入了一個(gè)新穎的強(qiáng)化學(xué)習(xí)階段。我們使用包含 MetricX-QE 和 AutoMQM 等高級指標(biāo)在內(nèi)的多種獎(jiǎng)勵(lì)模型，來引導(dǎo)模型產(chǎn)生更符合語境且聽起來更自然的翻譯。

前所未有的語言覆蓋率

我們對 TranslateGemma 在 55 個(gè)語言對上進(jìn)行了嚴(yán)格的訓(xùn)練和評估，以確保它能在主要語言 (如西班牙語、法語、中文和印地語) 以及多種低資源語言中均提供高質(zhì)量的可靠性能。

除了這些核心語言外，我們還通過針對近 500 個(gè)其他語言對進(jìn)行訓(xùn)練來突破極限。TranslateGemma 的設(shè)計(jì)定位是成為深度優(yōu)化的堅(jiān)實(shí)基礎(chǔ)，使其成為研究人員針對特定語言對微調(diào)其前沿模型，或提升低資源語言翻譯質(zhì)量的理想起點(diǎn)。雖然我們尚未確認(rèn)此擴(kuò)展集合的評估指標(biāo)，但我們已將完整列表納入技術(shù)報(bào)告，以此鼓勵(lì)社區(qū)進(jìn)行探索和深度研究。

強(qiáng)大的多模態(tài)能力

TranslateGemma 模型延續(xù)了 Gemma 3 強(qiáng)大的多模態(tài)功能。我們根據(jù) Vistra 圖像翻譯基準(zhǔn)執(zhí)行的測試表明，文本翻譯能力的提升也會對圖像內(nèi)文本的翻譯能力產(chǎn)生積極影響，即使在 TranslateGemma 訓(xùn)練過程中未進(jìn)行特定的多模態(tài)微調(diào)亦是如此。

全場景靈活部署

TranslateGemma 為開放翻譯模型樹立了全新標(biāo)準(zhǔn)，并在最優(yōu)性能與卓越效率之間取得平衡。這些模型專為多樣化的部署環(huán)境而設(shè)計(jì)，還有三種規(guī)模任您選擇:

4B 模型: 針對移動端和邊緣部署進(jìn)行了優(yōu)化。

12B 模型: 設(shè)計(jì)為可在消費(fèi)級筆記本電腦上流暢運(yùn)行，為本地開發(fā)環(huán)境帶來研究級的強(qiáng)大性能。

27B 模型: 旨在提供最大保真度，能夠在云端的單個(gè) H100 GPU 或 TPU 上運(yùn)行。

即刻體驗(yàn) TranslateGemma

TranslateGemma 版本的發(fā)布為研究人員和開發(fā)者提供了功能強(qiáng)大且適配靈活的工具，以滿足各種翻譯相關(guān)任務(wù)的需求。我們期待看到社區(qū)在這些模型的基礎(chǔ)上進(jìn)行構(gòu)建并加以利用，共同打破語言障礙并促進(jìn)跨文化深度理解。具體試用方式如下:

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

開源

開源

+關(guān)注

關(guān)注
3

文章
4180

瀏覽量
46032
模型

模型

+關(guān)注

關(guān)注
1

文章
3738

瀏覽量
52068

原文標(biāo)題：TranslateGemma: 全新開放翻譯模型系列，助您實(shí)現(xiàn)高效的多模態(tài)翻譯

文章出處：【微信號：Google_Developers，微信公眾號：谷歌開發(fā)者】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

谷歌推出TranslateGemma全新開放翻譯模型系列

評論