近日,騰訊混元團(tuán)隊(duì)宣布開(kāi)源混元圖像3.0圖生圖版本(HunyuanImage 3.0-Instruct),沐曦股份曦云C500/C550 24小時(shí)內(nèi)完成適配,為國(guó)內(nèi)首批適配該模型的國(guó)產(chǎn)算力。
此次高效適配得益于沐曦自研MXMACA軟件棧的良好兼容性和適配能力。作為沐曦“自主GPGPU硬件+全棧軟件體系”的關(guān)鍵協(xié)同載體,MXMACA承擔(dān)著連接硬件算力單元與上層應(yīng)用生態(tài)的核心紐帶作用,覆蓋底層驅(qū)動(dòng)、用戶態(tài)接口、編譯器、算子適配、訓(xùn)練框架、推理框架、行業(yè)場(chǎng)景優(yōu)化等全鏈路能力,是支撐國(guó)產(chǎn)GPU生態(tài)落地與行業(yè)賦能的算力基座。
關(guān)于騰訊混元圖像3.0圖生圖
混元圖像3.0圖生圖支持多樣化的圖片編輯與多圖融合能力,包括增、刪、改、風(fēng)格變換、老照片修復(fù)、人物與文字修改等圖片編輯功能,以及將多張照片中的元素提取出來(lái)合成新圖片的能力。對(duì)于普通用戶,該模型可用于制作表情包、虛擬人物合拍、社交分享等日常場(chǎng)景。對(duì)于專業(yè)用戶,它能夠助力電商海報(bào)設(shè)計(jì)、游戲角色定制、創(chuàng)意圖片制作等專業(yè)領(lǐng)域,顯著提升創(chuàng)作效率。
混元圖像3.0圖生圖版本基于混元圖像3.0的原生多模態(tài)架構(gòu)構(gòu)建,將文本理解、視覺(jué)理解與圖像生成深度融合于同一模型中。作為原生多模態(tài)模型,混元圖像3.0圖生圖核心創(chuàng)新在于其“先思考,后編輯”的工作流程。當(dāng)接收到用戶輸入的圖片和提示詞后,模型會(huì)首先理解圖像內(nèi)容,然后基于提示詞進(jìn)行推理,確定需要編輯的區(qū)域、詳細(xì)步驟以及需要保留的區(qū)域,最終形成更加詳細(xì)的編輯指令。
混元圖像3.0圖生圖基于80B總參數(shù)規(guī)模(激活參數(shù)約13B)的混合專家原生多模態(tài)架構(gòu),在處理圖像編輯任務(wù)時(shí)展現(xiàn)出強(qiáng)大的推理能力和精準(zhǔn)的編輯效果。訓(xùn)練過(guò)程中,混元團(tuán)隊(duì)構(gòu)建了千萬(wàn)量級(jí)的圖生圖數(shù)據(jù),覆蓋80多個(gè)任務(wù),并注入了思維鏈數(shù)據(jù),使模型能夠?qū)W會(huì)先分析用戶圖像和意圖,再輸出詳細(xì)編輯指令。后訓(xùn)練階段采用自研MixGRPO算法,高效對(duì)齊用戶偏好,大幅提升了指令響應(yīng)和非編輯區(qū)域保持一致的效果。
最新全球權(quán)威大模型競(jìng)技場(chǎng)LMArena的圖像編輯(Image Edit)榜單中,混元圖像3.0圖生圖進(jìn)入第一梯隊(duì),成為全球最強(qiáng)的開(kāi)源圖生圖模型。
在最新的LMArena圖片編輯榜單上,騰訊混元圖像3.0圖生圖位列全球第七,也是前七名里面唯一開(kāi)源的模型。LMArena官方X祝賀混元圖像3.0圖生圖“在圖片編輯磅榜單中與Nano-Banana和Seedream-4.5等表現(xiàn)相當(dāng)”。這一成績(jī)來(lái)自于對(duì)模型圖像編輯能力的全面盲測(cè)評(píng)估,包括指令遵循、編輯精確度和輸出質(zhì)量等多個(gè)維度。
近期,騰訊混元圖像3.0圖生圖模型在元寶上線,用戶只需要上傳1張或以上的圖片并輸入指令即可體驗(yàn)。該能力受到眾多用戶喜愛(ài)。
網(wǎng)友在元寶上使用混元圖生圖能力,圖片來(lái)自網(wǎng)絡(luò)
附混元圖像3.0圖生圖開(kāi)源項(xiàng)目地址:
Github:
https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
Hugging Face:https://huggingface.co/tencent/HunyuanImage-3.0-Instruct
Hugging Face(蒸餾版):https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil
關(guān)于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。
-
開(kāi)源
+關(guān)注
關(guān)注
3文章
4178瀏覽量
46025 -
模型
+關(guān)注
關(guān)注
1文章
3735瀏覽量
52066 -
沐曦
+關(guān)注
關(guān)注
1文章
74瀏覽量
1800
原文標(biāo)題:
文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
沐曦曦云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型
沐曦股份正式推出曦索X系列全新GPU品牌與產(chǎn)品線
沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊混元開(kāi)源翻譯模型1.5版本
DLInfer聯(lián)手沐曦股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地
首款全國(guó)產(chǎn)通用GPU芯片發(fā)布 沐曦集成推出曦云C600
沐曦GPU與龍蜥操作系統(tǒng)完成適配
沐曦曦云C系列產(chǎn)品已支持TileLang
沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊混元圖像3.0圖生圖模型
評(píng)論