chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

使用Firebase AI Logic生成圖像模型的兩種新功能

谷歌開發(fā)者 ? 來源:谷歌開發(fā)者 ? 2025-11-30 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者 / 高級開發(fā)者關系工程師 Thomas Ezan 和開發(fā)者關系工程師 Mozart Louis

為您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功能預覽版;其二是 Gemini 2.5 Flash Image (又名 Nano Banana) 正式版,后者的專長就是在情境或?qū)υ捴猩蓤D像。

借助 Firebase AI Logic 生成圖像以提高用戶參與度

圖像生成模型可用于創(chuàng)建自定義用戶個人資料頭像,或?qū)€性化視覺素材直接集成到應用關鍵流程中。

例如,Imagen 提供了尚處于開發(fā)者預覽版的全新編輯功能?,F(xiàn)在,您可以繪制遮罩并利用圖像內(nèi)繪制 (inpainting) 在遮罩區(qū)域內(nèi)生成像素。此外,還提供了圖像擴展 (outpainting) 功能,可用于生成遮罩區(qū)域外的像素。

另一方面,Gemini 2.5 Flash Image (又名 Nano Banana) 可以使用 Gemini 模型淵博的世界知識和推理能力來生成與上下文相關的圖像,這非常適合用于創(chuàng)建與用戶當前應用內(nèi)體驗契合的動態(tài)插圖。

△ 使用 Gemini 2.5 Flash Image 創(chuàng)建與您的應用上下文相關的動態(tài)插圖

最后,借助對話和迭代編輯圖像的功能,用戶可以使用自然語言編輯圖像。

在著手將 AI 集成到您的應用中時,了解 AI 安全性非常重要。尤其關鍵的是,您需要評估應用的安全風險、斟酌調(diào)整以降低安全風險、執(zhí)行適合您用例的安全測試,以及征求用戶反饋并監(jiān)控內(nèi)容。

Imagen 或 Gemini 任您選擇

Gemini 2.5 Flash Image (Nano Banana) 和 Imagen 之間的區(qū)別在于各自獨特的側(cè)重點和高級功能。Gemini 2.5 Flash Image 作為廣泛的 Gemini 系列中的圖像模型,擅長對話式圖像編輯,能在多次迭代中保持上下文和主體一致性,并利用 "世界知識和推理" 來創(chuàng)建與上下文相關的視覺內(nèi)容,或在長文本序列中嵌入準確的視覺內(nèi)容。

Imagen 是 Google 的專業(yè)圖像生成模型,專為更好地發(fā)揮創(chuàng)意和掌控作品而設計,擅長于高度真實的輸出、藝術細節(jié)、特定風格,并提供明確的控制選項,來指定生成圖像的寬高比或格式。

Gemini 2.5 Flash Image
(Nano Banana )
Imagen
具備世界知識和推理能力,生成與上下文更相關的圖像
在保持與上下文關聯(lián)性的同時,通過對話編輯圖像
在長文本序列中嵌入準確的視覺內(nèi)容
指定生成圖像的寬高比或格式
支持基于遮罩的編輯,實現(xiàn)圖像內(nèi)繪制和圖像擴展
更好地控制生成圖像的細節(jié) (質(zhì)量、藝術細節(jié)和特定風格)

一起來了解如何在您的應用中使用上述功能。

使用 Imagen 進行圖像內(nèi)繪制

幾個月前,我們發(fā)布了 Imagen 新的編輯功能。雖然 Imagen 的圖像生成功能已可正式用于生產(chǎn)環(huán)境,但編輯功能仍處于開發(fā)者預覽版階段。

Imagen 編輯功能包括圖像內(nèi)繪制和圖像擴展,二者均為基于遮罩的圖像編輯功能。這項新功能允許用戶修改圖像的特定區(qū)域,而無需重新生成整個圖像。這意味著您可以保留圖像中您最滿意的部分,只更改您想要調(diào)整的內(nèi)容。

做出這些更改時,原始圖像的核心元素和圖像整體完整性不受影響,您可以僅調(diào)整遮罩區(qū)域。

要使用 Imagen 的圖像內(nèi)繪制功能,請先初始化 imagen-3.0-capability-001,這是支持編輯功能的特定 Imagen 模型:

// Copyright2025Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
    Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
     "imagen-3.0-capability-001",
      generationConfig =ImagenGenerationConfig(
        numberOfImages =1,
        aspectRatio = ImagenAspectRatio.SQUARE_1x1,
        imageFormat = ImagenImageFormat.jpeg(compressionQuality =75),
      ),
    )

然后,定義圖像內(nèi)繪制函數(shù):

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
valprompt ="remove the pancakes and make it an omelet instead"
suspendfuninpaintImageWithMask(sourceImage:Bitmap, maskImage:Bitmap, prompt:String, editSteps:Int=50): Bitmap {
   valimageResponse = editingModel.editImage(
      referenceImages = listOf(
        ImagenRawImage(sourceImage.toImagenInlineImage()),
        ImagenRawMask(maskImage.toImagenInlineImage()),
      ),
      prompt = prompt,
      config = ImagenEditingConfig(
        editMode = ImagenEditMode.INPAINT_INSERTION,
        editSteps = editSteps,
      ),
    )
   returnimageResponse.images.first().asBitmap()
  }

您需要提供一張原始圖像、一張遮罩圖像、用于編輯的提示詞以及需要執(zhí)行的編輯步驟數(shù)量。

您可以在 Android AI 示例庫的 Imagen Editing Sample 中,查看其實際運行效果!

Imagen 還支持圖像擴展,該功能使您能讓模型在遮罩外的區(qū)域生成像素。您還可以使用 Imagen 的圖像自定義功能來更改圖像風格或更新圖像中的一個主體。有關詳細信息,請參閱 Android 開發(fā)者文檔。

使用 Gemini 2.5 Flash Image 通過對話生成圖像

要使用 Gemini 2.5 Flash Image 編輯圖像,一種方法是通過該模型的多輪聊天功能進行編輯。

首先,初始化模型:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
valmodel=Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
  modelName ="gemini-2.5-flash-image",
 // Configure the model to respond with text and images (required)
  generationConfig = generationConfig {
    responseModalities = listOf(ResponseModality.TEXT,
    ResponseModality.IMAGE)
  }
)

為了實現(xiàn)與上述基于遮罩的 Imagen 方法類似的結(jié)果,我們可以利用chatAPI,啟動與 Gemini 2.5 Flash Image 的對話。

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
// Initialize the chat
valchat=model.startChat()
// Load a bitmap
valsource=ImageDecoder.createSource(context.contentResolver, uri)
valbitmap=ImageDecoder.decodeBitmap(source)
// Create the initial prompt instructing the model to edit the image
valprompt=content {
  image(bitmap)
  text("remove the pancakes and add an omelet")
}
// To generate an initial response, send a user message with the image and text prompt
varresponse=chat.sendMessage(prompt)
// Inspect the returned image
vargeneratedImageAsBitmap=response
  .candidates.first().content.parts.filterIsInstance().firstOrNull()?.image
// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response  .candidates.first().content.parts.filterIsInstance().firstOrNull()?.image

您可以在 Android AI 示例庫的 Gemini Image Chat Sample 查看該功能的實際運作,也可參閱 Android 技術文檔以了解更多相關信息。

結(jié)論

Imagen 和 Gemini 2.5 Flash Image 都提供了強大的功能,允許您根據(jù)具體用例選擇理想的圖像生成模型,從而讓您的應用更加個性化,并提高用戶參與度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    74

    瀏覽量

    8173
  • AI
    AI
    +關注

    關注

    91

    文章

    40941

    瀏覽量

    302517
  • 模型
    +關注

    關注

    1

    文章

    3810

    瀏覽量

    52253

原文標題:一文詳解 | 從了解到集成,輕松為您的應用選擇理想的圖像生成模型

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于擴散模型圖像生成過程

    近年來,擴散模型在文本到圖像生成方面取得了巨大的成功,實現(xiàn)了更高圖像生成質(zhì)量,提高了推理性能,也可以激發(fā)擴展創(chuàng)作靈感。 不過僅憑文本來控制
    的頭像 發(fā)表于 07-17 11:00 ?4409次閱讀
    基于擴散<b class='flag-5'>模型</b>的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>過程

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局一致性等方面的細微差異。 邊緣端部署:將模型量化、編譯,最終高效運行在算力
    發(fā)表于 08-21 13:59

    機器人運動控制的兩種模型

    以六自由度模塊化機器人為對象,利用D-H坐標變換方法進行運動學分析,計算出各桿之間的齊次坐標變換矩陣,建立求解機器人逆運動學問題的兩種模型。并根據(jù)兩種模型應用vc++
    發(fā)表于 08-05 11:34 ?14次下載

    機器人運動控制的兩種模型

    以六自由度模塊化機器人為對象,利用D-H坐標變換方法進行運動學分析,計算出各桿之間的齊次坐標變換矩陣,建立求解機器人逆運動學問題的兩種模型。并根據(jù)兩種模型應用vc++程
    發(fā)表于 07-20 15:33 ?24次下載

    兩種空間矢量脈寬調(diào)制生成方法的分析與比較

    兩種空間矢量脈寬調(diào)制生成方法的分析與比較
    發(fā)表于 03-30 18:24 ?11次下載

    iOS10.3beta3推送 修復bug增加兩種新功能

    今天凌晨蘋果正式向開發(fā)者推送了iOS 10.3 beta 3的開發(fā)者預覽版固件。本次更新仍然主要以bug修復和性能提升為主,另外還加入了新的功能:應用兼容性、查找AirPods兩種新功能,同時也調(diào)整了關于APP store的一些
    發(fā)表于 02-22 08:41 ?1676次閱讀

    基于改進的DCGAN生成SAR圖像的方法

    針對SAR圖像識別軟件,通過改進 DCGAN模型生成器與單判別器對抗的結(jié)構(gòu),采用多生成器與單判別器進行對抗,設計了控制各生成
    發(fā)表于 04-23 11:01 ?21次下載
    一<b class='flag-5'>種</b>基于改進的DCGAN<b class='flag-5'>生成</b>SAR<b class='flag-5'>圖像</b>的方法

    基于生成式對抗網(wǎng)絡的圖像補全方法

    圖像補全是數(shù)字圖像處理領域的重要研究方向,具有廣闊的應用前景。提出了一基于生成式對抗網(wǎng)絡(GAN)的圖像補全方法。
    發(fā)表于 05-19 14:38 ?14次下載

    Stability AI開源圖像生成模型Stable Diffusion

    Stable Diffusion 的很多用戶已經(jīng)公開發(fā)布了生成圖像的樣例,Stability AI 的首席開發(fā)者 Katherine Crowson 在推特上分享了許多圖像?;?
    的頭像 發(fā)表于 09-21 15:37 ?3835次閱讀

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領先的前身Stable Diffusion更快、更強大,而Stable Diffusion是許多其他文
    的頭像 發(fā)表于 02-19 16:03 ?1864次閱讀
    Stability <b class='flag-5'>AI</b>試圖通過新的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>人工智能<b class='flag-5'>模型</b>保持領先地位

    谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內(nèi)重新發(fā)布其備受關注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像
    的頭像 發(fā)表于 02-28 10:17 ?1287次閱讀

    快手自研文生圖大模型“可圖”開放,支持AI圖像創(chuàng)作及定制

    5月30日最新動態(tài),快手于近日向公眾推出其自主研發(fā)的文生圖大模型命名為“可圖”。該模型具備文生圖及圖生圖兩種功能,適用于AI
    的頭像 發(fā)表于 05-31 10:32 ?1510次閱讀

    如何用C++創(chuàng)建簡單的生成AI模型

    生成AI(Generative AI)是一人工智能技術,它通過機器學習模型和深度學習技術,從大量歷史數(shù)據(jù)中學習對象的特征和規(guī)律,從而能夠
    的頭像 發(fā)表于 07-05 17:53 ?3302次閱讀

    Google款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質(zhì)的圖像生成
    的頭像 發(fā)表于 12-30 09:56 ?1229次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成AI 領域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創(chuàng)意的提示,然后使用 Imagen 3
    的頭像 發(fā)表于 01-03 10:38 ?1664次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質(zhì)量<b class='flag-5'>圖像</b>