蜜臀vA在线,精品亚洲AV无码区最新

作者 / 高級開發(fā)者關系工程師 Thomas Ezan 和開發(fā)者關系工程師 Mozart Louis

為您的應用添加自定義圖像，能夠顯著改善和個性化用戶體驗，有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功能預覽版;其二是 Gemini 2.5 Flash Image (又名 Nano Banana) 正式版，后者的專長就是在情境或?qū)υ捴猩蓤D像。

借助 Firebase AI Logic 生成圖像以提高用戶參與度

圖像生成模型可用于創(chuàng)建自定義用戶個人資料頭像，或?qū)€性化視覺素材直接集成到應用關鍵流程中。

例如，Imagen 提供了尚處于開發(fā)者預覽版的全新編輯功能?，F(xiàn)在，您可以繪制遮罩并利用圖像內(nèi)繪制 (inpainting) 在遮罩區(qū)域內(nèi)生成像素。此外，還提供了圖像擴展 (outpainting) 功能，可用于生成遮罩區(qū)域外的像素。

另一方面，Gemini 2.5 Flash Image (又名 Nano Banana) 可以使用 Gemini 模型淵博的世界知識和推理能力來生成與上下文相關的圖像，這非常適合用于創(chuàng)建與用戶當前應用內(nèi)體驗契合的動態(tài)插圖。

△ 使用 Gemini 2.5 Flash Image 創(chuàng)建與您的應用上下文相關的動態(tài)插圖

最后，借助對話和迭代編輯圖像的功能，用戶可以使用自然語言編輯圖像。

在著手將 AI 集成到您的應用中時，了解 AI 安全性非常重要。尤其關鍵的是，您需要評估應用的安全風險、斟酌調(diào)整以降低安全風險、執(zhí)行適合您用例的安全測試，以及征求用戶反饋并監(jiān)控內(nèi)容。

Imagen 或 Gemini 任您選擇

Gemini 2.5 Flash Image (Nano Banana) 和 Imagen 之間的區(qū)別在于各自獨特的側(cè)重點和高級功能。Gemini 2.5 Flash Image 作為廣泛的 Gemini 系列中的圖像模型，擅長對話式圖像編輯，能在多次迭代中保持上下文和主體一致性，并利用 "世界知識和推理" 來創(chuàng)建與上下文相關的視覺內(nèi)容，或在長文本序列中嵌入準確的視覺內(nèi)容。

Imagen 是 Google 的專業(yè)圖像生成模型，專為更好地發(fā)揮創(chuàng)意和掌控作品而設計，擅長于高度真實的輸出、藝術細節(jié)、特定風格，并提供明確的控制選項，來指定生成圖像的寬高比或格式。

Gemini 2.5 Flash Image (Nano Banana )	Imagen
具備世界知識和推理能力，生成與上下文更相關的圖像在保持與上下文關聯(lián)性的同時，通過對話編輯圖像在長文本序列中嵌入準確的視覺內(nèi)容	指定生成圖像的寬高比或格式支持基于遮罩的編輯，實現(xiàn)圖像內(nèi)繪制和圖像擴展更好地控制生成圖像的細節(jié) (質(zhì)量、藝術細節(jié)和特定風格)

一起來了解如何在您的應用中使用上述功能。

使用 Imagen 進行圖像內(nèi)繪制

幾個月前，我們發(fā)布了 Imagen 新的編輯功能。雖然 Imagen 的圖像生成功能已可正式用于生產(chǎn)環(huán)境，但編輯功能仍處于開發(fā)者預覽版階段。

Imagen 編輯功能包括圖像內(nèi)繪制和圖像擴展，二者均為基于遮罩的圖像編輯功能。這項新功能允許用戶修改圖像的特定區(qū)域，而無需重新生成整個圖像。這意味著您可以保留圖像中您最滿意的部分，只更改您想要調(diào)整的內(nèi)容。

做出這些更改時，原始圖像的核心元素和圖像整體完整性不受影響，您可以僅調(diào)整遮罩區(qū)域。

要使用 Imagen 的圖像內(nèi)繪制功能，請先初始化 imagen-3.0-capability-001，這是支持編輯功能的特定 Imagen 模型:

// Copyright2025Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
    Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
     "imagen-3.0-capability-001",
      generationConfig =ImagenGenerationConfig(
        numberOfImages =1,
        aspectRatio = ImagenAspectRatio.SQUARE_1x1,
        imageFormat = ImagenImageFormat.jpeg(compressionQuality =75),
      ),
    )

然后，定義圖像內(nèi)繪制函數(shù):

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
valprompt ="remove the pancakes and make it an omelet instead"
suspendfuninpaintImageWithMask(sourceImage:Bitmap, maskImage:Bitmap, prompt:String, editSteps:Int=50): Bitmap {
   valimageResponse = editingModel.editImage(
      referenceImages = listOf(
        ImagenRawImage(sourceImage.toImagenInlineImage()),
        ImagenRawMask(maskImage.toImagenInlineImage()),
      ),
      prompt = prompt,
      config = ImagenEditingConfig(
        editMode = ImagenEditMode.INPAINT_INSERTION,
        editSteps = editSteps,
      ),
    )
   returnimageResponse.images.first().asBitmap()
  }

您需要提供一張原始圖像、一張遮罩圖像、用于編輯的提示詞以及需要執(zhí)行的編輯步驟數(shù)量。

您可以在 Android AI 示例庫的 Imagen Editing Sample 中，查看其實際運行效果!

Imagen 還支持圖像擴展，該功能使您能讓模型在遮罩外的區(qū)域生成像素。您還可以使用 Imagen 的圖像自定義功能來更改圖像風格或更新圖像中的一個主體。有關詳細信息，請參閱 Android 開發(fā)者文檔。

使用 Gemini 2.5 Flash Image 通過對話生成圖像

要使用 Gemini 2.5 Flash Image 編輯圖像，一種方法是通過該模型的多輪聊天功能進行編輯。

首先，初始化模型:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
valmodel=Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
  modelName ="gemini-2.5-flash-image",
 // Configure the model to respond with text and images (required)
  generationConfig = generationConfig {
    responseModalities = listOf(ResponseModality.TEXT,
    ResponseModality.IMAGE)
  }
)

為了實現(xiàn)與上述基于遮罩的 Imagen 方法類似的結(jié)果，我們可以利用chatAPI，啟動與 Gemini 2.5 Flash Image 的對話。

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
// Initialize the chat
valchat=model.startChat()
// Load a bitmap
valsource=ImageDecoder.createSource(context.contentResolver, uri)
valbitmap=ImageDecoder.decodeBitmap(source)
// Create the initial prompt instructing the model to edit the image
valprompt=content {
  image(bitmap)
  text("remove the pancakes and add an omelet")
}
// To generate an initial response, send a user message with the image and text prompt
varresponse=chat.sendMessage(prompt)
// Inspect the returned image
vargeneratedImageAsBitmap=response
  .candidates.first().content.parts.filterIsInstance().firstOrNull()?.image
// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response  .candidates.first().content.parts.filterIsInstance().firstOrNull()?.image

您可以在 Android AI 示例庫的 Gemini Image Chat Sample 查看該功能的實際運作，也可參閱 Android 技術文檔以了解更多相關信息。

結(jié)論

Imagen 和 Gemini 2.5 Flash Image 都提供了強大的功能，允許您根據(jù)具體用例選擇理想的圖像生成模型，從而讓您的應用更加個性化，并提高用戶參與度。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

Gemini

Gemini

+關注

關注
0

文章
74

瀏覽量
8173
AI

AI

+關注

關注
91

文章
40941

瀏覽量
302517
模型

模型

+關注

關注
1

文章
3810

瀏覽量
52253

原文標題：一文詳解 | 從了解到集成，輕松為您的應用選擇理想的圖像生成模型

文章出處：【微信號：Google_Developers，微信公眾號：谷歌開發(fā)者】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

使用Firebase AI Logic生成圖像模型的兩種新功能

評論