在 2024 年 8 月 14 日的 Pixel 9 系列手机发布会上,谷歌推出了全新的图像生成应用 Pixel Studio。该应用基于谷歌的 Imagen 3 模型,能够在 2 秒内生成各种图像,并将预装在每台 Pixel 9 系列手机上。用户只需输入简单的提示词即可生成所需图像。Pixel Studio 依赖谷歌 Tensor G4 SoC 芯片进行本地生成,如果用户想要更高质量的内容,还可以调用 Gemini 在云端生成图片。发布会上,谷歌展示了该应用生成的一张小猫图片,生成时间不超过 2 秒。此外,谷歌还宣布了对 Gemini overlay 功能的改进,可以将人工智能生成的图片直接拖放到电子邮件或聊天中。
Pixel Studio 应用的核心技术是谷歌的 Imagen 3 模型,这是一种基于扩散技术的生成模型,能够将文本提示转换为图像。与其他 AI 图像生成器不同,Pixel Studio 主要在设备本地运行,这得益于谷歌最新的 Tensor G4 SoC 芯片。该芯片提供了计算能力,使得图像生成速度极快,仅需 2 秒钟。然而,对于更高质量的图像生成,用户可以选择调用 Gemini 在云端进行处理。
用户体验方面,Pixel Studio 应用界面简洁直观,用户只需输入提示词即可生成图像。生成的图像可以直接在应用内进行简单的编辑,如添加贴纸或更改图像风格。尽管如此,Pixel Studio 目前不支持生成人脸,这可能是由于 Gemini 模型在历史准确性方面曾出现问题。谷歌表示,未来可能会添加更多功能,但目前的重点是确保生成图像的安全性和准确性。
与苹果的 Image Playground 相比,Pixel Studio 在某些方面具有优势。Image Playground 是苹果即将推出的 AI 图像生成应用,预计将与 iOS 18 一起发布。与 Pixel Studio 类似,Image Playground 也能够根据文本提示生成图像,并提供一些基本的编辑功能。然而,Pixel Studio 的本地生成功能使其在速度和隐私保护方面更具优势。苹果的 Image Playground 则更注重与其他 Apple Intelligence 功能的整合,如 Siri 和照片搜索。
Pixel Studio 的发布在市场上引起了广泛关注。作为 Pixel 9 系列手机的预装应用,Pixel Studio 展示了谷歌在 AI 图像生成技术上的应用,也为用户提供了一个创意工具。
Pixel Studio 在技术上也面临一些挑战。首先,尽管 Tensor G4 SoC 芯片提供了计算能力,但在生成复杂图像时,仍可能出现性能瓶颈。为了解决这一问题,谷歌提供了调用 Gemini 在云端生成图像的选项,这样可以利用更强大的计算资源,生成更高质量的图像。
其次,如何确保生成图像的安全性和准确性也是一个重要问题。谷歌在发布会上表示,Pixel Studio 目前不支持生成人脸,这可能是为了避免生成潜在有害的图像。未来,谷歌可能会添加更多的安全措施,如内容审核和过滤机制,以确保生成图像的安全性。

