2024 年 8 月 22 日,Ideogram 宣布推出其最新的文本生成图像模型 Ideogram 2.0。Ideogram 2.0 在图像生成质量上有了提升,并增加了许多新功能,使用户能够更好地控制生成的图像效果。新闻发布后,社交媒体上充满了用户的讨论和实际测试视频,展示了这一新工具的功能。
首先,Ideogram 2.0 在文本显示方面有了提升,无论是贺卡、T 恤设计、海报还是插图,Ideogram 2.0 都能呈现更长、更准确的文本。用户可以通过简单的提示词生成图像,并且可以选择多种色彩方案,控制图像色彩。此外,Ideogram 2.0 还解决了一些 AI 图像生成中的难题。例如,文本渲染技术得到了提高,解决了「漂浮椰子」的问题。
用户发现,Ideogram 2.0 具有较高的提示理解能力,即使是一些奇怪的提示,它也能按照要求作图。例如,一位网友生成了一张图像,描述为 “一位老人一边吃着面食,一边操作着 MacBook,一边在海上冲浪。他的背上还背着一只北极熊,上面举着 Ideogram 2.0 的牌子”。
Ideogram 2.0 还推出了 iOS 应用程序和 API 测试版,方便用户在移动设备上使用这一工具。用户可以通过 API 进行性能基准测试,生成图像的定价为每千张图像 80 美元。
与其他知名工具如 Midjourney 和 Stable Diffusion 相比,Ideogram 2.0 在多个方面表现出色。首先,它在文本渲染方面的能力优于 Midjourney v6.1 和 FLUX.1 [pro]。技术上,Ideogram 2.0 采用了多模态和并行扩散 Transformer 模块的混合架构,使其在性能上有了提升。
用户可以通过简单的提示词生成图像,并且可以选择多种色彩方案,控制图像色彩。例如,一位用户在 Twitter 上分享了他使用 Ideogram 2.0 生成的图像,描述为 “一个现代网站设计,主题是珍珠奶茶。背景是柔和的青绿色,有一杯透明杯装的桃子珍珠奶茶,旁边是一台打开博客文章的桃色笔记本电脑,还有一把舒适的青绿色椅子,椅背弯曲。文字‘放松、创造、在家工作’以现代字体书写。” 生成的图像不仅色彩鲜艳,而且细节丰富。
此外,Ideogram 2.0 还推出了 “描述”(Describe)和 “魔法提示”(Magic Prompt)功能。Describe 可以根据原始图像生成详细的文字提示,而 Magic Prompt 则可以在初始提示的基础上进行变化。通过将这两个功能结合,用户可以在一张原始图像的基础上,进行创造性的迭代和重新诠释。例如,一位用户生成了一张 3D 渲染的 Hello Kitty 图像,描述为 “Hello Kitty 在庆祝爱情的场景中,周围环绕着五个发光的星形物体,每个星形物体上都用金色斜体字写着‘Be,’ ‘Happy,’ ‘Kind,’ ‘Cool,’ 和‘Thankful.’ 背景是黄色和粉色对比,场景中点缀着粉色透明蝴蝶、小红色和橙色的心形物体,以及白色花朵。” 生成的图像不仅色彩鲜艳,而且细节丰富。

