2024 年 8 月 2 日,Black Forest Labs 发布了全新的 AI 图像生成工具 FLUX.1。这款工具迅速引起了广泛关注和讨论。仅仅一周时间,社交媒体上已经充斥着用户们利用 FLUX.1 进行创作的各种作品。FLUX.1 的发布在技术圈和艺术创作、设计领域引起了轰动。
Black Forest Labs 的团队成员包括多位在计算机视觉和机器学习领域有丰富经验的专家,他们利用最新的 Transformer 架构和大语言模型技术,使 FLUX.1 在图像生成方面达到了新的高度。FLUX.1 不是一个单一的模型,而是一个包含三种变体的系列:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。这三个版本各有特色,但它们都有一个共同点:拥有 120 亿参数。
根据 Black Forest Labs 的测试数据,FLUX.1 在多个关键指标上全面超越了这些 “老前辈”。即使是系列中最轻量级的 FLUX.1 [schnell],也能在性能上力压 Midjourney v6.0 和 DALL-E 3。FLUX.1 支持从 0.1 到 2.0 百万像素的多种分辨率和宽高比。这种灵活性为创作者提供了更多选择,无论是制作社交媒体封面还是打印高清海报,FLUX.1 都能应对。
FLUX.1 采用了基于多模态和并行扩散 Transformer 模块的混合架构,这种架构允许模型同时处理文本和图像信息,提高了生成图像的准确性和质量。此外,FLUX.1 还引入了流匹配(Flow Matching)训练方法。这种方法能够改善扩散模型的性能,使得生成的图像更加自然。结合旋转位置嵌入(Rotary Position Embedding)和并行注意力层,FLUX.1 在硬件效率方面也实现了提升。
FLUX.1 能够应对各种复杂的绘画需求。比如,在处理包含大量文字的图像时,FLUX.1 展现出了较高的准确性。它不仅能正确生成文字,还能保持字体的一致性和排版的美观性。在生成大型场景时,FLUX.1 同样表现良好。它能够按照用户的指令布置场景中的各个元素,同时保持整体画面的和谐与真实感。无论是都市街景,还是奇幻世界,FLUX.1 都能呈现。
FLUX.1 在处理人物手部这一传统 AI 绘画的痛点时,也取得了进展。相比其他工具,FLUX.1 生成的人手更加自然,比例更加协调。

