在 AI 技术飞速发展的今天,字节跳动的开源动作再次成为行业焦点。2024 年 8 月 27 日,字节跳动在 Hugging Face 平台上发布了一个名为 Hyper-FLUX.1-dev-8steps-lora.safetensors 的模型。这个基于 LoRA(Low-Rank Adaptation)技术的模型,旨在提升文本到图像生成的效率,特别是与 Stable Diffusion 和 Flux 技术相关联。
Hyper-FLUX.1-dev-8steps-lora 模型的发布,标志着 AI 绘图技术进入了一个新的速度纪元。传统的 AI 绘图过程往往步骤繁多,耗时较长,但这个模型仅需 8 步或 16 步的操作流程,缩短了图片生成时间。尽管 8 步模型在效果上相较于原始版本有所折损,但这种折损在实际应用中是可以接受的。对于大多数用户来说,这种折损并不会明显影响到最终的视觉效果。
为了让更多的人体验到 Hyper-FLUX.1-dev-8steps-lora 的效果,字节跳动在 Hugging Face 上设立了演示空间。在这里,用户可以直观地感受到 8 步 Lora 的绘图效果。
这个模型文件大小为 1.39 GB,存储在 Git Large File Storage (LFS) 中,用户需要通过 LFS 下载。该模型使用 OpenRAIL++ 许可,意味着在遵循特定开源协议的情况下,用户可以自由使用和分发此模型。
在 Reddit 上,一位博主通过 Hyper-FLUX.1-dev-8steps-lora 和原始版本分别绘制了一只毛毛虫。在不放大的情况下,两者的差异并不明显。如果放大看可以发现 Hyper-FLUX.1-dev-8steps-lora 的画质是要差一些。
在社交媒体上,用户对 Hyper-FLUX.1-dev-8steps-lora 的反馈也很积极。Twitter 用户 @Zuntan03 表示,使用 Flux Dev 的 LoRA 进行 8 步高速生成,FullHD 输出,虽然使用感没有太大变化,但提高了速度,并且可以使用 Civitai 上的大量 Flux Dev LoRA。另一位用户 @kiyoshi_shin 则表示,试用了 Hyper FLUX 8 Steps LoRA 后,可以在 8 步内生成相当不错的画质,而不是通常的 20 步。
此外,用户 @JakeDahn 分享了他使用个人 Flux LoRA 微调生成的新头像,并表示仍然惊讶于它的效果。用户 @Alone1Moon 则提到,在 Flux 环境下使用 Forge 的 LoRA 行为有点奇怪,在 ComfyUI 中,强度反映得相对直观,但在 Forge 中,结果往往难以预测。
FLUX 模型由 Black Forest Labs 开发,这是一家专注于 AI 和图像处理技术的公司。团队成员包括多位在计算机视觉和机器学习领域有丰富经验的专家。FLUX 的开发过程中,团队利用了最新的 Transformer 架构和大语言模型(LLM)技术,使其在图像生成方面达到了新的高度。
FLUX 模型的核心技术基于 Transformer 架构,结合了大规模数据训练和精细调优。与其他文本到图像生成模型相比,FLUX 在处理细节和复杂场景方面表现出色,特别是在生成逼真的人类手部图像时尤为突出。
FLUX 模型的应用场景非常广泛。在艺术创作领域,FLUX 可以帮助艺术家生成高质量的图像,节省大量时间和精力。在广告设计领域,FLUX 可以根据客户需求生成各种风格的广告图像,提高工作效率。在虚拟现实和增强现实领域,FLUX 可以生成逼真的虚拟场景,为用户提供沉浸式体验。
此外,FLUX 还支持多种输入格式,包括自然语言描述、标签和草图等。这种多样化的输入方式使得用户可以更加灵活地使用该模型,满足不同的创作需求。与 MidJourney 相比,FLUX 在生成图像的细节处理和整体质量上都有提升,尤其是在生成复杂的手部细节方面表现尤为出色。