2024 年 9 月 4 日,TheMisto.ai 团队发布了 MistoControlNet-Flux-dev 模型,这是一个专门针对 Flux1-dev 模型设计的 ControlNet 网络,特别适用于处理线稿和轮廓草图。该模型采用双流 Transformer 结构,提升了不同类型线稿的对齐和表达能力,并与 T5 和 clip-l 文本编码器对齐,以确保图像和文本提示之间的平衡性能。
MistoControlNet-Flux-dev 适用于工业设计、建筑、动画等多个领域,支持使用 Flux1-dev 系列的 fp16 和 fp8 量化模型,提供不同分辨率和控制强度的设置。该模型不兼容 XLabs 加载器和采样器,建议使用 TheMisto.ai 专用的 ComfyUI 套件运行,并支持未来发布的扩展模块。
在应用场景方面,MistoControlNet-Flux-dev 模型展示了其在工业设计、建筑、动画等多个领域的潜力。例如,在工业设计中,设计师可以使用该模型快速生成线稿和轮廓草图,从而加速设计流程。在建筑领域,建筑师可以利用该模型生成建筑草图,帮助他们展示设计理念。在动画制作中,动画师可以使用该模型生成角色和场景的线稿,提升工作效率。
TheMisto.ai 团队还提供了详细的使用说明和示例代码,帮助用户理解和应用该模型。用户可以从 GitHub 和 Hugging Face 下载模型,并将其放置在 ComfyUI 的 TheMisto_model 目录中,首次运行 ComfyUI 的 TheMisto.ai Flux ControlNet ComfyUI 套件时会自动创建该目录。运行 ComfyUI 后,用户可以在 workflow 文件夹中找到示例工作流,方便快速上手。
MistoControlNet-Flux-dev 模型在性能上表现出色。首先,该模型采用了双流 Transformer 结构,这种结构在不增加推理时间的情况下,对不同类型的线稿和轮廓条件有更好的表现力和对齐效果。其次,模型对 T5 和 clip-l 两个 TextEncoder 的文字对齐也得到了对应的训练,确保了条件图像和文本对齐都有较好的表现。
在性能对比方面,MistoControlNet-Flux-dev 模型与 FLUX.1 系列模型进行了对比测试。测试结果显示,MistoControlNet-Flux-dev 在生成质量和速度方面均优于 FLUX.1 系列模型。具体来说,使用 Flux1-dev 的 fp16 量化模型生成的图像质量最高,其次是 fp8 量化模型,而其他量化模型的生成质量相对较低。在生成速度方面,fp16 量化模型的速度最快,其次是 fp8 量化模型,其他量化模型的速度相对较慢。
技术优势方面,MistoControlNet-Flux-dev 模型采用了 Transformer 结构和优化算法,提高了生成图像的质量和效率。研究人员还对模型进行了大量的实验,验证了其在不同数据集上的表现。通过对比分析,MistoControlNet-Flux-dev 在多个图像生成任务中均取得了成绩,证明了其在生成式 AI 领域的潜力和应用价值。