开源推荐
evening
GitHub 热门项目:DreamO
2026-06-26
1 阅读
GitHub Trending
GitHub 项目:DreamO
仓库地址:https://github.com/bytedance/DreamO
星级:1648 | 作者:字节跳动
项目描述:[SIGGRAPH Asia 2025] DreamO:图像定制的统一框架
===================================================
自述文件内容:
# 梦O
**[DreamO:图像定制的统一框架](https://arxiv.org/abs/2504.16915)**的正式实施
[](https://arxiv.org/abs/2504.16915) [](https://huggingface.co/spaces/ByteDance/DreamO)
### :triangle_flag_on_post: 更新 * **2025.08.11**: 🎉 DreamO 被 SIGGRAPH Asia 2025 接受! * **2025.06.24**:🔥🔥**我们很高兴发布 DreamO v1.1,它在图像质量方面有了显着改进,减少了身体成分错误的可能性,并增强了美观性**。 [了解更多模型信息](dreamo_v1.1.md) * **2025.06.26**:模型量化现在支持 [Nunchaku](https://github.com/mit-han-lab/nunchaku)。 * **2025.05.30**: 🔥 Native [ComfyUI 实现](https://github.com/ToTheBeginning/ComfyUI-DreamO) 现已推出! * **2025.05.12**:现在支持消费级 GPU(16GB 或 24GB),请参阅[此处](#for-consumer-grade-gpus) 了解说明 * **2025.05.11**:我们更新了模型以缓解过饱和和塑料面问题。新版本比以前的版本显示了一致的改进。请检查一下! * **2025.05.08**:发布代码和型号 * 2025年4月24日:发布DreamO技术报告。 https://github.com/user-attachments/assets/385ba166-79df-40d3-bcd7-5472940fa24a ## :wrench: 依赖关系和安装 **v1.1 的注意事项**:为了使用 Nunchaku 进行模型量化,我们已将扩散器版本更新为 0.33.1。如果您安装了旧版本0.31.0,请更新扩散器;否则,代码将抛出错误。 ````bash # 克隆 DreamO 存储库 git 克隆 https://github.com/bytedance/DreamO.git cd梦O # 创建 conda 环境 conda create --name dreamo python=3.10 # 激活环境 conda 激活 Dreamo # 安装依赖包 pip install -r 要求.txt ```` **(可选)Nunchaku**:如果您想使用Nunchaku进行模型量化,请参考[原始仓库](https://github.com/mit-han-lab/nunchaku)安装指南。 ## :zap:快速推理 ### 本地电台演示 ````bash 蟒蛇应用程序.py ```` ``控制台 选项: --version {v1.1,v1} 默认会使用最新的 v1.1 模型,你也可以切换回 v1 --offload 启用 'quant=nunchaku' 和 'offload' 将原始 24GB VRAM 减少到 6.5GB。 --no_turbo 使用turbo将原来的25步减少到12步。 --quant {无,int8,双节棍} 量化使用:none(bf16)、int8、nunchaku --device DEVICE 要使用的设备:auto、cuda、mps 或 cpu ```` 我们观察到 DreamO 和加速的 FLUX LoRA 变体之间具有很强的兼容性 ([FLUX-turbo](https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha)),因此默认启用 Turbo LoRA, 将推理减少到 12 个步骤(默认情况下为 25 个以上)。可以通过“--no_turbo”禁用 Turbo,尽管我们的评估显示结果好坏参半; 因此,我们建议保持 Turbo 启用
### :triangle_flag_on_post: 更新 * **2025.08.11**: 🎉 DreamO 被 SIGGRAPH Asia 2025 接受! * **2025.06.24**:🔥🔥**我们很高兴发布 DreamO v1.1,它在图像质量方面有了显着改进,减少了身体成分错误的可能性,并增强了美观性**。 [了解更多模型信息](dreamo_v1.1.md) * **2025.06.26**:模型量化现在支持 [Nunchaku](https://github.com/mit-han-lab/nunchaku)。 * **2025.05.30**: 🔥 Native [ComfyUI 实现](https://github.com/ToTheBeginning/ComfyUI-DreamO) 现已推出! * **2025.05.12**:现在支持消费级 GPU(16GB 或 24GB),请参阅[此处](#for-consumer-grade-gpus) 了解说明 * **2025.05.11**:我们更新了模型以缓解过饱和和塑料面问题。新版本比以前的版本显示了一致的改进。请检查一下! * **2025.05.08**:发布代码和型号 * 2025年4月24日:发布DreamO技术报告。 https://github.com/user-attachments/assets/385ba166-79df-40d3-bcd7-5472940fa24a ## :wrench: 依赖关系和安装 **v1.1 的注意事项**:为了使用 Nunchaku 进行模型量化,我们已将扩散器版本更新为 0.33.1。如果您安装了旧版本0.31.0,请更新扩散器;否则,代码将抛出错误。 ````bash # 克隆 DreamO 存储库 git 克隆 https://github.com/bytedance/DreamO.git cd梦O # 创建 conda 环境 conda create --name dreamo python=3.10 # 激活环境 conda 激活 Dreamo # 安装依赖包 pip install -r 要求.txt ```` **(可选)Nunchaku**:如果您想使用Nunchaku进行模型量化,请参考[原始仓库](https://github.com/mit-han-lab/nunchaku)安装指南。 ## :zap:快速推理 ### 本地电台演示 ````bash 蟒蛇应用程序.py ```` ``控制台 选项: --version {v1.1,v1} 默认会使用最新的 v1.1 模型,你也可以切换回 v1 --offload 启用 'quant=nunchaku' 和 'offload' 将原始 24GB VRAM 减少到 6.5GB。 --no_turbo 使用turbo将原来的25步减少到12步。 --quant {无,int8,双节棍} 量化使用:none(bf16)、int8、nunchaku --device DEVICE 要使用的设备:auto、cuda、mps 或 cpu ```` 我们观察到 DreamO 和加速的 FLUX LoRA 变体之间具有很强的兼容性 ([FLUX-turbo](https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha)),因此默认启用 Turbo LoRA, 将推理减少到 12 个步骤(默认情况下为 25 个以上)。可以通过“--no_turbo”禁用 Turbo,尽管我们的评估显示结果好坏参半; 因此,我们建议保持 Turbo 启用