这是一个非官方的 Zero123 https://zero123.cs.columbia.edu/ 移植 ComfyUI 自定义节点。实现使用单张 RGB 图像改变物体视角。
通过此移植,您可以在 ComfyUI 中生成 3D 旋转图像。
安装此节点后,下载 样例工作流 sample workflow 开始使用。
有任何问题或者建议,欢迎在issue中反馈。
- 输入图像
image
必须是正方形
(宽=高),否则将强制自动转换 - 输入图像
image
应该是一个具有白色背景
的物体
,可使用Zero123: Image Preprocess
预处理图像。 - 输出图像
image
目前仅支持256x256
(固定),可后期放大。
- image : 输入图像,应为
正方形
图像,且为具有白色背景
的物体
。 - polar_angle :
X
轴的旋转角度,向上或向下转动<0.0
: 向上转动>0.0
: 向下转动
- azimuth_angle :
Y
轴的旋转角度,向左或向右转动<0.0
: 向左转动>0.0
: 向右转动
- scale :
Z
轴,远
或近
>1.0
: 更大、更近0<1<1.0
: 更小、更远1.0
: 不变
- steps : 使用原始
zero123
代码库中的默认值75
,建议不小于75
- batch_size : 想要生成的图像数量
- fp16 : 是否以
fp16
加载模型。启用可以加速并节省 GPU 显存 - checkpoint : 选择模型,
zero123-xl
是当前最新的模型.stable-zero123
效果可能更好但商业需要许可。 - height : 输出高度,固定为 256 不可变
- width : 输出宽度,固定为 256 不可变
- sampler : 固定不可变
- scheduler : 固定不可变
- images : 输出图像
- image : 原始输入
图像
. - mask : 原始输入
图像
对应的遮罩(Mask)
. - margin : 输出图像四周
留白
比例.
- image : 处理后的
白底
、方型
、主体居中的图像
.
- 预处理图像时,识别主体,并移除所有背景。
- 使用图像裁剪,来聚焦主体,并转为正方形图像
- 尝试多张图像,选择最佳图像
- 针对最终图像,进行放大处理
搜索 zero123
选择本repo,进行安装。
搜索 zero123
, 安装想要的模型。推荐 zero123-xl.ckpt
或 stable-zero123
(商用需要许可)
cd ComfyUI/custom_nodes
git clone https://github.com/kealiu/ComfyUI-Zero123-Porting.git
cd ComfyUI-Zero123-Porting
pip install -r requirements.txt
然后,重新启动 ComfyUI
, 并刷新浏览器。
打开 model-list.json
,获取模块下载 URL,并下载到 ComfyUI/models/checkpoints/zero123/
zero123
: 原版 zero123, 也是本Repo来源版本。stable-zero123
: StableAI 版本, 宣称由更多、更好的数据,以及更优的算法训练而来。开源模型但商用有限制。zero123++
: Sudo AI 版本。 同样开源了模型,但模型固定输出6张固定角度的图像。
Zero-1-to-3: Zero-shot One Image to 3D Object,一款能够在diffusion模型中学习到相机视角控制机制的框架。
@misc{liu2023zero1to3,
title={Zero-1-to-3: Zero-shot One Image to 3D Object},
author={Ruoshi Liu and Rundi Wu and Basile Van Hoorick and Pavel Tokmakov and Sergey Zakharov and Carl Vondrick},
year={2023},
eprint={2303.11328},
archivePrefix={arXiv},
primaryClass={cs.CV}
}