Skip to content

Ryden-kai/ComfyUI-Zero123-Porting-rayden

Repository files navigation

ComfyUI 自定义节点 Zero-1-to-3: Zero-shot 单张图片全角度3D重绘

英文

这是一个非官方的 Zero123 https://zero123.cs.columbia.edu/ 移植 ComfyUI 自定义节点。实现使用单张 RGB 图像改变物体视角。

通过此移植,您可以在 ComfyUI 中生成 3D 旋转图像。

Functions

简单上手

安装此节点后,下载 样例工作流 sample workflow 开始使用。

有任何问题或者建议,欢迎在issue中反馈。

节点和工作流

节点 Zero123: Image Rotate in 3D

simple workflow

节点 Zero123: Image Preprocess

simple image process

前提条件

  • 输入图像 image 必须是 正方形 (宽=高),否则将强制自动转换
  • 输入图像 image 应该是一个具有 白色背景物体,可使用 Zero123: Image Preprocess 预处理图像。
  • 输出图像 image 目前仅支持 256x256 (固定),可后期放大。

说明

节点 Zero123: Image Rotate in 3D 参数输入与输出结果

输入

  • image : 输入图像,应为正方形图像,且为具有白色背景物体
  • polar_angle : X 轴的旋转角度,向上或向下转动
    • <0.0 : 向上转动
    • >0.0 : 向下转动
  • azimuth_angle : Y 轴的旋转角度,向左或向右转动
    • <0.0 : 向左转动
    • >0.0 : 向右转动
  • scale : Z 轴,
    • >1.0 : 更大、更近
    • 0<1<1.0: 更小、更远
    • 1.0 : 不变
  • steps : 使用原始 zero123 代码库中的默认值 75,建议不小于 75
  • batch_size : 想要生成的图像数量
  • fp16 : 是否以 fp16 加载模型。启用可以加速并节省 GPU 显存
  • checkpoint : 选择模型,zero123-xl 是当前最新的模型. stable-zero123 效果可能更好但商业需要许可。
  • height : 输出高度,固定为 256 不可变
  • width : 输出宽度,固定为 256 不可变
  • sampler : 固定不可变
  • scheduler : 固定不可变

输出

  • images : 输出图像

节点 Zero123: Image Preprocess 参数输入与输出结果

输入

  • image : 原始输入图像.
  • mask : 原始输入图像对应的遮罩(Mask).
  • margin : 输出图像四周 留白 比例.

输出

  • image : 处理后的 白底方型 、主体居中的 图像.

提示

  • 预处理图像时,识别主体,并移除所有背景。
  • 使用图像裁剪,来聚焦主体,并转为正方形图像
  • 尝试多张图像,选择最佳图像
  • 针对最终图像,进行放大处理

安装

使用 ComfyUI Manager

自定义节点

搜索 zero123 选择本repo,进行安装。

Models

搜索 zero123, 安装想要的模型。推荐 zero123-xl.ckptstable-zero123 (商用需要许可)

手工安装

自定义节点

cd ComfyUI/custom_nodes
git clone https://github.com/kealiu/ComfyUI-Zero123-Porting.git
cd ComfyUI-Zero123-Porting
pip install -r requirements.txt

然后,重新启动 ComfyUI, 并刷新浏览器。

模型

打开 model-list.json ,获取模块下载 URL,并下载到 ComfyUI/models/checkpoints/zero123/

Zero123 related works

  • zero123 : 原版 zero123, 也是本Repo来源版本。
  • stable-zero123StableAI 版本, 宣称由更多、更好的数据,以及更优的算法训练而来。开源模型但商用有限制。
  • zero123++Sudo AI 版本。 同样开源了模型,但模型固定输出6张固定角度的图像。

Thanks to

Zero-1-to-3: Zero-shot One Image to 3D Object,一款能够在diffusion模型中学习到相机视角控制机制的框架。

@misc{liu2023zero1to3,
      title={Zero-1-to-3: Zero-shot One Image to 3D Object}, 
      author={Ruoshi Liu and Rundi Wu and Basile Van Hoorick and Pavel Tokmakov and Sergey Zakharov and Carl Vondrick},
      year={2023},
      eprint={2303.11328},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

About

ComfyUI Node for Zero-1-to-3: Zero-shot One Image to 3D Object

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages