YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
VBench I2V 评测环境
VBench Image-to-Video (I2V) 评测环境,包含评测代码、预训练模型与数据压缩包,以及可选的采样框架。
目录结构(Hub 上传形态)
vbench-i2v/
├── README.md
├── .hfignore # `hf upload` 忽略规则(避免重复上传解压目录)
├── vbench_env.tar.gz # Python 虚拟环境压缩包(可选,解压后得到 vbench_env/)
├── vbench2_beta_i2v/
│ ├── pretrained_models.tar.gz # 预训练模型压缩包(解压后得到 pretrained_models/)
│ ├── data.tar.gz # 输入图像压缩包(解压后得到 data/)
│ └── third_party.tar.gz # 第三方依赖压缩包(解压后得到 third_party/)
└── vbench/ # VBench 源码
说明:为避免重复上传(压缩包 + 解压目录),Hub 上默认以 `*.tar.gz` 为主;需要使用时请自行解压。
## 解压数据与模型
```bash
cd vbench-i2v
# 可选:解压虚拟环境(如果你希望复用该环境)
tar -xzf vbench_env.tar.gz
# 解压评测所需数据/模型
tar -xzf vbench2_beta_i2v/data.tar.gz -C vbench2_beta_i2v
tar -xzf vbench2_beta_i2v/pretrained_models.tar.gz -C vbench2_beta_i2v
tar -xzf vbench2_beta_i2v/third_party.tar.gz -C vbench2_beta_i2v
## 采样
支持单机完整采样或跨机器分布式采样(VAE 和去噪分离)。
```bash
# 分布式采样
python your_sampler.py encode --output-prompt-file prompts.txt --output-latent-file latents.txt
python your_sampler.py denoise --prompt-file prompts.txt --latent-file latents.txt --output-dir ./denoised_latents
python your_sampler.py decode --latent-dir ./denoised_latents --output-dir ./sampled_videos/my_model
# 单机完整采样
python your_sampler.py full
采样框架目录 samplers/ 可能需要单独上传/同步(不一定包含在基础上传中)。
评测
# 如果你解压了 vbench_env.tar.gz
source vbench_env/bin/activate
python run_i2v_eval.py --videos_path ./sampled_videos/my_model --dimension i2v_subject
评测维度
| 维度 | 说明 |
|---|---|
| i2v_subject | 主体一致性 |
| i2v_background | 背景一致性 |
| camera_motion | 相机运动 |
| subject_consistency | 视频内主体一致性 |
| background_consistency | 视频内背景一致性 |
| aesthetic_quality | 美学质量 |
| imaging_quality | 图像质量 |
| motion_smoothness | 运动平滑度 |
| dynamic_degree | 动态程度 |
采样规范
- 每个 (image, prompt) 生成 5 个视频 (index 0-4)
- 命名:
{prompt}-{index}.mp4
系统要求
- Python 3.12.x
- CUDA 11.8+
- ~40GB 磁盘空间
- 16GB+ GPU 显存
相关链接
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support