实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性从图像扩散模型到视频扩散模型的三阶段训练。我们提供每个阶段的权重。支持训练加速,包括Transformer加速、更快的 T5 和 VAE 以及序列并行。在对 64x512x512 视频进行训练时,Open-Sora 可将训练速度提高55%。详细信息请参见训练加速。我们提供用于数据预处理的视频切割和字幕工具。...
30 10937 0