本文由 资源共享网 – ziyuan 发布,转载请注明出处,如有问题请联系我们!通义Wan2.1的720p高清图生视频大模型
通义Wan2.1的720p高清图生视频(I2V)大模型**,参数量14B,采用FP8_e4m3fn精度压缩,文件格式为安全的safetensors,是Wan2.1图生视频主流使用版本。
核心基础信息
功能定位:由阿里通义开源的视频生成模型,核心能力是将一张静态输入图转换为自然动态视频,支持最高720p分辨率输出。
精度优化:采用FP8_e4m3fn浮点精度压缩,相比bf16版本,显存占用降低约50%,仅需要16GB显存即可运行720p生成分辨率,适配更多消费级显卡,精度损失可以忽略。
部署路径:标准存放路径为ComfyUI的
models/diffusion_models/目录,除了该UNet权重,还需要额外配套下载文本编码器和VAE权重才能完整运行。
核心特性与支持能力
控制支持:支持多种ControlNet控制信号,包括Canny边缘、深度图、OpenPose人体姿态、MLSD线稿和相机轨迹,实现对视频生成内容的精准引导。
分辨率适配:官方原生支持720p高清输出,画面细节更清晰,动态连贯性优于480p版本,适合生成高质量创作视频。
社区资源丰富:Reddit的ComfyUI和Stable Diffusion社区有大量用户共享的优化工作流和参数调优技巧,新手可以直接复用成熟方案。
本地生成推荐参数(适配Mac 32GB)
参考社区实测方案,通用参数配置参考:
Sampler(采样器):euler
Scheduler(调度器):normal
Steps(步数):30(平衡速度与质量)
CFG Scale:7.5
Denoise(去噪强度):0.85
FPS:16,总生成帧数:81(对应生成约5秒视频)
与《通义Wan2.1的720p高清图生视频大模型》相关的《AI设计》
视频生成模型Self Forcing
Self Forcing 是 Adobe Research 与德克萨斯大学奥斯汀分校联合推出的新型自回归视频生成算法,解决传统生成模型在训练与测试时的暴露偏差问题。通过在训练阶段模拟自生成过程,以先前生成的帧为条件生成后续帧,而非依赖真实帧,弥合训练与测试分布的差异。Self Forcing 引入滚动 KV 缓存机制,支持理论上无限长的视频生成,在单个 H100 GPU 上实现 17 FPS 的实...
5 1139 0
轻量级开源视频生成模型LTX-Video
ltx-video-2b-v0.9.5.safetensors是轻量级开源视频生成模型LTX-Video的0.9.5版本核心权重文件,采用safetensors格式存储,是目前LTX-Video在ComfyUI中部署的官方推荐版本。核心基础信息模型规模:参数量为2B(20亿),属于轻量级视频生成模型,相比大参数模型,对消费级显卡更友好。存储格式:使用安全的safetensors格式,...
5 160 0
AI图像修复&超分辨率放大模型
SUPIR-v0F.ckpt是SUPIR开源AI图像修复放大项目的官方预训练模型权重文件,ckpt格式是传统PyTorch模型权重存储格式,v0F是SUPIR项目针对真实场景优化的正式版本。核心定位与特点SUPIR是目前效果领先的开源AI图像修复&超分辨率放大模型,专门处理老旧照片、低分辨率图像的高清修复,v0F版本核心优势:保留原始图像细节:放大修复后不会过度平滑丢失真实纹理,对老照片的胶...
5 192 0
二次元图像自动打标模型
wd-v1-4-moat-tagger-v2.onnx是基于WD 1.4标签器框架、采用MOAT骨干网络的二次元图像自动打标模型,ONNX格式适合跨框架部署推理,是目前AI绘画领域最常用的二次元图像自动打标工具之一。核心信息解析项目定位:该模型用于自动识别二次元图像内容,输出对应描述标签,可以直接作为Stable Diffusion绘图的正向提示词,大幅降低手动写prompt的成本。后缀含...
5 171 0
Stability AI基础大模型
sd_xl_base_1.0.safetensors是Stability AI官方发布的SDXL 1.0基础大模型的权重文件,采用安全的safetensors格式存储,是所有基于SDXL生态模型的官方基础基底。核心基础信息定位:作为SDXL架构的基础模型,是所有SDXL创作、二次微调的起点,负责根据文字提示生成初始图像框架,官方通常配合sd_xl_refiner_1.0.safetens...
5 149 0


