多个角色的RVC/gsv3格式语音模型
与《幸运星角色语音模型》相关的《AI设计》
AI数字人生成模型(+语音模型)
1. AI数字人生成Sonic模型(当前热度最高)核心能力:只需一张人脸静态照片+一段音频,就能快速生成唇形精准、表情自然的说话人脸视频,是当前效果领先的开源数字人方案。技术特点:采用端到端生成方案,替代传统3D动捕/早期固定嘴型方案,能根据音频自动联动生成脸颊、眼周微表情,唇形同步精度极高。优势对比:表格对比项传统3D方案早期开源方案(如Wav2Lip)Sonic模型准备成本极高(需...
5 69 0
AI图像修复&超分辨率放大模型
SUPIR-v0F.ckpt是SUPIR开源AI图像修复放大项目的官方预训练模型权重文件,ckpt格式是传统PyTorch模型权重存储格式,v0F是SUPIR项目针对真实场景优化的正式版本。核心定位与特点SUPIR是目前效果领先的开源AI图像修复&超分辨率放大模型,专门处理老旧照片、低分辨率图像的高清修复,v0F版本核心优势:保留原始图像细节:放大修复后不会过度平滑丢失真实纹理,对老照片的胶...
5 62 0
ICLight可控图像重光照AI模型
iclight_sd15_fbc.safetensors是基于SD 1.5开发的ICLight relight项目的开源权重,全称是「FlashBidirectional Control」(双向闪光控制)版本,专门用于AI图像重打光任务。核心定位与能力ICLight是一款可控图像重光照AI模型,这个FBC版本是官方优化的双向控制版本,可以实现:自定义任意光照效果:通过输入文字提示或光照参考图...
5 58 0
TripoSR快速3D重建大模型
TripoSR-model.ckpt是TripoAI开源的TripoSR快速3D重建大模型的预训练权重文件,ckpt为传统PyTorch模型存储格式,用于从单张输入图像快速生成高质量三维网格模型。核心定位与特点TripoSR是目前速度最快的开源单图转3D模型,核心优势:生成速度极快:单张图像生成完整3D网格仅需0.5秒,远快于传统NeRF重建方案(通常需要数分钟)精度表现优秀:在复杂...
5 80 0


