AI模型_AI设计_设计资源

栏目分类：: 不限软件插件源文件素材经验教程 AI设计

AI模型分类

二级分类：: 不限 AI软件 AI模型 AI教程

wd-v1-4-moat-tagger-v2.onnx是基于WD 1.4标签器框架、采用MOAT骨干网络的二次元图像自动打标模型，ONNX格式适合跨框架部署推理，是目前AI绘画领域最常用的二次元图像自动打标工具之一。‌核心信息解析‌项目定位‌：该模型用于自动识别二次元图像内容，输出对应描述标签，可以直接作为Stable Diffusion绘图的正向提示词，大幅降低手动写prompt的成本。‌后缀含...

5 0 TAG：自动模型图像二次元

TripoSR快速3D重建大模型

TripoSR-model.ckpt是TripoAI开源的TripoSR快速3D重建大模型的预训练权重文件，ckpt为传统PyTorch模型存储格式，用于从单张输入图像快速生成高质量三维网格模型。‌核心定位与特点TripoSR是目前速度最快的开源单图转3D模型，核心优势：‌生成速度极快‌：单张图像生成完整3D网格仅需‌0.5秒‌，远快于传统NeRF重建方案（通常需要数分钟）‌精度表现优秀‌：在复杂...

5 0 TAG：快速 3D 大模型

手绘线稿控制图像构图模型

v3_sd15_mm.ckpt是ControlNet 1.0版本中，针对SD 1.5开发的‌「Soft Edge（软边缘/线条）」控制类型的预训练权重，全称是MistoLine Line Art版本**，用于AI绘画中通过手绘线稿控制图像构图。核心参数与定位‌含义拆解‌：v3：对应ControlNet 1.0的第三个稳定版本，是目前成熟的正式版本sd15：适配Stable Diffusion 1....

5 0 TAG：控制手绘模型图像制图

AI换脸模型

inswapper_128.onnx是开源AI换脸项目InsightFace Swap（原ROOP）的核心模型权重文件，基于ONNX格式，专门用于将一张源人脸图像无缝替换到目标视频或图像中。‌核心信息解析‌模型定位‌：它是InsightFace生态中专门用于‌单图换脸（One-Shot Face Swapping）‌的预训练模型。只需提供一张源人脸照片，即可将视频中所有出现的人脸替换为该源人脸，无...

5 0 TAG：模型换脸 AI

人脸检测识别模型

w600k_r50.onnx是‌InsightFace人脸检测识别项目**中，基于WIDER Face数据集训练的ResNet50骨干网络的ONNX格式人脸特征提取权重，用于人脸特征编码（人脸识别场景。核心参数解析‌w600k‌：模型基于包含60万张人脸的大规模数据集训练，覆盖更全面，对不同人种、姿态的人脸特征泛化能力更强。‌r50‌：代表骨干网络是ResNet50，是精度和速度的经典平衡选择。‌...

5 0 TAG：检测模型识别人脸

ICLight可控图像重光照AI模型

iclight_sd15_fbc.safetensors是基于SD 1.5开发的ICLight relight项目的开源权重，全称是「FlashBidirectional Control」（双向闪光控制）版本，专门用于AI图像重打光任务‌。核心定位与能力ICLight是一款可控图像重光照AI模型，这个FBC版本是官方优化的双向控制版本，可以实现：‌自定义任意光照效果‌：通过输入文字提示或光照参考图...

5 0 TAG：模型图像 AI 光照

高精度的一键图像抠图模型

briaai_rmbg_v1.4.pth 是BriaAI开源的RMBG 1.4版本背景移除模型的PyTorch格式预训练权重文件，专门用于高精度的一键图像抠图，是目前效果最好的开源抠图模型之一‌。核心特点‌精度超高‌：对头发丝、半透明物体、衣物边缘等复杂细节的分割精度远高于传统抠图算法（如U2Net、MODNet），接近商用工具的专业效果。‌速度快‌：单张1024分辨率图像，在消费级GPU上仅需1...

5 0 TAG：图像高精度抠图

AI图像修复&超分辨率放大模型

SUPIR-v0F.ckpt是SUPIR开源AI图像修复放大项目的官方预训练模型权重文件，ckpt格式是传统PyTorch模型权重存储格式，v0F是SUPIR项目针对真实场景优化的正式版本‌。核心定位与特点SUPIR是目前效果领先的‌开源AI图像修复&超分辨率放大模型‌，专门处理老旧照片、低分辨率图像的高清修复，v0F版本核心优势：保留原始图像细节：放大修复后不会过度平滑丢失真实纹理，对老照片的胶...

5 0 TAG：修复图像 AI 放大

虚拟试衣大模型CatVTON

‌CatVTON是一款开源的虚拟试衣大模型，由国内AI团队研发，能基于人物图像和目标衣物图像生成自然贴合人体的试衣效果，是目前效果领先的开源试衣方案‌。核心特点与能力‌支持任意试衣场景‌：支持多类别衣物（上衣、下装、连衣裙、外套等），适配任意人体姿势、复杂褶皱，衣物纹理和图案保留完整，贴合度远高于传统虚拟试衣方案。‌推理效率高‌：基于流匹配架构优化，单张试衣图生成速度快，在RTX 3090显卡上仅...

5 0 TAG：试衣虚拟大模型

BOPBTL checkpoints模型

可用于老照片修复

5 0 TAG：模型

多模态统一大模型 Florence-2模型

Florence-2是微软研究院推出的开源多模态统一大模型，采用文本Prompt统一所有计算机视觉任务，在零样本能力上表现突出‌。核心特点‌任务统一架构‌：打破传统多任务多模型的设计，用一个纯Transformer架构统一处理目标检测、实例分割、OCR、图像描述、VQA视觉问答、深度估计等数十种CV任务，所有任务都转化为文本生成问题，通过不同Prompt调用即可。‌极强零样本迁移能力‌：在126个...

5 0 TAG：大模型多模态

mobilenet0.25_Final.pth

mobilenet0.25_Final.pth是RetinaFace人脸检测项目中，以MobileNetV1为骨干网络、宽度乘子0.25的最终训练完成权重文件。‌核心信息说明‌模型架构定位‌：MobileNet0.25是专门为移动端/边缘设备设计的轻量人脸检测骨干网络，0.25指网络宽度乘子，按比例压缩了每一层的通道数，极大减小模型体积和计算量，适合低算力设备快速推理。‌文件属性‌：这是PyTor...

5 0 TAG：模型迁移美妆

轻量级开源视频生成模型LTX-Video

ltx-video-2b-v0.9.5.safetensors是轻量级开源视频生成模型LTX-Video的0.9.5版本核心权重文件，采用safetensors格式存储，是目前LTX-Video在ComfyUI中部署的官方推荐版本‌。核心基础信息‌模型规模‌：参数量为‌2B（20亿）‌，属于轻量级视频生成模型，相比大参数模型，对消费级显卡更友好。‌存储格式‌：使用安全的safetensors格式，...

5 0 TAG：视频开源生成模型

通义Wan2.1的‌720p高清图生视频大模型

通义Wan2.1的‌720p高清图生视频（I2V）大模型**，参数量14B，采用FP8_e4m3fn精度压缩，文件格式为安全的safetensors，是Wan2.1图生视频主流使用版本。核心基础信息‌功能定位‌：由阿里通义开源的视频生成模型，核心能力是将一张静态输入图转换为自然动态视频，支持最高720p分辨率输出。‌精度优化‌：采用FP8_e4m3fn浮点精度压缩，相比bf16版本，显存占用降低约...

5 0 TAG：视频高清模型 720 大模型图生视频

单目深度估计模型

depth_anything_v2_vits.pth是Depth Anything V2单目深度估计项目中，Small版本模型的PyTorch格式预训练权重文件，属于该项目轻量化版本的权重文件。‌核心信息解析‌所属项目定位‌：Depth Anything V2是NeurIPS 2024的最新研究成果，是当前效果领先的开源单目深度估计模型，用于从单张RGB图像预测像素级深度信息，广泛应用于计算机视觉...

5 0 TAG：模型深度

腾讯MimicMotion人体动作迁移模型

‌MimicMotionMergedUnet_1-1-fp16.safetensors是腾讯MimicMotion人体动作迁移模型的FP16精度UNet权重文件，适配ComfyUI的MimicMotion插件工作流，用于将参考视频的人体动作迁移到参考图像生成对应动作视频。‌核心定位与特点它是MimicMotion 1.1版本的UNet合并权重，采用FP16半精度存储，兼顾性能和画质，主要特点：‌适...

5 0 TAG：腾讯模型人体动作迁移

TorchScript‌ 格式的序列化模型

w-ll_ucoco_384_bs5.torchscript.pt 是 DWPose（DW-LL）姿态估计模型的一个特定优化版本，专门用于 ComfyUI ControlNet 等 AI 绘画工作流中的人体关键点检测。‌该文件是 ‌TorchScript‌ 格式的序列化模型，意味着它已经过编译优化，无需依赖完整的 Python 环境即可高效推理，显著提升了加载速度和运行稳定性。核心参数解析‌dw-...

5 0 TAG：格式模型序列化

AI数字人生成模型（+语音模型）

1. AI数字人生成Sonic模型（当前热度最高）‌核心能力‌：只需一张人脸静态照片+一段音频，就能快速生成唇形精准、表情自然的说话人脸视频，是当前效果领先的开源数字人方案。‌技术特点‌：采用端到端生成方案，替代传统3D动捕/早期固定嘴型方案，能根据音频自动联动生成脸颊、眼周微表情，唇形同步精度极高。‌优势对比‌：表格对比项传统3D方案早期开源方案（如Wav2Lip）Sonic模型准备成本极高（需...

5 0 TAG：生成数字模型数字人 AI 语音

半精度TorchScript格式预训练模型

rvm_mobilenetv3_fp16.torchscript是Robust Video Matting（RVM robust视频抠图）项目提供的、基于MobileNetV3骨干网络的半精度TorchScript格式预训练模型，用于移动端/部署端高效视频抠图推理。‌核心信息说明‌模型定位‌：RVM是字节跳动开发的专门针对人体视频抠图的鲁棒性模型，支持实时抠图，这个版本是针对部署优化的导出格式：骨...

5 0 TAG：格式模型训练

基于SDXL框架开发的顶级写实风格AI绘画大模型

‌realvisxlV40_v40Bakedvae.safetensors是基于SDXL框架开发的顶级写实风格AI绘画大模型，已经内置烘焙好的匹配VAE，是目前SDXL生态中最受欢迎的写实底模之一，文件格式为安全的safetensors。‌核心特点与定位它主打极致‌照片级真实感‌，是RealVisXL系列的V4.0稳定版本，核心优势突出：内置匹配的 baked VAE，下载后直接加载即可使用，无需...

5 0 TAG：风格开发模型 AI绘画框架绘画 AI 基于大模型写实

更多AI模型

共 34 条记录 1 2

推荐AI模型

优质AI模型

推荐标签

聚合所有的资源网，实现全网资源共享，建一个完全免费的资源网站