• 资源分类:AI模型
  • 最后更新:2026-05-28
  • 下载积分:5【升级会员送积分】
  • 积分说明:【上传资源赚积分】
  • 收藏
    资源语言: 中文

    depth_anything_v2_vits.pth是Depth Anything V2单目深度估计项目中,Small版本模型的PyTorch格式预训练权重文件,属于该项目轻量化版本的权重文件。

    核心信息解析

    1. 所属项目定位‌:Depth Anything V2是NeurIPS 2024的最新研究成果,是当前效果领先的开源单目深度估计模型,用于从单张RGB图像预测像素级深度信息,广泛应用于计算机视觉、3D重建、AI绘画、AR等场景。

    2. 后缀含义说明‌:

      • v2:代表第二代版本,相比V1在细节还原和鲁棒性上有明显提升

      • vits:代表采用ViT-Small(Small版本)骨干网络,参数量仅‌25M‌,是该项目四个可用版本中参数最小、速度最快的版本,适合实时推理和边缘设备部署

      • .pth:是PyTorch原生的模型权重存储格式,用于保存训练好的模型参数,需要配合项目源码中的模型结构加载使用

    主要使用场景

    该权重主要用于以下场景:

    1. 作为轻量化深度估计模型,用于单张图像/视频帧的实时深度估计推理

    2. 在AI绘画工作流中,为ControlNet生成深度图条件,精准控制画面空间结构

    3. 边缘设备部署时,满足低计算资源下的深度估计需求,Small版本在V100 GPU上仅需60ms即可完成推理

    基础加载流程示例

    参考官方流程,该权重的基础加载代码如下:

    pythonimport torchfrom depth_anything_v2.dpt import DepthAnythingV2# 初始化对应规模的模型结构model = DepthAnythingV2(encoder='vits', features=64, out_channels=[48, 96, 192, 384])# 加载pth权重文件model.load_state_dict(torch.load('depth_anything_v2_vits.pth', map_location='cpu'))
    model.eval()


    提示:
    1、资源共享网(www.08i8.com)AI模型资源《单目深度估计模型》仅供研究学习请勿商用!
    2、如果发现本资源违法或侵权请【报告管理员】
    3、您所看到的所有资源都是网友分享,资源共享网(www.08i8.com)无法保证都能正常下载使用,
    4、如果您发现资源无法下载或无法使用请【报告管理员】,管理员会联系资源发布者补充新资源!
    5、如果暂时无法补充新资源,【只退积分!不退款!
    6、关注微信公众号:《国资互联联盟》 不迷路!

    标签 模型 深度

    与《单目深度估计模型》相关的《AI设计》


  • TripoSR快速3D重建大模型

    TripoSR快速3D重建大模型

    TripoSR-model.ckpt是TripoAI开源的TripoSR快速3D重建大模型的预训练权重文件,ckpt为传统PyTorch模型存储格式,用于从单张输入图像快速生成高质量三维网格模型。‌核心定位与特点TripoSR是目前速度最快的开源单图转3D模型,核心优势:‌生成速度极快‌:单张图像生成完整3D网格仅需‌0.5秒‌,远快于传统NeRF重建方案(通常需要数分钟)‌精度表现优秀‌:在复杂...

    5 80  0

  • 腾讯MimicMotion人体动作迁移模型

    腾讯MimicMotion人体动作迁移模型

    ‌MimicMotionMergedUnet_1-1-fp16.safetensors是腾讯MimicMotion人体动作迁移模型的FP16精度UNet权重文件,适配ComfyUI的MimicMotion插件工作流,用于将参考视频的人体动作迁移到参考图像生成对应动作视频。‌核心定位与特点它是MimicMotion 1.1版本的UNet合并权重,采用FP16半精度存储,兼顾性能和画质,主要特点:‌适...

    5 65  0

  • 二次元图像自动打标模型

    二次元图像自动打标模型

    wd-v1-4-moat-tagger-v2.onnx是基于WD 1.4标签器框架、采用MOAT骨干网络的二次元图像自动打标模型,ONNX格式适合跨框架部署推理,是目前AI绘画领域最常用的二次元图像自动打标工具之一。‌核心信息解析‌项目定位‌:该模型用于自动识别二次元图像内容,输出对应描述标签,可以直接作为Stable Diffusion绘图的正向提示词,大幅降低手动写prompt的成本。‌后缀含...

    5 72  0


  • ziyuan
    ziyuan Rank: 16

    0

    0

    0

    ( 此人很懒并没有留下什么~~ )

    首页

    栏目

    搜索

    会员