技术特点:采用统一的SLAT表示法,模型拥有12亿参数。部署方式:提供了Docker镜像方便本地部署,也可以使用第三方制作的整合镜像。硬件门槛:极高,甚至依赖A100(80G显存)高端硬件。虽然可以通过云服务商提供的镜像降低本地显卡压力,但本地独立运行需要足够强劲的专业卡
Hi3DGen 框架包含三个核心模块:图像到法向估计器(NiRNE):通过噪声注入和双流训练策略,有效分离低频整体结构和高频细节信息,实现稳定、精细的法向估计;法向到几何生成模块(NoRLD):借助法向正则化的潜在扩散学习,为3D几何生成提供明确的细粒度监督,确保生成结果与输入图像高度一致;3D数据合成流水线(DetailVerse 数据集):构建了一个包含70万高质量合成3D资产的数据集,弥补了...
技术特点:通过“法线贴图”作为桥梁,生成高保真的3D几何体。部署方式:下载解压后双击启动脚本,自动打开WebUI网页界面进行操作。硬件门槛:需要英伟达显卡,显存6G以上,仅支持Windows 10/11。上手评价:无需接触代码,体量适合个人开发者。注意文件路径不能包含非英文字符和空格,第一次启动较慢需等待
audio_encoderscheckpointsclipclip_visionconfigscontrolnetdiffusersdiffusion_modelsembeddingsfishaudiofishaudioS2gligenhypernetworksinterpolationlatent_upscale_modelsLLMlorasmodel_patchesphotomakerstyl...
技术特点:采用统一的SLAT表示法,模型拥有12亿参数。部署方式:提供了Docker镜像方便本地部署,也可以使用第三方制作的整合镜像。硬件门槛:极高,甚至依赖A100(80G显存)高端硬件。虽然可以通过云服务商提供的镜像降低本地显卡压力,但本地独立运行需要足够强劲的专业卡
Hi3DGen 框架包含三个核心模块:图像到法向估计器(NiRNE):通过噪声注入和双流训练策略,有效分离低频整体结构和高频细节信息,实现稳定、精细的法向估计;法向到几何生成模块(NoRLD):借助法向正则化的潜在扩散学习,为3D几何生成提供明确的细粒度监督,确保生成结果与输入图像高度一致;3D数据合成流水线(DetailVerse 数据集):构建了一个包含70万高质量合成3D资产的数据集,弥补了...
技术特点:通过“法线贴图”作为桥梁,生成高保真的3D几何体。部署方式:下载解压后双击启动脚本,自动打开WebUI网页界面进行操作。硬件门槛:需要英伟达显卡,显存6G以上,仅支持Windows 10/11。上手评价:无需接触代码,体量适合个人开发者。注意文件路径不能包含非英文字符和空格,第一次启动较慢需等待
Self Forcing 是 Adobe Research 与德克萨斯大学奥斯汀分校联合推出的新型自回归视频生成算法,解决传统生成模型在训练与测试时的暴露偏差问题。通过在训练阶段模拟自生成过程,以先前生成的帧为条件生成后续帧,而非依赖真实帧,弥合训练与测试分布的差异。Self Forcing 引入滚动 KV 缓存机制,支持理论上无限长的视频生成,在单个 H100 GPU 上实现 17 FPS 的实...