本文由 资源共享网 – ziyuan 发布,转载请注明出处,如有问题请联系我们!多模态统一大模型 Florence-2模型
Florence-2是微软研究院推出的开源多模态统一大模型,采用文本Prompt统一所有计算机视觉任务,在零样本能力上表现突出。
核心特点
任务统一架构:打破传统多任务多模型的设计,用一个纯Transformer架构统一处理目标检测、实例分割、OCR、图像描述、VQA视觉问答、深度估计等数十种CV任务,所有任务都转化为文本生成问题,通过不同Prompt调用即可。
极强零样本迁移能力:在126个公开数据集上做了预训练,覆盖各类视觉任务场景,零样本下直接超越很多专业微调模型,不需要针对特定任务微调就能直接用。
多尺寸适配不同场景:推出了3个参数规格,适配从端侧到云端的不同需求:
表格
核心能力示例
你只需要更换Prompt就能切换任务:
图像描述:
What is the content of this image?目标检测:
<OD>猫会输出所有猫的 bounding box 坐标OCR识别:
<OCR>提取图片中所有文字视觉问答:
How many people are in this image?直接回答问题
与《多模态统一大模型 Florence-2模型》相关的《AI设计》
基于SD XL框架开发的二次元AI绘画大模型
AnythingXL_v50.safetensors是基于SD XL框架开发的二次元AI绘画大模型,是Anything系列在SD XL时代的迭代版本,文件格式为安全的safetensors单文件权重。核心特点二次元风格适配优化:适配EulerAncestralDiscreteScheduler调度器,对二次元角色、场景的生成效果做了专门优化,色彩明快、线条清晰,符合日系动漫审美。部署便捷...
5 56 0
基于SD 1.5训练的 国风主题AI绘画大模型
3Guofeng3_v34.safetensors是基于SD 1.5训练的 国风主题AI绘画大模型 ,是目前SD生态中口碑顶尖的国风创作模型,文件格式为安全的safetensors。核心特点该模型由国风爱好者社区训练,在传统国风、中式美学的表现力上做了深度优化,可以直接生成符合中国传统审美、带有东方意境的绘画作品,无需复杂的提示词工程就能获得风格纯正的国风产出,适配绝大多数国风创作场景。...
5 59 0
基于SD 1.5训练的二次元风格AI绘画大模型
meinamix_meinaV11.safetensors是基于SD 1.5训练的二次元风格AI绘画大模型,是MeinaMix系列的经典成熟版本,文件格式为安全的safetensors。核心定位与特点它主打精美好看的二次元动漫风格生成,对日系动漫脸、萌系角色、插画质感的还原度非常高,是目前二次元创作领域使用最广泛的大模型之一:对动漫人体结构、五官比例的控制更稳定,翻车率远低于早期二次元模型;擅长...
5 65 0


