微软推出最新视觉基础模型Florence-2 ，可在WebGPU的浏览器独立运行！-零度博客

微软推出最新视觉基础模型Florence-2 ，可在WebGPU的浏览器独立运行！

11个月前更新

2.1W+2176

Florence-2：微软全新开源视觉模型！

能够执行超过10种不同的视觉任务包括图像字幕生成、对象检测、图像区域关联和分割等。

它不仅能描述图片的内容，还能识别图片中的物体，并指出这些物体的位置。

比如，如果你给它一张公园里的图片，它可以告诉你图片里有一个穿蓝衣服的女孩在玩耍，旁边还有一只狗。

Florence-2 系列包括 Florence-2-base 和 Florence-2-large，参数分别为 0.23 亿和 0.77 亿。尽管模型较小，但性能并不逊色。

可以运行在各种资源受限的移动端设备上。 Florence-2 采用统一的、基于提示的表示方式来处理各种视觉任务。通过简单的文本提示，模型可以生成所需的文本形式结果，无论是图片描述、目标检测、视觉定位还是图像分割。这种方法简化了多任务处理的复杂性，提高了模型的通用性和适应性

Florence-2是Microsoft 在MIT 许可下开源的轻量级视觉语言模式。该模型在字幕、物件侦测、接地和分割等任务中展示了强大的零样本和微调功能。

尽管尺寸很小，但它所取得的结果与大许多倍的模型（如Kosmos-2）相当。该模型的优势不在于复杂的架构，而在于大规模的FLD-5B 资料集，其中包含1.26 亿张影像和54 亿个综合视觉注释。

微软推出最新视觉基础模型Florence-2 ，可在支援WebGPU的浏览器独立运行

该模型支持多种功能，可用于生成图像、识别字元、分割图像、检测物体等等。

Florence-2 比其前身更小、更精确。 Florence-2系列由两个模型组成：Florence-2-base和Florence-2-large，分别有2.3亿和7.7亿参数。此尺寸甚至允许部署在行动装置上。

尽管规模较小，但Florence-2 在所有基准测试中都取得了比Kosmos-2 更好的零样本结果，尽管Kosmos-2 拥有16 亿个参数。

Florence-2的本地化运行得益于Transformers.js和ONNX Runtime Web技术的支持。这一突破不仅提高了使用者隐私保护水平，还大大降低了使用成本，为AI视觉技术的普及应用铺平了道路。

THE END

喜欢就支持一下吧

相关推荐

猜你喜欢
最近更新

微软 Win 11 Edge 弹窗警告，阻止用户下载 Chrome 浏览器，默认浏览器该如何设置？ | 零度解说-零度博客

微软 Win 11 Edge 弹窗警告，阻止用户下载 Chrome 浏览器，默认浏览器该如何设置？ | 零度解说

https://youtu.be/o29aoTY6LJ8

Youtube视频 # chrome # edge # 默认浏览器修改

admin

1.5W+2251

赶紧下载！5款 “限时免费” 软件！下载即赚到！！白嫖好几百刀... | 零度解说-零度博客

赶紧下载！5款 “限时免费” 软件！下载即赚到！！白嫖好几百刀… | 零度解说

今天给大家推荐5款【限时免费】的软件，非常实用，切勿错过，得到就是赚到，立马帮你省下好几百刀！ https://www.youtube.com/watch?v=JQhQPFOKr6I ------------------------------------- 🔔 1...

Youtube视频免费资源

admin

3.3W+1943

你绝对想不到！路由器、电视盒子、充电器、USB插排、冰箱到底谁的待机最耗电？| 零度解说-零度博客

你绝对想不到！路由器、电视盒子、充电器、USB插排、冰箱到底谁的待机最耗电？| 零度解说

https://youtu.be/xFzegqHE4KA 【同款测功耗工具】：https://m.tb.cn/h.UPlgpde 淘宝口令：5fu?質2$6M5LdUgje4q$:// HU7177,打開/

admin

1.3W+6539

推荐6款最强的安卓模拟器！在电脑上玩手游更方便更流畅 | 零度解说-零度博客

推荐6款最强的安卓模拟器！在电脑上玩手游更方便更流畅 | 零度解说

https://youtu.be/lOR4wQLgOG0

admin

1.3W+6539

笔记本安装黑苹果系统，简单易懂，毫无保留，100%保证黑苹果安装成功！（2020年更新）-零度博客

笔记本安装黑苹果系统，简单易懂，毫无保留，100%保证黑苹果安装成功！（2020年更新）

https://youtu.be/UI816XXYyg4 安装黑苹果系统，无论是在台式机还是笔记本上安装存在很多的不确定因素；影响安装黑苹果成功与否的重要因素：CPU，显卡，核心驱动，主板，Intel还是AMD，选择正...

Youtube视频 # 零度解说 # mac os # 双系统

admin

1.1W+652

便宜、高容量和快速：新的铝电池技术！你需要知道的一切-零度博客

便宜、高容量和快速：新的铝电池技术！你需要知道的一切

新技术有一个经典的讽刺意味，采用者被迫将自己限制在每个人都想要的三件事中的两件事上：快速、便宜和好。当技术是电池时，采用更具挑战性。便宜和快速（充电）仍然很重要，但“好”可...

admin

1.6W+2250

密码末日即将来临！NIST 推出新的加密标准以做好准备-零度博客

密码末日即将来临！NIST 推出新的加密标准以做好准备

决策将对许多公司产生约束力，并改变他们保护数据的方式。在不远的将来——也许只有十年，没有人确切知道多久——随着量子计算的出现，保护你的银行交易、聊天信息和医疗记录免遭窥探的...

admin

1.6W+2251

Google AI 放大招！Gemini 2.0 Flash 震撼发布：深度推理 + 无限文生图，完爆 DeepSeek？实测揭晓！ | 零度解说-零度博客

Google AI 放大招！Gemini 2.0 Flash 震撼发布：深度推理 + 无限文生图，完爆 DeepSeek？实测揭晓！ | 零度解说

https://www.youtube.com/watch?v=QF1pakHxGs4

AI gemini Youtube视频

admin

1.8W+1806

免费下载官方正版 Windows 10系统，通过 Rufus、Ventoy 进行一键制作U盘系统-零度博客

免费下载官方正版 Windows 10系统，通过 Rufus、Ventoy 进行一键制作U盘系统

1. Windows 10正版系统【官方下载】 2.Rufus 写盘工具【点击下载】 3.Ventoy U盘制作工具【点击下载】、【使用教程】

admin

1.8W+1529