微软推出最新视觉基础模型Florence-2 ,可在WebGPU的浏览器独立运行!

图片[1]-微软推出最新视觉基础模型Florence-2 ,可在WebGPU的浏览器独立运行!-零度博客

Florence-2:微软全新开源视觉模型!

能够执行超过10种不同的视觉任务 包括图像字幕生成、对象检测、图像区域关联和分割等。

它不仅能描述图片的内容,还能识别图片中的物体,并指出这些物体的位置。

比如,如果你给它一张公园里的图片,它可以告诉你图片里有一个穿蓝衣服的女孩在玩耍,旁边还有一只狗。

Florence-2 系列包括 Florence-2-base 和 Florence-2-large,参数分别为 0.23 亿和 0.77 亿。尽管模型较小,但性能并不逊色。

可以运行在各种资源受限的移动端设备上。 Florence-2 采用统一的、基于提示的表示方式来处理各种视觉任务。 通过简单的文本提示,模型可以生成所需的文本形式结果,无论是图片描述、目标检测、视觉定位还是图像分割。这种方法简化了多任务处理的复杂性,提高了模型的通用性和适应性

图片[2]-微软推出最新视觉基础模型Florence-2 ,可在WebGPU的浏览器独立运行!-零度博客

 

Florence-2是Microsoft 在MIT 许可下开源的轻量级视觉语言模式。该模型在字幕、物件侦测、接地和分割等任务中展示了强大的零样本和微调功能。

尽管尺寸很小,但它所取得的结果与大许多倍的模型(如Kosmos-2)相当。该模型的优势不在于复杂的架构,而在于大规模的FLD-5B 资料集,其中包含1.26 亿张影像和54 亿个综合视觉注释。

微软推出最新视觉基础模型Florence-2 ,可在支援WebGPU的浏览器独立运行

该模型支持多种功能,可用于生成图像、识别字元、分割图像、检测物体等等。

Florence-2 比其前身更小、更精确。 Florence-2系列由两个模型组成:Florence-2-base和Florence-2-large,分别有2.3亿和7.7亿参数。此尺寸甚至允许部署在行动装置上。

尽管规模较小,但Florence-2 在所有基准测试中都取得了比Kosmos-2 更好的零样本结果,尽管Kosmos-2 拥有16 亿个参数。

Florence-2的本地化运行得益于Transformers.js和ONNX Runtime Web技术的支持。这一突破不仅提高了使用者隐私保护水平,还大大降低了使用成本,为AI视觉技术的普及应用铺平了道路。

THE END
喜欢就支持一下吧
点赞2176 分享
视频实时换脸!OBS美颜、直播特效等,用 Snap Camera 就够了,完全免费,附上最新的安装使用教程!!2024 | 零度解说-零度博客
DoYourData Recovery Pro – Mac 电脑数据恢复软件[$70→0]-零度博客

DoYourData Recovery Pro – Mac 电脑数据恢复软件[$70→0]

DoYourData Recovery Pro 是一款用于 Mac设备上的数据恢复软件,能够恢复由于误删、格式化、病毒攻击、系统奔溃、操作不当或其他问题产生的数据丢失。 功能介绍 恢复几乎所有格式文件,包括图片...
admin的头像-零度博客admin
1.4W+1529
免费白嫖 Intel® Developer Cloud 的 VPS!不嫖可惜,嫖完“瞬间阳痿”-零度博客

免费白嫖 Intel® Developer Cloud 的 VPS!不嫖可惜,嫖完“瞬间阳痿”

  1.点击打开注册链接:https://www.intel.com/content/www/us/en/developer/tools/devcloud/services.html 2.免费申请VPS链接:https://scheduler.cloud.intel.com/#/system  3.Puttygen...
admin的头像-零度博客admin
1.9W+1683
Victoria 一款用于诊断和修复硬盘驱动器的工具!-零度博客

Victoria 一款用于诊断和修复硬盘驱动器的工具!

Victoria 是一款用于诊断和修复硬盘驱动器的工具,支持对 HDD 和 SSD 进行详细的 SMART 检测、坏道扫描、扇区修复等操作。该软件能够提供硬盘的详细信息,如容量、固件版本、支持的特性以及温度...
admin的头像-零度博客admin
2.4W+3492
Google 深度搜索!小白秒变“老司机”的必备技能!2024 | 零度解说-零度博客

Google 深度搜索!小白秒变“老司机”的必备技能!2024 | 零度解说

https://youtu.be/achFs5sLO7Q   ------------------------------------- 🔔 “以图搜片”插件和网址:https://www.freedidi.com/11832.html 零度社区:https://bbs.freedidi.com
admin的头像-零度博客admin
1.4W+1528
你的银行卡可能被盗刷!如果开启了这个手机功能,赶紧给它关闭掉!! | 零度解说-零度博客
【震惊】最真实的AI视频生成工具!完全免费开源,只需一张照片,就能生成炸裂效果!Sora 劲敌来了!! | 零度解说-零度博客

【震惊】最真实的AI视频生成工具!完全免费开源,只需一张照片,就能生成炸裂效果!Sora 劲敌来了!! | 零度解说

https://www.youtube.com/watch?v=mujvbxPV1WU ============= SadTalker AI视频生成工具下载:https://www.freedidi.com/12112.html
白嫖日本网盘!永久45G,速度超快,支持 WebDav 协议的 InfiniCloud, 赶紧上车!-零度博客

白嫖日本网盘!永久45G,速度超快,支持 WebDav 协议的 InfiniCloud, 赶紧上车!

InfiniCloud是一款非常不错的日本网盘,不仅速度快,而且还支持 WebDAV 同步! 官网:https://infini-cloud.net 即使你在大陆也无需翻墙即可访问网盘。 免费用户默认 20G 永久空间,输入注册码...
admin的头像-零度博客admin
1.6W+6541
DeepSeek 本地部署最佳实践!免费开源,无痛运行高级 AI 大模型,秒建本地知识库! | 零度解说-零度博客

DeepSeek 本地部署最佳实践!免费开源,无痛运行高级 AI 大模型,秒建本地知识库! | 零度解说

https://www.youtube.com/watch?v=tWJvSy7dL1wDeepSeek-R1 本地部署知识库工具下载:https://www.freedidi.com/18410.html注意:本地部署也是支持开启联网搜索模式的只需在AnythingLLM的设置界...