谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看

科技巨头谷歌在年度I/O开发者大会重磅发布人工智能新品

北京时间5月15日凌晨,谷歌年度科技盛会I/O开发者大会拉开帷幕。正如预期,人工智能无疑成为了本次大会的核心主题。在为期两小时的精彩演讲中,谷歌相继发布了一系列人工智能创新产品和服务,引领AI科技浪潮。

人工智能新品抢先看:

图片[1]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度博客

 

人工智能新品抢先看:

Gemini的广泛升级

谷歌推出了新模型“Gemini 1.5 Flash”,以作为Gemini 1.5 Pro更具成本效益的替代方案,同时仍具有强大的功能。Gemini 1.5 Flash从活动当天开始在谷歌的AI工作室和Vertex AI中提供公开预览版。

 

图片[2]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度博客

2月份公布的Gemini 1.5 Pro也将迎来升级,在今年晚些时候将会把100万Tokens的窗口进一步扩大至200万,这将使其能够同时处理2小时的视频、22小时的音频、超过60,000行代码或超过140万个单词。

谷歌CEO皮查伊强调了Gemini在跨语言方面的改进,它将以35种语言向全球所有开发人员提供。皮查伊表示,Gemini 1.5 Pro可以分析PDF和视频以提供摘要,这意味着当用户假期归来后,模型可以将电子邮件和附件一起进行总结。

专为在智能手机上运行而设计的Gemini Nano也从纯文本输入扩展到可以图片输入。谷歌表示,“手机将能通过文字、图片、视频、音频,理解用户的世界。”并且整个过程都是在本地运行,不会引发隐私泄露。

开源大模型Gemma也将有一系列的更新,定于下月推出的Gemma 2参数量将能达到270亿。最后,谷歌的第一个视觉语言模型PaliGemma也被添加到Gemma模型系列中。

Veo、Imagen 3、音频概述

针对OpenAI的Sora,谷歌也推出了自己的视频生成模型“Veo”,可以根据文字、图片和视频的提示,生成各种风格的高质量1080P视频。

公司表示,Veo可以更好地理解自然语言,从而生成更能代表用户视觉的视频。它还能理解“延时拍摄”等电影术语,以生成各种风格的视频,并让用户更好地控制最终输出。

图片[3]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度博客

去年,谷歌推出了一款名为“SynthID”的工具,可以在AI生成的图像中嵌入人眼不可见的水印。在今天的大会上,公司宣布正在将这项工具扩展到文本和视频之中。上文提到的视频生成模型Veo,在该平台生成的所有视频都会包含SynthID水印。

谷歌还推出了新一代的图像生成模型“Imagen 3”,根据公司的说法该模型可生成迄今为止最高质量的图像,图像中具有更多细节和更少伪影,有助于创建更真实的视觉体验。

与Veo一样,Imagen 3也改进了其自然语言功能,可以更好地理解用户提示及其背后的意图。谷歌称,Imagen 3是渲染文本的最佳选择,目前只有选定的创作者才能使用,很快就会在Vertex AI中推出。

通过Gemini 1.5 Pro,音频概述(Audio Overview)功能可以基于源文件生成个性化和交互式音频对话。

AI赋能谷歌搜索

作为主业,谷歌自然会大力将AI融进其主导全球的搜索引擎之中。从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。

同时谷歌搜索也将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题,并支持“拍视频”搜索解决方案的新搜索形式。

图片[4]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度博客

根据现场演示,搜索引擎具备多步骤推理的能力,例如寻找一个瑜伽教室,同时展示新手优惠报价,和距离特定位置的步行时间。这个AI搜索引擎助手,还能介绍食谱、安排行程,以及接受视频形式的提问。

许多人可能都曾经历过花费数小时滚动浏览网页信息流来查找想要搜索的图片,对此,谷歌推出了AI解决方案。借助Gemini,用户可以在Google Photos中通过对话提示来查找他们寻找的图像。

在谷歌提供的案例中,一位用户希望看到他的女儿作为游泳运动员随着时间推移的进步,Google Photos自动筛选给出。谷歌表示,这项名为“Ask Photos”的功能将于今年夏季晚些时候推出。

Astra项目

谷歌在大会上宣布了一个名为“Astra”的高级视觉和对话响应智能体项目,即开发能在日常生活中提供帮助的通用AI智能体。媒体分析认为,这个项目旨在开发一种类似《钢铁侠》中人工智能系统“贾维斯”。

 

根据谷歌的说法,为了做到真正实用,智能体需要能够像人一样理解周围复杂多变的环境并做出反应——它需要能接收并记忆所见所闻,从而了解上下文信息并采取行动。

谷歌表示,它还需要具备主动性、“会学习”并能满足个性化需求,这样用户才能自然地与它交谈,不会有滞后或延迟。

DeepMind首席执行官Demis Hassabis在台上表示,“将响应时间缩短为对话式的内容是一项艰巨的工程挑战。”

AI芯片等硬件

谷歌推出了第六代TPU(张量处理单元)“Trillium”,将在2024年底向云客户提供。公司表示,与上一代TPU v5e相比,每个芯片的计算性能提高了4.7倍。

图片[5]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度博客

除了TPU,谷歌也会推出CPU和GPU来支持工作负载。

皮查伊也在大会上提到,谷歌云将成为首批提供英伟达Blackwell GPU的云提供商之一,他在演讲中强调了谷歌“与英伟达的长期合作伙伴关系”。

THE END
喜欢就支持一下吧
点赞1527 分享
超详细的CPU超频教程——intel和AMD-零度博客

超详细的CPU超频教程——intel和AMD

ntel的CPU 在Intel挤牙膏的这七八年内,家用市场的桌面CPU,只要认准CPU型号最后带K的CPU就确认可以超频的,比如2500K、4950K、6700K、7700K等,不带K的CPU一般都不能超频,比如2500、4750、670...
admin的头像-零度博客admin
1.3W+652
不符合Win11硬件标准?照样可以升级到Windows 11-零度博客

不符合Win11硬件标准?照样可以升级到Windows 11

微软在 6 月 24 日公布了下一代 Windows 系统 Win11,现在微软通过 Insider 通道,推送 Win11 的预览版了。 不过,Win11 是存在硬件配置要求的,如果你的电脑不符合标准,且在 6 月 24 日之前没...
admin的头像-零度博客admin
1.7W+2250
如何让电脑桌面变的更加美观,更加与众不同!-零度博客

如何让电脑桌面变的更加美观,更加与众不同!

Win10电脑的桌面也可以非常有个性! rainmeter:https://www.rainmeter.net/ 皮肤文件:https://www.deviantart.com/hiphopium/art/Lumiero-828277050  【本地下载】 模板Blue Mountain_Theme...
Windows 11  LTSC 2024 长期服务版官方镜像下载!选IoT 物联版 还是企业版?-零度博客

Windows 11 LTSC 2024 长期服务版官方镜像下载!选IoT 物联版 还是企业版?

估计很多用户在选择 Windows 11 LTSC 2024 长期服务版,最看重的是它的清爽、稳定和性能!但是Widows 11 LTSC 有两个版本,分别是:Windows 11 企业版 LTSC 和 Windows 11 IoT 物联版 LTSC;那...
admin的头像-零度博客admin
8.1W+1997
Captura(卡普图拉)免费开源的屏幕录制软件-零度博客

Captura(卡普图拉)免费开源的屏幕录制软件

Captura是一款完全免费且开源的电脑屏幕录制工具 主要功能: 捕获屏幕,网络摄像头,音频,光标,鼠标单击和击键 适用于Windows系统 需要:NET 4.7.2及以上的环境支持 下载地址:https://mathew...
如何快速获取比特币?BTC如何进行安全保存? 最新比特币交易教程!-零度博客

如何快速获取比特币?BTC如何进行安全保存? 最新比特币交易教程!

https://youtu.be/xUK_Cl1bZP4 ? 火币网国际站点:https://www.huobi.com/zh-cn/topic/invited/?invite_code=48tr7 localbitcoins官网 :https://localbitcoins.com/?ch=1f881 coinbase:https:...
Google Voice更安全的保号教程,永久免费获取一个海外手机号! 2021 | 零度解说-零度博客
是时候放弃 LastPass 了!数据泄露事件令人担忧-零度博客

是时候放弃 LastPass 了!数据泄露事件令人担忧

你听说过一次又一次:您需要 使用密码管理器来生成强而独特的密码并为您跟踪它们。如果您最终选择了免费的主流选项,尤其是在 2010 年代,那可能是 LastPass。然而,对于该安全服务的 2560 万...
admin的头像-零度博客admin
1.6W+1091
如何在YouTube影片上没有字幕情况下生成字幕?-零度博客

如何在YouTube影片上没有字幕情况下生成字幕?

善用 Youtube 自动生成的字幕 轻松为你的 Youtube 影片添加字幕! 制作影片很有趣, 但是制作字幕却很繁琐, 如果你已经厌倦了拖动字幕时间轴, 那么这个插件可能很适合你! 您可能知道Youtube 会自...
admin的头像-零度博客admin
1.5W+1527