DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降

AlphaTensor 发现了更好的矩阵数学算法,从远处激发了另一项改进。

 

图片[1]-DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降-零度博客

 

矩阵乘法是许多机器学习突破的核心,而且它变得更快——两倍。上周,DeepMind宣布它发现了一种更有效的矩阵乘法运算方法,打破了 50 年的记录。本周,约翰内斯·开普勒大学林茨分校的两名奥地利研究人员声称,他们已经超越了这一新纪录。

矩阵乘法涉及将两个矩形数字数组相乘,通常是语音识别、图像识别、智能手机图像处理、压缩和生成计算机图形的核心。图形处理单元 (GPU) 因其大规模并行特性而特别擅长执行矩阵乘法。他们可以将一个大的矩阵数学问题分割成许多部分,并使用一种特殊的算法同时攻击其中的一部分。

1969 年,一位名叫 Volker Strassen 的德国数学家发现了以前最好的 4×4 矩阵相乘算法,它减少了执行矩阵计算所需的步骤数。例如,使用传统的教室方法将两个 4×4 矩阵相乘需要 64 次乘法,而 Strassen 的算法可以在 49 次乘法中执行相同的壮举。

DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降
 DeepMind 的矩阵乘法示例,带有花哨的括号和彩色数字圆圈。
DeepMind

DeepMind 使用名为 AlphaTensor 的神经网络发现了一种将乘法次数减少到 47 次的方法,其研究人员上周在 Nature 上发表了一篇关于该成就的论文。

从 49 步到 47 步听起来并不多,但考虑到 GPU 每天要进行多少万亿次矩阵计算,即使是增量改进也可以转化为巨大的效率提升,让 AI 应用程序可以在现有系统上更快地运行硬件。

 

当数学只是一场游戏时,人工智能赢了

DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降

AlphaTensor 是 AlphaGo( 2017 年击败世界冠军围棋选手)和AlphaZero的后代,后者负责国际象棋和将棋。DeepMind 将 AlphaTensor 称为“第一个用于为矩阵乘法等基本任务发现新颖、高效且​​可证明正确的算法的 AI 系统”。

为了发现更有效的矩阵数学算法,DeepMind 将问题设置为单人游戏。该公司在上周的博客文章中更详细地描述了该过程

在这个游戏中,棋盘是一个 3 维张量(数字数组),用于捕捉当前算法离正确的程度。通过一组与算法指令相对应的允许移动,玩家尝试修改张量并将其条目归零。当玩家设法这样做时,这将为任何一对矩阵生成可证明正确的矩阵乘法算法,并且其效率由将张量归零所采取的步骤数来衡量。

然后,DeepMind 使用强化学习训练 AlphaTensor 来玩这个虚构的数学游戏——类似于 AlphaGo 学习围棋的方式——并且随着时间的推移逐渐改进。根据 DeepMind 的说法,最终,它重新发现了施特拉森和其他人类数学家的工作,然后超越了他们。

在一个更复杂的示例中,AlphaTensor 发现了一种以 96 步执行 5×5 矩阵乘法的新方法(旧方法为 98 步)。本周,奥地利林茨 Johannes Kepler 大学的Manuel Kauers 和 Jakob Moosbauer发表了一篇论文,声称他们已将该计数减少了 1,降至 95 次乘法。这个显然破纪录的新算法来得如此之快绝非巧合,因为它建立在 DeepMind 的工作之上。在他们的论文中,Kauers 和 Moosbauer 写道:“这个解决方案是从 [DeepMind 的研究人员] 的方案中获得的,通过应用一系列转换导致可以消除一个乘法的方案。”

技术进步靠自己,随着人工智能现在在寻找新的算法,其他长期的数学记录可能很快就会下降。与计算机辅助设计 ( CAD ) 允许开发更复杂、更快的计算机的方式类似,人工智能可以帮助人类工程师加速其自身的推出。

THE END
喜欢就支持一下吧
点赞2250 分享
这7个网站,绝对值得你收藏!2022 | 零度解说-零度博客
这5款免费软件,能让你的电脑变的更强大更专业! 2020 | 零度解说-零度博客

这5款免费软件,能让你的电脑变的更强大更专业! 2020 | 零度解说

更多视频▶https://www.youtube.com/channel/UCvijahEyGtvMpmMHBu4FS2w?sub_confirmation=1 推荐的这5款电脑上的免费软件,真的可以用强大的没有朋友来形容,每一款都是精品中的精品,尤其其中...
DeepSeek 重磅推出 NSA 功能!处理长文本、编写长篇故事更强-零度博客

DeepSeek 重磅推出 NSA 功能!处理长文本、编写长篇故事更强

就在马斯克发布Grok 3大模型后当天,DeepSeek 就重磅推出 NSA 功能!这是长文本建模的突破性进展,在处理长序列文本起到非常关键的作用,处理长文本、编写长篇故事更强!消息发布后就迎来大量的...
admin的头像-零度博客admin
1.3W+2631
零度推荐的7个非常实用的网站!-零度博客

零度推荐的7个非常实用的网站!

edit.photo 图片在线编辑器:【点击进入】 Userbenchmark: 【点击进入】 显卡超频参数网站:【点击进入】 AfterBurner 显卡超频软件: 【点击下载】 ExpressVP 优惠链接: 【点击获取】 最好的...
admin的头像-零度博客admin
1.6W+2251
导出完整的Google相册照片! 包含时间、日期、拍摄地点等元数据-零度博客

导出完整的Google相册照片! 包含时间、日期、拍摄地点等元数据

  1.谷歌相册导出地址:https://takeout.google.com   2.Exiftool工具下载:【官网】   3.Exiftool使用教程:【点击进入】   4.完整的导出教程:https://www.freedidi.com/...
admin的头像-零度博客admin
1.7W+1682
ChatGPT 正式推出iOS官方客户端! 目前仅支持iPhone ,安卓版会在后续推出-零度博客

ChatGPT 正式推出iOS官方客户端! 目前仅支持iPhone ,安卓版会在后续推出

周四,OpenAI在美国发布了一款适用于 iPhone 的免费ChatGPT 应用程序,其中包括通过其Whisper AI 语音识别模型提供的语音输入支持;它还可以与网页版AI助手同步聊天记录。此举首次将 ChatGPT 引...
admin的头像-零度博客admin
1.3W+6539
推荐7个非常实用又超有趣的网站!学习、娱乐、办公必备-零度博客

推荐7个非常实用又超有趣的网站!学习、娱乐、办公必备

  1.Ninite.com 当你设置新 Windows 电脑的时候,必须了解的站点,在它的主页上,你会发现几十个流行的应用程序! 检查您要安装的所有文件并点击底部的下载按钮,然后 Ninite 将下载一个文...
Llama 4 最新大模型在线免费使用、下载本地部署!Llama-4-Scout 、Maverick-零度博客

Llama 4 最新大模型在线免费使用、下载本地部署!Llama-4-Scout 、Maverick

AI界从来没有“周末”这个词,连硅谷也不休息!就在这个大周日,Meta突然发布了Llama 4家族的新成员,而且一出手就是三款模型,直接引爆AI圈——Llama 4 Scout、Llama 4 Maverick,还有一个还在...
admin的头像-零度博客admin
2.7W+2140
2020年谁最有钱?全球顶级亿万富翁大揭晓!马云还在全球首富前十位吗?-零度博客