DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降

AlphaTensor 发现了更好的矩阵数学算法,从远处激发了另一项改进。

 

图片[1]-DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降-零度博客

 

矩阵乘法是许多机器学习突破的核心,而且它变得更快——两倍。上周,DeepMind宣布它发现了一种更有效的矩阵乘法运算方法,打破了 50 年的记录。本周,约翰内斯·开普勒大学林茨分校的两名奥地利研究人员声称,他们已经超越了这一新纪录。

矩阵乘法涉及将两个矩形数字数组相乘,通常是语音识别、图像识别、智能手机图像处理、压缩和生成计算机图形的核心。图形处理单元 (GPU) 因其大规模并行特性而特别擅长执行矩阵乘法。他们可以将一个大的矩阵数学问题分割成许多部分,并使用一种特殊的算法同时攻击其中的一部分。

1969 年,一位名叫 Volker Strassen 的德国数学家发现了以前最好的 4×4 矩阵相乘算法,它减少了执行矩阵计算所需的步骤数。例如,使用传统的教室方法将两个 4×4 矩阵相乘需要 64 次乘法,而 Strassen 的算法可以在 49 次乘法中执行相同的壮举。

DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降
 DeepMind 的矩阵乘法示例,带有花哨的括号和彩色数字圆圈。
DeepMind

DeepMind 使用名为 AlphaTensor 的神经网络发现了一种将乘法次数减少到 47 次的方法,其研究人员上周在 Nature 上发表了一篇关于该成就的论文。

从 49 步到 47 步听起来并不多,但考虑到 GPU 每天要进行多少万亿次矩阵计算,即使是增量改进也可以转化为巨大的效率提升,让 AI 应用程序可以在现有系统上更快地运行硬件。

 

当数学只是一场游戏时,人工智能赢了

DeepMind 使用 AI 打破了 50 年的数学记录;一周后新纪录下降

AlphaTensor 是 AlphaGo( 2017 年击败世界冠军围棋选手)和AlphaZero的后代,后者负责国际象棋和将棋。DeepMind 将 AlphaTensor 称为“第一个用于为矩阵乘法等基本任务发现新颖、高效且​​可证明正确的算法的 AI 系统”。

为了发现更有效的矩阵数学算法,DeepMind 将问题设置为单人游戏。该公司在上周的博客文章中更详细地描述了该过程

在这个游戏中,棋盘是一个 3 维张量(数字数组),用于捕捉当前算法离正确的程度。通过一组与算法指令相对应的允许移动,玩家尝试修改张量并将其条目归零。当玩家设法这样做时,这将为任何一对矩阵生成可证明正确的矩阵乘法算法,并且其效率由将张量归零所采取的步骤数来衡量。

然后,DeepMind 使用强化学习训练 AlphaTensor 来玩这个虚构的数学游戏——类似于 AlphaGo 学习围棋的方式——并且随着时间的推移逐渐改进。根据 DeepMind 的说法,最终,它重新发现了施特拉森和其他人类数学家的工作,然后超越了他们。

在一个更复杂的示例中,AlphaTensor 发现了一种以 96 步执行 5×5 矩阵乘法的新方法(旧方法为 98 步)。本周,奥地利林茨 Johannes Kepler 大学的Manuel Kauers 和 Jakob Moosbauer发表了一篇论文,声称他们已将该计数减少了 1,降至 95 次乘法。这个显然破纪录的新算法来得如此之快绝非巧合,因为它建立在 DeepMind 的工作之上。在他们的论文中,Kauers 和 Moosbauer 写道:“这个解决方案是从 [DeepMind 的研究人员] 的方案中获得的,通过应用一系列转换导致可以消除一个乘法的方案。”

技术进步靠自己,随着人工智能现在在寻找新的算法,其他长期的数学记录可能很快就会下降。与计算机辅助设计 ( CAD ) 允许开发更复杂、更快的计算机的方式类似,人工智能可以帮助人类工程师加速其自身的推出。

THE END
喜欢就支持一下吧
点赞2250 分享
狗狗币最新挖矿教程!附挖矿软件,新手也能快速上手! 2024-零度博客

狗狗币最新挖矿教程!附挖矿软件,新手也能快速上手! 2024

自从特朗普成功竞选以后,各路加密货币应声上涨!作为深受马斯克影响的狗狗币突然又火了,价格暴涨。当然不仅仅狗狗币,其它任何加密货币也一样,比特币也在一周内涨了5000多美金,当然比特币普...
admin的头像-零度博客admin
7.5W+5783
Windows 10/11 电脑上必备的神器!Powertoys-零度博客

Windows 10/11 电脑上必备的神器!Powertoys

Microsoft PowerToys 是一组实用程序,供高级用户调整和简化其 Windows 10 和 11 体验以提高工作效率。 1、微软应用商店下载:【点击前往】 2、Github开源项目:【点击访问】 3、网盘打包下载:...
SMSboom 短信轰炸!开源在GitHub的免费开源项目-零度博客

SMSboom 短信轰炸!开源在GitHub的免费开源项目

  SMSboom 开源项目 :【Github链接】【安装包链接】 三件事 原作者 @whalefell 為保障自身安全及規避風險,於 2022/7/6 將本倉庫移交給我.至此,本倉庫所有事務與原作者無關. 介於本項...
admin的头像-零度博客admin
2.4W+6549
如何在 Linux 上安装和设置 Sublime Text-零度博客

如何在 Linux 上安装和设置 Sublime Text

Sublime Text 是一个源代码编辑器,支持各种标记和编程语言。它提供了命令调色板、转到任何内容、自动完成、片段和插件等功能,并且适用于所有主要平台,包括 Linux、macOS 和 Windows。如果您...
admin的头像-零度博客admin
1.6W+2251
显卡要涨价了!RTX 30 LHR挖矿限制被100%破解,这次有什么猫腻?| 零度解说-零度博客
Windows 11系统下找回 IE浏览器的代码-零度博客

Windows 11系统下找回 IE浏览器的代码

在文档下输入以下代码: CreateObject('InternetExplorer.Application').Visible=true   最后保存为VBS,运行即可调出IE浏览器!   详细的设置教程:https://www.freedidi.com/3540.h...
admin的头像-零度博客admin
1.6W+2251
10款超级好用的谷歌浏览器插件!-零度博客

10款超级好用的谷歌浏览器插件!

https://youtu.be/2sr8SkecQmY   IE Tab: https://chrome.google.com/webstore/detail/ie-tab/hehijbfgiekmjfkfjpbkbammjbdenadd?utm_source=chrome-ntp-icon The Great Suspender: https:...
显卡价格一夜暴降40%!泡沫终究还是来了,你准备好了吗? | 零度解说-零度博客
DeepSeek 多模态大模型Janus-Pro-7B,本地部署教程!支持图像识别和图像生成-零度博客

DeepSeek 多模态大模型Janus-Pro-7B,本地部署教程!支持图像识别和图像生成

DeepSeek 又深夜发大招!开源了多模态大模型Janus-Pro-7B,普通电脑可以直接安装使用,现在我们就来本地部署!支持图像识别和图像生成,性能非常强悍!1、检查自己是否安装了 Git 和 conda ,如...
admin的头像-零度博客admin
6.5W+1899