马斯克开源Grok-1：史上最大3140亿参数模型，权重架构全面公开，附最新下载地址-零度博客

马斯克开源Grok-1：史上最大3140亿参数模型，权重架构全面公开，附最新下载地址

10个月前更新

1.5W+1529

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

1.Grok-1 开源模型下载：【磁力链接】，然后使用【Torrent 客户端】进行下载即可！

2.Grok 开源项目：【Githubg 官方下载】或【网盘下载 】

3.如果需要在云端安装Grok-1大模型，可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub：

git clone https://github.com/xai-org/grok-1.git && cd grok-1
pip install huggingface_hub[hf_transfer]
huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

模型详情:

基于大量文本数据训练,未针对任何特定任务微调
3140亿参数MoE模型,激活权重25%
使用旋转嵌入而非固定位置嵌入
Tokenizer词汇大小131,072,嵌入大小6,144
64层Transformer,每层解码器层包含多头注意力块和密集块
多头注意力:48头查询,8头键/值,键值大小128
密集块:加宽因子8,隐藏层大小32768
每个token从8个专家选择2个
旋转位置嵌入大小6,144
上下文长度8192 tokens,精度bf16

模型能力:

在标准LM基准测试中表现超过同等计算量模型
HumanEval编码任务63.2%,MMLU 73%
在匈牙利高中数学考试中获C级(59%)
整体在推理和编码任务中表现出色

局限性:

缺少独立搜索网络能力,需结合搜索工具增强
可能产生幻觉,需人工审查
目前无法像X平台付费版实现实时获取信息

开源意义:

遵循Apache 2.0许可证,用户可自由使用修改分发
体现了xAI追求透明化和社区开放的理念
为进一步研究和创新提供了宝贵资源

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

THE END

AI 免费资源

喜欢就支持一下吧

相关推荐

猜你喜欢
最近更新

SubsTracker - 订阅管理与提醒系统（Cloudflare workers）-零度博客

SubsTracker – 订阅管理与提醒系统（Cloudflare workers）

SubsTracker - 订阅管理与提醒系统是基于Cloudflare Workers的轻量级订阅管理系统，帮助您轻松跟踪各类订阅服务的到期时间，并通过Telegram发送及时提醒。✨ 特性🔔 自动提醒: 在订阅到期前自...

admin

1.7W+797

美女博士 AI 项目刷爆全网！Pika 视频生成工具，出道即顶流！！附最新注册使用教程 | 零度解说-零度博客

美女博士 AI 项目刷爆全网！Pika 视频生成工具，出道即顶流！！附最新注册使用教程 | 零度解说

https://youtu.be/uSVlBs8LB00?si=C68Y5vRt4eSacatX ======= 注册链接：https://www.freedidi.com/11022.html

admin

1.7W+1682

2021年最新预言你最好要知道！印度男孩再发警示，我们不能再忽视！ | 零度解密-零度博客

2021年最新预言你最好要知道！印度男孩再发警示，我们不能再忽视！ | 零度解密

https://youtu.be/r_hgDB-QQAQ

Youtube视频 # 2021年最新预言 # 阿南德预言

admin

1W+652

Windows 11 是否真的值得升级? 这9个原因看完再做决定！| 零度解说

https://youtu.be/NfbEnpd_gOE

admin

1.6W+2250

ChatGPT 4.5 重磅升级！实测8个高难问题，表现有点意外，这次终于靠谱了？| 零度解说-零度博客

ChatGPT 4.5 重磅升级！实测8个高难问题，表现有点意外，这次终于靠谱了？| 零度解说

https://youtu.be/Ev5PMfIlmZQ?si=wlI0wiobt3KiYRHM

AI Claude DEEPSEEK

admin

1W+1492

钛盘 TMP.link - 不限速无限空间的临时网盘！免客户端 /支持CURL、Wget命令行上传下载 | 零度解说-零度博客

钛盘 TMP.link – 不限速无限空间的临时网盘！免客户端 /支持CURL、Wget命令行上传下载 | 零度解说

https://www.youtube.com/watch?v=bWnNoFVLN6Y

Youtube视频 # 网盘

admin

1.6W+2251

Twitter 的审核系统支离破碎！马斯克接手推特以后....-零度博客

Twitter 的审核系统支离破碎！马斯克接手推特以后….

在 Elon Musk 裁员后，几乎没有版主可以与之交谈。甚至在 11 月 12 日 Twitter 裁掉约4,400 名合同工之前，该平台就已经显示出紧张的迹象。虚假信息研究人员和活动人士称，埃隆...

admin

1.6W+1091

零度推荐的7个非常实用的网站！-零度博客

零度推荐的7个非常实用的网站！

edit.photo 图片在线编辑器：【点击进入】 Userbenchmark：【点击进入】显卡超频参数网站：【点击进入】 AfterBurner 显卡超频软件: 【点击下载】 ExpressVP 优惠链接：【点击获取】最好的...

admin

1.6W+2251

开心电视助手【最新版】安卓TV必备的神器！-零度博客

开心电视助手【最新版】安卓TV必备的神器！

开心电视助手，是一款专门针对安卓设备打造的远程管理工具，可以轻松实现：管理电视/机顶盒/投影仪等设备，还可以远程安装各种电视APP，方便用户的使用和安装应用，还支持刷第三方固件等...

admin

8.6W+3271