马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址

图片[1]-马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址-零度博客

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

 

1.Grok-1 开源模型下载:【磁力链接】 ,然后使用 【Torrent 客户端】进行下载即可!

2.Grok 开源项目:【Githubg 官方下载】或【网盘下载

3.如果需要在云端安装Grok-1大模型,可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub:

git clone https://github.com/xai-org/grok-1.git && cd grok-1
pip install huggingface_hub[hf_transfer]
huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

 

模型详情:

  • 基于大量文本数据训练,未针对任何特定任务微调
  • 3140亿参数MoE模型,激活权重25%
  • 使用旋转嵌入而非固定位置嵌入
  • Tokenizer词汇大小131,072,嵌入大小6,144
  • 64层Transformer,每层解码器层包含多头注意力块和密集块
  • 多头注意力:48头查询,8头键/值,键值大小128
  • 密集块:加宽因子8,隐藏层大小32768
  • 每个token从8个专家选择2个
  • 旋转位置嵌入大小6,144
  • 上下文长度8192 tokens,精度bf16

模型能力:

  • 在标准LM基准测试中表现超过同等计算量模型
  • HumanEval编码任务63.2%,MMLU 73%
  • 在匈牙利高中数学考试中获C级(59%)
  • 整体在推理和编码任务中表现出色

局限性:

  • 缺少独立搜索网络能力,需结合搜索工具增强
  • 可能产生幻觉,需人工审查
  • 目前无法像X平台付费版实现实时获取信息

开源意义:

  • 遵循Apache 2.0许可证,用户可自由使用修改分发
  • 体现了xAI追求透明化和社区开放的理念
  • 为进一步研究和创新提供了宝贵资源

 

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

THE END
喜欢就支持一下吧
点赞1529 分享
ViveTool 工具下载,及详细使用教程-零度博客

ViveTool 工具下载,及详细使用教程

注意:为了可以正常使用ViVe,您的系统必须是 Windows 10 build 18963或更高版本。 ViveTool 工具:【点击下载】 使用方法: 在VIVETOOL文件夹下运行这个命令:vivetool addconfig 23615618  2...
admin的头像-零度博客admin
1.8W+2250
零度解说的电脑背景桌面壁纸-零度博客

零度解说的电脑背景桌面壁纸

之前收到好几位网友在我的零度解说频道里问我要这个背景图 图片下载在下面了 点击下载零度桌面背景图
RTX 30系列显卡原价!希望大家都记住,别再被“黄牛们”割韭菜!-零度博客

RTX 30系列显卡原价!希望大家都记住,别再被“黄牛们”割韭菜!

以下是华硕上架的 RTX 30 系列显卡的价格 RTX 3060:2499 元 RTX 3060 Ti:2999 元 RTX 3070 :3899 元 RTX 3070 Ti:4499 元 RTX 3080:5499 元 RTX 3080 Ti:8999 元 RTX 3090:11999 元 4月...
admin的头像-零度博客admin
1.7W+2250
优化上网速度,只需电脑上几步操作,让你上网的速度大大提高 | 零度解说-零度博客

优化上网速度,只需电脑上几步操作,让你上网的速度大大提高 | 零度解说

提高上网速度,从优化电脑设置开始。今天给大家介绍的提升网络速度是完全免费的,我们只需要在电脑上合理配置适合我们的DNS,即可大大提高我们浏览网页的速度。不管你在海外还是在中国大陆,甚...
ESET NOD32 Antivirus 杀毒软件,免费轻量版,支持 Windows 、macOS!-零度博客

ESET NOD32 Antivirus 杀毒软件,免费轻量版,支持 Windows 、macOS!

ESET NOD32 Antivirus 是一款快速轻便的防病毒软件!  提供快速轻便的防病毒技术。以 ESET NOD32 杀毒引擎为核心,它提供基本的恶意软件防护,并允许您保护数据和资金免遭数字欺诈。每月安全报...
admin的头像-零度博客admin
1.8W+1760
手动清理电脑垃圾文件!给系统盘做一个深度清洁-零度博客

手动清理电脑垃圾文件!给系统盘做一个深度清洁

  1.MasterSeeker 大文件搜索 【官网下载】   2.Geek Uninstaller 卸载软件必备 【官网下载】  
admin的头像-零度博客admin
1.8W+1092
华硕推出 PN64 / PN52 迷你主机:搭载 12 代酷睿、锐龙 5000H 处理器-零度博客

华硕推出 PN64 / PN52 迷你主机:搭载 12 代酷睿、锐龙 5000H 处理器

1 月 8 日消息,根据 notebookcheck 消息,华硕于 CES 2022 推出 PN64 / PN52 两款迷你主机,分别搭载英特尔、AMD 处理器。该系列迷你主机采用深灰色拉丝外壳,侧边具有镂空出风口,提供丰富的...
admin的头像-零度博客admin
1.5W+2251
LastPass 被黑!您的信息和密码保险库数据现已掌握在黑客手中-零度博客

LastPass 被黑!您的信息和密码保险库数据现已掌握在黑客手中

领先的密码管理器之一 LastPass 表示,黑客获得了属于其客户的大量个人信息,以及加密和加密散列密码以及存储在客户保险库中的其他数据。 周四发布的这一启示代表了对 8 月份披露的LastPass 违...
admin的头像-零度博客admin
1.6W+1091
无限白嫖ChatGPT 4o 和 Claude 3.5的方法!-零度博客

无限白嫖ChatGPT 4o 和 Claude 3.5的方法!

1、Merlin 【链接直达】免费注册会员后即可免费使用GPT 4o 、 Claude 3.5等高级模型,支持浏览器插件,使用更方便2、Cursor【链接直达】合理设置后,可达到无限免费“续杯”,内置了专业版的Cha...
admin的头像-零度博客admin
9.9W+1849