马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址

图片[1]-马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址-零度博客

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

 

1.Grok-1 开源模型下载:【磁力链接】 ,然后使用 【Torrent 客户端】进行下载即可!

2.Grok 开源项目:【Githubg 官方下载】或【网盘下载

3.如果需要在云端安装Grok-1大模型,可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub:

git clone https://github.com/xai-org/grok-1.git && cd grok-1
pip install huggingface_hub[hf_transfer]
huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

 

模型详情:

  • 基于大量文本数据训练,未针对任何特定任务微调
  • 3140亿参数MoE模型,激活权重25%
  • 使用旋转嵌入而非固定位置嵌入
  • Tokenizer词汇大小131,072,嵌入大小6,144
  • 64层Transformer,每层解码器层包含多头注意力块和密集块
  • 多头注意力:48头查询,8头键/值,键值大小128
  • 密集块:加宽因子8,隐藏层大小32768
  • 每个token从8个专家选择2个
  • 旋转位置嵌入大小6,144
  • 上下文长度8192 tokens,精度bf16

模型能力:

  • 在标准LM基准测试中表现超过同等计算量模型
  • HumanEval编码任务63.2%,MMLU 73%
  • 在匈牙利高中数学考试中获C级(59%)
  • 整体在推理和编码任务中表现出色

局限性:

  • 缺少独立搜索网络能力,需结合搜索工具增强
  • 可能产生幻觉,需人工审查
  • 目前无法像X平台付费版实现实时获取信息

开源意义:

  • 遵循Apache 2.0许可证,用户可自由使用修改分发
  • 体现了xAI追求透明化和社区开放的理念
  • 为进一步研究和创新提供了宝贵资源

 

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

THE END
喜欢就支持一下吧
点赞1529 分享
相关推荐
谷歌光纤没有死,它正在继续扩张!-零度博客

谷歌光纤没有死,它正在继续扩张!

该公司在一篇博客文章中宣布,Alphabet 旗下专注于在美国提供高速互联网接入的 Google Fiber 制定了雄心勃勃的计划,在未来三到五年内扩展其光纤服务。它希望在五个新州推出光纤服务,其中包括...
admin的头像-零度博客admin
1.6W+2250
永久免费获取25t的网络硬盘,OneDrive免费扩容教程,申请无限容量的谷歌云网盘!-零度博客

永久免费获取25t的网络硬盘,OneDrive免费扩容教程,申请无限容量的谷歌云网盘!

因为之前发现某些人居然在某宝上出售这种免费的网络硬盘 实在看不过去,故发此教程, 申请步骤其实是非常简单的!申请链接来自网络 (友情提示:推荐使用5T的,25T容易翻车,切勿放重要东西,当...
Chrome 限制广告拦截扩展的“Manifest V3”计划被推迟-零度博客

Chrome 限制广告拦截扩展的“Manifest V3”计划被推迟

Manifest V3 转换再次延迟,让各地的 Chrome 用户松了一口气。 几年来,谷歌一直想取消 Chrome 当前的扩展系统,转而支持一个更有限的扩展系统,对过滤阻止广告和/或保护用户隐私的扩展程序设置...
admin的头像-零度博客admin
1.7W+1091
Windows 11 24H2 正式发布,微软官方原版 ISO 下载方式在这里!-零度博客

Windows 11 24H2 正式发布,微软官方原版 ISO 下载方式在这里!

微软之前一直传闻会在本月发布 Windows 11 24H2,尽管有消息称发布日期可能是 10 月 8 日,但微软显然不想让大家猜中,今天便正式发布了该版本。24H2 带来了许多新改进,不过与 Copilot+ PC 相...
admin的头像-零度博客admin
9.7W+4491
VMware Workstation Pro 16.0 虚拟机下载-零度博客

VMware Workstation Pro 16.0 虚拟机下载

VMware 虚拟机下载:【官方下载】或【网盘下载】最新版 另外一款完全免费的虚拟机软件!就是这个VirtualboxVirtualbox:【点击前往】   
ChatGPT 参数规模之谜被揭开:或仅为 7B模型?-零度博客

ChatGPT 参数规模之谜被揭开:或仅为 7B模型?

近日,南加州大学的研究团队爆出一项重磅消息:他们通过一种攻击方法,成功破解了 OpenAI 最新版 ChatGPT 模型(gpt-3.5-turbo)的参数规模,结果发现其参数规模可能只有 70 亿,而非此前传闻的...
admin的头像-零度博客admin
1.3W+1527
警告!Win7/10/11 爆高危漏洞:文件查看即中招,账号易被盗,补丁已出 !-零度博客

警告!Win7/10/11 爆高危漏洞:文件查看即中招,账号易被盗,补丁已出 !

12 月 7 日消息,0patch 团队于 12 月 5 日发布公告,发现 Windows 系统存在一个高危零日漏洞,并推出了非官方修复补丁。漏洞概述该漏洞利用了 NTLM(NT LAN Manager)身份验证协议的缺陷。NTLM...
admin的头像-零度博客admin
1.2W+4374
Lindows OS:抄袭 XP系统?25年后竟然还能安装运行!极其流畅 | 零度解说-零度博客

Lindows OS:抄袭 XP系统?25年后竟然还能安装运行!极其流畅 | 零度解说

https://www.youtube.com/watch?v=2xyTgMjXLVk   Lindows OS 系统下载:https://www.freedidi.com/18291.html    
Windows 11 24H2 两年来最大的更新,今天正式推出!-零度博客

Windows 11 24H2 两年来最大的更新,今天正式推出!

微软今天在以 Windows 和 Copilot 为中心的活动上宣布,将从今天开始向消费者推出今年的 Windows 11 年度更新。Windows 11 2024 更新(也称为 Windows 11 24H2)将分阶段推出,首先从运行 22H2 ...
admin的头像-零度博客admin
1.2W+3250