Meta Llama 3 正式发布!如何在线体验和本地安装部署?

Meta 宣布推出下一代开源大语言模型Llama 3,标志着AI发展新里程碑。该模型分为80亿和700亿参数两个版本,被誉为”Llama 2的重大飞跃”,为大规模语言模型树立新标杆。

值得一提的是,Llama 3已与Meta AI助手深度集成,未来还将陆续在AWS、Databricks、Google Cloud等多个云平台上线,并获得AMD、Intel、NVIDIA等硬件厂商的支持,进一步扩大应用场景。

该模型的发布彰显了Meta在开源AI领域的决心和影响力。我们有理由期待,Llama 3将为自然语言处理、机器学习等AI前沿技术的发展注入新动力。

在线使用:【链接直达

不仅可以智能对话,也可以在线生成图片

图片[1]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客 图片[2]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

 

本地安装部署:

1.从github下载Llama 3 项目文件

点击下载】、【网盘下载

2.申请模型下载链接 (申请秒过)

点击申请

申请后会在邮件里提供一个下载链接

3.安装环境依赖

在Llama3最高级目录执行以下命令(建议在安装了python的conda环境下执行)

pip install -e .

4.下载Llama3模型,执行以下命令:

bash download.sh

 

运行命令后在终端下输入邮件里获取到下载链接,并选择你需要的模型,比如我选择8B-instruct

图片[3]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

 

如果你在下载的时候出现这个错误,那是因为你电脑上没有安装Wget命令的环境,你只需【下载wget】、或【网盘下载

下载以后把wget.exe程序放在C:\Windows\System32 目录下就可以解决!看零度视频里的演示即可

 

图片[4]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

5. 运行示例脚本,执行以下命令:

torchrun --nproc_per_node 1 example_chat_completion.py \
    --ckpt_dir Meta-Llama-3-8B-Instruct/ \
    --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model \
    --max_seq_len 512 --max_batch_size 6

 

6.创建自己的对话脚本,在根目录下创建以下chat.py脚本

# Copyright (c) Meta Platforms, Inc. and affiliates.
# This software may be used and distributed in accordance with the terms of the Llama 3 Community License Agreement.

from typing import List, Optional

import fire

from llama import Dialog, Llama


def main(
    ckpt_dir: str,
    tokenizer_path: str,
    temperature: float = 0.6,
    top_p: float = 0.9,
    max_seq_len: int = 512,
    max_batch_size: int = 4,
    max_gen_len: Optional[int] = None,
):
    """
    Examples to run with the models finetuned for chat. Prompts correspond of chat
    turns between the user and assistant with the final one always being the user.

    An optional system prompt at the beginning to control how the model should respond
    is also supported.

    The context window of llama3 models is 8192 tokens, so `max_seq_len` needs to be <= 8192.

    `max_gen_len` is optional because finetuned models are able to stop generations naturally.
    """
    generator = Llama.build(
        ckpt_dir=ckpt_dir,
        tokenizer_path=tokenizer_path,
        max_seq_len=max_seq_len,
        max_batch_size=max_batch_size,
    )

    # Modify the dialogs list to only include user inputs
    dialogs: List[Dialog] = [
        [{"role": "user", "content": ""}],  # Initialize with an empty user input
    ]

    # Start the conversation loop
    while True:
        # Get user input
        user_input = input("You: ")
        
        # Exit loop if user inputs 'exit'
        if user_input.lower() == 'exit':
            break
        
        # Append user input to the dialogs list
        dialogs[0][0]["content"] = user_input

        # Use the generator to get model response
        result = generator.chat_completion(
            dialogs,
            max_gen_len=max_gen_len,
            temperature=temperature,
            top_p=top_p,
        )[0]

        # Print model response
        print(f"Model: {result['generation']['content']}")

if __name__ == "__main__":
    fire.Fire(main)

运行以下命令就可以开始对话:

torchrun --nproc_per_node 1 chat.py     --ckpt_dir Meta-Llama-3-8B-Instruct/     --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model     --max_seq_len 512 --max_batch_size 6

 

THE END
喜欢就支持一下吧
点赞2176 分享
相关推荐
VirtualBox 7.0 安装 macOS big sur  + Windows 11系统-零度博客

VirtualBox 7.0 安装 macOS big sur + Windows 11系统

  1.VirtualBox 7.0 虚拟机软件:【点击下载】 2.macOS big sur  系统ISO镜像:【点击下载】 3.Windows 11 22H2系统:【点击下载】     安装教程:   https://www.youtube...
admin的头像-零度博客admin
1.9W+2250
全新 AI 视频生成工具 - 免费开源,本地部署,一键生成2分钟超长视频!剑指Sora? | 零度解说-零度博客

全新 AI 视频生成工具 – 免费开源,本地部署,一键生成2分钟超长视频!剑指Sora? | 零度解说

https://www.youtube.com/watch?v=mKYWIm4qWF0   ------------------------------------- 🔔 StreamingT2V模型下载安装:https://www.freedidi.com/12128.html
Windows 11  LTSC 2024 官方精简版!简体中文正式版ISO镜像下载-零度博客

Windows 11 LTSC 2024 官方精简版!简体中文正式版ISO镜像下载

Win11企业版 2024 长期服务版 (Windows 11 IoT Enterprise LTSC 2024) 提供长达 10 年的支持服务,支持至 2034 年。它可视为官方推出的精简版 Win11,系统稳定流畅,对电脑硬件的要求较低,适合...
admin的头像-零度博客admin
14.3W+5480
忽视这 5 件事可能会降低您的 Windows 10 PC 的速度-零度博客

忽视这 5 件事可能会降低您的 Windows 10 PC 的速度

您的 Windows PC 速度慢吗?您可能会在没有意识到的情况下对您的计算机造成伤害。 没有人喜欢一台有问题的电脑,尤其是当它占用你宝贵的空闲时间来完成一项简单的任务时。因此,无论是启动、打...
admin的头像-零度博客admin
1.5W+2251
【AI绘画】Stable-Diffusion 通过骨架分析插件ControlNet 来制作超有意境的图片-零度博客

【AI绘画】Stable-Diffusion 通过骨架分析插件ControlNet 来制作超有意境的图片

  A.开始前的准备工作,你需要先安装必备的环境 安装 Python 3.10.6,  'Add Python to PATH' 安装 git. B.正式开始安装的步骤: 1.下载 Stable-Diffusion-webui 【链接地址】  Github...
admin的头像-零度博客admin
1.5W+6541
CALC Smart 计算器 ±   原价38(限免),是学生党尤其是相关专业人士必备!-零度博客

CALC Smart 计算器 ± 原价38(限免),是学生党尤其是相关专业人士必备!

输入即计算,快速历史记录或转换,丰富功能,纸带滚动,新自定义布局和主题,分数等更多!CALC有更智能的方式处理您日常的数学运算,始终使用最新的iOS系统,并由用户的创意赋能。最喜欢的粉丝...
admin的头像-零度博客admin
2W+1573
Windows 不敢公布的电脑软件,这5款你一定都知道!【绝对宝藏级的】| 零度解说-零度博客
俄罗斯创建自己的 TLS 证书颁发机构以绕过制裁-零度博客

俄罗斯创建自己的 TLS 证书颁发机构以绕过制裁

俄罗斯已成立国内可信 TLS 证书颁发机构 (CA),以帮助俄罗斯网站更新其 TLS 证书并继续为其访问者提供服务。 在入侵乌克兰之前,位于俄罗斯的网站会向国际 CA 支付更新其 TLS 证书的费用。然而...
admin的头像-零度博客admin
1.5W+2251
担心用户流失!Netflix 推迟打击密码共享行为-零度博客

担心用户流失!Netflix 推迟打击密码共享行为

我们不止一次注意到 Netflix 的密码共享打击是一种 愚蠢的现金抢夺,并说明了该公司不可避免地从创新颠覆者转变为 Netflix 最初颠覆的那种廉价有线电视公司。 Netflix 在过去五年中最大的创新...
admin的头像-零度博客admin
1.2W+6539