Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!

图片[1]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

Langchain-Chatchat 是一个可以实现:完全本地化推理的知识库增强方案, 重点解决数据安全保护,私域化部署的企业痛点。 开源方案采用Apache License,可以免费商用,无需付费。

支持市面上主流的本地大语言模型和Embedding 嵌入式模型,支持开源的本地向量数据库。

图片[2]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

图片[3]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

1. 环境配置

  • 首先,确保你的机器安装了 Python 3.8 – 3.11  (强烈推荐使用 Python3.11) 【点击前往
  • 安装CUDA Toolkit,建议安装 CUDA 12.1版本,因为开发者就是用的这个版本,点击前往官方下载
  • 需要注意的是,如果你不在海外,需要自行全局科学上网,否则无法正常安装。

2. 正式安装

大陆用户请选择本地安装包:网盘打包下载

拉取仓库项目文件:

# 拉取仓库
 git clone https://github.com/chatchat-space/Langchain-Chatchat.git

# 进入目录
 cd Langchain-Chatchat

# 安装全部依赖
 pip install -r requirements.txt 
 pip install -r requirements_api.txt
 pip install -r requirements_webui.txt  

# 默认依赖包括基本运行环境(FAISS向量库)。如果要使用 milvus/pg_vector 等向量库,请将 requirements.txt 中相应依赖取消注释再安装。

3.下载模型

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b
git clone https://huggingface.co/BAAI/bge-large-zh

初始化配置

python copy_config_example.py
python init_database.py --recreate-vs

4.启动

python startup.py -a

第一次启动的时候需要输入一个邮箱,就可以打开 webUI 可视化界面进行使用!

GPU硬件推荐参数

7B的模型,显存14GB+,推荐 NVIDIA RTX4080 16G及以上
14B级模型,显存30GB+,推荐 NVIDIA Tesla V100 32G及以上
39B级模型,显存69GB+,推荐 NVIDIA A100 80G及以上
72B级模型,显存145GB+,需要专业级显卡或者多卡叠加

(默认安装的是 ChatGLM-6B 模型,中端型显卡可以直接本地运行)

本次演示环境系统: Windows 11   、GPU: RTX 4090 24GB、 CPU: i7-12700

当然如果你需要运行更大的模型,比如你想要顺利在GPU运行本地模型的 FP16 版本,你至少需要以下的硬件配置,来保证在我们框架下能够实现 稳定连续对话

  • ChatGLM3-6B & LLaMA-7B-Chat 等 7B模型
    • 最低显存要求: 14GB
    • 推荐显卡: RTX 4080
  • Qwen-14B-Chat 等 14B模型
    • 最低显存要求: 30GB
    • 推荐显卡: V100
  • Yi-34B-Chat 等 34B模型
    • 最低显存要求: 69GB
    • 推荐显卡: A100
  • Qwen-72B-Chat 等 72B模型
    • 最低显存要求: 145GB
    • 推荐显卡:多卡 A100 以上

5.安装过程中出现的常见错误和解决方法:

1.提示 ModuleNotFoundError: No module named ‘pwd’,这个模块是Unix系统上的,Windows 上并没有,所以我们需要进行降级:

pip install langchain-community==0.0.19

2.提示错误信息 | ERROR | stderr | AssertionError: Torch not compiled with CUDA enabled

说明你没有安装CUDA环境或者你安装的PyTorch版本不支持CUDA,解决方法:

pip uninstall torch torchvision torchaudio

通过上面的命令进行卸载后重新安装官方给出的正确版本,安装命令如下:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

3.安装依赖 wavedrom 时报错 (setuptools_scm)的解决方法:

pip install setuptools_scm

安装后再重新安装依赖环境

 

 

THE END
喜欢就支持一下吧
点赞2177 分享
如何更新电脑驱动?3种方法务必要知道,提升性能,省时又放心!| 零度解说-零度博客

如何更新电脑驱动?3种方法务必要知道,提升性能,省时又放心!| 零度解说

https://youtu.be/joniHPDcgQc   ------------------------------------- 🔔 电脑驱动更新软件下载:https://www.freedidi.com/13230.html   ===================== 哔哩哔哩  
真香!NVIDIA Chat with RTX,本地一键部署私密的AI聊天机器人! | 零度解说-零度博客

真香!NVIDIA Chat with RTX,本地一键部署私密的AI聊天机器人! | 零度解说

https://youtu.be/Hwn49QenXWg ------------------------------------- NVIDIA Chat with RTX 安装包下载:https://www.freedidi.com/11615.html
admin的头像-零度博客admin
1.3W+1527
【甲骨文】云服务器免费注册地址大全!-零度博客

【甲骨文】云服务器免费注册地址大全!

不同地区注册甲骨文云服务器的页面链接是不一样的,具体注册链接如下:大陆:【链接直达】台湾:【链接直达】美国:【链接直达】澳洲:【链接直达】日本: 【链接直达】韩国: 【链接直达】更多...
admin的头像-零度博客admin
16.9W+3833
Windows 10 最新挖矿教程,错过比特币千万别再错过以太币!-零度博客
Mistral Small 3.1 开源!AI界最强小钢炮?超低延迟+多模态,本地部署实测,惊喜还是翻车?| 零度解说-零度博客

Mistral Small 3.1 开源!AI界最强小钢炮?超低延迟+多模态,本地部署实测,惊喜还是翻车?| 零度解说

https://www.youtube.com/watch?v=xRC2TCCep9c   Mistral Small 3.1 本地安装下载:https://www.freedidi.com/18813.html
ACDSee 免费看图软件,免破解!官方推出免费版本,Windows免费下载。-零度博客

ACDSee 免费看图软件,免破解!官方推出免费版本,Windows免费下载。

ACDSee Free看图软件,免破解!官方推出免费版本了,能在电脑上查看照片, 并进行简单的放大检视、旋转功能,支援Windows免费下载。若需要进阶使用投影片播放、缩放、裁剪、滤镜、光线调整等编...
手机也能跑AI大模型!支持DeepSeek R1、Llama 3.3、Qwen2.5等,iOS/安卓离线使用,完全免费开源!| 零度解说-零度博客

手机也能跑AI大模型!支持DeepSeek R1、Llama 3.3、Qwen2.5等,iOS/安卓离线使用,完全免费开源!| 零度解说

PocketPal AI 是一款袖珍型 AI 助手,由可直接在手机上运行的小型语言模型 (SLM) 驱动。PocketPal AI 专为 iOS 和 Android 系统设计,让您无需网络连接即可与各种 SLM 进行交互。 https://www.y...
Llama 4 最新大模型在线免费使用、下载本地部署!Llama-4-Scout 、Maverick-零度博客

Llama 4 最新大模型在线免费使用、下载本地部署!Llama-4-Scout 、Maverick

AI界从来没有“周末”这个词,连硅谷也不休息!就在这个大周日,Meta突然发布了Llama 4家族的新成员,而且一出手就是三款模型,直接引爆AI圈——Llama 4 Scout、Llama 4 Maverick,还有一个还在...
admin的头像-零度博客admin
2.8W+2140
如何恢复微信聊天记录,找回被删除或被拉黑的联系人!| 零度解说-零度博客