Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!

图片[1]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

Langchain-Chatchat 是一个可以实现:完全本地化推理的知识库增强方案, 重点解决数据安全保护,私域化部署的企业痛点。 开源方案采用Apache License,可以免费商用,无需付费。

支持市面上主流的本地大语言模型和Embedding 嵌入式模型,支持开源的本地向量数据库。

图片[2]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

图片[3]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

1. 环境配置

  • 首先,确保你的机器安装了 Python 3.8 – 3.11  (强烈推荐使用 Python3.11) 【点击前往
  • 安装CUDA Toolkit,建议安装 CUDA 12.1版本,因为开发者就是用的这个版本,点击前往官方下载
  • 需要注意的是,如果你不在海外,需要自行全局科学上网,否则无法正常安装。

2. 正式安装

大陆用户请选择本地安装包:网盘打包下载

拉取仓库项目文件:

# 拉取仓库
 git clone https://github.com/chatchat-space/Langchain-Chatchat.git

# 进入目录
 cd Langchain-Chatchat

# 安装全部依赖
 pip install -r requirements.txt 
 pip install -r requirements_api.txt
 pip install -r requirements_webui.txt  

# 默认依赖包括基本运行环境(FAISS向量库)。如果要使用 milvus/pg_vector 等向量库,请将 requirements.txt 中相应依赖取消注释再安装。

3.下载模型

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b
git clone https://huggingface.co/BAAI/bge-large-zh

初始化配置

python copy_config_example.py
python init_database.py --recreate-vs

4.启动

python startup.py -a

第一次启动的时候需要输入一个邮箱,就可以打开 webUI 可视化界面进行使用!

GPU硬件推荐参数

7B的模型,显存14GB+,推荐 NVIDIA RTX4080 16G及以上
14B级模型,显存30GB+,推荐 NVIDIA Tesla V100 32G及以上
39B级模型,显存69GB+,推荐 NVIDIA A100 80G及以上
72B级模型,显存145GB+,需要专业级显卡或者多卡叠加

(默认安装的是 ChatGLM-6B 模型,中端型显卡可以直接本地运行)

本次演示环境系统: Windows 11   、GPU: RTX 4090 24GB、 CPU: i7-12700

当然如果你需要运行更大的模型,比如你想要顺利在GPU运行本地模型的 FP16 版本,你至少需要以下的硬件配置,来保证在我们框架下能够实现 稳定连续对话

  • ChatGLM3-6B & LLaMA-7B-Chat 等 7B模型
    • 最低显存要求: 14GB
    • 推荐显卡: RTX 4080
  • Qwen-14B-Chat 等 14B模型
    • 最低显存要求: 30GB
    • 推荐显卡: V100
  • Yi-34B-Chat 等 34B模型
    • 最低显存要求: 69GB
    • 推荐显卡: A100
  • Qwen-72B-Chat 等 72B模型
    • 最低显存要求: 145GB
    • 推荐显卡:多卡 A100 以上

5.安装过程中出现的常见错误和解决方法:

1.提示 ModuleNotFoundError: No module named ‘pwd’,这个模块是Unix系统上的,Windows 上并没有,所以我们需要进行降级:

pip install langchain-community==0.0.19

2.提示错误信息 | ERROR | stderr | AssertionError: Torch not compiled with CUDA enabled

说明你没有安装CUDA环境或者你安装的PyTorch版本不支持CUDA,解决方法:

pip uninstall torch torchvision torchaudio

通过上面的命令进行卸载后重新安装官方给出的正确版本,安装命令如下:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

3.安装依赖 wavedrom 时报错 (setuptools_scm)的解决方法:

pip install setuptools_scm

安装后再重新安装依赖环境

 

 

THE END
喜欢就支持一下吧
点赞2177 分享
新的 Linux 恶意软件利用 30 个插件漏洞来入侵 WordPress 网站-零度博客

新的 Linux 恶意软件利用 30 个插件漏洞来入侵 WordPress 网站

一个以前不为人知的 Linux 恶意软件一直在利用多个过时的 WordPress 插件和主题中的 30 个漏洞来注入恶意 JavaScript。 根据防病毒供应商Dr.Web的一份报告,该恶意软件同时针对 32 位和 64 位 L...
admin的头像-零度博客admin
1.3W+6540
5款精品软件推荐!每一款都堪称神器,值得收藏 | 零度解说-零度博客
任何人都可以注册 DuckDuckGo 的隐私保护@duck.com 电子邮件地址-零度博客

任何人都可以注册 DuckDuckGo 的隐私保护@duck.com 电子邮件地址

在去年推出私人测试版的电子邮件保护服务后, DuckDuckGo 宣布它终于可供所有用户使用。电子邮件保护是一项转发服务,可为您分配一个免费的“@duck.com”电子邮件地址,并在电子邮件跟踪器进入...
admin的头像-零度博客admin
1.7W+2252
Deep Live Cam:AI 实时换脸直播,效果炸裂!堪称DeepFake杀手锏!-零度博客

Deep Live Cam:AI 实时换脸直播,效果炸裂!堪称DeepFake杀手锏!

https://youtu.be/f9bbSqKae9E   Deep Live Cam 换脸工具下载:https://www.freedidi.com/14586.html      
admin的头像-零度博客admin
2.2W+3252
澳大利亚发现罕见的新“Lagerstätte”化石遗址-零度博客

澳大利亚发现罕见的新“Lagerstätte”化石遗址

由澳大利亚博物馆(AM)和新南威尔士大学(UNSW)的古生物学家Matthew McCurry博士和堪培拉大学的Michael Frese博士领导的澳大利亚和国际科学家团队在澳大利亚新南威尔士州发现并调查了一个重要...
admin的头像-零度博客admin
1.5W+2251
Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

Meta Llama 3 正式发布!如何在线体验和本地安装部署?

Meta 宣布推出下一代开源大语言模型Llama 3,标志着AI发展新里程碑。该模型分为80亿和700亿参数两个版本,被誉为'Llama 2的重大飞跃',为大规模语言模型树立新标杆。 值得一提的是,Llama 3已与Meta...
admin的头像-零度博客admin
2.1W+2176
如何进入暗网? 暗网里的真真假假,进入暗网你必须要知道的事情!-零度博客

如何进入暗网? 暗网里的真真假假,进入暗网你必须要知道的事情!

https://youtu.be/1PT5Kcq4Ppo 想必大家应该知道暗网,但是什么是暗网呢? 所谓的暗网就是通过常规的搜索引擎或浏览器无法到达的深度网络; 在暗网里有大量你在表层网络里看不到的内容,但是大...
如何找到 Windows 10 桌面上我的電腦-零度博客

如何找到 Windows 10 桌面上我的電腦

要開啟這個設定其實不難!我们只要在桌面上右鍵點選個人化就可以進行調整, 可以把資源回收桶、控制台、使用者文件、網路呼叫出來,當然也可以全部再關閉不顯示, 接下來就讓我們看看如何找回你...
精品网站推荐!这8个都是宝藏,资源完全免费,非常好用!!| 零度解说-零度博客

精品网站推荐!这8个都是宝藏,资源完全免费,非常好用!!| 零度解说

https://youtu.be/xV_b07VKT_c ============= 8个免费精品网站:https://www.freedidi.com/11303.html
admin的头像-零度博客admin
1.4W+1528