Skip to content

ChatGLM本地模型部署

ChatGLM2-6B

ChatGLM2-6B 简介

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,具体介绍可参阅ChatGLM2-6B 项目主页

💡 注意:

ChatGLM2-6B 权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。本教程只是介绍了一种用法,无权给予任何授权!

推荐配置

依据官方数据,同样是生成 8192 长度,量化等级为 FP16 要占用 12.8GB 显存、int8 为 8.1GB 显存、int4 为 5.1GB 显存,量化后会稍微影响性能,但不多。

类型内存显存硬盘空间
fp16>=16GB>=16GB>=25GB
int8>=16GB>=9GB>=25GB
int4>=16GB>=6GB>=25GB

源码部署

💡 提示:

根据上面的环境配置配置好环境,具体教程自行百度;
可参考的部署文章
  • 1.从GitHub仓库中拉取代码
git clone https://github.com/THUDM/ChatGLM2-6B
  • 2.进入下载源码的目录
cd ChatGLM2-6B

详细部署参考以上提示的部署文章