FastGPT/chatglm2.md at 92ebd6a0b9799af24c2ff8856b88ad5ac05663fb

mirror of https://github.com/labring/FastGPT.git synced 2025-07-22 20:37:48 +00:00

Files

archer 92ebd6a0b9 doc: m3e model

2023-08-26 22:31:21 +08:00

title, description, icon, draft, toc, weight

title	description	icon	draft	toc	weight
接入 ChatGLM2-6B	将 FastGPT 接入私有化模型 ChatGLM2-6B	model_training	false	true	753

前言

FastGPT 允许你使用自己的 OpenAI API KEY 来快速调用 OpenAI 接口，目前集成了 GPT-3.5, GPT-4 和 embedding，可构建自己的知识库。但考虑到数据安全的问题，我们并不能将所有的数据都交付给云端大模型。

那么如何在 FastGPT 上接入私有化模型呢？本文就以清华的 ChatGLM2 为例，为各位讲解如何在 FastGPT 中接入私有化模型。

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，具体介绍可参阅 ChatGLM2-6B 项目主页。

{{% alert context="warning" %}} 注意，ChatGLM2-6B 权重对学术研究完全开放，在获得官方的书面许可后，亦允许商业使用。本教程只是介绍了一种用法，无权给予任何授权！ {{% /alert %}}

然后等待模型下载，直到模型加载完毕为止。如果出现报错先问 GPT。

启动成功后应该会显示如下地址：

这里的 http://0.0.0.0:6006 就是连接地址。

然后现在回到 .env.local 文件，依照以下方式配置地址：

OPENAI_BASE_URL=http://127.0.0.1:6006/v1
CHAT_API_KEY=sk-aaabbbcccdddeeefffggghhhiiijjjkkk # 这里是你在代码中配置的 token，这里的 OPENAIKEY 可以任意填写

这样就成功接入 ChatGLM2-6B 了。

docker 部署时，给的推荐配置是组网模型，无法连接到本地的网络，以为这无法请求 0.0.0.0:6006。可以使用 host 模式，或者将模型发布到服务器上，并通过 oneapi 引入该模型。