doc: m3e model

2026-05-11 01:02:01 +08:00 · 2023-08-26 22:31:21 +08:00
parent 0d26b1d48e
commit 92ebd6a0b9
15 changed files with 130 additions and 74 deletions
@@ -162,72 +162,7 @@ docker-compose up -d

 ### 如何自定义配置文件？

-需要在 `docker-compose.yml` 同级目录创建一个 `config.json` 文件，内容如下：
-
-```json
-{
-  "FeConfig": {
-    "show_emptyChat": true,
-    "show_register": false,
-    "show_appStore": false,
-    "show_userDetail": false,
-    "show_git": true,
-    "systemTitle": "FastGPT",
-    "authorText": "Made by FastGPT Team.",
-    "gitLoginKey": "",
-    "scripts": []
-  },
-  "SystemParams": {
-    "gitLoginSecret": "",
-    "vectorMaxProcess": 15,
-    "qaMaxProcess": 15,
-    "pgIvfflatProbe": 20
-  },
-  "plugins": {},
-  "ChatModels": [
-    {
-      "model": "gpt-3.5-turbo",
-      "name": "GPT35-4k",
-      "contextMaxToken": 4000,
-      "quoteMaxToken": 2000,
-      "maxTemperature": 1.2,
-      "price": 0,
-      "defaultSystem": ""
-    },
-    {
-      "model": "gpt-3.5-turbo-16k",
-      "name": "GPT35-16k",
-      "contextMaxToken": 16000,
-      "quoteMaxToken": 8000,
-      "maxTemperature": 1.2,
-      "price": 0,
-      "defaultSystem": ""
-    },
-    {
-      "model": "gpt-4",
-      "name": "GPT4-8k",
-      "contextMaxToken": 8000,
-      "quoteMaxToken": 4000,
-      "maxTemperature": 1.2,
-      "price": 0,
-      "defaultSystem": ""
-    }
-  ],
-  "QAModel": {
-    "model": "gpt-3.5-turbo-16k",
-    "name": "GPT35-16k",
-    "maxToken": 16000,
-    "price": 0
-  },
-  "VectorModels": [
-    {
-      "model": "text-embedding-ada-002",
-      "name": "Embedding-2",
-      "price": 0
-    }
-  ]
-}
-```
+需要在 `docker-compose.yml` 同级目录创建一个 `config.json` 文件，内容参考: [配置详解](/docs/installation/reference/configuration/)

 然后修改 `docker-compose.yml` 中的 `fastgpt` 容器内容，增加挂载选项即可：

@@ -1,71 +0,0 @@
---
-title: '接入 ChatGLM2-6B'
-description: ' 将 FastGPT 接入私有化模型 ChatGLM2-6B'
-icon: 'model_training'
-draft: false
-toc: true
-weight: 753
---
-
-## 前言
-
-FastGPT 允许你使用自己的 OpenAI API KEY 来快速调用 OpenAI 接口，目前集成了 GPT-3.5, GPT-4 和 embedding，可构建自己的知识库。但考虑到数据安全的问题，我们并不能将所有的数据都交付给云端大模型。
-
-那么如何在 FastGPT 上接入私有化模型呢？本文就以清华的 ChatGLM2 为例，为各位讲解如何在 FastGPT 中接入私有化模型。
-
-## ChatGLM2-6B 简介
-
-ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，具体介绍可参阅 [ChatGLM2-6B 项目主页](https://github.com/THUDM/ChatGLM2-6B)。
-
-{{% alert context="warning" %}}
-注意，ChatGLM2-6B 权重对学术研究完全开放，在获得官方的书面许可后，亦允许商业使用。本教程只是介绍了一种用法，无权给予任何授权！
-{{% /alert %}}
-
-## 推荐配置
-
-依据官方数据，同样是生成 8192 长度，量化等级为 FP16 要占用 12.8GB 显存、int8 为 8.1GB 显存、int4 为 5.1GB 显存，量化后会稍微影响性能，但不多。
-
-因此推荐配置如下：
-
-{{< table "table-hover table-striped" >}}
-| 类型 | 内存 | 显存 | 硬盘空间 | 启动命令 |
-|------|---------|---------|----------|--------------------------|
-| fp16 | >=16GB | >=16GB | >=25GB | python openai_api.py 16 |
-| int8 | >=16GB | >=9GB | >=25GB | python openai_api.py 8 |
-| int4 | >=16GB | >=6GB | >=25GB | python openai_api.py 4 |
-{{< /table >}}
-
-## 环境配置
-
- Python 3.8.10
- CUDA 11.8
- 科学上网环境
-
-## 部署步骤
-
-1. 根据上面的环境配置配置好环境，具体教程自行 GPT；
-2. 下载 [python 文件](https://github.com/labring/FastGPT/blob/main/files/models/ChatGLM2/openai_api.py)
-3. 在命令行输入命令 `pip install -r requirments.txt`；
-4. 打开你需要启动的 py 文件，在代码的第 76 行配置 token，这里的 token 只是加一层验证，防止接口被人盗用；
-5. 执行命令 `python openai_api.py 16`。这里的数字根据上面的配置进行选择。
-
-然后等待模型下载，直到模型加载完毕为止。如果出现报错先问 GPT。
-
-启动成功后应该会显示如下地址：
-
-![](/imgs/chatglm2.png)
-
-> 这里的 `http://0.0.0.0:6006` 就是连接地址。
-
-然后现在回到 .env.local 文件，依照以下方式配置地址：
-
-```bash
-OPENAI_BASE_URL=http://127.0.0.1:6006/v1
-CHAT_API_KEY=sk-aaabbbcccdddeeefffggghhhiiijjjkkk # 这里是你在代码中配置的 token，这里的 OPENAIKEY 可以任意填写
-```
-
-这样就成功接入 ChatGLM2-6B 了。
-
-## 注意
-
-1. docker 部署时，给的推荐配置是组网模型，无法连接到本地的网络，以为这无法请求 0.0.0.0:6006。可以使用 host 模式，或者将模型发布到服务器上，并通过 oneapi 引入该模型。
@@ -106,7 +106,9 @@ weight: 751
    {
      "model": "text-embedding-ada-002",
      "name": "Embedding-2",
-      "price": 0
+      "price": 0,
+      "defaultToken": 500,
+      "maxToken": 3000
    }
  ]
 }
@@ -0,0 +1,24 @@
+---
+title: '升级到 V4.2.1'
+description: 'FastGPT 从旧版本升级到 V4.2.1 操作指南'
+icon: 'upgrade'
+draft: false
+toc: true
+weight: 763
+---
+
+私有部署，如果添加了配置文件，需要在配置文件中修改 `VectorModels` 字段。增加 defaultToken 和 maxToken，分别对应直接分段时的默认 token 数量和该模型支持的 token 上限（通常不建议超过 3000）
+
+```json
+"VectorModels": [
+    {
+      "model": "text-embedding-ada-002",
+      "name": "Embedding-2",
+      "price": 0,
+      "defaultToken": 500,
+      "maxToken": 3000
+    }
+]
+```
+
+改动目的是，我们认为不需要留有选择余地，选择一个最合适的模型去进行任务即可。