v4.5 (#403)

2025-10-15 07:31:19 +00:00 · 2023-10-17 10:00:32 +08:00
parent dd8f2744bf
commit 3b776b6639
98 changed files with 1525 additions and 983 deletions
--- a/docSite/assets/imgs/v45-1.png
+++ b/docSite/assets/imgs/v45-1.png
--- a/docSite/assets/imgs/v45-2.png
+++ b/docSite/assets/imgs/v45-2.png
--- a/docSite/assets/imgs/v45-3.png
+++ b/docSite/assets/imgs/v45-3.png
--- a/docSite/assets/imgs/v45-4.png
+++ b/docSite/assets/imgs/v45-4.png
--- a/docSite/content/docs/custom-models/chatglm2-m3e.md
+++ b/docSite/content/docs/custom-models/chatglm2-m3e.md
@@ -63,15 +63,15 @@ Authorization 为 sk-aaabbbcccdddeeefffggghhhiiijjjkkk。model 为刚刚在 One

 ```json
 "ChatModels": [
-  //已有模型
+  //其他对话模型
  {
    "model": "chatglm2",
    "name": "chatglm2",
-    "contextMaxToken": 8000,
+    "maxToken": 8000,
+    "price": 0,
    "quoteMaxToken": 4000,
    "maxTemperature": 1.2,
-    "price": 0,
-    "defaultSystem": ""
+    "defaultSystemChatPrompt": ""
  }
 ],
 "VectorModels": [
--- a/docSite/content/docs/custom-models/chatglm2.md
+++ b/docSite/content/docs/custom-models/chatglm2.md
@@ -107,11 +107,11 @@ Authorization 为 sk-aaabbbcccdddeeefffggghhhiiijjjkkk。model 为刚刚在 One
  {
    "model": "chatglm2",
    "name": "chatglm2",
-    "contextMaxToken": 8000,
+    "maxToken": 8000,
+    "price": 0,
    "quoteMaxToken": 4000,
    "maxTemperature": 1.2,
-    "price": 0,
-    "defaultSystem": ""
+    "defaultSystemChatPrompt": ""
  }
 ]
 ```
--- a/docSite/content/docs/development/configuration.md
+++ b/docSite/content/docs/development/configuration.md
@@ -27,31 +27,75 @@ weight: 520
  },
  "ChatModels": [
    {
-      "model": "gpt-3.5-turbo",
-      "name": "GPT35-4k",
-      "contextMaxToken": 4000, // 最大token，均按 gpt35 计算
+      "model": "gpt-3.5-turbo", // 实际调用的模型
+      "name": "GPT35-4k", // 展示的名字
+      "maxToken": 4000, // 最大token，均按 gpt35 计算
      "quoteMaxToken": 2000, // 引用内容最大 token
      "maxTemperature": 1.2, // 最大温度
      "price": 0,
-      "defaultSystem": ""
+      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-3.5-turbo-16k",
      "name": "GPT35-16k",
-      "contextMaxToken": 16000,
+      "maxToken": 16000,
      "quoteMaxToken": 8000,
      "maxTemperature": 1.2,
      "price": 0,
-      "defaultSystem": ""
+      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-4",
      "name": "GPT4-8k",
-      "contextMaxToken": 8000,
+      "maxToken": 8000,
      "quoteMaxToken": 4000,
      "maxTemperature": 1.2,
      "price": 0,
-      "defaultSystem": ""
+      "defaultSystemChatPrompt": ""
+    }
+  ],
+  "QAModel": [ // QA 拆分模型
+    { 
+      "model": "gpt-3.5-turbo-16k",
+      "name": "GPT35-16k",
+      "maxToken": 16000,
+      "price": 0
+    }
+  ],
+  "ExtractModels": [ // 内容提取模型
+    { 
+      "model": "gpt-3.5-turbo-16k",
+      "name": "GPT35-16k",
+      "maxToken": 16000, 
+      "price": 0,
+      "functionCall": true, // 是否支持 function call
+      "functionPrompt": "" // 自定义非 function call 提示词
+    }
+  ],
+  "CQModels": [ // Classify Question: 问题分类模型
+    {
+      "model": "gpt-3.5-turbo-16k",
+      "name": "GPT35-16k",
+      "maxToken": 16000,
+      "price": 0,
+      "functionCall": true,
+      "functionPrompt": ""
+    },
+    {
+      "model": "gpt-4",
+      "name": "GPT4-8k",
+      "maxToken": 8000,
+      "price": 0,
+      "functionCall": true,
+      "functionPrompt": ""
+    }
+  ],
+  "QGModels": [ // Question Generation: 生成下一步指引模型
+    { 
+      "model": "gpt-3.5-turbo",
+      "name": "GPT35-4k",
+      "maxToken": 4000,
+      "price": 0
    }
  ],
  "VectorModels": [
@@ -62,36 +106,6 @@ weight: 520
      "defaultToken": 500,
      "maxToken": 3000
    }
-  ],
-  "QAModel": { // QA 拆分模型
-    "model": "gpt-3.5-turbo-16k",
-    "name": "GPT35-16k",
-    "maxToken": 16000,
-    "price": 0
-  },
-  "ExtractModel": { // 内容提取模型
-    "model": "gpt-3.5-turbo-16k",
-    "functionCall": true, // 是否使用 functionCall
-    "name": "GPT35-16k",
-    "maxToken": 16000,
-    "price": 0,
-    "prompt": ""
-  },
-  "CQModel": { // Classify Question: 问题分类模型
-    "model": "gpt-3.5-turbo-16k",
-    "functionCall": true,
-    "name": "GPT35-16k",
-    "maxToken": 16000,
-    "price": 0,
-    "prompt": ""
-  },
-  "QGModel": { // Question Generation: 生成下一步指引模型
-    "model": "gpt-3.5-turbo",
-    "name": "GPT35-4k",
-    "maxToken": 4000,
-    "price": 0,
-    "prompt": "",
-    "functionCall": false
-  }
+  ]
 }
 ```
--- a/docSite/content/docs/installation/docker.md
+++ b/docSite/content/docs/installation/docker.md
@@ -139,6 +139,21 @@ docker-compose 端口定义为：`映射端口:运行端口`。

 （自行补习 docker 基本知识）

+### relation "modeldata" does not exist
+
+PG 数据库没有连接上/初始化失败，可以查看日志。FastGPT 会在每次连接上 PG 时进行表初始化，如果报错会有对应日志。
+
+1. 检查数据库容器是否正常启动
+2. 非 docker 部署的，需要手动安装 pg vector 插件
+3. 查看 fastgpt 日志，有没有相关报错
+
+### Operation `auth_codes.findOne()` buffering timed out after 10000ms
+
+mongo连接失败，检查
+1. mongo 服务有没有起来(有些 cpu 不支持 AVX，无法用 mongo5，需要换成 mongo4.x，可以dockerhub找个最新的4.x，修改镜像版本，重新运行）
+2. 环境变量（账号密码，注意host和port）
+
+
 ### 错误排查方式

 遇到问题先按下面方式排查。
--- a/docSite/content/docs/installation/one-api.md
+++ b/docSite/content/docs/installation/one-api.md
@@ -99,12 +99,12 @@ CHAT_API_KEY=sk-xxxxxx
    {
      "model": "ERNIE-Bot", // 这里的模型需要对应 One API 的模型
      "name": "文心一言", // 对外展示的名称
-      "contextMaxToken": 4000, // 最大长下文 token，无论什么模型都按 GPT35 的计算。GPT 外的模型需要自行大致计算下这个值。可以调用官方接口去比对 Token 的倍率，然后在这里粗略计算。
+      "maxToken": 4000, // 最大长下文 token，无论什么模型都按 GPT35 的计算。GPT 外的模型需要自行大致计算下这个值。可以调用官方接口去比对 Token 的倍率，然后在这里粗略计算。
      // 例如：文心一言的中英文 token 基本是 1:1，而 GPT 的中文 Token 是 2:1，如果文心一言官方最大 Token 是 4000，那么这里就可以填 8000，保险点就填 7000.
+      "price": 0, // 1个token 价格 => 1.5 / 100000 * 1000 = 0.015元/1k token
      "quoteMaxToken": 2000, // 引用知识库的最大 Token
      "maxTemperature": 1, // 最大温度
-      "price": 0, // 1个token 价格 => 1.5 / 100000 * 1000 = 0.015元/1k token
-      "defaultSystem": "" // 默认的系统提示词
+      "defaultSystemChatPrompt": "" // 默认的系统提示词
    }
    ...
 ],
--- a/docSite/content/docs/installation/upgrading/45.md
+++ b/docSite/content/docs/installation/upgrading/45.md
@@ -0,0 +1,84 @@
+---
+title: 'V4.5(需进行较为复杂更新)'
+description: 'FastGPT V4.5 更新'
+icon: 'upgrade'
+draft: false
+toc: true
+weight: 839
+---
+
+FastGPT V4.5 引入 PgVector0.5 版本的 HNSW 索引，极大的提高了知识库检索的速度，比起`IVFFlat`索引大致有3~10倍的性能提升，可轻松实现百万数据毫秒级搜索。缺点在于构建索引的速度非常慢，4c16g 500w 组数据使用`并行构建`大约花了 48 小时。具体参数配置可参考 [PgVector官方](https://github.com/pgvector/pgvector)
+
+下面需要对数据库进行一些操作升级：
+
+## PgVector升级：Sealos 部署方案
+
+1. 点击[Sealos桌面](https://cloud.sealos.io)的数据库应用。
+2. 点击【pg】数据库的详情。
+3. 点击右上角的重启，等待重启完成。
+4. 点击左侧的一键链接，等待打开 Terminal。
+5. 依次输入下方 sql 命令
+
+```sql
+-- 升级插件名
+ALTER EXTENSION vector UPDATE;
+-- 插件是否升级成功，成功的话，vector插件版本为 0.5.0，旧版的为 0.4.1
+\dx
+
+-- 下面两个语句会设置 pg 在构建索引时可用的内存大小，需根据自身的数据库规格来动态配置，可配置为 1/4 的内存大小
+alter system set maintenance_work_mem = '2400MB'; 
+select pg_reload_conf();
+
+-- 开始构建索引，该索引构建时间非常久，直接点击右上角的叉，退出 Terminal 即可
+CREATE INDEX CONCURRENTLY vector_index ON modeldata USING hnsw (vector vector_ip_ops) WITH (m = 16, ef_construction = 64);
+-- 可以再次点击一键链接，进入 Terminal，输入下方命令，如果看到 "vector_index" hnsw (vector vector_ip_ops) WITH (m='16', ef_construction='64') 则代表构建完成（注意，后面没有 INVALID）
+\d modeldata
+```
+
+|                       |                       |
+| --------------------- | --------------------- |
+| ![](/imgs/v45-1.png) | ![](/imgs/v45-2.png) |
+| ![](/imgs/v45-3.png) | ![](/imgs/v45-4.png) |
+
+
+
+## PgVector升级：Docker-compose.yml 部署方案
+
+下面的命令是基于给的 docker-compose 模板，如果数据库账号密码更换了，请自行调整。
+
+1. 修改 `docker-compose.yml` 中pg的镜像版本，改成 `ankane/pgvector:v0.5.0` 或 `registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.5.0`
+2. 重启 pg 容器(docker-compose pull && docker-compose up -d)，等待重启完成。
+3. 进入容器: `docker exec -it pg bash`
+4. 连接数据库: `psql 'postgresql://username:password@localhost:5432/postgres'`
+5. 执行下面 sql 命令
+
+```sql
+-- 升级插件名
+ALTER EXTENSION vector UPDATE;
+-- 插件是否升级成功，成功的话，vector插件版本为 0.5.0，旧版的为 0.4.2
+\dx
+
+-- 下面两个语句会设置 pg 在构建索引时可用的内存大小，需根据自身的数据库规格来动态配置，可配置为 1/4 的内存大小
+alter system set maintenance_work_mem = '2400MB'; 
+select pg_reload_conf();
+
+-- 开始构建索引，该索引构建时间非常久，直接关掉终端即可，不要使用 ctrl+c 关闭
+CREATE INDEX CONCURRENTLY vector_index ON modeldata USING hnsw (vector vector_ip_ops) WITH (m = 16, ef_construction = 64);
+-- 可以再次连接数据库，输入下方命令。如果看到 "vector_index" hnsw (vector vector_ip_ops) WITH (m='16', ef_construction='64') 则代表构建完成（注意，后面没有 INVALID）
+\d modeldata
+```
+
+## 版本新功能介绍
+
+### Fast GPT V4.5
+
+1. 新增 - 升级 PgVector 插件，引入 HNSW 索引，极大加快的知识库搜索速度。
+2. 新增 - AI对话模块，增加【返回AI内容】选项，可控制 AI 的内容不直接返回浏览器。
+3. 新增 - 支持问题分类选择模型
+4. 优化 - TextSplitter，采用递归拆解法。
+5. 优化 - 高级编排 UX 性能
+6. 修复 - 分享链接鉴权问题
+
+## 该版本需要修改 `config.json` 文件
+
+最新配置可参考: [V45版本最新 config.json](/docs/development/configuration)
--- a/docSite/content/docs/use-cases/ai_settings.md
+++ b/docSite/content/docs/use-cases/ai_settings.md
@@ -0,0 +1,94 @@
+---
+title: "AI 高级配置说明"
+description: "FastGPT AI 高级配置说明"
+icon: "sign_language"
+draft: false
+toc: true
+weight: 310
+---
+
+在 FastGPT 的 AI 对话模块中，有一个 AI 高级配置，里面包含了 AI 模型的参数配置，本文详细介绍这些配置的含义。
+
+# 返回AI内容
+
+这是一个开关，打开的时候，当 AI 对话模块运行时，会将其输出的内容返回到浏览器（API响应）；如果关闭，AI 输出的内容不会返回到浏览器，但是生成的内容仍可以通过【AI回复】进行输出。你可以将【AI回复】连接到其他模块中。
+
+# 温度
+
+可选范围0-10，约大代表生成的内容约自由扩散，越小代表约严谨。调节能力有限，知识库问答场景通常设置为0。
+
+# 回复上限
+
+控制 AI 回复的最大 Tokens，较小的值可以一定程度上减少 AI 的废话，但也可能导致 AI 回复不完整。
+
+# 引用模板 & 引用提示词
+
+这两个参数与知识库问答场景相关，可以控制知识库相关的提示词。
+
+## AI 对话消息组成
+
+想使用明白这两个变量，首先要了解传递传递给 AI 模型的消息格式。它是一个数组，FastGPT 中这个数组的组成形式为：
+
+```json
+[
+    内置提示词（config.json 配置，一般为空）
+    系统提示词 （用户输入的提示词）
+    历史记录
+    问题（由引用提示词、引用模板和用户问题组成）
+]
+```
+
+{{% alert icon="🍅" context="success" %}}
+Tips: 可以通过点击上下文按键查看完整的
+{{% /alert %}}
+
+## 引用模板和提示词设计
+
+引用模板和引用提示词通常是成对出现，引用提示词依赖引用模板。
+
+FastGPT 知识库采用 QA 对(不一定都是问答格式，仅代表两个变量)的格式存储，在转义成字符串时候会根据**引用模板**来进行格式化。知识库包含 3 个变量： q, a, file_id, index, source，可以通过 {{q}} {{a}} {{file_id}} {{index}} {{source}} 按需引入。下面一个模板例子：
+
+**引用模板**
+
+```
+{instruction:"{{q}}",output:"{{a}}",source:"{{source}}"}
+```
+
+搜索到的知识库，会自动将 q,a,source 替换成对应的内容。每条搜索到的内容，会通过 `\n` 隔开。例如：
+```
+{instruction:"电影《铃芽之旅》的导演是谁？",output:"电影《铃芽之旅》的导演是新海诚。",source:"手动输入"}
+{instruction:"本作的主人公是谁？",output:"本作的主人公是名叫铃芽的少女。",source:""}
+{instruction:"电影《铃芽之旅》男主角是谁？",output:"电影《铃芽之旅》男主角是宗像草太，由松村北斗配音。",source:""}
+{instruction:"电影《铃芽之旅》的编剧是谁？22",output:"新海诚是本片的编剧。",source:"手动输入"}
+```
+
+**引用提示词**
+
+引用模板需要和引用提示词一起使用，提示词中可以写引用模板的格式说明以及对话的要求等。可以使用 {{quote}} 来使用 **引用模板**，使用 {{question}} 来引入问题。例如：
+
+```
+你的背景知识:
+"""
+{{quote}}
+"""
+对话要求：
+1. 背景知识是最新的，其中 instruction 是相关介绍，output 是预期回答或补充。
+2. 使用背景知识回答问题。
+3. 背景知识无法回答问题时，你可以礼貌的的回答用户问题。
+我的问题是:"{{question}}"
+```
+
+转义后则为：
+```
+你的背景知识:
+"""
+{instruction:"电影《铃芽之旅》的导演是谁？",output:"电影《铃芽之旅》的导演是新海诚。",source:"手动输入"}
+{instruction:"本作的主人公是谁？",output:"本作的主人公是名叫铃芽的少女。",source:""}
+{instruction:"电影《铃芽之旅》男主角是谁？",output:"电影《铃芽之旅》男主角是宗像草太，由松村北斗配音}
+"""
+对话要求：
+1. 背景知识是最新的，其中 instruction 是相关介绍，output 是预期回答或补充。
+2. 使用背景知识回答问题。
+3. 背景知识无法回答问题时，你可以礼貌的的回答用户问题。
+我的问题是:"{{question}}"
+```
--- a/docSite/content/docs/use-cases/prompt.md
+++ b/docSite/content/docs/use-cases/prompt.md
@@ -1,109 +0,0 @@
---
-title: "提示词 & 引用提示词"
-description: "FastGPT 提示词 & 引用提示词说明"
-icon: "sign_language"
-draft: false
-toc: true
-weight: 310
---
-
-限定词从 V4.4.3 版本后去除，被“引用提示词”和“引用模板”替代。
-
-# AI 对话消息组成
-
-传递给 AI 模型的消息是一个数组，FastGPT 中这个数组的组成形式为：
-
-```json
-[
-    内置提示词（config.json 配置，一般为空）
-    提示词 （用户输入的提示词）
-    历史记录
-    问题（会由输入的问题、引用提示词和引用模板来决定）
-]
-```
-
-{{% alert icon="🍅" context="success" %}}
-Tips: 可以通过点击上下文按键查看完整的
-{{% /alert %}}
-
-# 引用模板和提示词设计
-
-知识库采用 QA 对的格式存储，在转义成字符串时候会根据**引用模板**来进行格式化。知识库包含 3 个变量： q,a 和 source，可以通过 {{q}} {{a}} {{source}} 按需引入。下面一个模板例子：
-
-**引用模板**
-
-```
-{instruction:"{{q}}",output:"{{a}}",source:"{{source}}"}
-```
-
-搜索到的知识库，会自动将 q,a,source 替换成对应的内容。每条搜索到的内容，会通过 `\n` 隔开。例如：
-```
-{instruction:"电影《铃芽之旅》的导演是谁？",output:"电影《铃芽之旅》的导演是新海诚。",source:"手动输入"}
-{instruction:"本作的主人公是谁？",output:"本作的主人公是名叫铃芽的少女。",source:""}
-{instruction:"电影《铃芽之旅》男主角是谁？",output:"电影《铃芽之旅》男主角是宗像草太，由松村北斗配音。",source:""}
-{instruction:"电影《铃芽之旅》的编剧是谁？22",output:"新海诚是本片的编剧。",source:"手动输入"}
-```
-
-**引用提示词**
-
-引用模板需要和引用提示词一起使用，提示词中可以写引用模板的格式说明以及对话的要求等。可以使用 {{quote}} 来使用 **引用模板**，使用 {{question}} 来引入问题。例如：
-
-```
-你的背景知识:
-"""
-{{quote}}
-"""
-对话要求：
-1. 背景知识是最新的，其中 instruction 是相关介绍，output 是预期回答或补充。
-2. 使用背景知识回答问题。
-3. 背景知识无法回答问题时，你可以礼貌的的回答用户问题。
-我的问题是:"{{question}}"
-```
-
-
-# 提示词案例
-
-## 仅回复知识库里的内容
-
-**引用提示词**里添加：
-```
-你的背景知识:
-"""
-{{quote}}
-"""
-对话要求：
-1. 回答前，请先判断背景知识是否足够回答问题，如果无法回答，请直接回复：“对不起，我无法回答你的问题~”。
-2. 背景知识是最新的，其中 instruction 是相关介绍，output 是预期回答或补充。
-3. 使用背景知识回答问题。
-我的问题是:"{{question}}"
-```
-
-## 说明引用来源
-
-**引用模板:**
-
-```
-{instruction:"{{q}}",output:"{{a}}",source:"{{source}}"}
-```
-
-**引用提示词：**
-
-```
-你的背景知识:
-"""
-{{quote}}
-"""
-对话要求：
-1. 背景知识是最新的，其中 instruction 是相关介绍，output 是预期回答或补充，source是背景来源。
-2. 使用背景知识回答问题。
-3. 在回答问题后，你需要给出本次回答对应的背景来源，来源展示格式如下：
-
-“
-这是AI作答。本次知识来源：
-1. source1
-2. source2
-......
-”
-
-我的问题是:"{{question}}"
-```
--- a/docSite/content/docs/workflow/examples/fixingEvidence.md
+++ b/docSite/content/docs/workflow/examples/fixingEvidence.md
@@ -232,7 +232,7 @@ weight: 142
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",
--- a/docSite/content/docs/workflow/examples/google_search.md
+++ b/docSite/content/docs/workflow/examples/google_search.md
@@ -432,7 +432,7 @@ export default async function (ctx: FunctionContext) {
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "直接响应，无需配置",
        "type": "hidden",
        "targets": []
--- a/docSite/content/docs/workflow/examples/lab_appointment.md
+++ b/docSite/content/docs/workflow/examples/lab_appointment.md
@@ -751,7 +751,7 @@ HTTP 模块允许你调用任意 POST 类型的 HTTP 接口，从而实验一些
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "模型AI回复回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",
--- a/docSite/content/docs/workflow/examples/op_question.md
+++ b/docSite/content/docs/workflow/examples/op_question.md
@@ -313,7 +313,7 @@ weight: 144
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",
--- a/docSite/content/docs/workflow/examples/versatile_assistant.md
+++ b/docSite/content/docs/workflow/examples/versatile_assistant.md
@@ -745,7 +745,7 @@ PS2：配置中的问题分类还包含着“联网搜索”，这个是另一
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",
@@ -903,7 +903,7 @@ PS2：配置中的问题分类还包含着“联网搜索”，这个是另一
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",
@@ -1117,7 +1117,7 @@ PS2：配置中的问题分类还包含着“联网搜索”，这个是另一
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",
@@ -1484,7 +1484,7 @@ PS2：配置中的问题分类还包含着“联网搜索”，这个是另一
    "outputs": [
      {
        "key": "answerText",
-        "label": "模型回复",
+        "label": "AI回复",
        "description": "将在 stream 回复完毕后触发",
        "valueType": "string",
        "type": "source",