Merge branch 'labring:main' into main

2025-07-23 05:12:39 +00:00 · 2025-01-14 10:57:57 +08:00
parent 433000acb1 781fd45e39
commit 2af9fb846d
748 changed files with 18203 additions and 7308 deletions
--- a/.github/workflows/preview-fastgpt-image.yml
+++ b/.github/workflows/preview-fastgpt-image.yml
@@ -36,7 +36,7 @@ jobs:
          password: ${{ secrets.GH_PAT }}
      - name: Set DOCKER_REPO_TAGGED based on branch or tag
        run: |
-          echo "DOCKER_REPO_TAGGED=ghcr.io/${{ github.repository_owner }}/fastgpt-pr:${{ github.event.pull_request.number }}" >> $GITHUB_ENV
+          echo "DOCKER_REPO_TAGGED=ghcr.io/${{ github.repository_owner }}/fastgpt-pr:${{ github.event.pull_request.head.sha }}" >> $GITHUB_ENV
      - name: Build image for PR
        env:
          DOCKER_REPO_TAGGED: ${{ env.DOCKER_REPO_TAGGED }}
@@ -44,13 +44,30 @@ jobs:
          docker buildx build \
          -f projects/app/Dockerfile \
          --label "org.opencontainers.image.source=https://github.com/${{ github.repository_owner }}/FastGPT" \
-          --label "org.opencontainers.image.description=fastgpt-pr imae" \
+          --label "org.opencontainers.image.description=fastgpt-pr image" \
          --label "org.opencontainers.image.licenses=Apache" \
          --push \
          --cache-from=type=local,src=/tmp/.buildx-cache \
          --cache-to=type=local,dest=/tmp/.buildx-cache \
          -t ${DOCKER_REPO_TAGGED} \
          .
+      # Add write md step after build
+      - name: Write md
+        run: |
+          echo "# 🤖 Generated by deploy action" > report.md
+          echo "📦 Preview Image: \`${DOCKER_REPO_TAGGED}\`" >> report.md
+          cat report.md
+
+      - name: Gh Rebot for Sealos
+        uses: labring/gh-rebot@v0.0.6
+        if: ${{ (github.event_name == 'pull_request_target') }}
+        with:
+          version: v0.0.6
+        env:
+          GH_TOKEN: '${{ secrets.GH_PAT }}'
+          SEALOS_TYPE: 'pr_comment'
+          SEALOS_FILENAME: 'report.md'
+          SEALOS_REPLACE_TAG: 'DEFAULT_REPLACE_DEPLOY'

  helm-check:
    runs-on: ubuntu-20.04
--- a/README.md
+++ b/README.md
@@ -58,9 +58,9 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b
   - [x] 多库复用，混用
   - [x] chunk 记录修改和删除
   - [x] 支持手动输入，直接分段，QA 拆分导入
-   - [x] 支持 txt，md，html，pdf，docx，pptx，csv，xlsx (有需要更多可 PR file loader)
-   - [x] 支持 url 读取、CSV 批量导入
+   - [x] 支持 txt，md，html，pdf，docx，pptx，csv，xlsx (有需要更多可 PR file loader)，支持 url 读取、CSV 批量导入
   - [x] 混合检索 & 重排
+   - [x] API 知识库
   - [ ] 自定义文件读取服务
   - [ ] 自定义分块服务
  
@@ -69,7 +69,7 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b
   - [x] 对话时反馈引用并可修改与删除
   - [x] 完整上下文呈现
   - [x] 完整模块中间值呈现
-   - [x] 高级编排 DeBug 模式
+   - [ ] 高级编排 DeBug 模式
  
 `4` OpenAPI 接口
   - [x] completions 接口 (chat 模式对齐 GPT 接口)
@@ -104,7 +104,7 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b
 * [快速开始本地开发](https://doc.tryfastgpt.ai/docs/development/intro/)
 * [部署 FastGPT](https://doc.tryfastgpt.ai/docs/development/sealos/)
 * [系统配置文件说明](https://doc.tryfastgpt.ai/docs/development/configuration/)
-* [多模型配置](https://doc.tryfastgpt.ai/docs/development/one-api/)
+* [多模型配置方案](https://doc.tryfastgpt.ai/docs/development/modelconfig/one-api/)
 * [版本更新/升级介绍](https://doc.tryfastgpt.ai/docs/development/upgrading/)
 * [OpenAPI API 文档](https://doc.tryfastgpt.ai/docs/development/openapi/)
 * [知识库结构详解](https://doc.tryfastgpt.ai/docs/guide/knowledge_base/rag/)
@@ -127,7 +127,6 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b

 我们正在寻找志同道合的小伙伴，加速 FastGPT 的发展。你可以通过 [FastGPT 2025 招聘](https://fael3z0zfze.feishu.cn/wiki/P7FOwEmPziVcaYkvVaacnVX1nvg)了解 FastGPT 的招聘信息。

-
 ## 💪 相关项目

 - [Laf：3 分钟快速接入三方应用](https://github.com/labring/laf)
@@ -139,19 +138,21 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b
    <img src="https://img.shields.io/badge/-返回顶部-7d09f1.svg" alt="#" align="right">
 </a>

-## 👀 其他

- [保姆级 FastGPT 教程](https://www.bilibili.com/video/BV1n34y1A7Bo/?spm_id_from=333.999.0.0)
- [接入飞书](https://www.bilibili.com/video/BV1Su4y1r7R3/?spm_id_from=333.999.0.0)
- [接入企微](https://www.bilibili.com/video/BV1Tp4y1n72T/?spm_id_from=333.999.0.0)
+## 🌿 第三方生态
+
+- [COW 个人微信/企微机器人](https://doc.tryfastgpt.ai/docs/use-cases/external-integration/onwechat/)
+- [SiliconCloud (硅基流动) —— 开源模型在线体验平台](https://cloud.siliconflow.cn/i/TR9Ym0c4)

 <a href="#readme">
    <img src="https://img.shields.io/badge/-返回顶部-7d09f1.svg" alt="#" align="right">
 </a>

-## 🌿 第三方生态
+## 👀 其他

- [COW 个人微信/企微机器人](https://doc.tryfastgpt.ai/docs/use-cases/external-integration/onwechat/)
+- [保姆级 FastGPT 教程](https://www.bilibili.com/video/BV1n34y1A7Bo/?spm_id_from=333.999.0.0)
+- [接入飞书](https://www.bilibili.com/video/BV1Su4y1r7R3/?spm_id_from=333.999.0.0)
+- [接入企微](https://www.bilibili.com/video/BV1Tp4y1n72T/?spm_id_from=333.999.0.0)

 <a href="#readme">
    <img src="https://img.shields.io/badge/-返回顶部-7d09f1.svg" alt="#" align="right">
@@ -214,4 +215,4 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b
 1. 允许作为后台服务直接商用，但不允许提供 SaaS 服务。
 2. 未经商业授权，任何形式的商用服务均需保留相关版权信息。
 3. 完整请查看 [FastGPT Open Source License](./LICENSE)
-4. 联系方式：Dennis@sealos.io，[点击查看商业版定价策略](https://doc.tryfastgpt.ai/docs/commercial)
+4. 联系方式：Dennis@sealos.io，[点击查看商业版定价策略](https://doc.tryfastgpt.ai/docs/shopping_cart/intro/)
--- a/dev.md
+++ b/dev.md
@@ -1,6 +1,6 @@
 ## Premise

-Since FastGPT is managed in the same way as monorepo, it is recommended to install 'make' first during development.
+Since FastGPT is managed in the same way as monorepo, it is recommended to install ‘make’ first during development.

 monorepo Project Name:

--- a/docSite/assets/imgs/dataset1.png
+++ b/docSite/assets/imgs/dataset1.png
--- a/docSite/assets/imgs/dataset2.png
+++ b/docSite/assets/imgs/dataset2.png
--- a/docSite/assets/imgs/dingtalk-bot-1.png
+++ b/docSite/assets/imgs/dingtalk-bot-1.png
--- a/docSite/assets/imgs/dingtalk-bot-2.png
+++ b/docSite/assets/imgs/dingtalk-bot-2.png
--- a/docSite/assets/imgs/dingtalk-bot-3.png
+++ b/docSite/assets/imgs/dingtalk-bot-3.png
--- a/docSite/assets/imgs/dingtalk-bot-4.png
+++ b/docSite/assets/imgs/dingtalk-bot-4.png
--- a/docSite/assets/imgs/dingtalk-bot-5.png
+++ b/docSite/assets/imgs/dingtalk-bot-5.png
--- a/docSite/assets/imgs/dingtalk-bot-6.png
+++ b/docSite/assets/imgs/dingtalk-bot-6.png
--- a/docSite/assets/imgs/dingtalk-bot-7.png
+++ b/docSite/assets/imgs/dingtalk-bot-7.png
--- a/docSite/assets/imgs/dingtalk-bot-8.png
+++ b/docSite/assets/imgs/dingtalk-bot-8.png
--- a/docSite/assets/imgs/image-20.png
+++ b/docSite/assets/imgs/image-20.png
--- a/docSite/assets/imgs/image-21.png
+++ b/docSite/assets/imgs/image-21.png
--- a/docSite/assets/imgs/image-22.png
+++ b/docSite/assets/imgs/image-22.png
--- a/docSite/assets/imgs/image-23.png
+++ b/docSite/assets/imgs/image-23.png
--- a/docSite/assets/imgs/image-24.png
+++ b/docSite/assets/imgs/image-24.png
--- a/docSite/assets/imgs/image-25.png
+++ b/docSite/assets/imgs/image-25.png
--- a/docSite/assets/imgs/image-26.png
+++ b/docSite/assets/imgs/image-26.png
--- a/docSite/assets/imgs/image-27.png
+++ b/docSite/assets/imgs/image-27.png
--- a/docSite/assets/imgs/image-28.png
+++ b/docSite/assets/imgs/image-28.png
--- a/docSite/assets/imgs/image-29.png
+++ b/docSite/assets/imgs/image-29.png
--- a/docSite/assets/imgs/image-30.png
+++ b/docSite/assets/imgs/image-30.png
--- a/docSite/assets/imgs/image-31.png
+++ b/docSite/assets/imgs/image-31.png
--- a/docSite/assets/imgs/image-32.png
+++ b/docSite/assets/imgs/image-32.png
--- a/docSite/assets/imgs/image-33.png
+++ b/docSite/assets/imgs/image-33.png
--- a/docSite/assets/imgs/image-34.png
+++ b/docSite/assets/imgs/image-34.png
--- a/docSite/assets/imgs/image-35.png
+++ b/docSite/assets/imgs/image-35.png
--- a/docSite/assets/imgs/image-36.png
+++ b/docSite/assets/imgs/image-36.png
--- a/docSite/assets/imgs/image-37.png
+++ b/docSite/assets/imgs/image-37.png
--- a/docSite/assets/imgs/image-38.png
+++ b/docSite/assets/imgs/image-38.png
--- a/docSite/assets/imgs/image-39.png
+++ b/docSite/assets/imgs/image-39.png
--- a/docSite/assets/imgs/image-40.png
+++ b/docSite/assets/imgs/image-40.png
--- a/docSite/assets/imgs/image-41.png
+++ b/docSite/assets/imgs/image-41.png
--- a/docSite/assets/imgs/image-42.png
+++ b/docSite/assets/imgs/image-42.png
--- a/docSite/assets/imgs/image-43.png
+++ b/docSite/assets/imgs/image-43.png
--- a/docSite/assets/imgs/image-44.png
+++ b/docSite/assets/imgs/image-44.png
--- a/docSite/assets/imgs/image-45.png
+++ b/docSite/assets/imgs/image-45.png
--- a/docSite/assets/imgs/image-46.png
+++ b/docSite/assets/imgs/image-46.png
--- a/docSite/assets/imgs/image-47.png
+++ b/docSite/assets/imgs/image-47.png
--- a/docSite/assets/imgs/image-48.png
+++ b/docSite/assets/imgs/image-48.png
--- a/docSite/assets/imgs/image-49.png
+++ b/docSite/assets/imgs/image-49.png
--- a/docSite/assets/imgs/image-50.png
+++ b/docSite/assets/imgs/image-50.png
--- a/docSite/assets/imgs/image-51.png
+++ b/docSite/assets/imgs/image-51.png
--- a/docSite/assets/imgs/image-52.png
+++ b/docSite/assets/imgs/image-52.png
--- a/docSite/assets/imgs/image-53.png
+++ b/docSite/assets/imgs/image-53.png
--- a/docSite/assets/imgs/image-54.png
+++ b/docSite/assets/imgs/image-54.png
--- a/docSite/assets/imgs/image-55.png
+++ b/docSite/assets/imgs/image-55.png
--- a/docSite/assets/imgs/image-56.png
+++ b/docSite/assets/imgs/image-56.png
--- a/docSite/assets/imgs/image-57.png
+++ b/docSite/assets/imgs/image-57.png
--- a/docSite/assets/imgs/image-58.png
+++ b/docSite/assets/imgs/image-58.png
--- a/docSite/assets/imgs/image-59.png
+++ b/docSite/assets/imgs/image-59.png
--- a/docSite/assets/imgs/image-60.png
+++ b/docSite/assets/imgs/image-60.png
--- a/docSite/assets/imgs/image-61.png
+++ b/docSite/assets/imgs/image-61.png
--- a/docSite/assets/imgs/image-62.png
+++ b/docSite/assets/imgs/image-62.png
--- a/docSite/assets/imgs/image-63.png
+++ b/docSite/assets/imgs/image-63.png
--- a/docSite/assets/imgs/image-64.png
+++ b/docSite/assets/imgs/image-64.png
--- a/docSite/assets/imgs/image-65.png
+++ b/docSite/assets/imgs/image-65.png
--- a/docSite/assets/imgs/image-66.png
+++ b/docSite/assets/imgs/image-66.png
--- a/docSite/assets/imgs/image-67.png
+++ b/docSite/assets/imgs/image-67.png
--- a/docSite/assets/imgs/image-68.png
+++ b/docSite/assets/imgs/image-68.png
--- a/docSite/assets/imgs/image-69.png
+++ b/docSite/assets/imgs/image-69.png
--- a/docSite/assets/imgs/image-70.png
+++ b/docSite/assets/imgs/image-70.png
--- a/docSite/assets/imgs/image-71.png
+++ b/docSite/assets/imgs/image-71.png
--- a/docSite/assets/imgs/image-72.png
+++ b/docSite/assets/imgs/image-72.png
--- a/docSite/assets/imgs/image-73.png
+++ b/docSite/assets/imgs/image-73.png
--- a/docSite/assets/imgs/image-74.png
+++ b/docSite/assets/imgs/image-74.png
--- a/docSite/assets/imgs/image-75.png
+++ b/docSite/assets/imgs/image-75.png
--- a/docSite/assets/imgs/image-76.png
+++ b/docSite/assets/imgs/image-76.png
--- a/docSite/assets/imgs/image-77.png
+++ b/docSite/assets/imgs/image-77.png
--- a/docSite/assets/imgs/image-78.png
+++ b/docSite/assets/imgs/image-78.png
--- a/docSite/assets/imgs/image-79.png
+++ b/docSite/assets/imgs/image-79.png
--- a/docSite/assets/imgs/image-80.png
+++ b/docSite/assets/imgs/image-80.png
--- a/docSite/assets/imgs/image-81.png
+++ b/docSite/assets/imgs/image-81.png
--- a/docSite/assets/imgs/image-82.png
+++ b/docSite/assets/imgs/image-82.png
--- a/docSite/assets/imgs/image-83.png
+++ b/docSite/assets/imgs/image-83.png
--- a/docSite/assets/imgs/image-84.png
+++ b/docSite/assets/imgs/image-84.png
--- a/docSite/assets/imgs/image-85.png
+++ b/docSite/assets/imgs/image-85.png
--- a/docSite/assets/imgs/image-86.png
+++ b/docSite/assets/imgs/image-86.png
--- a/docSite/assets/imgs/image-87.png
+++ b/docSite/assets/imgs/image-87.png
--- a/docSite/assets/imgs/searxng_plugin_guide1.png
+++ b/docSite/assets/imgs/searxng_plugin_guide1.png
--- a/docSite/assets/imgs/template_submission2.png
+++ b/docSite/assets/imgs/template_submission2.png
--- a/docSite/content/zh-cn/docs/agreement/open-source.md
+++ b/docSite/content/zh-cn/docs/agreement/open-source.md
@@ -7,7 +7,7 @@ toc: true
 weight: 1210
 ---

-FastGPT 项目在 Apache License 2.0 许可下开源，同时包含以下附加条件：
+FastGPT 项目在 Apache License 2.0 许可下开源，但包含以下附加条件：

 + FastGPT 允许被用于商业化，例如作为其他应用的“后端即服务”使用，或者作为应用开发平台提供给企业。然而，当满足以下条件时，必须联系作者获得商业许可：
   
--- a/docSite/content/zh-cn/docs/development/configuration.md
+++ b/docSite/content/zh-cn/docs/development/configuration.md
@@ -4,14 +4,14 @@ description: 'FastGPT 配置参数介绍'
 icon: 'settings'
 draft: false
 toc: true
-weight: 708
+weight: 707
 ---

 由于环境变量不利于配置复杂的内容，新版 FastGPT 采用了 ConfigMap 的形式挂载配置文件，你可以在 `projects/app/data/config.json` 看到默认的配置文件。可以参考 [docker-compose 快速部署](/docs/development/docker/) 来挂载配置文件。

-**开发环境下**，你需要将示例配置文件 `config.json` 复制成 `config.local.json` 文件才会生效。
+**开发环境下**，你需要将示例配置文件 `config.json` 复制成 `config.local.json` 文件才会生效。  

-这个配置文件中包含了系统参数和各个模型配置：
+下面配置文件示例中包含了系统参数和各个模型配置：

 ## 4.6.8+ 版本新配置文件示例

@@ -21,16 +21,16 @@ weight: 708
    "lafEnv": "https://laf.dev" // laf环境。 https://laf.run （杭州阿里云） ,或者私有化的laf环境。如果使用 Laf openapi 功能，需要最新版的 laf 。
  },
  "systemEnv": {
-    "vectorMaxProcess": 15,
-    "qaMaxProcess": 15,
+    "vectorMaxProcess": 15, // 向量处理线程数量
+    "qaMaxProcess": 15, // 问答拆分线程数量
    "tokenWorkers": 50, // Token 计算线程保持数，会持续占用内存，不能设置太大。
    "pgHNSWEfSearch": 100 // 向量搜索参数。越大，搜索越精确，但是速度越慢。设置为100，有99%+精度。
  },
  "llmModels": [
    {
+      "provider": "OpenAI", // 模型提供商，主要用于分类展示，目前已经内置提供商包括：https://github.com/labring/FastGPT/blob/main/packages/global/core/ai/provider.ts, 可 pr 提供新的提供商，或直接填写 Other
      "model": "gpt-4o-mini", // 模型名(对应OneAPI中渠道的模型名)
      "name": "gpt-4o-mini", // 模型别名
-      "avatar": "/imgs/model/openai.svg", // 模型的logo
      "maxContext": 125000, // 最大上下文
      "maxResponse": 16000, // 最大回复
      "quoteMaxToken": 120000, // 最大引用内容
@@ -38,7 +38,7 @@ weight: 708
      "charsPointsPrice": 0, // n积分/1k token（商业版）
      "censor": false, // 是否开启敏感校验（商业版）
      "vision": true, // 是否支持图片输入
-      "datasetProcess": true, // 是否设置为知识库处理模型（QA），务必保证至少有一个为true，否则知识库会报错
+      "datasetProcess": true, // 是否设置为文本理解模型（QA），务必保证至少有一个为true，否则知识库会报错
      "usedInClassify": true, // 是否用于问题分类（务必保证至少有一个为true）
      "usedInExtractFields": true, // 是否用于内容提取（务必保证至少有一个为true）
      "usedInToolCall": true, // 是否用于工具调用（务必保证至少有一个为true）
@@ -48,12 +48,13 @@ weight: 708
      "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
      "customExtractPrompt": "", // 自定义内容提取提示词
      "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
-      "defaultConfig": {} // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
+      "defaultConfig": {}, // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
+      "fieldMap": {} // 字段映射（o1 模型需要把 max_tokens 映射为 max_completion_tokens）
    },
    {
+      "provider": "OpenAI",
      "model": "gpt-4o",
      "name": "gpt-4o",
-      "avatar": "/imgs/model/openai.svg",
      "maxContext": 125000,
      "maxResponse": 4000,
      "quoteMaxToken": 120000,
@@ -71,14 +72,15 @@ weight: 708
      "customCQPrompt": "",
      "customExtractPrompt": "",
      "defaultSystemChatPrompt": "",
-      "defaultConfig": {}
+      "defaultConfig": {},
+      "fieldMap": {}
    },
    {
+      "provider": "OpenAI",
      "model": "o1-mini",
      "name": "o1-mini",
-      "avatar": "/imgs/model/openai.svg",
      "maxContext": 125000,
-      "maxResponse": 4000,
+      "maxResponse": 65000,
      "quoteMaxToken": 120000,
      "maxTemperature": 1.2,
      "charsPointsPrice": 0,
@@ -95,15 +97,17 @@ weight: 708
      "customExtractPrompt": "",
      "defaultSystemChatPrompt": "",
      "defaultConfig": {
-        "temperature": 1
+        "temperature": 1,
+        "max_tokens": null,
+        "stream": false
      }
    },
    {
+      "provider": "OpenAI",
      "model": "o1-preview",
      "name": "o1-preview",
-      "avatar": "/imgs/model/openai.svg",
      "maxContext": 125000,
-      "maxResponse": 4000,
+      "maxResponse": 32000,
      "quoteMaxToken": 120000,
      "maxTemperature": 1.2,
      "charsPointsPrice": 0,
@@ -120,27 +124,26 @@ weight: 708
      "customExtractPrompt": "",
      "defaultSystemChatPrompt": "",
      "defaultConfig": {
-        "temperature": 1
+         "temperature": 1,
+        "max_tokens": null,
+        "stream": false
      }
    }
  ],
  "vectorModels": [
    {
-      "model": "text-embedding-ada-002", // 模型名（与OneAPI对应）
-      "name": "Embedding-2", // 模型展示名
-      "avatar": "/imgs/model/openai.svg", // logo
-      "charsPointsPrice": 0, // n积分/1k token
-      "defaultToken": 700, // 默认文本分割时候的 token
-      "maxToken": 3000, // 最大 token
-      "weight": 100, // 优先训练权重
-      "defaultConfig": {}, // 自定义额外参数。例如，如果希望使用 embedding3-large 的话，可以传入 dimensions:1024，来返回1024维度的向量。（目前必须小于1536维度）
-      "dbConfig": {}, // 存储时的额外参数（非对称向量模型时候需要用到）
-      "queryConfig": {} // 参训时的额外参数
+      "provider": "OpenAI",
+      "model": "text-embedding-3-small",
+      "name": "text-embedding-3-small",
+      "charsPointsPrice": 0,
+      "defaultToken": 512,
+      "maxToken": 3000,
+      "weight": 100
    },
    {
+      "provider": "OpenAI",
      "model": "text-embedding-3-large",
      "name": "text-embedding-3-large",
-      "avatar": "/imgs/model/openai.svg",
      "charsPointsPrice": 0,
      "defaultToken": 512,
      "maxToken": 3000,
@@ -150,18 +153,22 @@ weight: 708
      }
    },
    {
-      "model": "text-embedding-3-small",
-      "name": "text-embedding-3-small",
-      "avatar": "/imgs/model/openai.svg",
-      "charsPointsPrice": 0,
-      "defaultToken": 512,
-      "maxToken": 3000,
-      "weight": 100
+      "provider": "OpenAI",
+      "model": "text-embedding-ada-002", // 模型名（与OneAPI对应）
+      "name": "Embedding-2", // 模型展示名
+      "charsPointsPrice": 0, // n积分/1k token
+      "defaultToken": 700, // 默认文本分割时候的 token
+      "maxToken": 3000, // 最大 token
+      "weight": 100, // 优先训练权重
+      "defaultConfig": {}, // 自定义额外参数。例如，如果希望使用 embedding3-large 的话，可以传入 dimensions:1024，来返回1024维度的向量。（目前必须小于1536维度）
+      "dbConfig": {}, // 存储时的额外参数（非对称向量模型时候需要用到）
+      "queryConfig": {} // 参训时的额外参数
    }
  ],
  "reRankModels": [],
  "audioSpeechModels": [
    {
+      "provider": "OpenAI",
      "model": "tts-1",
      "name": "OpenAI TTS1",
      "charsPointsPrice": 0,
@@ -176,6 +183,7 @@ weight: 708
    }
  ],
  "whisperModel": {
+    "provider": "OpenAI",
    "model": "whisper-1",
    "name": "Whisper1",
    "charsPointsPrice": 0
@@ -183,29 +191,66 @@ weight: 708
 }
 ```

-## 关于模型 logo
+##  内置的模型提供商ID

-统一放置在项目的`public/imgs/model/xxx`目录中，目前内置了以下几种，如果有需要，可以PR增加。默认logo为 Hugging face 的 logo~
+为了方便模型分类展示，FastGPT 内置了部分模型提供商的名字和 Logo。如果你期望补充提供商，可[提交 Issue](https://github.com/labring/FastGPT/issues)，并提供几个信息：

- /imgs/model/baichuan.svg - 百川智能
- /imgs/model/chatglm.svg - 智谱清言
- /imgs/model/claude.svg - claude
- /imgs/model/deepseek.svg - deepseek
- /imgs/model/doubao.svg - 火山豆包
- /imgs/model/ernie.svg - 文心一言
- /imgs/model/gemini.svg - gemini
- /imgs/model/huggingface.svg - Hugging face【默认logo】
- /imgs/model/minimax.svg - minimax
- /imgs/model/moonshot.svg - 月之暗面
- /imgs/model/openai.svg - OpenAI GPT
- /imgs/model/qwen.svg - 通义千问
- /imgs/model/sparkDesk.svg - 讯飞星火
- /imgs/model/yi.svg - 零一万物
- 
+1. 厂商官网地址
+2. 厂商 SVG logo，建议是正方形图片。

-## 特殊模型
+目前已支持的提供商, 复制 "-" 之前的字符串，作为 provider 的值。

-### ReRank 接入(私有部署)
+- OpenAI
+- Claude
+- Gemini
+- Meta
+- MistralAI
+- AliCloud - 阿里云
+- Qwen - 通义千问
+- Doubao - 豆包
+- ChatGLM - 智谱
+- DeepSeek - 深度求索
+- Moonshot - 月之暗面
+- MiniMax
+- SparkDesk - 讯飞星火
+- Hunyuan - 腾讯混元
+- Baichuan - 百川
+- Yi - 零一万物
+- Ernie - 文心一言
+- StepFun - 阶跃星辰
+- Ollama
+- BAAI - 智源研究院
+- FishAudio
+- Other - 其他
+
+
+## ReRank 模型接入
+
+由于 OneAPI 不支持 Rerank 模型，所以需要单独配置接入，这里
+
+
+### 使用硅基流动的在线模型
+
+有免费的 `bge-reranker-v2-m3` 模型可以使用。
+
+1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
+2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
+3. 修改 FastGPT 配置文件
+
+```json
+{
+    "reRankModels": [
+        {
+            "model": "BAAI/bge-reranker-v2-m3", // 这里的model需要对应 siliconflow 的模型名
+            "name": "BAAI/bge-reranker-v2-m3",
+            "requestUrl": "https://api.siliconflow.cn/v1/rerank",
+            "requestAuth": "siliconflow 上申请的 key"
+        }
+    ]
+}
+```
+
+### 私有部署模型

 请使用 4.6.6-alpha 以上版本，配置文件中的 `reRankModels` 为重排模型，虽然是数组，不过目前仅有第1个生效。

@@ -226,44 +271,3 @@ weight: 708
    ]
 }
 ```
-
-### ReRank 接入（硅基流动）
-
-有免费的 `bge-reranker-v2-m3` 模型可以使用。
-
-1. 注册硅基流动账号: https://siliconflow.cn/
-2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
-3. 修改 FastGPT 配置文件
-
-```json
-{
-    "reRankModels": [
-        {
-            "model": "BAAI/bge-reranker-v2-m3", // 这里的model需要对应 siliconflow 的模型名
-            "name": "BAAI/bge-reranker-v2-m3",
-            "requestUrl": "https://api.siliconflow.cn/v1/rerank",
-            "requestAuth": "siliconflow 上申请的 key"
-        }
-    ]
-}
-```
-
-### ReRank 接入（Cohere）
-
-这个重排模型对中文不是很好，不如 bge 的好用。
-
-1. 申请 Cohere 官方 Key: https://dashboard.cohere.com/api-keys
-2. 修改 FastGPT 配置文件
-
-```json
-{
-    "reRankModels": [
-        {
-            "model": "rerank-multilingual-v2.0", // 这里的model需要对应 cohere 的模型名
-            "name": "rerank-multilingual-v2.0",
-            "requestUrl": "https://api.cohere.ai/v1/rerank",
-            "requestAuth": "Coherer上申请的key"
-        }
-    ]
-}
-```
--- a/docSite/content/zh-cn/docs/development/custom-models/chatglm2-m3e.md
+++ b/docSite/content/zh-cn/docs/development/custom-models/chatglm2-m3e.md
@@ -23,7 +23,7 @@ FastGPT 默认使用了 OpenAI 的 LLM 模型和向量模型，如果想要私
 也可以通过环境变量引入：sk-key。有关docker环境变量引入的方法请自寻教程，此处不再赘述。
 ```

-## 接入 [One API](/docs/development/one-api/)
+## 接入 [One API](/docs/development/modelconfig/one-api/)

 为 chatglm2 和 m3e-large 各添加一个渠道，参数如下：

--- a/docSite/content/zh-cn/docs/development/custom-models/xinference.md
+++ b/docSite/content/zh-cn/docs/development/custom-models/xinference.md
@@ -102,7 +102,7 @@ xinference launch -n qwen-chat -s 14 -f pytorch

 ## 将本地模型接入 One API

-One API 的部署和接入请参考[这里](/docs/development/one-api/)。
+One API 的部署和接入请参考[这里](/docs/development/modelconfig/one-api/)。

 为 qwen1.5-chat 添加一个渠道，这里的 Base URL 需要填 Xinference 服务的端点，并且注册 qwen-chat (模型的 UID) 。

--- a/docSite/content/zh-cn/docs/development/docker.md
+++ b/docSite/content/zh-cn/docs/development/docker.md
@@ -192,7 +192,7 @@ docker restart oneapi

 可以通过`ip:3001`访问OneAPI，默认账号为`root`密码为`123456`。

-在OneApi中添加合适的AI模型渠道。[点击查看相关教程](/docs/development/one-api/)
+在OneApi中添加合适的AI模型渠道。[点击查看相关教程](/docs/development/modelconfig/one-api/)

 ### 5. 访问 FastGPT

--- a/docSite/content/zh-cn/docs/development/faq.md
+++ b/docSite/content/zh-cn/docs/development/faq.md
@@ -1,5 +1,5 @@
 ---
-weight: 749
+weight: 740
 title: "私有部署常见问题"
 description: "FastGPT 私有部署常见问题"
 icon: upgrade
@@ -19,6 +19,10 @@ images: []

 ## 二、通用问题

+### 本地部署的限制
+
+具体内容参考https://fael3z0zfze.feishu.cn/wiki/OFpAw8XzAi36Guk8dfucrCKUnjg。
+
 ### 能否纯本地运行

 可以。需要准备好向量模型和LLM模型。
@@ -41,31 +45,6 @@ images: []
 1. 问题补全需要经过一轮AI生成。
 2. 会进行3~5轮的查询，如果数据库性能不足，会有明显影响。

-### 对话接口报错或返回为空(core.chat.Chat API is error or undefined)
-
-1. 检查 AI 的 key 问题：通过 curl 请求看是否正常。务必用 stream=true 模式。并且 maxToken 等相关参数尽量一致。
-2. 如果是国内模型，可能是命中风控了。
-3. 查看模型请求日志，检查出入参数是否异常。
-
-```sh
-# curl 例子。
-curl --location --request POST 'https://xxx.cn/v1/chat/completions' \
--header 'Authorization: Bearer sk-xxxx' \
--header 'Content-Type: application/json' \
--data-raw '{
-  "model": "gpt-3.5-turbo",
-  "stream": true,
-  "temperature": 1,
-  "max_tokens": 3000,
-  "messages": [
-    {
-      "role": "user",
-      "content": "你是谁"
-    }
-  ]
-}'
-```
-
 ### 页面中可以正常回复，API 报错

 页面中是用 stream=true 模式，所以API也需要设置 stream=true 来进行测试。部分模型接口（国产居多）非 Stream 的兼容有点垃圾。
@@ -111,6 +90,13 @@ FastGPT 模型配置文件中的 model 必须与 OneAPI 渠道中的模型对应

 如果OneAPI中，没有配置对应的模型，`config.json`中也不要配置，否则容易报错。

+### 点击模型测试失败
+
+OneAPI 只会测试渠道的第一个模型，并且只会测试对话模型，向量模型无法自动测试，需要手动发起请求进行测试。[查看测试模型命令示例](/docs/development/faq/#如何检查模型问题)
+### get request url failed: Post "https://xxx dial tcp: xxxx
+
+OneAPI 与模型网络不通，需要检查网络配置。
+
 ### Incorrect API key provided: sk-xxxx.You can find your api Key at xxx

 OneAPI 的 API Key 配置错误，需要修改`OPENAI_API_KEY`环境变量，并重启容器（先 docker-compose down 然后再 docker-compose up -d 运行一次）。
@@ -126,6 +112,112 @@ OneAPI 的 API Key 配置错误，需要修改`OPENAI_API_KEY`环境变量，并

 ## 四、常见模型问题

+### 如何检查模型问题
+
+1. 私有部署模型，先确认部署的模型是否正常。
+2. 通过 CURL 请求，直接测试上游模型是否正常运行（云端模型或私有模型均进行测试）
+3. 通过 CURL 请求，请求 OneAPI 去测试模型是否正常。
+4. 在 FastGPT 中使用该模型进行测试。
+
+下面是几个测试 CURL 示例：
+
+{{< tabs tabTotal="5" >}}
+{{< tab tabName="LLM模型" >}}
+{{< markdownify >}}
+
+```bash
+curl https://api.openai.com/v1/chat/completions \
+  -H "Content-Type: application/json" \
+  -H "Authorization: Bearer $OPENAI_API_KEY" \
+  -d '{
+    "model": "gpt-4o",
+    "messages": [
+      {
+        "role": "system",
+        "content": "You are a helpful assistant."
+      },
+      {
+        "role": "user",
+        "content": "Hello!"
+      }
+    ]
+  }'
+
+```
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< tab tabName="Embedding模型" >}}
+{{< markdownify >}}
+
+```bash
+curl https://api.openai.com/v1/embeddings \
+  -H "Authorization: Bearer $OPENAI_API_KEY" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "input": "The food was delicious and the waiter...",
+    "model": "text-embedding-ada-002",
+    "encoding_format": "float"
+  }'
+```
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< tab tabName="Rerank 模型" >}}
+{{< markdownify >}}
+
+```bash
+curl --location --request POST 'https://xxxx.com/api/v1/rerank' \
+--header 'Authorization: Bearer {{ACCESS_TOKEN}}' \
+--header 'Content-Type: application/json' \
+--data-raw '{
+  "model": "bge-rerank-m3",
+  "query": "导演是谁",
+  "documents": [
+    "你是谁？\n我是电影《铃芽之旅》助手"
+  ]
+}'
+```
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< tab tabName="TTS 模型" >}}
+{{< markdownify >}}
+
+```bash
+curl https://api.openai.com/v1/audio/speech \
+  -H "Authorization: Bearer $OPENAI_API_KEY" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "model": "tts-1",
+    "input": "The quick brown fox jumped over the lazy dog.",
+    "voice": "alloy"
+  }' \
+  --output speech.mp3
+```
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< tab tabName="Whisper 模型" >}}
+{{< markdownify >}}
+
+```bash
+curl https://api.openai.com/v1/audio/transcriptions \
+  -H "Authorization: Bearer $OPENAI_API_KEY" \
+  -H "Content-Type: multipart/form-data" \
+  -F file="@/path/to/file/audio.mp3" \
+  -F model="whisper-1"
+```
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< /tabs >}}
+
 ### 报错 - 模型响应为空/模型报错

 该错误是由于 stream 模式下，oneapi 直接结束了流请求，并且未返回任何内容导致。
@@ -165,7 +257,7 @@ curl --location --request POST 'https://api.openai.com/v1/chat/completions' \

 需要模型提供商和 oneapi 同时支持工具调用才可使用，测试方法如下：

-1. 通过 `curl` 向 `oneapi` 发起第一轮 stream 模式的 tool 测试。
+##### 1. 通过 `curl` 向 `oneapi` 发起第一轮 stream 模式的 tool 测试。

 ```bash
 curl --location --request POST 'https://oneapi.xxx/v1/chat/completions' \
@@ -200,7 +292,7 @@ curl --location --request POST 'https://oneapi.xxx/v1/chat/completions' \
 }'
 ```

-2. 检查响应参数
+##### 2. 检查响应参数

 如果能正常调用工具，会返回对应 `tool_calls` 参数。

@@ -238,7 +330,7 @@ curl --location --request POST 'https://oneapi.xxx/v1/chat/completions' \
 }
 ```

-3. 通过 `curl` 向 `oneapi` 发起第二轮 stream 模式的 tool 测试。
+##### 3. 通过 `curl` 向 `oneapi` 发起第二轮 stream 模式的 tool 测试。

 第二轮请求是把工具结果发送给模型。发起后会得到模型回答的结果。

--- a/docSite/content/zh-cn/docs/development/intro.md
+++ b/docSite/content/zh-cn/docs/development/intro.md
@@ -148,7 +148,7 @@ FastGPT 在`pnpm i`后会执行`postinstall`脚本，用于自动生成`ChakraUI

 ## 加入社区

-遇到困难了吗？有任何问题吗? 加入微信群与开发者和用户保持沟通。
+遇到困难了吗？有任何问题吗? 加入飞书群与开发者和用户保持沟通。

 <img width="400px" src="https://oss.laf.run/otnvvf-imgs/fastgpt-feishu1.png" class="medium-zoom-image" />

--- a/docSite/content/zh-cn/docs/development/modelConfig/_index.md
+++ b/docSite/content/zh-cn/docs/development/modelConfig/_index.md
@@ -0,0 +1,8 @@
+---
+weight: 745
+title: '模型配置方案'
+description: '本模型配置方案'
+icon: 'code_blocks'
+draft: false
+images: []
+---
--- a/docSite/content/zh-cn/docs/development/modelConfig/one-api.md
+++ b/docSite/content/zh-cn/docs/development/modelConfig/one-api.md
@@ -0,0 +1,189 @@
+---
+title: '通过 OneAPI 接入模型'
+description: '通过 OneAPI 接入模型'
+icon: 'api'
+draft: false
+toc: true
+weight: 745
+---
+
+FastGPT 目前采用模型分离的部署方案，FastGPT 中只兼容 OpenAI 的模型规范（OpenAI 不存在的模型采用一个较为通用的规范），并通过 [One API](https://github.com/songquanpeng/one-api) 来实现对不同模型接口的统一。
+
+[One API](https://github.com/songquanpeng/one-api) 是一个 OpenAI 接口管理 & 分发系统，可以通过标准的 OpenAI API 格式访问所有的大模型，开箱即用。
+
+
+## FastGPT 与 One API 关系
+
+可以把 One API 当做一个网关，FastGPT 与 One API 关系：
+
+![](/imgs/sealos-fastgpt.webp)
+
+## 部署
+
+### Docker 版本
+
+`docker-compose.yml` 文件已加入了 OneAPI 配置，可直接使用。默认暴露在 3001 端口。
+
+### Sealos 版本
+
+* 北京区: [点击部署 OneAPI](https://hzh.sealos.run/?openapp=system-template%3FtemplateName%3Done-api)
+* 新加坡区(可用 GPT) [点击部署 OneAPI](https://cloud.sealos.io/?openapp=system-template%3FtemplateName%3Done-api)
+
+![alt text](/imgs/image-59.png)
+
+部署完后，可以打开 OneAPI 访问链接，进行下一步操作。
+
+## OneAPI 基础教程
+
+### 概念
+
+1. 渠道：
+   1. OneApi 中一个渠道对应一个 `Api Key`，这个 `Api Key` 可以是GPT、微软、ChatGLM、文心一言的。一个`Api Key`通常可以调用同一个厂商的多个模型。
+   2. One API 会根据请求传入的`模型`来决定使用哪一个`渠道`，如果一个模型对应了多个`渠道`，则会随机调用。
+2. 令牌：访问 One API 所需的凭证，只需要这`1`个凭证即可访问`One API`上配置的模型。因此`FastGPT`中，只需要配置`One API`的`baseurl`和`令牌`即可。令牌不要设置任何的模型范围权限，否则容易报错。
+
+![alt text](/imgs/image-60.png)
+
+### 大致工作流程
+
+1. 客户端请求 One API
+2. 根据请求中的 `model` 参数，匹配对应的渠道（根据渠道里的模型进行匹配，必须完全一致）。如果匹配到多个渠道，则随机选择一个（同优先级）。
+3. One API 向真正的地址发出请求。
+4. One API 将结果返回给客户端。
+
+### 1. 登录 One API
+
+![step5](/imgs/oneapi-step5.png)
+
+### 2. 创建渠道
+
+在 One API 中添加对应渠道，直接点击 【添加基础模型】，不要遗漏了向量模型（Embedding）
+
+![step6](/imgs/oneapi-step6.png)
+
+### 3. 创建令牌
+
+| | |
+| --- | --- |
+| ![step7](/imgs/oneapi-step7.png) | ![alt text](/imgs/image-61.png) |
+
+### 4. 修改账号余额
+
+One API 默认 root 用户只有 200刀，可以自行修改编辑。
+
+![alt text](/imgs/image-62.png)
+
+### 5. 修改 FastGPT 的环境变量
+
+有了 One API 令牌后，FastGPT 可以通过修改 `baseurl` 和 `key` 去请求到 One API，再由 One API 去请求不同的模型。修改下面两个环境变量：
+
+```bash
+# 务必写上 v1。如果在同一个网络内，可改成内网地址。
+OPENAI_BASE_URL=https://xxxx.cloud.sealos.io/v1
+# 下面的 key 是由 One API 提供的令牌
+CHAT_API_KEY=sk-xxxxxx
+```
+
+## 接入其他模型
+
+**以添加文心一言为例:**
+
+### 1. OneAPI 新增模型渠道
+
+类型选择百度文心千帆。
+
+![](/imgs/oneapi-demo1.png)
+
+### 2. 修改 FastGPT 配置文件
+
+可以在 `/projects/app/src/data/config.json` 里找到配置文件（本地开发需要复制成 config.local.json）,按下面内容修改配置文件，最新/更具体的配置说明，可查看[FastGPT 配置文件说明](/docs/development/configuration)。
+
+配置模型关键点在于`model` 需要与 OneAPI 渠道中的模型一致。
+
+```json
+{
+  "llmModels": [ // 语言模型配置
+    {
+      "model": "ERNIE-Bot", // 这里的模型需要对应 One API 的模型
+      "name": "文心一言", // 对外展示的名称
+      "avatar": "/imgs/model/openai.svg", // 模型的logo
+      "maxContext": 16000, // 最大上下文
+      "maxResponse": 4000, // 最大回复
+      "quoteMaxToken": 13000, // 最大引用内容
+      "maxTemperature": 1.2, // 最大温度
+      "charsPointsPrice": 0, 
+      "censor": false,
+      "vision": false, // 是否支持图片输入
+      "datasetProcess": true, // 是否设置为知识库处理模型
+      "usedInClassify": true, // 是否用于问题分类
+      "usedInExtractFields": true, // 是否用于字段提取
+      "usedInToolCall": true, // 是否用于工具调用
+      "usedInQueryExtension": true, // 是否用于问题优化
+      "toolChoice": true, // 是否支持工具选择
+      "functionCall": false, // 是否支持函数调用
+      "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
+      "customExtractPrompt": "", // 自定义内容提取提示词
+      "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
+      "defaultConfig":{}  // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
+    }
+  ],
+  "vectorModels": [ // 向量模型配置
+    {
+      "model": "text-embedding-ada-002",
+      "name": "Embedding-2",
+      "avatar": "/imgs/model/openai.svg",
+      "charsPointsPrice": 0,
+      "defaultToken": 700,
+      "maxToken": 3000,
+      "weight": 100
+    },
+  ]
+}
+```
+
+### 3. 重启 FastGPT
+
+**Docker 版本**
+
+```bash
+docker-compose down
+docker-compose up -d
+```
+
+**Sealos 版本**
+
+直接找到 FastGPT 服务，点击重启即可。
+
+
+## 其他服务商接入参考
+
+这章介绍一些提供商接入 OneAPI 的教程，配置后不要忘记修改 FastGPT 配置文件。
+
+### 阿里通义千问
+
+千问目前已经兼容 GPT 格式，可以直接选择 OpenAI 类型来接入即可。如下图，选择类型为`OpenAI`，代理填写阿里云的代理地址。
+
+目前可以直接使用阿里云的语言模型和 `text-embedding-v3` 向量模型（实测已经归一化，可直接使用）
+
+![alt text](/imgs/image-63.png)
+
+### 硅基流动 —— 开源模型大合集
+
+[硅基流动](https://cloud.siliconflow.cn/i/TR9Ym0c4) 是一个专门提供开源模型调用平台，并拥有自己的加速引擎。模型覆盖面广，非常适合低成本来测试开源模型。接入教程：
+
+1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
+2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
+3. 新增 OneAPI 渠道，选择`OpenAI`类型，代理填写：`https://api.siliconflow.cn`，密钥是第二步创建的密钥。
+
+![alt text](/imgs/image-64.png)
+
+由于 OneAPI 未内置 硅基流动 的模型名，可以通过自定义模型名称来填入，下面是获取模型名称的教程：
+
+1. 打开[硅基流动模型列表](https://siliconflow.cn/zh-cn/models)
+2. 单击模型后，会打开模型详情。
+3. 复制模型名到 OneAPI 中。
+
+| | | |
+| --- | --- | --- |
+| ![alt text](/imgs/image-65.png) | ![alt text](/imgs/image-66.png)| ![alt text](/imgs/image-67.png) |
+
--- a/docSite/content/zh-cn/docs/development/modelConfig/siliconCloud.md
+++ b/docSite/content/zh-cn/docs/development/modelConfig/siliconCloud.md
@@ -0,0 +1,220 @@
+---
+title: '通过 SiliconCloud 体验开源模型'
+description: '通过 SiliconCloud 体验开源模型'
+icon: 'api'
+draft: false
+toc: true
+weight: 746
+---
+
+[SiliconCloud(硅基流动)](https://cloud.siliconflow.cn/i/TR9Ym0c4) 是一个以提供开源模型调用为主的平台，并拥有自己的加速引擎。帮助用户低成本、快速的进行开源模型的测试和使用。实际体验下来，他们家模型的速度和稳定性都非常不错，并且种类丰富，覆盖语言、向量、重排、TTS、STT、绘图、视频生成模型，可以满足 FastGPT 中所有模型需求。
+
+如果你想部分模型使用 SiliconCloud 的模型，可额外参考[OneAPI接入硅基流动](/docs/development/modelconfig/one-api/#硅基流动--开源模型大合集)。
+
+本文会介绍完全使用 SiliconCloud 模型来部署 FastGPT 的方案。
+
+
+## 1. 注册 SiliconCloud 账号
+
+1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
+2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
+
+## 2. 修改 FastGPT 环境变量
+
+```bash
+OPENAI_BASE_URL=https://api.siliconflow.cn/v1
+# 填写 SiliconCloud 控制台提供的 Api Key
+CHAT_API_KEY=sk-xxxxxx
+```
+
+## 3. 修改 FastGPT 配置文件
+
+我们选取 SiliconCloud 中的模型作为 FastGPT 配置。这里配置了 `Qwen2.5 72b` 的纯语言和视觉模型；选择 `bge-m3` 作为向量模型；选择 `bge-reranker-v2-m3` 作为重排模型。选择 `fish-speech-1.5` 作为语音模型；选择 `SenseVoiceSmall` 作为语音输入模型。
+
+注意：ReRank 模型仍需配置一次 Api Key
+
+```json
+{
+    "llmModels": [
+    {
+      "provider": "Other", // 模型提供商，主要用于分类展示，目前已经内置提供商包括：https://github.com/labring/FastGPT/blob/main/packages/global/core/ai/provider.ts, 可 pr 提供新的提供商，或直接填写 Other
+      "model": "Qwen/Qwen2.5-72B-Instruct", // 模型名(对应OneAPI中渠道的模型名)
+      "name": "Qwen2.5-72B-Instruct", // 模型别名
+      "maxContext": 32000, // 最大上下文
+      "maxResponse": 4000, // 最大回复
+      "quoteMaxToken": 30000, // 最大引用内容
+      "maxTemperature": 1, // 最大温度
+      "charsPointsPrice": 0, // n积分/1k token（商业版）
+      "censor": false, // 是否开启敏感校验（商业版）
+      "vision": false, // 是否支持图片输入
+      "datasetProcess": true, // 是否设置为文本理解模型（QA），务必保证至少有一个为true，否则知识库会报错
+      "usedInClassify": true, // 是否用于问题分类（务必保证至少有一个为true）
+      "usedInExtractFields": true, // 是否用于内容提取（务必保证至少有一个为true）
+      "usedInToolCall": true, // 是否用于工具调用（务必保证至少有一个为true）
+      "usedInQueryExtension": true, // 是否用于问题优化（务必保证至少有一个为true）
+      "toolChoice": true, // 是否支持工具选择（分类，内容提取，工具调用会用到。）
+      "functionCall": false, // 是否支持函数调用（分类，内容提取，工具调用会用到。会优先使用 toolChoice，如果为false，则使用 functionCall，如果仍为 false，则使用提示词模式）
+      "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
+      "customExtractPrompt": "", // 自定义内容提取提示词
+      "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
+      "defaultConfig": {}, // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
+      "fieldMap": {} // 字段映射（o1 模型需要把 max_tokens 映射为 max_completion_tokens）
+    },
+    {
+      "provider": "Other",
+      "model": "Qwen/Qwen2-VL-72B-Instruct",
+      "name": "Qwen2-VL-72B-Instruct",
+      "maxContext": 32000,
+      "maxResponse": 4000,
+      "quoteMaxToken": 30000,
+      "maxTemperature": 1,
+      "charsPointsPrice": 0,
+      "censor": false,
+      "vision": true,
+      "datasetProcess": false,
+      "usedInClassify": false,
+      "usedInExtractFields": false,
+      "usedInToolCall": false,
+      "usedInQueryExtension": false,
+      "toolChoice": false,
+      "functionCall": false,
+      "customCQPrompt": "",
+      "customExtractPrompt": "",
+      "defaultSystemChatPrompt": "",
+      "defaultConfig": {}
+    }
+  ],
+  "vectorModels": [
+    {
+      "provider": "Other",
+      "model": "Pro/BAAI/bge-m3",
+      "name": "Pro/BAAI/bge-m3",
+      "charsPointsPrice": 0,
+      "defaultToken": 512,
+      "maxToken": 5000,
+      "weight": 100
+    }
+  ],
+  "reRankModels": [
+    {
+        "model": "BAAI/bge-reranker-v2-m3", // 这里的model需要对应 siliconflow 的模型名
+        "name": "BAAI/bge-reranker-v2-m3",
+        "requestUrl": "https://api.siliconflow.cn/v1/rerank",
+        "requestAuth": "siliconflow 上申请的 key"
+    }
+  ],
+  "audioSpeechModels": [
+    {
+        "model": "fishaudio/fish-speech-1.5",
+        "name": "fish-speech-1.5",
+        "voices": [
+            {
+                "label": "fish-alex",
+                "value": "fishaudio/fish-speech-1.5:alex",
+                "bufferId": "fish-alex"
+            },
+            {
+                "label": "fish-anna",
+                "value": "fishaudio/fish-speech-1.5:anna",
+                "bufferId": "fish-anna"
+            },
+            {
+                "label": "fish-bella",
+                "value": "fishaudio/fish-speech-1.5:bella",
+                "bufferId": "fish-bella"
+            },
+            {
+                "label": "fish-benjamin",
+                "value": "fishaudio/fish-speech-1.5:benjamin",
+                "bufferId": "fish-benjamin"
+            },
+            {
+                "label": "fish-charles",
+                "value": "fishaudio/fish-speech-1.5:charles",
+                "bufferId": "fish-charles"
+            },
+            {
+                "label": "fish-claire",
+                "value": "fishaudio/fish-speech-1.5:claire",
+                "bufferId": "fish-claire"
+            },
+            {
+                "label": "fish-david",
+                "value": "fishaudio/fish-speech-1.5:david",
+                "bufferId": "fish-david"
+            },
+            {
+                "label": "fish-diana",
+                "value": "fishaudio/fish-speech-1.5:diana",
+                "bufferId": "fish-diana"
+            }
+        ]
+    }
+  ],
+  "whisperModel": {
+    "model": "FunAudioLLM/SenseVoiceSmall",
+    "name": "SenseVoiceSmall",
+    "charsPointsPrice": 0
+  }
+}
+```
+
+## 4. 重启 FastGPT
+
+## 5. 体验测试
+
+### 测试对话和图片识别
+
+随便新建一个简易应用，选择对应模型，并开启图片上传后进行测试：
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-68.png) | ![alt text](/imgs/image-70.png) |
+
+可以看到，72B 的模型，性能还是非常快的，这要是本地没几个 4090，不说配置环境，输出怕都要 30s 了。
+
+### 测试知识库导入和知识库问答
+
+新建一个知识库（由于只配置了一个向量模型，页面上不会展示向量模型选择）
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-72.png) | ![alt text](/imgs/image-71.png) |
+
+导入本地文件，直接选择文件，然后一路下一步即可。79 个索引，大概花了 20s 的时间就完成了。现在我们去测试一下知识库问答。
+
+首先回到我们刚创建的应用，选择知识库，调整一下参数后即可开始对话：
+
+| | | | 
+| --- | --- | --- |
+| ![alt text](/imgs/image-73.png) | ![alt text](/imgs/image-75.png) | ![alt text](/imgs/image-76.png) |
+
+对话完成后，点击底部的引用，可以查看引用详情，同时可以看到具体的检索和重排得分：
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-77.png) | ![alt text](/imgs/image-78.png) |
+
+### 测试语音播放
+
+继续在刚刚的应用中，左侧配置中找到语音播放，点击后可以从弹窗中选择语音模型，并进行试听：
+
+![alt text](/imgs/image-79.png)
+
+### 测试语言输入
+
+继续在刚刚的应用中，左侧配置中找到语音输入，点击后可以从弹窗中开启语言输入
+
+![alt text](/imgs/image-80.png)
+
+开启后，对话输入框中，会增加一个话筒的图标，点击可进行语音输入：
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-81.png) | ![alt text](/imgs/image-82.png) |
+
+## 总结
+
+如果你想快速的体验开源模型或者快速的使用 FastGPT，不想在不同服务商申请各类 Api Key，那么可以选择 SiliconCloud 的模型先进行快速体验。
+
+如果你决定未来私有化部署模型和 FastGPT，前期可通过 SiliconCloud 进行测试验证，后期再进行硬件采购，减少 POC 时间和成本。
--- a/docSite/content/zh-cn/docs/development/one-api.md
+++ b/docSite/content/zh-cn/docs/development/one-api.md
@@ -1,179 +0,0 @@
---
-title: '使用 One API 接入 Azure、ChatGLM 和本地模型'
-description: '部署和使用 One API，实现 Azure、ChatGLM 和本地模型的接入。'
-icon: 'api'
-draft: false
-toc: true
-weight: 708
---
-
-* 默认情况下，FastGPT 只配置了 GPT 的模型，如果你需要接入其他模型，需要进行一些额外配置。
-* [One API](https://github.com/songquanpeng/one-api) 是一个 OpenAI 接口管理 & 分发系统，可以通过标准的 OpenAI API 格式访问所有的大模型，开箱即用。
-* FastGPT 可以通过接入 One API 来实现对不同大模型的支持。One API 的部署方法也很简单。
-
-## FastGPT 与 One API 关系
-
-可以把 One API 当做一个网关。
-
-![](/imgs/sealos-fastgpt.webp)
-
-## 部署
-
-### Docker 版本
-
-已加入最新的 `docker-compose.yml` 文件中。
-
-### Sealos - MySQL 版本
-
-MySQL 版本支持多实例，高并发。
-
-直接点击以下按钮即可一键部署 👇
-
-<a href="https://template.cloud.sealos.io/deploy?templateName=one-api" rel="external" target="_blank"><img src="https://cdn.jsdelivr.net/gh/labring-actions/templates@main/Deploy-on-Sealos.svg" alt="Deploy on Sealos"/></a>
-
-部署完后会跳转「应用管理」，数据库在另一个应用「数据库」中。需要等待 1~3 分钟数据库运行后才能访问成功。
-
-### Sealos - SqlLite 版本
-
-SqlLite 版本不支持多实例，适合个人小流量使用，但是价格非常便宜。
-
-**1. [点击打开 Sealos 公有云](https://cloud.sealos.io/)**
-
-**2. 打开 AppLaunchpad(应用管理) 工具**
-
-![step1](/imgs/oneapi-step1.webp)
-
-**3. 点击创建新应用**
-
-**4. 填写对应参数**
-
-镜像：ghcr.io/songquanpeng/one-api:latest
-
-![step2](/imgs/oneapi-step2.png)
-打开外网访问开关后，Sealos 会自动分配一个可访问的地址，不需要自己配置。
-
-![step3](/imgs/oneapi-step3.png)
-填写完参数后，点击右上角部署即可。环境变量：
-
-```
-SESSION_SECRET=SESSION_SECRET
-POLLING_INTERVAL=60
-BATCH_UPDATE_ENABLED=true
-BATCH_UPDATE_INTERVAL=60
-```
-
-## One API 使用教程
-
-### 概念
-
-1. 渠道：
-   1. OneApi 中一个渠道对应一个 `Api Key`，这个 `Api Key` 可以是GPT、微软、ChatGLM、文心一言的。一个`Api Key`通常可以调用同一个厂商的多个模型。
-   2. One API 会根据请求传入的`模型`来决定使用哪一个`Key`，如果一个模型对应了多个`Key`，则会随机调用。
-2. 令牌：访问 One API 所需的凭证，只需要这`1`个凭证即可访问`One API`上配置的模型。因此`FastGPT`中，只需要配置`One API`的`baseurl`和`令牌`即可。
-
-### 大致工作流程
-
-1. 客户端请求 One API
-2. 根据请求中的 `model` 参数，匹配对应的渠道（根据渠道里的模型进行匹配，必须完全一致）。如果匹配到多个渠道，则随机选择一个（同优先级）。
-3. One API 向真正的地址发出请求。
-4. One API 将结果返回给客户端。
-
-### 1. 登录 One API
-
-打开 【One API 应用详情】，找到访问地址：
-![step4](/imgs/oneapi-step4.png)
-
-登录 One API
-![step5](/imgs/oneapi-step5.png)
-
-### 2. 创建渠道和令牌
-
-在 One API 中添加对应渠道，直接点击 【添加基础模型】，不要遗漏了向量模型（Embedding）
-![step6](/imgs/oneapi-step6.png)
-
-创建一个令牌
-![step7](/imgs/oneapi-step7.png)
-
-### 3. 修改账号余额
-
-One API 默认 root 用户只有 200刀，可以自行修改编辑。
-
-### 4. 修改 FastGPT 的环境变量
-
-有了 One API 令牌后，FastGPT 可以通过修改 `baseurl` 和 `key` 去请求到 One API，再由 One API 去请求不同的模型。修改下面两个环境变量：
-
-```bash
-# 下面的地址是 Sealos 提供的，务必写上 v1， 两个项目都在 sealos 部署时候，https://xxxx.cloud.sealos.io 可以改用内网地址
-OPENAI_BASE_URL=https://xxxx.cloud.sealos.io/v1
-# 下面的 key 是由 One API 提供的令牌
-CHAT_API_KEY=sk-xxxxxx
-```
-
-## 接入其他模型
-
-**以添加文心一言为例:**
-
-### 1. One API 添加对应模型渠道
-
-![](/imgs/oneapi-demo1.png)
-
-### 2. 修改 FastGPT 配置文件
-
-可以在 `/projects/app/src/data/config.json` 里找到配置文件（本地开发需要复制成 config.local.json），配置文件中有一项是**对话模型配置**：
-
-```json
-"llmModels": [
-    ...
-    {
-      "model": "ERNIE-Bot", // 这里的模型需要对应 One API 的模型
-      "name": "文心一言", // 对外展示的名称
-      "avatar": "/imgs/model/openai.svg", // 模型的logo
-      "maxContext": 16000, // 最大上下文
-      "maxResponse": 4000, // 最大回复
-      "quoteMaxToken": 13000, // 最大引用内容
-      "maxTemperature": 1.2, // 最大温度
-      "charsPointsPrice": 0, 
-      "censor": false,
-      "vision": false, // 是否支持图片输入
-      "datasetProcess": true, // 是否设置为知识库处理模型
-      "usedInClassify": true, // 是否用于问题分类
-      "usedInExtractFields": true, // 是否用于字段提取
-      "usedInToolCall": true, // 是否用于工具调用
-      "usedInQueryExtension": true, // 是否用于问题优化
-      "toolChoice": true, // 是否支持工具选择
-      "functionCall": false, // 是否支持函数调用
-      "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
-      "customExtractPrompt": "", // 自定义内容提取提示词
-      "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
-      "defaultConfig":{}  // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
-    }
-    ...
-],
-```
-
-**添加向量模型:**
-
-```json
-"vectorModels": [
-  ......
-    {
-      "model": "text-embedding-ada-002",
-      "name": "Embedding-2",
-      "avatar": "/imgs/model/openai.svg",
-      "charsPointsPrice": 0,
-      "defaultToken": 700,
-      "maxToken": 3000,
-      "weight": 100
-    },
-  ......
-]
-```
-
-### 3. 重启 FastGPT
-
-```bash
-docker-compose down
-docker-compose up -d
-```
-
-重启 FastGPT 即可在选择文心一言模型进行对话。**添加向量模型也是类似操作，增加到 `vectorModels`里。**
--- a/docSite/content/zh-cn/docs/development/openapi/chat.md
+++ b/docSite/content/zh-cn/docs/development/openapi/chat.md
@@ -866,6 +866,8 @@ curl --location --request DELETE 'http://localhost:3000/api/core/chat/delHistory

 ### 清空所有历史记录

+仅会情况通过 API Key 创建的对话历史记录，不会清空在线使用、分享链接等其他来源的对话历史记录。
+
 {{< tabs tabTotal="3" >}}
 {{< tab tabName="请求示例" >}}
 {{< markdownify >}}
@@ -1313,6 +1315,83 @@ curl --location --request POST 'http://localhost:3000/api/core/chat/feedback/upd

 ## 猜你想问

+**4.8.16 后新版接口**
+
+新版猜你想问，必须包含 appId 和 chatId 的参数才可以进行使用。会自动根据 chatId 去拉取最近 6 轮对话记录作为上下文来引导回答。
+
+{{< tabs tabTotal="3" >}}
+{{< tab tabName="请求示例" >}}
+{{< markdownify >}}
+
+```bash
+curl --location --request POST 'http://localhost:3000/api/core/ai/agent/v2/createQuestionGuide' \
+--header 'Authorization: Bearer {{apikey}}' \
+--header 'Content-Type: application/json' \
+--data-raw '{
+    "appId": "appId",
+    "chatId": "chatId",
+    "questionGuide": {
+        "open": true,
+        "model": "GPT-4o-mini",
+        "customPrompt": "你是一个智能助手，请根据用户的问题生成猜你想问。"
+    }
+}'
+```
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< tab tabName="参数说明" >}}
+{{< markdownify >}}
+
+{{% alert icon=" " context="success" %}}
+
+| 参数名 | 类型 | 必填 | 说明 |
+| --- | --- | --- | --- |
+| appId | string | ✅ | 应用 Id |
+| chatId | string | ✅ | 对话 Id |
+| questionGuide | object |  | 自定义配置，不传的话，则会根据 appId，取最新发布版本的配置 |
+
+```ts
+type CreateQuestionGuideParams = OutLinkChatAuthProps & {
+  appId: string;
+  chatId: string;
+  questionGuide?: {
+    open: boolean;
+    model?: string;
+    customPrompt?: string;
+  };
+};
+```
+
+{{% /alert %}}
+
+{{< /markdownify >}}
+{{< /tab >}}
+
+{{< tab tabName="响应示例" >}}
+{{< markdownify >}}
+
+```json
+{
+    "code": 200,
+    "statusText": "",
+    "message": "",
+    "data": [
+        "你对AI有什么看法？",
+        "想了解AI的应用吗？",
+        "你希望AI能做什么？"
+    ]
+}
+```
+{{< /markdownify >}}
+{{< /tab >}}
+{{< /tabs >}}
+
+---
+
+**4.8.16 前旧版接口：**
+
 {{< tabs tabTotal="3" >}}
 {{< tab tabName="请求示例" >}}
 {{< markdownify >}}
@@ -1369,3 +1448,5 @@ curl --location --request POST 'http://localhost:3000/api/core/ai/agent/createQu



+
+
--- a/docSite/content/zh-cn/docs/development/openapi/dataset.md
+++ b/docSite/content/zh-cn/docs/development/openapi/dataset.md
@@ -1424,7 +1424,11 @@ curl --location --request POST 'https://api.fastgpt.in/api/core/dataset/searchTe
    "limit": 5000,
    "similarity": 0,
    "searchMode": "embedding",
-    "usingReRank": false
+    "usingReRank": false,
+
+    "datasetSearchUsingExtensionQuery": true,
+    "datasetSearchExtensionModel": "gpt-4o-mini",
+    "datasetSearchExtensionBg": ""
 }'
 ```

@@ -1441,6 +1445,9 @@ curl --location --request POST 'https://api.fastgpt.in/api/core/dataset/searchTe
 - similarity - 最低相关度（0~1，可选）
 - searchMode - 搜索模式：embedding | fullTextRecall | mixedRecall
 - usingReRank - 使用重排
+- datasetSearchUsingExtensionQuery - 使用问题优化
+- datasetSearchExtensionModel - 问题优化模型
+- datasetSearchExtensionBg - 问题优化背景描述
 {{% /alert %}}

 {{< /markdownify >}}
--- a/docSite/content/zh-cn/docs/development/sealos.md
+++ b/docSite/content/zh-cn/docs/development/sealos.md
@@ -15,7 +15,7 @@ weight: 706

 FastGPT 使用了 one-api 项目来管理模型池，其可以兼容 OpenAI 、Azure 、国内主流模型和本地模型等。

-可参考：[Sealos 快速部署 OneAPI](/docs/development/one-api)
+可参考：[Sealos 快速部署 OneAPI](/docs/development/modelconfig/one-api)


 ## 一键部署
@@ -163,4 +163,4 @@ SYSTEM_FAVICON 可以是一个网络地址

 ### One API 使用

-[参考 OneAPI 使用步骤](/docs/development/one-api/)
+[参考 OneAPI 使用步骤](/docs/development/modelconfig/one-api/)
--- a/docSite/content/zh-cn/docs/development/upgrading/43.md
+++ b/docSite/content/zh-cn/docs/development/upgrading/43.md
@@ -1,5 +1,5 @@
 ---
-title: '升级到 V4.3(需要初始化)'
+title: '升级到 V4.3(包含升级脚本)'
 description: 'FastGPT 从旧版本升级到 V4.3 操作指南'
 icon: 'upgrade'
 draft: false
--- a/docSite/content/zh-cn/docs/development/upgrading/44.md
+++ b/docSite/content/zh-cn/docs/development/upgrading/44.md
@@ -1,5 +1,5 @@
 ---
-title: '升级到 V4.4(需要初始化)'
+title: '升级到 V4.4(包含升级脚本)'
 description: 'FastGPT 从旧版本升级到 V4.4 操作指南'
 icon: 'upgrade'
 draft: false
--- a/docSite/content/zh-cn/docs/development/upgrading/441.md
+++ b/docSite/content/zh-cn/docs/development/upgrading/441.md
@@ -1,5 +1,5 @@
 ---
-title: '升级到 V4.4.1(需要初始化)'
+title: '升级到 V4.4.1(包含升级脚本)'
 description: 'FastGPT 从旧版本升级到 V4.4.1 操作指南'
 icon: 'upgrade'
 draft: false
--- a/Show More
+++ b/Show More