New document (#5299)

* add new doc (#5175) Co-authored-by: dreamer6680 <146868355@qq.com> * Test docs (#5235) * fix: change the page of doc * chore: add new dependencies, update global styles/layout, optimize docs, add Feishu & GitHub icons, update API examples * fix: docs/index 404 not found * Update environment variable names, optimize styles, add new API routes, fix component styles, adjust documentation, and update GitHub and Feishu icons * update readme * feat: add a linkfastgpt compontent * feat: update new doc * fix:remove unuse page and redirect homepage to docs (#5288) * fix：remove some unuse doc * fix: redirect homepage to doc * git ignore * fix:navbar to index (#5295) * sidbar * fix: navtab unlight (#5298) * doc --------- Co-authored-by: dreamer6680 <1468683855@qq.com> Co-authored-by: dreamer6680 <146868355@qq.com>
2025-12-19 01:09:49 +08:00 · 2025-07-23 21:35:03 +08:00
parent ce9ec1bf57
commit fe7abf22a9
895 changed files with 36297 additions and 56 deletions
--- a/document/content/docs/introduction/development/modelConfig/ai-proxy.mdx
+++ b/document/content/docs/introduction/development/modelConfig/ai-proxy.mdx
@@ -0,0 +1,125 @@
+---
+title: 通过 AI Proxy 接入模型
+description: 通过 AI Proxy 接入模型
+---
+
+从 `FastGPT 4.8.23` 版本开始，引入 AI Proxy 来进一步方便模型的配置。
+
+AI Proxy 与 One API 类似，也是作为一个 OpenAI 接口管理 & 分发系统，可以通过标准的 OpenAI API 格式访问所有的大模型，开箱即用。
+
+## 部署
+
+### Docker 版本
+
+`docker-compose.yml` 文件已加入了 AI Proxy 配置，可直接使用。[点击查看最新的 yml 配置](https://raw.githubusercontent.com/labring/FastGPT/main/deploy/docker/docker-compose-pgvector.yml)
+
+从旧版升级的用户，可以复制 yml 里，ai proxy 的配置，加入到旧的 yml 文件中。
+
+## 运行原理
+
+AI proxy 核心模块: 
+
+1. 渠道管理：管理各家模型提供商的 API Key 和可用模型列表。
+2. 模型调用：根据请求的模型，选中对应的渠道；根据渠道的 API 格式，构造请求体，发送请求；格式化响应体成标准格式返回。
+3. 调用日志：详细记录模型调用的日志，并在错误时候可以记录其入参和报错信息，方便排查。
+
+运行流程：
+
+![aiproxy12](/imgs/aiproxy1.png)
+
+## 在 FastGPT 中使用
+
+AI proxy 相关功能，可以在`账号-模型提供商`页面找到。
+
+### 1. 创建渠道
+
+在`模型提供商`的配置页面，点击`模型渠道`，进入渠道配置页面
+
+![aiproxy1](/imgs/aiproxy-1.png)
+
+点击右上角的“新增渠道”，即可进入渠道配置页面
+
+![aiproxy2](/imgs/aiproxy-2.png)
+
+以阿里云的模型为例，进行如下配置
+
+![aiproxy3](/imgs/aiproxy-3.png)
+
+1. 渠道名：展示在外部的渠道名称，仅作标识;
+2. 厂商：模型对应的厂商，不同厂商对应不同的默认地址和 API 密钥格式;
+3. 模型：当前渠道具体可以使用的模型，系统内置了主流的一些模型，如果下拉框中没有想要的选项，可以点击“新增模型”，[增加自定义模型](/docs/development/modelconfig/intro/#新增自定义模型);
+4. 模型映射：将 FastGPT 请求的模型，映射到具体提供的模型上。例如：
+   
+```json
+{
+    "gpt-4o-test": "gpt-4o",
+}
+```
+
+FatGPT 中的模型为 `gpt-4o-test`，向 AI Proxy 发起请求时也是 `gpt-4o-test`。AI proxy 在向上游发送请求时，实际的`model`为 `gpt-4o`。
+
+5. 代理地址：具体请求的地址，系统给每个主流渠道配置了默认的地址，如果无需改动则不用填。
+6. API 密钥：从模型厂商处获取的 API 凭证。注意部分厂商需要提供多个密钥组合，可以根据提示进行输入。
+
+最后点击“新增”，就能在“模型渠道”下看到刚刚配置的渠道
+
+![aiproxy4](/imgs/aiproxy-4.png)
+
+### 2. 渠道测试
+
+然后可以对渠道进行测试，确保配置的模型有效
+
+![aiproxy5](/imgs/aiproxy-5.png)
+
+点击“模型测试”，可以看到配置的模型列表，点击“开始测试”
+
+![aiproxy6](/imgs/aiproxy-6.png)
+
+等待模型测试完成后，会输出每个模型的测试结果以及请求时长
+
+![aiproxy7](/imgs/aiproxy-7.png)
+
+### 3. 启用模型
+
+最后在`模型配置`中，可以选择启用对应的模型，这样就能在平台中使用了，更多模型配置可以参考[模型配置](/docs/development/modelconfig/intro)
+
+![aiproxy8](/imgs/aiproxy-8.png)
+
+## 其他功能介绍
+
+### 优先级
+
+范围1～100。数值越大，越容易被优先选中。
+
+![aiproxy9](/imgs/aiproxy-9.png)
+
+### 启用/禁用
+
+在渠道右侧的控制菜单中，还可以控制渠道的启用或禁用，被禁用的渠道将无法再提供模型服务
+
+![aiproxy10](/imgs/aiproxy-10.png)
+
+### 调用日志
+
+在 `调用日志` 页面，会展示发送到模型处的请求记录，包括具体的输入输出 tokens、请求时间、请求耗时、请求地址等等。错误的请求，则会详细的入参和错误信息，方便排查，但仅会保留 1 小时(环境变量里可配置)。
+
+![aiproxy11](/imgs/aiproxy-11.png)
+
+## 从 OneAPI 迁移到 AI Proxy
+
+可以从任意终端，发起 1 个 HTTP 请求。其中 `{{host}}` 替换成 AI Proxy 地址，`{{admin_key}}` 替换成 AI Proxy 中 `ADMIN_KEY` 的值。
+
+Body 参数 `dsn` 为 OneAPI 的 mysql 连接串。
+
+```bash
+curl --location --request POST '{{host}}/api/channels/import/oneapi' \
+--header 'Authorization: Bearer {{admin_key}}' \
+--header 'Content-Type: application/json' \
+--data-raw '{
+    "dsn": "mysql://root:s5mfkwst@tcp(dbconn.sealoshzh.site:33123)/mydb"
+}'
+```
+
+执行成功的情况下会返回 "success": true
+
+脚本目前不是完全准，仅是简单的做数据映射，主要是迁移`代理地址`、`模型`和`API 密钥`，建议迁移后再进行手动检查。
--- a/document/content/docs/introduction/development/modelConfig/intro.mdx
+++ b/document/content/docs/introduction/development/modelConfig/intro.mdx
@@ -0,0 +1,464 @@
+---
+title: FastGPT 模型配置说明
+description: FastGPT 模型配置说明
+---
+
+import { Alert } from '@/components/docs/Alert';
+
+在 4.8.20 版本以前，FastGPT 模型配置在 `config.json` 文件中声明，你可以在 https://github.com/labring/FastGPT/blob/main/projects/app/data/model.json 中找到旧版的配置文件示例。
+
+从 4.8.20 版本开始，你可以直接在 FastGPT 页面中进行模型配置，并且系统内置了大量模型，无需从 0 开始配置。下面介绍模型配置的基本流程：
+
+## 配置模型
+
+### 1. 对接模型提供商
+
+#### AI Proxy
+
+从 4.8.23 版本开始， FastGPT 支持在页面上配置模型提供商，即使用 [AI Proxy 接入教程](/docs/development/modelconfig/ai-proxy) 来进行模型聚合，从而可以对接更多模型提供商。
+
+#### One API
+
+也可以使用 [OneAPI 接入教程](/docs/development/modelconfig/one-api)。你需要先在各服务商申请好 API 接入 OneAPI 后，才能在 FastGPT 中使用这些模型。示例流程如下：
+
+![alt text](/imgs/image-95.png)
+
+除了各模型官方的服务外，还有一些第三方服务商提供模型接入服务，当然你也可以用 Ollama 等来部署本地模型，最终都需要接入 OneAPI，下面是一些第三方服务商：
+
+<Alert icon=" " context="info">
+- [SiliconCloud(硅基流动)](https://cloud.siliconflow.cn/i/TR9Ym0c4): 提供开源模型调用的平台。
+- [Sealos AIProxy](https://hzh.sealos.run/?uid=fnWRt09fZP&openapp=system-aiproxy): 提供国内各家模型代理，无需逐一申请 api。
+</Alert>
+
+在 OneAPI 配置好模型后，你就可以打开 FastGPT 页面，启用对应模型了。
+
+### 2. 配置介绍
+
+<Alert icon="🤖" context="success">
+注意：
+1. 目前语音识别模型和重排模型仅会生效一个，所以配置时候，只需要配置一个即可。  
+2. 系统至少需要一个语言模型和一个索引模型才能正常使用。
+</Alert>
+
+#### 核心配置
+
+- 模型 ID：接口请求时候，Body 中`model`字段的值，全局唯一。
+- 自定义请求地址/Key：如果需要绕过`OneAPI`，可以设置自定义请求地址和 Token。一般情况下不需要，如果 OneAPI 不支持某些模型，可以使用该特性。
+
+#### 模型类型
+
+1. 语言模型 - 进行文本对话，多模态模型支持图片识别。
+2. 索引模型 - 对文本块进行索引，用于相关文本检索。
+3. 重排模型 - 对检索结果进行重排，用于优化检索排名。
+4. 语音合成 - 将文本转换为语音。
+5. 语音识别 - 将语音转换为文本。
+
+#### 启用模型
+
+系统内置了目前主流厂商的模型，如果你不熟悉配置，直接点击`启用`即可，需要注意的是，`模型 ID`需要和 OneAPI 中渠道的`模型`一致。
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-91.png) | ![alt text](/imgs/image-92.png) |
+
+#### 修改模型配置
+
+点击模型右侧的齿轮即可进行模型配置，不同类型模型的配置有区别。
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-93.png) | ![alt text](/imgs/image-94.png) |
+
+## 新增自定义模型
+
+如果系统内置的模型无法满足你的需求，你可以添加自定义模型。自定义模型中，如果`模型 ID`与系统内置的模型 ID 一致，则会被认为是修改系统模型。
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-96.png) | ![alt text](/imgs/image-97.png) |
+
+#### 通过配置文件配置
+
+如果你觉得通过页面配置模型比较麻烦，你也可以通过配置文件来配置模型。或者希望快速将一个系统的配置，复制到另一个系统，也可以通过配置文件来实现。
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-98.png) | ![alt text](/imgs/image-99.png) |
+
+**语言模型字段说明：**
+
+```json
+{
+    "model": "模型 ID",
+    "metadata": {
+        "isCustom": true, // 是否为自定义模型
+        "isActive": true, // 是否启用
+        "provider": "OpenAI", // 模型提供商，主要用于分类展示，目前已经内置提供商包括：https://github.com/labring/FastGPT/blob/main/packages/global/core/ai/provider.ts, 可 pr 提供新的提供商，或直接填写 Other
+        "model": "gpt-4o-mini", // 模型ID(对应OneAPI中渠道的模型名)
+        "name": "gpt-4o-mini", // 模型别名
+        "maxContext": 125000, // 最大上下文
+        "maxResponse": 16000, // 最大回复
+        "quoteMaxToken": 120000, // 最大引用内容
+        "maxTemperature": 1.2, // 最大温度
+        "charsPointsPrice": 0, // n积分/1k token（商业版）
+        "censor": false, // 是否开启敏感校验（商业版）
+        "vision": true, // 是否支持图片输入
+        "datasetProcess": true, // 是否设置为文本理解模型（QA），务必保证至少有一个为true，否则知识库会报错
+        "usedInClassify": true, // 是否用于问题分类（务必保证至少有一个为true）
+        "usedInExtractFields": true, // 是否用于内容提取（务必保证至少有一个为true）
+        "usedInToolCall": true, // 是否用于工具调用（务必保证至少有一个为true）
+        "toolChoice": true, // 是否支持工具选择（分类，内容提取，工具调用会用到。）
+        "functionCall": false, // 是否支持函数调用（分类，内容提取，工具调用会用到。会优先使用 toolChoice，如果为false，则使用 functionCall，如果仍为 false，则使用提示词模式）
+        "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
+        "customExtractPrompt": "", // 自定义内容提取提示词
+        "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
+        "defaultConfig": {}, // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
+        "fieldMap": {} // 字段映射（o1 模型需要把 max_tokens 映射为 max_completion_tokens）
+    }
+}
+```
+
+**索引模型字段说明:**
+
+```json
+{
+    "model": "模型 ID",
+    "metadata": {
+        "isCustom": true, // 是否为自定义模型
+        "isActive": true, // 是否启用
+        "provider": "OpenAI", // 模型提供商
+        "model": "text-embedding-3-small", // 模型ID
+        "name": "text-embedding-3-small", // 模型别名
+        "charsPointsPrice": 0, // n积分/1k token
+        "defaultToken": 512, // 默认文本分割时候的 token
+        "maxToken": 3000 // 最大 token
+    }
+}
+```
+
+**重排模型字段说明:**
+
+```json
+{
+    "model": "模型 ID",
+    "metadata": {
+        "isCustom": true, // 是否为自定义模型
+        "isActive": true, // 是否启用
+        "provider": "BAAI", // 模型提供商
+        "model": "bge-reranker-v2-m3", // 模型ID
+        "name": "ReRanker-Base", // 模型别名
+        "requestUrl": "", // 自定义请求地址
+        "requestAuth": "", // 自定义请求认证
+        "type": "rerank" // 模型类型
+    }
+}
+```
+
+**语音合成模型字段说明:**
+
+```json
+{
+    "model": "模型 ID",
+    "metadata": {
+      "isActive": true, // 是否启用
+      "isCustom": true, // 是否为自定义模型
+      "type": "tts", // 模型类型
+      "provider": "FishAudio", // 模型提供商
+      "model": "fishaudio/fish-speech-1.5", // 模型ID
+      "name": "fish-speech-1.5", // 模型别名
+      "voices": [ // 音色
+        {
+          "label": "fish-alex", // 音色名称
+          "value": "fishaudio/fish-speech-1.5:alex", // 音色ID
+        },
+        {
+          "label": "fish-anna", // 音色名称
+          "value": "fishaudio/fish-speech-1.5:anna", // 音色ID
+        }
+      ],
+      "charsPointsPrice": 0 // n积分/1k token
+    }
+}
+```
+
+**语音识别模型字段说明:**
+
+```json
+{
+    "model": "whisper-1",
+    "metadata": {
+      "isActive": true, // 是否启用
+      "isCustom": true, // 是否为自定义模型
+      "provider": "OpenAI", // 模型提供商
+      "model": "whisper-1", // 模型ID
+      "name": "whisper-1", // 模型别名
+      "charsPointsPrice": 0, // n积分/1k token
+      "type": "stt" // 模型类型
+    }
+}
+```
+
+## 模型测试
+
+FastGPT 页面上提供了每类模型的简单测试，可以初步检查模型是否正常工作，会实际按模板发送一个请求。
+
+![alt text](/imgs/image-105.png)
+
+## 特殊接入示例
+
+### ReRank 模型接入
+
+由于 OneAPI 不支持 Rerank 模型，所以需要单独配置。FastGPT 中，模型配置支持自定义请求地址，可以绕过 OneAPI，直接向提供商发起请求，可以利用这个特性来接入 Rerank 模型。
+
+
+#### 使用硅基流动的在线模型
+
+有免费的 `bge-reranker-v2-m3` 模型可以使用。
+
+1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
+2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
+3. 打开 FastGPT 模型配置，新增一个`BAAI/bge-reranker-v2-m3`的重排模型（如果系统内置了，也可以直接变更,无需新增）。
+
+![alt text](/imgs/image-101.png)
+
+#### 私有部署模型
+
+[点击查看部署 ReRank 模型教程](/docs/development/custom-models/bge-rerank/)
+
+### 接入语音识别模型
+
+OneAPI 的语言识别接口，无法正确的识别其他模型（会始终识别成 whisper-1），所以如果想接入其他模型，可以通过自定义请求地址来实现。例如，接入硅基流动的 `FunAudioLLM/SenseVoiceSmall` 模型，可以参考如下配置：
+
+点击模型编辑：
+
+![alt text](/imgs/image-106.png)
+
+填写硅基流动的地址：`https://api.siliconflow.cn/v1/audio/transcriptions`，并填写硅基流动的 API Key。
+
+![alt text](/imgs/image-107.png)
+
+## 其他配置项说明
+
+### 自定义请求地址
+
+如果填写了该值，则可以允许你绕过 OneAPI，直接向自定义请求地址发起请求。需要填写完整的请求地址，例如：
+
+- LLM: [host]/v1/chat/completions
+- Embedding: [host]/v1/embeddings
+- STT: [host]/v1/audio/transcriptions
+- TTS: [host]/v1/audio/speech
+- Rerank: [host]/v1/rerank
+
+自定义请求 Key，则是向自定义请求地址发起请求时候，携带请求头：Authorization: Bearer xxx 进行请求。
+
+所有接口均遵循 OpenAI 提供的模型格式，可参考 [OpenAI API 文档](https://platform.openai.com/docs/api-reference/introduction) 进行配置。
+
+由于 OpenAI 没有提供 ReRank 模型，遵循的是 Cohere 的格式。[点击查看接口请求示例](/docs/development/faq/#如何检查模型问题)
+
+
+### 模型价格配置
+
+商业版用户可以通过配置模型价格，来进行账号计费。系统包含两种计费模式：按总 tokens 计费和输入输出 Tokens 分开计费。
+
+如果需要配置`输入输出 Tokens 分开计费模式`，则填写`模型输入价格`和`模型输出价格`两个值。
+如果需要配置`按总 tokens 计费模式`，则填写`模型综合价格`一个值。
+
+## 如何提交内置模型
+
+由于模型更新非常频繁，官方不一定及时更新，如果未能找到你期望的内置模型，你可以[提交 Issue](https://github.com/labring/FastGPT/issues)，提供模型的名字和对应官网。或者直接[提交 PR](https://github.com/labring/FastGPT/pulls)，提供模型配置。
+
+
+### 添加模型提供商
+
+如果你需要添加模型提供商，需要修改以下代码：
+
+1. FastGPT/packages/web/components/common/Icon/icons/model - 在此目录下，添加模型提供商的 svg 头像地址。
+2. 在 FastGPT 根目录下，运行`pnpm initIcon`，将图片加载到配置文件中。
+3. FastGPT/packages/global/core/ai/provider.ts - 在此文件中，追加模型提供商的配置。
+
+### 添加模型
+
+你可以在`FastGPT/packages/service/core/ai/config/provider`目录下，找对应模型提供商的配置文件，并追加模型配置。请自行全文检查，`model`字段，必须在所有模型中唯一。具体配置字段说明，参考[模型配置字段说明](/docs/development/modelconfig/intro/#通过配置文件配置)
+
+## 旧版模型配置说明
+
+配置好 OneAPI 后，需要在`config.json`文件中，手动的增加模型配置，并重启。
+
+由于环境变量不利于配置复杂的内容，FastGPT 采用了 ConfigMap 的形式挂载配置文件，你可以在 `projects/app/data/config.json` 看到默认的配置文件。可以参考 [docker-compose 快速部署](/docs/development/docker/) 来挂载配置文件。
+
+**开发环境下**，你需要将示例配置文件 `config.json` 复制成 `config.local.json` 文件才会生效。  
+**Docker部署**，修改`config.json` 文件，需要重启容器。
+
+下面配置文件示例中包含了系统参数和各个模型配置：
+
+```json
+{
+  "feConfigs": {
+    "lafEnv": "https://laf.dev" // laf环境。 https://laf.run （杭州阿里云） ,或者私有化的laf环境。如果使用 Laf openapi 功能，需要最新版的 laf 。
+  },
+  "systemEnv": {
+    "vectorMaxProcess": 15, // 向量处理线程数量
+    "qaMaxProcess": 15, // 问答拆分线程数量
+    "tokenWorkers": 50, // Token 计算线程保持数，会持续占用内存，不能设置太大。
+    "hnswEfSearch": 100 // 向量搜索参数，仅对 PG 和 OB 生效。越大，搜索越精确，但是速度越慢。设置为100，有99%+精度。
+  },
+  "llmModels": [
+    {
+      "provider": "OpenAI", // 模型提供商，主要用于分类展示，目前已经内置提供商包括：https://github.com/labring/FastGPT/blob/main/packages/global/core/ai/provider.ts, 可 pr 提供新的提供商，或直接填写 Other
+      "model": "gpt-4o-mini", // 模型名(对应OneAPI中渠道的模型名)
+      "name": "gpt-4o-mini", // 模型别名
+      "maxContext": 125000, // 最大上下文
+      "maxResponse": 16000, // 最大回复
+      "quoteMaxToken": 120000, // 最大引用内容
+      "maxTemperature": 1.2, // 最大温度
+      "charsPointsPrice": 0, // n积分/1k token（商业版）
+      "censor": false, // 是否开启敏感校验（商业版）
+      "vision": true, // 是否支持图片输入
+      "datasetProcess": true, // 是否设置为文本理解模型（QA），务必保证至少有一个为true，否则知识库会报错
+      "usedInClassify": true, // 是否用于问题分类（务必保证至少有一个为true）
+      "usedInExtractFields": true, // 是否用于内容提取（务必保证至少有一个为true）
+      "usedInToolCall": true, // 是否用于工具调用（务必保证至少有一个为true）
+      "toolChoice": true, // 是否支持工具选择（分类，内容提取，工具调用会用到。）
+      "functionCall": false, // 是否支持函数调用（分类，内容提取，工具调用会用到。会优先使用 toolChoice，如果为false，则使用 functionCall，如果仍为 false，则使用提示词模式）
+      "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
+      "customExtractPrompt": "", // 自定义内容提取提示词
+      "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
+      "defaultConfig": {}, // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
+      "fieldMap": {} // 字段映射（o1 模型需要把 max_tokens 映射为 max_completion_tokens）
+    },
+    {
+      "provider": "OpenAI",
+      "model": "gpt-4o",
+      "name": "gpt-4o",
+      "maxContext": 125000,
+      "maxResponse": 4000,
+      "quoteMaxToken": 120000,
+      "maxTemperature": 1.2,
+      "charsPointsPrice": 0,
+      "censor": false,
+      "vision": true,
+      "datasetProcess": true,
+      "usedInClassify": true,
+      "usedInExtractFields": true,
+      "usedInToolCall": true,
+      "toolChoice": true,
+      "functionCall": false,
+      "customCQPrompt": "",
+      "customExtractPrompt": "",
+      "defaultSystemChatPrompt": "",
+      "defaultConfig": {},
+      "fieldMap": {}
+    },
+    {
+      "provider": "OpenAI",
+      "model": "o1-mini",
+      "name": "o1-mini",
+      "maxContext": 125000,
+      "maxResponse": 65000,
+      "quoteMaxToken": 120000,
+      "maxTemperature": 1.2,
+      "charsPointsPrice": 0,
+      "censor": false,
+      "vision": false,
+      "datasetProcess": true,
+      "usedInClassify": true,
+      "usedInExtractFields": true,
+      "usedInToolCall": true,
+      "toolChoice": false,
+      "functionCall": false,
+      "customCQPrompt": "",
+      "customExtractPrompt": "",
+      "defaultSystemChatPrompt": "",
+      "defaultConfig": {
+        "temperature": 1,
+        "max_tokens": null,
+        "stream": false
+      }
+    },
+    {
+      "provider": "OpenAI",
+      "model": "o1-preview",
+      "name": "o1-preview",
+      "maxContext": 125000,
+      "maxResponse": 32000,
+      "quoteMaxToken": 120000,
+      "maxTemperature": 1.2,
+      "charsPointsPrice": 0,
+      "censor": false,
+      "vision": false,
+      "datasetProcess": true,
+      "usedInClassify": true,
+      "usedInExtractFields": true,
+      "usedInToolCall": true,
+      "toolChoice": false,
+      "functionCall": false,
+      "customCQPrompt": "",
+      "customExtractPrompt": "",
+      "defaultSystemChatPrompt": "",
+      "defaultConfig": {
+         "temperature": 1,
+        "max_tokens": null,
+        "stream": false
+      }
+    }
+  ],
+  "vectorModels": [
+    {
+      "provider": "OpenAI",
+      "model": "text-embedding-3-small", 
+      "name": "text-embedding-3-small",
+      "charsPointsPrice": 0,
+      "defaultToken": 512,
+      "maxToken": 3000,
+      "weight": 100
+    },
+    {
+      "provider": "OpenAI",
+      "model": "text-embedding-3-large",
+      "name": "text-embedding-3-large",
+      "charsPointsPrice": 0,
+      "defaultToken": 512,
+      "maxToken": 3000,
+      "weight": 100,
+      "defaultConfig": {
+        "dimensions": 1024
+      }
+    },
+    {
+      "provider": "OpenAI",
+      "model": "text-embedding-ada-002", // 模型名（与OneAPI对应）
+      "name": "Embedding-2", // 模型展示名
+      "charsPointsPrice": 0, // n积分/1k token
+      "defaultToken": 700, // 默认文本分割时候的 token
+      "maxToken": 3000, // 最大 token
+      "weight": 100, // 优先训练权重
+      "defaultConfig": {}, // 自定义额外参数。例如，如果希望使用 embedding3-large 的话，可以传入 dimensions:1024，来返回1024维度的向量。（目前必须小于1536维度）
+      "dbConfig": {}, // 存储时的额外参数（非对称向量模型时候需要用到）
+      "queryConfig": {} // 参训时的额外参数
+    }
+  ],
+  "reRankModels": [],
+  "audioSpeechModels": [
+    {
+      "provider": "OpenAI",
+      "model": "tts-1",
+      "name": "OpenAI TTS1",
+      "charsPointsPrice": 0,
+      "voices": [
+        { "label": "Alloy", "value": "alloy", "bufferId": "openai-Alloy" },
+        { "label": "Echo", "value": "echo", "bufferId": "openai-Echo" },
+        { "label": "Fable", "value": "fable", "bufferId": "openai-Fable" },
+        { "label": "Onyx", "value": "onyx", "bufferId": "openai-Onyx" },
+        { "label": "Nova", "value": "nova", "bufferId": "openai-Nova" },
+        { "label": "Shimmer", "value": "shimmer", "bufferId": "openai-Shimmer" }
+      ]
+    }
+  ],
+  "whisperModel": {
+    "provider": "OpenAI",
+    "model": "whisper-1",
+    "name": "Whisper1",
+    "charsPointsPrice": 0
+  }
+}
+```
--- a/document/content/docs/introduction/development/modelConfig/meta.json
+++ b/document/content/docs/introduction/development/modelConfig/meta.json
@@ -0,0 +1,4 @@
+{
+  "title": "模型配置方案",
+  "pages": ["ai-proxy","intro","one-api","siliconCloud","ppio"]
+}
--- a/document/content/docs/introduction/development/modelConfig/one-api.mdx
+++ b/document/content/docs/introduction/development/modelConfig/one-api.mdx
@@ -0,0 +1,127 @@
+---
+title: 通过 OneAPI 接入模型
+description: 通过 OneAPI 接入模型
+---
+
+FastGPT 目前采用模型分离的部署方案，FastGPT 中只兼容 OpenAI 的模型规范（OpenAI 不存在的模型采用一个较为通用的规范），并通过 [One API](https://github.com/songquanpeng/one-api) 来实现对不同模型接口的统一。
+
+[One API](https://github.com/songquanpeng/one-api) 是一个 OpenAI 接口管理 & 分发系统，可以通过标准的 OpenAI API 格式访问所有的大模型，开箱即用。
+
+
+## FastGPT 与 One API 关系
+
+可以把 One API 当做一个网关，FastGPT 与 One API 关系：
+
+![](/imgs/sealos-fastgpt.webp)
+
+## 部署
+
+### Sealos 版本
+
+* 北京区: [点击部署 OneAPI](https://hzh.sealos.run/?openapp=system-template%3FtemplateName%3Done-api)
+* 新加坡区(可用 GPT) [点击部署 OneAPI](https://cloud.sealos.io/?openapp=system-template%3FtemplateName%3Done-api&uid=fnWRt09fZP)
+
+![alt text](/imgs/image-59.png)
+
+部署完后，可以打开 OneAPI 访问链接，进行下一步操作。
+
+## OneAPI 基础教程
+
+### 概念
+
+1. 渠道：
+   1. OneApi 中一个渠道对应一个 `Api Key`，这个 `Api Key` 可以是GPT、微软、ChatGLM、文心一言的。一个`Api Key`通常可以调用同一个厂商的多个模型。
+   2. One API 会根据请求传入的`模型`来决定使用哪一个`渠道`，如果一个模型对应了多个`渠道`，则会随机调用。
+2. 令牌：访问 One API 所需的凭证，只需要这`1`个凭证即可访问`One API`上配置的模型。因此`FastGPT`中，只需要配置`One API`的`baseurl`和`令牌`即可。令牌不要设置任何的模型范围权限，否则容易报错。
+
+![alt text](/imgs/image-60.png)
+
+### 大致工作流程
+
+1. 客户端请求 One API
+2. 根据请求中的 `model` 参数，匹配对应的渠道（根据渠道里的模型进行匹配，必须完全一致）。如果匹配到多个渠道，则随机选择一个（同优先级）。
+3. One API 向真正的地址发出请求。
+4. One API 将结果返回给客户端。
+
+### 1. 登录 One API
+
+![step5](/imgs/oneapi-step5.png)
+
+### 2. 创建渠道
+
+在 One API 中添加对应渠道，直接点击 【添加基础模型】，不要遗漏了向量模型（Embedding）
+
+![step6](/imgs/oneapi-step6.png)
+
+### 3. 创建令牌
+
+| | |
+| --- | --- |
+| ![step7](/imgs/oneapi-step7.png) | ![alt text](/imgs/image-61.png) |
+
+### 4. 修改账号余额
+
+One API 默认 root 用户只有 200刀，可以自行修改编辑。
+
+![alt text](/imgs/image-62.png)
+
+### 5. 修改 FastGPT 的环境变量
+
+有了 One API 令牌后，FastGPT 可以通过修改 `baseurl` 和 `key` 去请求到 One API，再由 One API 去请求不同的模型。修改下面两个环境变量：
+
+```bash
+# 务必写上 v1。如果在同一个网络内，可改成内网地址。
+OPENAI_BASE_URL=https://xxxx.cloud.sealos.io/v1
+# 下面的 key 是由 One API 提供的令牌
+CHAT_API_KEY=sk-xxxxxx
+```
+
+## 接入其他模型
+
+**以添加文心一言为例:**
+
+### 1. OneAPI 新增模型渠道
+
+类型选择百度文心千帆。
+
+![](/imgs/oneapi-demo1.png)
+
+### 2. 修改 FastGPT 模型配置
+
+打开 FastGPT 模型配置，启动文心千帆模型，如果希望未内置，可以通过新增模型来配置。
+
+![alt text](/imgs/image-103.png)
+
+
+## 其他服务商接入参考
+
+这章介绍一些提供商接入 OneAPI 的教程，配置后不要忘记在 FastGPT 模型配置中启用。
+
+### 阿里通义千问
+
+千问目前已经兼容 GPT 格式，可以直接选择 OpenAI 类型来接入即可。如下图，选择类型为`OpenAI`，代理填写阿里云的代理地址。
+
+目前可以直接使用阿里云的语言模型和 `text-embedding-v3` 向量模型（实测已经归一化，可直接使用）
+
+![alt text](/imgs/image-63.png)
+
+### 硅基流动 —— 开源模型大合集
+
+[硅基流动](https://cloud.siliconflow.cn/i/TR9Ym0c4) 是一个专门提供开源模型调用平台，并拥有自己的加速引擎。模型覆盖面广，非常适合低成本来测试开源模型。接入教程：
+
+1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
+2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
+3. 新增 OneAPI 渠道，选择`OpenAI`类型，代理填写：`https://api.siliconflow.cn`，密钥是第二步创建的密钥。
+
+![alt text](/imgs/image-64.png)
+
+由于 OneAPI 未内置 硅基流动 的模型名，可以通过自定义模型名称来填入，下面是获取模型名称的教程：
+
+1. 打开[硅基流动模型列表](https://siliconflow.cn/zh-cn/models)
+2. 单击模型后，会打开模型详情。
+3. 复制模型名到 OneAPI 中。
+
+| | | |
+| --- | --- | --- |
+| ![alt text](/imgs/image-65.png) | ![alt text](/imgs/image-66.png)| ![alt text](/imgs/image-67.png) |
+
--- a/document/content/docs/introduction/development/modelConfig/ppio.mdx
+++ b/document/content/docs/introduction/development/modelConfig/ppio.mdx
@@ -0,0 +1,100 @@
+---
+title: 通过 PPIO LLM API 接入模型
+description: 通过 PPIO LLM API 接入模型
+---
+
+import { Alert } from '@/components/docs/Alert';
+
+FastGPT 还可以通过 PPIO LLM API 接入模型。
+
+<Alert context="warning">
+以下内容搬运自 [FastGPT 接入 PPIO LLM API](https://ppinfra.com/docs/third-party/fastgpt-use)，可能会有更新不及时的情况。
+</Alert>
+
+FastGPT 是一个将 AI 开发、部署和使用全流程简化为可视化操作的平台。它使开发者不需要深入研究算法，
+用户也不需要掌握复杂技术，通过一站式服务将人工智能技术变成易于使用的工具。
+
+PPIO 派欧云提供简单易用的 API 接口，让开发者能够轻松调用 DeepSeek 等模型。
+
+- 对开发者：无需重构架构，3 个接口完成从文本生成到决策推理的全场景接入，像搭积木一样设计 AI 工作流；
+- 对生态：自动适配从中小应用到企业级系统的资源需求，让智能随业务自然生长。
+
+下方教程提供完整接入方案（含密钥配置），帮助您快速将 FastGPT 与 PPIO API 连接起来。
+
+## 1. 配置前置条件
+
+(1) 获取 API 接口地址
+
+固定为: `https://api.ppinfra.com/v3/openai/chat/completions`。
+
+(2) 获取 【API 密钥】
+
+登录派欧云控制台 [API 秘钥管理](https://www.ppinfra.com/settings/key-management) 页面，点击创建按钮。
+注册账号填写邀请码【VOJL20】得 50 代金券
+
+<img src="https://static.ppinfra.com/docs/image/llm/BKWqbzI5PoYG6qxwAPxcinQDnob.png" alt="创建 API 密钥" />
+
+(3) 生成并保存 【API 密钥】
+<Alert context="warning">
+秘钥在服务端是加密存储，请在生成时保存好秘钥；若遗失可以在控制台上删除并创建一个新的秘钥。
+</Alert>
+
+<img src="https://static.ppinfra.com/docs/image/llm/OkUwbbWrcoCY2SxwVMIcM2aZnrs.png" alt="生成 API 密钥" />
+<img src="https://static.ppinfra.com/docs/image/llm/GExfbvcosoJhVKxpzKVczlsdn3d.png" alt="保存 API 密钥" />
+
+(4) 获取需要使用的模型 ID
+
+deepseek 系列：
+
+- DeepSeek R1：deepseek/deepseek-r1/community
+
+- DeepSeek V3：deepseek/deepseek-v3/community
+
+其他模型 ID、最大上下文及价格可参考：[模型列表](https://ppinfra.com/model-api/pricing)
+
+## 2. 部署最新版 FastGPT 到本地环境
+
+<Alert context="warning">
+请使用 v4.8.22 以上版本，部署参考: https://doc.tryfastgpt.ai/docs/development/intro/
+</Alert>
+
+## 3. 模型配置（下面两种方式二选其一）
+
+（1）通过 OneAPI 接入模型 PPIO 模型： 参考 OneAPI 使用文档，修改 FastGPT 的环境变量 在 One API 生成令牌后，FastGPT 可以通过修改 baseurl 和 key 去请求到 One API，再由 One API 去请求不同的模型。修改下面两个环境变量： 务必写上 v1。如果在同一个网络内，可改成内网地址。
+
+OPENAI_BASE_URL= http://OneAPI-IP:OneAPI-PORT/v1
+
+下面的 key 是由 One API 提供的令牌 CHAT_API_KEY=sk-UyVQcpQWMU7ChTVl74B562C28e3c46Fe8f16E6D8AeF8736e
+
+- 修改后重启 FastGPT，按下图在模型提供商中选择派欧云
+
+<img src="https://static.ppinfra.com/docs/image/llm/Fvqzb3kTroys5Uxkjlzco7kwnsb.png" alt="选择派欧云" />
+
+- 测试连通性
+以 deepseek 为例，在模型中选择使用 deepseek/deepseek-r1/community，点击图中②的位置进行连通性测试，出现图中绿色的的成功显示证明连通成功，可以进行后续的配置对话了
+<img src="https://static.ppinfra.com/docs/image/llm/FzKGbGsSPoX4Eexobj2cxcaTnib.png" alt="测试连通性" />
+
+（2）不使用 OneAPI 接入 PPIO 模型
+
+按照下图在模型提供商中选择派欧云
+<img src="https://static.ppinfra.com/docs/image/llm/QbcdbPqRsoAmuyx2nlycQWFanrc.png" alt="选择派欧云" />
+
+- 配置模型 自定义请求地址中输入：`https://api.ppinfra.com/v3/openai/chat/completions`
+<img src="https://static.ppinfra.com/docs/image/llm/ZVyAbDIaxo7ksAxLI3HcexYYnZf.png" alt="配置模型" />
+<img src="https://static.ppinfra.com/docs/image/llm/Ha9YbggkwoQsVdx1Z4Gc9zUSnle.png" alt="配置模型" />
+
+- 测试连通性
+<img src="https://static.ppinfra.com/docs/image/llm/V1f0b89uloab9uxxj7IcKT0rn3e.png" alt="测试连通性" />
+
+出现图中绿色的的成功显示证明连通成功，可以进行对话配置
+
+## 4. 配置对话
+（1）新建工作台
+<img src="https://static.ppinfra.com/docs/image/llm/ZaGpbBH6QoVubIx2TsLcwYEInfe.png" alt="新建工作台" />
+（2）开始聊天
+<img src="https://static.ppinfra.com/docs/image/llm/HzcTb4gobokVRQxTlU7cD5OunMf.png" alt="开始聊天" />
+
+## PPIO 全新福利重磅来袭 🔥
+顺利完成教程配置步骤后，您将解锁两大权益：1. 畅享 PPIO 高速通道与 FastGPT 的效能组合；2.立即激活 **「新用户邀请奖励」** ————通过专属邀请码邀好友注册，您与好友可各领 50 元代金券，硬核福利助力 AI 工具效率倍增！
+
+🎁 新手专享：立即使用邀请码【VOJL20】完成注册，50 元代金券奖励即刻到账！
--- a/document/content/docs/introduction/development/modelConfig/siliconCloud.mdx
+++ b/document/content/docs/introduction/development/modelConfig/siliconCloud.mdx
@@ -0,0 +1,90 @@
+---
+title: 通过 SiliconCloud 体验开源模型
+description: 通过 SiliconCloud 体验开源模型
+---
+
+[SiliconCloud(硅基流动)](https://cloud.siliconflow.cn/i/TR9Ym0c4) 是一个以提供开源模型调用为主的平台，并拥有自己的加速引擎。帮助用户低成本、快速的进行开源模型的测试和使用。实际体验下来，他们家模型的速度和稳定性都非常不错，并且种类丰富，覆盖语言、向量、重排、TTS、STT、绘图、视频生成模型，可以满足 FastGPT 中所有模型需求。
+
+如果你想部分模型使用 SiliconCloud 的模型，可额外参考[OneAPI接入硅基流动](/docs/development/modelconfig/one-api/#硅基流动--开源模型大合集)。
+
+本文会介绍完全使用 SiliconCloud 模型来部署 FastGPT 的方案。
+
+
+## 1. 注册 SiliconCloud 账号
+
+1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
+2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
+
+## 2. 修改 FastGPT 环境变量
+
+```bash
+OPENAI_BASE_URL=https://api.siliconflow.cn/v1
+# 填写 SiliconCloud 控制台提供的 Api Key
+CHAT_API_KEY=sk-xxxxxx
+```
+
+## 3. 修改 FastGPT 模型配置
+
+系统内置了几个硅基流动的模型进行体验，如果需要其他模型，可以手动添加。
+
+这里启动了 `Qwen2.5 72b` 的纯语言和视觉模型；选择 `bge-m3` 作为向量模型；选择 `bge-reranker-v2-m3` 作为重排模型。选择 `fish-speech-1.5` 作为语音模型；选择 `SenseVoiceSmall` 作为语音输入模型。
+
+![alt text](/imgs/image-104.png)
+
+## 4. 体验测试
+
+### 测试对话和图片识别
+
+随便新建一个简易应用，选择对应模型，并开启图片上传后进行测试：
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-68.png) | ![alt text](/imgs/image-70.png) |
+
+可以看到，72B 的模型，性能还是非常快的，这要是本地没几个 4090，不说配置环境，输出怕都要 30s 了。
+
+### 测试知识库导入和知识库问答
+
+新建一个知识库（由于只配置了一个向量模型，页面上不会展示向量模型选择）
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-72.png) | ![alt text](/imgs/image-71.png) |
+
+导入本地文件，直接选择文件，然后一路下一步即可。79 个索引，大概花了 20s 的时间就完成了。现在我们去测试一下知识库问答。
+
+首先回到我们刚创建的应用，选择知识库，调整一下参数后即可开始对话：
+
+| | | | 
+| --- | --- | --- |
+| ![alt text](/imgs/image-73.png) | ![alt text](/imgs/image-75.png) | ![alt text](/imgs/image-76.png) |
+
+对话完成后，点击底部的引用，可以查看引用详情，同时可以看到具体的检索和重排得分：
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-77.png) | ![alt text](/imgs/image-78.png) |
+
+### 测试语音播放
+
+继续在刚刚的应用中，左侧配置中找到语音播放，点击后可以从弹窗中选择语音模型，并进行试听：
+
+![alt text](/imgs/image-79.png)
+
+### 测试语言输入
+
+继续在刚刚的应用中，左侧配置中找到语音输入，点击后可以从弹窗中开启语言输入
+
+![alt text](/imgs/image-80.png)
+
+开启后，对话输入框中，会增加一个话筒的图标，点击可进行语音输入：
+
+| | |
+| --- | --- |
+| ![alt text](/imgs/image-81.png) | ![alt text](/imgs/image-82.png) |
+
+## 总结
+
+如果你想快速的体验开源模型或者快速的使用 FastGPT，不想在不同服务商申请各类 Api Key，那么可以选择 SiliconCloud 的模型先进行快速体验。
+
+如果你决定未来私有化部署模型和 FastGPT，前期可通过 SiliconCloud 进行测试验证，后期再进行硬件采购，减少 POC 时间和成本。