fix: doc path (#5393)

2025-10-19 18:14:38 +00:00 · 2025-08-05 23:20:39 +08:00
parent 254680bfdf
commit e5c91b7fae
36 changed files with 1149 additions and 1664 deletions
--- a/document/content/docs/introduction/development/custom-models/chatglm2-m3e.mdx
+++ b/document/content/docs/introduction/development/custom-models/chatglm2-m3e.mdx
@@ -9,9 +9,9 @@ FastGPT 默认使用了 OpenAI 的 LLM 模型和向量模型，如果想要私

 ## 部署镜像

-+ 镜像名: `stawky/chatglm2-m3e:latest`  
-+ 国内镜像名: `registry.cn-hangzhou.aliyuncs.com/fastgpt_docker/chatglm2-m3e:latest`
-+ 端口号: 6006
+- 镜像名: `stawky/chatglm2-m3e:latest`
+- 国内镜像名: `registry.cn-hangzhou.aliyuncs.com/fastgpt_docker/chatglm2-m3e:latest`
+- 端口号: 6006

 ```
 # 设置安全凭证（即oneapi中的渠道密钥）
@@ -21,7 +21,7 @@ FastGPT 默认使用了 OpenAI 的 LLM 模型和向量模型，如果想要私

 ## 接入 OneAPI

-文档链接：[One API](/docs/development/modelconfig/one-api/)
+文档链接：[One API](/docs/introduction/development/modelconfig/one-api/)

 为 chatglm2 和 m3e-large 各添加一个渠道，参数如下：

@@ -97,7 +97,7 @@ M3E 模型的使用方法如下：
 1. 创建知识库时候选择 M3E 模型。

   注意，一旦选择后，知识库将无法修改向量模型。
-   
+
   ![](/imgs/model-m3e2.png)

 2. 导入数据
@@ -108,7 +108,7 @@ M3E 模型的使用方法如下：
 4. 应用绑定知识库

   注意，应用只能绑定同一个向量模型的知识库，不能跨模型绑定。并且，需要注意调整相似度，不同向量模型的相似度（距离）会有所区别，需要自行测试实验。
-   
+
   ![](/imgs/model-m3e4.png)

 chatglm2 模型的使用方法如下：
--- a/document/content/docs/introduction/development/custom-models/ollama.mdx
+++ b/document/content/docs/introduction/development/custom-models/ollama.mdx
@@ -7,14 +7,14 @@ description: ' 采用 Ollama 部署自己的模型'

 ## 安装 Ollama

-Ollama 本身支持多种安装方式，但是推荐使用 Docker 拉取镜像部署。如果是个人设备上安装了 Ollama 后续需要解决如何让 Docker 中 FastGPT 容器访问宿主机 Ollama的问题，较为麻烦。 
+Ollama 本身支持多种安装方式，但是推荐使用 Docker 拉取镜像部署。如果是个人设备上安装了 Ollama 后续需要解决如何让 Docker 中 FastGPT 容器访问宿主机 Ollama的问题，较为麻烦。

 ### Docker 安装（推荐）

 你可以使用 Ollama 官方的 Docker 镜像来一键安装和启动 Ollama 服务（确保你的机器上已经安装了 Docker），命令如下：

 ```bash
-docker pull ollama/ollama 
+docker pull ollama/ollama
 docker run --rm -d --name ollama -p 11434:11434 ollama/ollama
 ```

@@ -81,7 +81,6 @@ ollama pull [模型名]

 ![](/imgs/Ollama-pull.png)

-
 ### 测试通信

 在安装完成后，需要进行检测测试，首先进入 FastGPT 所在的容器，尝试访问自己的 Ollama ，命令如下：
@@ -108,7 +107,7 @@ ollama ls

 ### 2. AI Proxy 接入

-如果你采用的是 FastGPT 中的默认配置文件部署[这里](/docs/development/docker.md)，即默认采用 AI Proxy 进行启动。
+如果你采用的是 FastGPT 中的默认配置文件部署[这里](/docs/introduction/development/docker.md)，即默认采用 AI Proxy 进行启动。

 ![](/imgs/Ollama-aiproxy1.png)

@@ -116,7 +115,7 @@ ollama ls

 ![](/imgs/Ollama-aiproxy2.png)

-在 FastGPT 中点击账号->模型提供商->模型配置->新增模型，添加自己的模型即可，添加模型时需要保证模型ID和 OneAPI 中的模型名称一致。详细参考[这里](/docs/development/modelConfig/intro.md)
+在 FastGPT 中点击账号->模型提供商->模型配置->新增模型，添加自己的模型即可，添加模型时需要保证模型ID和 OneAPI 中的模型名称一致。详细参考[这里](/docs/introduction/development/modelConfig/intro.md)

 ![](/imgs/Ollama-models2.png)

@@ -177,4 +176,5 @@ docker run -it --network [ FastGPT 网络 ] --name 容器名 intel/oneapi-hpckit
 ![](/imgs/Ollama-models4.png)

 ### 6. 补充
+
 上述接入 Ollama 的代理地址中，主机安装 Ollama 的地址为“http://[主机IP]:[端口]”，容器部署 Ollama 地址为“http://[容器名]:[端口]”
--- a/document/content/docs/introduction/development/custom-models/xinference.mdx
+++ b/document/content/docs/introduction/development/custom-models/xinference.mdx
@@ -13,8 +13,8 @@ Xinference 支持多种推理引擎作为后端，以满足不同场景下部署

 如果你的目标是在一台 Linux 或者 Window 服务器上部署大模型，可以选择 Transformers 或 vLLM 作为 Xinference 的推理后端：

-+ [Transformers](https://huggingface.co/docs/transformers/index)：通过集成 Huggingface 的 Transformers 库作为后端，Xinference 可以最快地 集成当今自然语言处理（NLP）领域的最前沿模型（自然也包括 LLM）。
-+ [vLLM](https://vllm.ai/): vLLM 是由加州大学伯克利分校开发的一个开源库，专为高效服务大型语言模型（LLM）而设计。它引入了 PagedAttention 算法， 通过有效管理注意力键和值来改善内存管理，吞吐量能够达到 Transformers 的 24 倍，因此 vLLM 适合在生产环境中使用，应对高并发的用户访问。
+- [Transformers](https://huggingface.co/docs/transformers/index)：通过集成 Huggingface 的 Transformers 库作为后端，Xinference 可以最快地 集成当今自然语言处理（NLP）领域的最前沿模型（自然也包括 LLM）。
+- [vLLM](https://vllm.ai/): vLLM 是由加州大学伯克利分校开发的一个开源库，专为高效服务大型语言模型（LLM）而设计。它引入了 PagedAttention 算法， 通过有效管理注意力键和值来改善内存管理，吞吐量能够达到 Transformers 的 24 倍，因此 vLLM 适合在生产环境中使用，应对高并发的用户访问。

 假设你服务器配备 NVIDIA 显卡，可以参考[这篇文章中的指令来安装 CUDA](https://xorbits.cn/blogs/langchain-streamlit-doc-chat)，从而让 Xinference 最大限度地利用显卡的加速功能。

@@ -98,7 +98,7 @@ xinference launch -n qwen-chat -s 14 -f pytorch

 ## 将本地模型接入 One API

-One API 的部署和接入请参考[这里](/docs/development/modelconfig/one-api/)。
+One API 的部署和接入请参考[这里](/docs/introduction/development/modelconfig/one-api/)。

 为 qwen1.5-chat 添加一个渠道，这里的 Base URL 需要填 Xinference 服务的端点，并且注册 qwen-chat (模型的 UID) 。

@@ -153,9 +153,6 @@ curl --location --request POST 'https://[oneapi_url]/v1/chat/completions' \

 然后重启 FastGPT 就可以在应用配置中选择 Qwen 模型进行对话：

-![](/imgs/fastgpt-list-models.png)
---
-
-+ 参考：[FastGPT + Xinference：一站式本地 LLM 私有化部署和应用开发](https://xorbits.cn/blogs/fastgpt-weather-chat)
-
+## ![](/imgs/fastgpt-list-models.png)

+- 参考：[FastGPT + Xinference：一站式本地 LLM 私有化部署和应用开发](https://xorbits.cn/blogs/fastgpt-weather-chat)