Files
FastGPT/docSite/content/zh-cn/docs/development/custom-models/bge-rerank.md
Shixian Sheng 8323c2d27e 修复了几个链接 (#4377)
* Update bge-rerank.md

* Update bge-rerank.md

* Update chatglm2.md

* Update README.md
2025-03-28 10:59:12 +08:00

3.6 KiB
Raw Blame History

title, description, icon, draft, toc, weight
title description icon draft toc weight
接入 bge-rerank 重排模型 接入 bge-rerank 重排模型 sort false true 920

不同模型推荐配置

推荐配置如下:

{{< table "table-hover table-striped-columns" >}}

模型名 内存 显存 硬盘空间 启动命令
bge-reranker-base >=4GB >=4GB >=8GB python app.py
bge-reranker-large >=8GB >=8GB >=8GB python app.py
bge-reranker-v2-m3 >=8GB >=8GB >=8GB python app.py
{{< /table >}}

源码部署

1. 安装环境

  • Python 3.9, 3.10
  • CUDA 11.7
  • 科学上网环境

2. 下载代码

3 个模型代码分别为:

  1. https://github.com/labring/FastGPT/tree/main/plugins/model/rerank-bge/bge-reranker-base
  2. https://github.com/labring/FastGPT/tree/main/plugins/model/rerank-bge/bge-reranker-large
  3. https://github.com/labring/FastGPT/tree/main/plugins/model/rerank-bge/bge-reranker-v2-m3

3. 安装依赖

pip install -r requirements.txt

4. 下载模型

3个模型的 huggingface 仓库地址如下:

  1. https://huggingface.co/BAAI/bge-reranker-base
  2. https://huggingface.co/BAAI/bge-reranker-large
  3. https://huggingface.co/BAAI/bge-reranker-v2-m3

在对应代码目录下 clone 模型。目录结构:

bge-reranker-base/
app.py
Dockerfile
requirements.txt

5. 运行代码

python app.py

启动成功后应该会显示如下地址:

这里的 http://0.0.0.0:6006 就是连接地址。

docker 部署

镜像名分别为:

  1. registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-base:v0.1 (4 GB+)
  2. registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-large:v0.1 (5 GB+)
  3. registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-v2-m3:v0.1 (5 GB+)

端口

6006

环境变量

ACCESS_TOKEN=访问安全凭证请求时Authorization: Bearer ${ACCESS_TOKEN}

运行命令示例

# auth token 为mytoken
docker run -d --name reranker -p 6006:6006 -e ACCESS_TOKEN=mytoken --gpus all registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-base:v0.1

docker-compose.yml示例

version: "3"
services:
  reranker:
    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-base:v0.1
    container_name: reranker
    # GPU运行环境如果宿主机未安装将deploy配置隐藏即可
    deploy:
      resources:
        reservations:
          devices:
          - driver: nvidia
            count: all
            capabilities: [gpu]
    ports:
      - 6006:6006
    environment:
      - ACCESS_TOKEN=mytoken

接入 FastGPT

  1. 打开 FastGPT 模型配置,新增一个重排模型。
  2. 填写模型配置表单:模型 ID 为bge-reranker-base,地址填写{{host}}/v1/rerankhost 为你部署的域名/IP:Port。

alt text

QA

403报错

FastGPT中自定义请求 Token 和环境变量的 ACCESS_TOKEN 不一致。

Docker 运行提示 Bus error (core dumped)

尝试增加 docker-compose.yml 配置项 shm_size ,以增加容器中的共享内存目录大小。

...
services:
  reranker:
    ...
    container_name: reranker
    shm_size: '2gb'
    ...