Files
FastGPT/python/reranker/bge-reranker-base/README.md
2024-04-03 18:14:09 +08:00

1.4 KiB
Raw Blame History

推荐配置

推荐配置如下:

{{< table "table-hover table-striped-columns" >}}

类型 内存 显存 硬盘空间 启动命令
base >=4GB >=3GB >=8GB python app.py
{{< /table >}}

部署

环境要求

  • Python 3.10.11
  • CUDA 11.7
  • 科学上网环境

源码部署

  1. 根据上面的环境配置配置好环境,具体教程自行 GPT
  2. 下载 python 文件
  3. 在命令行输入命令 pip install -r requirments.txt
  4. 按照https://huggingface.co/BAAI/bge-reranker-base下载模型仓库到app.py同级目录
  5. 添加环境变量 export ACCESS_TOKEN=XXXXXX 配置 token这里的 token 只是加一层验证,防止接口被人盗用,默认值为 ACCESS_TOKEN
  6. 执行命令 python app.py

然后等待模型下载,直到模型加载完毕为止。如果出现报错先问 GPT。

启动成功后应该会显示如下地址:

这里的 http://0.0.0.0:6006 就是连接地址。

docker 部署

镜像和端口

  • 镜像名: registry.cn-hangzhou.aliyuncs.com/fastgpt/rerank:v0.2
  • 端口号: 6006
# 设置安全凭证即oneapi中的渠道密钥
通过环境变量ACCESS_TOKEN引入默认值ACCESS_TOKEN。
有关docker环境变量引入的方法请自寻教程此处不再赘述。