Files
FastGPT/docSite/content/docs/workflow/modules/dataset_search.md
Archer 51bbdf26a3 4.6.8-production (#822)
* Json completion (#16)

* json-completion

* fix duplicate

* fix

* fix: config json

* feat: query extension

* perf: i18n

* 468 doc

* json editor

* perf: doc

* perf: default extension model

* docker file

* doc

* perf: token count

* perf: search extension

* format

* perf: some constants data

---------

Co-authored-by: heheer <71265218+newfish-cmyk@users.noreply.github.com>
2024-02-05 00:51:46 +08:00

1.9 KiB
Raw Blame History

title, description, icon, draft, toc, weight
title description icon draft toc weight
知识库搜索 FastGPT AI 知识库搜索模块介绍 chat false true 357

知识库搜索具体参数说明,以及内部逻辑请移步:FastGPT知识库搜索方案

特点

  • 可重复添加(复杂编排时防止线太乱,可以更美观)
  • 有外部输入
  • 有静态配置
  • 触发执行
  • 核心模块

参数说明

输入 - 关联的知识库

可以选择一个或多个相同向量模型的知识库,用于向量搜索。

输入 - 相似度

学名称为距离,两个向量之间距离,可以认为是两个向量的相似度,又可以映射成文本之间的相似度。

需要注意的是不同的向量模型之间的相似度是不能比较的因为他们的距离值计算出来差距很大。例如openai 的 embedding 模型,通常 0.8 以上的才是较为准确的内容,而 M3E 模型则是 0.35。

输入 - 单次搜索上限

每次触发搜索模块时,最多取 n 条作为最终引用,又称 topN。需要注意的是取了 n 条引用不代表对话模型都可以使用,还会受对话模型最大 Tokens 的影响。

输出 - 搜索结果

输出部分给了两个 boolean 类型的搜索结果,以便根据搜索结果进行不同的处理,通常会有下方两个处理方式:

直接回复特定内容 对接普通的 gpt

当然,你也可以连接到 HTTP 模块,从而实现无法从知识搜索到内容时,去进行联网搜索或者维基百科搜索。

输出 - 引用内容

以数组格式输出引用,长度可以为 0。意味着即使没有搜索到内容这个输出链路也会走通。