mirror of
https://github.com/labring/FastGPT.git
synced 2025-07-22 20:37:48 +00:00
40 lines
1.5 KiB
Markdown
40 lines
1.5 KiB
Markdown
---
|
||
title: '知识库搜索参数'
|
||
description: '知识库搜索原理'
|
||
icon: 'language'
|
||
draft: false
|
||
toc: true
|
||
weight: 106
|
||
---
|
||
|
||
在知识库搜索的方式上,FastGPT提供了三种方式,分别为“语义检索”“增强语义检索”“混合检索”。
|
||
|
||

|
||
|
||
## 语义检索
|
||
|
||
语义检索就是向量检索,同时把用户的问题和知识库内容向量化,然后通过“语义相关度匹配”的方式从知识库中查找到匹配的知识点。
|
||
|
||
优点:
|
||
- 相近语义理解
|
||
- 跨多语言理解(例如输入中文问题匹配英文知识点)
|
||
- 多模态理解(文本,图片,音视频等)
|
||
|
||
## 增强语义检索
|
||
|
||
在语义检索的基础上,增强“语义相关度匹配”并在搜索结束后进行 Rerank(重排)。
|
||
|
||
Rerank(重排):把检索结果按“与用户问题语义”相关性,从高到低排序,简单的说就是把最匹配用户问题的检索结果排在前面。
|
||
|
||
## 混合检索(推荐)
|
||
|
||
|
||
在向量检索的同时进行全文检索,并把两项检索的结果混合一起重排,以便选中匹配用户问题的最佳结果。
|
||
|
||
全文检索:理解为全文关键词检索,通过关键词查询知识库,并返回包含关键词的文本片段。
|
||
|
||
优点:
|
||
- 精确匹配(姓名,编号,ID等)
|
||
- 少量关键词匹配(当用户问题字数过少时向量检索效果非常不好)
|
||
|
||
混合检索结合了向量检索和全文检索的优点,并且对查询结果进行了重排,大大提高了命中率,推荐使用。 |