基于检索增强生成的知识库存储检索系统和方法

查看全文
202410945806复制
CN202410945806.1复制
大数据
摘要
基于检索增强生成的知识库存储检索系统和方法,主要内容是:(1)文档提取与分块模块,把加入知识库的文档切分为文档块,形成文档列表和关键字列表;(2)文档向量化与存储模块,把向量化后的文档列表和关键字列表存贮到向量库中;(3)文档窗口设置模块,根据用户的提问信息,确定文档窗口值W的大小;(4)初步检索模块,提取出文档相似度值最大的前W个文档,作为初步检索结果;(5)混合重排序模块根据综合相似度s值的大小,从初步检索结果中返回W/2个文档作为最终检索结果。本发明对多模态问答大模型具有支持能力。
申请人
北京邮电大学
第一发明人
李炜
著录信息
20240715
20241015
申请日
首次公开日
授权(公告日)
维持时间:年
预估到期:
申请号
202410945806
申请日
20240715
公开(公告)号
CN118779429A@FMGK20241015
当前申请(专利权)人
北京邮电大学
公开(公告)日
20241015
原始申请(专利权)人
北京邮电大学
原始申请(专利权)人地址
100876 北京市海淀区西土城路10号
发明(设计)人
李炜、王玉龙、韩志、赵海秀、廖建新、王晶
代理人
代理机构
IPC分类号
G06F16/332
G06F40/126
G06F40/194
G06F40/279