在知识图谱问答技术领域中,候选池的生成是影响问答系统性能和准确性的关键环节。传统方法往往面临候选池规模庞大、实体召回率低以及系统鲁棒性不足等问题,导致问答效率低下且结果准确性不高。
本发明提出了一种非严格N元语法字符串匹配方法,用于优化候选池的生成。该方法通过主语相关短语在知识图谱中的完全匹配、部分匹配以及降低主语相关短语后的继续匹配策略,精准定位并构建候选池。此技术不仅有效缩减了候选池规模,还显著提升了实体召回率。进一步地,基于此方法实现的简单问答系统,通过改进谓词抽取技术,进一步提高了系统的准确率和效率。
与现有技术相比,本发明以更少的资源和更简洁的算法流程,实现了问答系统鲁棒性和准确率的双重提升。非严格N元语法字符串匹配方法的引入,为候选池生成提供了更为高效和准确的解决方案。此外,改进的谓词抽取技术进一步增强了系统的性能,使得本发明在知识图谱问答技术领域具有显著的竞争优势和创新性。
20241220
制造业
1、成果由北京理工大学单独持有;2、本成果已授权专利
技术许可、合作开发、技术服务和咨询、技术转让等
可国(境)内外转让
会同成果完成团队与意向方共同研讨合作方案
北京理工大学产业开发研究院
北京市科学技术委员会;中关村科技园区管理委员会
本发明提供一种候选池生成方法,属于知识图谱问答技术领域。针对候选池生成,本发明提供了一种非严格N元语法字符串匹配方法,依次通过对主语相关短语在知识图谱进行完全匹配、部分匹配、降低主语相关短语后继续匹配的方式,在知识图谱中查找匹配节点构建候选池,在降低候选池规模的同时有效提高了实体召回率;进一步的,基于上述候选池生成方法,提供一种简单问答系统的实现方法,提高了问答系统的鲁棒性和准确率;此外,本发明又进一步对简单问答系统的谓词抽取方法进行改进,进一步提高了问答系统的准确率和效率。对比现有技术,本发明提出的上述方法,以更少的资源,更简单的算法过程提高了问答系统的鲁棒性和准确率。
