面向政策制定的低幻觉多任务适配大模型技术研究及示范应用

联系合作
新一代信息技术
智慧城市
成果单位: 北京瑞莱智慧科技有限公司
合作方式: 技术许可
所处阶段: 其他
关键词: 政策制定政务场景增强RAG查询改写多智能体任务调度分层检索推理生成抑制检索增强生成多任务适配
总得分 (满分100)
0
资本强度 (满分0)
该成果得分:0

核心问题

在政策制定等知识密集型专业领域中,通用大语言模型面临知识时效性不足、领域深度欠缺、易产生幻觉、无法访问私域权威数据等问题。同时,政策制定与服务过程中存在政策信息获取渠道分散、信息不对称、政策内容解读困难等核心问题。

解决方案

本课题研发了一套适用于政策制定场景的低幻觉多任务适配智能辅助系统,采用分层架构设计:

  1. 基础技术层:构建增强RAG以抑制模型幻觉,包括查询改写、文档找回、政策上下文拼接和加权、政策验证闭环和政策智能体工作流。
  2. 核心系统层:设计任务调度与路由机制、多智能体协同模式、推理-行动机制与反思优化,构建多任务适配的政策智能体。
  3. 支撑应用层:建设高质量多维度政策垂直领域数据集,设计创新型人机协同方式。 在幻觉抑制方面,整合四种技术方案:数据驱动抑制方案、调控模型结构与参数抑制方案、推理和生成阶段控制方案、外部辅助和混合策略方案。 在多任务适配方面,提出基于多智能体协同体系的技术方案,实现任务识别、执行到结果汇聚的全过程智能化管理。

竞争优势

  1. 创新性:原始创新成果,首次在政策制定领域实现低幻觉与多任务适配的深度结合。
  2. 技术优势:通过分层架构设计和四种幻觉抑制技术方案,显著降低模型幻觉率(10%以上),提升政策问答准确性(多任务问答数据集准确率70%-90%)。
  3. 应用效益:完成在首都之窗等政务场景的示范应用,达成关键考核指标(政策检索增强数据集Top-10召回率90%以上,混合意图识别准确率80%以上),为政务智能化提供可扩展的技术基础。
  4. 行业领先:解决通用大模型在政策垂直领域的核心痛点,形成政策大模型系统的统一管理与智能适配能力。

成果公开日期

20251202

所属产业领域

信息传输、软件和信息技术服务业

项目名称

面向政策制定的低幻觉多任务适配大模型技术研究及示范应用

项目课题来源

北京市科学技术委员会;中关村科技园区管理委员会

摘要

在政策制定等知识密集型专业领域中,通用大语言模型面临着知识时效性不足、领域深度欠缺、易产生幻觉、无法访问私域权威数据等关键痛点。与此同时,当前政策制定与服务过程中普遍存在政策信息获取渠道分散、信息不对称、政策内容解读困难等核心问题。针对这些挑战,本课题研发了一套适用于政策制定场景的低幻觉多任务适配智能辅助系统。 本课题的研究内容采用分层架构设计。基础技术层聚焦于构建增强RAG以抑制模型幻觉的基础组件,包括面向政策垂直领域的查询改写、文档找回、政策上下文拼接和加权、政策验证闭环和政策智能体工作流。核心系统层针对政策垂直领域设计了"任务调度与路由机制""多智能体协同模式"以及"推理-行动机制与反思优化",并构建多任务适配的政策智能体。支撑应用层通过建设高质量多维度的政策垂直领域数据集,并设计创新型的人机协同方式,赋能北京市政府部门示范应用。 在幻觉抑制方面,本课题系统分析并整合了四种技术方案。数据驱动抑制方案通过设计政策领域高质量数据集,涵盖不同层级、不同发布渠道、不同元结构信息,同时设计政策垂直测试集以及质量评估体系。调控模型结构与参数抑制方案通过对模型架构和参数的精细调控,增强模型在政策领域的专业表现。推理和生成阶段控制方案设计了面向政策的推理生成抑制技术,将政策问答系统的结构化格式如标准化的引用格式、规范的政策条文引述、结构化的对比分析结果等引入,并施加结构化约束。外部辅助和混合策略方案设计了面向政策领域的检索增强生成技术,将"检索—认证—排序—证据拼接—生成—验证"结合为一个可信因果链条,并引入基于来源可信度的分层检索策略、政策文件权威性认证机制与证据一致性反馈等模块,从系统层缓解大模型的幻觉问题。 在多任务适配方面,本课题提出了面向政策领域的多任务适配技术方案。该方案基于多智能体协同体系,将不同任务的处理逻辑抽象为"任务体",通过统一调度、模块化管理和可复用机制,实现从任务识别、执行到结果汇聚的全过程智能化管理。设计目标包括统一底座、分工协同、动态调度、可解释推理和持续优化等,实现政策大模型系统在多任务环境下的统一管理与智能适配,为政务智能化提供了可扩展的技术基础。 本课题完成政策大模型系统在首都之窗等政务场景的示范应用,并达成以下关键考核指标:在政策检索增强数据集上Top-10召回率达到90%以上;混合意图识别准确率达到80%以上;"区域对比、定义查找、时间沿革、总结归纳、异同分析、存在性验证"等多任务问答数据集准确率在70%甚至90%以上;并在各测试场景上将幻觉率降低10%以上。

试试对话AI技术经理人
WENXIAOGUO
问小果
该成果有哪些相似成果?
该成果可能有哪些需求方?
该成果的市场前景如何?
北京瑞莱智慧科技有限公司的相关成果还有哪些?