知识指导的医学依存句法分析研究

联系合作
新一代信息技术
医药健康
成果单位: 北京信息科技大学
合作方式: 自行实施
所处阶段: 概念
关键词: 医疗文本理解医学事件抽取家族病史抽取病历文本分析Wasserstein生成对抗网络去词汇化词向量拼接数据增强
总得分 (满分100)
0
资本强度 (满分0)
该成果得分:0

核心问题

在医学文本处理中,依存句法分析面临着重重挑战,包括医学领域依存句法树资源的稀缺性、医学文本的复杂多样性以及由此导致的数据稀疏与知识匮乏问题。这些问题严重制约了医学依存句法分析的性能,进而影响了医疗文本的理解、医学事件抽取、家族病史抽取等关键任务的准确性,阻碍了智慧医疗的深入发展。

解决方案

本项目创新性地提出了以下解决方案:(1)构建了wasserstein生成式对抗网络模型,通过语境精准识别词汇的领域属性,有效减小了领域间的词汇鸿沟,增强了句法模型的领域迁移能力;(2)隐式地,利用预训练模型获取近义词,将源领域特有的词汇替换为目标领域中相似的词汇,实现了数据的有效增强;(3)显式地,依据不同预训练模型获取领域属性,将源领域词汇与目标领域相似词汇进行词向量拼接,进一步缩小了领域词汇差异;(4)专门标注了2000句医学领域的中文依存句法树,为医学依存句法分析及其下游任务提供了宝贵的数据资源。通过这些技术手段,本项目成功地将知识以隐式和显式的方式注入到依存句法分析任务中,有效缓解了数据稀疏和知识匮乏的问题。

竞争优势

本项目提出的识别词汇领域属性模型,不仅从模型层面进行了优化,还通过知识指导的隐式和显式应用,显著提升了依存句法分析的性能。相较于传统方法,本项目在数据增强、领域迁移、知识注入等方面展现出独特的优势,能够更深入、更准确地分析和理解病历文本,从而提取出更有价值的信息。这对于推动智慧医疗的发展,提高医疗文本处理的效率和准确性,具有重要的实践意义和科研价值。同时,本项目的创新性和实用性也为其在医学自然语言处理领域的应用奠定了坚实的基础,展现了广阔的应用前景和市场潜力。

成果公开日期

20241231

所属产业领域

信息传输、软件和信息技术服务业

转化现有基础

1.本项目完成了以下内容: (1)构建了Wasserstein生成式对抗网络模型,根据语境识别词汇的领域属性; (2)隐式地,将领域属性以词向量拼接的方式应用在医学依存句法分析任务中,实现了部分去词汇化,减小领域之间的词汇鸿沟,提高了句法模型的领域迁移性能,在genia数据上的错误率降到了6.5%; (3)显式地,依据不同预训练模型获取近义词,将源领域特有的词汇替换成目标领域中相似词汇,实现数据增强; (4)标注了2000句医学领域的中文依存句法树。 2.依托于微信小程序来开发,设计一个基于微博社交媒体数据的多模态情感分析系统,功能包含图像和文本的上传、情感倾向分析

转化合作需求

1.有自然语言处理等相关需求; 2.公司应有会使用自然语言处理技术的研究人员; 3.具备相关硬件条件,比如显卡应足够用于模型训练。

转化意向范围

可国(境)内外转让

转化预期效益

加深对医学文本的分析和理解,提取出更有价值的信息,实现电子辅助诊疗,提高医生的工作效率,对智慧医疗的发展有重要意义。

项目名称

北京市自然科学基金青年项目

项目课题来源

北京市科学技术委员会;中关村科技园区管理委员会

摘要

依存句法分析是针对给定的句子分析词语之间的修饰关系,对句子在语法层面进行描述,为多项下游任务提供基础知识。在医学领域,依存句法分析在医疗文本的理解、医学事件抽取、家族病史抽取等任务中起重要作用。但是,医学领域的依存句法树资源稀少,医学文本多样且复杂,医学依存分析任务存在严重的数据稀疏及知识匮乏现象,导致性能不理想。为解决该问题,本项目利用大规模预训练模型蕴含的知识,从多方面指导医学文本的依存句法分析,根据语境识别领域特有词汇,增强句法模型的泛化能力,并对医学领域依存树进行数据增强,进一步提高医学依存句法分析的性能。本项目完成了以下内容:(1)构建了Wasserstein生成式对抗网络模型,根据语境识别词汇的领域属性;(2)隐式地,将领域属性以词向量拼接的方式应用在医学依存句法分析任务中,实现了部分去词汇化,减小领域之间的词汇鸿沟,提高了句法模型的领域迁移性能;(3)显式地,依据不同预训练模型获取近义词,将源领域特有的词汇替换成目标领域中相似词汇,实现数据增强;(4)标注了2000句医学领域的中文依存句法树,为依存句法分析及下游任务增添数据来源。本项目提出的识别词汇领域属性模型,并利用知识指导其隐式和显式应用,有利于将知识注入其他的自然语言理解任务中,缓解数据稀疏和知识匮乏的现象;从模型和数据层面改善了现有的依存句法分析模型,提高了依存句法分析的性能,加深对病历文本的分析和理解,提取出更有价值的信息,对智慧医疗的发展有重要意义。

试试对话AI技术经理人
WENXIAOGUO
问小果
该成果有哪些相似成果?
该成果可能有哪些需求方?
该成果的市场前景如何?
北京信息科技大学的相关成果还有哪些?