有效

一种短文本数据的事件演化分析方法

程学旗、刘盛华、李福鑫、王元卓、刘悦
中国科学院计算技术研究所
程学旗机构 暂无
技术领域 暂无
刘盛华机构 暂无
技术领域 暂无
李福鑫机构 暂无
技术领域 暂无
王元卓机构 暂无
技术领域 暂无
刘悦机构 暂无
技术领域 暂无

摘要

本发明提供一种短文本数据的事件演化分析方法,包括:根据词库和当前时段输入的短文本数据构造当前时段的文档—词项矩阵并对其进行非负矩阵分解,得到文档—事件矩阵和事件—词项矩阵;根据事件—词项矩阵计算当前时段的事件和前一时段的事件之间的相似度,根据该相似度、当前时段的事件和前一时段的剩余图构造当前时段的事件关系图;当前时段的事件关系图分割为一个或多个子图;对子图进行归类得到新生成事件集和演化事件集;根据文档—事件矩阵计算每个事件关联的文档数,并根据该文档数做演化事件集的趋势分析和预测,作为下一时段非负矩阵分解的约束条件。该方法适于动态地跟踪短文本数据的事件演化过程。