有效

一种深度语音特征的构建及心理健康筛查方法

邵珠宏、张佐闱、尚媛园、李世豪、胡强、张岩丽、宋巍、谭小慧、梁佩鹏
深圳市日新信息科技有限公司
邵珠宏机构 暂无
技术领域 暂无
张佐闱机构 暂无
技术领域 暂无
尚媛园机构 暂无
技术领域 暂无
李世豪机构 暂无
技术领域 暂无
胡强机构 暂无
技术领域 暂无
张岩丽机构 暂无
技术领域 暂无
宋巍机构 暂无
技术领域 暂无
谭小慧机构 暂无
技术领域 暂无
梁佩鹏机构 暂无
技术领域 暂无

摘要

本发明提出一种深度语音特征的构建及心理健康筛查方法,包括,获取语音数据,对语音数据进行预处理;对预处理后的语音数据进行快速傅里叶变换得到功率谱,对功率谱应用梅尔滤波器组并取对数得到梅尔谱图;对于每个帧的对数梅尔谱图,计算其一阶和二阶差分;根据得到的对数梅尔谱图及其一阶和二阶差分构建三通道图像;对三通道图像进行处理以提取深度时序特征和深度空间特征;将深度时序特征与深度空间特征进行拼接并使用全连接层进行降维,从而得到融合语音特征;对融合语音特征,采用包含多任务学习策略的预测网络进行心理健康的筛查及严重程度的预测。通过本发明提出的方法,能够应用于心理与精神健康监测,实现早发现、早干预、早治疗。