有效
一种元认知驱动的启发式提示问题推荐方法
吴雯、周婧、叶光泽、贺樑
华东师范大学
吴
吴雯机构 暂无
技术领域 暂无
周
周婧机构 暂无
技术领域 暂无
叶
叶光泽机构 暂无
技术领域 暂无
贺
贺樑机构 暂无
技术领域 暂无
摘要
本发明公开了一种元认知驱动的的启发式提示问题推荐方法,其特点是该方法采用基于情绪和认知风格的知识追踪模块与性格加强的错因分析模块和元认知策略驱动的启发式提示问题推荐模块构建的推荐系统,实现启发式提示问题推荐,所述知识追踪模块采用LSTM模型以及情绪与认知风格辅助任务,得到用户当前知识水平的向量表示;所述错因分析模块通过注意力机制得到错因表示;所述启发式提示问题推荐模块采用大语言模型生成供选择的启发式提示问题进行排序,将排名最靠前的启发式问题推荐给用户。本发明与现有技术相比具有推荐结果更加准确,可解释性更强,向用户推荐更高质量的启发式提示问题,以提高用户的元认知能力,从而实现人机元认知的协同提升。
1.一种元认知驱动的启发式提示问题推荐方法,其特征在于,该方法采用基于情绪和认知风格的知识追踪模块与性格加强的错因分析模块和元认知策略驱动的启发式提示问题推荐模块构建的推荐系统,实现启发式提示问题推荐,所述基于情绪和认知风格的知识追踪模块从用户的历史做题记录抽取出用户的认知风格和知识掌握程度,从当前对话抽取出用户的当前情绪,构建基于情绪和认知风格的知识水平表示;所述错因分析模块从历史对话抽取用户性格,使用注意力机制捕捉当前知识水平下性格和错题之间的关系,构建基于性格的错因表示;所述元认知策略驱动的启发式提示问题推荐模块基于错因表示,使用大语言模型生成一系列供选择的启发式提示问题,利用图神经网络对生成的启发式提示问题进行排序,在强化学习框架下不断调整提示策略,以协同提升人机元认知水平;所述错因分析模块具体包含下述两部分:1)生成用户性格表示部分根据用户的历史对话文本信息由下述(i)式计算性格表示 : (i);其中, 为历史对话中第 个心理词库类别词的词频; 为历史对话中第 个心理词库类别词的逆向文本频率; 为第 个心理词库类别与情绪的相关因子;2)基于用户性格的错因分析部分2-2-1:根据性格-错因矩阵 ,得到性格造成的错因 ;根据错题-性格矩阵 ,得到最容易做错该题的性格 2-2-2:将题目表示 与知识点矩阵 中每一个知识点做内积,经激活函数得到题目与知识点的相关性,即由下述(j)式表示的注意力权重 : (j);2-2-3:根据注意力权重 由下述(k)式计算知识水平造成的错因 : (k);其中, 表示 中对应知识点与错因的相关程度;2-2-4:根据错因 和错因 由下述(l)式计算错因 : (l);其中, 为最容易做错该题的性格 与用户性格 进行内积得到,表示二者的匹配程度,其计算如下述(m)式所示: (m);其中, 为性格表示 的转置。
2.根据权利要求1所述的元认知驱动的启发式提示问题推荐方法,其特征在于,所述知识追踪模块具体包含下述三部分:1)生成用户的情绪与认知风格隐式表示部分1-1-1:根据用户的当前对话文本信息,使用TF-IDF算法抽取情绪特征计算用户的情绪表示 ,具体由下述(a)式表示为: (a);其中, 为当前对话中第 个心理词库类别词的词频; 为当前对话中第 个心理词库类别词的逆向文本频率; 是第 个心理词库类别与情绪的相关因子;1-1-2:将用户 的情绪表示 与认知表示 进行拼接,由下述(b)式得到情绪与认知风格隐式表示 : (b);其中, 表示拼接操作;所述认知表示 由问卷调查结果经过one-hot编码得到;2)基于情绪与认知风格的知识水平表示部分根据做题序列 ,使用LSTM模型获得用户当前的知识水平,具体如下:1-2-1:基于用户情绪与认知风格隐式表示 由下述(c)式得到题目 对用户 的难度表示 : (c);其中, 是基于题目包含的知识点难度和题目特点生成题目的难度表示; 是将用户当前状态整合到题目客观难度中的输入集成函数;1-2-2:将题目 对应的融合了用户当前情绪与认知风格的题目难度表示 和答题表示 进行拼接,由下述(d)式得到LSTM模型的输入向量 : (d);1-2-3:使用遗忘门 和输入门 由下述(e)式计算单元状态 : (e);其中, 为单元状态更新值;遗忘门 控制 中用于更新 的特征;输入门 控制 中用于更新 的特征;1-2-4:使用输出门 和单元状态 由下述(f)式计算当前知识水平 : (f);3)预测未掌握题目部分1-3-1:根据当前知识水平表示 由下述(g)式计算学生对题目的掌握程度 : (g);其中, 为sigmoid函数; 的长度等于题目长度;1-3-2:训练目标是学生答题序列的负对数似然,使用二元交叉熵BCE由下述(h)式计算损失 : (h);其中, 是二元交叉熵损失。
3.根据权利要求1所述的元认知驱动的启发式提示问题推荐方法,其特征在于,所述启发式提示问题推荐模块具体包含下述三部分:1)启发式提示问题生成部分根据用户的个体性格、知识水平和历史学习数据信息,构建语言生成限制条件,采用大语言模型生成一系列可供选择的启发式提示问题;2)启发式提示问题推荐部分3-2-1:构建提示问题图 ,其中节点集合 表示提示问题节点的集合,边集合 表示提示问题节点之间的关系;3-2-2:采用基于图注意力机制的图神经网络模型进行排序,该图神经网络模型由下述(n)式表示为: (n);其中, 为节点 在第 层的隐藏状态; 为节点 的邻居节点隐藏状态的聚合信息; 为第 层的参数;3-2-3:通过迭代计算隐藏状态获得每个提示问题节点的最终表示 ,而后与用户的知识水平表示 和情绪表示 进行连接,由下述(o)式得到综合的节点特征表示 : (o);其中, 表示向量的连接操作;3-2-4:使用全连接层由下述(p)式预测节点的排序分数 : (p);其中, 为激活函数; 和 分别是全连接层的权重矩阵和偏置向量;3-2-5:根据得到的排序分数对节点进行排序,将排名最靠前的启发式提示问题推荐给用户;3)基于强化学习的人机元认知协同提升部分3-3-1:将对话内容、用户特征和系统状态表示为状态向量 ,根据当前状态 ,使用策略网络由下述(q)式生成动作 : (q);其中, 表示策略网络;3-3-2:将用户接受提示问题后的答题情况作为反馈信号 ,当用户答题正确时,根据反馈信号 由下述(r)式计算奖励信号 : (r);其中, 为折扣因子,控制未来奖励对当前决策的重要性,其取值范围为 ; 为下一时刻的奖励信号;3-3-3:将策略网络参数和目标策略网络参数分别表示为 和 ,将价值函数网络参数和目标价值函数网络参数分别表示为 和 ;3-3-4:基于目标策略网络参数 ,使用目标价值函数网络计算目标价值函数 且由下述(s)式表示为; (s);其中, 分别为下一个状态和下一个动作;3-3-5:基于策略网络参数 ,使用价值函数网络计算当前价值函数 ,且由下述(t)式表示为: (t);其中, 和 分别为当前状态和当前动作;3-3-6:使用奖励信号 和目标价值函数 由下述(u)式计算时间差分误差 : (u);其中, 是折扣因子;3-3-7:通过对策略网络参数 的梯度进行反向传播来更新参数,具体如下述(v)式表示为: (v);其中, 是策略网络的学习率;3-3-8:通过对价值网络参数 的梯度进行反向传播来更新参数,具体如下述(w)式表示为: (w);其中, 为价值函数网络的学习率。



