CN115795008B口语对话状态追踪模型训练方法及口语对话状态追踪方法-转果果

王

王德远机构暂无

技术领域暂无

袁

袁彩霞机构暂无

技术领域暂无

高

高晖机构暂无

技术领域暂无

王

王小捷机构暂无

技术领域暂无

许

许文俊机构暂无

技术领域暂无

张

张平机构暂无

技术领域暂无

冯

冯方向机构暂无

技术领域暂无

摘要

本申请公开了一种口语对话状态追踪模型训练方法及口语对话状态追踪方法，其中训练方法包括：获取预设的样本数据；样本数据包括正确的对话过程文本数据、经过噪声融合处理的对话过程文本数据和目标槽值标签；利用口语对话状态追踪模型，基于经过噪声融合处理的所述对话过程文本数据，进行文本纠错和槽值提取，并基于文本纠错和槽值提取的结果、正确的对话过程文本数据和目标槽值标签，计算总损失函数值，利用总损失函数值，对口语对话状态追踪模型的参数进行优化调整；其中，基于对话过程文本数据在文本纠错前后分别对应的语义向量的拼接结果，利用对话状态追踪解码器，进行槽值提取。采用本申请，可以提高口语对话状态追踪的准确度。

1.一种口语对话状态追踪模型的训练方法，其特征在于，包括：获取预设的样本数据；所述样本数据包括正确的对话过程文本数据、经过噪声融合处理的所述对话过程文本数据和目标槽值标签；利用口语对话状态追踪模型，基于经过噪声融合处理的所述对话过程文本数据，进行文本纠错和槽值提取，并基于所述文本纠错和所述槽值提取的结果、所述正确的对话过程文本数据和所述目标槽值标签，计算总损失函数值，利用所述总损失函数值，对所述口语对话状态追踪模型的参数进行优化调整；其中，基于所述对话过程文本数据在所述文本纠错前后分别对应的语义向量的拼接结果，利用对话状态追踪解码器，进行所述槽值提取；其中，所述基于所述文本纠错和所述槽值提取的结果、所述正确的对话过程文本数据和所述目标槽值标签，计算总损失函数值包括：按照，计算第一损失函数值；其中，为预设的超参数，，表示经过噪声融合处理的所述对话过程文本数据；表示所述正确的对话过程文本数据，，n表示中的词数；表示中的第i个词，表示纠错解码器的输出概率，表示在对进行解码之前已经解码出的所有词，表示不是实体词，表示是实体词；按照，计算第二损失函数值；其中，表示所述目标槽值标签；表示所述对话状态追踪解码器的输出概率;计算所述第一损失函数值与所述第二损失函数值的和，得到所述总损失函数值;所述方法进一步包括：利用预先训练的第一编码器，对纠错编码器和所述对话状态追踪编码器进行初始化；利用预先训练的第一解码器，对所述纠错解码器和所述对话状态追踪解码器进行初始化；其中，所述第一编码器和所述第一解码器的训练方法包括：获取预设的预训练样本数据集合，所述预训练样本数据集合包括纠错任务样本数据集合和对话状态追踪任务样本数据集合；所述预训练样本数据集合中的每个样本数据包括任务类型指示信息、正确的对话过程文本数据和相应的经过噪声融合处理的对话过程文本数据，以及目标槽值标签；所述任务类型包括纠错任务和对话状态追踪任务；确定所述纠错任务样本数据集合中每个样本数据的句子困惑度，基于所述句子困惑度和预设的句子困惑度等级划分策略，确定相应样本数据的句子困惑度等级；按照所述句子困惑度等级，对所述纠错任务样本数据集合中的样本数据进行分类，得到每种句子困惑度等级各自对应的纠错任务样本数据子集；将所述对话状态追踪任务样本数据集合分别与每个所述纠错任务样本数据子集组合，得到相应句子困惑度等级对应的预训练样本数据集合组；按照句子困惑度等级由低至高的顺序，依次选择一个所述预训练样本数据集合组，利用该预训练样本数据集合组中的样本数据，对编解码器训练模型进行训练；其中，所述训练包括：从所述预训练样本数据集合组中，批量选取样本数据，利用所选取的每批样本数据，对编解码器训练模型进行相应任务的训练；每批样本数据中纠错任务和对话状态追踪任务各占一半样本数据；所述编解码器训练模型由所述第一编码器和所述第一解码器构成。 2.根据权利要求1所述的方法，其特征在于，所述进行文本纠错和槽值提取包括：生成所述对话过程文本数据的向量表示；基于所述向量表示，利用纠错编码器和纠错解码器，进行文本纠错处理，得到所述对话过程文本数据的第一语义向量；基于所述向量表示，利用对话状态追踪编码器进行编码处理，得到所述对话过程文本数据的第二语义向量；将所述第一语义向量和所述第二语义向量进行拼接，并利用自注意力网络层，对所述拼接结果进行语义融合；将所述语义融合的结果，输入至对话状态追踪解码器进行解码处理，得到所述对话过程文本数据的槽值提取结果。 3.根据权利要求2所述的方法，其特征在于，所述基于所述向量表示，利用纠错编码器和纠错解码器，进行文本纠错处理包括：将所述向量表示输入至所述纠错编码器进行编码处理，并将相应的编码处理结果输入至所述纠错解码器进行解码处理，得到所述第一语义向量。 4.根据权利要求1所述的方法，其特征在于，所述噪声融合处理包括：将所述对话过程文本数据转换为语音数据；将所述语音数据与预设的噪声音频进行融合；将所述融合的结果转换为文本数据，得到经过噪声融合处理的所述对话过程文本数据。 5.一种口语对话状态追踪方法，其特征在于，包括：获取目标对话过程文本数据；将所述目标对话过程文本数据，输入至预先训练的口语对话状态追踪模型进行槽值提取，得到所述目标对话过程文本数据对应的槽值；其中，所述口语对话状态追踪模型基于权利要求1至4的任一训练方法得到。

暂无引用专利