CN117115851B一种适用于复杂监控场景的行人属性识别方法-转果果

周

周亦博机构暂无

技术领域暂无

于

于金佐机构暂无

技术领域暂无

李

李波机构暂无

技术领域暂无

胡

胡海苗机构暂无

技术领域暂无

浦

浦世亮机构暂无

技术领域暂无

任

任文奇机构暂无

技术领域暂无

张

张世峰机构暂无

技术领域暂无

摘要

一种在监控场景下，基于去除深度模型在推理过程中学习到的冗余属性间共现偏置，以实现在变化场景下更好泛化性能的行人属性识别方法。包括：一种新的属性信息解耦特征的生成方式。在模型对某一属性的识别和推理过程中，利用特征的线性插值与标签的线性插值匹配这一先前研究中的实验观察，通过最小化该属性的特化特征与其他属性预测概率间的互信息，以减少对于其他属性信息的利用，在显著降低训练时间的前提下实现了更好的准确率；一种新的特征插值方法。本发明提出了方向‑范数分离的特征插值方法，该方法相比于原始的插值过程，可以更好地发掘与探索属性特征的分布域，进而提高了模型的最终效果；使用卷积神经网络，按照以上算法框架，以特定训练参数配置对模型进行训练，得到行人属性识别模型。本方法可以实现在发生时空变化的监控场景中更加精确和稳定的行人属性识别结果。

1.一种适用于复杂监控场景的行人属性识别方法，其特征在于包括以下步骤：S1.生成属性信息解耦后的特征，包括：在基于ConvNeXt作为特征提取器的行人属性识别模型对行人属性的识别和推理过程中，在特征的线性插值与标签的线性插值匹配的实验观察的基础上，最小化不同行人属性特化特征之间的互信息，以避免不同行人属性识别结果之间的过度相互依赖，所述步骤S1包括：S1.1)首先使用ResNet-50或者ConvNeXt-base特征提取器产生属性信息混杂的、形状为[N,K]的视觉特征，其中N为训练批次的batch大小，K为特征向量的维度，将该视觉特征经过一个权重矩阵尺寸为[K,C*K]的全连接层处理后，产生[N,C*K]尺寸的全连接层处理后特征，C为待预测属性总数，之后将此全连接层处理后特征重排，得到形状为[N,C,K]的、三维的属性特化特征矩阵A，其中A的第二个维度上每个通道中的特征分量为对应用于某一属性预测的属性特化特征向量，其中A的第二个维度上每个通道中的特征分量的形状为[N,1,K]，其中，以A[:,i,:]表示三维矩阵A的第二个维度上的第i个元素，且当A的形状为[A,B,C]时A[:,i,:]的形状为[A,C]，则期望的是A[:,j,:]所对应的属性特化特征向量仅仅包含可用于识别第j个行人属性的特征语义，而不含有任何可以降低第j个属性之外其他属性的不确定性的特征语义，即属性特化特征向量与待识别属性一一对应，S1.2)从0-1均匀分布中产生N*C个随机数，并将所生成的随机数重排为[N,C,1]形状的插值权重矩阵，并在插值权重矩阵的第三个维度进行次数为K的复制，获得形状为[N,C,K]的插值矩阵W，之后与属性特化特征矩阵A按照如下方式进行线性组合即元素维度上的相乘运算：其中A’是A在第一个维度上的随机打乱后获得的重排后属性特化特征矩阵，上式获得的随机插值后的矩阵即为经过扰动的插值后属性特化特征矩阵，S1.3)将在第二个维度上的所有属性特化特征向量相加后直接喂入分类器，并要求分类器进行对应于使用插值矩阵W进行对应属性标签插值后的标签结果的预测，其中：将形状为[N,C]的属性标签矩阵增加一个额外的维度，并在此属性标签矩阵的该额外的维度上进行K次复制操作，获得形状为[N,C,K]的三维属性标签矩阵Y，之后基于插值矩阵W，进行如下操作，以生成插值后的、三维的属性标签矩阵其中Y’矩阵是按照和生成A’时相同的打乱顺序，在第一个维度进行重排之后的重排三维标签矩阵，是形状为[N,C,K]的插值后的、三维的属性标签矩阵，之后，将插值后属性特化特征矩阵在第二个维度进行加和，获得[N,K]维度的加和降维后特征矩阵，并将加和降维后特征矩阵传入分类器，通过交叉熵损失，使得分类器产生的属性预测概率输出与上式中得到的插值后三维属性标签矩阵Y相同,即训练目标函数为其中：Loss是损失函数符号，表示用于产生反向传播进行参数更新的梯度的目标函数，P()是概率符号，表示分类器在接受括号内的输入后所输出的一组对各行人属性出现概率的预测，使用上式，使得第j个属性的预测概率值，仅仅取决于插值后属性特化特征矩阵的第二维的第j个属性特化特征，即产生插值后属性特化特征矩阵的第二维的第j个属性特化特征的插值权重与产生插值后的、三维的属性标签矩阵的第二维度的第j个属性标签的插值权重相同，，且与所遍历位置j之外其他位置所对应的属性特化特征向量的变化无关，所述目标函数保证了所遍历位置j之外其他位置所对应的属性特化特征向量中不会包含影响第j个属性预测结果的特征语义，确保了特定属性的预测概率和其他属性特化特征之间的信息解耦。 2.根据权利要求1所述的行人属性识别方法，其特征在于进一步包括训练步骤，包括：S3.1)设定行人属性识别模型的初始学习率，在特定更新步数之后，使学习率下降10％，其中训练过程采用adam优化器进行多批次参数更新，单次迭代的数据批次大小为64，S3.2)使输入图像经过双线性插值，将大小统一调整为256x 192，其中使用随机水平旋转和随机切割的数据增强方法构建一个数据批次，S3.3)设置最大训练迭代次数，在模型达到最大训练次数后，将训练收敛的模型参数保存以进行后续测试。 3.根据权利要求2所述的行人属性识别方法，其特征在于：把行人属性识别模型的初始学习率设置为0.0001。 4.根据权利要求2所述的行人属性识别方法，其特征在于：设置最大训练迭代次数为60。

CN1095168ACN1095168A CN110688888ACN110688888A