CN111401132B监控场景下高层语义指导的行人属性识别方法-转果果

胡

胡海苗机构暂无

技术领域暂无

安

安浩然机构暂无

技术领域暂无

李

李波机构暂无

技术领域暂无

浦

浦世亮机构暂无

技术领域暂无

摘要

一种监控场景下属性层次关系指导的行人属性识别方法，包括：根据行人属性的层次特性及不同层次属性间的关系改进网络结构，分层次进行属性识别并引入全连接层来学习不同层次属性间的关系；根据行人属性的位置约束改进网络结构，引入注意力机制，分别从空间域和通道域两个维度来学习注意力权重，使网络更加关注特定的身体部位；选用加权交叉熵损失函数，以各属性的正样本比例作为权重系数；把训练集输入改进后的卷积神经网络，得出行人属性识别模型；将测试集输入到行人属性识别模型中进行识别，对行人属性识别模型的实验结果进行评估；本方法可分析更深层次的行人属性，更好挖掘属性的层次关系以及位置约束，使属性识别结果更全面和准确。

1.监控场景下高层语义指导的行人属性识别方法，其特征在于包括以下步骤：S1)根据行人属性的层次特性以及不同层次属性间的关系对网络结构进行改进，分层次进行属性识别并引入全连接层来学习不同层次属性间的关系；S2)根据行人属性的位置约束对网络结构进行改进，引入注意力机制，分别从空间域和通道域两个维度来学习注意力权重，使网络更加关注特定的身体部位；S3)选用加权交叉熵损失函数，以各个属性的正样本比例作为权重系数；S4)把训练集输入改进后的卷积神经网络，得出行人属性识别模型；S5)将测试集输入到行人属性识别模型中进行识别，对行人属性识别模型的实验结果进行评估，其中：所述步骤S1)包括：S1.1)按照行人属性所处的语义抽象级别将行人属性分为低层属性、中层属性和高层属性，其中，低层属性关注于包括颜色、纹理的表观细节描述，中层属性关注于包括衣物、发型、配饰以及携带物的既包含语义信息又包含表观信息的属性描述，高层属性关注于包括性别、年龄的抽象语义描述；S1.2)在GoogLeNet中选取Inception4a/output、Inception4d/output和Inception5b/output三层的特征图用于三个不同层次的属性识别任务；S1.3)通过将低层以及中层属性的识别概率分数连接起来得到在进行高层属性识别时的先验概率，然后将其作为全连接层的输入，全连接层的输出为以此为先验的情况下得到的高层属性识别的后验概率，所述步骤S2)包括：S2.1)对行人属性数据集中的标注属性进行分类，将所有的属性分为全局属性和局部属性，其中局部属性又分为头部、上身、腰间、下身以及脚部五个区域部位相关的属性；S2.2)网络的低层特征包含有更多的包括颜色、纹理的细节信息，特征图的通道数量较少且空间分辨率较高，所以引入空间注意力机制对特征图进行重标定，进而实现对不同位置约束下的低层属性的实现；S2.3)高层特征具有更高的抽象级别和可判别性，特征图的通道数量较多且空间分辨率较低，所以引入通道注意力机制对特征图进行重标定，进而实现对不同位置约束下的高层属性的识别；S2.4)由于中层属性的识别既依赖于表观细节信息又依赖于抽象语义信息，介于低层属性和高层属性之间，所以引入双重注意力机制学习注意力权重，进而实现对不同位置约束下的中层属性的识别。 2.根据权利要求1所述的监控场景下高层语义指导的行人属性识别方法，其特征在于：所述步骤S3)中的损失函数为：其中，y和分别代表真实的和预测的属性分类结果，c代表属性编号，w c 代表属性c在训练集中正样本所占的比例，σ()为Sigmoid激活函数,log()为对数函数。 3.根据权利要求1所述的监控场景下高层语义指导的行人属性识别方法，其特征在于：所述步骤S4)包括以下具体步骤：S4.1)采用以初始学习率为0.001、指数式衰减学习率的随机梯度下降优化器和256的数据批次大小进行迭代训练；S4.2)将输入图像的大小统一调整为224×224，然后应用包括随机旋转、随机调整大小和随机水平翻转的步骤进行图像增强方式来构建一个数据批次；S4.3)设置最大迭代次数，在最大迭代次数下，不断迭代学习，直到损失函数值不再下降，行人属性识别模型收敛，保存行人外观属性识别模型参数；S4.4)完成训练，得到最终的行人外观属性识别模型。

暂无引用专利