CN121303229B一种基于通道贡献度的批归一化掩码剪枝防御方法-转果果

陈

陈壮志机构暂无

技术领域暂无

陈

陈佳机构暂无

技术领域暂无

沈

沈天逸机构暂无

技术领域暂无

侯

侯嘉烨机构暂无

技术领域暂无

徐

徐东伟机构暂无

技术领域暂无

宣

宣琦机构暂无

技术领域暂无

尹

尹鹏机构暂无

技术领域暂无

摘要

本发明公开了一种基于通道贡献度的批归一化掩码剪枝防御方法，属于人工智能安全与深度学习模型防护技术领域。该方法针对现有防御技术在中毒攻击下模型鲁棒性不足、难以在少量干净样本条件下有效抑制后门的问题，通过触发器反演生成伪中毒样本，基于干净样本与伪中毒样本对模型各批归一化层通道进行掩码操作并计算通道贡献度评分，依据评分对低贡献度通道执行批归一化掩码置零以实现结构化剪枝，随后对剪枝后模型进行微调以恢复性能，并通过迭代优化使模型性能趋于稳定。本发明能够在基本保持模型正常分类精度的同时显著降低后门攻击成功率，提升模型在电磁信号识别等实际应用中的安全性与可靠性。

1.一种基于通道贡献度的批归一化掩码剪枝防御方法，其特征在于，应用于无线电信号调制识别模型的抗后门攻击防御，包括以下步骤：利用少量干净样本通过触发器反演技术生成伪中毒样本，其中所述干净样本包括干净的电磁信号调制样本，所述伪中毒样本包括伪中毒电磁信号样本；所述生成伪中毒样本的过程包括：定义触发器由掩码矩阵和触发模式组成，所述掩码矩阵取值在0到1之间，所述触发模式初始化为具有随机性的小幅噪声；通过交替优化策略，固定掩码矩阵时使用梯度下降更新触发模式，并投影到幅值约束范围内，固定触发模式时使用梯度下降更新掩码矩阵，并应用软阈值操作以诱导稀疏性；在优化结束后，对掩码矩阵进行二值化处理，得到二值掩码；将二值掩码与触发模式相结合，形成最终触发器，并叠加到干净样本上生成伪中毒样本；基于所述干净样本和伪中毒样本，对模型的批归一化层逐通道进行掩码操作，测量掩码置零前后在干净样本分类准确率与伪中毒样本攻击成功率上的变化，以计算每个通道的贡献度评分；所述计算每个通道的贡献度评分的过程包括：在未屏蔽任何通道时，记录模型在干净样本集上的基线分类准确率和在伪中毒样本集上的基线攻击成功率；对于每个批归一化层的每个通道，临时将该通道的掩码置零，并在相同样本集上重新测量分类准确率和攻击成功率；计算屏蔽该通道后分类准确率的下降量和攻击成功率的下降量；将分类准确率的下降量乘以第一权重系数，将攻击成功率的下降量乘以第二权重系数，并将两者相减得到通道贡献度评分；根据所述贡献度评分对低贡献度通道执行批归一化掩码置零操作，实现结构化剪枝；对剪枝后的模型使用干净样本进行微调，以恢复干净样本上的识别性能；迭代执行所述剪枝与微调过程，直至模型在电磁信号调制识别任务上的性能稳定。 2.根据权利要求1所述的方法，其特征在于，执行结构化剪枝的过程包括：收集所有批归一化层的所有通道的贡献度评分；将所述评分按值从低到高进行全局排序；根据预设的剪枝比例，从排序列表中选择排名靠前的多个通道，使得所选通道的数量占总通道数量的比例等于剪枝比例；对每个被选中的通道，将其在批归一化层中的掩码参数永久置零，从而在模型前向传播中屏蔽该通道。 3.根据权利要求1所述的方法，其特征在于，所述对剪枝后的模型进行微调的过程包括：使用干净样本集作为训练数据；定义损失函数为模型输出与真实标签之间的交叉熵损失；在反向传播过程中，仅计算未被掩码的模型参数的梯度，并更新这些参数，而被掩码的通道参数梯度为零，不进行更新；迭代训练过程直至损失函数收敛或达到预设迭代次数。 4.根据权利要求1所述的方法，其特征在于，迭代执行剪枝与微调的过程包括：完成一次剪枝和微调后，在验证集上计算干净样本分类准确率和伪中毒样本攻击成功率；比较当前性能与前一迭代的性能，如果分类准确率的变化小于预设阈值且攻击成功率低于目标值，则终止过程；否则，以相同或更保守的剪枝比例再次执行贡献度评分计算、剪枝和微调。 5.一种基于通道贡献度的批归一化掩码剪枝防御系统，其特征在于，用于实施权利要求1-4中任一项所述的方法，所述系统包括：样本生成模块，用于利用少量干净样本通过触发器反演技术生成伪中毒样本；贡献度计算模块，用于基于所述干净样本和伪中毒样本，对模型的批归一化层逐通道进行掩码操作，测量掩码置零前后在干净样本分类准确率与伪中毒样本攻击成功率上的变化，以计算每个通道的贡献度评分；剪枝模块，用于根据所述贡献度评分对低贡献度通道执行批归一化掩码置零操作，实现结构化剪枝；微调模块，用于对剪枝后的模型使用干净样本进行微调，以恢复干净样本上的识别性能；迭代控制模块，用于迭代执行所述剪枝与微调过程，直至模型性能稳定。 6.一种计算机终端设备，其特征在于，包括：一个或多个处理器；存储器，与所述处理器耦接，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-4中任一项所述方法的步骤。 7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-4中任一项所述方法的步骤。 8.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-4中任一项所述的方法的步骤。

CN112949840ACN112949840A CN113204745ACN113204745A