有效

一种基于通道贡献度的批归一化掩码剪枝防御方法

陈壮志、陈佳、沈天逸、侯嘉烨、徐东伟、宣琦、尹鹏
杭州市滨江区浙工大人工智能创新研究院
陈壮志机构 暂无
技术领域 暂无
陈佳机构 暂无
技术领域 暂无
沈天逸机构 暂无
技术领域 暂无
侯嘉烨机构 暂无
技术领域 暂无
徐东伟机构 暂无
技术领域 暂无
宣琦机构 暂无
技术领域 暂无
尹鹏机构 暂无
技术领域 暂无

摘要

本发明公开了一种基于通道贡献度的批归一化掩码剪枝防御方法,属于人工智能安全与深度学习模型防护技术领域。该方法针对现有防御技术在中毒攻击下模型鲁棒性不足、难以在少量干净样本条件下有效抑制后门的问题,通过触发器反演生成伪中毒样本,基于干净样本与伪中毒样本对模型各批归一化层通道进行掩码操作并计算通道贡献度评分,依据评分对低贡献度通道执行批归一化掩码置零以实现结构化剪枝,随后对剪枝后模型进行微调以恢复性能,并通过迭代优化使模型性能趋于稳定。本发明能够在基本保持模型正常分类精度的同时显著降低后门攻击成功率,提升模型在电磁信号识别等实际应用中的安全性与可靠性。