有效

一种基于视觉语言交互式学习的AI图像检测模型优化方法

丁峰、张月、周沄鹏、魏康康、肖梦瑶
南昌大学
丁峰机构 暂无
技术领域 暂无
张月机构 暂无
技术领域 暂无
周沄鹏机构 暂无
技术领域 暂无
魏康康机构 暂无
技术领域 暂无
肖梦瑶机构 暂无
技术领域 暂无

摘要

本发明提供了一种基于视觉语言交互式学习的AI图像检测模型优化方法,涉及视觉语言处理技术领域。所述模型优化方法包括:提取图像训练集的视觉特征和文本特征,基于文本特征对视觉特征进行加权处理获得重建文本,基于视觉特征对文本特征进行加权处理获得重建图像,基于均方误差损失优化跨模态交互式重建过程的重建文本和重建图像;获取跨模态交互式重建过程中的视觉特征及文本特征,计算粗粒度代理点特征和细粒度代理点特征并构建四个字典,基于余弦相似性损失函数拉近模态之间的空间分布,并基于动量更新机制更新所述四个字典,获得优化后的AI图像检测模型。本发明通过设计跨模态交互式重建与字典学习更新,提升了模型检测AI图像的准确率。