CN116882480B一种面向隐私保护的扩散模型驱动的无监督域泛化方法-转果果

王

王伟机构暂无

技术领域暂无

孔

孔文康机构暂无

技术领域暂无

吕

吕晓婷机构暂无

技术领域暂无

刘

刘鹏睿机构暂无

技术领域暂无

陈

陈国荣机构暂无

技术领域暂无

陈

陈政机构暂无

技术领域暂无

刘

刘敬楷机构暂无

技术领域暂无

祝

祝咏升机构暂无

技术领域暂无

胡

胡福强机构暂无

技术领域暂无

段

段莉机构暂无

技术领域暂无

李

李超机构暂无

技术领域暂无

刘

刘吉强机构暂无

技术领域暂无

摘要

本发明提供了一种面向隐私保护的扩散模型驱动的无监督域泛化方法。该方法包括：目标服务器把训练完成的扩散模型和初始化完成的全局模型发送到各个客户端；各个客户端从扩散模型中采样出虚拟目标域数据，提取出域的特异特征和共享特征，各个客户端把域的共享特征和训练后的客户端模型上传到目标域中的目标服务器，目标服务器通过各客户端模型对目标域的样本进行联邦置信度投票，生成虚拟预测域；目标服务器根据各个客户端对虚拟预测域的贡献，动态调整各个客户端模型的权重，使用联邦置信度投票出的虚拟预测域，得到用于下一轮的联邦下发的全局模型。本发明使用扩散模型能够对目标域的数据进行较好的隐私保护，并有足够的通用性，降低了通讯压力。

1.一种面向隐私保护的扩散模型驱动的无监督域泛化方法，其特征在于，包括：步骤S1：在目标域中的目标服务器上训练扩散模型；步骤S2：所述目标服务器把训练完成的扩散模型和初始化完成的全局模型发送到各个客户端；步骤S3：各个客户端接收到全局模型后，从扩散模型中采样出虚拟目标域数据，对虚拟目标域数据进行解耦表征学习，提取出域的特异特征和共享特征，利用特异特征中的分类器构成本地的客户端模型，对客户端模型进行训练；步骤S4：各个客户端把域的共享特征和训练后的客户端模型上传到目标域中的目标服务器，目标服务器通过各客户端模型利用域的共享特征对目标域的样本进行联邦置信度投票，投票出的最大可能的预测数据，得到概率权重矩阵，生成虚拟预测域；步骤S5：目标服务器根据各个客户端对虚拟预测域的贡献，动态调整各个客户端模型的权重，将更新后的各个客户端模型进行聚合，得到更新后的全局模型；步骤S6：使用联邦置信度投票出的虚拟预测域对更新后的全局模型进行微调，得到用于下一轮的联邦下发以及目标域样本标签预测的新模型。 2.根据权利要求1所述的方法，其特征在于，所述的步骤S1：在目标域中的目标服务器上训练扩散模型，包括：在目标服务器上训练扩散模型U θ ，从分布中随机抽取数据向数据逐渐添加噪声直到第T次计算后，获得扩散模型U θ 用一个马尔可夫链来描述，即t＝1,…,T，其中β t 是一个线性插值从0.0001到0.02的参数，T是扩散步数；所述扩散模型用来生成跟目标域数据集相同分布的虚拟数据域的，在客户端的源域基于扩散模型通过高斯噪声还原出与目标域相似分布的数据。 3.根据权利要求2所述的方法，其特征在于，所述的步骤S3：各个客户端接收到全局模型后，从扩散模型中采样出虚拟目标域数据，对虚拟目标域数据进行解耦表征学习，提取出域的特异特征和共享特征，利用特异特征中的分类器构成本地的客户端模型，对客户端模型进行训练，包括：全局模型的下发包括三个部分：提取域共享特征、标记分类器和域分类器，标记分类器中包含了域的特异特征以及域单独的分类器权重，各个客户端模型从扩散模型中采样出虚拟目标域的样本数据使用特征提取器将样本数据映射到特征空间并获得域的共享特征和特异特征，利用特异特征中的标签分类器构成本地的客户端模型，对客户端模型进行训练，标签分类器根据特征来预测标签类别。 4.根据权利要求3所述的方法，其特征在于，所述的步骤S4：各个客户端把域的共享特征和训练后的客户端模型上传到目标域中的目标服务器，目标服务器通过各客户端模型利用域的共享特征对目标域的样本进行联邦置信度投票，投票出的最大可能的预测数据，得到概率权重矩阵，生成虚拟预测域，包括：各个客户端把域的共享特征和训练后的客户端模型上传到目标域中的目标服务器，目标服务器利用各源域的共识知识扩展一个虚拟域 5.根据权利要求4所述的方法，其特征在于，所述的步骤S5：目标服务器根据各个客户端对虚拟预测域的贡献，动态调整各个客户端模型的权重，将更新后的各个客户端模型进行聚合，得到更新后的全局模型，包括：定义总体知识质量为其中S′∈S，n CK 表示超过CK的域数量，max函数为求CK函数概率最大值，也就是预测的标签分类值，根据CQ每个客户端的知识贡献计算为CC(S k )＝CQ(S)-CQ(S\{S k })，用和CC(Sk)去重新调整客户端模型L k 的权重，计算为其中目标服务器将更新后的各个客户端模型进行聚合，得到更新后的全局模型G。 6.根据权利要求5所述的方法，其特征在于，所述的步骤S6：目标服务器通过更新后的全局模型对目标域的样本进行联邦置信度投票，获取所述目标域的样本的预测标签，包括：将每个客户端上本地训练的客户端模型L k 视为任务，将通过共识聚焦聚合的全局模型G视为预训练模型，使用全局模型G学习联邦置信度投票生成的虚拟预测域其中y K+2 ＝argmax c (P×η)，而是每个源域对目标域的预测概率，为概率权重矩阵；从虚拟预测域中采样出样本x K+2 ，对全局模型G进行虚拟特征学习得到使得目标域能学习到各源域的特征分布，对更新后的全局模型进行微调，得到用于下一轮的联邦下发以及目标域样本标签预测的新的全局模型。

CN114692741ACN114692741A CN113420888ACN113420888A