1.一种面向隐私保护的扩散模型驱动的无监督域泛化方法,其特征在于,包括:步骤S1:在目标域中的目标服务器上训练扩散模型;步骤S2:所述目标服务器把训练完成的扩散模型和初始化完成的全局模型发送到各个客户端;步骤S3:各个客户端接收到全局模型后,从扩散模型中采样出虚拟目标域数据,对虚拟目标域数据进行解耦表征学习,提取出域的特异特征和共享特征,利用特异特征中的分类器构成本地的客户端模型,对客户端模型进行训练;步骤S4:各个客户端把域的共享特征和训练后的客户端模型上传到目标域中的目标服务器,目标服务器通过各客户端模型利用域的共享特征对目标域的样本进行联邦置信度投票,投票出的最大可能的预测数据,得到概率权重矩阵,生成虚拟预测域;步骤S5:目标服务器根据各个客户端对虚拟预测域的贡献,动态调整各个客户端模型的权重,将更新后的各个客户端模型进行聚合,得到更新后的全局模型;步骤S6:使用联邦置信度投票出的虚拟预测域对更新后的全局模型进行微调,得到用于下一轮的联邦下发以及目标域样本标签预测的新模型。
2.根据权利要求1所述的方法,其特征在于,所述的步骤S1:在目标域中的目标服务器上训练扩散模型,包括:在目标服务器上训练扩散模型U θ ,从分布 中随机抽取数据 向数据逐渐添加噪声 直到第T次计算后,获得 扩散模型U θ 用一个马尔可夫链来描述,即t=1,…,T,其中β t 是一个线性插值从0.0001到0.02的参数,T是扩散步数;所述扩散模型用来生成跟目标域数据集相同分布的虚拟数据域的,在客户端的源域基于扩散模型通过高斯噪声还原出与目标域相似分布的数据。
3.根据权利要求2所述的方法,其特征在于,所述的步骤S3:各个客户端接收到全局模型后,从扩散模型中采样出虚拟目标域数据,对虚拟目标域数据进行解耦表征学习,提取出域的特异特征和共享特征,利用特异特征中的分类器构成本地的客户端模型,对客户端模型进行训练,包括:全局模型的下发包括三个部分:提取域共享特征、标记分类器和域分类器,标记分类器中包含了域的特异特征以及域单独的分类器权重,各个客户端模型从扩散模型中采样出虚拟目标域的样本数据 使用特征提取器将样本数据 映射到特征空间 并获得域的共享特征 和特异特征,利用特异特征中的标签分类器 构成本地的客户端模型,对客户端模型进行训练,标签分类器 根据特征 来预测标签类别。
4.根据权利要求3所述的方法,其特征在于,所述的步骤S4:各个客户端把域的共享特征和训练后的客户端模型上传到目标域中的目标服务器,目标服务器通过各客户端模型利用域的共享特征对目标域的样本进行联邦置信度投票,投票出的最大可能的预测数据,得到概率权重矩阵,生成虚拟预测域,包括:各个客户端把域的共享特征 和训练后的客户端模型上传到目标域中的目标服务器,目标服务器利用各源域的共识知识 扩展一个虚拟域
5.根据权利要求4所述的方法,其特征在于,所述的步骤S5:目标服务器根据各个客户端对虚拟预测域的贡献,动态调整各个客户端模型的权重,将更新后的各个客户端模型进行聚合,得到更新后的全局模型,包括:定义总体知识质量为 其中S′∈S,n CK 表示超过CK的域数量,max函数为求CK函数概率最大值,也就是预测的标签分类值,根据CQ每个客户端的知识贡献计算为CC(S k )=CQ(S)-CQ(S\{S k }),用 和CC(Sk)去重新调整客户端模型L k 的权重,计算为 其中 目标服务器将更新后的各个客户端模型进行聚合,得到更新后的全局模型G。
6.根据权利要求5所述的方法,其特征在于,所述的步骤S6:目标服务器通过更新后的全局模型对目标域的样本进行联邦置信度投票,获取所述目标域的样本的预测标签,包括:将每个客户端上本地训练的客户端模型L k 视为任务,将通过共识聚焦聚合的全局模型G视为预训练模型,使用全局模型G学习联邦置信度投票生成的虚拟预测域 其中y K+2 =argmax c (P×η),而 是每个源域对目标域的预测概率, 为概率权重矩阵;从虚拟预测域 中采样出样本x K+2 ,对全局模型G进行虚拟特征学习得到 使得目标域能学习到各源域的特征分布,对更新后的全局模型进行微调,得到用于下一轮的联邦下发以及目标域样本标签预测的新的全局模型。