CN116523806B一种基于换脸的合成人脸修复方法、介质和电子设备-转果果

曹

曹娟机构暂无

技术领域暂无

方

方凌飞机构暂无

技术领域暂无

黄

黄子尧机构暂无

技术领域暂无

唐

唐胜机构暂无

技术领域暂无

摘要

本发明提供了一种基于换脸的合成人脸修复方法、介质和电子设备，其中，合成人脸修复模型的构建方法包括：利用合成人脸图像集训练第一自编码器进行人脸图像重构，得到经训练的第一自编码器，其中，第一自编码器包括编码器和解码器，合成人脸图像集包括目标人物说话状态的合成人脸图像；利用源人脸图像集训练第二自编码器进行人脸图像重构，得到经训练的第二自编码器，其中，第二自编码器包括编码器和解码器，源人脸图像集包括目标人物正常说话状态的人脸图像；构建用于对人脸图像进行修复的人脸修复模型，其由经训练的第一自编码器的编码器以及经训练的第二自编码器的解码器构成；以得到能够对合成人脸进行高效、高质量修复的人脸修复模型。

1.一种合成人脸修复模型的构建方法，其特征在于，包括：利用合成人脸图像集训练第一自编码器进行人脸图像重构，得到经训练的第一自编码器，其中，第一自编码器包括编码器和解码器，合成人脸图像集包括目标人物说话状态的合成人脸图像；利用源人脸图像集训练第二自编码器进行人脸图像重构，得到经训练的第二自编码器，其中，第二自编码器包括编码器和解码器，源人脸图像集包括目标人物正常说话状态的人脸图像；构建用于对人脸图像进行修复的人脸修复模型，其由经训练的第一自编码器的编码器以及经训练的第二自编码器的解码器构成。 2.根据权利要求1所述的方法，其特征在于，所述源人脸图像集是由目标人物正常说话状态下录制的源视频中的多张源人脸图像构成，所述合成人脸图像集是由语音驱动人脸唇形技术基于所述源视频合成的合成视频中的多张合成人脸图像构成。 3.根据权利要求2所述的方法，其特征在于，合成人脸图像集中至少部分合成人脸图像存在图像质量问题，所述图像质量问题包括重影、唇部区域皮肤纹理不一致、唇部在人脸面部的位置不协调、唇部动作与面部肌肉不协调和同一环境不同合成人脸图像的面部光照不一致或者其组合。 4.根据权利要求3所述的方法，其特征在于，源人脸图像没有合成人脸图像的图像质量问题或者源人脸图像的图像质量问题比合成人脸图像的图像质量问题更轻。 5.根据权利要求2所述的方法，其特征在于，所述合成人脸图像集中的每一张合成人脸图像均在所述源人脸图像集中对应一张源人脸图像，该源人脸图像是生成该合成人脸图像的基础。 6.根据权利要求2-5之一所述的方法，其特征在于，语音驱动人脸唇形技术包括Wav2Lip、PCAVS或者Live Speech Portraits中的技术。 7.根据权利要求1-5之一所述的方法，其特征在于，第一自编码器和第二自编码器均为神经网络模型且结构相同，所述神经网络模型包括SAE模型或者SAEHD模型。 8.一种修复合成图像方法，其特征在于，包括：获取合成图像中目标人物的合成人脸图像；将目标人物的合成人脸图像输入权利要求1-7之一所述的合成人脸修复模型的构建方法构建的合成人脸修复模型，得到经修复的合成人脸图像；利用经修复的合成人脸图像替换合成图像中目标人物的合成人脸图像。 9.一种基于换脸的合成人脸修复方法，其特征在于，包括：获取目标人物正常说出第一内容时录制的源视频以及由语音驱动人脸唇形技术基于所述源视频合成的目标人物说出第二内容时的合成视频；获取包括源视频中目标人物的人脸图像的源人脸图像集，以及获取包括合成视频中目标人物的合成人脸图像的合成人脸图像集；获取基于所述源人脸图像集和所述合成人脸图像集根据权利要求1-7之一所述的合成人脸修复模型的构建方法构建的合成人脸修复模型；将合成视频的各个视频帧的合成人脸图像分别输入到合成人脸修复模型，得到各个视频帧的经修复的合成人脸图像并用于替换合成视频中对应的合成人脸图像。 10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序可被处理器执行以实现权利要求1至9中任一项所述方法的步骤。 11.一种电子设备，其特征在于，包括：一个或多个处理器；以及存储器，其中存储器用于存储可执行指令；所述一个或多个处理器被配置为经由执行所述可执行指令以实现权利要求1至9中任一项所述方法的步骤。

CN110889381ACN110889381A CN113592724ACN113592724A