CN119762603B一种图像生成方法及相关装置-转果果

孙

孙斌机构暂无

技术领域暂无

邓

邓兆利机构暂无

技术领域暂无

任

任海涛机构暂无

技术领域暂无

张

张峻康机构暂无

技术领域暂无

宓

宓振鹏机构暂无

技术领域暂无

摘要

本申请提供了一种图像生成方法及相关装置。电子设备可以接收并响应于第一输入，确定在第一拍摄场景下的第一场景模板模型和第一提示词。获取个人图像训练集，通过该个人图像训练集训练第一人像模型。接着，从该个人图像训练集中获取一张第一正脸图像，并基于该第一正脸图像生成第一人脸关键点图。接着，获取目标模板图像，并基于该目标模板图像生成第一骨骼关键点图。接着，将该第一骨骼关键点图中的人脸关键点替换成该第一人脸关键点图中的人脸关键点，得到姿态控制图。最后，通过文生图模型，基于姿态控制图、第一人像模型、第一场景模板模型和第一提示词，生成个性化图像。提升了生成的指定风格的图像中人像和背景的画面效果。

1.一种图像生成方法，其特征在于，包括：接收第一输入；响应于所述第一输入，确定在第一拍摄场景下的第一场景模板模型和第一提示词；获取个人图像训练集，所述个人图像训练集包括指定用户的多张个人图像；通过所述个人图像训练集训练第一人像模型，所述第一人像模型用于生成所述指定用户的人脸特征；从所述个人图像训练集中获取一张第一正脸图像，并基于所述第一正脸图像生成第一人脸关键点图；所述第一正脸图像中包括有指定用户的正脸姿态的人脸，所述第一人脸关键点图包括所述第一正脸图像中的人脸关键点；获取目标模板图像，并基于所述目标模板图像生成第一骨骼关键点图；所述目标模板图像包括模特摆出指定姿态时的人脸，所述第一骨骼关键点图包括所述目标模板图像中的人脸关键点和肢体关键点；将所述第一骨骼关键点图中的人脸关键点替换成所述第一人脸关键点图中的人脸关键点，得到姿态控制图；使用所述姿态控制图、所述第一人像模型和所述第一场景模板模型控制文生图模型基于所述第一提示词生成个性化图像，所述个性化图像包括所述指定用户在所述第一拍摄场景下摆出所述指定姿态时的人脸。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：提取所述个性化图像中人像的面部区域，得到面部掩膜图，所述面部掩膜图用于表征所述个性化图像中人像的第一面部区域；使用所述面部掩膜图、所述姿态控制图、所述第一人像模型和所述第一场景模板模型控制图生图模型对所述个性化图像中所述指定用户的人脸进行精细修复，得到目标图像。 3.根据权利要求2所述的方法，其特征在于，所述目标图像中人脸与所述第一正脸图像中人脸的相似度大于所述个性化图像中人脸与所述第一正脸图像中人脸的相似度。 4.根据权利要求2所述的方法，其特征在于，所述方法还包括：将所述第一人像模型在所述文生图模型生成所述个性化图像过程中的模型权重设置为第一权重；将所述第一场景模板模型在所述文生图模型生成所述个性化图像过程中的模型权重设置为第二权重。 5.根据权利要求4所述的方法，其特征在于，所述方法还包括：将所述第一人像模型在所述图生图模型生成所述目标图像过程中的模型权重设置为第三权重；将所述第一场景模板模型在所述图生图模型生成所述目标图像过程中的模型权重设置为第四权重，所述第四权重小于所述第三权重。 6.根据权利要求5所述的方法，其特征在于，所述第一权重小于所述第三权重，所述第二权重大于所述第四权重。 7.根据权利要求6所述的方法，其特征在于，所述第一权重等于所述第二权重。 8.根据权利要求2-7中任一项所述的方法，其特征在于，所述方法还包括：使用仿射变换矩阵对所述第一正脸图像进行仿射变换，得到第二正脸图像，所述第二正脸图像中人脸的尺寸和位置与所述目标模板图像中模特人脸的尺寸和位置一样；检测所述第二正脸图像中人脸的边缘，得到正脸边缘图；确定出正脸边缘图中眉毛的位置；从所述正脸边缘图中截取所述眉毛以上部分的边缘，得到额头边缘控制图；所述使用所述姿态控制图、所述第一人像模型和所述第一场景模板模型控制文生图模型基于所述第一提示词生成个性化图像，具体包括：使用所述姿态控制图、所述额头边缘控制图、所述第一人像模型和所述第一场景模板模型控制文生图模型基于所述第一提示词生成个性化图像。 9.根据权利要求8所述的方法，其特征在于，所述使用所述面部掩膜图、所述姿态控制图、所述第一人像模型和所述第一场景模板模型控制图生图模型对所述个性化图像中所述指定用户的人脸进行精细修复，得到目标图像，具体包括：使用所述面部掩膜图、所述额头边缘控制图、所述姿态控制图、所述第一人像模型和所述第一场景模板模型控制图生图模型对所述个性化图像中所述指定用户的人脸进行精细修复，得到目标图像。 10.根据权利要求2-7中任一项所述的方法，其特征在于，所述提取所述个性化图像中人像的面部区域，得到面部掩膜图，具体包括：分割所述个性化图像中人像的面部区域，得到初步掩膜图，所述初步掩膜图用于表征所述个性化图像中人像的第二面部区域；对所述初步掩膜图按指定比例扩充，得到所述面部掩膜图。 11.根据权利要求1-7中任一项所述的方法，其特征在于，所述通过所述个人图像训练集训练第一人像模型，具体包括：将所述个人图像训练集中图像的尺寸调整为指定尺寸；使用所述个人图像训练集中调整为所述指定尺寸后的图像训练所述指定用户的人像模型。 12.根据权利要求1-7中任一项所述的方法，其特征在于，所述将所述第一骨骼关键点图中的人脸关键点替换成所述第一人脸关键点图中的人脸关键点，得到姿态控制图，具体包括：获取目标模板图像，并基于所述目标模板图像生成第二人脸关键点图，所述第二人脸关键点图包括所述目标模板图像中的人脸关键点；确定出所述第一人脸关键点图和所述第二人脸关键点图之间的仿射变换矩阵，所述仿射变换矩阵用于表征所述第一人脸关键点图中的人脸关键点与所述第二人脸关键点图中的人脸关键点之间的尺寸与位置的变换关系；使用所述仿射变换矩阵对所述第一人脸关键点图进行仿射变换，得到第三人脸关键点图；将所述第一骨骼关键点图中的人脸关键点去除，保留肢体关键点，得到第二骨骼关键点图；将所述第三人脸关键点图中的人脸关键点融合至第二骨骼关键点图中，得到所述姿态控制图。 13.一种电子设备，其特征在于，包括一个或多个处理器和一个或多个存储器；其中，所述一个或多个存储器与所述一个或多个处理器耦合，所述一个或多个存储器用于存储计算机程序，当所述一个或多个处理器执行所述计算机程序时，使得执行如权利要求1-12中任一项所述的方法。 14.一种电子设备，其特征在于，包括一个或多个功能模块，所述一个或多个功能模块用于执行如权利要求1-12中任一项所述的方法。 15.一种芯片系统，其特征在于，所述芯片系统应用于电子设备，所述芯片系统包括处理电路和接口电路，所述接口电路用于接收指令并传输至所述处理电路，所述处理电路用于运行所述指令以执行如权利要求1-12中任一项所述的方法。 16.一种计算机可读存储介质，其特征在于，包括指令，当所述指令在电子设备的处理器上运行时，使得执行如权利要求1-12中任一项所述的方法。

CN113590078ACN113590078A CN113723165ACN113723165A