全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210735272.0 (22)申请日 2022.06.27 (71)申请人 北京奇艺世纪科技有限公司 地址 100080 北京市海淀区北一 街2号10、 11层 (72)发明人 邢晨  (74)专利代理 机构 北京银龙知识产权代理有限 公司 11243 专利代理师 龚素素 (51)Int.Cl. G06T 3/00(2006.01) G06V 10/44(2022.01) (54)发明名称 图像生成方法、 图像生成装置及相关 设备 (57)摘要 本发明实施例提供了一种图像生 成方法、 图 像生成装置及相关设备, 其中, 方法包括: 利用具 有目标人脸风格的目标数据集, 对预先训练的 StyleGAN模型进行训练和模型参数调整, 得到风 格化模型, 风格化模型用于生 成具有目标人脸风 格的人脸图像; 将随机噪声分别输入至StyleGAN 模型和风格化模型, 以使StyleGAN模型基于随机 噪声输入 得到第一人脸图像, 风格化模型基于随 机噪声输入和第一人脸图像得到第二人脸图像, 第二人脸图像是将第一人脸图像进行风格迁移 后, 得到的具有目标人脸风格的人脸图像。 本发 明实施例提供的方法可以降低获取风格迁移模 型所使用的训练样本的成本和难度。 权利要求书2页 说明书15页 附图3页 CN 115187450 A 2022.10.14 CN 115187450 A 1.一种图像生成方法, 其特 征在于, 包括: 利用具有目标人脸风格的目标数据集, 对预先训练的风格生成对抗网络StyleGAN模型 进行训练和模型参数调整, 得到风格化模型, 所述风格化模型用于生成具有所述 目标人脸 风格的人脸图像; 将随机噪声分别输入至所述StyleGAN模型和所述风格化模型, 以使所述StyleGAN模型 基于所述随机噪声输入得到第一人脸图像, 所述风格化模型基于所述随机噪声输入和所述 第一人脸图像得到第二人脸图像, 所述第二人脸图像是将所述第一人脸图像进行风格迁移 后, 得到的具有所述目标 人脸风格的人脸图像。 2.根据权利 要求1所述的方法, 其特征在于, 所述StyleGAN模型基于所述随机噪声输入 得到所述第一人脸图像, 包括: 所述StyleGAN模型的第一映射层基于所述随机噪声输入进行特征提取, 得到第一隐藏 特征; 所述第一隐藏特 征用于表征 所述第一人脸图像中人脸区域的属性; 将所述第一 隐藏特征与预设的第一平均特征进行加权处理, 得到第一目标特征; 所述 第一平均特 征基于所述StyleGAN模型每一次训练时所述第一映射层输出的结果确定; 所述StyleGAN模型的第一综合模块基于所述第一目标特征输入进行图像生成, 得到所 述第一人脸图像。 3.根据权利要求2所述的方法, 其特征在于, 所述将所述第 一隐藏特征与预设的第 一平 均特征进行加权处 理, 得到第一目标 特征, 包括: 将所述第一隐藏特 征与预设的第一平均特 征进行加权处 理, 得到第一中间特 征; 对所述第一中间特 征对应的参数进行调整, 得到所述第一目标 特征。 4.根据权利要求2所述的方法, 其特征在于, 所述风格化模型基于所述随机噪声输入和 所述第一人脸图像得到所述第二人脸图像, 包括: 所述风格化模型的第 二映射层基于所述随机噪声输入进行特征提取, 得到第 二隐藏特 征, 所述第二隐藏特 征用于表征 所述第二人脸图像中人脸区域的属性; 将所述第二 隐藏特征与预设的第二平均特征进行加权处理, 得到第二目标特征; 所述 第二平均特 征基于所述 风格化模型每一次训练时所述第二映射层输出的结果确定; 所述风格化模型的第二综合模块基于所述第二目标特征输入和所述第一人脸图像输 入进行图像生成, 得到所述第二人脸图像。 5.根据权利 要求4所述的方法, 其特征在于, 所述将随机噪声分别输入至所述StyleGAN 模型和所述 风格化模型, 获得第一人脸图像以及第二人脸图像, 包括: 将所述StyleGAN模型和所述风格化模型进行混合, 得到混合模型; 其 中, 所述混合模型 包括所述StyleGAN模型和所述风格化模型, 且所述StyleGAN模 型的第一 综合模块的输出端 与所述风格化模型的第二综合模块的输入端连接; 将所述随机噪声输入至所述StyleGAN模型和所述混合模型进行图像生成, 得到第一人 脸图像以及第二人脸图像。 6.根据权利要求4所述的方法, 其特征在于, 所述利用具有目标人脸风格的目标数据 集, 对预先训练的StyleGAN模型进行训练和模型参数调整得到风格化模型之后, 所述方法 还包括: 获取样本真实图像的第 三隐藏特征, 所述第 三隐藏特征用于表征所述样本真实图像中权 利 要 求 书 1/2 页 2 CN 115187450 A 2人脸区域的属性; 将所述第三隐藏特 征与预设的所述第二平均特 征进行加权处 理, 得到第三目标 特征; 所述StyleGAN模型的第一综合模块基于所述第三隐藏特征输入进行图像生成, 得到第 一真实图像; 所述风格化模型的第二综合模块基于所述第三目标特征输入和所述第一真实图像输 入进行图像生成, 得到第二真实 图像; 所述第二真实 图像是将所述第一真实 图像进行风格 迁移后, 具有所述目标 人脸风格的人脸图像。 7.根据权利 要求6所述的方法, 其特征在于, 所述将随机噪声分别输入至所述StyleGAN 模型和所述 风格化模型, 获得第一人脸图像以及第二人脸图像之后, 所述方法还 包括: 确定所述样本真实图像中背景区域的属性, 以及确定所述第 二真实图像中背景区域的 属性; 使用所述样本真实图像中背景区域的属性 替换所述第二真实图像中背景区域的属性。 8.一种图像生成装置, 其特 征在于, 包括: 处理模块, 用于利用具有目标人脸风格的目标数据集, 对预先训练的StyleGAN模型进 行训练和模型参数调整, 得到风格化模型, 所述风格化模型用于生成具有所述目标人脸风 格的人脸图像; 输入模块, 用于将随机噪声分别输入至所述StyleGAN模型和所述风格化模型, 以使所 述StyleGAN模 型基于所述随机噪声输入得到第一人脸图像, 所述风格化模 型基于所述随机 噪声输入和所述第一人脸图像得到第二人脸图像, 所述第二人脸图像是将所述第一人脸图 像进行风格迁移后, 得到的具有所述目标 人脸风格的人脸图像。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放 程序; 处理器, 用于执行存储器上所存放的程序时, 实现如权利要求1 ‑7中任一项所述的方法 的步骤。 10.一种可读存储介质, 其上存储有程序, 其特征在于, 该程序被处理器执行时实现如 权利要求1 ‑7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115187450 A 3

PDF文档 专利 图像生成方法、图像生成装置及相关设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像生成方法、图像生成装置及相关设备 第 1 页 专利 图像生成方法、图像生成装置及相关设备 第 2 页 专利 图像生成方法、图像生成装置及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。