(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211081372.2
(22)申请日 2022.09.06
(71)申请人 北京澜舟 科技有限公司
地址 100000 北京市海淀区海淀大街3号B
座11层1101-3室
(72)发明人 华菁云 王宇龙 马超 周明
(74)专利代理 机构 深圳市智享知识产权代理有
限公司 4 4361
专利代理师 王琴
(51)Int.Cl.
A63F 13/52(2014.01)
G06T 11/00(2006.01)
G06V 10/74(2022.01)
G06V 40/16(2022.01)
G10L 15/26(2006.01)
(54)发明名称
一种捏脸方法、 捏脸系统及存 储介质
(57)摘要
本发明涉及自然语 言领域, 特别涉及一种捏
脸方法、 捏脸系统及存储介质, 本发明的捏脸方
法包括以下步骤: 获取对目标人脸图像的自然语
言描述; 随机生成一组人脸图像; 计算自然语言
描述与一组人脸图像中各图像的相关性; 筛选相
关性高于 预设阈值的人脸图像, 以相关性最高的
人脸图像作为第一目标人脸图像。 本发明通过用
户输入自然语言描述即可获得用户想象中的目
标人脸图像, 操作 简单; 此外, 本发明获取第一目
标人脸图像的时候就已经考虑到人脸图像与自
然语言描述之间的相关性, 因此 获取的第一目标
人脸图像效果更好。 本发明还提供一种捏脸系统
与存储介质, 该捏脸系统与存储介质与上述捏脸
方法具有相同的有益效果。
权利要求书1页 说明书10页 附图3页
CN 115155058 A
2022.10.11
CN 115155058 A
1.一种捏脸方法, 其特 征在于: 包括以下步骤:
获取对目标 人脸图像的自然语言描述;
随机生成一组人脸图像;
计算所述自然语言描述与所述 一组人脸图像中各图像的相关性;
筛选相关性高于预设阈值的人脸图像, 以相关性最高的人脸图像作为第 一目标人脸图
像。
2.如权利要求1所述的捏脸方法, 其特征在于: 筛选相关性高于预设阈值的人脸图像,
以相关性 最高的人脸图像作为第一目标 人脸图像之后还 包括以下步骤:
判断是否有新的对人像的自然语言描述;
若有, 则获取新的对人像的自然语言描述并基于新的对人像的自然语言描述对第 一目
标人脸图像进行修改得到第二目标 人脸图像。
3.如权利要求1所述的捏脸方法, 其特征在于: 所述自然语言描述的包括语音模态的自
然语言描述以及文本模态的自然语言描述。
4.如权利要求1所述的捏脸方法, 其特 征在于: 随机生成一组人脸图像的步骤 包括;
通过对抗网络生成器随机生成一组人脸图像。
5.如权利要求1所述的捏脸方法, 其特征在于: 计算所述自然语言描述与所述一组人脸
图像中各图像的相关性的步骤 包括:
通过多模态双塔架构模型逐一计算所述自然语言描述与所述一组人脸图像中各图像
的相关性。
6.如权利要求1所述的捏脸方法, 其特征在于: 计算所述自然语言描述与所述一组人脸
图像中各图像的相关性之后的步骤 还包括:
判断所述自然语言描述与所述 一组人脸图像中各图像的相关性是否超过 预设阈值;
若所述自然语言描述与所述一组人脸图像中各图像之间的相关性均 未超过预设阈值,
则重新生成一组新的人脸图像。
7.一种捏脸系统, 其特征在于: 包括输入模块、 人像生成模块、 文本与图像匹配模块; 所
述文本与图像匹配模块分别与所述输入 模块以及所述人像生成模块信号连接;
所述输入 模块用于获取自然语言描述;
所述人像生成模块用于随机生成一组人脸图像;
所述文本与图像匹配模块用于获取第一目标 人脸图像。
8.如权利要求7所述的捏脸系统, 其特征在于: 所述捏脸系统还包括优化模块, 所述优
化模块分别与所述输入模块以及所述文本与图像匹配模块信号连接; 所述优化模块用于对
第一目标 人脸图像进行修改得到第二目标 人脸图像。
9.如权利要求7所述的捏脸系统, 其特征在于: 所述文本与图像匹配模块包括 比较模
块, 所述比较模块用于比较对目标人脸图像的自然语言描述与所述一组人脸图像中各图像
之间的相关性是否大于预设阈值; 所述自然语言描述包括文本模态的自然语言描述与语音
模态的自然语言描述; 所述输入模块包括语音转文字模块, 所述语音转文字模块用于将语
音模态的自然语言描述 转换成文本模态的自然语言描述。
10.一种存储介质, 其上存储有计算机程序, 其特征在于: 所述计算机程序被处理器执
行时实现权利要求1 ‑6任一项所述的捏脸方法。权 利 要 求 书 1/1 页
2
CN 115155058 A
2一种捏脸方 法、 捏脸系统及存 储介质
技术领域
[0001]本发明涉及人脸图像生成技术领域, 特别涉及一种捏脸方法、 捏脸系统及存储介
质。
背景技术
[0002]捏脸在网络游戏中泛指对虚拟角色样貌进行D IY的数据操作, 目前, 用户在进入游
戏或者登录某个网站或进入元宇宙空间时, 想要一个想象中的人脸图像作为头像需要通过
满是复杂的拖动条 的控制面板来生成用户预期的头像, 而对于一般的用户而已, 这种操作
方式较为复杂, 且最终 获得的头像往 往与用户想象中的样子相差较大。
发明内容
[0003]为降低捏脸难度, 本发明提供了一种捏脸方法、 捏脸系统及存 储介质。
[0004]本发明解决技 术问题的方案是提供一种捏脸方法, 包括以下步骤:
获取对目标 人脸图像的自然语言描述;
随机生成一组人脸图像;
计算所述自然语言描述与所述 一组人脸图像中各图像的相关性;
筛选相关性高于预设阈值的人脸图像, 以相关性最高的人脸图像作为第一目标人
脸图像。
[0005]优选地, 筛选相关性高于预设阈值的人脸图像, 以相关性最高的人脸图像作为第
一目标人脸图像之后还 包括以下步骤:
判断是否有新的对人像的自然语言描述;
若有, 则获取新的对人像的自然语言描述并基于新的对人像的自然语言描述对第
一目标人脸图像进行修改得到第二目标 人脸图像。
[0006]优选地, 所述自然语言描述的包括语音模态的自然语言描述以及文本模态的自然
语言描述。
[0007]优选地, 随机生成一组人脸图像的步骤 包括;
通过对抗网络生成器随机生成一组人脸图像。
[0008]优选地, 计算所述自然语言描述与所述一组人脸图像中各图像的相关性的步骤包
括:
通过多模态双塔架构模型逐一计算所述自然语言描述与所述一组人脸图像中各
图像的相关性。
[0009]优选地, 计算所述自然语言描述与所述一组人脸图像中各图像的相关性之后的步
骤还包括:
判断所述自然语言描述与所述一组人脸图像中各图像的相关性是否超过预设阈
值;
若所述自然语言描述与所述一组人脸图像中各图像之间的相关性均未超过预设说 明 书 1/10 页
3
CN 115155058 A
3
专利 一种捏脸方法、捏脸系统及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:46上传分享