专利 表情符号预测方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211058352.3 (22)申请日 2022.08.30 (71)申请人北京字跳网络技术有限公司地址 100190 北京市海淀区紫金数码园4号楼2层0207 (72)发明人游京翰　郭明宇　冉蛟　 (74)专利代理机构北京知帆远景知识产权代理有限公司 1 1890 专利代理师王佳璐 (51)Int.Cl. G06V 20/70(2022.01) G06V 20/30(2022.01) G06V 10/74(2022.01) G06V 10/40(2022.01) G06V 10/82(2022.01)G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称表情符号预测方法、装置、设备及存储介质 (57)摘要本申请实施例提供了一种表情符号预测方法、装置、设备及存储介质，涉及人工智能技术领域，该方法包括：获取目标图像和目标文本信息，目标图像为具有标注信息的图像，标注信息包括目标文本信息和表情符号，根据目标图像、目标文本信息和预先训练的表情符号预测模型，确定标注信息的至少一个预测表情符号，表情符号预测模型根据多个训练样本训练得到，每个训练样本包括样本图像和样本图像的标注信息，样本图像的标注信息包括文本标注信息和标注表情符号，显示标注信息的至少一个预测表情符号。从而，可预测图像的标注信息中包含的表情符号，保证对图像的标注信息转录的完整性。权利要求书2页说明书14页附图3页 CN 115424266 A 2022.12.02 CN 115424266 A 1.一种表情符号预测方法，其特征在于，包括：获取目标图像和目标文本信息，所述目标图像为具有标注信息的图像，所述标注信息包括所述目标文本信息和表情符号；根据所述目标图像、所述目标文本信息和预先训练的表情符号预测模型，确定所述标注信息的至少一个预测表情符号，其中，所述表情符号预测模型根据多个训练样本训练得到，每个所述训练样本包括样本图像和所述样本图像的标注信息，所述样本图像的标注信息包括文本标注信息和标注表情符号；显示所述标注信息的至少一个预测表情符号。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：响应于用户从所述标注信息的至少一个预测表情符号中选择目标表情符号的操作，将所述目标文本信息和所述目标表情符号按照所述标注信息的分布顺序合并，得到目标标注信息；显示所述目标标注信息。 3.根据权利要求1所述的方法，其特征在于，所述获取目标图像和目标文本信息，包括：接收输入的所述目标图像和目标文本信息。 4.根据权利要求1所述的方法，其特征在于，所述根据所述目标图像、所述目标文本信息和预先训练的表情符号预测模型，确定所述标注信息的至少一个预测表情符号，包括：将所述目标图像和所述目标文本信息组成prompt范式输入所述表情符号预测模型，输出所述标注信息的至少一个预测表情符号，所述prompt范式结构中待填充的内容为待预测的表情符号。 5.根据权利要求3所述的方法，其特征在于，所述表情符号预测模型包括图像特征提取模型和文本特征提取模型，所述将所述目标图像和所述目标文本信息组成pr ompt范式输入所述表情符号预测模型，输出所述标注信息的至少一个预测表情符号，包括：将所述目标图像输入所述图像特征提取模型，输出所述目标图像的特征向量；依次将所述目标文本信息和表情库中的每一表情符号按照所述prompt范式结构合并得到候选信息；依次将每一所述候选信息输入所述文本特征提取模型，输出所述候选信息的特征向量；分别计算所述目标图像的特征向量和所述候选信息的特征向量之间的余弦相似度，按照所述余弦相似度从大到小的顺序，选取前K个余弦相似度对应的候选信息，将所述K个候选信息中的表情符号作为所述标注信息的至少一个预测表情符号输出，所述K为正整数。 6.根据权利要求1 ‑5任一项所述的方法，其特征在于，所述表情符号预测模型根据N个训练样本通过如下方式训练得到：针对所述N个训练样本中的每一训练样本，以所述训练样本中的样本图像、所述样本图像的文本标注信息和所述样本图像的标注表情符号为所述表情符号预测模型的输入，得到所述样本图像的特征向量和所述样本图像的标注信息的特征向量；根据所述N个样本图像的特征向量和所述N个样本图像的标注信息的特征向量之间的余弦相似度，构建损失函数；根据所述损失函数调整所述表情符号预测模型的参数，以得到已训练的表情符号预测权　利　要　求　书 1/2 页 2 CN 115424266 A 2模型。 7.根据权利要求6所述的方法，其特征在于，所述表情符号预测模型包括图像特征提取模型和文本特征提取模型，所述以所述训练样本中的样本图像和所述样本图像的标注信息为所述表情符号预测模型的输入，得到所述样本图像的特征向量和所述样本图像的标注信息的特征向量，包括：以所述训练样本中的样本图像为所述图像特征提取模型的输入，所述图像特征提取模型输出所述样本图像的特征向量；以所述样本图像的标注信息为所述文本特征提取模型的输入，所述文本特征提取模型输出所述样本图像的标注信息的特征向量。 8.一种表情符号预测装置，其特征在于，包括：获取模块，用于获取目标图像和目标文本信息，所述目标图像为具有标注信息的图像，所述标注信息包括所述目标文本信息和表情符号；确定模块，用于根据所述目标图像、所述目标文本信息和预先训练的表情符号预测模型，确定所述标注信息的至少一个预测表情符号，其中，所述表情符号预测模型根据多个训练样本训练得到，每个所述训练样本包括样本图像和所述样本图像的标注信息，所述样本图像的标注信息包括文本标注信息和标注表情符号；显示模块，用于显示所述标注信息的至少一个预测表情符号。 9.一种电子设备，其特征在于，包括：处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，以执行权利要求1至7中任一项所述的方法。 10.一种计算机可读存储介质，其特征在于，包括指令，当其在计算机程序上运行时，使得所述计算机执行如权利要求1至7中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115424266 A 3

专利 表情符号预测方法、装置、设备及存储介质

专利表情符号预测方法、装置、设备及存储介质