(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210972187.6
(22)申请日 2022.08.12
(71)申请人 淮阴工学院
地址 223000 江苏省淮安市经济技 术开发
区枚乘东路1号
(72)发明人 陈晓兵 张润 卢佳祺 包涵
张冰莹 王蓉蓉 张骏强 周冬冬
(74)专利代理 机构 淮安市科文知识产权事务所
32223
专利代理师 吴晶晶
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/951(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06Q 10/10(2012.01)
(54)发明名称
一种基于知识图谱和排序学习的岗位推荐
方法
(57)摘要
本发明公开了一种基于知识图谱和排序学
习的岗位推荐方法, 包括: 爬取求职网站获取用
户和岗位数据, 并根据所获取的用户和岗位数据
采用三元 组的形式来构建知识图谱; 通过知 识表
示学习的方法挖掘知识图谱, 将知识图谱的三元
组信息进行向量化表示, 得到用户特征向量和岗
位特征向量; 通过余弦相似度的方法来衡量用户
特征向量和岗位特征向量间的语义相似度, 得到
用户‑岗位相似度集合; 将得到的相似度集合和
特征向量整体定义为文档特征输入到排序模型
中训练, 通过神经网络来训练排序模型, 基于排
序模型为用户在岗位集合中对岗位进行排序, 得
到Top‑K推荐列表。 本发明可以有效地获取用户
和岗位信息, 并快速形成高精度推荐列表, 为用
户提供最佳推荐方案 。
权利要求书3页 说明书6页 附图2页
CN 115221415 A
2022.10.21
CN 115221415 A
1.一种基于知识图谱和排序学习的岗位推荐方法, 其特 征在于, 包括以下步骤:
步骤1: 爬取求职网站获取用户和岗位数据, 并根据所获取的用户和岗位数据采用三元
组的形式来构建知识图谱;
步骤2: 通过知识表示学习的方法挖掘知识图谱, 将知识图谱的三元组信息进行向量化
表示, 得到用户特 征向量zuser和岗位特 征向量zpost;
步骤3: 通过余弦相似度的方法来衡量用户特征向量和岗位特征向量间的语义相似度,
得到用户 ‑岗位相似度集 合;
步骤4: 将得到的相似度集合和特征向量整体定义为文档特征x输入到排序模型中训
练, 通过神经网络来训练排序模型, 基于排序模型为用户在岗位集合中对岗位进 行排序, 得
到Top‑K推荐列表; 所述神经网络为改进后的R ankNet排序学习算法, 其构建新的损失函数,
具体为:
交叉熵损失函数为: Cij=‑Pijlog Pij‑(1‑Pij)log(1‑Pij), 其中, Pij为文档i排在文档j
的前面的概 率;
构造的点级损失 公式如下:
其中, xt为输入的文档特征, f(xt)文档的预测评分, y是文档的真实评分, a是 由预测评
分减去真实评分得到;
所构建的新损失函数公式如下:
通过验证集来确定损失函数的权
值k的大小。
2.根据权利要求1所述的基于知识图谱和排序 学习的岗位推荐方法, 其特征在于, 所述
步骤1的具体方法为:
步骤1.1: 所述的用户和岗位数据包括职位信息和用户履历信息及其它与岗位和用户
相关的数据;
步骤1.2: 对收集到的用户和岗位数据进行结构化处理, 从处理后的数据中提取知识,
包括实体及其属性的提取、 关系和关系属性的提取;
步骤1.3: 根据 所获取的实体与关系构建用户信息知识图谱和岗位信息知识图谱, 并将
所构建的知识图谱 存储在Neo4j图数据库中。
3.根据权利要求1所述的基于知识图谱和排序 学习的岗位推荐方法, 其特征在于, 所述
步骤2的具体方法为:
步骤2.1: 通过使用TransE表示学习算法对知识图谱的内容进行 特征向量的提取;
步骤2.2: 将用户 和岗位知识图谱看作三元组集合{zuser, l, f}和{zpost, l, f}并输入到
TransE模型中, 随机 生成任意维度的向量来模拟这个 三元组, 其中, zuser表示用户, zpost表示
岗位, l表示关系, f表示尾实体;
步骤2.3: 打乱训练数据生成正例的三元组和负例的三元组 组成新的训练数据;
步骤2.4: 计算损失函数, 通过梯度下降法来批量更新之前随机生成的向量, 从而得到权 利 要 求 书 1/3 页
2
CN 115221415 A
2用户向量zuser和岗位向量zpost。
4.根据权利要求1所述的基于知识图谱和排序 学习的岗位推荐方法, 其特征在于, 所述
步骤3的具体方法为:
步骤3.1: 通过使用余 弦相似度来计算用户特征向量zuser与岗位特征向量zpost间语义相
似度来得到相似度矩阵W(z)=sim(zuser, zpost);
步骤3.2: 将得到的相似度矩阵W(z)进一步生成数据集D=sim(zuser, zpost)作为排序学
习模型的训练集。
5.根据权利要求1所述的基于表示学习和排序 学习的岗位推荐方法, 其特征在于, 所述
步骤4的具体方法为:
步骤4.1: 利用改进后的RankNet排序学习算法训练排序模型, 所述模型训练一个给文
档计算评分的函数f(x, w), 其中, x为文档的输入特 征, w为排序模型的参数;
步骤4.2: 根据打分函数f(x, w)计算文档i和文档j的评分si=f(xi, w), sj=f(xj, w); 则
文档i排在文档j的前面的概 率为:
而文档i排在文档j前面的真实概 率为:
步骤4.3: 为RankNet算法构建一个新 的损失函数, 并 以此损失函数来衡量Pij对
的拟
合程度;
步骤4.4: 将RankNet算法用三层神经网络模型来实现, 输入层为样本的特征, 输出层为
样本的分数, 排序函数 可以定义 为:
其中, x为输入的文档特征; gi表示第i层的传递函数; w和 v分别为隐藏层到输出层的神
经元的权重和输入层到隐藏层的神经元的权重; b和bj表示隐藏层到输出层神经元叠加后
的偏置值和输入层到隐藏层神经 元叠加后的偏置;
步骤4.5: 使用梯度下降法计算后, 得到以下关系式:
步骤4.6: 改进后的损失函数对输入层和隐藏层间的参数vij求导, 进而更新迭代模型:
其中, Δvij中的i, j分别表示输入层的第i个节点, 隐藏层的第j个节点, 对隐藏层和输
出层的参数wj求导, Δwj为:
更新网络的所有权 重v, w: v=v ‑ηΔv, w=w‑ηΔw;
步骤4.7: 在算法迭代过程中, 不断修正v和w的值, 以期获得最小的损失函数, 最后将得
到的相似度集合W(z)以及特征向量zuser和zpost放入排序模型中训练得到用户 ‑岗位的评分f权 利 要 求 书 2/3 页
3
CN 115221415 A
3
专利 一种基于知识图谱和排序学习的岗位推荐方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:03上传分享