(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211026759.8
(22)申请日 2022.08.25
(66)本国优先权数据
202210558585.3 202 2.05.21 CN
(71)申请人 武汉研数聚英网络科技有限公司
地址 430000 湖北省武汉市硚口区韩家墩
街道解放大道213号楚天创新园1 1层
(72)发明人 崔绍龙 宋国徽 孙兆华
(74)专利代理 机构 北京久维律师事务所 1 1582
专利代理师 邢江峰
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 10/10(2012.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
(54)发明名称
一种多源城市数据的人才数据竞争力匹配
方法
(57)摘要
本发明提供了一种多源城市数据的人才数
据竞争力匹配方法, 步骤为: 构建多维度数据体
系, 将人才按照不同的维度进行整合, 进行时间
关联和空间关联; 基于多维度数据体系, 结合数
据时空属性, 对人才数据进行多维度的分析, 采
用卷积神经网络将数据作为输入向量, 通过卷积
层、 池化层和全 连接层, 最终融合分析结果, 形成
多维人才画 像和分析。 本发明充分考虑数据间的
动态时空关联性, 通过构建包含时空属性的多维
人才数据体系, 将时间、 空间、 行业需求和人才潜
力的维度加以融合和分析, 形成针对 人才的时空
分析模型, 构建基于多源城市数据的人才画像算
法, 实现精准的人才画像, 优化人才搜索和 匹配
的效率。
权利要求书2页 说明书5页
CN 115456367 A
2022.12.09
CN 115456367 A
1.一种多源 城市数据的人才数据竞争力匹配方法, 其特 征在于: 步骤为:
Q1、 构建多维度数据体系, 将人才的相关数据, 将 教育维度、 研究成果维度、 工作经历维
度、 人脉情况维度和从事领域的内容维度按照不同的维度进行整合, 然后进行时间关联和
空间关联;
Q2、 多维度分析模型, 基于多维度数据体系, 结合数据时空属性, 对人才数据进行多维
度的分析, 包括时间衰减/增强分析模 型、 多维度数据融合分析模型、 知识图谱分析模型, 采
用卷积神经网络将数据作为输入向量, 通过卷积层、 池化层和全连接层, 最 终得到人才特征
向量, 形成分析 结果矩阵, 融合分析 结果, 形成多维人才画像和分析。
2.根据权利要求1所述的一种 多源城市数据的人才数据竞争力匹配方法, 其特征在于:
所述教育维度上, 在本科、 硕士、 博士三个方面, 以国内国外来区分教育的二级属性, 在国
内、 国外两个方面上, 通过教育部确定的学校名 和专业的排名来进行量化, 排名在200名以
前的学校和专 业, 按照200到1赋予权重, 而200 之后的学校和专业统一按照0.5来计算, 形成
量化指标, 本科、 硕士、 博士按照初始值为1,2,4的权重, 与之前形成的量化指标来进行计
算, 公式为:
其中p为教育维度的量化指标, e为本科、 硕士、 博士, ne代表本科、 硕士、 博士的权重, se
为根据学校和专 业计算量化的教育指标, 教育指标目前是静态值, 但是需要赋予时间属性,
从两个方面来改进教育量化值的合理性, 包括本硕博的权重和学校及专业的排名。 随着社
会的发展和人才需求, 本硕博的重要度是随着时间维度进行变化的, 权重也随之变化; 学校
及专业的排名也是随着时间变化, 因此相 应的量化指标也是随时间变化, 通过为教育指标
赋予时间属性, 形成将静态指标和动态指标相融合, 也是教育指标 更加合理。
研究成果维度根据主要通过影响因子, 引用量, 文章数目, 参与项目总金额, 专利数5个
维度进行综合刻画, 采用PCA(Principal Components Analysis)进行降维分析, 最终得到
综合指标。 同时, 研究成果 维度计算中的各个子维度是动态变化的, 因此也是动态计算研究
成果指标。
工作经历维度以工作公司为核心, 围绕工作企业、 职位、 工作年限、 工作收入、 社会任职
几个方面形成工作经历 指标, 工作经历 指标为(w*j*p+c)+t+s+o;
工作企业的计算公式w*j*p+c,w为权重, 公司规模, 选择行业协会所公布的行业前10%
为权重100计算, 前20%的权重为50, 其余权重为0; j为个人在公司的重要程度, 按照三个档
位, 公司股东、 核心人员、 普通人员, 权值分别为5,3,1; p为公司性质, 民企为1, 其他企业为
0.5, c为地点, 一线城市为1, 其 他城市为0.5;
工作年限为t, 工作年限以3年 为限, 低于 3年为0.5,高于三 年统一为1;
工作收入为s, 10万 年薪为1, 每增 加10万年薪, s增 加1;
社会任职o如果有的话 为1, 没有的话 为0;
人脉情况维度的指标是根据人才的导师职位高低、 周边人群的擅长领域来确定, 由于
这部分指标无法收集过多信息, 指标的重要度适当降低, 以人才的导师情况为基准, 导师为
院士级别的, 人 脉情况指标设为1, 其 他设为0;
从事领域内容维度是将人才擅长的技 能、 从事的领域中的关键词与构建的热门领域关权 利 要 求 书 1/2 页
2
CN 115456367 A
2键词进行匹配, 以匹配的值 来作为从事领域内容的指标值;
最后对人才的描述从这个5个维度进行量 化:
p=αepe+αrpr+αwpw+αfpf+αmpm
其中p为人才的量化指标, pe为教育维度指标, pr为研究维度指标, pw为工作经历维度指
标, pf为人脉情况指标, pm为从事领域内容指标, 这个5个指标都是在原有指标基础上进行归
一化, 以在统一阈值 范围内进行量化和描述; αe、 αr、 αw、 αf、 αm分别为各个指标的权重 值, 初始
值为1。
3.根据权利要求2所述的一种 多源城市数据的人才数据竞争力匹配方法, 其特征在于:
所述时间衰减/增强分析模型为: 结合人才的时空属性和行为特征, 形成基于时间序列的分
析模型, 构建人才的能力、 潜力、 适应性方面的分析 结果。
4.根据权利要求3所述的一种 多源城市数据的人才数据竞争力匹配方法, 其特征在于:
所述多维数据融合分析模型为: 将已收集到的所有人才特征进行整体的分析, 采用PCA算
法, 将所有人数据进行归一化和降维处理, 根据主成分得分系 数矩阵, 计算主成分得分, 从
而对人才进行全面和整体的分析。
5.根据权利要求4所述的一种 多源城市数据的人才数据竞争力匹配方法, 其特征在于:
所述人才的时空属性和行为特征包括工作年限对于能力的影响、 从事项目对于能力的影
响、 学习经历对于人才能力的影响特 征。
6.根据权利要求5所述的一种 多源城市数据的人才数据竞争力匹配方法, 其特征在于:
所述知识图谱分析模型为: 对所有的人才数据进行整体的分析, 通过对人才数据进行语义
抽取, 构建社会网络模型, 形成人才知识库, 完成对人才的属性分析。权 利 要 求 书 2/2 页
3
CN 115456367 A
3
专利 一种多源城市数据的人才数据竞争力匹配方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:29:47上传分享