(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211037138.X
(22)申请日 2022.08.29
(65)同一申请的已公布的文献号
申请公布号 CN 115099795 A
(43)申请公布日 2022.09.23
(73)专利权人 江苏青山软件 有限公司
地址 226000 江苏省南 通市苏锡通科技产
业园区江成路1088号江成研发园8号
楼5楼A8503-17室
(72)发明人 李倩倩
(74)专利代理 机构 深圳政科创新专利代理事务
所(普通合伙) 44880
专利代理师 谢庚生
(51)Int.Cl.
G06Q 10/10(2012.01)G06F 16/176(2019.01)
G06F 16/958(2019.01)
审查员 周颖
(54)发明名称
企业内部数字资源管理方法及系统
(57)摘要
本发明涉及企业数字管 理领域, 具体涉及一
种企业内部数字资源管理方法及系统, 通过对企
业内部的数字资源文件的特征标识和场景信息,
获取上传行为码, 以及数字资源文件的文本特征
码, 判断数字资源文件的敏感度以及关注度, 从
而实现数字资源文件的推荐。 即本发 明的方案能
够实时对数字资源文件精确有效地分析得出关
注度不同的数字资源文件, 能够对高关注度的数
字资源文件的不同子簇生 成推荐文件列表, 进行
数字资源文件的推荐, 使 得企业内部数字资源文
件能够科 学、 细致、 人性 化地被管理。
权利要求书2页 说明书8页 附图1页
CN 115099795 B
2022.11.11
CN 115099795 B
1.一种企业内部数字资源管理方法, 其特 征在于, 包括以下步骤:
获取企业内部在各采集 时长内上传的数字资源文件的特征标识和场景信 息, 将所述特
征标识以及场景信息进行编码合并处理, 得到上传行为码, 所述上传行为码包括当前上传
行为码和历史上传行为码;
获取各采集 时长内的各数字资源文件的文本词汇表, 对所述文本词汇表中的所有词汇
进行编码得到文本特征码; 所述文本特征码包括当前特征码和历史特征码, 所述采集时长
包括历史采集时长和当前采集时长;
基于任意两两数字资源文件的历史特征码以及历史上传行为码, 计算任意两两数字资
源文件的邻域距离, 基于各数字 资源文件对应的邻域距离, 计算局部变动域, 将所有局部变
动域记为历史变动域; 进 而得到所有数字资源文件 对应的历史变动域;
获取任一数字资源文件, 根据设定策略确定该数字资源文件的有效历史时长, 得到各
数字资源文件的有效历史时长以及对应的历史变动域;
根据各数字资源文件对应的当前上传行为码和当前特征码, 计算每个数字资源文件的
当前变动域; 选取任意两数字资源文件在有效历史时长内的历史变动域, 确定调节变动域,
并计算两数字资源文件的聚类空间距离, 基于各两两数字资源文件的聚类空间距离, 对所
有数字资源文件进行聚类, 得到不同簇;
计算每个簇的平均当前变动域, 按照平均当前变动 域从大到小的优先级对不同簇进行
排序, 并按照优先级的高低, 对每个簇内的当前变动域进行关注度的标注, 生成高关注度对
应的数字资源文件的推荐 文件列表;
所述特征标识为用户浏览器指纹以及用户操作; 用户浏览器指纹包括UA、 时区、 地理位
置; 场景信息为企业内部不同的部门的ID信息;
其中的邻域距离为:
其中,
为数字资源文件 p的历史特征码,
为数字资源文件 q的历史特征码,
为数字
资源文件 p的历史上传行为码,
为数字资源文件 q的历史上传行为码;
为
哈希特征表示的历史特征码之间的向量夹角相似度, 即基于余弦相似度的距离, 代表了编
辑行为的距离缩放系数, 从而 形成一种共同表示数字资源文件操作时的内容及操作 异常性
的联合距离
为上传行为码的相似距离, 是一种汉明距离 。
2.根据权利要求1所述的一种企业内部数字资源管理方法, 其特征在于, 所述设定策略
为: 对获取的任一数字 资源文件, 设定初始历史观察时长, 计算该初始历史观 察时长中数字
资源文件对应的场景信息经过编码后的汉明距离, 计算初始历史观察时长以及汉明距离的
和, 作为该 数字资源文件的有效历史时长; 所述初始历史观察时长小于所述历史采集时长 。
3.根据权利要求1所述的一种企业内部数字资源管理方法, 其特征在于, 所述局部变动
域的获取过程为: 将其中任一数字 资源文件对应的邻域距离按照从小到大排序, 选取前k个权 利 要 求 书 1/2 页
2
CN 115099795 B
2邻域距离; 将前k个邻域距离的均值作为各 数字资源文件的局部变动域。
4.根据权利要求1所述的一种企业内部数字资源管理方法, 其特征在于, 所述调节变动
域是基于各数字资源文件的历史变动域中的最小值与最大值的比值对对应的数字资源文
件的当前变动域进行调节得到的;
所述聚类空间距离为两数字资源文件的调节变动域的差异的绝对值。
5.根据权利要求1所述的一种企业内部数字资源管理方法, 其特征在于, 所述文本词汇
表是基于文本词频统计的分词方法处 理得到的。
6.一种企业内部数字资源管理系统, 包括存储器和处理器, 其特征在于, 所述处理器执
行所述存储器存储的如权利要求1 ‑5中任一项所述一种企业内部数字资源管理方法的程
序。权 利 要 求 书 2/2 页
3
CN 115099795 B
3
专利 企业内部数字资源管理方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:29:45上传分享