(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211247950.5
(22)申请日 2022.10.12
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 李春艳
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 薛平
(51)Int.Cl.
G06Q 10/10(2012.01)
G06F 16/11(2019.01)
G06F 16/14(2019.01)
G06F 16/16(2019.01)
G06F 16/172(2019.01)G06F 40/216(2020.01)
G06F 40/284(2020.01)
(54)发明名称
文件管理方法及装置
(57)摘要
本发明公开了一种文件 管理方法及装置, 涉
及大数据技术领域。 其中该方法包括: 通过获取
用户上传邮件中文档的请求; 对文档进行分词,
得到文档的分词结果; 通过词频逆文档频率方法
提取文档中的关键词; 将文档存储至关键词对应
的关键词文件夹中。 本发明可以基于关键词更快
速地在对应文件夹中找到相关文档, 提高查找邮
件附件的效率。
权利要求书2页 说明书8页 附图3页
CN 115526601 A
2022.12.27
CN 115526601 A
1.一种文件管理方法, 其特 征在于, 包括:
获取用户上传邮件中文档的请求;
对所述文档进行分词, 得到所述文档的分词结果;
通过词频逆文档频率方法提取 所述文档中的关键词;
将所述文档存 储至所述关键词对应的关键词文件夹中。
2.如权利要求1所述的方法, 其特征在于, 所述通过词频逆文档频率方法提取所述文档
中的关键词, 包括:
通过所述词频逆文档频率方法计算所述文档中每个分词的分数; 所述分数用于表示对
应分词的关键程度;
提取所述分数的排序在前的n个分词, 得到所述关键词; n 为大于等于1的整数;
所述将所述文档存 储至所述关键词对应的关键词文件夹中, 包括:
在所述分数最高的关键词对应的关键词 文件夹中存储所述文档, 并在其余关键词对应
的关键词文件夹中存 储所述文档的存 储路径。
3.如权利要求2所述的方法, 其特征在于, 在将所述文档存储至所述关键词对应的关键
词文件夹中之后, 还 包括:
接收用户输入的检索关键词;
搜索所述检索关键词对应的关键词文件夹;
在所述关键词文件夹中的文档数量小于m的情况下, 返回所有文档的文档标识; m为大
于等于1的整数;
在所述关键词文件夹 中的文档数量大于或等于m的情况下, 返回所述分数排序在前的m
个文档的文档标识。
4.如权利要求3所述的方法, 其特征在于, 在将所述文档存储至所述关键词对应的关键
词文件夹中之后, 还 包括:
建立所述文档的标识、 所述文档的存 储路径和所述关键词之间的映射关系;
将所述映射关系存 储至映射表中;
在接收用户输入的检索关键词之后, 还 包括:
在所述映射表中搜索所述检索关键词映射的文档标识;
在搜索所述检索关键词对应的关键词文件夹之后, 还 包括:
根据所述文档标识, 对比在所述关键词 文件夹中的搜索结果和在所述映射表中的搜索
结果;
除返回在所述关键词文件夹中搜索到的文档标识之外, 返回在所述关键词 文件夹中未
搜索到、 且在所述映射表中搜索到的文档标识。
5.一种文件管理装置, 其特 征在于, 包括:
获取单元, 用于获取用户上传邮件中文档的请求;
分词单元, 用于对所述文档进行分词, 得到所述文档的分词结果;
提取单元, 用于通过词频逆文档频率装置提取 所述文档中的关键词;
第一存储单元, 用于将所述文档存 储至所述关键词对应的关键词文件夹中。
6.如权利要求5所述的装置, 其特 征在于, 所述 提取单元包括:
计算子单元, 用于通过所述词频逆文档频率装置计算所述文档 中每个分词的分数; 所权 利 要 求 书 1/2 页
2
CN 115526601 A
2述分数用于表示对应分词的关键程度;
提取子单元, 用于提取所述分数的排序在前的n个分词, 得到所述关键词; n为大于等于
1的整数;
所述第一存储单元还用于在所述分数最高的关键词对应的关键词文件夹中存储所述
文档, 并在其 余关键词对应的关键词文件夹中存 储所述文档的存 储路径。
7.如权利要求6所述的装置, 其特 征在于, 所述装置还 包括:
接收单元, 用于在将所述文档存储至所述关键词对应的关键词文件夹中之后, 接收用
户输入的检索关键词;
搜索单元, 用于搜索所述检索关键词对应的关键词文件夹;
第一反馈单元, 用于在所述关键词文件夹 中的文档数量小于m的情况下, 返回所有文档
的文档标识; m为大于等于1的整数;
第二反馈单元, 用于在所述关键词文件夹 中的文档数量大于或等于m的情况下, 返回所
述分数排序在前的m个文档的文档标识。
8.如权利要求7 所述的装置, 其特 征在于, 所述装置还 包括:
建立单元, 用于在将所述文档存储至所述关键词对应的关键词文件夹中之后, 建立所
述文档的标识、 所述文档的存 储路径和所述关键词之间的映射关系;
第二存储单元, 用于将所述映射关系存 储至映射表中;
搜索单元, 用于在接收用户输入的检索关键词之后, 在所述映射表中搜索所述检索关
键词映射的文档标识;
对比单元, 用于在搜索所述检索关键词对应的关键词文件夹之后, 根据 所述文档标识,
对比在所述关键词文件夹中的搜索结果和在所述映射表中的搜索结果;
第三反馈单元, 用于除返回在所述关键词文件夹中搜索到的文档标识之外, 返回在所
述关键词文件夹中未搜索到、 且在所述映射表中搜索到的文档标识。
9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至4任一所述方
法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程
序, 所述计算机程序被处 理器执行时实现权利要求1至4任一所述方法。
11.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序, 所述计
算机程序被处 理器执行时实现权利要求1至4任一所述方法。权 利 要 求 书 2/2 页
3
CN 115526601 A
3
专利 文件管理方法及装置
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:29:08上传分享