(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211168197.0
(22)申请日 2022.09.23
(71)申请人 重庆旅游云信息科技有限公司
地址 401120 重庆市渝北区卉竹路2号8栋
第17层
(72)发明人 罗锐 刘华轶 房春光 汪岛
金灿
(74)专利代理 机构 成都华复知识产权代理有限
公司 512 98
专利代理师 余鹏
(51)Int.Cl.
G06F 16/25(2019.01)
G06F 16/215(2019.01)
G06F 16/245(2019.01)
G06F 16/27(2019.01)
(54)发明名称
基于MongoDB的多平台景区评论合并的方法
及系统
(57)摘要
本发明提供基于MongoDB的多平台景区评论
合并的方法及系统, 涉及景区管理技术领域, 所
述方法包括, 步骤一: 安装MongoDB抽取组件、
CMSP消息中间件以及MongoDB入库组件; 步骤 二:
对多个源MongoDB 平台的评论数据和评分数据进
行获取; 步骤三: 对初步集合的文本信息进行判
断; 通过MongoDB入库组件将各个源MongoDB平台
中不同景区的评论和评分依次保存至CMSP消息
中间件中, MongoDB入库组件获取CMSP消息中间
件收到的数据并转入指定MongoDB数据库中, 以
达到提取不同MongoDB 平台评论和评分内容的效
果, 同时整合后的数据能够通过判断过滤出无效
信息, 进而减少了冗余的产生, 在检索时只需要
通过申请访问单个平台即可获取全部的景区评
价数据, 有效的减少了 检索消耗的时间。
权利要求书2页 说明书4页 附图2页
CN 115544136 A
2022.12.30
CN 115544136 A
1.基于MongoDB的多平台景区评论 合并方法, 其特 征在于, 包括以下步骤:
步骤一: 安装Mo ngoDB抽取组件、 C MSP消息中间件以及Mo ngoDB入库组件;
步骤二: 对多个源Mo ngoDB平台的评论数据和评分数据进行获取;
步骤三: 对初步 集合的文本信息进行判断;
步骤四: 对判断后的文本信息整合, 以此划分不同等级的评分;
步骤五: 根据各个平台的评论评分规则和时间记录规则, 使用MongoDB的查询方法取出
对应数据, 把数据中的评分根据既定规则转换成统一 规则供后续项目使用。
2.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于:
所述对多个源Mo ngoDB平台的评论数据和评分数据进行获取, 还 包括:
MongoDB入库组件将各个源MongoDB平台中不同景区的评论和评分依次保存至CMSP消
息中间件中, MongoDB入库组件获取CMSP消息中间件收到的数据并转入指定MongoDB数据库
中, 以达到提取不同Mo ngoDB平台评论和评分内容的效果。
3.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于:
所述对初步 集合的文本信息进行判断, 还 包括:
首先判断获得的文本信息中是否存在超链接, 当评论数据中的文本信息含有超链接
时, 提取该链接并识别该链接为图片链接还是音频链接;
当判断以图片链接或音频链接的形式进行评论 时, 此时通过人工审核的方式判断用户
对景区的评价 为好评还是差 评;
利用语义注解标签从包含评论信 息的数据中提取文字评论信 息和非文字评论信 息, 通
过语义分析评估信息的有效性, 若为无效信息进行异常处 理并过滤。
4.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于:
所述对判断后的文本信息整合, 以此划分不同等级的评分, 还 包括:
用户反馈的评论需始终与评分相绑定关联;
用户的评分和评论是由处 理器进行实时更新且景区无权限更改信息 。
5.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于:
所述使用Mo ngoDB的查询方法取 出对应数据, 还 包括:
数据提取基于Spark开发环境, 采用分布式集群配置, 用于处理原始数据及经过处理的
数据的特 征提取;
对已评估的信息根据评价对象及其内在的语义关系进行集成;
为集成好的信息和原 始数据建立索引;
利用索引信息处 理查询要求, 返回匹配的内容。
6.基于MongoDB的多平台景区评论合并系统, 其特征在于, 所述基于MongoDB的多平台
景区评论评分合并系统包括:
数据抽取模块: 所述数据抽取模块为MongoDB抽取组件, 向源MongoDB数据库 中抽取增
量数据和源MongoDB数据库中的全量数据, 随后将数据放入到CMSP消息中间件中, CMSP消息
中间件收到的数据被MongoDB入库组件获取并插入shard中, 由shard上的存储单元chunk保
存数据, 并插 入指定MongoDB数据库中:
数据分类模块: 所述数据分类模块对指定MongoDB 数据库内的数据进行部署, 将同一景
区的相关内容分为 一个记录, 用于对不同景区评论和评分的数据分类;权 利 要 求 书 1/2 页
2
CN 115544136 A
2数据合并模块: 所述数据合并模块用于对分类后的数据进行整合, 设定大纲级别和转
化规则对统一化的数据按照转化规则进行转化, 得到可控制编辑规则的统一化的数据文
档。
7.根据权利要求6所述的基于MongoDB的多平台景区评论评分合并系 统, 其特征在于:
所述增量数据为实时更新的景区评论和 评分数据, 所述全量数据为源MongoDB数据库中的
全部评论和评分数据, 所述C MSP消息中间件负责景区评论和评分信息的缓存和传输 。
8.根据权利要求6所述的基于MongoDB的多平台景区评论评分合并系 统, 其特征在于:
当chunk的大小超 过配置的chunksize时, MongoDB的后台进程就会对其进行切分, 从而避免
chunk过大的情况。
9.根据权利要求6所述的基于MongoDB的多平台景区评论评分合并系 统, 其特征在于:
得到统一化的数据文档的过程中, 需要设置唯一且固定的不同编辑标识符, 每种编辑标识
符对应一种编辑规则; 在不可控制编辑规则的数据文档中需要编辑控制的地方, 按照所需
的不同的编辑方式, 添加对应的编辑标识符。权 利 要 求 书 2/2 页
3
CN 115544136 A
3
专利 基于MongoDB的多平台景区评论合并的方法及系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:50:03上传分享