说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211168197.0 (22)申请日 2022.09.23 (71)申请人 重庆旅游云信息科技有限公司 地址 401120 重庆市渝北区卉竹路2号8栋 第17层 (72)发明人 罗锐 刘华轶 房春光 汪岛  金灿  (74)专利代理 机构 成都华复知识产权代理有限 公司 512 98 专利代理师 余鹏 (51)Int.Cl. G06F 16/25(2019.01) G06F 16/215(2019.01) G06F 16/245(2019.01) G06F 16/27(2019.01) (54)发明名称 基于MongoDB的多平台景区评论合并的方法 及系统 (57)摘要 本发明提供基于MongoDB的多平台景区评论 合并的方法及系统, 涉及景区管理技术领域, 所 述方法包括, 步骤一: 安装MongoDB抽取组件、 CMSP消息中间件以及MongoDB入库组件; 步骤 二: 对多个源MongoDB 平台的评论数据和评分数据进 行获取; 步骤三: 对初步集合的文本信息进行判 断; 通过MongoDB入库组件将各个源MongoDB平台 中不同景区的评论和评分依次保存至CMSP消息 中间件中, MongoDB入库组件获取CMSP消息中间 件收到的数据并转入指定MongoDB数据库中, 以 达到提取不同MongoDB 平台评论和评分内容的效 果, 同时整合后的数据能够通过判断过滤出无效 信息, 进而减少了冗余的产生, 在检索时只需要 通过申请访问单个平台即可获取全部的景区评 价数据, 有效的减少了 检索消耗的时间。 权利要求书2页 说明书4页 附图2页 CN 115544136 A 2022.12.30 CN 115544136 A 1.基于MongoDB的多平台景区评论 合并方法, 其特 征在于, 包括以下步骤: 步骤一: 安装Mo ngoDB抽取组件、 C MSP消息中间件以及Mo ngoDB入库组件; 步骤二: 对多个源Mo ngoDB平台的评论数据和评分数据进行获取; 步骤三: 对初步 集合的文本信息进行判断; 步骤四: 对判断后的文本信息整合, 以此划分不同等级的评分; 步骤五: 根据各个平台的评论评分规则和时间记录规则, 使用MongoDB的查询方法取出 对应数据, 把数据中的评分根据既定规则转换成统一 规则供后续项目使用。 2.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于: 所述对多个源Mo ngoDB平台的评论数据和评分数据进行获取, 还 包括: MongoDB入库组件将各个源MongoDB平台中不同景区的评论和评分依次保存至CMSP消 息中间件中, MongoDB入库组件获取CMSP消息中间件收到的数据并转入指定MongoDB数据库 中, 以达到提取不同Mo ngoDB平台评论和评分内容的效果。 3.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于: 所述对初步 集合的文本信息进行判断, 还 包括: 首先判断获得的文本信息中是否存在超链接, 当评论数据中的文本信息含有超链接 时, 提取该链接并识别该链接为图片链接还是音频链接; 当判断以图片链接或音频链接的形式进行评论 时, 此时通过人工审核的方式判断用户 对景区的评价 为好评还是差 评; 利用语义注解标签从包含评论信 息的数据中提取文字评论信 息和非文字评论信 息, 通 过语义分析评估信息的有效性, 若为无效信息进行异常处 理并过滤。 4.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于: 所述对判断后的文本信息整合, 以此划分不同等级的评分, 还 包括: 用户反馈的评论需始终与评分相绑定关联; 用户的评分和评论是由处 理器进行实时更新且景区无权限更改信息 。 5.根据权利要求1所述的基于MongoDB的多平台景区评论评分合并方法, 其特征在于: 所述使用Mo ngoDB的查询方法取 出对应数据, 还 包括: 数据提取基于Spark开发环境, 采用分布式集群配置, 用于处理原始数据及经过处理的 数据的特 征提取; 对已评估的信息根据评价对象及其内在的语义关系进行集成; 为集成好的信息和原 始数据建立索引; 利用索引信息处 理查询要求, 返回匹配的内容。 6.基于MongoDB的多平台景区评论合并系统, 其特征在于, 所述基于MongoDB的多平台 景区评论评分合并系统包括: 数据抽取模块: 所述数据抽取模块为MongoDB抽取组件, 向源MongoDB数据库 中抽取增 量数据和源MongoDB数据库中的全量数据, 随后将数据放入到CMSP消息中间件中, CMSP消息 中间件收到的数据被MongoDB入库组件获取并插入shard中, 由shard上的存储单元chunk保 存数据, 并插 入指定MongoDB数据库中: 数据分类模块: 所述数据分类模块对指定MongoDB 数据库内的数据进行部署, 将同一景 区的相关内容分为 一个记录, 用于对不同景区评论和评分的数据分类;权 利 要 求 书 1/2 页 2 CN 115544136 A 2数据合并模块: 所述数据合并模块用于对分类后的数据进行整合, 设定大纲级别和转 化规则对统一化的数据按照转化规则进行转化, 得到可控制编辑规则的统一化的数据文 档。 7.根据权利要求6所述的基于MongoDB的多平台景区评论评分合并系 统, 其特征在于: 所述增量数据为实时更新的景区评论和 评分数据, 所述全量数据为源MongoDB数据库中的 全部评论和评分数据, 所述C MSP消息中间件负责景区评论和评分信息的缓存和传输 。 8.根据权利要求6所述的基于MongoDB的多平台景区评论评分合并系 统, 其特征在于: 当chunk的大小超 过配置的chunksize时, MongoDB的后台进程就会对其进行切分, 从而避免 chunk过大的情况。 9.根据权利要求6所述的基于MongoDB的多平台景区评论评分合并系 统, 其特征在于: 得到统一化的数据文档的过程中, 需要设置唯一且固定的不同编辑标识符, 每种编辑标识 符对应一种编辑规则; 在不可控制编辑规则的数据文档中需要编辑控制的地方, 按照所需 的不同的编辑方式, 添加对应的编辑标识符。权 利 要 求 书 2/2 页 3 CN 115544136 A 3

.PDF文档 专利 基于MongoDB的多平台景区评论合并的方法及系统

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于MongoDB的多平台景区评论合并的方法及系统 第 1 页 专利 基于MongoDB的多平台景区评论合并的方法及系统 第 2 页 专利 基于MongoDB的多平台景区评论合并的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:50:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。