全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210328858.5 (22)申请日 2022.03.30 (71)申请人 南京厚建软件 有限责任公司 地址 210000 江苏省南京市雨 花台区安德 门大街57号楚翘城7幢9 楼905-910室 (72)发明人 刘军 童庆峰 章黎 李俊  何明荃  (74)专利代理 机构 江苏易文通知识产权代理有 限公司 32512 专利代理师 迟飞飞 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/958(2019.01) G06F 9/445(2018.01) G06F 9/451(2018.01)G06F 16/901(2019.01) (54)发明名称 一种互联网平台互动数据统一回收的方法 (57)摘要 本发明属于互联网数据采集回收技术领域, 具体的说是一种互联网平台互动数据统一回收 的方法, 包 括浏览器、 M2OPlus内容管理系统和浏 览器插件, 所述浏览器插件安装在所述浏览器 中, 所述浏览器插件用以在网站中采集数据, 并 将采集数据传输回M2OPlus内容管理系 统中; 本 发明通过编辑人员鼠标通过操作模块依次在网 站界面中, 选择相关需要采集的数据, 并将需要 采集的数据进行锁定, 则 浏览器插件并可以精确 对互动数据进行采集, 然后保持对页面数据刷新 的监控, 解决了爬虫海量采集对服务器需求较大 的问题, 浏览器插件能够应用在各种垂直数据采 集回收的场景中, 提升应用者工作效率的同时也 降低对互联网社会资源的无效占用。 权利要求书2页 说明书7页 附图3页 CN 114676330 A 2022.06.28 CN 114676330 A 1.一种互联网平台互动数据统一回收的方法, 包括: 浏览器, 所述浏览器为现有常规的可 供浏览不同网站的工具; 其特征在于, 还 包括: M2O Plus内容管理系统, 所述管理系统能够安装在现有的电脑系统中; 浏览器插件, 所述浏览器插件安装在所述浏览器中, 所述浏览器插件用以在网站中采 集数据, 并将采集数据传输回M2O  Plus内容管理系统中。 2.根据权利要求1所述一种互联网平台互动数据统一 回收的方法, 其特征在于: 所述浏 览器插件是基于通用的Web开发技 术。 3.根据权利要求1所述一种互联网平台互动数据统一回收的方法, 其特征在于: 所述 M2O Plus内容管理系统中设有采集插 件模块, 所述采集插 件用以下 载所述浏览器插 件。 4.根据权利要求1所述一种互联网平台互动数据统一 回收的方法, 其特征在于: 所述浏 览器插件安装在所述浏览器中后, 所述浏览器中的网站地址栏后面会出现一个采集图标; 编辑人员移动鼠标到达采集图标位置时, 在鼠标箭头上会显示关于所述采集图标的解 释, 其中解释语言跟随所述浏览器使用的语言。 5.根据权利要求1所述一种互联网平台互动数据统一回收的方法, 其特征在于: 所述 M2O Plus内容管理系统中设有登录模块, 编辑人员鼠标点击所述采集图标会弹出一个浮动 窗口, 需要编辑人员输入账户密码登录 M2O Plus内容管理系统。 6.根据权利要求1所述一种互联网平台互动数据统一回收的方法, 其特征在于: 所述 M2O Plus内容管理系统中设有操作模块, 所述操作模块用以简化编辑人员的操作流程, 让 编辑人员能够快速操作; 所述操作模块在M2O  Plus内容管理系统界面中为悬浮状态, 使得编辑人员能够随意调 整操作模块在界面上的位置, 让编辑人员操作起 来更加顺手。 7.根据权利要求1所述一种互联网平台互动数据统一 回收的方法, 其特征在于: 所述操 作模块中包括: 分析模块, 所述分析模块用以对相应的所述浏览器网站进行循环遍历, 获取页面DOM节 点树数组; 锁定区域模块, 所述锁定区域模块能够对所述浏览器网站 的界面进行锁定, 使得鼠标 只能在锁定区域中进行选择, 缩小数据采集的范围; 锁定数据模块, 所述锁定数据模块能够在所述锁定区域模块中显示的数据中, 锁定某 一位置的特定数据, 从而 进一步缩小数据采集的范围; 采集模块, 所述采集模块能够对所述锁定数据模块中的数据信息进行采集。 8.根据权利要求7所述一种互联网平台互动数据统一 回收的方法, 其特征在于: 所述锁 定数据模块中包括字段关联选择器, 所述字段关联选择器能够关联指定的采集内容。 9.根据权利要求7所述一种互联网平台互动数据统一 回收的方法, 其特征在于: 所述采 集模块采集数据过程中, 会将 “采集”按钮自动变成 “停止采集 ”, 编辑人员通过鼠标点击 “停 止采集”按钮能够随时停止当前采集任务。 10.根据权利要求1 ‑9所述任意一项一种互联网平台互动数据统一 回收的方法, 其特征 在于: 所述浏览器插 件的运算流程如下: S1: 通过documentElement.childNodes对页面DOM节点进行循环遍历, 获取到页面DOM权 利 要 求 书 1/2 页 2 CN 114676330 A 2节点树数组; S2: 通过addEleventListener循环为每个类型是Element的节点创建一个 onmouseover、 o nclick的监听事 件, 以及CS S高亮变色显示的方法; S3: 接下来就是锁定鼠标点击的节点ID, 当某个节点被点击后只保留该ID下级节点的 onmouseov er、 onclick事件的有效性, 同时取消其他节点的监听事件, 当重新点击该节点后 恢复整体页面的节点 监听事件; S4: 在S3节点区域内, 判断点击的节点nodeType为text时, 唤起弹窗的select字段关联 选择器, 记录内容节点的T agName信息绑定选择器中的字段Fiel dname信息, 通过Ajax异步 提交到后端API进行关联信息的存 储; S5: 创建一个定时器用于不断获取 该锁定区域是否有新的互动内容; S6: 通过跟本地存储及服务端回传有效性反馈, 在页 面通过nodeValue实时改变采集回 传数字的显示结果。权 利 要 求 书 2/2 页 3 CN 114676330 A 3

.PDF文档 专利 一种互联网平台互动数据统一回收的方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种互联网平台互动数据统一回收的方法 第 1 页 专利 一种互联网平台互动数据统一回收的方法 第 2 页 专利 一种互联网平台互动数据统一回收的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:58:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。