全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210755128.3 (22)申请日 2022.06.30 (71)申请人 高质标准 化研究院(山 东)有限公司 地址 250000 山东省济南市历下区高新区 龙奥北路131 1号7层 (72)发明人 任海玲 王豇川 邹丽杰 贾丽丽  谷彩婵 路征 王剑 法文鹏  杨立海 袭保军 王玫 刘朋朋  (74)专利代理 机构 济南龙瑞知识产权代理有限 公司 37272 专利代理师 张俊涛 (51)Int.Cl. G06F 16/215(2019.01) G06K 9/62(2022.01) G06F 21/64(2013.01)G06F 8/71(2018.01) G06F 16/25(2019.01) G06F 16/957(2019.01) (54)发明名称 一种基于多源异构数据的绿色商品识别方 法 (57)摘要 本发明涉及绿色商品识别技术领域, 特别涉 及一种基于多源异构数据的绿色商品识别方法, S1, 对绿色商品信息进行数据采集; S2, 对S1采 集 到的数据进行清洗; S3, 对清洗后的数据定义绿 色判定规则; S4, 汇总每一类绿色商品数据源识 别算法并建立数据匹配规则, 将数据匹配算法封 装为结构并提供对外请求访问; S5, 建立数据预 警机制以及数据安全防护机制。 本发 明的有益效 果: 建立一套集成算法来输出绿色判定标志。 将 对多类数据源进行定期更新, 建立数据唯一识别 算法, 保障绿色商品的唯一及有效性。 解决各应 用渠道单独对接时的数据分析人力成本及数据 整合技术难题。 收集多源绿色商品信息后, 采集 数据使用频率, 从不同维度监控绿色商品数据使 用情况。 权利要求书1页 说明书4页 附图1页 CN 115114272 A 2022.09.27 CN 115114272 A 1.一种基于多源异构数据的绿色商品识别方法, 其特 征在于, 包括以下步骤: S1, 对绿色商品信息进行 数据采集; S2, 对S1采集到的数据进行清洗; S3, 对清洗后的数据定义绿色判定规则; S4, 汇总每一类绿色商品数据源识别算法并建立数据匹配规则, 将数据匹配算法封装 为结构并提供对外请求访问; S5, 建立数据预警机制以及数据安全防护机制。 2.根据权利要求1所述的基于多源异构数据的绿色商品识别方法, 其特 征在于: 所述S1具体为, 针对每一类绿色商品信息的数据源, 提取采集规则, 利用Lxml库和 Scrapy框架技 术, 对每一类数据源进行采集入库。 3.根据权利要求1所述的基于多源异构数据的绿色商品识别方法, 其特 征在于: 所述S2具体为, 采集的每一类绿色商品信 息数据源, 通过数据清洗算法, 对入库的数据 进行清洗、 内容过滤、 抽取等预处理后, 利用Numpy库和Pandas库技术统一汇入到数据中心 资源池。 4.根据权利要求1所述的基于多源异构数据的绿色商品识别方法, 其特 征在于: 所述S3具体为, 对每一类绿色商品信息数据源的绿色判定规则进行定义, 利用通存通 取等技术算法, 保障每一类数据经 过规则算法后, 输出绿色判定标志。 5.根据权利要求1所述的基于多源异构数据的绿色商品识别方法, 其特 征在于: 所述S4具体为, 汇总每一类绿色商品数据源识别算法, 利用Elastic技术, 建立数据匹 配规则, 通过定义的判定算法, 快速 输出, 将此核心算法封装为接口, 提供对外请求访问。 6.根据权利要求5所述的基于多源异构数据的绿色商品识别方法, 其特 征在于: 所述对外请求访问出现因大量数据同时请求带来的堵塞及响应慢的情况时, 利用 Redis和Rab bitMQ技术, 对其他应用渠道的请求访问做快速分发响应。 7.根据权利要求1所述的基于多源异构数据的绿色商品识别方法, 其特 征在于: 所述S5具体为, S51, 利用Celery技术, 对每一类绿色商品信息数据源进行定期采集, 建立数据预警机 制, 对平台 内的数据进行 数据流挖掘, 关联分析及动态监控; S52, 建立数据安全防护机制, 保障数据资源 池中的数据安全有效, 防止非法数据篡改。权 利 要 求 书 1/1 页 2 CN 115114272 A 2一种基于多源异构数据的绿色商品识别方 法 技术领域 [0001]本发明涉及绿色商品识别技术领域, 特别涉及一种基于多源异构数据的绿色商品 识别方法。 背景技术 [0002]各种绿色商品数据渠道来源不 一, 判定规则不统一。 [0003]绿色产品的信息验证会常见在人们购买绿色商品的情 况下, 它应该会与人们的日 常生活消费等息息相关, 但目前并没有被人们广泛引用。 这也跟目前绿色商品的数据难以 检验、 人们对绿色商品知识了解度较低, 绿色商品相关的知识也没有被广泛的推进及主题 宣传。 [0004]现阶段的绿色商品信息发布在各自官 方网站, 会出现以下几点问题: 1.绿色商品查询途径相对分散, 用户在购买绿色认定商品时, 需要手动去相关绿 色商品官方网站进行查询, 操作比较繁琐, 同时存在无法对绿色商品信息的准确 性进行判 断; 2.现有的各大官方绿色商品网站 上未开放共享接口给公众, 电商平台上架的商品 无法通过 官方接口获取绿色认定标志; 3.现有的各大官方绿色商品网站 上公布的绿色商品信息, 在绿色认定标志上的规 则不一, 用户在进行查询时, 无法准确的判定是否为绿色认定商品; 4.针对数据量比较大的绿色商品信息, 存在网站查询慢, 无法及 时获取绿色商品 信息的情况; 除了上述问题, 传统的数据存储方式针对存储数据量大、 规则不一的情况不易维 护, 对数据情况监控不及时。 [0005]为此, 本申请设计了一种基于多源异构数据的绿色商品识别方法, 以解决上述问 题。 发明内容 [0006]本发明为了弥补现有技术中的不足, 提供了一种基于多源异构数据的绿色商品识 别方法。 [0007]一种基于多源异构数据的绿色商品识别方法, 其特 征在于, 包括以下步骤: S1, 对绿色商品信息进行 数据采集; S2, 对S1采集到的数据进行清洗; S3, 对清洗后的数据定义绿色判定规则; S4, 汇总每一类绿色商品数据源识别算法并建立数据匹配规则, 将数据匹配算法 封装为结构并提供对外请求访问; S5, 建立数据预警机制以及数据安全防护机制。 [0008]进一步地, 为了更好的实现本 发明, 所述S1具体为, 针对每一类绿色商品信息的数说 明 书 1/4 页 3 CN 115114272 A 3

PDF文档 专利 一种基于多源异构数据的绿色商品识别方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多源异构数据的绿色商品识别方法 第 1 页 专利 一种基于多源异构数据的绿色商品识别方法 第 2 页 专利 一种基于多源异构数据的绿色商品识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:02:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。