全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210941371.4 (22)申请日 2022.08.08 (71)申请人 浙江中烟工业有限责任公司 地址 310008 浙江省杭州市上城区中山 南 路77号 (72)发明人 金泳 楼卫东 高扬华  (74)专利代理 机构 北京维澳专利代理有限公司 11252 专利代理师 常小溪 (51)Int.Cl. G06Q 30/02(2012.01) G06F 16/2455(2019.01) G06F 16/23(2019.01) G06N 3/04(2006.01) (54)发明名称 基于数据血缘的卷烟品牌数据处 理方法 (57)摘要 本发明公开了一种基于数据血缘的卷烟品 牌数据处理方法, 针对卷烟品牌数据特有的分布 杂乱且特征难以提取的问题, 通过引入数据血缘 技术, 实现了卷烟品牌数据的时空分布及类型溯 源, 建立出作为起点的卷烟品牌数据与所有相关 元数据之间的数据血缘关系, 并据此确定以数据 流转频率量化表征的卷烟品牌影 响度, 利用经血 缘分析后得到的卷烟品牌数据时序信息及预测 目标, 构建LSTM架构的预测模型, 由此解决传统 深度学习中难以进行不同卷烟品牌在不同时序 中的同时比较, 通过同时输入不同卷烟品牌在不 同时刻下的影 响度特征, 对不同品牌的影响度既 进行纵向预测又进行横向比较, 由此便可以通过 预测模型对不同的卷烟品牌的影响度作出精准 预测并进行相应排序。 权利要求书2页 说明书7页 附图1页 CN 115409541 A 2022.11.29 CN 115409541 A 1.一种基于数据血缘的卷烟品牌数据处 理方法, 其特 征在于, 包括: 记录并动态更新卷烟品牌的数据资源; 基于所述数据资源, 对卷烟品牌数据进行追踪, 确定作为起点对象的卷烟品牌数据与 所有相关元 数据对象之间的数据血缘关系; 通过所述数据血缘关系, 确定卷烟品牌影响度的量化表征, 其中所述卷烟品牌影响度 与基于血缘关系确定的数据流 转频率相关; 基于附带有时序信息的卷烟品牌数据血缘关系以及所述卷烟品牌影响度, 构建LSTM架 构的预测模型; 利用所述预测模型对不同的卷烟品牌的影响度进行 预测并排序。 2.根据权利要求1所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述卷 烟品牌影响度的量 化表征为: 其中, φi, j表示影响度, frei, j表示第i个卷烟品牌在第j个时刻的数据流 转频率。 3.根据权利要求1所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述对 卷烟品牌数据进行追踪包括: 对所述数据资源进行 数据流向、 溯源及变更影响分析。 4.根据权利要求1所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述数 据处理方法还包括: 根据数据流向分析结果构建用于获取卷烟品牌数据血缘关系的血缘图 谱。 5.根据权利要求4所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述数 据处理方法还包括: 结合所述血缘图谱以及预设的数据清洗标准与数据质量要求, 对超过 预设期限仍存在且无 下级流程的卷烟品牌数据进行冷数据归档并告警。 6.根据权利要求1所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述数 据流转频率包括用于表征 预设数据血缘分级的应用热度的卷烟品牌数据引用或更新频次。 7.根据权利要求6所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述预 设数据血缘分级包括: 系统级别、 表级别以及字段级别。 8.根据权利要求1所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述数 据资源包括: 预设的卷烟品牌上下游数据资源编码、 数据项编 码、 时间项编 码以及数据资源 转换规则。 9.根据权利要求1~8任一项所述的基于数据 血缘的卷烟品牌数据处理方法, 其特征在 于, 所述数据处 理方法还 包括: 将影响度 预测结果与对应品牌的卷烟销量历史数据融合后, 再次利用所述预测模型获 取销量预测结果; 基于影响度预测结果以及销量预测结果对不同的卷烟品牌进行综合 排序。 10.根据权利要求9所述的基于数据血缘的卷烟品牌数据处理方法, 其特征在于, 所述 将影响度预测结果与对应品牌的卷烟销量历史数据融合后, 再次利用所述预测模型获取销 量预测结果包括: 将影响度预测结果与对应品牌的卷烟销量历史数据横向拼接为 新特征; 将所述新特征输入至所述预测模型进行处理并输出不同卷烟品牌在不同时刻的销量权 利 要 求 书 1/2 页 2 CN 115409541 A 2数据预测结果。权 利 要 求 书 2/2 页 3 CN 115409541 A 3

.PDF文档 专利 基于数据血缘的卷烟品牌数据处理方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于数据血缘的卷烟品牌数据处理方法 第 1 页 专利 基于数据血缘的卷烟品牌数据处理方法 第 2 页 专利 基于数据血缘的卷烟品牌数据处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:38:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。