全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210785243.5 (22)申请日 2022.07.05 (71)申请人 西南交通大 学 地址 610031 四川省成 都市金牛区二环路 北一段111号 (72)发明人 何娟 谢文颖 李济明 郭涛  (74)专利代理 机构 成都天既明专利代理事务所 (特殊普通 合伙) 51259 专利代理师 邓世燕 杜雁春 (51)Int.Cl. G06F 16/26(2019.01) G06F 16/2455(2019.01) G06F 16/25(2019.01) G06F 16/29(2019.01) (54)发明名称 基于自学习规则运算的铁路货运大数据可 视化展示平台 (57)摘要 本发明公开了一种基于自学习规则运算的 铁路货运大数据可视化展示平台, 包括交互式可 视化展示模块、 数据仓库模块、 数据传输接口和 数据挖掘模块。 与现有技术相比, 本发明提供的 基于自学习规则运算的铁路货运大数据可视化 展示平台能够实现对铁 路货运总体情况、 货物分 布、 货物流动、 货物预测、 客户分类、 客户流动和 货运运价七个方面的刻 画, 同时数据挖掘模块能 够实现上述内容的智能分析, 从海量数据中挖掘 分析出辅助铁路货运科学决策的高价值信息。 并 通过大数据可视化和交互式方式给使用者提供 高效、 全面、 直观的使用体验, 为使用者迅速提供 对高价值信息的高效洞察力。 平台的研发是对铁 路货运数据资产的高效率转化, 助力铁路货运运 营效率的提升 。 权利要求书3页 说明书14页 附图5页 CN 115145993 A 2022.10.04 CN 115145993 A 1.一种基于自学习规则运算的铁路货运大数据可视化展示平台, 其特征在于: 包括交 互式可视化展示模块、 数据仓库模块、 数据传输 接口和数据 挖掘模块, 其中: 所述数据仓库模块响应用户通过交互式可视化展示模块提交 的查询信 息, 通过数据传 输接口并行提取铁路货运电子商务平台后台数据库、 地理数据库、 统计局数据库、 金融数据 库和行业数据库的数据, 并将提取的数据通过 数据传输 接口传送至数据 挖掘模块; 所述数据挖掘模块包括数据清理模块、 自学习规则运算模块和挖掘结果存储模块, 用 于清理数据仓库模块提取 的数据, 并结合交互式可视化展示模块的查询数据, 运用基于多 变量LSTM的铁路货运运价率波动预测算法、 基于集成学习的铁路货运客户流失预警算法、 基于CNN‑LSTM的铁 路区域货运量短期预测算法构成自学习规则运算库进 行训练, 然后通过 挖掘结果存 储模块对挖掘结果进行存 储, 并返回挖掘结果于交 互式可视化展示模块。 2.根据权利要求1所述的基于自学习规则运算的铁路货运大数据可视化展示平台, 其 特征在于: 所述基于多变量 LSTM的铁路货运 运价率波动预测算法包括如下步骤: 步骤一、 计算 运价浮动率; 步骤二、 构建数据仓库多维特 征数据集, 确定特 征变量; 步骤三、 对特 征变量和运 价浮动率进行 预处理后进行训练集和 测试集的划分; 步骤四、 构建基于多变量LSTM的铁路货运运价浮动预测模型, 设置模型初始参数值, 使 用训练集对模型进 行超参数优化, 得到最优模型; 将测试集应用于训练好的最优模型, 将预 测值进行反归一 化处理, 使其与真实值处于同一 量级, 输出 预测结果并评估 模型质量。 3.根据权利要求2所述的基于自学习规则运算的铁路货运大数据可视化展示平台, 其 特征在于: 按如下公式计算 运价浮动率rxi: 其中, rxi表示货物种类代码为x的第i票货运数据的运价浮动率; P1为实际运价率; P2为 理论运价率; 为货物x所适用的基价1; 为货物x所适用的基价2; Γxi为该票货物的货 票总金额; lxi为该票货物的运输总里程; wxi为该票货物的计 费重量; Fxi为该票货物所需缴权 利 要 求 书 1/3 页 2 CN 115145993 A 2纳的所有附加费用; ft为第t类费用的系数; Mxi为该票货物所需缴纳的所有杂费; mk为第k项 杂费的系数; θk为该项杂费服务的距离; Λxi为该票货物所有的加减成率; λj为第j项加成率 或减成率, 该数据可为正数也可为负数, 当存在两个以上负数时仅取其中最小一个, 当存在 两个以上正数时所有数值进行叠加运 算。 4.根据权利要求2所述的基于自学习规则运算的铁路货运大数据可视化展示平台, 其 特征在于: 步骤二所述构建数据仓库多维特 征数据集, 确定特 征变量的方法为: (1)建立模型预测数据仓库: 包括运输成本数据集、 宏观环境数据集、 市场竞争数据集 与运输对象数据集; (2)将自变量X1,X2,…,Xm作为数据 集中影响因素的特征变量和作为因变量的运价浮动 率进行相关性计算, 根据变量间的相关性 程度确定n个特 征变量作为模型输入。 5.根据权利要求1所述的基于自学习规则运算的铁路货运大数据可视化展示平台, 其 特征在于: 所述基于集成学习的铁路货运 客户流失预警算法包括如下步骤: 步骤一、 获取待预测铁路货运客户查询时间前12月的历史发货订单原始数据集, 并对 原始数据集进行 数据预处 理; 步骤二、 构建铁路货运 客户运单 数据特征指标; 步骤三、 基于客户行为数据信 息对客户样本进行赋值得到铁路货运客户流失样本数据 标签; 将铁路货运客户特征数据及流失样本数据标签构建为新数据集, 并将新数据集按预 设比例划分为训练集和 测试集; 步骤四、 采用多个基学习器组成第 一层机器学习模型, 使用K折交叉验证方法基于训练 集生成训练好的基学习器, 并将测试集输入训练好的基学习器, 分别得到各个训练好的基 学习器对测试集的预测结果; 步骤五、 使用逻辑回归作为元学习器建立第二层机器学习模型, 将各个训练好的基学 习器对测试集的预测结果作为元学习器的特征值, 由此形成Stacking融合模型对目标特征 进行预测并输出 预测结果, 得到待测客户的流失概 率, 并转化成客户流失预警颜色标识。 6.根据权利要求5所述的基于自学习规则运算的铁路货运大数据可视化展示平台, 其 特征在于: 关键特征指标包括发货时间间隔R、 发货次数F、 发货总金额M、 最大发货金额D、 近 期发货能力K和发货倾向V; 其中: 1)近期发货能力K按如下公式计算: 式中, T为客户平均发货时间 间隔; 2)发货倾向V按如下公式计算: 式中, Vi表示客户第i次发货周转量和第i+1次发货周转量的差值, 发货周转量为计费重 量与总里程的乘积。 7.根据权利要求5所述的基于自学习规则运算的铁路货运大数据可视化展示平台, 其 特征在于: 所述K折交叉验证方法为: 将训练集划分为相等的K份, 在训练各个基分类器时, 每次取其中K ‑1份训练模 型, 将第K份的特征输入训练好的模型进 行预测, 以得到预测值; 再权 利 要 求 书 2/3 页 3 CN 115145993 A 3

PDF文档 专利 基于自学习规则运算的铁路货运大数据可视化展示平台

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于自学习规则运算的铁路货运大数据可视化展示平台 第 1 页 专利 基于自学习规则运算的铁路货运大数据可视化展示平台 第 2 页 专利 基于自学习规则运算的铁路货运大数据可视化展示平台 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。