(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210760438.4
(22)申请日 2022.06.29
(71)申请人 西安电子科技大 学广州研究院
地址 510000 广东省广州市黄埔区中新知
识城海丝中心B5、 B6、 B7栋
(72)发明人 周媛媛 李晓辉 沈八中 苏家楠
吕思婷
(74)专利代理 机构 广东省中源正拓专利代理事
务所(普通 合伙) 44748
专利代理师 覃汉赳
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 20/20(2019.01)
G06F 16/23(2019.01)
G06F 16/27(2019.01)G06Q 10/08(2012.01)
(54)发明名称
一种基于区块链的物流系统异常数据识别
方法
(57)摘要
本发明公开了一种基于区块链的物流系统
异常数据识别方法, 涉及区块链技术领域。 对样
本数据进行初始化, 得到多个训练集以及每一训
练集对应的初始化样本权重和错 分代价; 以初始
化样本权重和错分代价为参数, 进行预设数目次
迭代, 得到预设数目个弱分类器, 将预设数目个
弱分类器组合成该训练集的强分类器; 将所有训
练集的强分类器进行加权聚合, 通过投票式判决
得到交易数据是否异常的判决结果; 将正常的数
据打包得到第二区块接入至区块链。 结合基于集
成学习和代 价敏感的不平衡数据分类算法, 可以
有效提高不平衡数据分类的准确性, 当异常数据
在整体数据中占比较小时, 也可以通过已训练的
强分类器进行准确判断, 避免将异常的数据打包
上链, 造成损失。
权利要求书3页 说明书7页 附图1页
CN 115329833 A
2022.11.11
CN 115329833 A
1.一种基于区块链的物流系统异常数据识别方法, 其特 征在于, 所述方法包括:
获取用户区块链 节点提交至待审核区块的交易数据;
对样本数据进行初始化, 得到多个训练集以及每一训练集对应的初始化样本权重和错
分代价; 所述样本数据包括所述交易数据和所述用户区块链 节点的历史数据;
针对每一训练集, 以所述初始化样本权重和所述错分代价为参数, 进行预设数目次迭
代, 得到预设数目个弱分类 器, 将预设数目个弱分类 器组合成该训练集的强分类 器;
将所有训练集的强分类器进行加权聚合, 通过投票式判决得到所述交易数据 是否异常
的判决结果;
将所述交易数据的判决结果在区块链上进行广播, 并将正常的数据打包得到第二区
块, 将第二区块接入至区块链。
2.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法, 其特征在于,
在获取用户区块链 节点提交至待审核区块的交易数据之前, 所述方法还 包括:
获取目标用户通过用户区块链节点输入的账号和密码, 与数据库User用户表中记录的
注册时填的信息进行比对, 对所述目标用户进行身份验证;
若所述目标用户身份验证成功, 且所述用户区块链节点上传了所述交易数据, 则将所
述交易数据保存至所述待审核区块。
3.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法, 其特征在于,
对所述样本数据进行初始化, 得到多个训练集以及每一训练集对应的初始 化样本权重和错
分代价, 包括:
将所述样本数据划分为 N个训练集;
针对每一训练集, 该训练集表示 为:
S={(x1,y1),(x2,y2),...,(xK,yK)|y∈(1, ‑1)}
其中, K为训练集S的样本总数, xk表示第k个样本的数据, yk表示第k个样本是否正常, yk
=‑1代表正常类样本; yk=1代表异常类样本;
计算该训练集第一次迭代的初始化样本 权重D1:
其中, w1k为第一次迭代时训练集S中每 个样本的权 重;
计算该训练集的错分代价Ck:
其中,n为训练集中多数类样本的数量,m为训练集中少数类样本的数量,K为训练集S的
样本总数。
4.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法, 其特征在于,
针对每一训练集, 以所述初始 化样本权重和所述错分代价为参数, 进 行预设数目次迭代, 得
到预设数目个弱 分类器, 将预设数目个弱 分类器组合成该训练集的强分类器, 包括以下步
骤:
步骤一, 针对每一训练集, 提取部分数据, 作为学习训练集;
步骤二, 使用所述学习训练集当前对应的学习样本权重对所述学习训练集进行学习,权 利 要 求 书 1/3 页
2
CN 115329833 A
2得到弱分类 器; 所述学习样本 权重在第一次迭代时为所述初始化样本 权重;
步骤三, 根据所述学习样本 权重和错分代价更新下一次迭代的所述学习样本 权重;
步骤四, 使用更新后的所述学习样本权重, 重复执行上述步骤一至步骤三, 直到完成预
设数目次迭代, 得到预设数目个弱分类 器;
步骤五, 训练集S经过T次迭代后得到一组弱分类器f=(f1,f2,...,fT), 将弱分类器集
合f组合成一个强分类 器Fi:
其中, i表示训练集S为N个训练集中的第i个, T表示训练集S的迭代次数, αt表示第t次迭
代时的弱分类 器ft的所述学习样本 权重, sign函数输出值 为1或‑1。
5.基于权利要求4所述的一种基于区块链的物流系统异常数据识别方法, 其特征在于,
每一训练集包括正常类样本和异常类样本, 正常类样本多于异常类样本, 正常类样本称为
多数类样本, 异常类样本称为少数类样本; 假设每一训练集包含的m个多数类样本和n个少
数类样本;
针对每一训练集, 提取部分数据, 作为学习训练集, 具体包括:
针对每一训练集, 按照初始化样本权重对该训练集包含的m个多数类样本按照从大到
小进行排序, 提取 前n个多数类样本与n少数类样本, 形成新的集 合, 作为学习训练集。
6.基于权利要求4所述的一种基于区块链的物流系统异常数据识别方法, 其特征在于,
根据所述学习样本 权重和错分代价更新下一次迭代的所述学习样本 权重, 包括:
假设本次迭代为第t次迭代, 计算本次迭代时弱分类 器ft的错误率 εt:
其中, Dt(xk)表示第k个样本的数据xk在第t次迭代时的所述学习样本 权重;
计算第t次迭代训练的弱分类 器ft的权重αt:
计算样本 权重调节因子βk:
βk=‑0.5(ykft(xk))Ck+0.5
其中, yk为数值为1或 ‑1的变量, ft(xk)为第k个样本 的数据经过第t次迭代训练的弱分
类器ft的输出数值, Ck为错分代价;
更新t+1次迭代的所述学习样本 权重, 得到Dt+1:
其中, Dt(xk)为第k个样本的初始化权重, αt为第t次迭代的弱分类器ft的权重, βk为第k
个样本的权 重调节因子, zt为归一化因子。
7.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法, 其特征在于,
假设包含N个训练集, 且训练集S为N个训练集中的任意一个; 训练集S训练的强分类器Fi对
输入数据给 出的预测数值 为1或‑1;
将所有训练集的强分类器进行加权聚合, 通过投票式判决得到所述交易数据 是否异常权 利 要 求 书 2/3 页
3
CN 115329833 A
3
专利 一种基于区块链的物流系统异常数据识别方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:49:23上传分享