全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210903347.1 (22)申请日 2022.07.29 (71)申请人 中国人民解 放军国防科技大 学 地址 410073 湖南省长 沙市开福区德雅路 109号 (72)发明人 黄宏斌 杨皓宇 王懋 李璇  陈海文 刘丽华  (74)专利代理 机构 长沙大珂知识产权代理事务 所(普通合伙) 4323 6 专利代理师 伍志祥 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 10/08(2012.01) G06Q 50/26(2012.01)G06N 20/20(2019.01) (54)发明名称 一种前瞻性应急救援规划的在线学习方法 (57)摘要 本发明公开了一种前瞻性应急救援规划的 在线学习方法, 将救援者和攻击者之间的这种基 于阶段的对抗建模为一个同步救援路线博弈问 题; 基于每个阶段的博弈 结果, 假设所有数据 和参数事先已知, 构建多阶段离线应急救援规 划; 将多阶段离线应急救援规划扩展到真实的在 线多阶段救援规划, 以在线方式显示关键参数, 并使用在 线学习算法得到决策。 本发 明考虑在线 特征的远景地形规划具有性能优势, 可有效地应 用于大规模实际问题。 权利要求书4页 说明书12页 附图3页 CN 115271210 A 2022.11.01 CN 115271210 A 1.一种前瞻性应急救援规划的在线学习方法, 其特 征在于, 包括以下步骤: 收集或预测救援者和攻击者之间的博弈中的所有参数, 获取蓄意攻击场景下的应急救 援计划; 将所述应急救援计划建模为一个多阶段离线紧急救援规划问题, 该问题转化为一个二 进制整数线性规划, 包括: 将多阶段离线紧急救援规划问题建模为救援者和 攻击者之间的 一系列基于阶段的同步救援路线博弈; 基于每个阶段的博弈结果, 假设所有数据和 参数事 先已知, 构建多阶段离线应急救援规划, 通过这种方式, 多阶段离线紧急救援规划问题被集 成为一个线性 规划; 基于阶段 博弈的混合纳什均衡, 通过求 解线性规划得出最优的离线救济规划; 为了满足在线和不可撤销决策的需要, 将各决策阶段的纳什均衡结果集成后, 将所述 应急救援 计划建模为在线 线性规划, 以在线方式显示关键参数; 使用在线学习算法求 解在线线性规划; 输出救援决策。 2.根据权利要求1所述的前瞻性应急救援规划的在线学习方法, 其特征在于, 所述救援 者和攻击者之间的一系列基于阶段的同步救援路线博 弈包括: 在 t阶段时, 救援 者决定满足从资源基 地城市 到需求城市 的救援需求 , 需要根 据路网来规划本次的救援路径, 以最小化运输成本; 而攻击者则拥有数支分布在 网络中不 同节点武装力量, 对经过 的救援者拦截, 在机动性受约束的情况下从救援者处争夺救援物 资; 每个阶段, 救援者和攻击者之间会同步在道路网络 上进行救援路线博 弈, 该网络由一组表示交叉点的节点V和一组表示道路的边E组成; 攻击者的分队的分布向量表示为 , 如果有分队驻扎在节点j, 则 ; 攻击者的策略由|I|向量组成, 表示为 , 如果分队i 决定在t阶段到 达并控制节点j, 则 ; 此外, 攻击者的行动受到移动成本限制, 即每支分队的移动成本 不应超过t阶段 的预算  , 攻击者的所有可 行策略集表示 为: 其中  表示全1向量; 表示从节点j到节点 实施驻扎分队的 成本, 为预算 的向量形式; 攻击者的约束包括: 一支分 队在每个阶段只 能部署一次, 分 队的部署不超过攻击者的 预算; 救援者问题是规划一条从 到 的网络路由路径, 该路径的求解可建模为最短路径 问题; 表示网络中路径的救援者的决策变量, 如果选择通过边 k, 则 =1; 和 表示离开和通往节点i的边集, 救援者的策略空间由以下约束确权 利 要 求 书 1/4 页 2 CN 115271210 A 2定: 博弈双方的效用是紧急救援运输的成本, 救援者的目标是通过选择救援路径将运输最 小化, 而攻击者的目标则是阻断救援者的救援路线; 所述效用函数是双线性函数, 由决策变 量组成, 如下 所示: 其中, 表示穿越边 的运输成本, 表示穿越边 的额外成本, 该成本由攻击者控 制; 为中间决策变量, 如果边k在阶段t处于攻击者的控制 之下, 则 =1; 具体而言, 假 设所有从攻击者 驻守节点向外的边都处于控制之下, 即: 用 ={攻击者, 救援者}表示玩家集; 然后, 每个阶段的同时救济路由博弈可以表示为 元组 ; 在该博弈中, 运输的最终成本 定义为博弈 的混合纳什均 衡。 3.根据权利要求2所述的前瞻性应急救援规划的在线学习方法, 其特征在于, 如果救援 者在一个阶段选择攻击者控制的边缘进行穿越, 则运输的救援资源 将遭受征收或抢劫的 损失; 路径k处的损失量取决于救援人员遇 到的武装部队的征税率 ; 表示成功运输的剩余救济资源, 有: 。 4.根据权利要求3所述的前瞻性应急救援规划的在线学习方法, 其特征在于, 当需求   和运输成本 事先已知时, 将多阶段紧急离线救援规划表示为二元整数线性规划, 如下所 示: 其中 表示营救者的决策变量, 向量 , 用 表示 向量 , 表示多阶段离线紧急救援规划问题的阶段 数, b1为救济资源总量, b2为交通 预算, 使用二进制整数线性规划技术来求解多阶段离线紧急救援规划问题, 表示多阶段 离线紧急救援规划问题的最优解, Mof fERP表示多阶段离线紧急救援规划问题。 5.根据权利要求4所述的前瞻性应急救援规划的在线学习方法, 其特征在于, 在在线线 性规划中, 双方做出的决定均为不可撤销的, 且无法观测到未来的输入在每个阶段   , 参数权 利 要 求 书 2/4 页 3 CN 115271210 A 3

PDF文档 专利 一种前瞻性应急救援规划的在线学习方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种前瞻性应急救援规划的在线学习方法 第 1 页 专利 一种前瞻性应急救援规划的在线学习方法 第 2 页 专利 一种前瞻性应急救援规划的在线学习方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:41:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。