专利一种前瞻性应急救援规划的在线学习方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210903347.1 (22)申请日 2022.07.29 (71)申请人中国人民解放军国防科技大学地址 410073 湖南省长沙市开福区德雅路 109号 (72)发明人黄宏斌　杨皓宇　王懋　李璇　陈海文　刘丽华　 (74)专利代理机构长沙大珂知识产权代理事务所(普通合伙) 4323 6 专利代理师伍志祥 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 10/08(2012.01) G06Q 50/26(2012.01)G06N 20/20(2019.01) (54)发明名称一种前瞻性应急救援规划的在线学习方法 (57)摘要本发明公开了一种前瞻性应急救援规划的在线学习方法，将救援者和攻击者之间的这种基于阶段的对抗建模为一个同步救援路线博弈问题；基于每个阶段的博弈结果，假设所有数据和参数事先已知，构建多阶段离线应急救援规划；将多阶段离线应急救援规划扩展到真实的在线多阶段救援规划，以在线方式显示关键参数，并使用在线学习算法得到决策。本发明考虑在线特征的远景地形规划具有性能优势，可有效地应用于大规模实际问题。权利要求书4页说明书12页附图3页 CN 115271210 A 2022.11.01 CN 115271210 A 1.一种前瞻性应急救援规划的在线学习方法，其特征在于，包括以下步骤：收集或预测救援者和攻击者之间的博弈中的所有参数，获取蓄意攻击场景下的应急救援计划；将所述应急救援计划建模为一个多阶段离线紧急救援规划问题，该问题转化为一个二进制整数线性规划，包括：将多阶段离线紧急救援规划问题建模为救援者和攻击者之间的一系列基于阶段的同步救援路线博弈；基于每个阶段的博弈结果，假设所有数据和参数事先已知，构建多阶段离线应急救援规划，通过这种方式，多阶段离线紧急救援规划问题被集成为一个线性规划；基于阶段博弈的混合纳什均衡，通过求解线性规划得出最优的离线救济规划；为了满足在线和不可撤销决策的需要，将各决策阶段的纳什均衡结果集成后，将所述应急救援计划建模为在线线性规划，以在线方式显示关键参数；使用在线学习算法求解在线线性规划；输出救援决策。 2.根据权利要求1所述的前瞻性应急救援规划的在线学习方法，其特征在于，所述救援者和攻击者之间的一系列基于阶段的同步救援路线博弈包括：在 t阶段时，救援者决定满足从资源基地城市到需求城市的救援需求，需要根据路网来规划本次的救援路径，以最小化运输成本；而攻击者则拥有数支分布在网络中不同节点武装力量，对经过的救援者拦截，在机动性受约束的情况下从救援者处争夺救援物资；每个阶段，救援者和攻击者之间会同步在道路网络上进行救援路线博弈，该网络由一组表示交叉点的节点V和一组表示道路的边E组成；攻击者的分队的分布向量表示为，如果有分队驻扎在节点j，则；攻击者的策略由|I|向量组成，表示为，如果分队i 决定在t阶段到达并控制节点j，则；此外，攻击者的行动受到移动成本限制，即每支分队的移动成本不应超过t阶段的预算，攻击者的所有可行策略集表示为：其中表示全1向量；表示从节点j到节点实施驻扎分队的成本，为预算的向量形式；攻击者的约束包括：一支分队在每个阶段只能部署一次，分队的部署不超过攻击者的预算；救援者问题是规划一条从到的网络路由路径，该路径的求解可建模为最短路径问题；表示网络中路径的救援者的决策变量，如果选择通过边 k，则 =1；和表示离开和通往节点i的边集，救援者的策略空间由以下约束确权　利　要　求　书 1/4 页 2 CN 115271210 A 2定：博弈双方的效用是紧急救援运输的成本，救援者的目标是通过选择救援路径将运输最小化，而攻击者的目标则是阻断救援者的救援路线；所述效用函数是双线性函数，由决策变量组成，如下所示：其中，表示穿越边的运输成本，表示穿越边的额外成本，该成本由攻击者控制；为中间决策变量，如果边k在阶段t处于攻击者的控制之下，则 =1；具体而言，假设所有从攻击者驻守节点向外的边都处于控制之下，即：用 ={攻击者，救援者}表示玩家集；然后，每个阶段的同时救济路由博弈可以表示为元组；在该博弈中，运输的最终成本定义为博弈的混合纳什均衡。 3.根据权利要求2所述的前瞻性应急救援规划的在线学习方法，其特征在于，如果救援者在一个阶段选择攻击者控制的边缘进行穿越，则运输的救援资源将遭受征收或抢劫的损失；路径k处的损失量取决于救援人员遇到的武装部队的征税率；表示成功运输的剩余救济资源，有：。 4.根据权利要求3所述的前瞻性应急救援规划的在线学习方法，其特征在于，当需求和运输成本事先已知时，将多阶段紧急离线救援规划表示为二元整数线性规划，如下所示：其中表示营救者的决策变量，向量，用表示向量，表示多阶段离线紧急救援规划问题的阶段数， b1为救济资源总量， b2为交通预算，使用二进制整数线性规划技术来求解多阶段离线紧急救援规划问题，表示多阶段离线紧急救援规划问题的最优解， Mof fERP表示多阶段离线紧急救援规划问题。 5.根据权利要求4所述的前瞻性应急救援规划的在线学习方法，其特征在于，在在线线性规划中，双方做出的决定均为不可撤销的，且无法观测到未来的输入在每个阶段，参数权　利　要　求　书 2/4 页 3 CN 115271210 A 3

专利 一种前瞻性应急救援规划的在线学习方法

专利一种前瞻性应急救援规划的在线学习方法