全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211373495.3 (22)申请日 2022.11.04 (71)申请人 北京闪马智建科技有限公司 地址 100095 北京市海淀区温泉镇创客小 镇社区配套 商业楼15 #楼二层132号 申请人 上海闪马智能科技有限公司   杭州闪马智擎科技有限公司 (72)发明人 倪华健 易芮 林亦宁  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 赵静 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06V 20/52(2022.01) G08G 1/015(2006.01) G08G 1/017(2006.01) (54)发明名称 行为信息的确定方法、 装置、 存储介质及电 子装置 (57)摘要 本发明实施例提供了一种行为信息的确定 方法、 装置、 存储介质及电子装置, 其中, 该方法 包括: 将目标训练数据输入至初始网络模型中, 得到初始网络模 型中包括的N个子网络输出的损 失值; 基于N个子网络输出的损失值以及主干网 络的主干网络参数确定每个子网络的第一更新 梯度; 对N个子网络的第一更新梯度进行归一化 处理, 得到N个第二更新梯度; 基于N个第二更新 梯度确定用于更新N个子网络的子网络参数的目 标更新梯度; 按照目标更新梯度更新N个子网络 的子网络参数, 得到目标网络模型。 通过本发明, 解决了相关技术中存在的训练得到的网络模型 性能较差的问题, 达到提高目标网络模型的性能 的效果, 提高了目标网络模型的识别准确率。 权利要求书2页 说明书9页 附图3页 CN 115527087 A 2022.12.27 CN 115527087 A 1.一种行为信息的确定方法, 其特 征在于, 包括: 将目标数据输入至目标网络模型中, 利用所述目标网络模型中包括的多个子网络从不 同的维度识别所述目标 数据, 确定所述目标 数据中包括的目标对象的行为信息; 其中, 所述目标网络模型是通过如下方式进行训练的: 将目标训练数据输入至初始网 络模型中, 得到所述初始网络模型中包括的N个子网络输出 的损失值, N个所述子网络用于 从不同的维度识别所述目标训练数据, N为大于或等于2的整 数; 基于N个所述子网络输出的 损失值以及主干网络的主干网络参数确定每个所述子网络的第一更新梯度, 所述主干网络 为所述初始网络模型中包括的网络; 对N个所述子网络的所述第一更新梯度进行归一化处 理, 得到N个第二更新梯度; 基于N个所述第二更新梯度确定用于更新N个所述子网络的子网 络参数的目标更新梯度; 按照所述目标更新梯度更新N个所述子网络的所述子网络参数, 得 到目标网络模型, 所述目标训练数据与所述目标 数据为相同类型的数据。 2.根据权利要求1所述的方法, 其特征在于, 基于N个所述子网络输出的损 失值以及主 干网络的主干网络参数确定每 个所述子网络的第一更新梯度包括: 针对每个所述子网络初始 的损失值, 均执行以下操作, 得到每个所述子网络的所述第 一更新梯度: 确定所述损失值对所述主干网络参数的偏导数; 将所述偏导数确定为所述第一更新梯度。 3.根据权利要求1所述的方法, 其特征在于, 对N个所述子网络的所述第一更新梯度进 行归一化处理, 得到N个第二更新梯度包括: 确定N个所述第一更新梯度的第一平均值; 基于所述第一平均值确定N个所述第一更新梯度的方差; 基于所述方差以及所述第一平均值确定每个所述第一更新梯度对应的所述第二更新 梯度。 4.根据权利要求3所述的方法, 其特征在于, 基于所述方差以及所述第 一平均值确定每 个所述第一更新梯度对应的所述第二更新梯度包括: 针对每个所述第一更新梯度均执行以下操作, 得到每个所述第 一更新梯度对应的所述 第二更新梯度: 确定所述第一更新梯度与所述第一平均值的第一差值; 将所述第一差值与所述方差的比值确定为所述第二更新梯度。 5.根据权利要求3所述的方法, 其特征在于, 基于所述第 一平均值确定每个所述第 一更 新梯度的方差包括: 确定每个所述第一更新梯度与所述第一平均值的第二差值; 确定每个所述第二差值的平方值, 得到N个平方值; 确定N个所述平方值的第二平均值; 将所述第二平均值的算 术平方根确定为所述方差 。 6.根据权利要求1所述的方法, 其特征在于, 基于N个所述第 二更新梯度确定用于更新N 个所述子网络的子网络参数的目标 更新梯度包括: 确定N个所述第二更新梯度的和值; 将每个所述第二更新梯度与所述和值的比值确定为与所述第二更新梯度对应的所述权 利 要 求 书 1/2 页 2 CN 115527087 A 2子网络的网络 权重; 确定每个所述第二更新梯度与所述网络 权重的乘积, 得到N个所述乘积; 将N个所述乘积的和 确定为所述目标 更新梯度。 7.根据权利要求1所述的方法, 其特征在于, 在将目标训练数据输入至初始网络模型 中, 得到所述初始网络模型中包括的N个子网络 输出的损失值之前, 所述方法还 包括: 获取N种类型的训练数据, 其中, 一种类型的所述训练数据用于训练一个所述子网络, 不同的所述子网络对应不同类型的所述训练数据, 每 个类型的所述训练数据的数量相同; 对N种类型的所述训练数据中包括的目标类型的训练数据进行预处理, 得到处理后的 训练数据; 将所述处理后的训练数据以及其他训练数据确定为所述目标训练数据, 其中, 所述其 他训练数据为 N种类型中包括除所述目标类型的训练数据之外的训练数据。 8.一种行为信息的确定装置, 其特 征在于, 包括: 确定模块, 用于将目标数据输入至目标网络模型中, 利用所述目标网络模型中包括的 多个子网络从不同的维度识别所述目标数据, 确定所述目标数据中包括的目标对象的行为 信息; 其中, 所述目标网络模型是通过如下方式进行训练的: 将目标训练数据输入至初始网 络模型中, 得到所述初始网络模型中包括的N个子网络输出的损失值,  N个所述子网络用于 从不同的维度识别所述目标训练数据, N为大于或等于2的整 数; 基于N个所述子网络输出的 损失值以及主干网络的主干网络参数确定每个所述子网络的第一更新梯度, 所述主干网络 为所述初始网络模型中包括的网络; 对N个所述子网络的所述第一更新梯度进行归一化处 理, 得到N个第二更新梯度; 基于N个所述第二更新梯度确定用于更新N个所述子网络的子网 络参数的目标更新梯度; 按照所述目标更新梯度更新N个所述子网络的所述子网络参数, 得 到目标网络模型, 所述目标训练数据与所述目标 数据为相同类型的数据。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法 的步骤。 10.一种电子装置, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处理器被设置为运行所述计算机程序以执行所述权利要求 1至7任一项中所述的方 法。权 利 要 求 书 2/2 页 3 CN 115527087 A 3

.PDF文档 专利 行为信息的确定方法、装置、存储介质及电子装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 行为信息的确定方法、装置、存储介质及电子装置 第 1 页 专利 行为信息的确定方法、装置、存储介质及电子装置 第 2 页 专利 行为信息的确定方法、装置、存储介质及电子装置 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:35:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。