全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210563203.6 (22)申请日 2022.05.19 (71)申请人 北京地平线机 器人技术研发有限公 司 地址 100086 北京市海淀区丰豪东路9号院 2号楼3层1单 元302 (72)发明人 杜敏  (74)专利代理 机构 北京弘权知识产权代理有限 公司 11363 专利代理师 李少丹 许伟群 (51)Int.Cl. G06V 20/58(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06V 10/94(2022.01) G06F 9/50(2006.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种多任务模型的训练方法及装置 (57)摘要 公开了一种多任务模 型的训练方法及 装置, 用于对初始多任务模型进行训练, 初始多任务模 型可以包括至少一个第一异常子任务层, 本公开 提供的方法可以利用训练数据集对预先建立的 至少一个第一单任务模型进行训练, 得到各第一 单任务模型分别对应的第一模型参数, 其中, 第 一单任务模 型包括一个第二异常子任务层, 第二 异常子任务层基于第一异常子任务层获得, 并基 于第一模型参数更新初始多任务模 型, 得到训练 后的多任务模 型, 以实现对初始多任务模型的训 练, 解决了现有技术中对多任务模型进行训练 时, 若训练过程中出现异常, 需重新利用训练数 据对多任务模 型进行训练的情况发生, 减少迭代 耗时, 提升训练效率。 权利要求书2页 说明书17页 附图6页 CN 114821538 A 2022.07.29 CN 114821538 A 1.一种多任务模型的训练方法, 包括初始多任务模型, 所述初始多任务模型包括至少 一个第一异常子任务层, 所述方法包括: 获取训练数据集; 利用所述训练数据集对预先建立的至少一个第 一单任务模型进行训练, 得到各所述第 一单任务模型分别对应的第一模型参数, 其中, 各所述第一单任务模型均包括一个第二异 常子任务层, 各 所述第二异常子任务层分别基于各 所述第一异常子任务层获得; 基于所述第一模型参数 更新所述初始多任务模型, 得到训练后的多任务模型。 2.根据权利要求1所述的方法, 其中, 所述初始多任务模型还包括多个第一子任务层, 所述基于所述第一模型参数 更新所述初始多任务模型, 包括: 获取至少一个预先建立的第二单任务模型对应的第二模型参数, 其中, 各所述第二单 任务模型均包括一个第二子任务层, 各所述第二子任务层分别基于各所述第一子任务层获 得; 基于各所述第一模型参数和各 所述第二模型参数, 得到目标参数; 基于所述目标参数 更新所述初始多任务模型。 3.根据权利要求2所述的方法, 其中, 获取至少一个预先建立的第 二单任务模型对应的 第二模型参数, 还 包括: 利用所述训练数据集对预先建立的至少一个第 二单任务模型进行训练, 得到各所述第 二单任务模型分别对应的第二模型参数。 4.根据权利要求2所述的方法, 其中, 所述初始多任务模型还包括第一共享层, 各所述 第一单任务模型还包括第二异常共享层, 各所述第二异常共享层基于所述第一共享层获 得, 所述第一模型参数包括第一子任务层参数和第一共享层参数; 所述利用所述训练数据集对预先建立的至少一个第 一单任务模型进行训练, 得到各所 述第一单任务模型分别对应的第一模型参数包括: 利用所述训练数据集对各所述第 一单任务模型进行训练, 得到各所述第 二异常子任务 层分别对应的所述第一子任务层参数, 以及得到各所述第二异常共享层分别对应的所述第 一共享层参数。 5.根据权利要求4所述的方法, 其中, 所述第二单任务模型还包括一个第二共享层, 所 述第二共享层基于所述第一共享层获得, 所述第二模型参数包括第二子任务层参数和 第二 共享层参数, 所述目标参数包括目标子任务层参数和目标共享层参数; 所述获取至少一个第二单任务模型分别对应的第二模型参数包括: 获取各所述第二共享层分别对应的第二共享层参数; 所述基于各 所述第一模型参数和各 所述第二模型参数, 得到目标参数包括: 基于各所述第 一共享层参数和各所述第 二共享层参数的融合, 得到所述目标共享层参 数; 基于各所述第一子任务层参数的集 合, 得到所述目标子任务层参数。 6.根据权利要求5所述的方法, 其中, 所述基于各所述第 一共享层参数和各所述第 二共 享层参数的融合, 得到所述目标共享层参数, 包括: 基于各所述第 一共享层参数和各所述第 二共享层参数与 预设数值关系 进行融合, 确定 所述目标共享层参数。权 利 要 求 书 1/2 页 2 CN 114821538 A 27.根据权利要求6所述的方法, 其中, 所述基于各所述第 一共享层参数和各所述第 二共 享层参数与预设数值关系进行融合, 确定所述目标共享层参数, 包括: 响应于各所述第 一共享层参数和各所述第 二共享层参数均相同, 将各所述第 一共享层 参数和各 所述第二共享层参数中的任意 一个确定为所述目标共享层参数; 或者, 响应于各所述第 一共享层参数和各所述第 二共享层参数存在不相同情况, 将各所述第 一共享层参数和各所述第二共享层参数 的平均值确定为所述 目标共享层参数, 或者, 将各 所述第一共享层参数和各 所述第二共享层参数的中值确定为所述目标共享层参数。 8.根据权利要求7所述的方法, 其中, 所述基于所述目标参数更新所述初始多任务模 型, 包括: 基于所述目标子任务层参数, 更新各 所述第一异常子任务层; 响应于所述第一共享层存在异常的情况, 基于所述目标共享层参数, 更新所述第一共 享层。 9.一种多任务模型的训练装置, 用于训练初始多任务模型, 所述初始多任务模型包括 至少一个第一异常子任务层, 所述装置包括: 训练数据获取模块: 用于获取训练数据集; 训练模块, 利用根据 所述训练数据获取模块获取的所述训练数据集对预先建立的至少 一个第一单任务模型进行训练, 得到各所述第一单任务模型分别对应的第一模型参数, 其 中, 各所述第一单任务模型均包括一个第二异常子任务层, 各所述第二异常子任务层分别 基于各所述第一异常子任务层获得; 参数更新模块, 用于根据所述训练模块获取的所述第 一模型参数更新所述初始多任务 模型, 得到训练后的多任务模型。 10.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 所述计算机程序用于 执行上述权利要求1 ‑8任一所述的多任务模型的训练方法。 11.一种电子设备, 所述电子设备包括: 处理器; 用于存储所述处 理器可执行指令的存 储器; 所述处理器, 用于从所述存储器中读取所述可执行指令, 并执行所述指令以实现上述 权利要求1 ‑8任一所述的多任务模型的训练方法。权 利 要 求 书 2/2 页 3 CN 114821538 A 3

PDF文档 专利 一种多任务模型的训练方法及装置

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多任务模型的训练方法及装置 第 1 页 专利 一种多任务模型的训练方法及装置 第 2 页 专利 一种多任务模型的训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。