全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211210701.9 (22)申请日 2022.09.30 (71)申请人 阿波罗智联 (北京) 科技有限公司 地址 100176 北京市北京经济技 术开发区 瑞合西二路7号院1号楼1层101 (72)发明人 夏春龙  (74)专利代理 机构 北京银龙知识产权代理有限 公司 11243 专利代理师 刘念 (51)Int.Cl. G06N 3/08(2006.01) G06F 16/45(2019.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/40(2022.01)G06V 10/26(2022.01) (54)发明名称 模型训练方法、 装置及电子设备 (57)摘要 本公开提供了一种模 型训练方法、 装置及电 子设备, 涉及人工智能技术领域, 具体涉及深度 学习技术领域。 具体实现方案为: 获取目标场景 下的第一数据集, 第一数据集包括目标场景下的 M个历史多媒体数据; 基于第一预测数据, 确定M 个历史多媒体数据对应的M个第一采样概率, 第 一预测数据为基于第一训练数据集对第一模型 进行第K次迭代训练中输出的预测数据, 第一训 练数据集包括从所述第一数据集中选取的历史 多媒体数据; 基于M个第一采样概率, 从第一数据 集中选取N个历史多媒体数据, 得到第二训练数 据集; 基于第二训练数据集, 对第一模型进行第K +1次迭代训练, 得到第二预测数据; 基于第二预 测数据, 确定目标模型。 权利要求书4页 说明书14页 附图2页 CN 115423094 A 2022.12.02 CN 115423094 A 1.一种模型训练方法, 包括: 获取目标场景下的第一数据集, 所述第一数据集包括所述目标场景下的M个历史多媒 体数据, M为大于1的整数; 基于第一预测数据, 确定所述M个历史多媒体数据对应的M个第一采样概率, 所述第一 预测数据为基于第一训练数据集对第一模型进行第K次迭代训练中输出 的预测数据, 所述 第一训练数据集包括从所述第一数据集中选取的历史多媒体数据, 所述第一采样概率指示 所述历史多媒体数据在所述第一数据集中被选取的概 率, K为正整数; 基于所述M个第一采样概率, 从所述第一数据集中选取N个历史多媒体数据, 得到第二 训练数据集, N 为大于1的整数; 基于所述第二训练数据集, 对所述第一模型进行第K+1次迭代训练, 得到第二预测数 据; 基于所述第二预测数据, 确定由所述第一模型训练得到的目标模型, 所述目标模型用 于对所述目标场景 下的多媒体数据进行处 理。 2.根据权利要求1所述的方法, 其中, 所述第 一训练数据集还包括所述第 一训练数据集 中历史多媒体数据的第一标识数据, 所述基于第一预测数据, 确定所述M个历史多媒体数据 对应的M个第一采样概 率, 包括: 确定所述第一预测数据和所述第一标识数据之间的差异值; 基于所述差异值, 确定所述M个第一采样概 率。 3.根据权利要求2所述的方法, 其中, 所述基于所述差异值, 确定所述M个第一采样概 率, 包括: 基于所述差异值, 确定所述第一训练数据集中历史多媒体数据的价 值; 基于所述 价值, 确定所述M个第一采样概 率。 4.根据权利要求3所述的方法, 其中, 所述基于所述价值, 确定所述M个第一采样概率, 包括: 基于所述 价值, 确定所述第一训练数据集中历史多媒体数据的第二采样概 率; 基于所述第二采样概率, 对所述M个历史多媒体数据对应的M个第三采样概率进行调 整, 得到所述M个第一采样概 率; 其中, 所述M个第三采样概 率用于获取 所述第一训练数据集。 5.根据权利要求4所述的方法, 所述基于第一预测数据, 确定所述M个历史多媒体数据 对应的M个第一采样概 率之前, 还 包括: 在K为1的情况下, 基于所述第一数据集中历史多媒体数据的数量, 确定所述M个第三采 样概率。 6.根据权利要求1所述的方法, 其中, 所述第 二训练数据集还包括所述第 二训练数据集 中历史多媒体数据的第二标识数据, 所述基于所述第二预测数据, 确定由所述第一模型训 练得到的目标模型, 包括: 基于所述第二预测数据和所述第二标识数据, 确定所述第一模型在第K+1次迭代训练 中的网络损失值; 基于所述网络损失值, 更新所述第一模型的网络参数; 在基于所述网络损失值确定满足第一预设条件的情况下, 基于第K+1次迭代训练中更权 利 要 求 书 1/4 页 2 CN 115423094 A 2新后的所述第一模型, 确定所述目标模型; 其中, 所述第一预设条件 包括以下至少一项: 所述网络损失值小于或等于第一预设阈值; 所述第一模型的迭代次数 大于或等于第二预设阈值。 7.根据权利要求6所述的方法, 其中, 所述基于第K+1次迭代训练中更新后的所述第一 模型, 确定所述目标模型, 包括: 在所述第一模型的迭代训练完成的情况下, 将满足第 二预设条件的第 一模型确定为候 选模型, 得到 至少两个所述 候选模型; 从至少两个所述 候选模型中筛 选得到所述目标模型; 其中, 所述第二预设条件 包括以下至少一项: 迭代次数 大于或等于所述第二预设阈值的迭代训练中更新后的第一模型; 网络损失值小于或等于所述第一预设阈值的迭代训练中更新后的第一模型。 8.根据权利要求7所述的方法, 其中, 所述从至少两个所述候选模型中筛选得到所述目 标模型, 包括: 获取第二数据集; 将所述第二数据集分别输入到至少两个所述候选模型中每个候选模型进行处理, 得到 至少两个第三预测数据; 基于至少两个所述第三预测数据, 从至少两个所述候选模型中筛选得到所述目标模 型。 9.一种模型训练装置, 包括: 获取模块, 用于获取目标场景下的第一数据集, 所述第一数据集包括所述目标场景下 的M个历史多媒体数据, M为大于1的整数; 第一确定模块, 用于基于第一预测数据, 确定所述M个历史多媒体数据对应的M个第一 采样概率, 所述第一预测数据为基于第一训练数据集对第一模型进行第K次迭代训练中输 出的预测数据, 所述第一训练数据集包括从所述第一数据集中选取 的历史多媒体数据, 所 述第一采样概 率指示所述历史多媒体数据在所述第一数据集中被选取的概 率, K为正整数; 选取模块, 用于基于所述M个第一采样概率, 从所述第一数据集中选取N个历史多媒体 数据, 得到第二训练数据集, N 为大于1的整数; 迭代训练模块, 用于基于所述第二训练数据集, 对所述第一模型进行第K+1次迭代训 练, 得到第二预测数据; 第二确定模块, 用于基于所述第二预测数据, 确定由所述第一模型训练得到的目标模 型, 所述目标模型用于对所述目标场景 下的多媒体数据进行处 理。 10.根据权利要求9所述的装置, 其中, 所述第一训练数据集还包括所述第一训练数据 集中历史多媒体数据的第一标识数据, 所述第一确定模块包括: 第一确定 子模块, 用于确定所述第一预测数据和所述第一标识数据之间的差异值; 第二确定 子模块, 用于基于所述差异值, 确定所述M个第一采样概 率。 11.根据权利要求10所述的装置, 其中, 所述第二确定 子模块包括: 第一确定单元, 用于基于所述差异值, 确定所述第一训练数据集中历史多媒体数据的 价值;权 利 要 求 书 2/4 页 3 CN 115423094 A 3

PDF文档 专利 模型训练方法、装置及电子设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、装置及电子设备 第 1 页 专利 模型训练方法、装置及电子设备 第 2 页 专利 模型训练方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。