全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210562039.7 (22)申请日 2022.05.25 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 杨善明 刘泽宇 顾晓光  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 彭程 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/44(2022.01) G06V 10/20(2022.01)G06N 3/04(2006.01) G06F 16/783(2019.01) (54)发明名称 视频处理方法、 装置、 计算机设备、 介质及程 序产品 (57)摘要 本申请实施例公开了一种视频处理方法、 装 置、 计算机设备、 介质及程序产品。 其中方法包 括: 获取样本视频数据对应的正样本视频特征, 并获取所述样本视频数据对应的预测视频数据; 所述预测视频数据是基于所述样本视频数据进 行重构处理得到的视频数据; 获取历史样本视频 数据对应的负样本视频特征, 并基于所述正样本 视频特征、 所述负样本视频特征、 所述样本视频 数据以及所述预测视频数据, 对 预训练视频模型 进行预训练, 得到目标视频处理模型; 获取待处 理视频, 并调用所述目标视频处理模 型对所述待 处理视频进行视频处理, 得到所述待处理视频的 视频特征。 可以提高从视频中提取的视频特征的 准确性, 进 而提高视频处 理的准确性。 权利要求书2页 说明书22页 附图6页 CN 115115972 A 2022.09.27 CN 115115972 A 1.一种视频处 理方法, 其特 征在于, 包括: 获取样本视频数据对应的正样本视频特征, 并获取所述样本视频数据对应的预测视频 数据; 所述预测视频 数据是基于所述样本 视频数据进行重构处 理得到的视频 数据; 获取历史样本视频数据对应的负样本视频特征, 并基于所述正样本视频特征、 所述负 样本视频特征、 所述样本视频数据以及所述预测视频数据, 对 预训练视频模型进 行预训练, 得到目标视频处 理模型; 获取待处理视频, 并调用所述目标视频处理模型对所述待处理视频进行视频处理, 得 到所述待处 理视频的视频 特征。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述正样本视频特征、 所述负样 本视频特征、 所述样本视频数据以及所述预测视频数据, 对预训练视频模型进 行预训练, 得 到目标视频处 理模型, 包括: 基于所述正样本视频特征和所述负样本视频特征, 确定所述预训练视频模型的第 一损 失值; 基于所述样本视频数据以及所述预测视频数据, 确定所述预训练视频模型的第 二损失 值; 基于所述第一损失值和所述第二损失值, 确定所述预训练视频模型的目标损失值; 基于所述目标损失值对所述预训练视频模型进行 预训练, 得到目标视频处 理模型。 3.根据权利要求1所述的方法, 其特征在于, 所述正样本视频特征包括第 一正样本视频 特征和第二 正样本视频特征; 所述获取样本 视频数据对应的正样本 视频特征, 包括: 对所述样本视频数据进行预处理, 得到所述样本视频数据的第 一目标样本视频数据以 及第二目标样本 视频数据; 对所述第一目标样本视频数据进行编码处理, 得到所述样本视频数据的第 一正样本视 频特征; 对所述第二目标样本视频数据进行编码处理, 得到所述样本视频数据的第 二正样本视 频特征。 4.根据权利要求3所述的方法, 其特征在于, 所述对所述第 一目标样本视频数据进行编 码处理, 得到所述样本 视频数据的第一 正样本视频特征, 包括: 对所述第一目标样本视频数据进行掩码处理, 得到所述样本视频数据的掩码视频特 征; 对所述掩码视频 特征进行特征提取, 得到所述样本 视频数据的第一 正样本视频特征。 5.根据权利要求3所述的方法, 其特征在于, 所述对所述样本视频数据进行预处理, 得 到所述样本 视频数据的第一目标样本 视频数据以及第二目标样本 视频数据, 包括: 对所述样本视频数据进行抽帧处理, 得到初始样本视频数据, 所述初始样本视频数据 是基于一帧或多帧视频帧合成得到的; 对所述初始样本 视频数据进行分块处 理, 得到样本 视频分块数据; 对所述样本视频分块数据进行第一数据增强处理, 得到第一目标样本视频数据, 并对 所述样本 视频分块数据进行第二数据增强处 理, 得到第二目标样本 视频数据。 6.根据权利要求1所述的方法, 其特征在于, 获取所述样本视频数据对应的预测视频数 据, 包括:权 利 要 求 书 1/2 页 2 CN 115115972 A 2获取所述样本 视频数据的掩码视频 特征; 对所述掩码视频 特征进行特征提取, 得到所述样本 视频数据的第三 正样本视频特征; 基于所述第 三正样本视频特征对所述样本视频数据进行预测处理, 得到所述样本视频 数据的预测视频 数据。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 还 包括: 获取训练视频 数据以及所述训练视频 数据对应的标注信息; 基于所述训练视频数据以及所述训练视频数据对应的标注信息对所述目标视频处理 模型进行训练, 得到训练后的目标视频处 理模型; 其中, 所述调用所述目标视频处理模型对所述待处理视频进行视频处理, 得到所述待 处理视频的视频 特征, 包括: 调用所述训练后的目标视频处理模型对所述待处理视频进行视频处理, 得到所述待处 理视频的视频 特征。 8.一种视频处 理装置, 其特 征在于, 包括: 获取单元, 用于获取样本视频数据对应的正样本视频特征, 并获取所述样本视频数据 对应的预测视频数据; 所述预测视频数据是基于所述样本视频数据进 行重构处理得到的视 频数据; 预训练单元, 用于获取历史样本视频数据对应的负样本视频特征, 并基于所述正样本 视频特征、 所述负样本视频特征、 所述样本视频数据以及所述预测视频数据, 对 预训练视频 模型进行 预训练, 得到目标视频处 理模型; 处理单元, 用于获取待处理视频, 并调用所述目标视频处理模型对所述待处理视频进 行视频处 理, 得到所述待处 理视频的视频 特征。 9.一种计算机设备, 其特征在于, 包括处理器和存储器, 其中, 所述存储器用于存储计 算机程序, 所述计算机程序包括程序指 令, 所述处理器被配置用于调用所述程序指令, 执行 如权利要求1 ‑7任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序包括程序指令, 所述程序指令当被处理器执行时使所述处理器执行如 权利要求1 ‑7任一项所述的方法。 11.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机指令, 所述计 算机指令被处 理器执行时实现权利要求1 ‑7任一项所述方法。权 利 要 求 书 2/2 页 3 CN 115115972 A 3

PDF文档 专利 视频处理方法、装置、计算机设备、介质及程序产品

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频处理方法、装置、计算机设备、介质及程序产品 第 1 页 专利 视频处理方法、装置、计算机设备、介质及程序产品 第 2 页 专利 视频处理方法、装置、计算机设备、介质及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。