专利视频处理方法、装置、计算机设备、介质及程序产品

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210562039.7 (22)申请日 2022.05.25 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人杨善明　刘泽宇　顾晓光　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师彭程 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/44(2022.01) G06V 10/20(2022.01)G06N 3/04(2006.01) G06F 16/783(2019.01) (54)发明名称视频处理方法、装置、计算机设备、介质及程序产品 (57)摘要本申请实施例公开了一种视频处理方法、装置、计算机设备、介质及程序产品。其中方法包括：获取样本视频数据对应的正样本视频特征，并获取所述样本视频数据对应的预测视频数据；所述预测视频数据是基于所述样本视频数据进行重构处理得到的视频数据；获取历史样本视频数据对应的负样本视频特征，并基于所述正样本视频特征、所述负样本视频特征、所述样本视频数据以及所述预测视频数据，对预训练视频模型进行预训练，得到目标视频处理模型；获取待处理视频，并调用所述目标视频处理模型对所述待处理视频进行视频处理，得到所述待处理视频的视频特征。可以提高从视频中提取的视频特征的准确性，进而提高视频处理的准确性。权利要求书2页说明书22页附图6页 CN 115115972 A 2022.09.27 CN 115115972 A 1.一种视频处理方法，其特征在于，包括：获取样本视频数据对应的正样本视频特征，并获取所述样本视频数据对应的预测视频数据；所述预测视频数据是基于所述样本视频数据进行重构处理得到的视频数据；获取历史样本视频数据对应的负样本视频特征，并基于所述正样本视频特征、所述负样本视频特征、所述样本视频数据以及所述预测视频数据，对预训练视频模型进行预训练，得到目标视频处理模型；获取待处理视频，并调用所述目标视频处理模型对所述待处理视频进行视频处理，得到所述待处理视频的视频特征。 2.根据权利要求1所述的方法，其特征在于，所述基于所述正样本视频特征、所述负样本视频特征、所述样本视频数据以及所述预测视频数据，对预训练视频模型进行预训练，得到目标视频处理模型，包括：基于所述正样本视频特征和所述负样本视频特征，确定所述预训练视频模型的第一损失值；基于所述样本视频数据以及所述预测视频数据，确定所述预训练视频模型的第二损失值；基于所述第一损失值和所述第二损失值，确定所述预训练视频模型的目标损失值；基于所述目标损失值对所述预训练视频模型进行预训练，得到目标视频处理模型。 3.根据权利要求1所述的方法，其特征在于，所述正样本视频特征包括第一正样本视频特征和第二正样本视频特征；所述获取样本视频数据对应的正样本视频特征，包括：对所述样本视频数据进行预处理，得到所述样本视频数据的第一目标样本视频数据以及第二目标样本视频数据；对所述第一目标样本视频数据进行编码处理，得到所述样本视频数据的第一正样本视频特征；对所述第二目标样本视频数据进行编码处理，得到所述样本视频数据的第二正样本视频特征。 4.根据权利要求3所述的方法，其特征在于，所述对所述第一目标样本视频数据进行编码处理，得到所述样本视频数据的第一正样本视频特征，包括：对所述第一目标样本视频数据进行掩码处理，得到所述样本视频数据的掩码视频特征；对所述掩码视频特征进行特征提取，得到所述样本视频数据的第一正样本视频特征。 5.根据权利要求3所述的方法，其特征在于，所述对所述样本视频数据进行预处理，得到所述样本视频数据的第一目标样本视频数据以及第二目标样本视频数据，包括：对所述样本视频数据进行抽帧处理，得到初始样本视频数据，所述初始样本视频数据是基于一帧或多帧视频帧合成得到的；对所述初始样本视频数据进行分块处理，得到样本视频分块数据；对所述样本视频分块数据进行第一数据增强处理，得到第一目标样本视频数据，并对所述样本视频分块数据进行第二数据增强处理，得到第二目标样本视频数据。 6.根据权利要求1所述的方法，其特征在于，获取所述样本视频数据对应的预测视频数据，包括：权　利　要　求　书 1/2 页 2 CN 115115972 A 2获取所述样本视频数据的掩码视频特征；对所述掩码视频特征进行特征提取，得到所述样本视频数据的第三正样本视频特征；基于所述第三正样本视频特征对所述样本视频数据进行预测处理，得到所述样本视频数据的预测视频数据。 7.根据权利要求1 ‑6任一项所述的方法，其特征在于，还包括：获取训练视频数据以及所述训练视频数据对应的标注信息；基于所述训练视频数据以及所述训练视频数据对应的标注信息对所述目标视频处理模型进行训练，得到训练后的目标视频处理模型；其中，所述调用所述目标视频处理模型对所述待处理视频进行视频处理，得到所述待处理视频的视频特征，包括：调用所述训练后的目标视频处理模型对所述待处理视频进行视频处理，得到所述待处理视频的视频特征。 8.一种视频处理装置，其特征在于，包括：获取单元，用于获取样本视频数据对应的正样本视频特征，并获取所述样本视频数据对应的预测视频数据；所述预测视频数据是基于所述样本视频数据进行重构处理得到的视频数据；预训练单元，用于获取历史样本视频数据对应的负样本视频特征，并基于所述正样本视频特征、所述负样本视频特征、所述样本视频数据以及所述预测视频数据，对预训练视频模型进行预训练，得到目标视频处理模型；处理单元，用于获取待处理视频，并调用所述目标视频处理模型对所述待处理视频进行视频处理，得到所述待处理视频的视频特征。 9.一种计算机设备，其特征在于，包括处理器和存储器，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1 ‑7任一项所述的方法。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1 ‑7任一项所述的方法。 11.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机指令，所述计算机指令被处理器执行时实现权利要求1 ‑7任一项所述方法。权　利　要　求　书 2/2 页 3 CN 115115972 A 3

专利 视频处理方法、装置、计算机设备、介质及程序产品

专利视频处理方法、装置、计算机设备、介质及程序产品