专利视频数据的识别方法和装置、电子设备和存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210784195.8 (22)申请日 2022.06.28 (71)申请人北京明略昭辉科技有限公司地址 100098 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人胡郡郡　唐大闰　 (74)专利代理机构北京华夏泰和知识产权代理有限公司 1 1662 专利代理师曾军 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) H04N 21/234(2011.01) H04N 21/44(2011.01) (54)发明名称视频数据的识别方法和装置、电子设备和存储介质 (57)摘要本申请提供了一种视频数据的识别方法和装置、电子设备和存储介质，其中，该方法包括：获取待处理的目标视频片段；将所述目标视频片段输入目标模型中，得到视频特征，其中，所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息，所述目标模型是通过对初始模型的模型参数进行调整后得到的；根据所述视频特征，确定对所述目标视频片段中的视频数据的识别结果。通过本申请，解决了相关技术中存在的自动化程度较低，不能准确识别出视频片段的视频内容特征的问题。权利要求书2页说明书10页附图2页 CN 115205736 A 2022.10.18 CN 115205736 A 1.一种视频数据的识别方法，其特征在于，所述方法包括：获取待处理的目标视频片段；将所述目标视频片段输入目标模型中，得到视频特征，其中，所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息，所述目标模型是通过对初始模型的模型参数进行调整后得到的；根据所述视频特征，确定对所述目标视频片段中的视频数据的识别结果。 2.根据权利要求1所述的方法，其特征在于，在所述将所述目标视频片段输入目标模型中，得到视频特征之前，所述方法还包括：获取初始视频片段，其中，所述初始视频片段为训练所述初始模型的样本集；对所述初始视频片段进行等频帧数的划分，得到多个视频子片段，其中，所述视频子片段内包含多个视频帧，每一个所述视频子片段中的所述视频帧的数量相同；利用遮罩方案对所述视频子片段进行遮罩处理，得到被遮挡的第一视频帧和未被遮挡的第二视频帧，其中，所述第一视频帧和所述第二视频帧的个数都为至少一个；根据所述第一视频帧和所述第二视频帧，调整所述初始模型的模型参数，得到所述目标模型。 3.根据权利要求2所述的方法，其特征在于，所述利用遮罩方案对所述视频子片段进行遮罩处理，得到被遮挡的第一视频帧和未被遮挡的第二视频帧包括：按照所述遮罩方案中的遮罩比例对所述视频子片段进行遮罩处理，得到所述第一视频帧和所述第二视频帧。 4.根据权利要求3所述的方法，其特征在于，所述根据所述第一视频帧和所述第二视频帧，调整所述初始模型的模型参数，得到所述目标模型包括：根据所述第一视频帧，确定所述第一视频帧当前所处在的目标位置；根据所述第二视频帧，确定由所述第二视频帧所组成的第一序列；根据所述目标位置和所述第一序列，调整所述模型参数，得到所述目标模型。 5.根据权利要求4所述的方法，其特征在于，所述根据所述目标位置和所述第一序列，调整所述模型参数，得到所述目标模型包括：将所述第一序列输入编码器内，得到编码后的第二序列；在所述第二序列中的所述目标位置处加入多个遮罩标识，得到第三序列，其中，所述遮罩标识用于增加所述第二序列的完整度；将所述第三序列输入解码器内，得到解码后的特征向量；利用所述特征向量和损失函数，调整所述模型参数，得到所述目标模型。 6.根据权利要求5所述的方法，其特征在于，所述利用所述特征向量和损失函数，调整所述模型参数，得到所述目标模型包括：利用所述损失函数获取所述特征向量的计算结果；根据所述计算结果反向传播更新所述模型参数，直到所述计算结果大于或者等于预设阈值时，停止对所述模型参数的调整，得到所述目标模型，其中，所述预设阈值为停止调整所述模型参数的最低值。 7.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取下游任务信息；权　利　要　求　书 1/2 页 2 CN 115205736 A 2将所述目标视频片段对应的原始视频帧序列输入编码器内，得到编码后的第四序列；将所述第四序列与下游任务信息进行结合，得到结合后的应用结果。 8.一种视频数据的识别装置，其特征在于，所述装置包括：第一获取单元，用于获取待处理的目标视频片段；第一输入单元，用于将所述目标视频片段输入目标模型中，得到视频特征，其中，所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息，所述目标模型是通过对初始模型的模型参数进行调整后得到的；确定单元，用于根据所述视频特征，确定对所述目标视频片段中的视频数据的识别结果。 9.一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信，其特征在于，所述存储器，用于存储计算机程序；所述处理器，用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求1 至7中任一项所述的方法步骤。 10.一种计算机可读的存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被处理器执行时实现权利要求1至7中任一项中所述的方法步骤。权　利　要　求　书 2/2 页 3 CN 115205736 A 3

专利 视频数据的识别方法和装置、电子设备和存储介质

专利视频数据的识别方法和装置、电子设备和存储介质