专利一种数字化场景识别的多媒体互动分析方法及云平台

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210712085.0 (22)申请日 2022.06.22 (71)申请人晨雨初听（武汉）文化艺术传播有限公司地址 430061 湖北省武汉市武昌区积玉桥中山路338号 (72)发明人于宝乾　 (51)Int.Cl. G06F 3/16(2006.01) G06F 16/25(2019.01) H04N 7/15(2006.01) H04R 1/08(2006.01) (54)发明名称一种数字化场景识别的多媒体互动分析方法及云平台 (57)摘要本发明公开一种数字化场景识别的多媒体互动分析方法及云平台，通过在多媒体会议进行过程中对会议话筒进行开闭控制、音量控制和收音端放置角度的智能调控，实现了对会议话筒的多维度互动控制，弥补了目前对会议话筒的互动控制过于单一的不足，进而有效降低了收音干扰的发生率，同时提高了会议话筒的收音精准度，在很大程度上提升了会议话筒对演讲人员的收音效果，与此同时在对会议话筒进行音量控制时，综合考虑到了会议室的空间体积和会议话筒的固定位置对会议话筒音量控制的影响，由此据此对会议话筒的音量进行灵活性、针对性的控制，大大提高了音量控制的准确度，最大程度保障了参会人员的听觉效果。权利要求书3页说明书8页附图3页 CN 115268820 A 2022.11.01 CN 115268820 A 1.一种数字化场景识别的多媒体互动分析方法，其特征在于，包括以下步骤：步骤1：统计参加多媒体会议的参会人员，并获取各参会人员对应的参会基本信息；步骤2：获取多媒体会议对应的演讲流程，进而将多媒体会议对应的演讲流程和各参会人员对应的参会基本信息存储在参会数据库中；步骤3：对多媒体会议室中存在的座位进行编号，并分别在各座位对应的会议桌区域设置会议话筒和摄像仪；步骤4：在会议正式开始时，从参会数据库中提取多媒体会议对应的演讲流程，并从演讲流程中获取演讲顺序表；步骤5：从演讲顺序表中按顺序提取各演讲参会人员的姓名和演讲时间段；步骤6：根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制和音量控制；步骤7：在各演讲参会人员对应的演讲时间段对会议话筒进行收音端放置参数调控。 2.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述参会基本信息包括姓名和座位号。 3.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述会议话筒包括固定底座和收音端，其中收音端可自由转动。 4.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述步骤6中根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制对应的具体控制过程参看以下步骤： A1:根据各演讲参会人员的姓名从参会数据库中筛选出各演讲参会人员对应的座位号； A2:在各演讲参会人员对应的演讲时间段，根据各演讲参会人员对应的座位号找到该座位对应会议桌区域的会议话筒，并执行开启操作，同时对其他座位对应会议桌区域的会议话筒保持关闭状态。 5.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述步骤6中根据各演讲参会人员的姓名和演讲时间段对会议话筒进行音量控制对应的具体控制过程参看以下步骤： B1:获取会议室的空间体积，并在会议室内按照设定的三维直角坐标系构建方式进行三维直角坐标系构建； B2:根据构建的三维直角坐标系获取会议室空间内中心点的位置坐标及各会议话筒对应固定底座的位置坐标； B3:根据会议室空间内中心点的位置坐标和各会议话筒对应固定底座的位置坐标计算出各会议话筒的固定位置与会议室空间内中心点之间的距离，并记为各会议话筒固定位置对应的接近距离； B4:将会议室的空间体积与设置的各种空间体积在会议话筒处于标准固定位置下的适宜音量进行匹配，其中标准固定位置是指会议话筒固定在会议室空间内中心点位置，从中匹配出该会议室的空间体积在会议话筒处于标准固定位置下的适宜音量； B5:将各会议话筒固定位置对应的接近距离和该会议室的空间体积在会议话筒处于标权　利　要　求　书 1/3 页 2 CN 115268820 A 2准固定位置下的适宜音量代入公式中，由此计算出各会议话筒开启时对应的适宜音量，其中q表示为会议话筒开启时对应的适宜音量， q0表示为该会议室的空间体积在会议话筒处于标准固定位置下的适宜音量， l表示为会议话筒固定位置对应的接近距离， l0表示为预设的接近距离阈值； B6:在各演讲参会人员对应的演讲时间段实时采集该演讲参会人员所在座位对应会议话筒的实际音量，并将其调控为该会议话筒开启时对应的适宜音量。 6.根据权利要求5所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述设定的三维直角坐标系构建方式为取会议室所在地面的预设拐角作为原点，分别以会议室的长度所在方向、宽度所在方向和高度所在方向作为x轴、 y轴和z轴。 7.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述收音端放置参数包括收音端垂直方向放置高度和收音端水平方向放置角度。 8.根据权利要求7所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述步骤7中在各演讲参会人员对应的演讲时间段对会议话筒进行收音端放置参数调控具体包括以下步骤： C1:在各演讲参会人员对应的演讲时间段内将该演讲参会人员记为目标演讲人员，并将目标演讲人员所在座位对应会议桌区域的会议话筒和摄像仪记为目标演讲人员对应的指定会议话筒和指定摄像仪； C2:将目标演讲人员对应的演讲时间段按照预定义的时间间隔进行划分，得到若干采集时间点，并将各采集时间点按照时间先后顺序依次编号为1,2,...,t,...,m,进而由目标演讲人员对应的指定摄像仪在各采集时间点对目标演讲人员进行坐姿图像采集； C3:从各采集时间点对应目标演讲人员的坐姿图像中提取有效坐姿高度； C4:将各采集时间点对应目标演讲人员的坐姿图像聚焦在目标演讲人员的嘴部区域，进而根据构建的三维直角坐标系获取各采集时间点中目标演讲人员对应的嘴部位置三维坐标； C5:基于目标演讲人员对应指定会议话筒的固定位置三维坐标和各采集时间点中目标演讲人员对应的嘴部位置三维坐标计算各采集时间点中指定会议话筒的固定位置与目标演讲人员嘴部位置之间的距离，并将该距离记为指定会议话筒对目标演讲人员的收音距离； C6:根据各采集时间点对应目标演讲人员的有效坐姿高度进行坐姿高度线勾勒，进而将目标演讲人员对应指定会议话筒的固定位置向坐姿高度线进行投影，得到各采集时间点中目标演讲人员对应指定会议话筒的固定位置投影点； C7:将各采集时间点中目标演讲人员对应的嘴部位置、指定会议话筒的固定位置和指定会议话筒的固定位置投影点构成一个收音三角形，由此根据构成的收音三角形统计各采集时间点中目标演讲人员对应指定会议话筒的收音端垂直方向需求放置角度，其计算公式为 θt表示为第t个采集时间点中目标演讲人员对应指定会议话筒的收音端垂直方向需求放置角度， ht表示为第t个采集时间点中目标演讲人员对应的有效坐姿高度， lt权　利　要　求　书 2/3 页 3 CN 115268820 A 3

专利 一种数字化场景识别的多媒体互动分析方法及云平台

专利一种数字化场景识别的多媒体互动分析方法及云平台