全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210712085.0 (22)申请日 2022.06.22 (71)申请人 晨雨初听 (武汉) 文化 艺术传播有限 公司 地址 430061 湖北省武汉市武昌区积玉桥 中山路338号 (72)发明人 于宝乾  (51)Int.Cl. G06F 3/16(2006.01) G06F 16/25(2019.01) H04N 7/15(2006.01) H04R 1/08(2006.01) (54)发明名称 一种数字化场景识别的多媒体互动分析方 法及云平台 (57)摘要 本发明公开一种数字化场景识别的多媒体 互动分析方法及云平台, 通过在 多媒体会议进行 过程中对会议话筒进行开闭控制、 音量控制和收 音端放置角度的智能调控, 实现了对会议话筒的 多维度互动控制, 弥补了目前对会议话筒的互动 控制过于 单一的不足, 进而有效降低了收音干扰 的发生率, 同时提高了会议话筒的收音精准度, 在很大程度上提升了会议话筒对演讲人员的收 音效果, 与此同时在对会议话筒进行音量控制 时, 综合考虑到了会议室的空间体积和会议话筒 的固定位置对会议话筒音量控制的影 响, 由此据 此对会议话筒的音量进行灵活性、 针对性的控 制, 大大提高了音量控制的准确度, 最大程度保 障了参会人员的听觉效果。 权利要求书3页 说明书8页 附图3页 CN 115268820 A 2022.11.01 CN 115268820 A 1.一种数字化场景识别的多媒体互动分析 方法, 其特 征在于, 包括以下步骤: 步骤1: 统计参加多媒体会议的参会人员, 并获取 各参会人员对应的参会基本信息; 步骤2: 获取多媒体会议对应的演讲流程, 进而将多媒体会议对应的演讲流程和各参会 人员对应的参会基本信息存 储在参会数据库中; 步骤3: 对多媒体会议室中存在的座位进行编号, 并分别在各座位对应的会议桌区域设 置会议话筒和摄 像仪; 步骤4: 在会议正式开始时, 从参会数据库中提取多媒体会议对应的演讲流程, 并从演 讲流程中获取演讲顺序表; 步骤5: 从演讲顺序表中按顺序提取 各演讲参会人员的姓名和演讲时间段; 步骤6: 根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制和音量控 制; 步骤7: 在各演讲参会人员对应的演讲时间段对 会议话筒进行收音 端放置参数调控。 2.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述参会基本信息包括 姓名和座 位号。 3.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述会议话筒包括固定底座和收音 端, 其中收音 端可自由转动。 4.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述步骤6中根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制对应的具体 控制过程 参看以下步骤: A1:根据各演讲参会人员的姓名从参会数据库中筛选出各演讲参会人员对应的座位 号; A2:在各演讲参会人员对应的演讲时间段, 根据各演讲参会人员对应的座位号找到该 座位对应会议桌区域的会议话筒, 并执行开启操作, 同时对其他座位对应会议桌区域的会 议话筒保持关闭状态。 5.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述步骤6中根据各演讲参会人员的姓名和演讲时间段对会议话筒进行音量控制对应的具体 控制过程 参看以下步骤: B1:获取会议室的空间体积, 并在会议室内按照设定的三维直角坐标系构建方式进行 三维直角坐标系构建; B2:根据构建的三维直角坐标系获取会议室空间内中心点的位置坐标及各会议话筒对 应固定底座的位置坐标; B3:根据会议室空间内中心点的位置坐标和各会议话筒对应 固定底座的位置坐标计算 出各会议话筒的固定位置与会议室空间内中心 点之间的距离, 并记为各会议话筒固定位置 对应的接 近距离; B4:将会议室的空间体积与设置的各种空间体积在会议话筒处于标准固定位置下的适 宜音量进行匹配, 其中标准固定位置是指会议话筒固定在会议室空间内中心点位置, 从中 匹配出该会议室的空间体积在会议 话筒处于标准固定位置下的适宜音量; B5:将各会议话筒固定位置对应的接近距离和该会议室的空间体积在会议话筒处于标权 利 要 求 书 1/3 页 2 CN 115268820 A 2准固定位置下的适宜音量代入公式 中, 由此计算出各会议话筒开启时对应的适宜 音量, 其中q表示为会议话筒开启时对应的适宜音量, q0表示为该会议室的空间体积在会议 话筒处于标准固定位置下的适宜音量, l表示为会议话筒固定位置对应的接近距离, l0表示 为预设的接 近距离阈值; B6:在各演讲参会人员对应的演讲时间段实时采集该演讲参会人员所在座位对应会议 话筒的实际音量, 并将其调控为该会议 话筒开启时对应的适宜音量。 6.根据权利要求5所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述设定的三 维直角坐标系构建方式为取会议室所在地面的预设拐角作为原 点, 分别以会议 室的长度所在方向、 宽度所在方向和高度所在方向作为x轴 、 y轴和z轴。 7.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述收音端放置参数包括收音 端垂直方向放置高度和收音 端水平方向放置角度。 8.根据权利要求7所述的一种数字化场景识别的多媒体互动分析方法, 其特征在于: 所 述步骤7中在各演讲参会人员对应的演讲时间段对会议话筒进行收音端放置参数调控具体 包括以下步骤: C1:在各演讲参会人员对应的演讲时间段内将该演讲参会人员记为目标演讲人员, 并 将目标演讲人员所在座位对应会议桌区域的会议话筒和摄像仪记为目标演讲人员对应的 指定会议 话筒和指定摄 像仪; C2:将目标演讲人员对应的演讲时间段按照预定义的时间间隔进行划分, 得到若干采 集时间点, 并将各采集时间点按照时间先后顺序 依次编号为1,2,...,t,...,m,进而由目标 演讲人员对应的指定摄 像仪在各采集时间点对目标演讲 人员进行坐姿图像采集; C3:从各采集时间点对应目标演讲 人员的坐姿图像中提取有效坐姿高度; C4:将各采集时间点对应目标演讲人员的坐姿图像聚焦在目标演讲人员的嘴部区域, 进而根据构建的三维直角坐标系获取各采集时间点中目标演讲人员对应的嘴部位置三维 坐标; C5:基于目标演讲人员对应指定会议话筒的固定位置三维坐标和各采集 时间点中目标 演讲人员对应的嘴部位置三维坐标计算各采集时间点中指定会议话筒的固定位置与目标 演讲人员嘴部位置之间的距离, 并将该距离记为指定会议话筒对目标演讲人员的收音距 离; C6:根据各采集时间点对应目标演讲人员的有效坐姿高度进行坐姿高度线勾勒, 进而 将目标演讲人员对应指 定会议话筒的固定位置向坐姿高度线进行投影, 得到各采集时间点 中目标演讲 人员对应指定会议 话筒的固定位置投影点; C7:将各采集时间点中目标演讲人员对应的嘴部位置、 指定会议话筒的固定位置和指 定会议话筒的固定位置投影点构成一个收音三角形, 由此根据构成的收音三角形 统计各采 集时间点中目标演讲人员对应指定会议话筒的收音端垂 直方向需求放置角度, 其计算公式 为 θt表示为第t个采集时间点 中目标演讲人员对应指定会议话筒的收音端垂 直方向需求放置角度, ht表示为第t个采集时间点中目标演讲人员对应的有 效坐姿高度, lt权 利 要 求 书 2/3 页 3 CN 115268820 A 3

PDF文档 专利 一种数字化场景识别的多媒体互动分析方法及云平台

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数字化场景识别的多媒体互动分析方法及云平台 第 1 页 专利 一种数字化场景识别的多媒体互动分析方法及云平台 第 2 页 专利 一种数字化场景识别的多媒体互动分析方法及云平台 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:02:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。