全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210550668.8 (22)申请日 2022.05.18 (71)申请人 慧之安信息技 术股份有限公司 地址 100000 北京市海淀区昆明湖南路51 号A座二层217号 (72)发明人 于艺春 余丹 兰雨晴 王丹星  (74)专利代理 机构 北京广技专利代理事务所 (特殊普通 合伙) 11842 专利代理师 张国香 (51)Int.Cl. G06V 20/62(2022.01) G06V 20/40(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01)G06V 10/20(2022.01) G06F 16/35(2019.01) G06F 40/151(2020.01) G06F 40/289(2020.01) G06N 3/04(2006.01) H04N 21/2187(2011.01) H04N 21/4788(2011.01) (54)发明名称 基于LSTM技 术的暴力低俗弹幕检测方法 (57)摘要 本发明提供了基于LSTM技术的暴力低俗弹 幕检测方法, 其从直播平台当前的直播视频影像 中提取得到直播弹幕信息, 并识别其中包含的弹 幕文本内容; 将弹幕文本内容进行文本词语预处 理, 转换得到文本词汇向量; 利用LSTM神经网络 模型对文本词汇向量进行分类处理, 判断弹幕文 本内容是否存在违规的暴力低俗信息, 并且对存 在违规的暴力低俗信息的弹幕文本内容进行屏 蔽处理; 上述检测方法对直播平台的直播视频影 像出现的所有直播弹幕信息进行文本词汇的转 换, 得到与LSTM神经网络模型相匹配的文本词汇 向量, 这样能够对每条直播弹幕信息进行自动分 类识别, 减少对弹幕信息进行人工检测审核的工 作量, 避免弹幕信息的遗漏识别, 改善直播平台 的直播环境健康性。 权利要求书3页 说明书8页 附图1页 CN 114998880 A 2022.09.02 CN 114998880 A 1.基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于, 其包括如下步骤: 步骤S1, 获取直播平台当前的直播视频影像, 从所述直播视频影像中提取得到直播弹 幕信息; 并从所述 直播弹幕信息中区分识别其中包 含的弹幕文本内容; 步骤S2, 对所述弹幕文本内容进行文本词语预处理, 从而将所述弹幕文本内容转换为 文本词汇向量; 步骤S3, 利用LSTM神经网络模型对所述文本词汇向量进行分类处理, 判断所述弹幕文 本内容是否存在违规的暴力低俗信息; 步骤S4, 根据上述判断结果, 对存在违规的暴力低俗信息的弹幕文本内容进行屏蔽处 理。 2.如权利要求1所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S1中, 获取直播平台当前的直播视频影像, 从所述直播视频影像中提取得 到直播弹幕信息具体包括: 对直播平台进行实时录屏, 以此获取直播平台当前的直播视频影像; 按照直播平台的 直播时间顺序, 从所述 直播视频影 像中依次提取 得到若干直 播图片; 对所述直播图片进行识别处理, 得到所述直播图片的画面内对应存在的直播弹幕信 息 及其弹幕信息发送来源。 3.如权利要求2所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S2中, 对所述直播图片进行识别处理, 得到所述直播图片的画面内对应存 在的直播弹幕信息具体包括: 从所述直播图片中提取得到直播内容图层和直播弹幕图层, 并对所述直播内容图层进 行图像模糊化处 理, 以及对所述 直播弹幕图层进行图像 像素锐化处 理; 再从所述直播弹幕图层中识别提取得到所述直播弹幕图层画面范围内存在的直播弹 幕信息。 4.如权利要求3所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S1中, 从所述直播弹幕信息中区分识别其中包含的弹幕文本内容具体包 括: 从所述直播弹幕信息中获取其包括的所有信息符号的符号轮廓形状特 征; 根据所述符号轮廓形状特征, 将所述直播弹幕信 息包括的每个信 息符号区分为文本信 息符号和非文本信息符号; 按照所有文本信 息符号在所述直播弹幕信 息中的原有排列顺序, 将所有文本信 息符号 排列组成为弹幕文本内容。 5.如权利要求 4所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S2中, 对所述弹幕文本内容进行文本词语预处理, 从而将所述弹幕文本内 容转换为文本词汇向量具体包括: 根据所述弹幕文本内容的文本语义, 对所述弹幕文本内容进行文本分词处理, 得到若 干弹幕文本分词; 再将所述弹幕文本分词转换为文本词汇向量。 6.如权利要求5所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S3中, 利用LSTM神经网络模型对所述文本词汇向量进行分类处理, 判断所 述弹幕文本内容是否存在违规的暴力低俗信息具体包括:权 利 要 求 书 1/3 页 2 CN 114998880 A 2将所述文本词汇向量输入到已完成训练的LSTM神经网络模型中进行分类处理, 从而确 定所述文本词汇向量对应的弹幕文本分词是否属于违规的暴力低俗文本词汇; 若属于, 则确定所述弹幕文本 内容存在违规的暴力低俗信 息; 若不属于, 则确定所述弹 幕文本内容 不存在违规的暴力低俗信息 。 7.如权利要求6所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S4中, 根据上述判断结果, 对存在违规的暴力低俗信息的弹幕文本内容进 行屏蔽处 理具体包括: 若所述弹幕文本内容存在违规的暴力低俗信 息, 则根据 所述弹幕文本 内容在所述直播 视频影像的画面存在的位置, 对所述弹幕文本内容进行视 觉透明化的屏蔽处 理。 8.如权利要求7 所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S4中, 还 包括: 若所述弹幕文本内容存在违规的暴力低俗信 息, 则指示直播平台终端向对应弹幕信 息 发送来源的用户终端 进行禁止弹幕输出操作。 9.如权利要求8所述的基于LSTM技 术的暴力低俗弹幕检测方法, 其特 征在于: 在所述步骤S4, 还 包括: 若所述弹幕文本内容不存在违规的暴力低俗信 息, 则根据 所述弹幕信 息发送来源的用 户终端历史以往被禁止弹幕输出操作的次数, 控制当前发送的弹幕信息的弹幕文本内容的 透明度, 以及实时监测直播平台的弹幕显示区域内的颜色变化情况, 还根据所述弹幕信息 发送来源的用户终端历史以往被禁止弹幕输出操作的次数, 控制弹幕信息的显示颜色, 还 根据所述弹幕信息的长度, 调整所述弹幕信息在直 播平台上显示的速度, 其具体过程 为: 步骤S401, 利用下面公式(1), 根据所述弹幕信息发送来源的用户终端历史以往被禁止 弹幕输出操作的次数, 控制当前发送的弹幕信息的弹幕文本内容的透明度, 在上述公式(1)中, E(i)表示第i个不存在违规的暴力低俗信息的弹幕文本内容的透明 度; E0表示预先设定的弹幕文本内容的基准透明度; N(i)表示第i个不存在违规的暴力低俗 信息的弹幕文本内容所对应的发送来源的用户终端历史以往发送弹幕信息的总次数; n表 示预设的排查次数; D(i)表示第i个不存在违规的暴力低俗信息的弹幕文本内容所对应的 发送来源的用户终端历史以往被禁止弹幕输出操作的次数; int{}表示对括号内的数值取 整; 步骤S402, 利用下面公式(2), 根据所述弹幕信息发送来源的用户终端历史以往被禁止 弹幕输出操作的次数, 控制弹幕信息的显示颜色,权 利 要 求 书 2/3 页 3 CN 114998880 A 3

PDF文档 专利 基于LSTM技术的暴力低俗弹幕检测方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于LSTM技术的暴力低俗弹幕检测方法 第 1 页 专利 基于LSTM技术的暴力低俗弹幕检测方法 第 2 页 专利 基于LSTM技术的暴力低俗弹幕检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。