专利基于LSTM技术的暴力低俗弹幕检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210550668.8 (22)申请日 2022.05.18 (71)申请人慧之安信息技术股份有限公司地址 100000 北京市海淀区昆明湖南路51 号A座二层217号 (72)发明人于艺春　余丹　兰雨晴　王丹星　 (74)专利代理机构北京广技专利代理事务所 (特殊普通合伙) 11842 专利代理师张国香 (51)Int.Cl. G06V 20/62(2022.01) G06V 20/40(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01)G06V 10/20(2022.01) G06F 16/35(2019.01) G06F 40/151(2020.01) G06F 40/289(2020.01) G06N 3/04(2006.01) H04N 21/2187(2011.01) H04N 21/4788(2011.01) (54)发明名称基于LSTM技术的暴力低俗弹幕检测方法 (57)摘要本发明提供了基于LSTM技术的暴力低俗弹幕检测方法，其从直播平台当前的直播视频影像中提取得到直播弹幕信息，并识别其中包含的弹幕文本内容；将弹幕文本内容进行文本词语预处理，转换得到文本词汇向量；利用LSTM神经网络模型对文本词汇向量进行分类处理，判断弹幕文本内容是否存在违规的暴力低俗信息，并且对存在违规的暴力低俗信息的弹幕文本内容进行屏蔽处理；上述检测方法对直播平台的直播视频影像出现的所有直播弹幕信息进行文本词汇的转换，得到与LSTM神经网络模型相匹配的文本词汇向量，这样能够对每条直播弹幕信息进行自动分类识别，减少对弹幕信息进行人工检测审核的工作量，避免弹幕信息的遗漏识别，改善直播平台的直播环境健康性。权利要求书3页说明书8页附图1页 CN 114998880 A 2022.09.02 CN 114998880 A 1.基于LSTM技术的暴力低俗弹幕检测方法，其特征在于，其包括如下步骤：步骤S1，获取直播平台当前的直播视频影像，从所述直播视频影像中提取得到直播弹幕信息；并从所述直播弹幕信息中区分识别其中包含的弹幕文本内容；步骤S2，对所述弹幕文本内容进行文本词语预处理，从而将所述弹幕文本内容转换为文本词汇向量；步骤S3，利用LSTM神经网络模型对所述文本词汇向量进行分类处理，判断所述弹幕文本内容是否存在违规的暴力低俗信息；步骤S4，根据上述判断结果，对存在违规的暴力低俗信息的弹幕文本内容进行屏蔽处理。 2.如权利要求1所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S1中，获取直播平台当前的直播视频影像，从所述直播视频影像中提取得到直播弹幕信息具体包括：对直播平台进行实时录屏，以此获取直播平台当前的直播视频影像；按照直播平台的直播时间顺序，从所述直播视频影像中依次提取得到若干直播图片；对所述直播图片进行识别处理，得到所述直播图片的画面内对应存在的直播弹幕信息及其弹幕信息发送来源。 3.如权利要求2所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S2中，对所述直播图片进行识别处理，得到所述直播图片的画面内对应存在的直播弹幕信息具体包括：从所述直播图片中提取得到直播内容图层和直播弹幕图层，并对所述直播内容图层进行图像模糊化处理，以及对所述直播弹幕图层进行图像像素锐化处理；再从所述直播弹幕图层中识别提取得到所述直播弹幕图层画面范围内存在的直播弹幕信息。 4.如权利要求3所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S1中，从所述直播弹幕信息中区分识别其中包含的弹幕文本内容具体包括：从所述直播弹幕信息中获取其包括的所有信息符号的符号轮廓形状特征；根据所述符号轮廓形状特征，将所述直播弹幕信息包括的每个信息符号区分为文本信息符号和非文本信息符号；按照所有文本信息符号在所述直播弹幕信息中的原有排列顺序，将所有文本信息符号排列组成为弹幕文本内容。 5.如权利要求 4所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S2中，对所述弹幕文本内容进行文本词语预处理，从而将所述弹幕文本内容转换为文本词汇向量具体包括：根据所述弹幕文本内容的文本语义，对所述弹幕文本内容进行文本分词处理，得到若干弹幕文本分词；再将所述弹幕文本分词转换为文本词汇向量。 6.如权利要求5所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S3中，利用LSTM神经网络模型对所述文本词汇向量进行分类处理，判断所述弹幕文本内容是否存在违规的暴力低俗信息具体包括：权　利　要　求　书 1/3 页 2 CN 114998880 A 2将所述文本词汇向量输入到已完成训练的LSTM神经网络模型中进行分类处理，从而确定所述文本词汇向量对应的弹幕文本分词是否属于违规的暴力低俗文本词汇；若属于，则确定所述弹幕文本内容存在违规的暴力低俗信息；若不属于，则确定所述弹幕文本内容不存在违规的暴力低俗信息。 7.如权利要求6所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S4中，根据上述判断结果，对存在违规的暴力低俗信息的弹幕文本内容进行屏蔽处理具体包括：若所述弹幕文本内容存在违规的暴力低俗信息，则根据所述弹幕文本内容在所述直播视频影像的画面存在的位置，对所述弹幕文本内容进行视觉透明化的屏蔽处理。 8.如权利要求7 所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S4中，还包括：若所述弹幕文本内容存在违规的暴力低俗信息，则指示直播平台终端向对应弹幕信息发送来源的用户终端进行禁止弹幕输出操作。 9.如权利要求8所述的基于LSTM技术的暴力低俗弹幕检测方法，其特征在于：在所述步骤S4，还包括：若所述弹幕文本内容不存在违规的暴力低俗信息，则根据所述弹幕信息发送来源的用户终端历史以往被禁止弹幕输出操作的次数，控制当前发送的弹幕信息的弹幕文本内容的透明度，以及实时监测直播平台的弹幕显示区域内的颜色变化情况，还根据所述弹幕信息发送来源的用户终端历史以往被禁止弹幕输出操作的次数，控制弹幕信息的显示颜色，还根据所述弹幕信息的长度，调整所述弹幕信息在直播平台上显示的速度，其具体过程为：步骤S401，利用下面公式(1)，根据所述弹幕信息发送来源的用户终端历史以往被禁止弹幕输出操作的次数，控制当前发送的弹幕信息的弹幕文本内容的透明度，在上述公式(1)中， E(i)表示第i个不存在违规的暴力低俗信息的弹幕文本内容的透明度； E0表示预先设定的弹幕文本内容的基准透明度； N(i)表示第i个不存在违规的暴力低俗信息的弹幕文本内容所对应的发送来源的用户终端历史以往发送弹幕信息的总次数； n表示预设的排查次数； D(i)表示第i个不存在违规的暴力低俗信息的弹幕文本内容所对应的发送来源的用户终端历史以往被禁止弹幕输出操作的次数； int{}表示对括号内的数值取整；步骤S402，利用下面公式(2)，根据所述弹幕信息发送来源的用户终端历史以往被禁止弹幕输出操作的次数，控制弹幕信息的显示颜色，权　利　要　求　书 2/3 页 3 CN 114998880 A 3

专利 基于LSTM技术的暴力低俗弹幕检测方法

专利基于LSTM技术的暴力低俗弹幕检测方法