(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210961375.9
(22)申请日 2022.08.11
(65)同一申请的已公布的文献号
申请公布号 CN 115049021 A
(43)申请公布日 2022.09.13
(73)专利权人 江西合一云数据科技股份有限公
司
地址 330096 江西省南昌市高新 技术产业
开发区紫阳大道绿地新都会紫峰大厦
写字楼1408室
(72)发明人 余芳 余聪 徐飞
(74)专利代理 机构 南昌逸辰知识产权代理事务
所(普通合伙) 36145
专利代理师 王淼
(51)Int.Cl.
G06K 9/62(2022.01)G06F 16/25(2019.01)
(56)对比文件
CN 113568819 A,2021.10.2 9
TW 202115652 A,2021.04.16
CN 110647924 A,2020.01.0 3
CN 114783616 A,202 2.07.22
US 2021158593 A1,2021.0 5.27
US 2019138247 A1,2019.0 5.09
Jiye Huang等.Bat tery groupi ng based
on improved K-means w ith curve fit ting.
《2018 13th IE EE Conference o n Industrial
Electronics and Ap plications (ICIEA)》
.2018,
张宏伟等.贝叶斯序贯重要性积分滤波器.
《电子学报》 .202 2,
审查员 李志研
(54)发明名称
应用于公众集群管理的数据处理方法和装
置及其设备
(57)摘要
本申请提供了一种应用于公众集群管理的
数据处理方法和装置及其设备, 运用于公众集群
管理技术领域, 其方法包括: 调用数据、 向量化数
据、 K‑means聚类数据、 将数据导入至加权层叠坐
标框架、 坍缩框架、 评估坐标框架坍缩后的数据
匹配率, 确认异常状态并反推问题, 最终通过该
问题生成视图提供与管理者, 本申请提出的公众
集群管理的数据处理方法和装置及其设备绕过
了传统的分区化数据存储以及数据输出, 减少了
输出通路, 通过也避免了采用扩充存储单元的方
式, 达到了公众集群管理平台的数据存储及输出
的容量均衡, 减少了成本, 实现PCB单板 执行公众
集群管理的效果。
权利要求书3页 说明书11页 附图3页
CN 115049021 B
2022.11.08
CN 115049021 B
1.一种应用于公众集群管理的数据处 理方法, 其特 征在于, 包括:
获取数据库调用指令, 并根据指令从预设的数据库中调取与 数据库调用指令匹配类型
的单体数据, 其中所述单体数据包括但不限于为医疗数据资料, 且所述单体数据的类型包
括视频数据、 文本数据以及音频 数据的一项或多 项;
对所述单体数据进行两端向量化, 生成正值单体向量和负值单体向量, 具体为: 拆解所
述单体数据的第一级类型为视频类型、 文本类型和语音类型, 同时得到视频数据、 文本数据
和语音数据; 采用小波变换对视频数据和语音数据进行编码化得到量化数据, 对所述文本
数据进行关键词识别摘取得到文本集合, 而后对所述量化数据和文本集合进行向量化, 得
到所述正值单体向量; 对所述 正值单体向量进行镜像, 得到所述负值单体向量;
将所述正值单体向量和负值单体向量分别导入预设的加权层叠坐标框架中, 并采用K ‑
means聚类算法分别对正值单体 向量和负值单体向量进行聚类处理, 以形成在所述加权层
叠坐标框架中分别与所述正值单体向量和负值单体向量对应的正向加权曲线和反向加权
曲线, 具体为: 建立虚 坐标系, 将所述正值单体向量和负值单体向量分别完全重合坐标系的
一、 四坐标系的正X轴和坐标系二、 三的负X轴; 对所述单体数据中的视频类型、 文本类型和
语音类型进行第二级类型拆解, 得到所述视频数据、 文本数据和语音数据中的若干视频节
点、 若干文本节点和若干语音节点; 进行K ‑means算法对若干视频节点、 若干文本节点和若
干语音节点进行聚类, 通过节点的重复聚合量, 将对所述正值单体向量和负值单体向量在
虚坐标系中进行调整, 从而得到正向加权曲线和反向加权曲线;
通过所述正向加权曲线和反向加权曲线将所述加权层叠坐标框架进行坍缩, 使所述正
向加权曲线和反向加权曲线载入至匹配的加权坐标系中; 通过判定所述正向加权曲线和反
向加权曲线中的曲线数值所匹配的加权坐标系; 若匹配成功, 则坍缩所述加权层叠坐标框
架, 从而得到加权坐标系上形成正向加权曲线和反向加权曲线, 具体为: 当正向加权曲线和
反向加权曲线的加权层叠坐标框架中时, 判断正向加权曲线和反向加权曲线具体匹配的Z
轴类型, 当单体数据所指令的是医疗数据时, 在加权层叠坐标框架中所呈现的教育数据所
对应的坐标系就无法呈现该正向加权曲线/ 反向加权曲线, 因此实现 匹配过程, 进而进行坍
缩, 从原来的XYZ三轴坍缩成XY两轴, 得到正向加权曲线和反向加权曲线 载入至匹配的加权
坐标系中的效果, 即是判定所述正向加权曲线和反向加权曲线中的曲线 数值所匹配的加权
坐标系; 若匹配成功, 则坍缩所述加权层叠坐标框架, 从而得到加权坐标系上形成正向加权
曲线和反向加权曲线的过程;
再通过所述正向加权曲线和反 向加权曲线在加权坐标系中的坐标区间, 调用与所述坐
标区间对应的注意力算法对正向加权曲线和反向加权曲线进 行截断处理, 得到正向截断曲
线和反向截断曲线, 具体为: 采用注意力算法机制中的支持向量机对正向加权曲线和反向
加权曲线 进行截断处 理, 其中
得到正向截断曲线
和反向截断曲线
;
其中,
为坐标系 符号,
为正向加权曲线/反向加权曲线, i为截断次数,
为针对于Y
轴 上 的 截 断 ,
为 针 对 于 X 轴 上 的 截 断 , n 为 正 向 加 权 曲 线 中 的 集 合 数 ,权 利 要 求 书 1/3 页
2
CN 115049021 B
2为削减正向加权曲线的边 缘计算值以及b所确定的损失函数;
判断预设在数据库中单体数据对应的异常函数与 所述正向截断曲线的曲线 复合率, 同
时反推与所述反向加权曲线匹配的单体数据类型;
生成视图数据, 若所述曲线复合率高于指定阈值, 则通过反推后的单体数据类型在所
述视图数据中进行 特殊显示。
2.根据权利要求1所述的应用于公众集群管理 的数据处理方法, 其特征在于, 判断预设
在数据库中单体数据对应的异常函数与所述 正向截断曲线的曲线复合 率, 包括:
采用杰卡德距离对正向截断曲线和所述异常函数在加权坐标系中的曲线进行比对之
前, 将正向截断曲线匹配至公式, 即
对比正向截断曲线和所述异常函数的所述曲线复合 率的jaccard相似度, 其中
从而得到所述曲线复合 率;
其中, A为正向截断曲线的集合向量, B为异常函数在加权坐标系中的曲线对应的集合
向量, 上述的
为曲线复合率,
代表向量A和向量B均为1的个数,
代表向量A为1和向
量B为0的个数,
代表向量A为0和向量B为1的个数。
3.一种应用于公众集群管理的数据处 理装置, 其特 征在于, 包括:
获取单元, 用于获取数据库调用指令, 并根据指令从预设的数据库中调取与数据库调
用指令匹配类型 的单体数据, 其中所述单体数据包括但不限于为医疗数据资料, 且所述单
体数据的类型包括视频 数据、 文本数据以及音频 数据的一项或多 项;
向量量化单元, 用于对所述单体数据进行两端向量化, 生成正值单体向量和负值单体
向量, 具体为: 拆解所述单体数据的第一级类型为视频类型、 文本类型和语音类型, 同时得
到视频数据、 文本数据和语音数据; 采用小波变换对视频数据和语音数据进行编码化得到
量化数据, 对所述文本数据进行关键词识别摘取得到文本集合, 而后对所述量化数据和文
本集合进 行向量化, 得到所述正值单体向量; 对所述正值单体向量进 行镜像, 得到所述负值
单体向量;
坐标聚类单元, 用于将所述正值单体向量和负值单体向量分别导入预设的加权层叠坐
标框架中, 并采用K ‑means聚类算法分别对正值单体向量和负值单体向量进 行聚类处理, 以
形成在所述加权层叠坐标框架中分别与所述正值单体向量和负值单体向量对应的正向加
权曲线和反向加权曲线, 具体为: 建立虚 坐标系, 将所述正值单体向量和负值单体向量分别
完全重合坐标系的一、 四坐标系的正X轴和坐标系二、 三的负X轴; 对 所述单体数据中的视频
类型、 文本类型和语音类型进 行第二级类型拆解, 得到所述视频数据、 文本数据和语音数据
中的若干视频节点、 若干文本节点和若干语音节点; 进行K ‑means算法对若干视频节点、 若
干文本节点和若干语音节点进行聚类, 通过节点的重复聚合量, 将对所述正值单体向量和
负值单体向量在虚坐标系中进行调整, 从而得到正向加权曲线和反向加权曲线;
坐标坍缩单元, 用于通过所述正向加权曲线和反向加权曲线将所述加权层叠坐标框架权 利 要 求 书 2/3 页
3
CN 115049021 B
3
专利 应用于公众集群管理的数据处理方法和装置及其设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 01:01:49上传分享