全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210613372.6 (22)申请日 2022.05.31 (71)申请人 每日互动股份有限公司 地址 310012 浙江省杭州市西湖区西溪路 525号A楼西区418室 (72)发明人 尹雅露 李浩川 俞玲玲 陈志勇  (74)专利代理 机构 北京锺维联合知识产权代理 有限公司 1 1579 专利代理师 原春香 (51)Int.Cl. G06F 16/35(2019.01) G06F 8/71(2018.01) G06F 9/445(2018.01) (54)发明名称 一种pkg簇的获取方法、 计算机设备及存储 介质 (57)摘要 本发明涉及pkg处理技术领域, 尤其是一种 pkg簇的获取方法、 计算机设备及存储介质, 所述 方法: 根据初始pkg列表和初始pkg列表中每一初 始pkg对应的初始标签列表, 获取第一样本pkg列 表和第二样本pkg列表; 对第一样本pkg列表进行 处理, 获取第一样本pkg列表对应的中间pkg集; 对每一中间pkg列表进行聚类处理, 获取中间pkg 列表对应的第一指定pkg簇列表; 根据第一指定 pkg簇列表中第一指定pkg簇与第一指定pkg簇对 应的非第一指定pkg簇列表, 获取中间pkg簇; 可 知, 通过每一目标标签类型中的pkg进行聚类后, 再整体进行聚类, 保证了聚类的准确性, 进而通 过聚类生成pkg簇, 使得将目标pkg簇发送至用 户, 实现对pkg的模糊化, 提高pkg文件信息的安 全性。 权利要求书2页 说明书6页 附图2页 CN 115017311 A 2022.09.06 CN 115017311 A 1.一种pkg簇的获取 方法, 其特 征在于, 所述方法包括如下步骤: S100、 根据初始pk g列表和初始pk g列表中每一初始pk g对应的初始标签列表, 获取第一 样本pkg列表和第二样本pkg列表; S200、 对第一样本pkg列表进行处理, 获取第一样本pkg列表对应的中间pkg集G= {G1,……, Gj,……, Gn}, Gj是指第j类目标标签对应的中间pkg列表, j=1 ……n, n为目标标 签的类型 数量; S300、 对每一Gj进行处理, 获取到G对应的中间pkg簇列表H={H1,……, Hr,……, Hs}, Hr 是指第r个中间pkg簇, r =1……s, s为中间pkg簇的数量; 其中, 在S300步骤中还包括如下步 骤: S301、 对每一Gj进行聚类处理, 获取G对应的第一指定pkg簇集H'={H'1,……, H 'j,……, H'n}, H'j={H'j1,……, H'ja,……, H'jbj}, H'ja是指Gj对应的第a个第一指定pkg簇, a=1……bj, bj为Gj对应的第一指定pkg簇的数量; S303、 根据H'ja与H'ja对应的非第一指定pkg簇列表, 获取中间pkg簇 。 2.根据权利要求1所述的pkg簇的获取方法, 其特征在于, 在S100步骤中还通过如下步 骤确定第一样本pkg和第二样本pkg: S101、 获取初始pkg列表A={A1,……, Ai,……, Am}, Ai是指第i个初始pkg, i=1 ……m, m 为初始pkg数量; S103、 根据Ai, 获取Ai对应的初始标签列表; S105、 当Ai对应的初始标签列表不 等于null时, 将Ai作为第一样本pkg; S107、 当Ai对应的初始标签列表等于nul l时, 将Ai作为第二样本pkg。 3.根据权利要求1所述的pkg簇的获取方法, 其特征在于, 在A中所有 的初始pkg对应 同 一应用平台。 4.根据权利要求3所述的获取pkg簇的数据处理系 统, 其特征在于, 在S200步骤中还包 括如下步骤: S201、 获取第一样本pkg列表中任一第一样本pkg对应的标签列表L={L1,……, Lt,……, Lk}, Lt是指第一样本pkg对应的第t个初始标签, t=1 ……k, k为指第一样本pkg对 应的初始标签的数量; S203、 基于从所述应用平台 中获取Lt对应的pkg数量, 获取L对应的pkg数量列表; S205、 遍历L对应 的pkg数量列表且从L对应 的pkg数量列表中获取最大pkg数量对应 的 初始标签作为第一样本pkg的目标 标签; S207、 根据所有第一样本pkg的目标 标签, 获取到G。 5.根据权利要求1所述的pkg簇的获取方法, 其特征在于, 在S301步骤中还包括如下步 骤: S3011、 获取Gj对应的向量列 表G'j={G'j1,……G'jδ,……G'j η}, G'jδ是指Gj中第 δ个中间 pkg对应的向量, δ =1 ……η, η为Gj内的中间pkg的数量; S3012、 获取Gj对应的初始向量列表CSj={CSj1,……, CSja,……, CSjbj}, CSja是指Gj对应 的第a个初始向量; S3013、 根据G'jδ和CSj, 获取G'jδ对应的相似度列表Fδ j={Fδ j1,……, Fδ ja,……Fδ jb}, Fδ ja 是指G'j δ和CSja之间的相似度;权 利 要 求 书 1/2 页 2 CN 115017311 A 2S3014、 遍历Fδ j且将G'jδ与Fδ j中最大相似度对应的初始向量进行聚类成第三指定pkg 簇; S3015、 重复执 行S3014步骤, 获取到Gj对应的第三指定pkg簇列表; S3016、 根据Gj对应的第三指定pkg簇列表, 获取Gj对应的第三指定pkg簇列表中每一第 三指定pkg簇的均值向量, 其中, 所述均值向量是指每一pkg簇内的中心点对应的向量; S3017、 根据G'jδ与每一第三指定pkg簇的均值向量重新聚类, 获取到第四指定pkg簇列 表; S3018、 重复执行S3016和S3017步骤, 直到最终的指定pkg簇列表的均值向量不变且将 最终的指定pkg簇列表作为H'j。 6.根据权利要求5所述的pkg簇的获取方法, 其特征在于, 在S303步骤中还包括如下步 骤: S3031、 获取H'对应的均值向量列表H0={H0 1,……, H0 σ,……, H0 μ}, H0 σ是指H'对应的第σ 个第一指定pkg簇的均值向量, σ =1 ……μ, μ为第一指定pkg簇的数量。 S3033、 获取H'ja对应的向量列表, 其中, H'ja对应的向量列表中包括若干个pkg对应的向 量。 S3035、 根据H0, H'ja对应的非第一指定pkg簇列表, 其中, 非第一指定pkg簇列表是指H0中 除H'ja对应均值向量之外的所有第一指定pkg簇的均值向量, 构建的数据列表。 S3037、 根据H'ja对应的非第一指定pkg簇列表和H'ja对应的向量列表, 获取到 H。 7.根据权利要 求5所述的pkg簇的获取方法, 其特征在于, 所述初 始向量是Gj中随机选 取 bj个向量。 8.根据权利要求5所述的pkg簇的获取方法, 其特征在于, S3037步骤可以参照S3013 ‑ S3018步骤。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 8中任意一项所述的pkg簇的获取 方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求1至8中任意一项所述的pkg簇的获取 方法。权 利 要 求 书 2/2 页 3 CN 115017311 A 3

.PDF文档 专利 一种pkg簇的获取方法、计算机设备及存储介质

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种pkg簇的获取方法、计算机设备及存储介质 第 1 页 专利 一种pkg簇的获取方法、计算机设备及存储介质 第 2 页 专利 一种pkg簇的获取方法、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:58:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。