全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211168182.4 (22)申请日 2022.09.23 (71)申请人 清华大学 地址 100084 北京市海淀区清华园1号 (72)发明人 高跃 张欣炜 万海  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 顾鲜红 (51)Int.Cl. G06K 9/62(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) (54)发明名称 面向连续学习场景的样本分类方法与装置 (57)摘要 本申请涉及一种面向连续学习场景的样本 分类方法与装置, 方法包括: 基于预设的初始知 识库, 在识别连续学习场景中的无标签数据为未 知类样本时, 分裂预设的初始分类模 型得到动态 分支, 并对其应用预设的无监督学习算法学习未 知类样本上的聚类, 得到动态分支的聚类能力, 并基于动态分支的聚类能力, 为未知类样本标记 伪标签, 进而更新初始知识库, 计算未知类样本 与更新后的初始知识库中样本的第一距离, 从而 预测未知类样本的类别。 由此, 解决了相关技术 中的算法易忽视已知类别的分类功能, 无法从无 标签数据流中学习, 限制了分类能力的应用等问 题, 通过融合连续学习与新类挖掘, 实现了对未 知类别的挖掘和对已知类别的分类能力的保持。 权利要求书2页 说明书9页 附图2页 CN 115526250 A 2022.12.27 CN 115526250 A 1.一种面向连续学习场景的样本分类方法, 其特 征在于, 包括以下步骤: 基于预设的初始知识库, 识别连续学习场景中的无 标签数据是否为未知类样本; 在识别到所述未知类样本时, 分裂所述预设的初始分类模型得到动态分支, 并在所述 动态分支上应用预设的无监督学习算法学习所述未知类样本上的聚类, 得到所述动态分支 的聚类能力; 以及 基于所述动态分支 的聚类能力, 为所述未知类样本标记伪标签, 并基于所述伪标签更 新所述初始知识库, 并计算所述未知类样本与更新后的所述初始知识库中样本的第一距 离, 根据所述第一距离预测所述未知类样本的类别。 2.根据权利要求1所述的方法, 其特征在于, 在基于所述预设的初始知识库, 识别所述 连续学习场景中的无 标签数据是否为所述未知类样本之前, 还 包括: 基于所述预设的有标签数据, 采用预设的自监督学习算法训练目标模型, 得到初始目 标模型; 基于预设的交叉熵损失函数, 训练所述初始目标模型 得到所述预设的初始分类模型; 基于预设的数据抽取原则, 从所述预设的有标签数据中抽取有目标标签数据, 并根据 所述目标 标签数据构造所述预设的初始知识库。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述初始知识库, 识别连续学习 场景中的无 标签数据是否为未知类样本, 包括: 计算所述无 标签数据与所述预设的初始知识库中有标签数据之间的第二距离; 若所述第二距离大于预设的距离阈值, 则判定所述无 标签数据为所述未知类样本 。 4.根据权利要求1所述的方法, 其特征在于, 所述基于所述动态分支 的聚类能力, 为所 述未知类样本标记伪标签, 包括: 基于预设的负余弦距离, 确定所述未知类样本中任一样本的多个近邻; 将所述多个近邻中距离所述任一样本的最大距离作为局部样本密度, 并剔除所述未知 类样本中所述局部样本密度最大的一部分样本; 基于所述动态分支的聚类能力, 为所述未知类样本中的剩余样本标记伪标签。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述伪标签更新所述初始知识 库, 包括: 基于预设的删除规则, 删除所述预设的初始知识库中每 个类别对应的部分样本; 基于所述伪标签在所述预设的初始知识库添加所述未知类样本中的剩余样本 。 6.一种面向连续学习场景的样本分类装置, 其特 征在于, 包括: 识别模块, 用于基于预设的初始知识库, 识别连续学习场景中的无标签数据是否为未 知类样本; 获取模块, 用于在识别到所述未知类样本时, 分裂所述预设的初始分类模型得到动态 分支, 并在所述动态分支上应用预设的无监督学习算法学习 所述未知类样本上 的聚类, 得 到所述动态分支的聚类能力; 以及 预测模块, 用于基于所述动态分支的聚类能力, 为所述未知类样本标记伪标签, 并基于 所述伪标签更新所述初始知识库, 并计算所述未知类样本与更新后的所述初始知识库中样 本的第一距离, 根据所述第一距离预测所述未知类样本的类别。 7.根据权利要求6所述的装置, 其特征在于, 在基于所述预设的初始知识库, 识别所述权 利 要 求 书 1/2 页 2 CN 115526250 A 2连续学习场景中的无 标签数据是否为所述未知类样本之前, 所述识别模块, 还用于: 基于所述预设的有标签数据, 采用预设的自监督学习算法训练目标模型, 得到初始目 标模型; 基于预设的交叉熵损失函数, 训练所述初始目标模型 得到所述预设的初始分类模型; 基于预设的数据抽取原则, 从所述预设的有标签数据中抽取有目标标签数据, 并根据 所述目标 标签数据构造所述预设的初始知识库。 8.根据权利要求7 所述的装置, 其特 征在于, 所述识别模块, 具体用于: 计算所述无 标签数据与所述预设的初始知识库中有标签数据之间的第二距离; 若所述第二距离大于预设的距离阈值, 则判定所述无 标签数据为所述未知类样本 。 9.一种电子设备, 其特征在于, 包括: 存储器、 处理器及存储在所述存储器上并可在所 述处理器上运行的计算机程序, 所述处理器执行所述程序, 以实现如权利要求 1‑5任一项所 述的面向连续学习场景的样本分类方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行, 以用于实现如权利要求1 ‑5任一项所述的面向连续学习场景的样本分类方法。权 利 要 求 书 2/2 页 3 CN 115526250 A 3

PDF文档 专利 面向连续学习场景的样本分类方法与装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向连续学习场景的样本分类方法与装置 第 1 页 专利 面向连续学习场景的样本分类方法与装置 第 2 页 专利 面向连续学习场景的样本分类方法与装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。