全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210648557.0 (22)申请日 2022.06.09 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 孙飞 丁博麟  (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 专利代理师 金鹏 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/23(2019.01) G06F 16/27(2019.01) (54)发明名称 推荐模型更新方法、 推荐模 型训练方法及计 算设备 (57)摘要 本说明书实施例提供一种推荐模型更新方 法、 推荐模型训练方法及计算设备, 其中, 推荐模 型更新方法包括: 获取数据删除请求; 获取基于 多个训练分组进行分别训练得到的多个推荐模 型; 根据数据标志, 从多个训练分组中确定包括 特定数据的第一训练分组; 从第一训练分组中删 除特定数据, 得到更新分组, 并利用更新分组对 第一推荐模 型再次进行训练; 利用再次训练后的 第一推荐模 型和第二推荐模型, 针对用户进行对 象推荐。 在获取到数据删除请求时, 只需从第一 训练分组 中删除特定数据, 然后利用更新分组对 相应的第一推荐模型再次进行训练, 根据再次训 练后的第一推荐模型和其他推荐模 型, 针对用户 进行对象推荐, 提高了 推荐模型更新的效率。 权利要求书3页 说明书18页 附图8页 CN 115098771 A 2022.09.23 CN 115098771 A 1.一种推荐模型 更新方法, 包括: 获取数据删除请求, 其中, 所述数据删除请求携带 特定数据的数据标志; 获取多个推荐模型, 其中, 所述多个推荐模型是基于多个训练分组进行分别训练得到 的, 所述多个训练分组中的每一个包括基于用户行为数据的特征信息聚类得到的用户行为 数据集合; 根据所述数据标志, 从所述多个训练分组中确定包括所述特定数据的第一训练分组, 其中, 所述第一训练分组用于训练所述多个 推荐模型中的第一推荐模型; 从所述第一训练分组中删除所述特定数据, 得到更新分组, 并利用所述更新分组对所 述第一推荐模型 再次进行训练; 利用再次训练后的所述第 一推荐模型和第二推荐模型, 针对用户进行对象推荐, 其中, 所述第二推荐模型为所述多个 推荐模型中除所述第一推荐模型以外的推荐模型。 2.根据权利要求1所述的方法, 在所述获取 数据删除请求之前, 还 包括: 获取训练数据集, 其中, 所述训练数据集包括多个用户行为数据; 根据所述多个用户行为数据的特 征信息, 聚类得到多个用户行为数据集 合; 根据所述多个用户行为数据集 合, 对所述训练数据集进行分组, 得到多个训练分组; 针对任一训练分组, 利用该训练分组训练得到对应的推荐模型。 3.根据权利要求2所述的方法, 所述获取训练数据集, 包括: 根据用户标识, 从用户行为日志中提取各用户对应的用户行为数据, 其中, 所述用户行 为日志中记录 了用户标识与用户行为数据的对应关系; 基于所述用户行为数据, 构建训练数据集。 4.根据所述权利要求2或3所述的方法, 所述根据所述多个用户行为数据的特征信息, 聚类得到多个用户行为数据集 合, 包括: 根据所述多个用户行为数据的特 征信息, 计算各用户行为数据之间的距离; 根据所述各用户行为数据之间的距离, 使用中心聚类方法, 对所述多个用户行为数据 进行聚类, 得到多个用户行为数据集 合。 5.根据权利要求 4所述的方法, 所述特 征信息包括用户向量表示和行为对象向量表示; 所述根据所述多个用户行为数据的特 征信息, 计算各用户行为数据之间的距离, 包括: 根据第一用户行为数据的用户向量表示和第 二用户行为数据的用户向量表示, 计算所 述第一用户行为数据和所述第二用户行为数据的用户向量距离, 其中, 所述第 一用户行为数据和所述第 二用户行为数据为任意两个不同的用户行为数 据; 根据所述第一用户行为数据的行为对象向量表示和所述第二用户行为数据的行为对 象向量表示, 计算所述第一用户行为数据和所述第二用户行为数据的行为对象向量距离; 根据所述用户向量距离和所述行为对象向量距离, 确定所述第 一用户行为数据和所述 第二用户行为数据之间的距离 。 6.根据权利要求4所述的方法, 所述根据所述各用户行为数据之间的距离, 使用中心聚 类方法, 对所述多个用户行为数据进行聚类, 得到多个用户行为数据集 合, 包括: 确定多个用户行为数据集 合的中心; 计算当前用户行为数据分别与各个用户行为数据集 合的中心之间的距离;权 利 要 求 书 1/3 页 2 CN 115098771 A 2根据各所述距离, 确定所述当前用户行为数据所属的用户行为数据集 合。 7.根据权利要求6所述的方法, 在所述根据 各所述距离, 确定所述当前用户行为数据 所 属的用户行为数据集 合之前, 还 包括: 获取各个用户行为数据集 合中的用户行为数据数量; 所述根据各所述距离, 确定所述当前用户行为数据所属的用户行为数据集 合, 包括: 确定距离和用户行为数据数量符合预设分类条件的用户行为数据集合, 作为所述当前 用户行为数据所属的用户行为数据集 合。 8.根据权利要求2所述的方法, 所述针对任一训练分组, 利用该训练分组训练得到对应 的推荐模型, 包括: 获取初始推荐模型; 针对任一训练分组, 利用该训练分组对所述初始推荐模型进行训练, 得到对应的推荐 模型。 9.根据权利要求1所述的方法, 所述利用再次训练后的所述第一推荐模型和第二推荐 模型, 针对用户进行对象推荐, 包括: 获取特定用户的用户信息; 将所述用户信 息分别输入再次训练后的所述第 一推荐模型和第 二推荐模型, 得到各推 荐模型输出的预测用户行为数据; 对所述各推荐模型输出的预测用户行为数据进行整合, 得到向所述特定用户推荐的特 定行为对象。 10.根据权利要求9所述的方法, 所述预测用户行为数据包括所述特定用户的用户向量 表示和各 预测行为对象的行为对象向量表示; 所述对所述各推荐模型输出的预测用户行为数据进行整合, 得到向所述特定用户推荐 的特定行为对象, 包括: 利用注意力 机制, 对所述各推荐模型输出的所述特定用户的用户向量表示和各预测行 为对象的行为对象向量表示进 行注意力计算, 得到所述特定用户与各预测行为对象之 间的 关联权重; 根据所述关联权 重, 确定向所述特定用户推荐的特定行为对象。 11.一种推荐模型训练方法, 包括: 获取训练数据集, 其中, 所述训练数据集包括多个用户行为数据; 根据所述多个用户行为数据的特 征信息, 聚类得到多个用户行为数据集 合; 根据所述多个用户行为数据集 合, 对所述训练数据集进行分组, 得到多个训练分组; 针对任一训练分组, 利用该训练分组训练得到对应的推荐模型。 12.一种计算设备, 包括: 存储器和处 理器; 所述存储器用于存储计算机可执行指令, 所述处理器用于执行所述计算机可执行指 令, 该计算机可执行指 令被处理器执行时实现权利要求 1‑10中任意一项 所述的推荐模型更 新方法或者权利要求1 1所述的推荐模型训练方法。 13.一种计算机可读存储介质, 其存储有计算机可执行指令, 该计算机可执行指令被处 理器执行时实现权利要求1 ‑10中任意一项所述的推荐模型更新方法或者权利要求11所述权 利 要 求 书 2/3 页 3 CN 115098771 A 3

PDF文档 专利 推荐模型更新方法、推荐模型训练方法及计算设备

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 推荐模型更新方法、推荐模型训练方法及计算设备 第 1 页 专利 推荐模型更新方法、推荐模型训练方法及计算设备 第 2 页 专利 推荐模型更新方法、推荐模型训练方法及计算设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。