全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221043769 9.2 (22)申请日 2022.04.25 (71)申请人 大连理工大 学 地址 116024 辽宁省大连市甘井 子区凌工 路2 号 (72)发明人 周宽久 高崧豪 李浚瑀 刘楠  (74)专利代理 机构 辽宁鸿文知识产权代理有限 公司 21102 专利代理师 许明章 王海波 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9536(2019.01) G06F 16/2455(2019.01) G06K 9/62(2022.01) G06Q 30/06(2012.01) (54)发明名称 基于用户聚类和商品聚类的混合协同过滤 推荐算法 (57)摘要 一种基于用户聚类和商品聚类的混合协同 过滤推荐算法, 针对互联网电商平台, 设计属性 偏好矩阵实现系统推荐冷启动; 再对聚类结果进 行降噪处理, 并引入融合因子α, 获取T op‑n推荐 集。 最后, 根据购买记录分析商品间的关联规则 和用户对商品属性的偏好权值, 获得关联规则推 荐集与用户个性化推荐集, 结合Top ‑n推荐集共 同得到用户推荐列表, 完成对多维度精准推荐。 本发明能够在冷启动阶段没有实际购买数据的 情况下, 对用户进行较为精准的推荐; 并且在聚 类中利用双重聚类算法与聚类降噪处理, 使推荐 算法较传统推荐算法在推荐精准度方面有较大 幅度提升, 此外本发明利用关联规则分析, 结合 ID3进行赋权实现对商品间关联规则和用户个性 的推荐, 推荐结果更加科 学、 全面。 权利要求书4页 说明书11页 附图2页 CN 114741603 A 2022.07.12 CN 114741603 A 1.一种基于用户聚类和商品聚类的混合协同过滤推荐算法, 其特征在于, 包括以下步 骤: 步骤1、 引用外 部购买记录获得用户属性对商品属性的评价矩阵; 通过对外部购买记录的利用, 获得用户属性对商品属性的评价矩阵C, 评价矩阵如公式 (1)或公式(2)所示: Ue×C×Pe=Ee                         (1) 其中, e下标所示, 为外部购买记 录内容; Ue表示用户属性矩阵, 行为外部 数据源用户ID, 列为用户属性; C表示用户属性对商品属性的评价矩阵, 行为用户属性, 列为商品属性; Pe表 示商品属性矩阵, 行为商品属性, 列为外部数据源商品ID; Ee表示, 用户商品评价矩阵; 表示, Ue矩阵的逆矩阵, 表示Pe矩阵的逆矩阵; 公式(1)可等同于公式(2); 采用如下 所示的左逆矩阵(3)与右逆矩阵(4), 实现上述公式: HL=(HT×H)‑1×HT                  (3) HR=HT×(HT×H)‑1                  (4) 其中, H为m行n列矩阵: 当m≥n时, H有左逆矩阵HL, 计算公式为(3); 当m≤n时, H有右逆矩 阵HR, 计算公式为(4); 因此, 当Ue行数≥列数时, 代入公式(3)求出 当Pe行数≤列数时, 代入公式(4)求出 Ue与Pe的选取显然符合上述条件; 由此, 通过 公式(2)能够获得C矩阵, 该矩阵具有普遍性, 能够与系统中用户属性矩阵和商品属性矩阵结合完成冷启动; 步骤2、 将用户属性对商品属性的评价矩阵、 系统中用户属性矩阵和商品属性矩阵结 合, 获得初始用户评价矩阵, 选取Top ‑n, 完成冷启动; 具体如下: 引入外部购买记录获得用户 属性对商品属性的评价矩阵C, 解决冷启动阶段无法推荐 的问题, 将其与系统中已有用户信息及商品信息结合, 得到用户评价矩阵, 表示 为公式(5): Ui×C×Pi=Ei                         (5) 其中, Ui表示本系统用户属性矩阵, 行为用户ID, 列为用户属性; Pi表示本系统商品属性 矩阵, 行为商品属性, 列为商品ID; Ei表示本系统初始用户商品评价矩阵; 对Ei中每个用户对商品的评分进行排序, 选取评分最高的n个商品, 进行初步推荐; 由 此, 可实现冷启动阶段对用户的Top ‑n推荐, 完成冷启动; 在系统积累一定的用户、 商品以及 评价数据后, 进行后续 步骤; 步骤3、 利用系统中已有的用户属性矩阵和商品属性矩阵, 分别对用户与商品进行聚 类, 确定初始簇心, 并进行聚类迭代, 直至类簇稳定不变; 具体如下: 3.1)采用余弦相似定理计算用户之间和商品之间的相似度, 3.2)在K‑Means聚类中, 利用簇心聚集相似的用户或商品; 选取彼此最不相似的k个点 作为初始簇心; 3.3)类簇是簇心聚集的用户或商品向量的容器, 存放相似度高的用户或商品向量; 为 使聚类结果稳定, 计算类簇内所有向量均值作为新簇心, 与原簇心作比较, 该方法表示为 公 式(7):权 利 要 求 书 1/4 页 2 CN 114741603 A 2其中, Kold为原簇心, Knew为新簇心, n 为类簇B中的向量个数, b为类簇B中的向量; 首先, 利用公式(7)计算向量与各初始簇心相似度; 而后, 将向量分配到与其最相似簇 心所在的类簇中; 最后, 计算该类簇中所有向量和的均值作为新簇心Knew: 若Knew=Kold, 则表 明该类簇稳定, 否则使Knew替换Kold, 重复上述操作, 直至所有类簇稳定; 步骤4、 降噪处 理, 将靠近多个簇心的向量识别为噪点, 进行降噪; 步骤5、 获取用户预测评价与商品预测评价, 引入融合因子α, 获取最终预测评价, 并得 到Top‑n推荐集; 具体如下: 根据已完成的用户聚类以及商品聚类的聚类结果可以找到用户 和商品的邻居集N, 邻 居集N中存放与用户或商品高度相似的其他用户或商品属 性向量, 进行预测评价时会根据 邻居集中邻居用户或商品的真实评价进行 预测; 引入用户商品评价矩阵r, r中存有用户对商品的真实评价, 也存有用户对商品的未知 评价, 对未知评价进行 预测评价与真实评价结合可以获得Top ‑n推荐集; 根据聚类结果以及邻居集进行预测评价, 基于用户聚类的预测评价可表示为公式(9)、 基于商品聚类的预测评价可表示 为(10): 其中, Pi,u表示基于用户聚类, 用户i对商品u的预测评价; 表示用户i评价的均值; Ni表 示用户i的邻居集; rj,u表示用户j对商品u的评价; 表示用户j评价的均值; sim(i,j)表示 用户i与用户j属性的相似度; 其中, Qi,u表示基于商品 聚类用户i对商品u的预测评价; Nu表示商品u的邻居集; ri,v表示 用户i对商品v的评价; sim(v,u)表示商品v与商品u属性的相似度; 首先, 根据如公式(9)和公式(10)所示的基于用户聚类与基于商品聚类的预测评价; 而 后引入融合因子α, 利用两个预测评价结合融合因子α 共同生 成最终预测评价; 最后, 将最 终 预测评价代替用户评价矩阵r中的未知评价, 结合已有的真实评价, 对每个用户选取其评价 最高的n个商品(Top ‑n), 生成Top ‑n推荐集合M; 融合公式表示 为(11): Fi,u=α×Qi,u+(1‑α )×Pi,u                    (11) 其中, Fi,u表示用户i对商品u的预测评价; α 为融合因子, 该方法相比于单独基于用户聚 类或者是 单独基于商品聚类预测更加准确, 其中α ∈[0,1]; 步骤6、 对 交易数据进行Apriori关联规则挖掘, 根据用户的购买记录, 获得存在关联规 则的商品推荐集; 具体如下: 引入交易数据, 其中存放一定时间内单一用户购买过的所有商品ID, 并对交易数据进权 利 要 求 书 2/4 页 3 CN 114741603 A 3

.PDF文档 专利 基于用户聚类和商品聚类的混合协同过滤推荐算法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于用户聚类和商品聚类的混合协同过滤推荐算法 第 1 页 专利 基于用户聚类和商品聚类的混合协同过滤推荐算法 第 2 页 专利 基于用户聚类和商品聚类的混合协同过滤推荐算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:14:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。