(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221043769 9.2
(22)申请日 2022.04.25
(71)申请人 大连理工大 学
地址 116024 辽宁省大连市甘井 子区凌工
路2 号
(72)发明人 周宽久 高崧豪 李浚瑀 刘楠
(74)专利代理 机构 辽宁鸿文知识产权代理有限
公司 21102
专利代理师 许明章 王海波
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9536(2019.01)
G06F 16/2455(2019.01)
G06K 9/62(2022.01)
G06Q 30/06(2012.01)
(54)发明名称
基于用户聚类和商品聚类的混合协同过滤
推荐算法
(57)摘要
一种基于用户聚类和商品聚类的混合协同
过滤推荐算法, 针对互联网电商平台, 设计属性
偏好矩阵实现系统推荐冷启动; 再对聚类结果进
行降噪处理, 并引入融合因子α, 获取T op‑n推荐
集。 最后, 根据购买记录分析商品间的关联规则
和用户对商品属性的偏好权值, 获得关联规则推
荐集与用户个性化推荐集, 结合Top ‑n推荐集共
同得到用户推荐列表, 完成对多维度精准推荐。
本发明能够在冷启动阶段没有实际购买数据的
情况下, 对用户进行较为精准的推荐; 并且在聚
类中利用双重聚类算法与聚类降噪处理, 使推荐
算法较传统推荐算法在推荐精准度方面有较大
幅度提升, 此外本发明利用关联规则分析, 结合
ID3进行赋权实现对商品间关联规则和用户个性
的推荐, 推荐结果更加科 学、 全面。
权利要求书4页 说明书11页 附图2页
CN 114741603 A
2022.07.12
CN 114741603 A
1.一种基于用户聚类和商品聚类的混合协同过滤推荐算法, 其特征在于, 包括以下步
骤:
步骤1、 引用外 部购买记录获得用户属性对商品属性的评价矩阵;
通过对外部购买记录的利用, 获得用户属性对商品属性的评价矩阵C, 评价矩阵如公式
(1)或公式(2)所示:
Ue×C×Pe=Ee (1)
其中, e下标所示, 为外部购买记 录内容; Ue表示用户属性矩阵, 行为外部 数据源用户ID,
列为用户属性; C表示用户属性对商品属性的评价矩阵, 行为用户属性, 列为商品属性; Pe表
示商品属性矩阵, 行为商品属性, 列为外部数据源商品ID; Ee表示, 用户商品评价矩阵;
表示, Ue矩阵的逆矩阵,
表示Pe矩阵的逆矩阵; 公式(1)可等同于公式(2);
采用如下 所示的左逆矩阵(3)与右逆矩阵(4), 实现上述公式:
HL=(HT×H)‑1×HT (3)
HR=HT×(HT×H)‑1 (4)
其中, H为m行n列矩阵: 当m≥n时, H有左逆矩阵HL, 计算公式为(3); 当m≤n时, H有右逆矩
阵HR, 计算公式为(4); 因此, 当Ue行数≥列数时, 代入公式(3)求出
当Pe行数≤列数时,
代入公式(4)求出
Ue与Pe的选取显然符合上述条件; 由此, 通过 公式(2)能够获得C矩阵,
该矩阵具有普遍性, 能够与系统中用户属性矩阵和商品属性矩阵结合完成冷启动;
步骤2、 将用户属性对商品属性的评价矩阵、 系统中用户属性矩阵和商品属性矩阵结
合, 获得初始用户评价矩阵, 选取Top ‑n, 完成冷启动; 具体如下:
引入外部购买记录获得用户 属性对商品属性的评价矩阵C, 解决冷启动阶段无法推荐
的问题, 将其与系统中已有用户信息及商品信息结合, 得到用户评价矩阵, 表示 为公式(5):
Ui×C×Pi=Ei (5)
其中, Ui表示本系统用户属性矩阵, 行为用户ID, 列为用户属性; Pi表示本系统商品属性
矩阵, 行为商品属性, 列为商品ID; Ei表示本系统初始用户商品评价矩阵;
对Ei中每个用户对商品的评分进行排序, 选取评分最高的n个商品, 进行初步推荐; 由
此, 可实现冷启动阶段对用户的Top ‑n推荐, 完成冷启动; 在系统积累一定的用户、 商品以及
评价数据后, 进行后续 步骤;
步骤3、 利用系统中已有的用户属性矩阵和商品属性矩阵, 分别对用户与商品进行聚
类, 确定初始簇心, 并进行聚类迭代, 直至类簇稳定不变; 具体如下:
3.1)采用余弦相似定理计算用户之间和商品之间的相似度,
3.2)在K‑Means聚类中, 利用簇心聚集相似的用户或商品; 选取彼此最不相似的k个点
作为初始簇心;
3.3)类簇是簇心聚集的用户或商品向量的容器, 存放相似度高的用户或商品向量; 为
使聚类结果稳定, 计算类簇内所有向量均值作为新簇心, 与原簇心作比较, 该方法表示为 公
式(7):权 利 要 求 书 1/4 页
2
CN 114741603 A
2其中, Kold为原簇心, Knew为新簇心, n 为类簇B中的向量个数, b为类簇B中的向量;
首先, 利用公式(7)计算向量与各初始簇心相似度; 而后, 将向量分配到与其最相似簇
心所在的类簇中; 最后, 计算该类簇中所有向量和的均值作为新簇心Knew: 若Knew=Kold, 则表
明该类簇稳定, 否则使Knew替换Kold, 重复上述操作, 直至所有类簇稳定;
步骤4、 降噪处 理, 将靠近多个簇心的向量识别为噪点, 进行降噪;
步骤5、 获取用户预测评价与商品预测评价, 引入融合因子α, 获取最终预测评价, 并得
到Top‑n推荐集; 具体如下:
根据已完成的用户聚类以及商品聚类的聚类结果可以找到用户 和商品的邻居集N, 邻
居集N中存放与用户或商品高度相似的其他用户或商品属 性向量, 进行预测评价时会根据
邻居集中邻居用户或商品的真实评价进行 预测;
引入用户商品评价矩阵r, r中存有用户对商品的真实评价, 也存有用户对商品的未知
评价, 对未知评价进行 预测评价与真实评价结合可以获得Top ‑n推荐集;
根据聚类结果以及邻居集进行预测评价, 基于用户聚类的预测评价可表示为公式(9)、
基于商品聚类的预测评价可表示 为(10):
其中, Pi,u表示基于用户聚类, 用户i对商品u的预测评价;
表示用户i评价的均值; Ni表
示用户i的邻居集; rj,u表示用户j对商品u的评价;
表示用户j评价的均值; sim(i,j)表示
用户i与用户j属性的相似度;
其中, Qi,u表示基于商品 聚类用户i对商品u的预测评价; Nu表示商品u的邻居集; ri,v表示
用户i对商品v的评价; sim(v,u)表示商品v与商品u属性的相似度;
首先, 根据如公式(9)和公式(10)所示的基于用户聚类与基于商品聚类的预测评价; 而
后引入融合因子α, 利用两个预测评价结合融合因子α 共同生 成最终预测评价; 最后, 将最 终
预测评价代替用户评价矩阵r中的未知评价, 结合已有的真实评价, 对每个用户选取其评价
最高的n个商品(Top ‑n), 生成Top ‑n推荐集合M; 融合公式表示 为(11):
Fi,u=α×Qi,u+(1‑α )×Pi,u (11)
其中, Fi,u表示用户i对商品u的预测评价; α 为融合因子, 该方法相比于单独基于用户聚
类或者是 单独基于商品聚类预测更加准确, 其中α ∈[0,1];
步骤6、 对 交易数据进行Apriori关联规则挖掘, 根据用户的购买记录, 获得存在关联规
则的商品推荐集; 具体如下:
引入交易数据, 其中存放一定时间内单一用户购买过的所有商品ID, 并对交易数据进权 利 要 求 书 2/4 页
3
CN 114741603 A
3
专利 基于用户聚类和商品聚类的混合协同过滤推荐算法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:14:07上传分享