全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211274278.9 (22)申请日 2022.10.18 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 卢健  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 黄海英 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/951(2019.01) G06F 16/13(2019.01) G06Q 30/06(2012.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 推荐对象 的确定方法、 装置及计算机可读存 储介质 (57)摘要 本申请公开了一种推荐对象 的确定方法、 装 置及计算机可读存储介质, 涉及人工智 能领域。 其中, 该方法包括: 获取目标用户的用户特征数 据, 其中, 目标用户的用户特征数据至少表征目 标用户的身份特征; 基于第一模 型对目标用户的 用户特征数据进行向量转换, 得到用户特征向 量; 将用户特征向量输入至向量检索引擎中, 得 到对象清单; 将对象清单上的对象确定为推荐对 象, 并将推荐对象的对象信息发送至目标用户所 对应的终端设备中。 本申请解决了现有技术中为 用户确定推荐对象时存在的确定效率低的技术 问题。 权利要求书3页 说明书14页 附图4页 CN 115470413 A 2022.12.13 CN 115470413 A 1.一种推荐对象的确定方法, 其特 征在于, 包括: 获取目标用户的用户特征数据, 其中, 所述目标用户的用户特征数据至少表征所述目 标用户的身份特 征; 基于第一模型对所述目标用户的用户特 征数据进行向量 转换, 得到用户特 征向量; 将所述用户特征向量输入至向量检索引擎中, 得到对象清单, 其中, 所述对象清单上记 录有至少一个对 象的对象信息, 所述向量检索引擎中部署有索引文件, 所述索引文件至少 包括目标用户特征向量, 所述 目标用户特征向量与所述对 象信息相对应, 并且所述 目标用 户特征向量与所述用户特 征向量的相似度大于预设阈值; 将所述对象清单上的对象确定为推荐对象, 并将所述推荐对象的对象信 息发送至所述 目标用户所对应的终端设备中。 2.根据权利要求1所述的方法, 其特 征在于, 所述第一模型通过以下 过程训练得到: 获取历史时间段内的历史用户特征数据、 对象数据以及交易标签数据, 其中, 所述对象 数据为在所述历史时间段内能够被交易的对象的对象信息, 所述交易标签数据用于表征在 所述历史时间段内所述对象数据中每个对象所对应的购买记录, 所述历史用户特征数据为 在所述历史时间段内浏览过 所述对象数据中的对象的用户的用户特 征信息; 根据所述历史用户特征数据、 所述对象数据以及所述交易标签数据构建至少一个训练 数据, 其中, 每个训练数据由正样 本和负样本组成, 所述正样本包含 所述用户在所述历史时 间段内所购买过的对象, 所述负 样本包含所述用户在所述历史时间段内未购买过的对象; 根据所述至少一个训练数据分别对预设的第一神经网络及预设的第二神经网络进行 训练, 得到所述第一模型以及第二模型, 其中, 所述第二模型用于将所述对象数据转换为生 成所述索引文件所需的对象特 征向量。 3.根据权利要求2所述的方法, 其特征在于, 在根据 所述至少一个训练数据分别对预设 的第一神经网络及预设的第二神经网络进行训练, 得到所述第一模型以及第二模型之前, 所述方法还 包括: 获取所述历史用户特征数据中的数值型用户数据以及字符型用户数据, 其中, 所述数 值型用户数据为所述历史用户特征数据中表现形式为数值形式的数据, 所述字符型用户数 据为所述历史用户特 征数据中表现形式为非数值形式的数据; 对所述数值型用户数据以及所述字符型用户数据进行预处理, 得到第 一数值型数据以 及第一字符型数据, 其中, 所述第一数值型数据中至少包含所述历史用户特征数据中数值 型特征的数量, 所述第一字符型数据中至少包含所述历史用户特征数据中字符型特征的数 量, 所述第一数值型 数据和所述第一字符型 数据的表现形式为 三维向量。 4.根据权利要求3所述的方法, 其特征在于, 在根据 所述至少一个训练数据分别对预设 的第一神经网络及预设的第二神经网络进行训练, 得到所述第一模型以及第二模型之前, 所述方法还 包括: 获取所述对象数据中的数值型对象数据以及字符型对象数据, 其中, 所述数值型对象 数据为所述对象数据中表现形式为数值形式的数据, 所述字符型对象数据为所述对象数据 中表现形式为非数值形式的数据; 对所述数值型对象数据以及所述字符型对象数据进行预处理, 得到第 二数值型数据以 及第二字符型数据, 其中, 所述第二数值型数据中至少包含样本总 数量以及所述对 象数据权 利 要 求 书 1/3 页 2 CN 115470413 A 2中数值型特征的数量, 所述第二字符型数据中至少包含所述样本总数量以及所述对象数据 中字符型特征的数量, 所述样本总数量为所述至少一个训练数据中正样本数量与负样本数 量之和, 所述第二数值型 数据和所述第二字符型 数据的表现形式为 三维向量。 5.根据权利要求4所述的方法, 其特征在于, 根据 所述至少一个训练数据分别对预设的 第一神经网络及预设的第二神经网络进行训练, 得到所述第一模型以及第二模型, 包括: 根据所述第一数值型数据和所述第一字符型数据确定第一目标张量, 其中, 所述第一 目标张量表征 所述历史用户特 征数据中每 个历史用户的用户特 征; 根据所述第二数值型数据和所述第二字符型数据确定第二目标张量, 其中, 所述第一 目标张量表征 所述对象数据中每 个对象的对象特 征; 确定所述第一目标张量与所述第二目标张量之间的相似度; 根据所述相似度、 所述第一目标张量以及所述第二目标张量确定目标损失函数; 根据所述第 一目标张量、 所述第 二目标张量以及所述目标损失函数分别对所述第 一神 经网络以及所述第二神经网络进行迭代, 得到所述第一模型以及所述第二模型。 6.根据权利要求5所述的方法, 其特征在于, 根据 所述第一数值型数据和所述第 一字符 型数据确定第一目标张量, 包括: 根据所述历史用户特征数据中数值型特征的数量对所述第一数值型数据进行向量维 度的扩充, 得到第一张量, 其中, 所述第一张量包 含四个维度的向量; 根据所述历史用户特征数据中字符型特征的种类数量对所述第一字符型数据进行向 量维度的扩充, 得到第二张量, 其中, 所述第二张量包 含四个维度的向量; 根据所述历史用户特征数据中字符型特征的数量以及所述历史用户特征数据中数值 型特征的数量, 对所述第一张量与所述第二张量进行叠加, 得到第三张量; 对所述第三张量进行线性变换, 并基于所述第 一神经网络上预设的函数对变换后的第 三张量进行加权计算, 得到所述第一目标张量。 7.根据权利要求5所述的方法, 其特征在于, 根据 所述第二数值型数据和所述第 二字符 型数据确定第二目标张量, 包括: 根据所述对象数据中数值型特征的数量对所述第 二数值型数据进行向量维度的扩充, 得到第四张量, 其中, 所述第四张量包 含四个维度的向量; 根据所述对象数据中字符型特征的种类数量对所述第二字符型数据进行向量维度的 扩充, 得到第五张量, 其中, 所述第五张量包 含四个维度的向量; 根据所述对象数据中字符型特征的数量以及所述对象数据中数值型特征的数量, 对所 述第四张量与所述第五张量进行叠加, 得到第六张量; 对所述第六张量进行线性变换, 并基于所述第 二神经网络上预设的函数对变换后的第 六张量进行加权计算, 得到所述第二目标张量。 8.根据权利要求2所述的方法, 其特征在于, 在根据 所述至少一个训练数据训练得到所 述第一模型以及第二模型之后, 所述方法还 包括: 将所述对象数据输入至所述第二模型中, 得到所述对象特 征向量; 将所述对象特征向量输入至所述向量检索引擎中, 得到所述索引文件, 并将所述索引 文件存储在所述向量检索引擎中。 9.一种推荐对象的确定装置, 其特 征在于, 包括:权 利 要 求 书 2/3 页 3 CN 115470413 A 3

PDF文档 专利 推荐对象的确定方法、装置及计算机可读存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 推荐对象的确定方法、装置及计算机可读存储介质 第 1 页 专利 推荐对象的确定方法、装置及计算机可读存储介质 第 2 页 专利 推荐对象的确定方法、装置及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。