全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211122704.7 (22)申请日 2022.09.15 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802室 (72)发明人 毕研广 秦绍飞 于佳弘 黄凯  (74)专利代理 机构 北京信远 达知识产权代理有 限公司 1 1304 专利代理师 贾小慧 (51)Int.Cl. G06F 16/36(2019.01) G06V 10/40(2022.01) G06V 30/18(2022.01) G06V 30/19(2022.01) G06V 10/774(2022.01) (54)发明名称 一种账号知识图谱的建立方法、 装置、 设备 和介质 (57)摘要 本申请涉及数据处理技术领域, 具体涉及一 种账号知识图谱的建立方法、 装置、 设备和介质。 该方法获取目标账号对的账号数据, 并将账号数 据输入图文模 型中, 得到所述图文模 型输出的提 取特征; 其中, 图文模型包括图像子模型和文本 子模型, 图文模型采用联合训练方法训练得到 的, 提取的账号数据的特征较为准确; 若根据提 取特征确定目标账号对关联, 则建立目标账号对 在账号知识图谱中的关联关系。 如此, 利用联合 训练得到的图文模型, 能够较为准确地提取账号 数据包含的特征, 确定目标账号对之间是否具有 关联关系。 权利要求书2页 说明书13页 附图3页 CN 115438191 A 2022.12.06 CN 115438191 A 1.一种账号知识图谱的建立方法, 其特 征在于, 所述方法包括: 获取目标账号对的账号数据, 所述账号数据包括所述目标账号对的图像数据和所述目 标账号对的文本数据; 将所述账号数据输入图文模型中, 得到所述图文模型输出的提取特征, 所述图文模型 包括图像子模型和文本 子模型, 所述图文模型采用联合训练方法训练得到; 若根据所述提取特征确定所述目标账号对关联, 则建立所述目标账号对在账号知识图 谱中的关联关系。 2.根据权利要求1所述的方法, 其特征在于, 所述图文模型是采用如下方式训练得到 的: 获取训练数据, 所述训练数据包括图像训练数据、 文本训练数据、 第一标签和第二标 签, 所述图像训练数据和所述文本训练数据是从多个账号获取的, 所述第一标签用于标识 属于同一账号的所述图像训练数据和所述文本训练数据, 所述第二标签用于标识属于不同 账号的所述图像训练数据和所述文本训练数据; 将所述图像训练数据输入所述图像子模型, 得到所述图像子模型输出的第一图像特 征; 将所述文本训练数据输入所述文本子模型, 得到所述文本子模型输出的第一文本特 征; 根据所述第一图像特 征、 第一文本特 征、 第一标签和第二标签训练所述图文模型。 3.根据权利要求1所述的方法, 其特征在于, 所述目标账号对包括第一账号和第二账 号, 所述将所述账号数据输入图文模型中, 得到所述图文模型输出的提取 特征, 包括: 将所述目标账号对的图像数据输入所述图像子模型中, 得到所述图像子模型输出的第 二图像特征和第三图像特征, 所述第二图像特征是所述第一账号的图像特征, 所述第三图 像特征是所述第二账号的图像特 征; 将所述账号数据包括的文本数据输入所述文本子模型中, 得到所述文本子模型输出的 第二文本特征和第三文本特征, 所述第二文本特征是所述第一账号的文本特征, 所述第三 文本特征是所述第二账号的文本特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述若根据 所述提取特征确定所述目标账 号对关联, 则建立所述目标 账号对在账号知识图谱中的关联关系, 包括: 若所述第二图像特征和所述第 三图像特征的相似度 大于第一阈值, 且所述第 二文本特 征和所述第三文本特 征的相似度大于第二阈值, 确定所述目标 账号对关联; 建立所述目标 账号对在账号知识图谱中的关联关系。 5.根据权利要求1 ‑4任一项所述的方法, 其特 征在于, 所述方法还 包括: 根据所述账号知识图谱, 确定所述账号知识图谱包括的目标账号的账号向量, 所述目 标账号为所述账号知识图谱 包括的账号实体中的一个。 6.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 目标账号对是在预设时间段内具 有操作信息的两个账号。 7.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述目标账号对的图像数据包括 所述目标账号对的头像图像和背 景图像中的一种或者多种, 所述目标账号对的文本数据包 括所述目标 账号对的名称文本、 签名文本和昵称文本中的一种或者多种。权 利 要 求 书 1/2 页 2 CN 115438191 A 28.一种账号知识图谱的建立装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取目标账号对的账号数据, 所述账号数据包括所述目标账号对的图 像数据和所述目标 账号对的文本数据; 输入单元, 用于将所述账号数据输入图文模型中, 得到所述图文模型输出的提取特征, 所述图文模型包括图像子模型和文本 子模型, 所述图文模型采用联合训练装置训练得到; 建立单元, 用于若根据所述提取特征确定所述目标账号对关联, 则建立所述目标账号 对在账号知识图谱中的关联关系。 9.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 其上存 储有一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实 现如权利要求1 ‑7中任一所述的账号知识图谱的建立方法。 10.一种计算机可读介质, 其特征在于, 其上存储有计算机程序, 其中, 所述程序被处理 器执行时实现如权利要求1 ‑7中任一所述的账号知识图谱的建立方法。权 利 要 求 书 2/2 页 3 CN 115438191 A 3

.PDF文档 专利 一种账号知识图谱的建立方法、装置、设备和介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种账号知识图谱的建立方法、装置、设备和介质 第 1 页 专利 一种账号知识图谱的建立方法、装置、设备和介质 第 2 页 专利 一种账号知识图谱的建立方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。