全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211115069.X (22)申请日 2022.09.14 (71)申请人 江苏银承网络科技股份有限公司 地址 210000 江苏省南京市江北新区丽景 路2号研发大厦A座10层 (72)发明人 黄伟  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 张萌 (51)Int.Cl. G06Q 40/00(2012.01) G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) G06N 5/02(2006.01) (54)发明名称 小微企业画像构建方法及装置 (57)摘要 本发明提供了一种小微企业画像构建方法 及装置, 先获取参与承兑汇票流转的各个企业的 基础数据和电子承兑汇票样本数据, 再基于基础 数据和电子承兑汇票样本数据分别获取参与承 兑汇票流转的各个企业的命名实体, 并根据获取 的各个企业的命名实体确定出相应的小微企业; 之后分别对确定出的每个小微企业的命名实体 进行清洗和聚类, 得到每个小微企业的多个不同 属性分类; 最终基于得到的每个小微企业的多个 不同属性分类构建企业知识图谱。 采用本发明可 以缓解现有小微企业画像构建方案中存在的数 据源少、 有效维度少、 即时数据获取难的问题。 权利要求书2页 说明书11页 附图5页 CN 115456745 A 2022.12.09 CN 115456745 A 1.一种小微企业画像构建方法, 其特 征在于, 所述方法包括: 获取参与承兑汇票流转的各个企业的基础数据和电子承兑汇票样本数据; 其中, 所述 基础数据包括票据 交易行情数据、 票据背书关系 数据和公开市场数据; 所述电子承兑汇票 样本数据为电子承兑汇票 票据的正反面截图; 基于所述基础数据和所述电子承 兑汇票样本数据, 分别获取参与承 兑汇票流转的各个 企业的命名实体; 其中, 所述命名实体包括 一个或多个企业名称和多个企业属性; 根据获取的各个企业的命名实体, 确定出相应的小微企业; 分别对确定出的每个小微企业的命名实体进行清洗和聚类, 得到每个小微企业的多个 不同属性分类; 其中, 所述多个不同属性分类包括工商类和用票类; 基于得到的每个小微企业的多个不同属性分类, 构建企业知识图谱; 其中, 所述企业知 识图谱中的节点表征企业 实体, 所述 企业知识图谱中节点间的连线表征企业 实体间的供应 链关系。 2.根据权利要求1所述的小微企业画像构建方法, 其特征在于, 基于所述基础数据和所 述电子承兑汇票样本数据, 分别获取参与承兑汇票流转的各个企业的命名实体的步骤, 包 括: 基于所述基础数据, 分别获取各个企业的标准企业名称和标准企业属性; 其中, 所述标 准企业属性包括统一社会信用代码; 对所述电子承兑汇票样本数据进行命名实体的OCR识别, 得到各个企业的识别企业名 称和识别企业属性; 基于用户自定义上传的企业名称, 分别获取 各个企业的自定义企业名称; 对于每个企业, 均将该企业的统一社会信用代码分别与该企业的标准企业名称、 识别 企业名称和自定义企业名称绑定, 并基于该企业的标准 企业属性和识别企业属性补 全该企 业的企业属性。 3.根据权利要求2所述的小微企业画像构建方法, 其特征在于, 分别对确定出的每个小 微企业的命名实体进行清洗和聚类, 得到每 个小微企业的多个不同属性分类的步骤, 包括: 分别对确定出的每个小微企业的企业属性进行标签化处理, 得到每个小微企业的企业 属性标签; 通过预先训练好的机器学习 模型, 分别对得到的每个小微企业的企业属性标签进行清 洗和聚类, 得到每 个小微企业的多个不同属性分类标签。 4.根据权利要求3所述的小微企业画像构建方法, 其特征在于, 基于得到的每个小微企 业的多个不同属性分类, 构建企业知识图谱的步骤, 包括: 基于得到的每个小微企业的多个不同属性分类, 分别确定每个小微企业在供应链中的 贸易身份和贸易层级; 其中, 所述贸易身份包括以下中至少之一: 供应商、 生产企业和经销 商; 根据确定的每个小微企业在供应链中的贸易身份和贸易层级, 分别为每个小微企业对 应建立相应的节点, 并建立节点间的连线, 从而得到一个或多个供应链树结构; 根据每个小微企业的多个不同属性分类和确定的每个小微企业在供应链中的贸易身 份和贸易层级, 分别为每 个节点对应分配相应的节点标识, 得到所述企业知识图谱。 5.根据权利要求 4所述的小微企业画像构建方法, 其特 征在于, 所述方法还 包括:权 利 要 求 书 1/2 页 2 CN 115456745 A 2基于确定出的每个小微企业的命名实体, 分别构建每个小微企业的多个子维度表; 其 中, 所述多个子维度表包括实体基础信息表、 属性标签表、 实体与实体关系表、 实体与属性 关系表和交易数据表。 6.根据权利要求5所述的小微企业画像构建方法, 其特征在于, 基于确定出的每个小微 企业的命名实体, 分别构建每 个小微企业的多个子维度表的步骤, 包括: 对于确定出的每个小微企业, 均将该小微企业的企业名称与 该小微企业的一个或多个 企业信息映射成一个实体 基础信息表; 对于确定出的每个小微企业, 分别将该小微企业的每个企业属性标签对应映射成相应 的属性标签表; 对于确定出的每个小微企业, 分别将该小微企业在背书关系数据中的每个背书关系 对 应映射成相应的实体与实体关系表; 对于小微企业与企业属性间的每个关联关系, 均将该关联关系映射成一个实体与属性 关系表; 对于确定出的每个小微企业, 分别将该小微企业在票据交易行情数据中的每笔交易对 应映射成相应的交易数据表。 7.根据权利要求6所述的小微企业画像构建方法, 其特 征在于, 所述方法还 包括: 分别为每个实体基础信 息表、 每个属性标签表、 每个实体与实体关系表、 每个实体与属 性关系表、 每 个交易数据表对应分配相应的唯一编码。 8.根据权利要求1所述的小微企业画像构建方法, 其特 征在于, 所述方法还 包括: 将构建的所述企业知识图谱存储在预设的图结构数据库; 其中, 所述图结构数据库包 括数据查询接口。 9.根据权利要求1所述的小微企业画像构建方法, 其特征在于, 所述方法还包括: 通过 H5模块化数据可视化界面对构建的所述企业知识图谱进行 可视化。 10.一种小微企业画像构建装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取参与承 兑汇票流转的各个企业的基础数据和电子承 兑汇票样 本数据; 其中, 所述基础数据包括票据 交易行情数据、 票据背书关系数据和公开市场数据; 所述电子承兑汇票样本数据为电子承兑汇票 票据的正反面截图; 命名实体获取模块, 用于基于所述基础数据和所述电子承兑汇票样本数据, 分别获取 参与承兑汇票流转的各个企业的命名实体; 其中, 所述命名实体包括一个或多个企业名称 和多个企业属性; 小微企业确定模块, 用于根据获取的各个企业的命名实体, 确定出相应的小微企业; 数据处理模块, 用于分别对确定出的每个小微企业的命名实体进行清洗和聚类, 得到 每个小微企业的多个不同属性分类; 其中, 所述多个不同属性分类包括工商类和用票类; 企业知识图谱构建模块, 用于基于得到的每个小微企业的多个不同属性分类, 构建企 业知识图谱; 其中, 所述 企业知识图谱中的节点表征企业 实体, 所述 企业知识图谱中节点间 的连线表征企业实体间的供应链关系。权 利 要 求 书 2/2 页 3 CN 115456745 A 3

.PDF文档 专利 小微企业画像构建方法及装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 小微企业画像构建方法及装置 第 1 页 专利 小微企业画像构建方法及装置 第 2 页 专利 小微企业画像构建方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。