全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211264154.2 (22)申请日 2022.10.17 (71)申请人 启客 (北京) 科技有限公司 地址 100193 北京市海淀区西小口路6 6号 中关村东升科技园 ·北领地B-1楼1层 101A、 103A、 2层101B、 10 3B、 105B (72)发明人 卫晓祥 吴传文 唐绍祖  (74)专利代理 机构 北京中誉至诚知识产权代理 事务所(普通 合伙) 11858 专利代理师 张平力 (51)Int.Cl. G06F 16/9535(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01) (54)发明名称 智能销售信息 推荐方法及系统 (57)摘要 本公开涉及智能销售信息推荐 方法及系统, 方法包括: 获取企业客户名单及企业特征数据 集, 企业特征数据集包括N个企业的特征数据, 企 业客户名单包含N个企业中的M个企业; 将N个企 业的特征数据输入预测模型得到N个企业分值, 预测模型是基于样本 数据集对XGBoo st模型和逻 辑回归模型训练得到, 样本数据集包含训练集和 验证集, 训练集的正样本是从M个企业的特征数 据中随机抽取指定数量的特征数据, 验证集的正 样本是M个企业的特征数据中剩余数量的特征数 据, 指定数量小于剩余数量, 训练集和验证集的 负样本均是以预设百分比从N个不同企业的特征 数据中随机抽取的P个特征数据得到的随机负样 本及难分负样本; 基于N个企业分值确定目标客 户。 权利要求书3页 说明书15页 附图4页 CN 115329207 A 2022.11.11 CN 115329207 A 1.一种智能销售信息推荐方法, 其特 征在于, 包括: 获取当前企业客户名单以及企业特征数据集; 其中, 所述企业特征数据集至少包括N个 不同企业的特 征数据, 所述企业 客户名单包 含所述N个不同企业中的M个企业, M小于N; 将所述N个不同企业的特征数据输入预测模型, 以得到所述N个不同企业的第一分值; 其中, 所述预测模 型是基于第一样本数据集对 XGBoost模 型训练得到的, 所述第一样 本数据 集包括第一训练集和第一验证集, 所述第一训练集包括第一正样本和第一负样本, 所述第 一验证集包括第二正样本和第二负样本, 所述第一正样本包含从所述M个企业的特征数据 中随机抽取 的指定数量的特征数据, 所述第二正样本包含从所述M个企业的特征数据中抽 取后剩余数量的特征数据, 所述指定数量小于所述剩余数量, 所述第一负样本和第二负样 本均包含以预设百分比R从所述N个不同企业的特征数据中随机抽取的P个特征数据得到的 随机负样本以及难分负样本; 其中, R=P/N=1 ‑a, a表示所述N个不同企业中能够成为潜在意 向企业客户的比值; 基于所述 N个不同企业的第一分值, 确定潜在的目标企业 客户。 2.根据权利要求1所述的方法, 其特征在于, 所述N个不同企业的特征数据包括企业画 像特征数据和企业基本特征数据; 在使用所述第一训练集对所述XGBoost模型的训练过程 中, 使用所述第一验证集对 所述XGBoost模 型的输出结果进 行验证, 同时观测模型评价指标 是否满足预设条件, 若否, 则调节所述XGBoost模 型的超参数以及增加所述 企业画像特征数 据来重新训练。 3.根据权利要求1所述的方法, 其特 征在于, 该 方法还包括: 获取所述N个不同企业各自的企业介绍文本; 将所述N个不同企业各自的企业介绍文本输入命名实体识别模型, 以识别得到所述N个 不同企业对应的预设名词, 所述预设名词包括至少一个业务名词和/或产品名词; 其中, 所 述命名实体识别模型 是基于样本企业介绍文本对BERT模型 预先训练得到的; 计算所述N个不同企业对应的预设名词各自的第一逆向文件频率IDF并形成第一IDF字 典, 同时计算所述N个不同企业中每个企业对应的预设名词的第一词频TF并形成第一TF字 典; 基于所述第一IDF字典、 所述第一TF字典生成所述N个不同企业中每个企业对应的第一 TF‑IDF以形成第一TF ‑IDF字典; 基于所述企业客户名单, 从识别得到的所述N个不同企业的预设名词中选择确定所述M 个企业对应的所有预设名词, 计算所述M个企业对应的所有预设名词各自的第二词频TF并 形成第二TF字典; 基于所述第二TF字典、 所述第一IDF字典, 生成所述M个企业对应的所有预设名词各自 的第二TF ‑IDF以形成第二TF ‑IDF字典; 基于所述第二TF ‑IDF字典以及所述第一TF ‑IDF字典, 对所述N个不 同企业中每个企业 对应的预设名词的第一TF ‑IDF和第二TF ‑IDF进行加权求和计算, 以得到所述N个不同企业 中每个企业对应的第二分值; 基于所述N个不同企业中每个企业的第二分值, 以及所述N个不同企业的第一分值, 确 定所述N个不同企业中每 个企业的最终分值; 基于所述 N个不同企业中每 个企业的最终分值, 确定潜在的目标企业 客户。权 利 要 求 书 1/3 页 2 CN 115329207 A 24.根据权利要求3所述的方法, 其特征在于, 所述基于所述N个不同企业中每个企业的 第二分值, 以及所述N个不同企业的第一分值, 确定所述N个不同企业中每个企业的最终分 值, 包括: 基于所述N个不同企业中每个企业的第二分值以及所述N个不同企业的第 一分值, 确定 所述N个不同企业各自的分值特 征数据; 将所述N个不同企业各自的分值特征数据输入逻辑 回归模型, 得到所述N个不同企业中 每个企业的最终分值; 其中, 所述逻辑回归模型是基于第二样本数据集对原始的逻辑回归 模型训练得到的, 所述第二样本数据集包括第二训练集和第二验证集, 所述第二训练集包 括第三正样本和第三负 样本, 所述第二验证集包括第四正样本和第四负 样本; 其中, 所述第 三正样本包含从所述N个不同企业的分值特征数据中匹配的所述M个企业 的分值特征数据中随机抽取的所述指 定数量的分值特征数据; 所述第四正样本包含从所述 M个企业的分值特征数据中抽取后所述剩余数量的分值特征数据; 所述第三负样本和第四 负样本均包含以所述预设百分比R从所述N个不同企业的分值特征数据中随机抽取的P 个分 值特征数据得到的随机负 样本以及难分负 样本。 5.根据权利要求1~4任一项所述的方法, 其特征在于, 所述指定数量与所述剩余数量的 比值为3/7。 6.根据权利要求2~4任一项所述的方法, 其特征在于, 各所述企业基本特征数据包括企 业成立年限、 注册资本、 行业类别、 经 营范围、 所在地区中的一个或多个。 7.根据权利要求6所述的方法, 其特 征在于, 该 方法还包括: 对所述N个不同企业各自的企业画像特征数据和企业基本特征数据进行预处理, 以得 到所述企业特 征数据集; 其中所述预处 理至少包 含数据分箱和/或独热One ‑Hot编码。 8.一种智能销售信息推荐系统, 其特 征在于, 包括: 获取模块, 用于获取当前企业客户名单以及企业特征数据集; 其中, 所述企业特征数据 集至少包括N个不同企业的特征数据, 所述企业客户名单包含所述N个不同企业中的M个企 业, M小于N; 识别模块, 用于将所述N个不同企业的特征数据输入预测模型, 以得到所述N个不同企 业的第一分值; 其中, 所述预测模型是基于第一样本数据集对XGBoost模型训练得到的, 所 述第一样本数据集包括第一训练集和 第一验证集, 所述第一训练集包括第一正样本和 第一 负样本, 所述第一验证集包括第二正样本和 第二负样本, 所述第一正样本包含从所述M个企 业的特征数据中随机抽取 的指定数量的特征数据, 所述第二正样本包含从所述M个企业的 特征数据中抽取后剩余数量的特征数据, 所述指定数量小于所述剩余数量, 所述第一负样 本和第二负样本均包含以预设百分比R从所述N个不同企业的特征数据中随机抽取的P 个特 征数据得到的随机负样本以及难分负样本; 其中, R=P/N=1 ‑a, a表示所述N个不同企业中能 够成为潜在意向企业 客户的比值; 确定模块, 用于基于所述 N个不同企业的第一分值, 确定潜在的目标企业 客户。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1~7任一项所述智能销售信息推荐方法。 10.一种电子设备, 其特 征在于, 包括: 处理器; 以及权 利 要 求 书 2/3 页 3 CN 115329207 A 3

.PDF文档 专利 智能销售信息推荐方法及系统

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 智能销售信息推荐方法及系统 第 1 页 专利 智能销售信息推荐方法及系统 第 2 页 专利 智能销售信息推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:15:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。