全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210986684.1 (22)申请日 2022.08.17 (71)申请人 广州华多网络科技有限公司 地址 511442 广东省广州市番禺区南村镇 万达广场B1栋24层 (72)发明人 葛莉  (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06Q 30/02(2012.01) G06F 16/35(2019.01) G06F 40/242(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/04(2006.01) (54)发明名称 广告文本生成方法及其装置、 设备、 介质、 产 品 (57)摘要 本申请涉及广告文本生 成方法及其装置、 设 备、 介质、 产品, 所述方法包括: 获取用于描述目 标商品的文本信息及用于控制广告文本的主题 特征的至少一个主题标签; 从主题词表中查询确 定各个所述的主题标签相对应的关键词, 构造出 关键词序列, 所述关键词用于描述商品的卖点信 息; 采用广告文本生成模型, 以所述关键词序列 与所述文本信息构成的句对为输入预测出至少 一个广告文本中的各个词元; 确定每个预测出的 广告文本映射到所述主题标签的匹配度作为相 应的广告文本的排序分值, 筛选出部分广告文 本。 本申请能够通过主题标签控制广告文本生成 模型所生 成的广告文本的主题 风格, 使其能够适 配实际营销需求而生成有效的广告 文本。 权利要求书3页 说明书16页 附图6页 CN 115293817 A 2022.11.04 CN 115293817 A 1.一种广告 文本生成方法, 其特 征在于, 包括: 获取用于描述目标商品的文本信息及用于控制广告文本的主题特征的至少一个主题 标签; 从预设的主题词表中查询确定各个所述的主题标签相对应的关键词, 构造出涵盖各个 所述的主题标签相对应的关键词序列, 所述关键词用于描述商品的卖点信息, 该卖点信息 符合该关键词所属的主题标签的主题特 征; 采用广告文本生成模型, 以所述关键词序列与所述文本信息构成的句对为输入, 逐时 间步自回归预测出至少一个广告 文本中的各个词元; 确定每个预测出的广告文本映射到所述主题标签的匹配度作为相应的广告文本的排 序分值, 筛 选出部分广告 文本。 2.根据权利要求1所述的广告文本生成方法, 其特征在于, 采用广告文本生成模型, 以 所述关键词 序列与所述文本信息构成的句对为输入, 逐时间步自回归预测出至少一个广告 文本中的各个词元, 包括: 根据所述广告文本生成模型所引用的参考词表编码所述关键词序列与所述文本信息 构成的句对, 获得编码向量; 采用所述广告文本生成模型的编码器提取出所述编码向量的深层语义信 息, 获得相对 应的编码向量序列; 以所述编码向量序列为前缀信 息输入所述广告文本生成模型的解码器, 逐时间步自回 归解码出各个时间步的文本向量, 其中每个文本向量表示映射到所述参考词表中的各个词 元的概率分布; 在自回归解码过程中, 对应每个时间步, 根据其生成的文本向量查询所述参考词表确 定出其相对应的词 元, 将该词 元的编码特征追加至该文本 向量相对应的前缀信息中, 以生 成下一时间步的文本向量。 3.根据权利要求2所述的广告文本生成方法, 其特征在于, 在 自回归解码过程中, 对应 每个时间步, 根据其生成的文本向量查询所述参考词表确定出其相对应的词元, 将该词元 的编码特 征追加至该文本向量相对应的前缀信息中, 以生成下一时间步的文本向量, 包括: 从首个时间步获得的文本向量开始, 确定出该文本向量映射到所述参考词表中概率最 高的第一数量的多个词元, 构造以每 个词元的编码特 征为先导的各个文本特 征序列; 以每个文本特征序列后接于所述前缀信 息, 根据该前缀信 息预测出下一 时间步的文本 向量, 对应确定出该文本 向量映射到所述参考词表中概率最高的第一数量的多个词元, 将 各个词元的编码特 征追加到相应的文本特 征序列中分化出多个更新的文本特 征序列; 根据更新的每个文本特征序列的词元与文本向量的对应关系, 确定各个词元在其文本 向量中的概 率, 计算更新的每 个文本特 征序列的所有词元的概 率总和; 根据预设的第 二数量选取出多个更新的文本特征序列, 继续对应下一 时间步获取文本 向量迭代以上过程, 直至满足预设条件终止, 获得最后确定的更新的文本特征序列用于构 造相应的广告 文本。 4.根据权利要求2所述的广告文本生成方法, 其特征在于, 确定每个预测出的广告文本 映射到所述主题标签的匹配度作为相应的广告文本的排序分值, 筛选出部分广告文本, 包 括:权 利 要 求 书 1/3 页 2 CN 115293817 A 2将每个所述的广告文本对应的文本特征序列输入各个主题标签相对应的主题分类器, 确定出每 个广告文本对应各个主题标签的主题分类 器的分类标签; 参考所述句对中的各个主题标签计算其相对应的各个主题分类器的分类标签的单个 损失值, 将所有单个损失值汇总量 化为相应的广告 文本的匹配度; 以所述匹配度作为排序分值筛选出部分广告文本确定为对应所述文本信息预测出的 广告文本。 5.根据权利要求1至4中任意一项所述的广告文本生成方法, 其特征在于, 采用广告文 本生成模型, 以所述关键词序列与所述文本信息构成的句对为输入, 逐时间步自回归预测 出至少一个广告 文本中的各个词元之前, 包括: 获取数据集中的单个训练样本, 所述训练样本包括商 品的文本信 息及至少一个主题标 签, 关联所述训练样本设置有所述商品的广告参 考样本; 从预设的主题词表中查询确定各个所述的主题标签相对应的关键词, 构造出涵盖各个 所述的主题标签相对应的关键词序列, 所述关键词用于描述商品的卖点信息, 该卖点信息 符合该关键词所属的主题标签的主题特 征; 将所述关键词序列与所述文本信息构成的句对输入被训练的所述广告文本生成模型 逐时间步自回归预测出至少一个广告 文本中的各个词元; 根据所述训练样本相对应的广告参考样本计算所述预测广告文本相对应的第一损失 值; 将所述预测广告文本输入各个主题标签相对应的主题分类器, 确定出每个广告文本对 应各个主题标签的主题分类器的分类标签, 参考所述训练样本中的各个主题 标签计算所述 分类标签相对应的第二损失值; 将所述第一损失值和第 二损失值综合为总损失值, 根据总损失值修正所述广告文本生 成模型的模型参数, 迭代以上过程直至广告文本生成模型根据该总损失值确定为达到收敛 状态。 6.根据权利要求5所述的广告文本生成方法, 其特征在于, 获取数据集中的单个训练样 本之前, 包括: 获取多个商品相对应的文本信息及广告文本, 对每个广告文本进行分词, 获得每个广 告文本相对应的分词集; 基于每个广告文本的分词集, 确定其与 所述主题词表中具有最大相同关键词数量相对 应的一个或多个主题标签; 对应每个广告文本构造数据集中的数据记录, 其中, 将该广告文本相对应的文本信息 及其相对应的所有主题标签构 造为该数据 记录中的训练样本, 将所述广告文本作为该数据 记录中与该训练样本相对应的广告参 考样本。 7.根据权利要求5所述的广告文本生成方法, 其特征在于, 获取数据集中的单个训练样 本之前, 包括: 获取多个商 品相对应的广告文本, 统计选取出所述广告文本 中的携带相应的商 品的卖 点信息的关键词; 根据所述关键词从商品文本信 息集中提取出各个关键词语义相近似的关键词集合, 所 述商品文本信息集包 含多个商品相对应的文本信息;权 利 要 求 书 2/3 页 3 CN 115293817 A 3

PDF文档 专利 广告文本生成方法及其装置、设备、介质、产品

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 广告文本生成方法及其装置、设备、介质、产品 第 1 页 专利 广告文本生成方法及其装置、设备、介质、产品 第 2 页 专利 广告文本生成方法及其装置、设备、介质、产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:08:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。