掌桥专利:专业的专利平台
掌桥专利
首页

商品文案生成方法、装置、设备及存储介质

文献发布时间:2023-06-19 19:32:07


商品文案生成方法、装置、设备及存储介质

技术领域

本发明涉及计算机技术领域,尤其涉及一种商品文案生成方法、装置、设备及存储介质。

背景技术

在互联网电商行业,商家和平台都在为了提高商品的点击率和转化率不断做出努力。相应的,商家为了提高商品被搜索后的曝光度,会堆叠大量与商品卖点相关的长尾关键词;同时,商家在不同渠道投放广告时,还需要将商品的卖点转化为可供阅读且可吸引顾客眼球的电商文案。

随着网络电商行业的蓬勃发展,商品的种类和数量成井喷式的增长,产品同质化日趋加重,获客成本水涨船高,一个好的电商文案对最终商品的点击率和转化率起到至关重要的意义;以文案写作的一般流程来讲,商家要提炼卖点、分析场景和人群。比如包含“桑拿天”的文案就适合在夏天时出现,包含“生姜水”的文案适合推送至养发用户群体。商家的文案写作强度非常巨大,且人工写作成本高、效率低,不利于商家的发展。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种商品文案生成方法、装置、设备及存储介质,旨在解决商家的文案写作强度过大的技术问题。

为实现上述目的,本发明提供了一种商品文案生成方法,所述方法包括以下步骤:

根据获取到的商品信息确定目标商品的图像数据及文本数据;

对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;

基于所述商品特征信息,通过预设文案生成模型生成商品文案。

可选的,所述根据获取到的商品信息确定目标商品的图像数据及文本数据的步骤之前,还包括:

获取电商文案样本集;

根据所述电商文案样本集构建模型训练样本集;

根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型。

可选的,所述根据所述电商文案样本集构建模型训练样本集的步骤,包括:

遍历所述电商文案样本集,将遍历到的电商文案样本作为当前文案样本;

对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据;

对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息;

根据所述样本特征信息及所述当前文案样本构建模型训练样本;

在遍历结束时,根据获得的模型训练样本构建模型训练样本集。

可选的,所述对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息的步骤,包括:

根据所述样本文本数据确定文案知识图谱,并根据预设知识表示模型对所述文案知识图谱进行特征提取,获得知识特征信息;

通过预设自编码模型对所述样本图像数据进行特征提取,获得图像特征信息;

通过所述预设自编码模型对所述样本文本数据进行特征提取,获得文本特征信息;

根据所述图像特征信息、所述文本特征信息及所述知识特征信息构建样本特征信息。

可选的,所述获取电商文案样本集的步骤,包括:

从各个文案投放渠道采集多篇商品宣传文案;

检测所述商品宣传文案是否存在图像缺失或文字乱码;

将所述多篇商品宣传文案中存在图像缺失或存在文字乱码的商品宣传文案进行清除;

根据剩余的商品宣传文案构建电商文案样本集。

可选的,所述根据剩余的商品宣传文案构建电商文案样本集的步骤,包括:

获取各篇剩余的商品宣传文案对应的点击数;

将点击数大于预设点击阈值的商品宣传文案作为目标商品宣传文案;

根据目标商品宣传文案构建电商文案样本集。

可选的,所述根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型的步骤,包括:

遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本;

解析所述当前训练样本,获得当前样本特征信息及当前样本文案;

基于所述当前样本特征信息,通过所述初始文案生成模型生成当前预测文案;

根据所述当前样本文案及所述当前预测文案确定模型损失值;

将所述模型损失值与预设损失阈值进行比较;

若所述模型损失值大于所述预设损失阈值,则根据所述模型损失值对所述初始文案生成模型中的参数进行调整,并返回所述遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本的步骤。

可选的,所述将所述模型损失值与预设损失阈值进行比较的步骤之后,还包括:

若所述模型损失值小于或等于所述预设损失阈值,则停止遍历,并将所述初始文案生成模型作为预设文案生成模型。

可选的,所述根据所述当前样本文案及所述当前预测文案确定模型损失值的步骤,包括:

根据所述当前样本文案及所述当前预测文案通过损失值计算公式确定模型损失值;

其中,所述损失值计算公式为:

/>

式中,L为模型损失值,y为所述当前样本文案中的文字编号,

可选的,所述基于所述商品特征信息,通过预设文案生成模型生成商品文案的步骤,包括:

基于所述商品特征信息,通过预设文案生成模型生成多篇商品文案;

根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示。

可选的,所述根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示的步骤之后,还包括:

获取文案选择模式;

若所述文案选择模式为手动选择模式,则接收用户基于展示的商品文案输入的文案选择指令;

根据所述文案选择指令在所述多篇商品文案中选择目标商品文案;

将所述目标商品文案推送至文案投放区。

可选的,所述获取文案选择模式的步骤之后,还包括:

若所述文案选择模式为自动选择模式,则根据所述文案评定分值由大到小对所述多篇商品文案进行排序,获得排序结果;

将所述排序结果中序列第一的商品文案作为目标商品文案;

将所述目标商品文案推送至文案投放区。

此外,为实现上述目的,本发明还提出一种商品文案生成装置,所述商品文案生成装置包括以下模块:

数据获取模块,用于根据获取到的商品信息确定目标商品的图像数据及文本数据;

特征提取模块,用于对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;

文案生成模块,用于基于所述商品特征信息,通过预设文案生成模型生成商品文案。

可选的,所述数据获取模块,还用于获取电商文案样本集;根据所述电商文案样本集构建模型训练样本集;根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型。

可选的,所述数据获取模块,还用于遍历所述电商文案样本集,将遍历到的电商文案样本作为当前文案样本;对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据;对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息;根据所述样本特征信息及所述当前文案样本构建模型训练样本;

在遍历结束时,根据获得的模型训练样本构建模型训练样本集。

可选的,所述数据获取模块,还用于根据所述样本文本数据确定文案知识图谱,并根据预设知识表示模型对所述文案知识图谱进行特征提取,获得知识特征信息;通过预设自编码模型对所述样本图像数据进行特征提取,获得图像特征信息;通过所述预设自编码模型对所述样本文本数据进行特征提取,获得文本特征信息;根据所述图像特征信息、所述文本特征信息及所述知识特征信息构建样本特征信息。

可选的,所述数据获取模块,还用于从各个文案投放渠道采集多篇商品宣传文案;检测所述商品宣传文案是否存在图像缺失或文字乱码;将所述多篇商品宣传文案中存在图像缺失或存在文字乱码的商品宣传文案进行清除;根据剩余的商品宣传文案构建电商文案样本集。

可选的,所述数据获取模块,还用于获取各篇剩余的商品宣传文案对应的点击数;将点击数大于预设点击阈值的商品宣传文案作为目标商品宣传文案;根据目标商品宣传文案构建电商文案样本集。

此外,为实现上述目的,本发明还提出一种商品文案生成设备,所述商品文案生成设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的商品文案生成程序,所述商品文案生成程序被处理器执行时实现如上所述的商品文案生成方法的步骤。

此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有商品文案生成程序,所述商品文案生成程序执行时实现如上所述的商品文案生成方法的步骤。

本发明通过根据获取到的商品信息确定目标商品的图像数据及文本数据;对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;基于所述商品特征信息,通过预设文案生成模型生成商品文案。由于在获取到商品信息时根据商品信息确定了目标商品的图像数据及文本数据,再对图像数据及文本数据进行特征编码,从而生成了可输入预设文案生成模型的商品特征信息,基于商品特征信息及预先训练的预设文案生成模型即可自动生成商品文案,可替代人工生成商品文案,降低了商家的文案写作强度。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的电子设备的结构示意图;

图2为本发明商品文案生成方法第一实施例的流程示意图;

图3为本发明商品文案生成方法第二实施例的流程示意图;

图4为本发明一实施例的商品知识图谱示意图;

图5为本发明一实施例的预设文案生成模型的训练流程示意图;

图6为本发明商品文案生成方法第三实施例的流程示意图;

图7为本发明商品文案生成装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的商品文案生成设备结构示意图。

如图1所示,该电子设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity, WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory, NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器 1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及商品文案生成程序。

在图1所示的电子设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明电子设备中的处理器1001、存储器1005可以设置在商品文案生成设备中,所述电子设备通过处理器1001调用存储器1005中存储的商品文案生成程序,并执行本发明实施例提供的商品文案生成方法。

本发明实施例提供了一种商品文案生成方法,参照图2,图2为本发明一种商品文案生成方法第一实施例的流程示意图。

本实施例中,所述商品文案生成方法包括以下步骤:

步骤S10:根据获取到的商品信息确定目标商品的图像数据及文本数据。

需要说明的是,本实施例的执行主体可以是所述商品文案生成设备,所述商品文案生成设备可以使个人电脑、服务器等电子设备,还可以是其他可实现相同或相似功能的设备,本实施例对此不加以限制,在本实施例及下述各实施例中,以商品文案生成设备为例对本发明商品文案生成方法进行说明。

需要说明的是,目标商品可以是商家投放至商品推广渠道进行推广的商品。目标商品的商品信息可以包括图像数据及文本数据,其中,图像数据可以包括商品的产品介绍图、产品结构图、使用说明图等数据,文本数据可以包括商品的说明文本、商品特性标签等数据。获取商品信息可以是从商品推广渠道获取商家添加的商品的商品信息。

步骤S20:对所述图像数据及所述文本数据进行特征编码,获得商品特征信息。

需要说明的是,对图像数据及文本数据进行特征编码,获得商品特征信息可以是通过预设自编码模型对图像数据进行特征提取,获得图像特征信息,通过预设自编码模型对文本数据进行特征提取,获得文本特征信息,根据文本数据生成对应的知识图谱,再通过预设知识表示模型对生成的知识图谱进行特征提取,获得知识特征信息,最后将图像特征信息、文本特征信息及知识特征信息进行聚合,获得商品特征信息。其中,预设自编码模型可以是预先使用大量数据训练的自编码模型,可以用于对文本数据或图像数据进行特征提取。预设知识表示模型可以是对初始知识图谱模型使用大量数据训练得到的,可以用于对知识图谱进行特征提取,初始知识图谱模型可以是知识图谱嵌入(Knowledge GraphEmbedding,KGE)模型,如TransE(Translating Embeddings for Modeling Multi-relational Data)、TransH(Knowledge Graph Embedding by Translating onHyperplanes)等模型。

步骤S30:基于所述商品特征信息,通过预设文案生成模型生成商品文案。

需要说明的是,基于所述商品特征信息,通过预设文案生成模型生成商品文案可以是将商品特征信息输入预设文案生成模型,预设文案生成模型根据输入的商品特征信息生成商品文案。其中,预设文案生成模型可以是预先使用大量数据对初始文案生成模型进行训练得到的模型,可以根据输入的特征信息生成对应的商品文案,初始文案生成模型可以是编解码结构 (encoder-decoder)的深度神经网络模型,初始文案生成模型中的Encoder和 Decoder的特征提取器可以是递归神经网络(Recurrent Neural Network,RNN)或卷积神经网络(Convolutional Neural Networks,CNN),也可以是其他功能类似的模型。

可以理解的是,预设文案生成模型在使用过程中还可以不断根据新增的数据进行迭代和优化,从而不断提高模型的鲁棒性和准确性,使得预设文案生成模型的使用效果越来越好。

本实施例通过根据获取到的商品信息确定目标商品的图像数据及文本数据;对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;基于所述商品特征信息,通过预设文案生成模型生成商品文案。由于在获取到商品信息时根据商品信息确定了目标商品的图像数据及文本数据,再对图像数据及文本数据进行特征编码,从而生成了可输入预设文案生成模型的商品特征信息,基于商品特征信息及预先训练的预设文案生成模型即可自动生成商品文案,可替代人工生成商品文案,降低了商家的文案写作强度。

参考图3,图3为本发明一种商品文案生成方法第二实施例的流程示意图。

基于上述第一实施例,本实施例商品文案生成方法在所述步骤S10之前,还包括:

步骤S01:获取电商文案样本集。

需要说明的是,电商文案样本集可以是由多个电商文案样本组合而成的集合,电商文案样本可以是人工根据商品的特征撰写的电商文案。获取电商文案样本集可以是从各个文案投放渠道采集电商文案,并将采集到的电商文案作为电商文案样本构建电商文案样本集,其中,文案投放渠道可以是各大电商网站,也可以是其他类似的渠道。

进一步地,为了保证模型训练的效果较好,本实施例的步骤S01,可以包括:

从各个文案投放渠道采集多篇商品宣传文案;检测所述商品宣传文案是否存在图像缺失或文字乱码;将所述多篇商品宣传文案中存在图像缺失或存在文字乱码的商品宣传文案进行清除;根据剩余的商品宣传文案构建电商文案样本集。

需要说明的是,由于是从各个文案投放渠道采集商品宣传文案,各个文案投放渠道的文案格式也可能并不相同,需要进行格式转换,而转换过程中可能会出现文字乱码或数据丢失等现象,若采用此类文案作为样本,可能会导致后续训练得到的模型的效果较差,因此,可以在采集到商品宣传文案时检查是否存在图像确实或文字乱码,然后将存在图像缺失或存在文字乱码的商品宣传文案清除,然后再将剩余的商品宣传文案作为电商文案样本构建电商文案样本集,可以保证模型训练的效果较好。

进一步地,为了进一步提高训练得到的模型的效果,本实施例所述根据剩余的商品宣传文案构建电商文案样本集的步骤,可以包括:

获取各篇剩余的商品宣传文案对应的点击数;将点击数大于预设点击阈值的商品宣传文案作为目标商品宣传文案;根据目标商品宣传文案构建电商文案样本集。

可以理解的是,人工撰写的商品宣传文案的宣传效果并不一致,有部分宣传效果可能较好,有部分宣传效果可能较差,而若是采用宣传效果较差的商品宣传文案构建电商文案样本集,可能会导致后续训练得到的模型生成的文案的宣传效果也较差,为了保证模型生成的文案的宣传效果,在构建电商文案样本集时可以使用宣传效果较好的商品宣传文案进行构建,宣传效果可以使用点击数及转化率进行体现,但是转化率较难获得,因此,可以采用点击数来衡量宣传效果。

在实际使用中,可以获取各篇剩余的商品宣传文案对应的点击数,若点击数大于预设点击阈值,则可以判定该商品宣传文案的宣传效果较好,则可以将其作为目标商品宣传文案,再根据目标商品宣传文案构建电商文案样本集。其中,预设点击阈值可以由商品文案生成设备的管理人员根据实际需要预先进行设置。

步骤S02:根据所述电商文案样本集构建模型训练样本集。

可以理解的是,电商文案样本难以直接用于进行模型训练,因此,需要对电商文案样本集中的电商文案样本进行进一步处理,然后根据处理后的电商文案样本构建可用于训练的模型训练样本集。

进一步地,为了提升训练得到的文案生成模型的效果,本实施例步骤S02,可以包括:

遍历所述电商文案样本集,将遍历到的电商文案样本作为当前文案样本;对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据;对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息;根据所述样本特征信息及所述当前文案样本构建模型训练样本;在遍历结束时,根据获得的模型训练样本构建模型训练样本集。

需要说明的是,对电商文案样本集进行遍历可以是根据集合索引从小到大或从大到小对电商文案样本集进行顺序遍历,也可以是随机遍历,本实施例对此不加以限制。对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据可以是读取当前文案样本的数据,对当前文案样本中的数据进行拆分,将当前文案样本中的图像数据作为样本图像数据,并将当前文案样本中的文本数据作为样本文本数据,其中,文本数据可以包括文案标题、文案内容等数据。根据所述样本特征信息及所述当前文案样本构建模型训练样本可以是将样本特征信息及当前文案样本进行聚合,从而获得模型训练样本。

可以理解的是,在电商文案样本集中的所有电商文案样本均被遍历到过之后,可以判定遍历结束,则此时可以将遍历过程中所有构建的模型训练样本聚合为一个集合,从而获得模型训练样本集。

在实际使用中,对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息可以是根据样本文本数据确定文案知识图谱,并根据预设知识表示模型对文案知识图谱进行特征提取,获得知识特征信息;通过预设自编码模型对样本图像数据进行特征提取,获得图像特征信息;通过预设自编码模型对样本文本数据进行特征提取,获得文本特征信息;根据图像特征信息、文本特征信息及知识特征信息构建样本特征信息。

需要说明的是,根据样本文本数据确定文案知识图谱可以是提取样本文本数据中包含的文案标题,对文案标题进行关系抽取,从而获得文案知识图谱,其中,文案知识图谱可以是属性图(Property Graph)或资源描述框架图 (RDF Graph),其数据结果可以是以三元组进行表达,其三元组的表达式为: ,例如:<斜挎包,归属关系,运动>。根据图像特征信息、文本特征信息及知识特征信息构建样本特征信息可以是将图像特征信息、文本特征信息及知识特征信息进行聚合,从而获得样本特征信息。

为了便于理解,参考图4进行说明,但不对本方案进行限定。图4为商品知识图谱示意图,对于商品结构化后信息也称作商品的知识图谱,其构建后的图谱化信息如图4所示,经过结构化后的信息,其延展后的属性具备了与主体商品相联系的关系类别,这些类别信息是对商品在用户意图层的展开。例如:如果用户购买了具备<款式,运动>的商品,则有理由相信,用户的购买意向倾向于运动类型商品。图中,关联关系(relation)分为多种,is_design 表示设计风格,is_category表示分类,for_people表示适用人群,is_material 表示使用原料,belong_to表示归属于,is_style表示风格归属,is_function表示用途。

步骤S03:根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型。

需要说明的是,根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型可以是将模型训练样本集中的各个模型训练样本输入初始文案生成模型中进行训练,不断调整初始文案生成模型中的各项参数,直到模型收敛,则可以将收敛的模型作为预设文案生成模型。

在实际使用中,初始文案生成模型为编解码结构(encoder-decoder)的深度神经网络模型,若将其中编码器(Encoder)的输入数据表示为X,将解码器 (Decoder)的输出数据表示为Y,其中,X可以是文本特征信息,也可以是经过编码的知识特征信息或编码过的图像特征信息,Y为输出的文案,是通过Encoder将多模态信息进行特征融合并抽取后作为Decoder端的输入,并按照文字前后顺序依次预测下一文字,则其数学公式可以表示为:

进一步地,为了准确判断模型是否收敛,本实施例步骤S03,可以包括:

遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本;解析所述当前训练样本,获得当前样本特征信息及当前样本文案;基于所述当前样本特征信息,通过所述初始文案生成模型生成当前预测文案;根据所述当前样本文案及所述当前预测文案确定模型损失值;将所述模型损失值与预设损失阈值进行比较;若所述模型损失值大于所述预设损失阈值,则根据所述模型损失值对所述初始文案生成模型中的参数进行调整,并返回所述遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本的步骤。若所述模型损失值小于或等于所述预设损失阈值,则停止遍历,并将所述初始文案生成模型作为预设文案生成模型。

需要说明的是,遍历模型训练样本集可以是根据集合索引从小到大或从大到小对电商文案样本集进行顺序遍历,也可以是随机遍历,本实施例对此不加以限制。当前样本特征信息可以是当前训练样本中包含的样本特征信息,当前样本文案可以是当前训练样本中包含的电商文案样本。基于所述当前样本特征信息,通过所述初始文案生成模型生成当前预测文案可以是将当前样本特征信息输入初始文案生成模型中,使初始文案生成模型根据输入的当前样本特征信息生成当前预测文案。模型损失值可以是用于判定当前预测文案及当前样本文案的差异的量化数值,模型损失值越小,则表示差异越小。

可以理解的是,在模型训练过程中是需要不断调整初始文案生成模型中的参数,从而使得模型损失值不断变小。

在实际使用中,判定模型是否已经训练至收敛可以是将模型损失值与预设损失阈值进行比较,若模型损失值小于或等于预设损失阈值,则可以判定模型已经训练至收敛,则可以停止对模型训练样本集的遍历,即停止对模型的训练,并将此时调整过参数的初始文案生成模型作为预设文案生成模型。若模型损失值大于预设损失阈值,则可以判定模型并未训练至收敛,则此时可以以将模型损失值变小为目标对初始文案生成模型中的参数进行调整,并继续对模型训练样本集的遍历,即继续进行模型训练。

在具体实现中,根据所述当前样本文案及所述当前预测文案确定模型损失值可以是:

根据所述当前样本文案及所述当前预测文案通过损失值计算公式确定模型损失值;

其中,所述损失值计算公式为:

式中,L为模型损失值,y为所述当前样本文案中的文字编号,

为了便于理解,参考图5进行说明,但不对本方案进行限定,图5为预设文案生成模型的训练流程示意图。其中,预训练自编码模型即为预设自编码模型,知识表示模型即为预设知识表示模型,图像表示即为图像特征信息,文本表示即为文本特征信息,知识表示即为知识特征信息,模型评估结果即将模型损失值与预设损失阈值进行比较,若模型损失值小于或等于预设损失阈值,则可以判定达到预期结果,若模型损失值大于预设损失阈值,则可以判定为达到预期结果。

本实施例通过获取电商文案样本集;根据所述电商文案样本集构建模型训练样本集;根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型,为商品文案的自动生成提供了实现的基础,且在构建电商文案样本集时会将存在图像确实或文本乱码的电商文案清除,避免了使用异常数据进行模型训练,保证了模型训练的效果较好。

参考图6,图6为本发明一种商品文案生成方法第三实施例的流程示意图。

基于上述第一实施例,本实施例商品文案生成方法的所述步骤S30,包括:

步骤S301:基于所述商品特征信息,通过预设文案生成模型生成多篇商品文案。

可以理解的是,模型在生成商品文案时也是具备随机性,若仅生成一篇商品文案,并无法保证生成的商品文案的宣传效果一定优秀,因此,基于商品特征信息,通过预设文案生成模型生成商品文案时可以同时生成多篇商品文案,以便于从生成的多篇商品文案中选取宣传效果较好的商品文案。

步骤S302:根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示。

需要说明的是,预设文案评定规则可以是由商品文案生成设备的管理人员预先设置,文案评定分值可以是用于预估商品文案的宣传效果的量化分值,文案评定分值越高,则表示商品文案的宣传效果可能越好。根据所述文案评定分值将所述多篇商品文案进行展示可以是将文案评定分值与对应的商品文案设置为一行进行展示。

在实际使用中,根据预设文案评定规则确定各商品文案对应的文案评定分值可以是检测生成的商品文案中是否包含目标商品的主题词和/或关键词,根据主题词和/或关键词的覆盖率确定文案评定分值,还可以是根据目标商品对应的知识图谱与商品文案中的内容进行比对,从而确定商品文案的文案评定分值。

进一步地,为了便于管理人员选择合适的商品文案,本实施例所述根据所述文案评定分值将所述多篇商品文案进行展示的步骤,可以是依据文案评定分值从大到小对多篇商品文案进行排序,获得排序结果,然后根据排序结果将多篇商品文案进行展示,以便于商品文案生成设备的管理人员选择合适的商品文案。

本实施例步骤S302之后,还包括:

步骤S40:获取文案选择模式。

需要说明的是,文案选择模式分为两种,分别是手动选择模式及自动选择模式。文案选择模式可以由商品文案生成设备的管理人员预先进行设置。

步骤S50:若所述文案选择模式为手动选择模式,则接收用户基于展示的商品文案输入的文案选择指令。

可以理解的是,若文案选择模式为手动选择模式,则表明用户希望自行在生成的多篇商品文案中进行选择,则此时可以接收用户基于展示的商品文案输入的文案选择指令。

步骤S60:根据所述文案选择指令在所述多篇商品文案中选择目标商品文案。

需要说明的是,文案选择指令中可以带有文案标识,根据文案选择指令在多篇商品文案中选择目标商品文案可以是将各篇商品文案的标识与文案选择指令中的文案标识进行匹配,将匹配成功的商品文案作为目标商品文案。

步骤S70:将所述目标商品文案推送至文案投放区。

需要说明的是,文案投放区是将文案向消费者进行展示的区域,将目标商品文案推送至文案投放区,则可以将目标商品文案向消费者进行展示。

进一步地,若每次生成商品文案均需要用户进行选择,在商品数量极多的场景下,效率会十分低下,为了提高效率,本实施例步骤S40之后,还可以包括:

若所述文案选择模式为自动选择模式,则根据所述文案评定分值由大到小对所述多篇商品文案进行排序,获得排序结果;将所述排序结果中序列第一的商品文案作为目标商品文案;将所述目标商品文案推送至文案投放区。

需要说明的是,在商品数量极多的场景下,为了提高文案生成效率,商品文案生成设备的管理人员可以将文案选择模式提前设置为自动选择模式,则此时商品文案生成设备可以自动选择宣传效果较好的商品文案作为目标商品文案,并将选定的目标商品文案推送至文案投放区向消费者进行展示。而文案评定分值可以用于量化宣传效果,因此,可以选定文案评定分值最高的商品文案作为目标商品文案。

本实施例通过基于所述商品特征信息,通过预设文案生成模型生成多篇商品文案;根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示。由于并非仅生成一篇商品文案,而是生成了多篇商品文案,避免了仅生成一篇商品文案容错率较低的现象,且根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据文案评定分值将多篇商品文案进行展示,便于用户选择合适的商品文案进行推送。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有商品文案生成程序,所述商品文案生成程序被处理器执行时实现如上文所述的商品文案生成方法的步骤。

参照图7,图7为本发明商品文案生成装置第一实施例的结构框图。

如图7所示,本发明实施例提出的商品文案生成装置包括:

数据获取模块10,用于根据获取到的商品信息确定目标商品的图像数据及文本数据;

特征提取模块20,用于对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;

文案生成模块30,用于基于所述商品特征信息,通过预设文案生成模型生成商品文案。

本实施例通过根据获取到的商品信息确定目标商品的图像数据及文本数据;对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;基于所述商品特征信息,通过预设文案生成模型生成商品文案。由于在获取到商品信息时根据商品信息确定了目标商品的图像数据及文本数据,再对图像数据及文本数据进行特征编码,从而生成了可输入预设文案生成模型的商品特征信息,基于商品特征信息及预先训练的预设文案生成模型即可自动生成商品文案,可替代人工生成商品文案,降低了商家的文案写作强度。

进一步的,所述数据获取模块10,还用于获取电商文案样本集;根据所述电商文案样本集构建模型训练样本集;根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型。

进一步的,所述数据获取模块10,还用于遍历所述电商文案样本集,将遍历到的电商文案样本作为当前文案样本;对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据;对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息;根据所述样本特征信息及所述当前文案样本构建模型训练样本;在遍历结束时,根据获得的模型训练样本构建模型训练样本集。

进一步的,所述数据获取模块10,还用于根据所述样本文本数据确定文案知识图谱,并根据预设知识表示模型对所述文案知识图谱进行特征提取,获得知识特征信息;通过预设自编码模型对所述样本图像数据进行特征提取,获得图像特征信息;通过所述预设自编码模型对所述样本文本数据进行特征提取,获得文本特征信息;根据所述图像特征信息、所述文本特征信息及所述知识特征信息构建样本特征信息。

进一步的,所述数据获取模块10,还用于从各个文案投放渠道采集多篇商品宣传文案;检测所述商品宣传文案是否存在图像缺失或文字乱码;将所述多篇商品宣传文案中存在图像缺失或存在文字乱码的商品宣传文案进行清除;根据剩余的商品宣传文案构建电商文案样本集。

进一步的,所述数据获取模块10,还用于获取各篇剩余的商品宣传文案对应的点击数;将点击数大于预设点击阈值的商品宣传文案作为目标商品宣传文案;根据目标商品宣传文案构建电商文案样本集。

进一步的,所述数据获取模块10,还用于遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本;解析所述当前训练样本,获得当前样本特征信息及当前样本文案;基于所述当前样本特征信息,通过所述初始文案生成模型生成当前预测文案;根据所述当前样本文案及所述当前预测文案确定模型损失值;将所述模型损失值与预设损失阈值进行比较;若所述模型损失值大于所述预设损失阈值,则根据所述模型损失值对所述初始文案生成模型中的参数进行调整,并返回所述遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本的步骤。

进一步的,所述数据获取模块10,还用于若所述模型损失值小于或等于所述预设损失阈值,则停止遍历,并将所述初始文案生成模型作为预设文案生成模型。

进一步的,所述数据获取模块10,还用于根据所述当前样本文案及所述当前预测文案通过损失值计算公式确定模型损失值;

其中,所述损失值计算公式为:

式中,L为模型损失值,y为所述当前样本文案中的文字编号,

进一步的,所述文案生成模块30,还用于基于所述商品特征信息,通过预设文案生成模型生成多篇商品文案;根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示。

进一步的,所述文案生成模块30,还用于获取文案选择模式;若所述文案选择模式为手动选择模式,则接收用户基于展示的商品文案输入的文案选择指令;根据所述文案选择指令在所述多篇商品文案中选择目标商品文案;将所述目标商品文案推送至文案投放区。

进一步的,所述文案生成模块30,还用于若所述文案选择模式为自动选择模式,则根据所述文案评定分值由大到小对所述多篇商品文案进行排序,获得排序结果;将所述排序结果中序列第一的商品文案作为目标商品文案;将所述目标商品文案推送至文案投放区。

应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。

需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。

另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的商品文案生成方法,此处不再赘述。

此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

本发明公开了A1、一种商品文案生成方法,所述商品文案生成方法包括以下步骤:

根据获取到的商品信息确定目标商品的图像数据及文本数据;

对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;

基于所述商品特征信息,通过预设文案生成模型生成商品文案。

A2、如A1所述的商品文案生成方法,所述根据获取到的商品信息确定目标商品的图像数据及文本数据的步骤之前,还包括:

获取电商文案样本集;

根据所述电商文案样本集构建模型训练样本集;

根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型。

A3、如A2所述的商品文案生成方法,所述根据所述电商文案样本集构建模型训练样本集的步骤,包括:

遍历所述电商文案样本集,将遍历到的电商文案样本作为当前文案样本;

对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据;

对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息;

根据所述样本特征信息及所述当前文案样本构建模型训练样本;

在遍历结束时,根据获得的模型训练样本构建模型训练样本集。

A4、如A3所述的商品文案生成方法,所述对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息的步骤,包括:

根据所述样本文本数据确定文案知识图谱,并根据预设知识表示模型对所述文案知识图谱进行特征提取,获得知识特征信息;

通过预设自编码模型对所述样本图像数据进行特征提取,获得图像特征信息;

通过所述预设自编码模型对所述样本文本数据进行特征提取,获得文本特征信息;

根据所述图像特征信息、所述文本特征信息及所述知识特征信息构建样本特征信息。

A5、如A2所述的商品文案生成方法,所述获取电商文案样本集的步骤,包括:

从各个文案投放渠道采集多篇商品宣传文案;

检测所述商品宣传文案是否存在图像缺失或文字乱码;

将所述多篇商品宣传文案中存在图像缺失或存在文字乱码的商品宣传文案进行清除;

根据剩余的商品宣传文案构建电商文案样本集。

A6、如A5所述的商品文案生成方法,所述根据剩余的商品宣传文案构建电商文案样本集的步骤,包括:

获取各篇剩余的商品宣传文案对应的点击数;

将点击数大于预设点击阈值的商品宣传文案作为目标商品宣传文案;

根据目标商品宣传文案构建电商文案样本集。

A7、如A2所述的商品文案生成方法,所述根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型的步骤,包括:

遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本;

解析所述当前训练样本,获得当前样本特征信息及当前样本文案;

基于所述当前样本特征信息,通过所述初始文案生成模型生成当前预测文案;

根据所述当前样本文案及所述当前预测文案确定模型损失值;

将所述模型损失值与预设损失阈值进行比较;

若所述模型损失值大于所述预设损失阈值,则根据所述模型损失值对所述初始文案生成模型中的参数进行调整,并返回所述遍历所述模型训练样本集,并将遍历到的模型训练样本作为当前训练样本的步骤。

A8、如A7所述的商品文案生成方法,所述将所述模型损失值与预设损失阈值进行比较的步骤之后,还包括:

若所述模型损失值小于或等于所述预设损失阈值,则停止遍历,并将所述初始文案生成模型作为预设文案生成模型。

A9、如A7所述的商品文案生成方法,所述根据所述当前样本文案及所述当前预测文案确定模型损失值的步骤,包括:

根据所述当前样本文案及所述当前预测文案通过损失值计算公式确定模型损失值;

其中,所述损失值计算公式为:

式中,L为模型损失值,y为所述当前样本文案中的文字编号,

A10、如A1-A9任一项所述的商品文案生成方法,所述基于所述商品特征信息,通过预设文案生成模型生成商品文案的步骤,包括:

基于所述商品特征信息,通过预设文案生成模型生成多篇商品文案;

根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示。

A11、如A10所述的商品文案生成方法,所述根据预设文案评定规则确定各商品文案对应的文案评定分值,并根据所述文案评定分值将所述多篇商品文案进行展示的步骤之后,还包括:

获取文案选择模式;

若所述文案选择模式为手动选择模式,则接收用户基于展示的商品文案输入的文案选择指令;

根据所述文案选择指令在所述多篇商品文案中选择目标商品文案;

将所述目标商品文案推送至文案投放区。

A12、如A11所述的商品文案生成方法,所述获取文案选择模式的步骤之后,还包括:

若所述文案选择模式为自动选择模式,则根据所述文案评定分值由大到小对所述多篇商品文案进行排序,获得排序结果;

将所述排序结果中序列第一的商品文案作为目标商品文案;

将所述目标商品文案推送至文案投放区。

本发明公开了B13、一种商品文案生成装置,所述商品文案生成装置包括以下模块:

数据获取模块,用于根据获取到的商品信息确定目标商品的图像数据及文本数据;

特征提取模块,用于对所述图像数据及所述文本数据进行特征编码,获得商品特征信息;

文案生成模块,用于基于所述商品特征信息,通过预设文案生成模型生成商品文案。

B14、如B13所述的商品文案生成装置,所述数据获取模块,还用于获取电商文案样本集;根据所述电商文案样本集构建模型训练样本集;根据所述模型训练样本集对初始文案生成模型进行训练,获得预设文案生成模型。

B15、如B13所述的商品文案生成装置,所述数据获取模块,还用于遍历所述电商文案样本集,将遍历到的电商文案样本作为当前文案样本;对所述当前文案样本进行数据解析,获得样本图像数据及样本文本数据;对所述样本图像数据及所述样本文本数据进行特征编码,获得样本特征信息;根据所述样本特征信息及所述当前文案样本构建模型训练样本;在遍历结束时,根据获得的模型训练样本构建模型训练样本集。

B16、如B15所述的商品文案生成装置,所述数据获取模块,还用于根据所述样本文本数据确定文案知识图谱,并根据预设知识表示模型对所述文案知识图谱进行特征提取,获得知识特征信息;通过预设自编码模型对所述样本图像数据进行特征提取,获得图像特征信息;通过所述预设自编码模型对所述样本文本数据进行特征提取,获得文本特征信息;根据所述图像特征信息、所述文本特征信息及所述知识特征信息构建样本特征信息。

B17、如B14所述的商品文案生成装置,所述数据获取模块,还用于从各个文案投放渠道采集多篇商品宣传文案;检测所述商品宣传文案是否存在图像缺失或文字乱码;将所述多篇商品宣传文案中存在图像缺失或存在文字乱码的商品宣传文案进行清除;根据剩余的商品宣传文案构建电商文案样本集。

B18、如B17所述的商品文案生成装置,所述数据获取模块,还用于获取各篇剩余的商品宣传文案对应的点击数;将点击数大于预设点击阈值的商品宣传文案作为目标商品宣传文案;根据目标商品宣传文案构建电商文案样本集。

本发明公开了C19、一种商品文案生成设备,所述商品文案生成设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的商品文案生成程序,所述商品文案生成程序被处理器执行时实现上所述的商品文案生成方法的步骤。

本发明公开了D20、一种计算机可读存储介质,所述计算机可读存储介质上存储有商品文案生成程序,所述商品文案生成程序执行时实现如上所述的商品文案生成方法的步骤。

相关技术
  • 广告文案生成方法、装置、设备以及可读存储介质
  • 样本存储路径生成方法、装置、计算机设备及存储介质
  • 商品清单生成方法、装置、移动终端和计算机存储介质
  • 词表生成方法、文本分类方法、装置、设备及存储介质
  • 商品体积的推定方法、装置、计算机设备和存储介质
  • 一种商品推荐文案生成方法、装置、电子设备及存储介质
  • 文案生成方法、生成装置、电子设备及存储介质
技术分类

06120115939111