掌桥专利:专业的专利平台
掌桥专利
首页

文案生成方法及装置、计算机存储介质、电子设备

文献发布时间:2023-06-19 11:44:10


文案生成方法及装置、计算机存储介质、电子设备

技术领域

本公开涉及信息处理技术领域,特别涉及一种文案生成方法、文案生成装置、计算机存储介质及电子设备。

背景技术

随着移动互联网的飞速发展,用户有更多的浏览行为发生在移动端,其对相关互联网信息展示平台的依赖程度是不断上升的,但价格不再是影响用户做出消费决策的唯一因素,内容化的商品推荐成为吸引用户消费的关键。因而,如何快速得到吸引用户眼球的文案内容,成为相关人员关注的焦点问题。

目前,一般是通过人工对语句进行标注和划分,进而,对检索库中的已有语料进行组合与加工,得到最终的文案,即主要依赖于人工去完成,显而易见的,效率较低且样式固定,文案可控性较差。

鉴于此,本领域亟需开发一种新的文案生成方法及装置。

需要说明的是,上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。

发明内容

本公开的目的在于提供一种文案生成方法、文案生成装置、计算机存储介质及电子设备,进而至少在一定程度上避免了现有技术中文案可控性较差的缺陷。

本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

根据本公开的第一方面,提供一种文案生成方法,包括:将获取到的物品属性与预先设定的属性信息集合进行比对,以确定所述物品属性中的特征属性;对所述物品属性与对应的物品属性值进行拼接,得到拼接信息;获取所述拼接信息对应的编码隐状态向量,将解码隐状态向量与所述编码隐状态向量的第一相关系数确定为所述拼接信息对应的第一注意力权重;获取所述物品属性对应的第二注意力权重,以及,获取所述特征属性对应的第三注意力权重;根据所述第一注意力权重、所述第二注意力权重与所述第三注意力权重确定目标权重;根据所述目标权重对所述编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到所述物品对应的所述文案信息。

在本公开的示例性实施例中,在得到物品对应的文案信息之后,所述方法还包括:对所述文案信息进行重复性校验;若所述重复性校验通过,则判断所述文案信息是否为属性词汇;若为属性词汇,则判断所述文案信息与所述物品属性的语义是否一致;若一致,则将所述文案信息确定为目标文案。

在本公开的示例性实施例中,所述对所述物品属性与对应的物品属性值进行拼接,得到拼接信息,包括:获取所述物品属性对应的第一特征向量,以及,获取对应的物品属性值对应的第二特征向量;对所述第一特征向量与所述第二特征向量进行拼接,得到拼接向量;将所述拼接向量确定为所述拼接信息。

在本公开的示例性实施例中,所述将解码隐状态向量与所述编码隐状态向量的第一相关系数确定为所述拼接信息对应的第一注意力权重,包括:计算解码隐状态向量与所述编码隐状态向量的第一相关系数;基于归一化指数函数对所述第一相关系数进行归一化处理,得到所述第一注意力权重。

在本公开的示例性实施例中,所述获取所述物品属性对应的第二注意力权重,包括:计算所述解码隐状态向量与所述第一特征向量的第二相关系数;基于归一化指数函数对所述第二相关系数进行归一化处理,得到所述第二注意力权重。

在本公开的示例性实施例中,所述获取所述特征属性对应的第三注意力权重,包括:获取所述特征属性对应的第三特征向量;计算所述解码隐状态向量与所述第三特征向量的第三相关系数;基于归一化指数函数对所述第三相关系数进行归一化处理,得到所述第三注意力权重。

在本公开的示例性实施例中,所述根据所述第一注意力权重、所述第二注意力权重与所述第三注意力权重确定目标权重,包括:获取所述第一注意力权重、所述第二注意力权重与所述第三注意力权重的乘积值;对所述乘积值进行归一化处理,得到所述目标权重。

在本公开的示例性实施例中,所述对加权求和之后得到的上下文向量进行解码,得到所述物品对应的所述文案信息,包括:将加权求和之后得到的上下文向量输入解码网络中进行解码,得到输出序列;根据启发式搜索算法搜索得到所述输出序列中的最优序列,将所述最优序列确定为所述物品对应的所述文案信息。

在本公开的示例性实施例中,所述方法还包括:对获取到的物品信息进行分词处理,得到分词片段;对所述分词片段中的无效信息进行过滤处理,得到目标属性信息;获取所述目标属性信息与物品描述信息的交集信息;统计所述交集信息对应的词频信息;若所述词频信息大于预设阈值,则根据所述交集信息构建所述属性信息集合。

根据本公开的第二方面,提供一种文案生成装置,包括:比对模块,用于将获取到的物品属性与预先设定的属性信息集合进行比对,以确定所述物品属性中的特征属性;拼接模块,用于对所述物品属性与对应的物品属性值进行拼接,得到拼接信息;第一获取模块,用于获取所述拼接信息对应的编码隐状态向量,将解码隐状态向量与所述编码隐状态向量的第一相关系数确定为所述拼接信息对应的第一注意力权重;第二获取模块,用于获取所述物品属性对应的第二注意力权重,以及,获取所述特征属性对应的第三注意力权重;确定模块,用于根据所述第一注意力权重、所述第二注意力权重与所述第三注意力权重确定目标权重;加权模块,用于根据所述目标权重对所述编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到所述物品对应的所述文案信息。

根据本公开的第三方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的文案生成方法。

根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面所述的文案生成方法。

由上述技术方案可知,本公开示例性实施例中的文案生成方法、文案生成装置、计算机存储介质及电子设备至少具备以下优点和积极效果:

在本公开的一些实施例所提供的技术方案中,一方面,将获取到的物品属性与预先设定的属性信息集合进行比对,以确定物品属性中的特征属性,能够将特征属性预先标记出来,保证后续数据处理过程的针对性。进一步的,对物品属性与对应的物品属性值进行拼接,得到拼接信息;获取拼接信息对应的编码隐状态向量,将解码隐状态向量与编码隐状态向量的第一相关系数确定为拼接信息对应的第一注意力权重;获取物品属性对应的第二注意力权重,以及,获取特征属性对应的第三注意力权重;根据第一注意力权重、第二注意力权重与第三注意力权重确定目标权重,从而,能够从多维度调整目标权重,解决现有技术中仅根据单一权重得到文案而导致生成文案单一的技术问题,提高文案信息的多样性。另一方面,根据目标权重对编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到物品对应的文案信息,能够提高文案信息的全面性和准确性。

本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出本公开一示例性实施例中文案生成方法的流程示意图;

图2示出本公开另一示例性实施例中文案生成方法的流程示意图;

图3示出本公开再一示例性实施例中文案生成方法的流程示意图;

图4示出本公开又一示例性实施例中文案生成方法的流程示意图;

图5示出本公开一示例性实施例中文案生成方法的流程示意图;

图6示出本公开另一示例性实施例中文案生成方法的流程示意图;

图7示出本公开再一示例性实施例中文案生成方法的流程示意图;

图8示出本公开又一示例性实施例中文案生成方法的流程示意图;

图9示出本公开一示例性实施例中文案生成方法的流程示意图;

图10示出本公开示例性实施例中文案生成装置的结构示意图;

图11示出本公开示例性实施例中计算机存储介质的结构示意图;

图12示出本公开示例性实施例中电子设备的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。

此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。

目前,一般是通过人工对语句进行标注和划分,进而,对检索库中的已有预料进行组合与加工,得到最终的文案,即主要依赖于人工去完成,显而易见的,效率较低且样式固定,文案可控性较差。

在本公开的实施例中,首先提供了一种文案生成方法,至少在一定程度上克服现有技术中的方法文案可控性较差的缺陷。

图1示出本公开一示例性实施例中文案生成方法的流程示意图,该文案生成方法的执行主体可以是生成文案的服务器。

参考图1,根据本公开的一个实施例的文案生成方法包括以下步骤:

步骤S110,将获取到的物品属性与预先设定的属性信息集合进行比对,以确定物品属性中的特征属性;

步骤S120,对物品属性与对应的物品属性值进行拼接,得到拼接信息;

步骤S130,获取拼接信息对应的编码隐状态向量,将解码隐状态向量与编码隐状态向量的第一相关系数确定为拼接信息对应的第一注意力权重;

步骤S140,获取物品属性对应的第二注意力权重,以及,获取特征属性对应的第三注意力权重;

步骤S150,根据第一注意力权重、第二注意力权重与第三注意力权重确定目标权重;

步骤S160,根据目标权重对编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到物品对应的文案信息。

在图1所示实施例所提供的技术方案中,一方面,将获取到的物品属性与预先设定的属性信息集合进行比对,以确定物品属性中的特征属性,能够将特征属性预先标记出来,保证后续数据处理过程的针对性。进一步的,对物品属性与对应的物品属性值进行拼接,得到拼接信息;获取拼接信息对应的编码隐状态向量,将解码隐状态向量与编码隐状态向量的第一相关系数确定为拼接信息对应的第一注意力权重;获取物品属性对应的第二注意力权重,以及,获取特征属性对应的第三注意力权重;根据第一注意力权重、第二注意力权重与第三注意力权重确定目标权重,从而,能够从多维度调整目标权重,解决现有技术中仅根据单一权重得到文案而导致生成文案单一的技术问题,提高文案信息的多样性。另一方面,根据目标权重对编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到物品对应的文案信息,能够提高文案信息的全面性和准确性。

以下对图1中的各个步骤的具体实现过程进行详细阐述:

在本公开的示例性实施例中,文案是指结合文字、图像等元素来表现所制定的创意策略,例如:用于推广商品或某应用软件的宣传用语、介绍用语等。

在本公开的示例性实施例中,物品是需要进行推广的商品(例如:家用电器、家具、服饰、化妆品等)。

在本公开的示例性实施例中,属性(key)指物品的性质,例如:材质、颜色、品牌、适用人群、适用季节等。属性值(value)指物品的属性对应的具体参数或内容,举例而言,属性“材质”对应的属性值可以包括“羊绒、蕾丝、毛呢”;属性“颜色”对应的属性值可以包括“白色、黑色”;属性“品牌”对应的属性值可以包括“NIKE、ONLY、优衣库”;属性“适用人群”对应的属性值可以包括“学生、中老年”;属性“适用季节”对应的属性值可以包括“秋冬、夏季”。

在本公开的示例性实施例中,可以获取海量的物品信息和物品描述信息,并构建物品的属性信息集合。其中,物品信息即描述物品性能或样式的信息,可以包括类型、颜色、形状等等,示例性的,当物品为服饰(牛仔裤)时,获取到的物品信息可以是:“上市时间为夏季、腰型为中腰、宽松版型、九分裤长、哈伦裤型、颜色属性为浅蓝色、销售渠道类型为线上。其中,物品描述信息即为了达到推广物品的目的,人工编写的,结合文字、图像等元素来对物品进行描述的推广用语,示例性的,当物品为保温杯时,其对应的物品描述信息可以是“薄款牛仔裤,上身柔软细腻,九分裤长剪裁,青春减龄,版型是宽松型的,对腿部的包容性很好,中腰的款式,轻松遮住腰部赘肉,哈伦裤是公认超级显瘦的一种裤型。”其中,属性信息集合即根据高频率出现的物品属性和属性值构建的词典。

具体的,可以参考图2,图2示出本公开另一示例性实施例中文案生成方法的流程示意图,具体示出构建上述属性信息集合的流程示意图,包括步骤S201-步骤S204,以下结合图2对具体的实施方式进行解释。

在步骤S201中,对获取到的物品信息进行分词处理,得到分词片段。

在本公开的示例性实施例中,可以先获取海量的物品信息,进而,对获取到的物品信息进行分词处理,得到分词片段。示例性的,参照上述步骤的相关解释,当物品为服饰(牛仔裤)时,获取到的物品信息可以是:“上市时间:2019夏季;产品:牛仔裤;人群属性:女;腰型:中腰;版型:宽松;裤长:九分;裤型:哈伦裤;颜色:浅蓝色;销售渠道类型:线上销售;尺码:XL”及“2019夏季牛仔裤女中腰宽松九分哈伦裤浅蓝色线上销售XL”。

进而,可以对上述物品信息进行分词处理,得到分词片段:“2019、夏季、牛仔裤、女、中腰、宽松、九分、哈伦裤、浅蓝色、线上销售、XL。

在步骤S202中,对分词片段中的无效信息进行过滤处理,得到目标属性信息。

在本公开的示例性实施例中,在得到上述分词片段之后,可以对上述分词片段中的无效信息进行过滤处理,得到目标属性信息。其中,无效信息可以是不具有实际意义的信息,例如,上述分词片段中的“2019、线上销售,XL”,进而,可以对上述无效信息“2019、线上销售,XL”进行过滤处理,则过滤处理之后得到的目标属性信息可以是

在本公开的示例性实施例中,在对海量物品对应的分词片段中包含的无效信息进行过滤处理,得到海量的目标属性信息之后,可以根海量的目标属性信息建立训练数据集,并根据训练数据集训练机器学习模型,得到一文案生成模型(可以生成物品对应的文案信息的机器学习模型)。示例性的,可以参考图3,图3示出本公开再一示例性实施例中文案生成方法的流程示意图,具体示出训练得到文案生成模型的流程示意图,包括步骤S301-步骤S303,以下结合图3对具体的实施方式进行解释。

在步骤S301中,获取目标属性信息与物品描述信息的相异信息。

在本公开的示例性实施例中,在对上述无效信息进行过滤处理之后,可以获取目标属性信息与物品描述信息的相异信息。具体的,可以将上述目标属性信息与物品描述信息进行内容比对,以确定目标属性信息与物品描述信息之间的相异信息。

其中,相异信息可以是存在于目标属性信息中但不存在于物品描述信息中的信息,或,存在于物品描述信息中但不存在于目标属性信息中的信息。

在步骤S302中,若相异信息未存在于目标属性信息中,则根据相异信息对目标属性信息进行数据填充,得到训练数据集。

在本公开的示例性实施例中,若上述相异信息为存在于物品描述信息中,但不存在于目标属性信息中的信息,则可以根据上述相异信息对目标属性信息进行数据填充,即将上述相异信息补充至目标属性信息中,以得到训练数据集。示例性的,参照上述步骤的相关解释,可以将上述物品描述信息或者上述物品描述信息中的“薄款牛仔裤,上身柔软细腻,九分裤长剪裁,青春减龄,版型是宽松型的,对腿部的包容性很好,中腰的款式,轻松遮住腰部赘肉,哈伦裤是公认超级显瘦的一种裤型。”等补充至上述目标属性信息中,以得到训练数据集。从而,一方面,鉴于物品描述信息是人工编写的信息,因而,能够使得训练数据集更加贴合人类的思维方式,提高语言的趣味性和逻辑性,另一方面,解决了数据偏差的问题,能够保证训练数据集的全面性,提高后续模型的处理准确度。

在步骤S303中,基于训练数据集训练机器学习模型,得到文案生成模型。

在本公开的示例性实施例中,在得到上述训练数据集之后,可以根据上述训练数据集训练机器学习模型,具体的,可以将上述训练数据集输入机器学习模型中,多次调整参数以训练上述机器学习模型,以使得上述机器学习模型的损失函数趋于收敛,得到一文案生成模型。

在机器学习模型的训练过程中,示例性的,当模型的输出结果中存在重复信息或者冲突信息时,可以对输出结果的生成概率进行干预,例如:对当前输出结果进行惩罚,以降低重复信息和冲突信息的生成概率。从而,能够提高后续模型应用过程中文案信息的生成质量。

继续参考图2,在步骤S203中,获取目标属性信息与物品描述信息的交集信息。

在本公开的示例性实施例中,在对分词片段中的无效信息进行过滤处理,得到目标属性信息之后,还可以获取目标属性信息与物品描述信息的交集信息,其中,交集信息即同时存在于目标属性信息和物品描述信息中的信息。

在步骤S204中,统计交集信息对应的词频信息。

在本公开的示例性实施例中,在得到上述交集信息之后,可以统计上述交集信息对应的词频信息。其中,词频信息指的是词汇相对于一个文件或者一个语料库中的一个领域文件集的重复程度。

在步骤S205中,若词频信息大于预设阈值,则根据交集信息构建属性信息集合。

在本公开的示例性实施例中,在统计得到上述词频信息之后,若上述词频信息大于预设阈值(预先设定的,可以根据实际情况进行数值更改的词频数值),则可以根据上述交集信息构建一属性信息集合。示例性的,当交集信息包含交集信息A、B、C,预设阈值为10时,交集信息A对应的词频信息为12,交集信息B对应的词频信息为13,交集信息C对应的词频信息为6,则可知12大于10,13大于10,而6小于10,则可以根据交集信息A和交集信息B构建上述属性信息集合。

需要说明的是,当设置不同的预设阈值时,可以构建得到不同的属性信息集合,从而,能够保证下述步骤S110中比对确定出来的特征信息可以根据实际情况进行控制。

通过根据词频信息大于预设阈值的交集信息构建上述属性信息集合,能够将高频的交集信息统计在一起,从而,在模型的应用过程中,便于模型快速识别出高频的交集信息,提高数据处理的针对性。

具体的,在模型的具体应用阶段,可以参考图1,在步骤S110中,将获取到的物品属性与预先设定的属性信息集合进行比对,以确定物品属性中的特征属性。

在本公开的示例性实施例中,在获取到需要生成文案的物品属性之后,可以将物品属性与预先设定的属性信息集合进行比对,以确定出物品属性中的特征属性。其中,特征属性即存在于上述属性信息集合中的属性。

示例性的,当获取到的物品属性为“版型/腰型/风格”时,其中,“版型/腰型”存在于上述属性信息集合中时,则可以将上述“版型/腰型”确定为特征属性。

通过与属性信息集合比对确定特征属性,能够在后续对目标权重进行影响,解决现有技术中属性的选择完全依赖于注意力机制进行选择,导致生成文案的可控性较差的技术问题,增强模型的可控性和生成文案的多样性。

在步骤S120中,对物品属性与对应的物品属性值进行拼接,得到拼接信息。

在本公开的示例性实施例中,在获取到上述物品属性之后,可以将上述物品属性与对应的物品属性值进行拼接,得到拼接信息。参照上述步骤S110的相关解释,当物品属性为“版型/腰型/风格”时,对应的物品属性值可以是“宽松/高腰/简约清新”。

在本公开的示例性实施例中,示例性的,可以参考图4,图4示出本公开又一示例性实施例中文案生成方法的流程示意图,具体示出对物品属性与对应的物品属性值进行拼接,得到拼接信息的流程示意图,包含步骤S401-步骤S403,以下结合图4对步骤S120进行解释。

在步骤S401中,获取物品属性对应的第一特征向量,以及,获取物品属性值对应的第二特征向量。

在本公开的示例性实施例中,可以获取上述物品属性对应的第一特征向量,示例性的,可以是特征向量A

在步骤S402中,对第一特征向量与第二特征向量进行拼接,得到拼接向量。

在本公开的示例性实施例中,在获取到上述第一特征向量和上述第二特征向量之后,可以对上述第一特征向量和上述第二特征向量进行拼接,以得到拼接向量,示例性的,可以对上述第一特征向量和上述第二特征向量进行拼接,以得到拼接向量A[(1|2),(1|2),(1|2)]。

在步骤S403中,将拼接向量确定为上述拼接信息。

在本公开的示例性实施例中,在得到上述拼接向量之后,可以将上述拼接向量确定为上述拼接信息。

继续参考图1,在步骤S130中,获取拼接信息对应的编码隐状态向量,将解码隐状态向量与编码隐状态向量的第一相关系数确定为拼接信息对应的第一注意力权重。

在本公开的示例性实施例中,示例性的,在获取到上述拼接信息(拼接向量)之后,可以将上述拼接信息输入至文案生成模型的编码网络(LSTM-encoder)中,对上述拼接信息进行编码,得到各个编码时刻对应的编码隐状态向量。其中,编码隐状态向量即针对编码时刻的拼接信息的各个子片段进行的向量描述。示例性的,得到的编码隐状态向量可以包括:编码隐状态向量a、编码隐状态向量b、编码隐状态向量c。其中,上述编码网络可以是CNN(Convolutional Neural Networks,卷积神经网络,简称:CNN)、RNN(Recurrent NeuralNetwork,循环神经网络,简称:RNN)、LSTM(Long Short-Term Memory,长短时记忆网络,简称:LSTM)等,可以根据实际情况自行设定,属于本公开的保护范围。

在本公开的示例性实施例中,在得到上述编码隐状态向量之后,可以基于注意力机制(Attention Mechanism,源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息,上述机制通常被称为注意力机制)获取上述编码隐状态向量a、b、c各自对应的权重分布,示例性的,获取到编码隐状态向量a对应的权重分布为0.3,编码隐状态向量b对应的权重分布为0.3,编码隐状态向量c对应的权重分布为0.4。通过注意力机制,能够提高模型对重要的输入信息的关注度,从而,将有效的信息输入至模型。

在获取到上述权重分布之后,可以根据上述权重分布对编码隐状态向量进行加权求和,得到编码隐状态向量(a,b,c)对应的解码隐状态向量,示例性的,得到的解码隐状态向量可以包括:解码隐状态向量d、解码隐状态向量e、解码隐状态向量f。

在本公开的示例性实施例中,在得到上述编码隐状态向量和解码隐状态向量之后,示例性的,可以参考图5,图5示出本公开一示例性实施例中文案生成方法的流程示意图,具体示出将解码隐状态向量与编码隐状态向量的第一相关系数确定为拼接信息对应的第一注意力权重的流程示意图,包含步骤S501-步骤S502,以下结合图5对步骤S130进行解释。

在步骤S501中,计算解码隐状态向量与编码隐状态向量的第一相关系数。

在本公开的示例性实施例中,在得到上述解码隐状态向量(d、e、f)之后,可以计算解码隐状态向量与上述编码隐状态向量的第一相关系数。示例性的,可以先计算出解码隐状态向量d与上述编码隐状态向量(a、b、c)之间的第一相关系数g

具体的,可以先基于下述公式1计算上述相关系数g

g

其中,h

在步骤S502中,基于归一化指数函数对第一相关系数进行归一化处理,得到第一注意力权重。

在本公开的示例性实施例中,在计算出上述第一相关系数g

其中,N表示编码隐状态向量的数量,示例性的,当N取3时,可以基于公式2对上述第一相关系数g

接着参考图1,在步骤S140中,获取物品属性对应的第二注意力权重,以及,获取特征属性对应的第三注意力权重。

在本公开的示例性实施例中,可以获取上述物品属性对应的第一特征向量,以及,计算上述解码隐状态向量与第一特征向量的第二注意力权重。

示例性的,可以参考图6,图6示出本公开另一示例性实施例中文案生成方法的流程示意图,具体示出获取物品属性对应的第二注意力权重的流程示意图,包括步骤S601-步骤S602,以下结合图6对步骤S140进行解释。

在步骤S601中,计算解码隐状态向量与第一特征向量的第二相关系数。

在本公开的示例性实施例中,可以先基于上述公式1计算出上述解码隐状态向量与第一特征向量之间的第二相关系数,进而,基于上述公式2计算出第二注意力权重。示例性的,当上述第一特征向量包括:第一特征向量u,第一特征向量v和第一特征向量w时,则可以先基于上述公式1计算出第一特征向量u、v、w与解码隐状态向量d之间的第二相关系数(g

在步骤S602中,基于归一化指数函数对第二相关系数进行归一化处理,得到第二注意力权重。

在本公开的示例性实施例中,在得到上述第二相关系数之后,可以基于上述公式2对第二相关系数进行归一化处理,得到第二注意力权重。具体的,可以基于公式2对上述第二相关系数g

在本公开的示例性实施例中,可以参考图7,图7示出本公开再一示例性实施例中文案生成方法的流程示意图,具体示出获取特征属性对应的第三注意力权重的流程示意图,包括步骤S701-步骤S703,以下结合图7对步骤S140进行解释。

在步骤S701中,获取上述特征属性对应的第三特征向量。

在本公开的示例性实施例中,可以获取特征属性对应的第三特征向量,示例性的,可以通过神经网络或向量化算法等获取上述特征属性对应的第三特征向量。

在步骤S702中,计算解码隐状态向量与第三特征向量的第三相关系数。

在本公开的示例性实施例中,可以参照上述步骤S601的相关解释,计算出上述解码隐状态向量与第三特征向量的第三相关系数。

在步骤S703中,基于归一化指数函数对第三相关系数进行归一化处理,得到第三注意力权重。

在本公开的示例性实施例中,在计算出上述第三相关系数之后,可以参照上述步骤S602的相关解释,基于归一化指数对第三相关系数进行归一化处理,得到上述第三注意力权重。示例性的,得到的第三注意力权重可以是α

继续参考图1,在步骤S150中,根据第一注意力权重、第二注意力权重与第三注意力权重确定目标权重。

在本公开的示例性实施例中,在得到上述第一注意力权重、第二注意力权重与上述第三注意力权重之后,可以计算出上述第一注意力权重、第二注意力权重与第三注意力权重的乘积值,示例性的,参照上述步骤的相关解释,可以将α

从而,提供了一种新的确定目标权重的方法,能够解决现有技术中仅根据物品自身的属性和属性值获取单一权重值,导致生成文案的可控性和多样性较差的技术问题,提高文案的可控性。

在步骤S160中,根据目标权重对编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到物品对应的文案信息。

在本公开的示例性实施例中,在得到上述目标权重之后,可以根据目标权重对上述编码隐状态向量进行加权求和,得到多个上下文向量,并对得到的多个上下文向量进行解码,得到物品对应的文案信息。

具体的,可以参考图8,图8示出本公开又一示例性实施例中文案生成方法的流程示意图,具体示出对加权求和之后得到的上下文向量进行解码,得到物品对应的文案信息的流程示意图,包括步骤S801-步骤S802,以下结合图8对步骤S160进行解释。

在步骤S801中,将加权求和之后得到的上下文向量输入解码网络中进行解码,得到输出序列。

在本公开的示例性实施例中,在得到上下文向量之后,可以将得到的上下文向量输入解码网络(LSTM-encoder)中进行解码,得到输出序列,具体的,一个上下文向量可以产出一个输出文字,进而,对解码各个时刻输入的不同上下文向量完成解码之后,可以得到各时刻输出文字即对应的输出序列。

在步骤S802中,根据启发式搜索算法搜索得到输出序列中的最优序列,将最优序列确定为物品对应的文案信息。

在本公开的示例性实施例中,在上述输出序列的生成过程中,可以根据启发式搜索算法搜索得到输出序列中的最优序列,并将最优序列确定为物品对应的文案信息。

其中,上述启发式搜索算法可以是Beam Search算法(集束搜索算法),该算法使用广度优先搜索来构建搜索树,可降低内存需求。具体的,当词表大小为3,包含[X,Y,Z]时,预先设置的集束宽度(Beam Width)为2时,则生成第1个词的时候,对得到X的概率P(X)、得到Y的概率P(Y)、得到Z的概率P(Z)进行排序,选取概率最大的两个,假设为X,Z,生成第2个词的时候,将当前序列X,Z分别和词表中的所有词进行组合,得到新的6个序列为XX、XY、XZ,ZX、ZY、ZZ,然后同样取概率最大的两个作为当前序列,假设为XX、ZZ,重复以上的过程,直到遇到结束符为止,最终输出1个得分最高的序列作为最优序列。进而,可以将上述最优序列确定为上述物品对应的文案信息。

在本公开的示例性实施例中,在得到上述文案信息之后,可以对上述文案信息进行优化处理,具体的,可以参考图9,图9示出本公开一示例性实施例中对文案信息进行优化处理的流程示意图,包括步骤S901-步骤S903,以下结合图9对具体的实施方式进行解释。

在步骤S901中,对文案信息进行重复性校验。

在本公开的示例性实施例中,在得到上述文案信息之后,可以先对上述文案信息进行重复性校验。重复性检验即检测文案信息中是否包含重复语句或者重复片段,示例性的,当检测出文案信息中包含重复语句时,还可以对上述重复语句进行删除。

在步骤S902中,若重复性校验通过,则判断文案信息是否为属性词汇。

在本公开的示例性实施例中,若重复性校验通过,即检测出上述文案信息中不包含上述重复语句或重复片段,则可以接着判断上述文案信息是否为属性词汇。其中,属性词汇即表示物品属性或属性值的词汇。

在步骤S903中,若为属性词汇,则判断文案信息与物品属性的语义是否一致。

在本公开的示例性实施例中,若判断出上述文案信息为属性词汇,则可以判断上述文案信息与上述物品属性的词义是否一致,即文案信息是否与上述物品属性存在冲突,示例性的,当文案信息为“简约清新风格”,而得到的物品属性为“实用风格”时,则可以判断文案信息与物品属性的词义不一致。当文案信息为“简约清新风格”,而得到的物品属性为“简约清新风格”时,则可以判断文案信息与物品属性的词义一致。

在步骤S904中,若一致,则将文案信息确定为目标文案。

在本公开的示例性实施例中,当判断出上述文案信息与上述物品属性一致时,则可以将上述文案信息确定为最终的目标文案。从而,示例性的,可以将上述目标文案作为对物品进行推广时的推广用语。

通过对得到的文案信息进行优化处理,能够从重复、冲突等多个维度进行干预,提升最终得到的目标文案的丰富性与准确性。

本公开还提供了一种文案生成装置,图10示出本公开示例性实施例中文案生成装置的结构示意图;如图10所示,文案生成装置1000可以包括比对模块1001、拼接模块1002、第一获取模块1003、第二获取模块1004、确定模块1005和加权模块1006。其中:

比对模块1001,用于将获取到的物品属性与预先设定的属性信息集合进行比对,以确定物品属性中的特征属性。

在本公开的示例性实施例中,比对模块可以用于对获取到的物品信息进行分词处理,得到分词片段;对分词片段中的无效信息进行过滤处理,得到目标属性信息;获取目标属性信息与物品描述信息的交集信息;统计交集信息对应的词频信息;若词频信息大于预设阈值,则根据交集信息构建属性信息集合。

拼接模块1002,用于对物品属性与对应的物品属性值进行拼接,得到拼接信息。

在本公开的示例性实施例中,拼接模块用于获取物品属性对应的第一特征向量,以及,获取对应的物品属性值对应的第二特征向量;对第一特征向量与第二特征向量进行拼接,得到拼接向量;将拼接向量确定为拼接信息。

第一获取模块1003,用于获取拼接信息对应的编码隐状态向量,将解码隐状态向量与编码隐状态向量的第一相关系数确定为拼接信息对应的第一注意力权重。

在本公开的示例性实施例中,第一获取模块可以用于计算解码隐状态向量与编码隐状态向量的第一相关系数;基于归一化指数函数对第一相关系数进行归一化处理,得到第一注意力权重。

第二获取模块1004,用于获取物品属性对应的第二注意力权重,以及,获取特征属性对应的第三注意力权重。

在本公开的示例性实施例中,第二获取模块用于计算解码隐状态向量与第一特征向量的第二相关系数;基于归一化指数函数对第二相关系数进行归一化处理,得到第二注意力权重。

在本公开的示例性实施例中,第二获取模块获取特征属性对应的第三特征向量;计算解码隐状态向量与第三特征向量的第三相关系数;基于归一化指数函数对第三相关系数进行归一化处理,得到第三注意力权重。

确定模块1005,用于根据第一注意力权重、第二注意力权重与第三注意力权重确定目标权重。

在本公开的示例性实施例中,确定模块用于获取第一注意力权重、第二注意力权重与第三注意力权重的乘积值;对乘积值进行归一化处理,得到目标权重。

加权模块1006,用于根据目标权重对编码隐状态向量进行加权求和,对加权求和之后得到的上下文向量进行解码,得到物品对应的文案信息。

在本公开的示例性实施例中,加权模块用于将加权求和之后得到的上下文向量输入解码网络中进行解码,得到输出序列;根据启发式搜索算法搜索得到输出序列中的最优序列,将最优序列确定为物品对应的文案信息。

在本公开的示例性实施例中,加权模块用于对文案信息进行重复性校验;若重复性校验通过,则判断文案信息是否为属性词汇;若为属性词汇,则判断文案信息与物品属性的语义是否一致;若一致,则将文案信息确定为目标文案。

上述文案生成装置中各模块的具体细节已经在对应的文案生成方法中进行了详细的描述,因此此处不再赘述。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。

在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。

参考图11所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品1100,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。

下面参照图12来描述根据本公开的这种实施方式的电子设备1200。图12显示的电子设备1200仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图12所示,电子设备1200以通用计算设备的形式表现。电子设备1200的组件可以包括但不限于:上述至少一个处理单元1210、上述至少一个存储单元1220、连接不同系统组件(包括存储单元1220和处理单元1210)的总线1230以及显示单元1240。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1210执行,使得所述处理单元1210执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元1210可以执行如图1中所示的:步骤S110,将获取到的物品属性与预先设定的属性信息集合进行比对,以确定所述物品属性中的特征属性;步骤S120,对所述物品属性与对应的物品属性值进行拼接,得到拼接信息;步骤S130,获取所述拼接信息对应的编码隐状态向量,将解码隐状态向量与所述编码隐状态向量的第一相关系数确定为所述拼接信息对应的第一注意力权重;步骤S140,获取所述物品属性对应的第二注意力权重,以及,获取所述特征属性对应的第三注意力权重;步骤S150,根据所述第一注意力权重、所述第二注意力权重与所述第三注意力权重确定目标权重;步骤S160,基于所述目标权重对所述编码隐状态向量进行加权求和,得到物品对应的文案信息。

存储单元1220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)12201和/或高速缓存存储单元12202,还可以进一步包括只读存储单元(ROM)12203。

存储单元1220还可以包括具有一组(至少一个)程序模块12205的程序/实用工具12204,这样的程序模块12205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线1230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备1200也可以与一个或多个外部设备1300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1200交互的设备通信,和/或与使得该电子设备1200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1250进行。并且,电子设备1200还可以通过网络适配器1260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1260通过总线1230与电子设备1200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

相关技术
  • 文案生成方法及装置、计算机存储介质、电子设备
  • 一种讲房文案生成方法、装置、电子设备及存储介质
技术分类

06120113034352