掌桥专利:专业的专利平台
掌桥专利
首页

内容生成方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 16:12:48



技术领域

本公开涉及互联网技术领域,特别是涉及一种内容生成方法、装置、电子设备及存储介质。

背景技术

在许多行业中,用户对于商品及商品的特定信息(比如商品的优惠信息)非常关注,商品的特定信息对于用户的消费决策有着极大的影响,因此为商品生成特定内容,并在线上给用户展示商品特定内容,对于提高用户决策体验和效率有极大的帮助。

现有技术中,商品特定内容的一种生成方式,是基于外界输入的商品特定信息进行人工分析编辑,从而生成商品的特定内容。但是,人工编辑的方式生产效率低下,无法满足商品特定信息的时效性要求。另一种方式,是基于外界输入的商品特定信息进行计算机分析,从而生成商品的特定内容。但是,目前计算机分析的方式通常是生成商品的特定文本这一单一模态的特定内容,然而单一模态的特定文本对特定内容的描述较为单调片面,导致用户体验不佳。

发明内容

鉴于上述问题,本公开实施例提出了一种内容生成方法、装置、电子设备及存储介质,能够自动生成多模态的特定主题内容,特定主题内容更加丰富全面。

根据本公开的实施例的第一方面,提供了一种内容生成方法,包括:

获取目标商品的特定信息;

基于所述特定信息中包含的商场信息,从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息;

基于所述特定信息中包含的商品信息,从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,得到所述目标商品的特定图片;

从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接,得到所述目标商品的目标特定正文文本;

聚合所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本,自动生成所述目标商品的特定主题内容。

可选地,所述文本信息库通过以下方式构建:获取第一用户评论文本,从所述第一用户评论文本中抽取能够作为商品特定标题的第一文本,基于所述第一文本构建特定标题文本;获取第二用户评论文本,从所述第二用户评论文本中抽取包含商品名称和商品品牌的第二文本,基于所述第二文本构建特定正文文本;基于所述特定标题文本和所述特定正文文本构建所述文本信息库。

可选地,所述基于所述第二文本构建特定正文文本,包括:将所述第二文本中包含的商品名称替换为预设的商品名称的代表标识,将所述第二文本中包含的商品品牌替换为预设的商品品牌的代表标识,将替换后的第二文本作为特定正文文本。

可选地,所述基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,包括:识别所述目标商品的特定正文文本中包含的商品名称的代表标识和商品品牌的代表标识;从所述商品信息中抽取商品名称和商品品牌,利用所述商品名称填充替换所述商品名称的代表标识,利用所述商品品牌填充替换所述商品品牌的代表标识。

可选地,所述基于所述特定信息中包含的商场信息,从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息,包括:基于所述特定信息中包含的商场信息,从预先构建的商户信息库中进行匹配,选取位于所述商场信息对应商场内的至少一个匹配成功的商户信息作为所述目标商品的特定商户信息。

可选地,所述从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,包括:从所述文本信息库中随机选取至少一个特定标题文本,作为所述目标商品的特定标题文本;从所述文本信息库中随机选取至少一个特定正文文本,作为所述目标商品的特定正文文本。

根据本公开的实施例的第二方面,提供了一种内容生成装置,包括:

获取模块,用于获取目标商品的特定信息;

商户匹配模块,用于基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息;

商品匹配模块,用于基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,得到所述目标商品的特定图片;

文本处理模块,用于从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接,得到所述目标商品的目标特定正文文本;

聚合模块,用于聚合所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本,自动生成所述目标商品的特定主题内容。

可选地,所述文本信息库通过以下模块构建:第一构建模块,用于获取第一用户评论文本,从所述第一用户评论文本中抽取能够作为商品特定标题的第一文本,基于所述第一文本构建特定标题文本;第二构建模块,用于获取第二用户评论文本,从所述第二用户评论文本中抽取包含商品名称和商品品牌的第二文本,基于所述第二文本构建特定正文文本;第三构建模块,用于基于所述特定标题文本和所述特定正文文本构建所述文本信息库。

可选地,所述第二构建模块,包括:第一替换单元,用于将所述第二文本中包含的商品名称替换为预设的商品名称的代表标识,将所述第二文本中包含的商品品牌替换为预设的商品品牌的代表标识,将替换后的第二文本作为特定正文文本。

可选地,所述文本处理模块包括:识别单元,用于识别所述目标商品的特定正文文本中包含的商品名称的代表标识和商品品牌的代表标识;第二替换单元,用于从所述商品信息中抽取商品名称和商品品牌,利用所述商品名称填充替换所述商品名称的代表标识,利用所述商品品牌填充替换所述商品品牌的代表标识。

可选地,所述商户匹配模块,具体用于基于所述特定信息中包含的商场信息,从预先构建的商户信息库中进行匹配,选取位于所述商场信息对应商场内的至少一个匹配成功的商户信息作为所述目标商品的特定商户信息。

可选地,所述文本处理模块包括:第一选取单元,用于从所述文本信息库中随机选取至少一个特定标题文本,作为所述目标商品的特定标题文本;第二选取单元,用于从所述文本信息库中随机选取至少一个特定正文文本,作为所述目标商品的特定正文文本。

根据本公开的实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;和其上存储有指令的一个或多个计算机可读存储介质;当所述指令由所述一个或多个处理器执行时,使得所述处理器执行如上任一项所述的内容生成方法。

根据本公开的实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行如上任一项所述的内容生成方法。

本公开实施例提供了一种内容生成方法、装置、电子设备及存储介质。获取目标商品的特定信息;基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息;基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,得到所述目标商品的特定图片;从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接得到所述目标商品的目标特定正文文本;聚合所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本,自动生成所述目标商品的特定主题内容。因此,本公开实施例能够自动化地生产出同时包含特定图片、特定标题文本、特定正文文本和特定商户信息的多模态的特定主题内容,在通过自动化生产满足特定信息时效性要求的同时,能够使特定主题内容更加丰富全面,从而使特定信息能够及时地以多模态特定主题内容的形式触达用户,提高用户体验。

附图说明

为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些附图,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本公开实施例的一种内容生成方法的步骤流程图。

图2是本公开实施例的另一种内容生成方法的步骤流程图。

图3是本公开实施例的一种内容生成装置的结构框图。

图4是本公开实施例的一种电子设备的结构示意图。

具体实施方式

下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本公开的一部分实施例,而不是本公开的全部实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

参照图1,示出了本公开实施例的一种内容生成方法的步骤流程图。

如图1所示,内容生成方法可以包括以下步骤:

步骤101,获取目标商品的特定信息。

目标商品可以为任意行业的商品,包括但不限于:美妆行业的商品,服装行业的商品,食品行业的商品,电子行业的商品,等等。

示意性的,可以基于互联网中的商品相关信息,从线上抓取目标商品的特定信息;也可以基于调查等形式,从线下收集目标商品的特定信息;等等,本实施例对此不作限制。

示意性的,目标商品的特定信息可以为目标商品的优惠信息。具体地,目标商品的特定信息可以包括但不限于:目标商品的商品信息,目标商品的商场信息,目标商品的折扣信息,目标商品的优惠活动时间,等等。其中,目标商品的商品信息可以包括但不限于以下至少一种:商品名称,商品品牌,等等。商场信息可以包括但不限于以下至少一种:商场名称,商场所在城市,商场地址,等等。

步骤102,基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息。

预先构建商户信息库,商户信息库中可以包括多个商户信息。需要说明的是,在实现中可以针对不同的行业分别构建商户信息库。示意性的,商户信息库中的任意一个商户信息可以包括但不限于以下至少一种:商户名称,商户地址,商户所在城市,等等。对于商户信息库的构建方式,将在下面的实施例中详细论述。

基于目标商品的特定信息中包含的商场信息,可以从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息。具体的匹配过程将在下面的实施例中详细论述。

步骤103,基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,得到所述目标商品的特定图片。

预先构建商品信息库,商品信息库中可以包括多个商品信息。需要说明的是,在实现中可以针对不同的行业分别构建商品信息库。示意性的,商品信息库中的任意一个商品信息可以包括但不限于:商品图片,商品名称,商品品牌,等等。对于商品信息库的构建方式,将在下面的实施例中详细论述。

基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片。具体的匹配过程将在下面的实施例中详细论述。

获取到目标商品的图片后,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,即可得到所述目标商品的特定图片。

步骤104,从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接得到所述目标商品的目标特定正文文本。

预先构建文本信息库,文本信息库中可以包括多个特定标题文本和多个特定正文文本。需要说明的是,在实现中可以针对不同的行业分别构建文本信息库。对于文本信息库的构建方式,将在下面的实施例中详细论述。

从预先构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本。然后基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接得到所述目标商品的目标特定正文文本。

步骤105,聚合所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本,自动生成所述目标商品的特定主题内容。

本公开实施例中,能够自动化地生产出同时包含特定图片、特定标题文本、特定正文文本和特定商户信息的多模态的特定主题内容,在通过自动化生产满足特定信息时效性要求的同时,能够使特定主题内容更加丰富全面,从而使特定信息能够及时地以多模态特定主题内容的形式触达用户,提高用户体验。

参照图2,示出了本公开实施例的另一种内容生成方法的步骤流程图。

如图2所示,内容生成方法可以包括以下步骤:

步骤201,构建商户信息库、商品信息库和文本信息库。

以下,对各信息库的构建过程进行说明。

(1)商户信息库

示意性的,可以基于互联网中的商户相关信息,从线上收集商户信息;也可以基于调查等形式,从线下收集商户信息;等等。基于收集到的商户信息构建商户信息库。

示意性的,商户信息可以包括但不限于以下至少一种:商户名称,商户地址,商户所在城市,等等。

(2)商品信息库

示意性的,可以基于互联网中的商品相关信息,从线上收集商品信息;也可以基于调查等形式,从线下收集商品信息;等等。基于收集到的商品信息构建商品信息库。

示意性的,商品信息可以包括但不限于:商品名称,商品品牌,商品图片,等等。

(3)文本信息库

文本信息库中可以包括多个特定标题文本和多个特定正文文本。

对于构建特定标题文本的过程,可以获取第一用户评论文本,从所述第一用户评论文本中抽取能够作为商品特定标题的第一文本,基于所述第一文本构建特定标题文本。

示意性的,可以基于与商品相关的第一用户评论文本,通过文本扩充的方式构建特定标题文本。

具体地,特定标题文本的构建过程包括如下步骤A1~A4:

步骤A1,获取初始特定标题文本和第一用户评论文本。

构造与商品特定信息相关的初始特定标题文本集合,初始特定标题文本可以不包含具体的商品信息。对于初始特定标题文本的具体形式,可以根据实际经验构造任意适用的初始特定标题文本。比如,初始特定标题文本可以为“大减价”、“特价优惠”、“大特卖”,等等。

收集与商品相关的第一用户评论文本。在实现中,可以基于互联网中的商品评论相关信息,从线上收集与商品相关的第一用户评论文本。第一用户评论文本中可以包括但不限于:商品特定信息,商品名称,商品品牌,等等。

步骤A2,针对所述初始特定标题文本中的初始词语,从所述第一用户评论文本中筛选出所述初始词语的同义词(该同义词可以作为所述第一文本)。

示意性的,步骤A2可以包括以下步骤A21~A24:

步骤A21,对所述初始特定标题文本进行分词得到初始词语,对所述第一用户评论文本进行分词得到评论词语。

本实施例中,为了方便区分,将对初始特定标题文本进行分词得到的词语称为初始词语,将对第一用户评论文本进行分词得到的词语称为评论词语。

对于分词的具体过程,可以采用任意一种适用的分词方式。分词方式可以包括但不限于:正向最大匹配法分词,逆向最大匹配法分词,双向最大匹配法分词,基于HMM(Hidden Markov Model,隐马尔科夫模型)的分词,基于N-gram(汉语语言模型,也称为N元模型)的分词,等等。

步骤A22,利用预先训练的语义模型,获取各初始词语的语义向量和各评论词语的语义向量。

预先收集与商品相关的第一样本用户评论文本,基于第一样本用户评论文本训练语义模型。

示意性的,语义模型可以包括但不限于:基于CBOW(Continuous Bag-of-Words,连续词袋)的Word2Vec模型,基于Skip-Gram的Word2Vec模型,DNN(Deep Neural Networks,深度神经网络)模型,等等。

示意性的,基于CBOW的Word2Vec模型在训练过程中是给定输入的某个特定词的上下文,来预测该特定词,预测结果满足收敛条件时训练完成。基于Skip-Gram的Word2Vec模型在训练过程中是给定输入的某个特定词,来预测该特定词的上下文,预测结果满足收敛条件时训练完成。可选地,上述收敛条件可以为模型的损失函数小于预设阈值,等等。

利用上述训练得到的语义模型,可以获取各初始词语的语义向量,以及各评论词语的语义向量。

示意性的,可以分别针对每个词语(初始词语或评论词语),将该词语输入语言模型,经过语言模型的内部处理,得到语言模型输出的该的语义向量。或者可以针对每个初始特定标题文本,将该初始特定标题文本中包含的初始词语一并输入语言模型,经过语言模型的内部处理,得到语言模型输出的该初始特定标题文本中包含的各初始词语的语义向量;类似的,针对每个第一用户评论文本,对该第一用户评论文本进行分句,针对每个分句,将该分句中包含的评论词语一并输入语言模型,经过语言模型的内部处理,得到语言模型输出的该分句中包含的各评论词语的语义向量。

步骤A23,针对每个初始词语,计算当前初始词语的语义向量与各评论词语的语义向量的语义相似度。

示意性的,任意两个词语的语义向量之间的语义相似度,可以基于这两个词语的语义向量之间的余弦距离,欧氏距离,马氏距离,汉明距离,曼哈顿距离,等等,来进行衡量。

步骤A24,将语义相似度最大并且大于第三预设阈值的至少一个评论词语作为当前初始词语的同义词。

针对当前初始词语,按照各评论词语的语义向量与当前初始词语的语义向量的语义相似度,对各评论词语进行降序排序,从语义相似度最大的评论词语开始,按顺序依次选取语义相似度大于第三预设阈值的至少一个评论词语,作为当前初始词语的同义词。

步骤A3,利用所述初始词语的同义词替换所述初始词语,得到新增特定标题文本。

在筛选出各初始词语的同义词后,针对至少一个初始词语,利用该初始词语的同义词替换该初始词语,从而可以通过对初始特定标题文本进行修改得到新增特定标题文本。

步骤A4,将所述初始特定标题文本和所述新增特定标题文本作为所述特定标题文本。

因此,特定标题文本包括初始特定标题文本和新增特定标题文本。

对于构建特定正文文本的过程,可以获取第二用户评论文本,从所述第二用户评论文本中抽取包含商品名称和商品品牌的第二文本,基于所述第二文本构建特定正文文本。示意性的,可以基于与商品相关的第二用户评论文本,通过个性化挖掘的方式构建特定正文文本。

具体地,特定正文文本的构建过程包括如下步骤B1~B3:

步骤B1,获取第二用户评论文本,对所述第二用户评论文本进行分句,并选取正向情感的句子作为第一目标句子。

收集与商品相关的第二用户评论文本。在实现中,可以基于互联网中的商品评论相关信息,从线上收集与商品相关的第二用户评论文本。第二用户评论文本中可以包括但不限于:商品特定信息,商品名称,商品品牌,等等。可以理解的是,第二用户评论文本和第一用户评论文本可以相同,也可以不同。

对于分句的具体过程,可以采用任意一种适用的分句方式。比如,可以按照句子中的标点符号进行分句等等,本实施例在此不再详细论述。

预先收集不同情感对应的第三样本用户评论文本,将第三样本用户评论文本进行分句得到样本句子,并对各样本句子标注实际情感,基于各样本句子和各样本句子标注的实际情感训练情感分类模型。可选地,情感可以包括但不限于正向情感,负向情感,等等。

示意性的,情感分类模型可以包括但不限于:BERT(Bidirectional EncoderRepresentations from Transformers,基于转换器的双向编码器表征)模型,Word2Vec+RNN(Recurrent Neural Network,循环神经网络),逻辑回归模型,决策树模型,SVM(Support Vector Machine,是支持向量机),朴素贝叶斯模型,LSTM(Long Short-TermMemory,长短期记忆)模型,等等。

在情感分类模型的训练过程中,将样本句子输入情感分类模型,情感分类模型经过内部处理输出该样本分句的预测情感,然后根据预测情感和实际情感可以计算模型的损失函数,在损失函数小于预设阈值的情况下确定情感分类模型训练完成。

对第二用户评论文本进行分句得到对应的句子,针对每个句子,将该句子输入上述训练完成的情感分类模型,得到该情感分类模型输出的该句子的预测情感。选取预测情感为正向情感的句子作为第一目标句子。

步骤B2,从所述第一目标句子中筛选出包含商品名称和商品品牌的句子,作为第二文本。

示意性的,步骤B2可以包括以下步骤B21~B22:

步骤B21,针对每个第一目标句子,将当前第一目标句子输入预先训练的序列标注模型,得到所述序列标注模型输出的当前第一目标句子的预测标注信息。

预先收集包含商品名称和商品品牌的用户评论文本作为第二样本用户评论文本,并对第二样本用户评论文本进行标注得到第二样本用户评论文本的样本标注信息,基于第二样本用户评论文本和第二样本用户评论文本的样本标注信息训练序列标注模型。其中,样本标注信息用于指示第二样本用户评论文本中每个字是否为商品名称、商品品牌以及在商品名称、商品品牌中的顺序。

示意性的,可以将上述商品信息库中包含的商品名称和商品品牌作为标签,将这些标签与用户评论文本进行匹配(此处的匹配可以为文本的精确匹配),得到每个用户评论文本与标签的匹配结果,还可以进行人工审核修正误匹配结果,将匹配成功(也即包含商品名称和商品品牌)的句子作为第二样本用户评论文本。每个第二样本用户评论文本中匹配成功的每个字按顺序标注为对应标签的开头、中间和结尾,未匹配到的词语则标注为非标签。

示意性的,序列标注模型可以包括但不限于:BERT联合CRF(Conditional RandomFields,条件随机场)的模型,等等。

在序列标注模型的训练过程中,将第二样本用户评论文本输入序列标注模型,序列标注模型经过内部处理输出该第二样本用户评论文本的样本预测标注信息,然后根据样本预测标注信息和样本标注信息可以计算模型的损失函数,在损失函数小于预设阈值的情况下确定序列标注模型训练完成。样本预测标注信息用于指示第二样本用户评论文本中每个字是否为商品名称、商品品牌以及在商品名称、商品品牌中的顺序。

针对每个第一目标句子,将当前第一目标句子输入上述训练得到的序列标注模型,得到序列标注模型输出的当前第一目标句子的预测标注信息。预测标注信息用于指示当前第一目标句子中每个字是否为商品名称、商品品牌以及在商品名称、商品品牌中的顺序。

步骤B22,将所述预测标注信息指示为包含商品名称和商品品牌的第一目标句子,作为所述第二文本。

步骤B3,将所述第二文本中包含的商品名称替换为预设的商品名称的代表标识,将所述第二文本中包含的商品品牌替换为预设的商品品牌的代表标识,将替换后的第二文本作为特定正文文本。

代表标识可以为任意设置的标识。示意性的,可以将商品名称同一替换为「sku」等,将商品品牌统一替换为「brand」等。

在得到上述特定标题文本和特定正文文本后,基于所述特定标题文本和所述特定正文文本构建所述文本信息库。

步骤202,获取目标商品的特定信息。

步骤203,基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息。

示意性的,基于所述特定信息中包含的商场信息,从预先构建的商户信息库中进行匹配,选取位于所述商场信息对应商场内的至少一个匹配成功的商户信息作为所述目标商品的特定商户信息。因此,可以针对同一商场内的多个商户同时生成目标商品的特定主题内容。

示意性的,基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配的过程,可以包括以下步骤C11~C12:

步骤C11,将所述特定信息中的商场信息中包含的商场所在城市,与所述商户信息库的各商户信息中包含的商户所在城市进行第一匹配,获取第一匹配成功的商户信息集合。

第一匹配为精确匹配。将所述特定信息中的商品信息中包含的商场所在城市,与所述商户信息库的各商户信息中包含的商户所在城市进行精确匹配,如果特定信息中的商品信息中包含的商场所在城市,与所述商户信息库的某个商户信息中包含的商户所在城市相同,则确定该第一匹配成功;否则,确定第一匹配失败。

步骤C12,将所述特定信息中的商场信息中包含的商场地址,与所述商户信息集合的各商户信息中包含的商户地址进行第二匹配,将第二匹配成功的商户信息作为所述匹配成功的商户信息。

预先收集样本地址对,一个样本地址对中包含两个样本地址,并对样本地址对进行标注得到样本地址对的实际地址相似度。基于样本地址对和样本地址对的实际地址相似度训练地址匹配模型。可选地,样本地址可以为商场地址、商户地址等等。

示意性的,地址匹配模型可以包括但不限于:基于BERT的模型,等等。

在地址匹配模型的训练过程中,将样本地址对输入地址匹配模型,地址匹配模型经过内部处理输出该样本地址对的预测地址相似度,然后根据预测地址相似度和实际地址相似度可以计算模型的损失函数,在损失函数小于预设阈值的情况下确定地址匹配模型训练完成。

针对所述商户信息集合的每个商户信息,将当前商户信息中包含的商户地址与所述特定信息中的商场信息中包含的商场地址输入预先训练的地址匹配模型,得到所述地址匹配模型输出的地址相似度;将地址相似度最大并且大于第一预设阈值的商户信息,作为第二匹配成功的商户信息。对于第一预设阈值,可以根据实际经验设置任意适用的数值,比如设置第一预设阈值为0.8、0.9等等。

基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配后,选取匹配成功的商户信息作为所述目标商品的特定商户信息。

步骤204,基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,得到所述目标商品的特定图片。

示意性的,基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配的过程,可以包括以下步骤C21~C22:

步骤C21,将所述特定信息中的商品信息中包含的商品品牌,与所述商品信息库的各商品信息中包含的商品品牌进行第三匹配,获取第三匹配成功的商品信息集合。

第三匹配为精确匹配。将所述特定信息中的商品信息中包含的商品品牌,与所述商品信息库的各商品信息中包含的商品品牌进行精确匹配,如果特定信息中的商品信息中包含的商品品牌,与所述商品信息库的某个商品信息中包含的商品品牌相同,则确定该第三匹配成功;否则,确定第三匹配失败。

步骤C22,将所述特定信息中的商品信息中包含的商品名称,与所述商品信息集合的各商品信息中包含的商品名称进行第四匹配,将第四匹配成功的商品信息作为所述匹配成功的商品信息。

针对所述商品信息集合的每个商品信息,确定当前商品信息中包含的商品名称与所述特定信息中的商品信息中包含的商品名称的最长公共子串,并计算所述最长公共子串与当前商品信息中包含的商品名称的字符匹配度;将字符匹配度最大并且大于第二预设阈值的商品信息,作为第四匹配成功的商品信息。对于第二预设阈值,可以根据实际经验设置任意适用的数值,比如设置第二预设阈值为0.8、0.9等等。

示意性的,可以计算最长公共子串的长度与当前商品信息中包含的商品名称的长度的比值,将该比值作为所述最长公共子串与当前商品信息中包含的商品名称的字符匹配度。或者可以计算最长公共子串的长度与当前商品信息中包含的商品名称的长度的交并比,将该交并比作为所述最长公共子串与当前商品信息中包含的商品名称的字符匹配度。

基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配后,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片。

利用图片合成方法,将特定信息中包含的折扣文本与目标商品的图片进行合成,可以得到目标商品的特定图片。其中,折扣信息可以为折扣文本,比如,“五折”、“三折”等等。

步骤205,从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接得到所述目标商品的目标特定正文文本。

从预先构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本的过程,可以包括:从所述文本信息库中随机选取至少一个特定标题文本,作为所述目标商品的特定标题文本;从所述文本信息库中随机选取至少一个特定正文文本,作为所述目标商品的特定正文文本。

基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换的过程,包括:识别所述目标商品的特定正文文本中包含的商品名称的代表标识和商品品牌的代表标识;从所述特定信息包含商品信息中抽取商品名称和商品品牌,利用抽取的商品名称填充替换所述商品名称的代表标识,利用抽取的商品品牌填充替换所述商品品牌的代表标识。

以上述商品名称的代表标识为「sku」,商品品牌的代表标识为「brand」为例,利用目标商品的特定信息中的商品名称替换目标商品的特定正文文本中的「sku」,利用目标商品的特定信息中的商品品牌替换目标商品的特定正文文本中的「brand」。

将填充替换后的特定正文文本与所述特定信息进行拼接,即可得到所述目标商品的目标特定正文文本。

步骤206,聚合所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本,自动生成所述目标商品的特定主题内容。

示意性的,对于所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本的聚合方式,可以采用任意适用的方式实现,本实施例对此不作限制。

示意性的,特定主题内容可以包含单一商品维度的特定主题内容、商场维度的多品牌特定主题内容、同商场品牌维度的不同商品的特定主题内容等多种不同形式的特定主题内容。

本公开实施例中,围绕文本语义算法、图像生成算法、文本生成算法,实现了基于外界特定信息自动化生产特定主题内容,能够实时快速的将特定信息以特定主题内容的形式触达用户,保证了特定信息高效实时的分发;特定主题内容通过特定图片、特定标题文本、特定正文文本和特定商户信息多种模态的生成和聚合得到,内容展示更加全面丰富,提升了用户体验。

参照图3,示出了本公开实施例的一种内容生成装置的结构框图。

如图3所示,内容生成装置可以包括以下模块:

获取模块301,用于获取目标商品的特定信息;

商户匹配模块302,用于基于所述特定信息中包含的商场信息从预先构建的商户信息库中进行匹配,选取匹配成功的商户信息作为所述目标商品的特定商户信息;

商品匹配模块303,用于基于所述特定信息中包含的商品信息从预先构建的商品信息库中进行匹配,选取匹配成功的商品信息中包含的商品图片作为所述目标商品的图片,将所述特定信息中包含的折扣信息与所述目标商品的图片进行合成,得到所述目标商品的特定图片;

文本处理模块304,用于从预先基于用户评论文本构建的文本信息库中选取所述目标商品的特定标题文本和特定正文文本,基于所述特定信息中包含的商品信息对所述目标商品的特定正文文本进行填充替换,将填充替换后的特定正文文本与所述特定信息进行拼接,得到所述目标商品的目标特定正文文本;

聚合模块305,用于聚合所述目标商品的特定商户信息、所述目标商品的特定图片、所述目标商品的特定标题文本和所述目标商品的目标特定正文文本,自动生成所述目标商品的特定主题内容。

可选地,所述文本信息库通过以下模块构建:第一构建模块,用于获取第一用户评论文本,从所述第一用户评论文本中抽取能够作为商品特定标题的第一文本,基于所述第一文本构建特定标题文本;第二构建模块,用于获取第二用户评论文本,从所述第二用户评论文本中抽取包含商品名称和商品品牌的第二文本,基于所述第二文本构建特定正文文本;第三构建模块,用于基于所述特定标题文本和所述特定正文文本构建所述文本信息库。

可选地,所述第二构建模块,包括:第一替换单元,用于将所述第二文本中包含的商品名称替换为预设的商品名称的代表标识,将所述第二文本中包含的商品品牌替换为预设的商品品牌的代表标识,将替换后的第二文本作为特定正文文本。

可选地,所述文本处理模块304包括:识别单元,用于识别所述目标商品的特定正文文本中包含的商品名称的代表标识和商品品牌的代表标识;第二替换单元,用于从所述商品信息中抽取商品名称和商品品牌,利用所述商品名称填充替换所述商品名称的代表标识,利用所述商品品牌填充替换所述商品品牌的代表标识。

可选地,所述商户匹配模块302,具体用于基于所述特定信息中包含的商场信息,从预先构建的商户信息库中进行匹配,选取位于所述商场信息对应商场内的至少一个匹配成功的商户信息作为所述目标商品的特定商户信息。

可选地,所述文本处理模块304包括:第一选取单元,用于从所述文本信息库中随机选取至少一个特定标题文本,作为所述目标商品的特定标题文本;第二选取单元,用于从所述文本信息库中随机选取至少一个特定正文文本,作为所述目标商品的特定正文文本。

本公开实施例能够自动化地生产出同时包含特定图片、特定标题文本、特定正文文本和特定商户信息的多模态的特定主题内容,在通过自动化生产满足特定信息时效性要求的同时,能够使特定主题内容更加丰富全面,从而使特定信息能够及时地以多模态特定主题内容的形式触达用户,提高用户体验。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

在本公开的实施例中,还提供了一种电子设备。该电子设备可以包括一个或多个处理器,以及其上存储有指令的一个或多个计算机可读存储介质,指令例如应用程序。当所述指令由所述一个或多个处理器执行时,使得所述处理器执行如上任一实施例的内容生成方法。

参照图4,示出了本公开实施例的一种电子设备结构的示意图。如图4所示,电子设备包括处理器401、通信接口402、存储器403和通信总线404。其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。

存储器403,用于存放计算机程序。

处理器401,用于执行存储器403上所存放的程序时,实现上述任一实施例的内容生成方法。

通信接口402用于上述电子设备与其他设备之间的通信。

上述提到的通信总线404可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

上述提到的处理器401可以包括但不限于:中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)、数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,等等。

上述提到的存储器403可以包括但不限于:只读存储器(Read Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、光盘只读储存器(Compact DiscReadOnly Memory,简称CD-ROM)、电可擦可编程只读存储器(Electronic ErasableProgrammable ReadOnly Memory,简称EEPROM)、硬盘、软盘、闪存,等等。

在本公开的实施例中,还提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序可由电子设备的处理器执行,当所述计算机程序被处理器执行时,使得所述处理器执行如上任一实施例所述的内容生成方法。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。

技术分类

06120114741351