掌桥专利:专业的专利平台
掌桥专利
首页

品牌知识问答方法、装置、设备及可读存储介质

文献发布时间:2024-04-18 20:01:55


品牌知识问答方法、装置、设备及可读存储介质

技术领域

本申请实施例涉及人工智能技术领域,特别涉及一种品牌知识问答方法、装置、设备及可读存储介质。

背景技术

随着品牌行业的高速发展,不仅新的品牌层出不穷,还存在原有品牌的淘汰、合并等现象,使得用户可能会提出关于某个品牌的问题。随着人工智能技术的发展,一些神经网络模型可以生成品牌问题的答案。

相关技术中,可以构建品牌知识图谱,品牌知识图谱包括多个三元组,一个三元组包括品牌名称、关系以及与品牌名称形成该关系的尾实体。例如,一个三元组包括品牌A、所属行业和服装,也就是说,这个三元组描述了品牌A所属的行业是服装行业。可以通过神经网络模型对品牌问题进行品牌识别得到品牌名称,并对品牌问题进行关系识别得到关系。接着,从品牌知识图谱中确定与品牌名称和关系匹配的尾实体。之后,基于品牌名称、关系和尾实体生成品牌问题的答案。

一方面,由于品牌的不断产生、淘汰、合并等,使得品牌知识图谱需要频繁构建或更新,而品牌知识图谱的构建更新难度大。另一方面,在对品牌问题进行关系识别时,可能出现由于关系识别结果准确性不高而出现答非所问的现象。再一方面,基于三元组生成的答案较为呆板。基于前述原因,影响了品牌的问答效果。

发明内容

本申请提供了一种品牌知识问答方法、装置、设备及可读存储介质,可以提高品牌的问答效果,所述技术方案包括如下内容。

一方面,提供了一种品牌知识问答方法,所述方法包括:

获取关于品牌的问题信息,从所述问题信息中提取第一品牌信息;

基于所述第一品牌信息,从品牌知识库中检索出参考知识文档,所述品牌知识库包括多个品牌知识文档,所述参考知识文档是所述多个品牌知识文档中与所述第一品牌信息匹配的第二品牌信息的知识文档;

通过第一编码器对所述问题信息和所述参考知识文档进行语义编码,得到第一编码结果,所述第一编码结果用于描述所述参考知识文档的语义与所述问题信息的语义;

通过第一解码器对所述第一编码结果进行语义解码,得到第一解码结果,通过所述第一编码结果对所述第一解码结果进行校正,得到第二解码结果,基于所述第二解码结果确定所述问题信息的第一答案信息,所述第一解码结果表征从所述参考知识文档中提取的与所述问题信息语义相关的第一内容的语义,所述第二解码结果表征所述第一内容中与所述问题信息和所述参考知识文档语义相关的第二内容的语义。

另一方面,提供了一种品牌知识问答装置,所述装置包括:

获取模块,用于获取关于品牌的问题信息,从所述问题信息中提取第一品牌信息;

检索模块,用于基于所述第一品牌信息,从品牌知识库中检索出参考知识文档,所述品牌知识库包括多个品牌知识文档,所述参考知识文档是所述多个品牌知识文档中与所述第一品牌信息匹配的第二品牌信息的知识文档;

编码模块,用于通过第一编码器对所述问题信息和所述参考知识文档进行语义编码,得到第一编码结果,所述第一编码结果用于描述所述参考知识文档的语义与所述问题信息的语义;

解码模块,用于通过第一解码器对所述第一编码结果进行语义解码,得到第一解码结果,通过所述第一编码结果对所述第一解码结果进行校正,得到第二解码结果,基于所述第二解码结果确定所述问题信息的第一答案信息,所述第一解码结果表征从所述参考知识文档中提取的与所述问题信息语义相关的第一内容的语义,所述第二解码结果表征所述第一内容中与所述问题信息和所述参考知识文档语义相关的第二内容的语义。

在一种可能的实现方式中,所述获取模块,用于获取第一提示信息,所述第一提示信息用于提示对所述问题信息中的品牌信息进行提取;通过第二编码器对所述问题信息和所述第一提示信息进行语义编码,得到第二编码结果,所述第二编码结果用于描述所述问题信息的语义和所述第一提示信息的语义;通过第二解码器对所述第二编码结果进行语义解码,得到第三解码结果,通过所述第二编码结果对所述第三解码结果进行校正,得到第四解码结果,基于所述第四解码结果确定所述第一品牌信息,所述第三解码结果表征从所述问题信息中提取的与所述第一提示信息语义相关的第三内容的语义,所述第四解码结果表征所述第三内容中与所述问题信息和所述第一提示信息语义相关的第四内容的语义。

在一种可能的实现方式中,所述检索模块,用于对所述第一品牌信息进行特征提取,得到第一品牌特征;基于所述第一品牌特征和所述品牌知识库,构建品牌检索池,所述品牌知识库还包括各个品牌知识文档对应的品牌特征,所述品牌检索池包括各个品牌特征中的部分品牌特征;基于所述第一品牌特征,从所述品牌检索池中检索出第二品牌特征,所述第二品牌特征是对所述第二品牌信息进行特征提取得到的特征;从所述品牌知识库中确定所述第二品牌特征对应的所述参考知识文档。

在一种可能的实现方式中,所述第一品牌特征是通过特征提取模型对所述第一品牌信息进行特征提取得到的特征;

所述获取模块,还用于获取样本三元组,所述样本三元组包括样本品牌信息、与所述样本品牌信息的相似度大于设定值的相似品牌信息以及与所述样本品牌信息的相似度不大于所述设定值的不相似品牌信息;

特征提取模块,用于通过第一网络模型对所述样本三元组进行特征提取,得到样本品牌特征、相似品牌特征和不相似品牌特征;

训练模块,用于基于所述样本品牌特征、所述相似品牌特征和所述不相似品牌特征,对所述第一网络模型进行训练,得到所述特征提取模型。

在一种可能的实现方式中,所述训练模块,用于计算所述样本品牌特征和所述相似品牌特征之间的第一特征距离;计算所述样本品牌特征和所述不相似品牌特征之间的第二特征距离;基于所述第一特征距离和所述第二特征距离之间的差值,对所述第一网络模型进行训练,得到所述特征提取模型。

在一种可能的实现方式中,所述检索模块,用于对所述各个品牌特征进行聚类,得到多个聚类簇,所述聚类簇包括至少一个品牌特征;对于任一个聚类簇,基于所述任一个聚类簇包括的各个品牌特征,确定所述任一个聚类簇的特征;基于所述第一品牌特征和各个聚类簇的特征之间的距离,从所述多个聚类簇中确定参考聚类簇;将所述参考聚类簇包括的各个品牌特征确定为所述品牌检索池包括的各个品牌特征。

在一种可能的实现方式中,所述检索模块,用于对于所述品牌检索池中的任一个品牌特征,如果所述第一品牌特征和所述任一个品牌特征之间的距离小于距离阈值,则将所述任一个品牌特征确定为目标品牌特征;如果所述目标品牌特征为至少一个,则从至少一个目标品牌特征中确定第二品牌特征;如果不存在所述目标品牌特征,则生成第二提示信息,所述第二提示信息用于提示未能确定所述问题信息的答案信息。

在一种可能的实现方式中,所述目标品牌特征为至少两个,所述检索模块,用于基于至少两个目标品牌特征生成第三提示信息,所述第三提示信息用于提示从所述至少两个目标品牌特征中选择一个目标品牌特征;获取针对所述第三提示信息的选择操作,将所述选择操作选中的目标品牌特征确定为所述第二品牌特征。

在一种可能的实现方式中,所述装置还包括:

生成模块,用于如果未从所述问题信息中提取出所述第一品牌信息,则生成第四提示信息,所述第四提示信息用于提示输入品牌信息;

所述获取模块,还用于获取基于所述第四提示信息输入的第三品牌信息;

所述检索模块,还用于基于所述第三品牌信息,从所述品牌知识库中检索出目标知识文档,所述目标知识文档是所述多个品牌知识文档中与所述第三品牌信息匹配的第四品牌信息的知识文档;

所述编码模块,还用于通过所述第一编码器对所述问题信息和所述目标知识文档进行编码,得到第三编码结果,所述第三编码结果用于描述从所述目标知识文档中提取出的与所述问题信息相关的内容;

所述解码模块,还用于通过所述第一解码器对所述第三编码结果进行解码,得到所述问题信息的第二答案信息。

另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述电子设备实现上述任一所述的品牌知识问答方法。

另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一所述的品牌知识问答方法。

另一方面,还提供了一种计算机程序,所述计算机程序为至少一条,至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种品牌知识问答方法。

另一方面,还提供了一种计算机程序产品,所述计算机程序产品中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种品牌知识问答方法。

本申请提供的技术方案至少带来如下有益效果:

本申请提供的技术方案中,品牌知识库包括多个品牌知识文档,品牌知识文档暗含多种关系以及与品牌形成各种关系的尾实体,相较于构建或更新三元组来说,品牌知识文档的获取难度低,从而降低了品牌知识库的获取难度。通过从问题信息中提取第一品牌信息,再从品牌知识库中检索第一品牌信息对应的参考知识文档,实现了获取与第一品牌信息形成各种关系的尾实体。之后,通过对问题信息和参考知识文档进行编码和解码,得到第一答案信息,实现了无需对问题信息进行关系识别,而是在语义层面上理解问题信息和参考知识文档,实现从参考知识文档中提取出问题信息的答案信息,不仅避免了答非所问的现象,还能提高答案的灵活性,从而提高问答效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种品牌知识问答方法的实施环境示意图;

图2是本申请实施例提供的一种品牌知识问答方法的流程图;

图3是本申请实施例提供的一种大模型的结构示意图;

图4是本申请实施例提供的一种BERT-WWM模型的结构示意图;

图5是本申请实施例提供的一种知识文档的检索流程图;

图6是本申请实施例提供的另一种知识文档的检索流程图;

图7是本申请实施例提供的又一种知识文档的检索流程图;

图8是本申请实施例提供的再一种品牌知识问答方法的流程图;

图9是本申请实施例提供的一种品牌知识问答装置的结构示意图;

图10是本申请实施例提供的一种终端设备的结构示意图;

图11是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

随着品牌行业的高速发展,不仅新的品牌层出不穷,还存在原有品牌的淘汰、合并等现象,使得用户可能会提出关于某个品牌的问题。随着人工智能技术的发展,通过神经网络模型可以生成品牌问题的答案。

相关技术中,可以构建品牌知识图谱,品牌知识图谱包括多个三元组,一个三元组包括品牌名称、关系以及与品牌名称形成该关系的尾实体。可以先通过神经网络模型对品牌问题进行品牌识别得到品牌名称,并对品牌问题进行关系识别得到关系。接着,从品牌知识图谱中确定与品牌名称和关系匹配的尾实体。之后,基于品牌名称、关系和尾实体生成品牌问题的答案。

一方面,由于品牌的不断产生、淘汰、合并等,使得品牌知识图谱需要频繁构建或更新,而品牌知识图谱的构建更新难度大。另一方面,在对品牌问题进行关系识别时,可能出现由于关系识别结果准确性不高而出现答非所问的现象。再一方面,基于三元组生成的答案较为呆板。基于前述原因,影响了品牌的问答效果。基于此,本申请实施例提供了一种品牌知识问答方法,可以提高品牌问答效果。

图1是本申请实施例提供的一种品牌知识问答方法的实施环境示意图,如图1所示,该实施环境包括终端设备101和服务器102。其中,本申请实施例中的品牌知识问答方法可以由终端设备101执行,也可以由服务器102执行,或者由终端设备101和服务器102共同执行。

终端设备101可以是智能手机、游戏主机、台式计算机、平板电脑、膝上型便携计算机、智能电视、智能车载设备、智能语音交互设备、智能家电等。服务器102可以为一台服务器,或者为多台服务器组成的服务器集群,或者为云计算平台和虚拟化中心中的任意一种,本申请实施例对此不加以限定。服务器102与终端设备101通过通信网络连接,该通信网络可以为有线网络或无线网络。服务器102可以具有数据处理、数据存储以及数据收发等功能,在本申请实施例中不加以限定。终端设备101和服务器102的数量不受限制,可以是一个或多个。

可选地,终端设备101获取问题信息,并通过通信网络向服务器102发送问题信息。服务器102基于本申请实施例的品牌知识问答方法,确定问题信息的答案信息,并通过通信网络向终端设备101发送答案信息。其中,服务器102确定答案信息的过程如下所示。

首先,服务器102构建品牌知识库,品牌知识库的内容可以见步骤202的描述,在此不再赘述。接着,服务器102获取问题信息,确定问题信息涉及的品牌信息,其中,品牌信息的确定方式可以见下文有关第一品牌信息或者第三品牌信息的描述,在此暂不赘述。然后,服务器102基于品牌信息和品牌知识库,构建品牌检索池,并对品牌检索池进行检索,得到知识文档,其中,知识文档的确定方式可以见下文有关参考知识文档或者目标知识文档的描述,在此暂不赘述。之后,服务器102基于问题信息和知识文档,确定答案信息,其中,答案信息的确定方式可以见下文有关第一答案信息或者第二答案信息的描述,在此暂不赘述。

本申请实施例的各可选实现方式可以基于人工智能技术实现。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

以图2示出了本申请实施例提供的一种品牌知识问答方法的流程图为例,该方法可应用于上述实施环境中。为便于描述,将执行本申请实施例中的品牌知识问答方法的终端设备101或者服务器102称为电子设备,也就是说,该方法可以由电子设备来执行。如图2所示,该方法包括如下步骤。

步骤201,获取关于品牌的问题信息,从问题信息中提取第一品牌信息。

本申请实施例不对问题信息的格式、获取方式等做限定,示例性地,问题信息可以是用户在终端设备的显示界面输入的问题文本,或者,问题信息是通过音频采集设备采集的问题语音,或者,问题信息是携带有问题文本的图像。也就是说,问题信息是用户提出的或者采集得到的或者生成的,关于任意品牌的文本或者音频或者图像等。示例性地,问题信息为“XXXXX奶瓶是哪个地区的品牌?有什么特点?”。

由于问题信息是关于品牌的文本或者音频或者图像,因此,问题信息中可能携带品牌信息。基于此,电子设备在获取到问题信息之后,可以从问题信息中提取出第一品牌信息,其中,第一品牌信息可以是文本或者音频或者图像。

本申请实施例不对从问题信息中提取出第一品牌信息的方式做限定。示例性地,如果问题信息为问题图像,则电子设备可以对问题图像进行图像分割,得到各个图像区域。对于任一个图像区域,对该图像区域进行图像内容识别,以识别出该图像区域的图像内容是否包括品牌名称、品牌图案等品牌数据,如果该图像区域的图像内容包括品牌数据,则将该图像区域作为第一品牌信息。

在一种可能的实现方式中,问题信息为文本形式的信息或者问题信息可以转化为文本形式的信息。本申请实施例中,步骤201包括步骤2011至步骤2013(图中未示出)。

步骤2011,获取第一提示信息,第一提示信息用于提示对问题信息中的品牌信息进行提取。

第一提示信息是文本形式的信息,用于提示从问题信息中提取品牌信息。例如,第一提示信息可以为“请提取以上问题中的品牌名称:”。本申请实施例中,电子设备可以获取配置的至少一个初始提示信息,初始提示信息用于提示从问题信息中提取品牌信息。也即是说,各个初始提示信息是表达相同内容的不同文本,初始提示信息表达的内容是从问题信息中提取品牌信息。电子设备可以随机地或者根据用户的选择操作,从至少一个初始提示信息中确定第一提示信息。

步骤2012,通过第二编码器对问题信息和第一提示信息进行语义编码,得到第二编码结果,第二编码结果用于描述问题信息的语义和第一提示信息的语义。

本申请实施例中,可以将文本形式的问题信息或者转化为文本形式的问题信息,与第一提示信息进行拼接,得到第二拼接信息,通过这种方式,将问题信息格式化为提示(Prompt)。示例性地,第二拼接信息如下所示。

“XXXXX奶瓶是哪个地区的品牌?有什么特点?

请提取以上问题中的品牌名称:”

可以将第二拼接信息中的各个词语映射为对应的词向量,得到第二拼接信息的特征向量。接着,电子设备获取第二编码器,并将第二拼接信息的特征向量输入第二编码器,通过第二编码器对第二拼接信息的特征向量进行语义编码,得到第二编码结果,第二编码结果表征第二拼接信息的语义。由于第二拼接信息包括问题信息和第一提示信息,因此,第二编码结果可以表征问题信息的语义和第一提示信息的语义。本申请实施例不对第二编码器的结构、大小、类型等做限定。

示例性地,第二编码器包括注意力层和前馈层。注意力层用于基于注意力机制,对第二拼接信息的特征向量进行注意力处理,得到注意力处理结果。前馈层用于对注意力处理结果进行线性映射和非线性映射中的至少一项,得到第二编码结果。

其中,对于第二拼接信息的特征向量中任一个词语的词向量,通过注意力层对该词语的词向量进行注意力处理,或者,通过注意力层对该词语的词向量和与该词语相邻的至少一个词语的词向量进行注意力处理,确定该词语的处理结果。之后,将各个词语的处理结果进行拼接,得到注意力处理结果。

可选地,将词语的词向量作为待处理向量,或者,将词语的词向量和与该词语相邻的至少一个词语的词向量拼接得到待处理向量。通过注意力层对待处理向量进行不同权重的映射,得到查询向量、键向量和值向量,基于查询向量、键向量和值向量,确定词语的处理结果。

可以理解的是,第二编码器可以包括至少一个编码块,第一个编码块的输入为第二拼接信息的特征向量,第二编码器中除第一个编码块之外的任一个编码块的输入为上一个编码块的输出,最后一个编码块的输出为第二编码结果。一个编码块包括卷积层、注意力层、前馈层、激活层、全连接层、规范化层等中的至少一项。

可选地,一个编码块包括注意力层和前馈层。注意力层用于基于注意力机制,对编码块的输入进行注意力处理,得到注意力处理结果。前馈层用于对注意力处理结果进行线性映射和非线性映射中的至少一项,得到编码块的输出。其中,上文已描述了注意力层和前馈层的处理方式,在此不再赘述。

第二编码结果描述问题信息的语义和第一提示信息的语义,是将问题信息和第一提示信息作为一个整体,描述整体在全局角度的语义,使得第二编码结果的表征能力更强,有利于提高第一品牌信息的准确性。

步骤2013,通过第二解码器对第二编码结果进行语义解码,得到第三解码结果,通过第二编码结果对第三解码结果进行校正,得到第四解码结果,基于第四解码结果确定第一品牌信息,第三解码结果表征从问题信息中提取的与第一提示信息语义相关的第三内容的语义,第四解码结果表征第三内容中与问题信息和第一提示信息语义相关的第四内容的语义。

本申请实施例中,电子设备获取第二解码器,并将第二编码结果输入第二解码器,通过第二解码器对第二编码结果进行解码,得到第一品牌信息。本申请实施例不对第二解码器的结构、大小、类型等做限定。

示例性地,第二解码器包括第一注意力层、第二注意力层和前馈层。第一注意力层用于基于注意力机制,对第二编码结果进行注意力处理得到第三解码结果。第二注意力层用于基于注意力机制,对第二编码结果和第三解码结果进行注意力处理得到第四解码结果。前馈层用于对第四解码结果进行线性映射或者非线性映射,得到第一品牌信息的特征向量。第一品牌信息的特征向量包括第一品牌信息中各个词语的词向量,可以将第一品牌信息中各个词语的词向量映射为对应的词语,得到第一品牌信息。

对于第一注意力层,第二编码结果包括问题信息的第二编码特征和第一提示信息的第二编码特征。其中,问题信息的第二编码特征包括问题信息中各个词语的第二编码特征,第一提示信息的第二编码特征包括第一提示信息中各个词语的第二编码特征。对于问题信息中的任一个词语,通过第一注意力层基于第一提示信息的第二编码特征,对该词语的第二编码特征进行注意力处理,得到该词语的第三解码特征。之后,将问题信息中各个词语的第三解码特征进行拼接,得到第三解码结果。

可选地,通过第一注意力层对第一提示信息的第二编码特征进行不同权重的映射,得到值向量和键向量,通过第一注意力层对问题信息中的任一个词语的第二编码特征进行映射,得到查询向量,基于查询向量、键向量和值向量,确定词语的第三解码特征。词语的第三解码特征用于表征词语的语义以及词语与第一提示信息的相关性。

通过第一提示信息的第二编码特征,对问题信息中词语的第二编码特征进行注意力处理,实现了确定问题信息中的词语与第一提示信息的相关性,使得问题信息中与第一提示信息相关性高的词语的权重增大,与第一提示信息相关性低的词语的权重减少,从而可以确定问题信息中的词语是否可以作为第三内容的词语。通过增大第三内容的词语的权重,抑制非第三内容的词语的权重,使得第三解码结果可以表征第三内容的语义。

对于第二注意力层,通过第二注意力层基于第二编码结果,对问题信息中任一个词语的第三解码特征进行注意力处理,得到该词语的第四解码特征。之后,将问题信息中各个词语的第四解码特征进行拼接,得到第四解码结果。

可选地,通过第二注意力层对第二编码结果进行不同权重的映射,得到值向量和键向量,通过第二注意力层对问题信息中的任一个词语的第三解码特征进行映射,得到查询向量,基于查询向量、键向量和值向量,确定词语的第四解码特征。

通过第二编码结果,对问题信息中词语的第三解码特征进行注意力处理,实现了确定问题信息中的词语与第一提示信息、问题信息的相关性,实现了在确定问题信息中的词语与第一提示信息的相关性的基础上,确定词语与第一提示信息、问题信息的相关性。相当于在增大第三内容的词语的权重,抑制非第三内容的词语的权重的基础上,进一步增大第三内容中与第一提示信息、问题信息相关性高的词语的权重,从而可以确定问题信息中的词语是否可以作为第四内容的词语。通过增大第四内容的词语的权重,抑制非第四内容的词语的权重,使得第四解码结果可以表征对第三内容进行校正之后得到的第四内容的语义。

可以理解的是,第二解码器可以包括至少一个解码块,第一个解码块的输入包括第二编码结果,第二解码器中除第一个解码块之外的任一个解码块的输入包括上一个解码块的输出,最后一个解码块的输出为第一品牌信息的特征向量。任一个解码块包括卷积层、注意力层、前馈层、激活层、全连接层、规范化层等中的至少一项。

可选地,一个解码块包括两个注意力层和前馈层。第一个注意力层用于基于注意力机制,对解码块的输入进行注意力处理得到第一处理结果。第二个注意力层用于基于注意力机制,对第二编码结果和第一处理结果进行注意力处理得到第二处理结果。前馈层用于对第二处理结果进行线性映射或者非线性映射,得到解码块的输出。其中,上文已描述了两个注意力层和前馈层的处理原理,在此不再赘述。

在一种可能的实现方式中,电子设备获取第二问答模型,并将第二拼接信息的特征向量输入第二问答模型。第二问答模型是拥有超过设定数量的模型参数的大模型,该设定数量可以为几千万或者几亿。第二问答模型包括第二编码器和第二解码器。本申请实施例不对第二问答模型的结构、大小、类型等做限定,示例性地,第二问答模型的基础架构为对话开源大模型,大模型的结构如图3所示。

大模型包括编码器(对应第二编码器)和解码器(对应第二解码器)。可以将特征向量输入编码器,通过编码器进行编码,得到编码结果。例如,在图3中,特征向量包括向量1至向量4。通过编码器进行编码,得到包括向量5至向量6的编码结果。可以基于编码结果确定输入解码器的特征向量,通过解码器进行解码,得到解码结果。例如,在图3中,特征向量包括向量A至向量C。通过解码器进行解码,得到包括向量a至向量c的解码结果。

步骤202,基于第一品牌信息,从品牌知识库中检索出参考知识文档,品牌知识库包括多个品牌知识文档,参考知识文档是多个品牌知识文档中与第一品牌信息匹配的第二品牌信息的知识文档。

本申请实施例中,电子设备可以构建品牌知识库,品牌知识库包括多个品牌知识文档。一个品牌知识文档是一个品牌信息的知识文档。品牌信息可以包括品牌名称、品牌图案等,品牌信息对应的品牌知识文档包括但不限于该品牌信息的产生时间、产生地区、发展过程、所属行业、产品信息等至少一项。可选地,品牌知识文档为文本文档,包括多个字符,例如,品牌知识文档包括100至1000个字符。

可以理解的是,品牌知识库除包括多个品牌知识文档之外,还可以包括其他信息。示例性地,品牌知识库包括多个品牌信息和各个品牌信息对应的品牌知识文档。其中,一个品牌信息和对应的品牌知识文档如下所示。

品牌名称(即品牌信息):XXXXX。

品牌知识文档:XXXXX是AA公司旗下的奶瓶品牌,由V设计师所创立。XXXXX奶瓶采用P材质,通过N技术实现吸奶、储存、喂养等功能……XXXXX于M年进入地区N,由L公司进行代理。

电子设备可以在品牌知识库中对第一品牌信息进行检索,以从品牌知识库包括的各个品牌知识文档中检索出参考知识文档。本申请实施例不对检索方式做限定。

可选地,品牌知识库包括多个品牌信息和各个品牌信息对应的品牌知识文档。在一种可能的实现方式中,电子设备计算第一品牌信息与各个品牌信息之间的距离,其中,距离的计算方式在此不做限定。例如,可以计算第一品牌信息与各个品牌信息之间的编辑距离,或者,可以计算第一品牌信息与各个品牌信息之间的特征距离等。对于任一个品牌信息,如果第一品牌信息与该品牌信息之间的距离小于距离阈值,则将该品牌信息作为与第一品牌信息匹配的第二品牌信息,并将第二品牌信息对应的品牌知识文档作为参考知识文档。其中,距离阈值可以是设定值,或者,对第一品牌信息与各个品牌信息之间的距离进行排序后的第设定数量个距离。

可以理解的是,在计算第一品牌信息与各个品牌信息之间的特征距离时,需要对第一品牌信息进行特征提取,得到第一品牌特征,并对各个品牌信息进行特征提取,得到各个品牌特征。其中,特征提取的方式可以见步骤2021的描述,在此暂不赘述。接着,对于任一个品牌特征,计算第一品牌特征和该品牌特征之间的余弦距离、欧式距离、曼哈顿距离等至少一项距离。如果为一项距离,则可以将该项距离作为第一品牌信息与该品牌信息之间的特征距离;如果为至少一项距离,则可以对至少一项距离进行加权计算,得到第一品牌信息与各个品牌信息之间的特征距离。

在一种可能的实现方式中,步骤202包括步骤2021至步骤2024(图中未示出)。

步骤2021,对第一品牌信息进行特征提取,得到第一品牌特征。

本申请实施例中,可以基于任意的特征提取算法,对第一品牌信息进行特征提取,得到第一品牌特征。例如,在第一品牌信息为图像时,可以基于方向梯度直方图(Histogramof Oriented Gradient,HOG)算法、尺度不变特征转换(Scale-Invariant FeatureTransform,SIFT)算法等,对第一品牌信息进行特征提取。在第一品牌信息为文本时,可以基于词频-逆文本频率(Term Frequency–Inverse Document Frequency,TF-IDF)算法,对第一品牌信息进行特征提取。

在一种可能的实现方式中,电子设备可以获取训练好的特征提取模型,通过特征提取模型对第一品牌信息进行特征提取,得到第一品牌特征。本申请实施例不对特征提取模型的结构、大小、类型等做限定,示例性地,特征提取模型为基于变压器的双向编码器表示(Bidirectional Encoder Representations from Transformers,BERT)模型或者BERT-WWM(Whole Word Masking,整词掩码)模型。

其中,在对BERT模型进行训练时,需要对文本进行分词,把一个完整的词切分成若干个子词,这些子词会随机地被掩码(Mask)。例如,将一个词语切分为四个字,其中两个字被随机掩码。与BERT有所不同的是,在对BERT-WWM模型进行训练时,采用整词掩码,也就是说,如果一个词的部分子词被掩码,则同属该词的其他子词也会被掩码。例如,将一个词语切分为四个字,如果其中两个字被随机掩码,则剩余两个字也会被掩码。也就是说,这四个字均会被掩码。BERT-WWM模型的训练方式会使得任务学习更加困难,但也使得BERT-WWM模型能够更加深入地学习到语义特性,提取出表征能力更强、泛化能力更强的语义特征。

BERT模型和BERT-WWM模型的结构相类似,下面以特征提取模型是BERT-WWM模型为例,阐述对第一品牌信息进行特征提取的过程。可以理解的是,下文描述的特征提取过程也适用于特征提取模型是BERT模型的情况。

本申请实施例中,第一品牌信息为品牌文本或者可以转化为品牌文本,品牌文本包括多个字符。可以理解的是,品牌文本包括多个文本,不同文本之间可以添加分隔字符SEP,也可以不添加分隔字符SEP,第一个品牌文本之前添加开始字符CLS。例如,在图4中,品牌文本包括文本1至文本3,文本1之前添加开始字符CLS,文本2和文本3之间添加分隔字符SEP,文本1包括字符1至字符a,文本2包括字符1至字符b,文本3包括字符1至字符c。

可以将品牌文本中的各个字符转化为对应的字向量,得到第一向量。例如,将开始字符CLS转化为对应的字向量E

将第一向量输入BERT-WWM模型,BERT-WWM模型包括多个神经元,这些神经元形成至少一个网络层,例如,在图4中,这些神经元形成两个网络层。任一个网络层中的一个神经元与相邻网络层中的至少一个神经元连接。通过各个网络层对第一向量不断地进行特征提取,得到第二向量。第二向量包括第一向量中各个字向量经过特征提取之后得到的字向量。例如,第二向量包括字向量E

基于BERT-WWM模型对第一品牌信息进行特征提取,得到的第一品牌特征具有更强大的语义表征能力和泛化能力。由于第一品牌特征具有强大的语义表征能力和泛化能力,因此,对于第一品牌信息存在错误的情况,例如,由于问题信息中携带拼写错误的品牌信息或由于提取误差等原因,导致从问题信息中提取出错误的第一品牌信息,仍能够基于第一品牌特征从品牌知识库中检索出与该第一品牌特征语义相近的第二品牌特征,提高检索成功率。此外,对于品牌知识库中存在与第一品牌信息相似的多个品牌信息的情况,也能基于第一品牌特征从品牌知识库中检索出相似的各个品牌信息所对应的第二品牌特征,提高检索的相关性。也就是说,对于品牌信息存在细微差异的情况,由于第一品牌特征具有强大的语义表征能力和泛化能力,使得可以从品牌知识库中检索出相同或相似的各个品牌信息,以进一步识别相同品牌信息、相似品牌信息,提高品牌匹配结果的准确性。

可选地,第一品牌特征是通过特征提取模型对第一品牌信息进行特征提取得到的特征。这种情况下,该方法还包括步骤A1至步骤A3(图中未示出)。其中,步骤A1至步骤A3在步骤2021之前执行。

步骤A1,获取样本三元组,样本三元组包括样本品牌信息、与样本品牌信息的相似度大于设定值的相似品牌信息以及与样本品牌信息的相似度不大于设定值的不相似品牌信息。

本申请实施例中,电子设备可以获取训练数据集,训练数据集包括多个训练品牌信息。训练数据集的获取方式在此不做限定,例如,电子设备可以获取用户输入的训练数据集,或者,电子设备可以从其他设备中读取训练数据集。

可以采集人工标注的方式对训练数据集进行标注。对于训练数据集中的任两个训练品牌信息,根据人工经验确定这两个训练品牌信息的相似度。如果相似度大于设定值,则将这两个训练品牌信息分别作为样本品牌信息和相似品牌信息。如果相似度不大于设定值,则将这两个训练品牌信息分别作为样本品牌信息和不相似品牌信息。通过这种方式,对训练数据集中的每两个训练品牌信息进行标注,基于标注结果可以确定出多个样本三元组。

可选地,可以采用自然语言推理(Natural Language Inference,NLI)的方式,对训练数据集进行标注。NLI是一种判断两个句子或者两个词语之间的语义关系的方式,可以视作三分类任务,分类结果包括矛盾、中立和相近。本申请实施例中,可以获取训练好的分类模型。将任两个训练品牌信息输入分类模型,通过分类模型确定这两个训练品牌信息的语义特征。将这两个语义特征进行融合得到目标特征,通过目标特征表征这两个语义特征之间的相似程度。之后,将目标特征映射为相似概率,该相似概率就是这两个训练品牌信息之间的相似度。如果相似概率小于第一概率,则确定分类结果为矛盾,表征两个训练品牌信息的语义不相似;如果相似概率不小于第一概率且小于第二概率(第二概率大于第一概率),则确定分类结果为中立,表明两个训练品牌信息的语义介于相似与不相似之间;如果相似概率大于第二概率,则确定分类结果为相近,表明两个训练品牌信息的语义相似。通过这种方式,确定训练数据集中的每两个训练品牌信息之间的语义相似结果。

可选地,如果两个训练品牌信息的语义相似,则可以将这两个训练品牌信息分别作为样本品牌信息和相似品牌信息。如果两个训练品牌信息的语义不相似,则可以将这两个训练品牌信息分别作为样本品牌信息和不相似品牌信息。如果两个训练品牌信息的语义介于相似与不相似之间,则可以将这两个训练品牌信息分别作为样本品牌信息和相似品牌信息(这种情况下,设定值为第一概率),或者,将这两个训练品牌信息分别作为样本品牌信息和不相似品牌信息(这种情况下,设定值为第二概率)。通过这种方式,确定出多个样本三元组。

一个样本三元组可以表示为{(Xa,Xp,Xn)}。Xa为样本品牌信息,也可以称为锚样本。Xp为与Xa的相似度大于设定值的相似品牌信息,也可以称为相似样本。Xn与Xa的相似度不大于设定值的不相似品牌信息,也可以称为不相似样本。

步骤A2,通过第一网络模型对样本三元组进行特征提取,得到样本品牌特征、相似品牌特征和不相似品牌特征。

本申请实施例中,第一网络模型和特征提取模型的结构相类似,因此,通过第一网络模型对样本品牌信息进行特征提取得到样本品牌特征的方式、通过第一网络模型对相似品牌信息进行特征提取得到相似品牌特征的方式、通过第一网络模型对不相似品牌信息进行特征提取得到不相似品牌特征的方式,与通过特征提取模型对第一品牌信息进行特征提取得到第一品牌特征的方式相类似,在此不再赘述。

步骤A3,基于样本品牌特征、相似品牌特征和不相似品牌特征,对第一网络模型进行训练,得到特征提取模型。

本申请实施例中,可以基于样本品牌特征、相似品牌特征和不相似品牌特征,确定第一网络模型的损失。基于第一网络模型的损失,对第一网络模型进行一次训练,得到训练后的第一网络模型。

如果训练后的第一网络模型满足训练结束条件,则将训练后的第一网络模型作为特征提取模型。如果训练后的第一网络模型不满足训练结束条件,则将训练后的第一网络模型作为下一次训练的第一网络模型,并按照步骤A1至步骤A3的实现原理,对第一网络模型进行下一次训练,直至训练后的第一网络模型满足训练结束条件,将训练后的第一网络模型作为特征提取模型为止。

本申请实施例不对训练后的第一网络模型满足训练结束条件做限定。示例性地,如果训练后的第一网络模型的训练次数达到设定次数,则确定训练后的第一网络模型满足训练结束条件。或者,如果训练后的第一网络模型的准确性达到设定值,则确定训练后的第一网络模型满足训练结束条件。

可选地,步骤A3包括:计算样本品牌特征和相似品牌特征之间的第一特征距离;计算样本品牌特征和不相似品牌特征之间的第二特征距离;基于第一特征距离和第二特征距离之间的差值,对第一网络模型进行训练,得到特征提取模型。

本申请实施例中,可以计算样本品牌特征和相似品牌特征之间的点积、余弦距离、欧式距离、曼哈顿距离等至少一项距离。如果为一项距离,则可以将该项距离作为第一特征距离;如果为至少一项距离,则可以对至少一项距离进行加权计算,得到第一特征距离。相类似地,可以计算样本品牌特征和不相似品牌特征之间的点积、余弦距离、欧式距离、曼哈顿距离等至少一项距离。如果为一项距离,则可以将该项距离作为第二特征距离;如果为至少一项距离,则可以对至少一项距离进行加权计算,得到第二特征距离。

将第一特征距离减去第二特征距离,得到差值,基于差值确定第一网络模型的损失,例如,将差值加上一个超参数,或者,对差值进行加权,得到第一网络模型的损失。

可以理解的是,样本三元组可以为多个,每一个样本三元组对应一个第一特征距离和一个第二特征距离。对于任一个样本三元组,将该样本三元组对应的第一特征距离减去该样本三元组对应的第二特征距离,得到该样本三元组对应的差值。基于各个样本三元组对应的差值,确定第一网络模型的损失。可选地,第一网络模型的损失如下公式(1)所示。

其中,J表征第一网络模型的损失。D为欧式距离的符号。m表征样本三元组的数量。ia表征第i个样本三元组中的样本品牌信息,ip表征第i个样本三元组中的相似品牌信息,in表征第i样本三元组中的不相似品牌信息。

接着,通过第一网络模型的损失对第一网络模型进行训练,得到特征提取模型,训练过程已在上文描述,在此不再赘述。第一网络模型的训练方式属于对比学习的方式,通过对比学习,拉近相似样本之间的距离,推远不相似样本之间的距离,提高特征提取模型的泛化能力,使得通过特征提取模型提取出的第一品牌特征具有表征能力强和泛化能力强的特点。

步骤2022,基于第一品牌特征和品牌知识库,构建品牌检索池,品牌知识库还包括各个品牌知识文档对应的品牌特征,品牌检索池包括各个品牌特征中的部分品牌特征。

本申请实施例中,品牌知识库包括各个品牌知识文档对应的品牌信息。可以通过特征提取网络对各个品牌信息进行特征提取,得到各个品牌特征,特征提取的方式已在上文描述,在此不再赘述。

可选地,各个品牌信息的格式存在差异。例如,部分品牌信息为语言A,部分品牌信息为语言B,部分品牌信息包括繁体字,部分品牌信息包括简体字,部分品牌信息为字体A,部分品牌信息为字体B,部分品牌信息的字符数超过指定字符数(例如,指定字符数为20)等。为了便于通过特征提取网络对各个品牌信息进行特征提取,可以对各个品牌信息进行预处理,得到预处理后的各个品牌信息,预处理后的品牌信息是指定语言、指定字形、指定字体、字符数不超过指定字符数等的品牌信息,实现将不同格式的品牌信息转化为同一格式的品牌信息。将预处理后的各个品牌信息输入特征提取网络,通过特征提取网络对预处理后的各个品牌信息进行特征提取,得到各个品牌特征。可选地,品牌特征以数组的形式呈现。

可以将品牌信息、品牌特征以及品牌知识文档之间的对应关系存储在品牌知识库中。例如,将品牌名称(即品牌信息)、品牌名称的语义特征(即品牌特征)以及品牌知识文档所属文档的标识(Identity Document,ID)三者的对应关系存储在品牌知识库中。

可以在品牌知识库的基础上,构建第一品牌特征对应的品牌检索池,品牌检索池中包括品牌知识库包括的各个品牌特征中的部分品牌特征。例如,品牌知识库包括十万个品牌特征,而品牌检索池可以仅包括一千个品牌特征。本申请实施例不对品牌检索池的构建方式做限定。可选地,品牌检索池存储在内存中。

示例性地,一个品牌特征对应所属行业、所属地区、产生时间等。品牌检索池包括的任一个品牌特征是从品牌知识库中提取出的,且与第一品牌特征之间存在语义相关或所属行业相关或产生时间相关或发展过程相关或者所属地区相关等。

在一种可能的实现方式中,步骤2022包括步骤B1至步骤B4(图中未示出)。

步骤B1,对各个品牌特征进行聚类,得到多个聚类簇,聚类簇包括至少一个品牌特征。

本申请实施例中,可以配置聚类簇的数量为M。采用K均值(K-means)、模糊C均值(Fuzzy C-means,FCM)等任意的聚类算法,将各个品牌特征聚类成M个聚类簇,每一个聚类簇包括至少一个品牌特征,聚类过程在此不再赘述。

步骤B2,对于任一个聚类簇,基于任一个聚类簇包括的各个品牌特征,确定任一个聚类簇的特征。

可选地,将一个聚类簇包括的各个品牌特征之和,除以该聚类簇包括的品牌特征的数量,即计算该聚类簇包括的各个品牌特征的平均值,得到该聚类簇的特征,通过聚类簇的特征来描述聚类簇中各个品牌信息共有的全局信息。也就是说,聚类簇的特征可以表征聚类簇中的各个品牌信息。

步骤B3,基于第一品牌特征和各个聚类簇的特征之间的距离,从多个聚类簇中确定参考聚类簇。

本申请实施例中,对于任一个聚类簇,可以计算第一品牌特征和该聚类簇的特征之间的语义特征、内积、欧式距离、曼哈顿距离等至少一项距离。如果为一项距离,则可以将该项距离作为第一品牌特征和该聚类簇的特征之间的距离;如果为至少一项距离,则可以对至少一项距离进行加权计算,得到第一品牌特征和该聚类簇的特征之间的距离。如果距离小于参考距离,说明第一品牌信息和聚类簇包括的各个品牌信息之间存在语义相近,可以将聚类簇作为参考聚类簇。可以理解的是,参考聚类簇的数量为至少一个。

本申请实施例不对参考距离做限定。示例性地,参考距离是设定距离,或者,参考距离是对第一品牌特征和各个聚类簇的特征之间的距离进行排序后的第参考数量个距离。

步骤B4,将参考聚类簇包括的各个品牌特征确定为品牌检索池包括的各个品牌特征。

示例性地,参考聚类簇为两个,每个参考聚类簇包括50个品牌特征,则品牌检索池包括50×2=100个品牌特征。

步骤2023,基于第一品牌特征,从品牌检索池中检索出第二品牌特征,第二品牌特征是对第二品牌信息进行特征提取得到的特征。

本申请实施例中,可以从品牌检索池包括的各个品牌特征中,检索出至少一个与第一品牌特征匹配的第二品牌特征,第二品牌特征可以描述第二品牌信息的语义,第二品牌信息是与第一品牌信息语义相近的品牌信息。

可选地,步骤2023包括步骤C1至步骤C3(图中未示出)。

步骤C1,对于品牌检索池中的任一个品牌特征,如果第一品牌特征和任一个品牌特征之间的距离小于距离阈值,则将任一个品牌特征确定为目标品牌特征。

可以计算第一品牌特征和品牌检索池中任一个品牌特征之间的语义特征、内积、欧式距离、曼哈顿距离等至少一项距离。如果为一项距离,则可以将该项距离作为第一品牌特征和该品牌特征之间的距离;如果为至少一项距离,则可以对至少一项距离进行加权计算,得到第一品牌特征和该品牌特征之间的距离。如果距离小于距离阈值,说明第一品牌特征和该品牌特征语义相近,可以将该品牌特征作为目标品牌特征。可以理解的是,目标品牌特征可以为至少一个。

本申请实施例不对距离阈值做限定。示例性地,距离阈值是设定距离,或者,距离阈值是对第一品牌特征和品牌检索池中各个品牌特征之间的距离进行排序后的第参考数量个距离。

步骤C2,如果目标品牌特征为至少一个,则从至少一个目标品牌特征中确定第二品牌特征。

如果目标品牌特征为一个,则电子设备将该目标品牌特征作为第二品牌特征。如果目标品牌特征为至少两个,则电子设备可以将各个目标品牌特征作为各个第二品牌特征,或者,电子设备可以从各个目标品牌特征中随机选择至少一个第二品牌特征。

可选地,目标品牌特征为至少两个,步骤C2包括:基于至少两个目标品牌特征生成第三提示信息,第三提示信息用于提示从至少两个目标品牌特征中选择一个目标品牌特征;获取针对第三提示信息的选择操作,将选择操作选中的目标品牌特征确定为第二品牌特征。

本申请实施例中,电子设备生成用于提示从至少两个目标品牌特征中选择一个目标品牌特征的第三提示信息,通过显示页面显示第三提示信息和各个目标品牌特征对应的目标品牌信息。例如,通过显示页面显示三个品牌信息和第三提示信息“请从以上品牌信息中选择一个”。用户可以在显示页面上从各个目标品牌信息中选择一个目标品牌信息,电子设备将选中的目标品牌信息对应的目标品牌特征作为第二品牌特征。

步骤C3,如果不存在目标品牌特征,则生成第二提示信息,第二提示信息用于提示未能确定问题信息的答案信息。

电子设备在生成第二提示信息之后,可以通过显示页面显示第二提示信息,第二提示信息可以是文本形式或音频形式或者图片形式,例如,第二提示信息为:未查询到问题答案。

综合步骤C2和步骤C3可知,基于第一品牌特征从品牌检索池中未检索出目标品牌特征或者检索出至少一个目标品牌特征。可以创建检索接口,通过库函数实现调用检索接口,可以人工配置第一品牌特征和检索召回的数据量(即最大检索数量),检索结果如下表1所示。

表1

步骤2024,从品牌知识库中确定第二品牌特征对应的参考知识文档。

由于品牌知识库中包括各个品牌特征和对应的品牌知识文档,而第二品牌特征是各个品牌特征中的至少一个。因此,电子设备可以从品牌知识库中提取各个第二品牌特征对应的品牌知识文档,得到参考知识文档。参考知识文档为至少一个。

可选地,如果品牌知识库包括的品牌特征的数量小于设定数量,可以无需构建品牌检索池。也就是说,可以直接基于第一品牌特征在品牌知识库中检索出第二品牌特征,并确定第二品牌特征对应的参考知识文档。如果品牌知识库包括的品牌特征的数量不小于设定数量,则可以构建品牌检索池,基于第一品牌特征在品牌检索池中检索出第二品牌特征,并确定第二品牌特征对应的参考知识文档。通过构建品牌检索池,降低了待检索的数据量,提高了检索速度。

请参见图5,图5是本申请实施例提供的一种知识文档的检索流程图。

一方面,电子设备可以进行品牌知识库构建。即,先获取多个品牌信息,以品牌信息是品牌名称为例,将多个品牌名称转化为各个品牌特征。接着,对各个品牌特征进行聚类得到多个聚类簇,并基于各个聚类簇包括的品牌特征确定各个聚类簇的特征。

另一方面,当电子设备获取到问题信息时,可以从问题信息中提取第一品牌信息,并基于第一品牌信息进行第一品牌特征构建。以第一品牌信息是第一品牌名称为例,将第一品牌名称转化为第一品牌特征。接着,电子设备针对第一品牌特征发起检索服务。

电子设备可以根据第一品牌特征和各个聚类簇的特征构建品牌检索池,在品牌检索池中对第一品牌特征进行检索,得到第二品牌特征,并从品牌知识库中确定第二品牌特征对应的参考知识文档,以此实现基于品牌检索池确定参考知识文档。

步骤203,通过第一编码器对问题信息和参考知识文档进行语义编码,得到第一编码结果,第一编码结果用于描述参考知识文档的语义与问题信息的语义。

本申请实施例中,可以将文本形式的问题信息或者转化为文本形式的问题信息,与参考知识文档进行拼接,得到第一拼接信息,通过这种方式,将问题信息格式化为提示(Prompt)。示例性地,第一拼接信息如下所示。

“XXXXX奶瓶是哪个地区的品牌?有什么特点?

XXXXX是AA公司旗下的奶瓶品牌,由V设计师所创立。XXXXX奶瓶采用P材质,通过N技术实现吸奶、储存、喂养等功能……XXXXX于M年进入地区N,由L公司进行代理。”

可以将第一拼接信息中的各个词语映射为对应的词向量,得到第一拼接信息的特征向量。接着,电子设备获取第一编码器,并将第一拼接信息的特征向量输入第一编码器,通过第一编码器对第一拼接信息的特征向量进行语义编码,得到第一编码结果,第一编码结果表征第一拼接信息的语义。由于第一拼接信息包括问题信息和参考知识文档,因此,第一编码结果可以表征问题信息的语义和参考知识文档的语义。本申请实施例不对第一编码器的结构、大小、类型等做限定。

示例性地,第一编码器和第二编码器的结构相类似,第一编码器包括注意力层和前馈层。注意力层用于基于注意力机制,对第一拼接信息的特征向量进行注意力处理,得到注意力处理结果。前馈层用于对注意力处理结果进行线性映射和非线性映射中的至少一项,得到第一编码结果。

其中,对于第一拼接信息的特征向量中任一个词语的词向量,通过注意力层对该词语的词向量进行注意力处理,或者,通过注意力层对该词语的词向量和与该词语相邻的至少一个词语的词向量进行注意力处理,确定该词语的处理结果。之后,将各个词语的处理结果进行拼接,得到注意力处理结果。

可选地,将词语的词向量作为待处理向量,或者,将词语的词向量和与该词语相邻的至少一个词语的词向量拼接得到待处理向量。通过注意力层对待处理向量进行不同权重的映射,得到查询向量、键向量和值向量,基于查询向量、键向量和值向量,确定词语的处理结果。

可以理解的是,第一编码器可以包括至少一个编码块,第一个编码块的输入为第一拼接信息的特征向量,第一编码器中除第一个编码块之外的任一个编码块的输入为上一个编码块的输出,最后一个编码块的输出为第一编码结果。任一个编码块包括卷积层、注意力层、前馈层、激活层、全连接层、规范化层等中的至少一项。

可选地,一个编码块包括注意力层和前馈层。注意力层用于基于注意力机制,对编码块的输入进行注意力处理得到注意力处理结果。前馈层用于对注意力处理结果进行线性映射和非线性映射中的至少一项,得到编码块的输出。

第一编码结果描述参考知识文档的语义与问题信息的语义,是将问题信息和参加知识文档作为一个整体,描述整体在全局角度的语义,使得第一编码结果的表征能力更强,有利于提高第一答案信息的准确性。

步骤204,通过第一解码器对第一编码结果进行语义解码,得到第一解码结果,通过第一编码结果对第一解码结果进行校正,得到第二解码结果,基于第二解码结果确定问题信息的第一答案信息,第一解码结果表征从参考知识文档中提取的与问题信息语义相关的第一内容的语义,第二解码结果表征第一内容中与问题信息和参考知识文档语义相关的第二内容的语义。

本申请实施例中,电子设备获取第一解码器,并将第一编码结果输入第一解码器,通过第一解码器对第一编码结果进行解码,得到第一答案信息。本申请实施例不对第一解码器的结构、大小、类型等做限定。

示例性地,第一解码器和第二解码器的结构类似,第一解码器包括第一注意力层、第二注意力层和前馈层。第一注意力层用于基于注意力机制,对第一编码结果进行注意力处理得到第一解码结果。第二注意力层用于基于注意力机制,对第一编码结果和第一解码结果进行注意力处理得到第二解码结果。前馈层用于对第二解码结果进行线性映射和非线性映射中的至少一项,得到第一答案信息的特征向量。第一答案信息的特征向量包括第一答案信息中各个词语的词向量,可以将第一答案信息中各个词语的词向量映射为对应的词语,得到第一答案信息。

对于第一注意力层,第一编码结果包括问题信息的第一编码特征和参考知识文档的第一编码特征。其中,问题信息的第一编码特征包括问题信息中各个词语的第一编码特征,参考知识文档的第一编码特征包括参考知识文档中各个词语的第一编码特征。对于参考知识文档中的任一个词语,通过第一注意力层基于问题信息的第一编码特征,对该词语的第一编码特征进行注意力处理,得到该词语的第一解码特征。之后,将参考知识文档中各个词语的第一解码特征进行拼接,得到第一解码结果。

可选地,通过第一注意力层对问题信息的第一编码特征进行不同权重的映射,得到值向量和键向量,通过第一注意力层对参考知识文档中的任一个词语的第一编码特征进行映射,得到查询向量,基于查询向量、键向量和值向量,确定词语的第一解码特征。词语的第一解码特征用于表征词语的语义以及词语与问题信息的相关性。

通过问题信息的第一编码特征,对参考知识文档中词语的第一编码特征进行注意力处理,实现了确定参考知识文档中的词语与问题信息的相关性,使得参考知识文档中与问题信息相关性高的词语的权重增大,与问题信息相关性低的词语的权重减少,从而可以确定参考知识文档中的词语是否可以作为第一内容的词语。通过增大第一内容的词语的权重,抑制非第一内容的词语的权重,使得第一解码结果可以表征第一内容的语义。

对于第二注意力层,通过第二注意力层基于第一编码结果,对参考知识文档中任一个词语的第一解码特征进行注意力处理,得到该词语的第二解码特征。之后,将参考知识文档中各个词语的第二解码特征进行拼接,得到第二解码结果。

可选地,通过第二注意力层对第一编码结果进行不同权重的映射,得到值向量和键向量,通过第二注意力层对参考知识文档中的任一个词语的第一解码特征进行映射,得到查询向量,基于查询向量、键向量和值向量,确定词语的第二解码特征。

通过第一编码结果,对参考知识文档中词语的第一解码特征进行注意力处理,实现了确定参考知识文档中的词语与问题信息、参考知识文档的相关性,实现了在确定参考知识文档中的词语与问题信息的相关性的基础上,确定词语与问题信息、参考知识文档的相关性。相当于在增大第一内容的词语的权重,抑制非第一内容的词语的权重的基础上,进一步增大第一内容中与问题信息、参考知识文档相关性高的词语的权重,从而可以确定参考知识文档中的词语是否可以作为第二内容的词语。通过增大第二内容的词语的权重,抑制非第二内容的词语的权重,使得第二解码结果可以表征对第一内容进行校正之后得到的第二内容的语义。

可以理解的是,第一解码器可以包括至少一个解码块,第一个解码块的输入包括第一编码结果,第一解码器中除第一个解码块之外的任一个解码块的输入包括上一个解码块的输出,最后一个解码块的输出为第一答案信息的特征向量。任一个解码块包括卷积层、注意力层、前馈层、激活层、全连接层、规范化层等中的至少一项。

可选地,一个解码块包括两个注意力层和前馈层。第一个注意力层用于基于注意力机制,对解码块的输入进行注意力处理得到第一处理结果。第二个注意力层用于基于注意力机制,对第一编码结果和第一处理结果进行注意力处理得到第二处理结果。前馈层用于对第二处理结果进行线性映射或者非线性映射,得到解码块的输出。其中,上文已描述了两个注意力层和前馈层的处理原理,在此不再赘述。

在一种可能的实现方式中,电子设备获取第一问答模型,并将第一拼接信息的特征向量输入第一问答模型。第一问答模型是拥有超过设定数量的模型参数的大模型,该设定数量可以为几千万或者几亿。第一问答模型包括第一编码器和第一解码器。本申请实施例不对第一问答模型的结构、大小、类型等做限定,示例性地,第一问答模型的基础架构为对话开源大模型,大模型的结构如图3所示,在此不再赘述。

可选地,该方法还包括步骤D1至步骤D5(图中未示出)。其中,步骤D1至步骤D5在步骤201中“获取关于品牌的问题信息”之后执行。

步骤D1,如果未从问题信息中提取出第一品牌信息,则生成第四提示信息,第四提示信息用于提示输入品牌信息。

本申请实施例中,如果电子设备未从问题信息中提取出第一品牌信息,则电子设备生成用于提示输入品牌信息的第四提示信息,并通过显示页面显示第四提示信息。例如,通过显示页面显示第四提示信息“请输入品牌名称”。

步骤D2,获取基于第四提示信息输入的第三品牌信息。

用户可以在显示页面输入第三品牌信息,电子设备响应于该输入操作,获取输入的第三品牌信息。

步骤D3,基于第三品牌信息,从品牌知识库中检索出目标知识文档,目标知识文档是多个品牌知识文档中与第三品牌信息匹配的第四品牌信息的知识文档。

可以通过特征提取模型对第三品牌信息进行特征提取,得到第三品牌特征。其中,第三品牌特征的确定方式和第一品牌特征的确定方式相类似,在此不再赘述。

如果品牌知识库包括的品牌特征的数量小于设定数量,可以无需构建品牌检索池。也就是说,可以直接基于第三品牌特征在品牌知识库中检索出第四品牌特征,并确定第四品牌特征对应的目标知识文档。如果品牌知识库包括的品牌特征的数量不小于设定数量,则可以构建品牌检索池,基于第三品牌特征在品牌检索池中检索出第四品牌特征,并确定第四品牌特征对应的目标知识文档。可以理解的是,步骤D3的实现原理和步骤202的实现原理相类似,可以见步骤202的描述,在此不再赘述。

步骤D4,通过第一编码器对问题信息和目标知识文档进行编码,得到第三编码结果,第三编码结果用于描述从目标知识文档中提取出的与问题信息相关的内容。

可以理解的是,步骤D4的实现原理和步骤203的实现原理相类似,可以见步骤203的描述,在此不再赘述。

步骤D5,通过所述第一解码器对第三编码结果进行解码,得到问题信息的第二答案信息。

可以理解的是,步骤D5的实现原理和步骤204的实现原理相类似,可以见步骤204的描述,在此不再赘述。

请参见图6,图6是本申请实施例提供的另一种知识文档的检索流程图。本申请实施例中,电子设备可以获取问题信息,并基于大模型或者用户输入,确定问题信息涉及的品牌信息。其中,基于大模型确定的品牌信息对应上文提及的第一品牌信息,基于用户输入确定的品牌信息对应上文提及的第三品牌信息。

接着,电子设备针对品牌信息对品牌知识库进行检索,以在品牌知识库中检索出品牌信息对应的知识文档。其中,如果品牌信息对应第一品牌信息,则知识文档对应上文提及的参考知识文档,如果品牌信息对应第三品牌信息,则知识文档对应上文提及的目标知识文档。

之后,电子设备通过大模型基于问题信息和知识文档确定答案信息。其中,如果品牌信息对应第一品牌信息,知识文档对应参考知识文档,则答案信息对应上文提及的第一答案信息。如果品牌信息对应第三品牌信息,知识文档对应目标知识文档,则答案信息对应上文提及的第二答案信息。

需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准。例如,本申请中涉及到的问题信息、品牌信息等都是在充分授权的情况下获取的。

上述方法中,品牌知识库包括多个品牌知识文档,品牌知识文档暗含多种关系以及与品牌形成各种关系的尾实体,相较于构建或更新三元组来说,品牌知识文档的获取难度低,从而降低了品牌知识库的获取难度。通过从问题信息中提取第一品牌信息,再从品牌知识库中检索第一品牌信息对应的参考知识文档,实现了获取与第一品牌信息形成各种关系的尾实体。之后,通过对问题信息和参考知识文档进行编码和解码,得到第一答案信息,实现了无需对问题信息进行关系识别,而是在语义层面上理解问题信息和参考知识文档,实现从参考知识文档中提取出问题信息的答案信息,不仅避免了答非所问的现象,还能提高答案的灵活性,从而提高问答效果。

上述从方法步骤的角度阐述了本申请实施例的品牌知识问答方法,下面来系统全面的阐述该方法。请参见图7,图7是本申请实施例提供的又一种知识文档的检索流程图。

本申请实施例中,用户可以在显示界面上输入关于品牌的问题信息。电子设备接收到问题信息之后,通过大模型和品牌知识库基于图6所示的品牌知识问答方案,输出问题信息的答案信息,并在显示界面上显示答案信息,该品牌知识问答方案的内容在此不再赘述。

例如,用户输入问题信息为:“XXXXX奶瓶是哪个地区的品牌?有什么特点?”。

基于品牌知识库确定知识文档为:“XXXXX是AA公司旗下的奶瓶品牌,由V设计师所创立。XXXXX奶瓶采用P材质,通过N技术实现吸奶、储存、喂养等功能……XXXXX于M年进入地区N,由L公司进行代理。”。

通过大模型,基于问题信息和知识文档确定答案信息为:“XXXXX是地区A的品牌,XXXXX奶瓶采用P材质,通过N技术实现吸奶、储存、喂养等功能。”。

请参见图8,图8是本申请实施例提供的再一种品牌知识问答方法的流程图。以文本形式的问题信息为例,本申请实施例中,用户可以在显示界面上输入关于品牌的问题文本。

接着,电子设备通过大模型从问题文本中提取品牌名称,其中,大模型包括上文提及的第二编码器和第二解码器,提取方式在上文已描述,在此不再赘述。

如果电子设备通过大模型从问题文本中未能提取出品牌名称,即电子设备未获取到品牌名称,则电子设备生成用于提示用户输入品牌名称的提示信息(对应上文提及的第四提示信息)。电子设备通过显示页面显示提示信息,并在用户根据提示信息输入品牌名称之后,电子设备响应于该输入操作,获取品牌名称。

如果电子设备通过大模型从问题文本中提取出品牌名称,或者,电子设备接收到用户输入的品牌名称,也就是说,电子设备获取到品牌名称,则电子设备基于品牌名称在品牌知识库中检索知识文档。

如果电子设备基于品牌名称在品牌知识库中未能检索到知识文档,即电子设备未获取到知识文档,则电子设备生成用于提示未查询到问题文本的答案信息的提示信息,并在显示页面上显示该提示信息。

如果电子设备基于品牌名称在品牌知识库中检索到多个知识文档,则电子设备生成用于提示用户选择一个知识文档的提示信息(对应上文提及的第三提示信息)。电子设备通过显示页面显示提示信息和各个知识文档,并在用户根据提示信息选择一个知识文档之后,电子设备响应于该选择操作,获取知识文档。

可选地,各个知识文档对应各个品牌名称。这种情况下,提示信息可以用于提示用户选择一个知识文档对应的品牌名称。电子设备通过显示页面显示提示信息和各个品牌名称,并在用户根据提示信息选择一个品牌名称之后,电子设备响应于该选择操作,获取品牌名称对应的知识文档。

如果电子设备基于品牌名称在品牌知识库中检索到一个知识文档,或者,电子设备根据选择操作确定一个知识文档,则电子设备通过大模型基于知识文档和问题文本确定答案文本,并在显示界面显示答案文本。

本申请实施例的品牌知识问答方法具有如下所示的三个特点。

特点1:通过大模型和品牌知识库,针对有关品牌的任意问题,能够端到端的给出问题的答案信息。由于品牌知识库包括知识文档,获取难度低,且知识文档暗含品牌、多种关系以及与品牌形成各种关系的尾实体,内容丰富全面,因此,基于知识文档能够更准确地确定出答案信息,避免答非所问的现象,具有广阔的应用前景。

特点2:基于品牌名称在品牌知识库中检索知识文档时,可以先基于品牌知识库构建品牌检索池,再基于品牌检索池检索知识文档。通过构建品牌检索池,降低需要检索量,提高检索速度。经实验测试,相对于直接在品牌知识库中检索的方案,先构建品牌检索池再基于品牌检索池进行检索的方案可以提速百倍以上,且召回率损失保持在1%以下。

特点3:通过大模型基于问题信息和知识文档确定答案信息,实现了将知识文档作为问题信息的背景材料,通过大模型在语义层面上理解问题信息和知识文档,并从知识文档中提取答案信息,保证了问答的时效性和准确性。

图9所示为本申请实施例提供的一种品牌知识问答装置的结构示意图,如图9所示,该装置包括:

获取模块901,用于获取关于品牌的问题信息,从问题信息中提取第一品牌信息;

检索模块902,用于基于第一品牌信息,从品牌知识库中检索出参考知识文档,品牌知识库包括多个品牌知识文档,参考知识文档是多个品牌知识文档中与第一品牌信息匹配的第二品牌信息的知识文档;

编码模块903,用于通过第一编码器对问题信息和参考知识文档进行语义编码,得到第一编码结果,第一编码结果用于描述参考知识文档的语义与问题信息的语义;

解码模块904,用于通过第一解码器对第一编码结果进行语义解码,得到第一解码结果,通过第一编码结果对第一解码结果进行校正,得到第二解码结果,基于第二解码结果确定问题信息的第一答案信息,第一解码结果表征从参考知识文档中提取的与问题信息语义相关的第一内容的语义,第二解码结果表征第一内容中与问题信息和参考知识文档语义相关的第二内容的语义。

在一种可能的实现方式中,获取模块901,用于获取模块,用于获取第一提示信息,第一提示信息用于提示对问题信息中的品牌信息进行提取;通过第二编码器对问题信息和第一提示信息进行语义编码,得到第二编码结果,第二编码结果用于描述问题信息的语义和第一提示信息的语义;通过第二解码器对第二编码结果进行语义解码,得到第三解码结果,通过第二编码结果对第三解码结果进行校正,得到第四解码结果,基于第四解码结果确定第一品牌信息,第三解码结果表征从问题信息中提取的与第一提示信息语义相关的第三内容的语义,第四解码结果表征第三内容中与问题信息和第一提示信息语义相关的第四内容的语义。

在一种可能的实现方式中,检索模块902,用于对第一品牌信息进行特征提取,得到第一品牌特征;基于第一品牌特征和品牌知识库,构建品牌检索池,品牌知识库还包括各个品牌知识文档对应的品牌特征,品牌检索池包括各个品牌特征中的部分品牌特征;基于第一品牌特征,从品牌检索池中检索出第二品牌特征,第二品牌特征是对第二品牌信息进行特征提取得到的特征;从品牌知识库中确定第二品牌特征对应的参考知识文档。

在一种可能的实现方式中,第一品牌特征是通过特征提取模型对第一品牌信息进行特征提取得到的特征;

获取模块901,还用于获取样本三元组,样本三元组包括样本品牌信息、与样本品牌信息的相似度大于设定值的相似品牌信息以及与样本品牌信息的相似度不大于设定值的不相似品牌信息;

特征提取模块,用于通过第一网络模型对样本三元组进行特征提取,得到样本品牌特征、相似品牌特征和不相似品牌特征;

训练模块,用于基于样本品牌特征、相似品牌特征和不相似品牌特征,对第一网络模型进行训练,得到特征提取模型。

在一种可能的实现方式中,训练模块,用于计算样本品牌特征和相似品牌特征之间的第一特征距离;计算样本品牌特征和不相似品牌特征之间的第二特征距离;基于第一特征距离和第二特征距离之间的差值,对第一网络模型进行训练,得到特征提取模型。

在一种可能的实现方式中,检索模块902,用于对各个品牌特征进行聚类,得到多个聚类簇,聚类簇包括至少一个品牌特征;对于任一个聚类簇,基于任一个聚类簇包括的各个品牌特征,确定任一个聚类簇的特征;基于第一品牌特征和各个聚类簇的特征之间的距离,从多个聚类簇中确定参考聚类簇;将参考聚类簇包括的各个品牌特征确定为品牌检索池包括的各个品牌特征。

在一种可能的实现方式中,检索模块902,用于对于品牌检索池中的任一个品牌特征,如果第一品牌特征和任一个品牌特征之间的距离小于距离阈值,则将任一个品牌特征确定为目标品牌特征;如果目标品牌特征为至少一个,则从至少一个目标品牌特征中确定第二品牌特征;如果不存在目标品牌特征,则生成第二提示信息,第二提示信息用于提示未能确定问题信息的答案信息。

在一种可能的实现方式中,目标品牌特征为至少两个,检索模块902,用于基于至少两个目标品牌特征生成第三提示信息,第三提示信息用于提示从至少两个目标品牌特征中选择一个目标品牌特征;获取针对第三提示信息的选择操作,将选择操作选中的目标品牌特征确定为第二品牌特征。

在一种可能的实现方式中,装置还包括:

生成模块,用于如果未从问题信息中提取出第一品牌信息,则生成第四提示信息,第四提示信息用于提示输入品牌信息;

获取模块901,还用于获取基于第四提示信息输入的第三品牌信息;

检索模块902,还用于基于第三品牌信息,从品牌知识库中检索出目标知识文档,目标知识文档是多个品牌知识文档中与第三品牌信息匹配的第四品牌信息的知识文档;

编码模块903,还用于通过第一编码器对问题信息和目标知识文档进行编码,得到第三编码结果,第三编码结果用于描述从目标知识文档中提取出的与问题信息相关的内容;

解码模块904,还用于通过第一解码器对第三编码结果进行解码,得到问题信息的第二答案信息。

上述装置中,品牌知识库包括多个品牌知识文档,品牌知识文档暗含多种关系以及与品牌形成各种关系的尾实体,相较于构建或更新三元组来说,品牌知识文档的获取难度低,从而降低了品牌知识库的获取难度。通过从问题信息中提取第一品牌信息,再从品牌知识库中检索第一品牌信息对应的参考知识文档,实现了获取与第一品牌信息形成各种关系的尾实体。之后,通过对问题信息和参考知识文档进行编码和解码,得到第一答案信息,实现了无需对问题信息进行关系识别,而是在语义层面上理解问题信息和参考知识文档,实现从参考知识文档中提取出问题信息的答案信息,不仅避免了答非所问的现象,还能提高答案的灵活性,从而提高问答效果。

应理解的是,上述图9提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图10示出了本申请一个示例性实施例提供的终端设备1000的结构框图。该终端设备1000包括有:处理器1001和存储器1002。

处理器1001可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1001所执行以实现本申请中方法实施例提供的品牌知识问答方法。

在一些实施例中,终端设备1000还可选包括有:外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地,外围设备包括:射频电路1004、显示屏1005、摄像头组件1006、音频电路1007和电源1008中的至少一种。

外围设备接口1003可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中,处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上;在一些其他实施例中,处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。

射频电路1004用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1004包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1004还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。

显示屏1005用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时,显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时,显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1005可以为一个,设置在终端设备1000的前面板;在另一些实施例中,显示屏1005可以为至少两个,分别设置在终端设备1000的不同表面或呈折叠设计;在另一些实施例中,显示屏1005可以是柔性显示屏,设置在终端设备1000的弯曲表面上或折叠面上。甚至,显示屏1005还可以设置成非矩形的不规则图形,也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件1006用于采集图像或视频。可选地,摄像头组件1006包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。

音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1001进行处理,或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端设备1000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1007还可以包括耳机插孔。

电源1008用于为终端设备1000中的各个组件进行供电。电源1008可以是交流电、直流电、一次性电池或可充电电池。当电源1008包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中,终端设备1000还包括有一个或多个传感器1009。该一个或多个传感器1009包括但不限于:加速度传感器1011、陀螺仪传感器1012、压力传感器1013、光学传感器1014以及接近传感器1015。

加速度传感器1011可以检测以终端设备1000建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号,控制显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1012可以检测终端设备1000的机体方向及转动角度,陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端设备1000的3D动作。处理器1001根据陀螺仪传感器1012采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1013可以设置在终端设备1000的侧边框和/或显示屏1005的下层。当压力传感器1013设置在终端设备1000的侧边框时,可以检测用户对终端设备1000的握持信号,由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在显示屏1005的下层时,由处理器1001根据用户对显示屏1005的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

光学传感器1014用于采集环境光强度。在一个实施例中,处理器1001可以根据光学传感器1014采集的环境光强度,控制显示屏1005的显示亮度。具体地,当环境光强度较高时,调高显示屏1005的显示亮度;当环境光强度较低时,调低显示屏1005的显示亮度。在另一个实施例中,处理器1001还可以根据光学传感器1014采集的环境光强度,动态调整摄像头组件1006的拍摄参数。

接近传感器1015,也称距离传感器,通常设置在终端设备1000的前面板。接近传感器1015用于采集用户与终端设备1000的正面之间的距离。在一个实施例中,当接近传感器1015检测到用户与终端设备1000的正面之间的距离逐渐变小时,由处理器1001控制显示屏1005从亮屏状态切换为息屏状态;当接近传感器1015检测到用户与终端设备1000的正面之间的距离逐渐变大时,由处理器1001控制显示屏1005从息屏状态切换为亮屏状态。

本领域技术人员可以理解,图10中示出的结构并不构成对终端设备1000的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。

图11为本申请实施例提供的服务器的结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器1101和一个或多个的存储器1102,其中,该一个或多个存储器1102中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1101加载并执行以实现上述各个方法实施例提供的品牌知识问答方法,示例性的,处理器1101为CPU。当然,该服务器1100还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1100还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种品牌知识问答方法。

可选地,上述计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序,该计算机程序为至少一条,该至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种品牌知识问答方法。

在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种品牌知识问答方法。

应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 高效DC-DC变换器及适用于MPPT的储能设备
  • 适用于集中型光伏DC-DC变换器的MPPT控制方法
技术分类

06120116570255