掌桥专利:专业的专利平台
掌桥专利
首页

数据存储方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 19:14:59


数据存储方法、装置、电子设备和存储介质

技术领域

本发明涉及数据处理技术领域,尤其涉及一种数据存储方法、装置、电子设备和存储介质。

背景技术

近年来,人工智能技术在不断发展,而随着技术的进步设备也越来越智能化,对应地人机交互过程越来越拟人化、纷繁化,简而言之,设备可以类人般通过语音、视觉、动作等多种方式,与人进行交互。

目前,人机交互过程中设备多以日记的方式,直接记录设备与人之间的交互数据,此种记录方式记录的十分全面,但是,也正是因为记录全面,日志所记录的交互数据必定纷繁复杂,后续查询十分不便,即在查询所需的交互数据时,需对日志记录的所有数据进行逐一筛选,不仅耗时费力,还极易漏查,查询效率低下。

发明内容

本发明提供一种数据存储方法、装置、电子设备和存储介质,用以解决现有技术中因存储的数据繁多,查询十分不便的缺陷,降低了存储的数据量,提升了查询的便利性。

本发明提供一种数据存储方法,包括:

确定待存储的对话语音,以及所述对话语音对应的对话文本;

对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;

基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音。

根据本发明提供的一种数据存储方法,所述对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系,包括:

对所述对话文本中的用户语句进行语义要素拆解,得到所述用户语句的各语义要素,以及所述各语义要素之间的语义要素关系;

基于所述对话文本中的用户语句进行情绪识别,得到所述用户语句包含的各情绪类别,以及所述各情绪类别之间的情绪约束关系;

基于所述各语义要素和所述语义要素关系,或所述各语义要素和所述语义要素关系,以及所述各情绪类别和所述情绪约束关系,确定所述用户语句的各语句要素,以及所述各语句要素之间的要素关系。

根据本发明提供的一种数据存储方法,所述对所述对话文本中的用户语句进行语义要素拆解,得到所述用户语句的各语义要素,以及所述各语义要素之间的语义要素关系,包括:

将所述对话文本中的用户语句输入至语义拆解模型中的语义拆解层,得到所述语义拆解层输出的所述用户语句的各语义要素;

将所述用户语句,以及所述用户语句的各语义要素输入至所述语义拆解模型中的语义理解层,得到所述语义理解层输出的所述各语义要素之间的语义要素关系;

所述语义拆解模型基于样本语句、所述样本语句的各样本语义要素,以及所述各样本语义要素之间的语义要素关系训练得到。

根据本发明提供的一种数据存储方法,所述基于所述对话文本中的用户语句进行情绪识别,得到所述用户语句包含的各情绪类别,以及所述各情绪类别之间的情绪约束关系,包括:

将所述对话文本中的用户语句输入至情绪识别模型中的情绪识别层,得到所述情绪识别层输出的所述用户语句包含的各情绪类别;

将所述用户语句,以及所述用户语句包含的各情绪类别输入至所述情绪识别模型中的语义理解层,得到所述语义理解层输出的所述各情绪类别之间的情绪约束关系;

所述情绪识别模型基于样本语句、所述样本语句对应的各情绪类别标签,以及所述各情绪类别标签之间的情绪约束关系训练得到。

根据本发明提供的一种数据存储方法,所述基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,包括:

将所述各语句要素和所述各语句要素之间的要素关系输入至要素重组模型,得到所述要素重组模型输出的所述用户语句的存储信息;

所述要素重组模型包含各要素关系与存储模板之间的对应关系,所述要素重组模型用于基于所述各语句要素之间的要素关系,确定对应存储模板,并基于对应存储模板,对所述各语句要素进行规则拼接。

根据本发明提供的一种数据存储方法,所述对话语音基于如下步骤确定:

基于用户的语言表达习性,从历史对话语音中确定对话筛选条件;

基于所述对话筛选条件,从当前对话语音中确定待存储的对话语音,所述对话筛选条件包括时间条件、地点条件、人物条件、环境条件、动作条件、约束条件中的至少一种。

根据本发明提供的一种数据存储方法,所述各语义要素包括人物、时间、地点、实体、动作、时态、修饰语中的至少两种;

所述各语义要素之间的语义要素关系包括主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系中的至少一种。

本发明还提供一种数据存储装置,包括:

确定单元,用于确定待存储的对话语音,以及所述对话语音对应的对话文本;

拆解单元,用于对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;

重组单元,用于基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的数据存储方法。

本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的数据存储方法。

本发明提供的数据存储方法、装置、电子设备和存储介质,通过对待存储的对话语音对应的对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系;利用各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,分别存储对话语音和存储信息,克服了传统方案中存储的数据繁多,查询十分不便的缺陷,待存储的对话语音的确定,以及针对于用户语句的要素拆解和重组能够在极大程度上缩减存储的数据量,同时还实现了数据的规整化,保证了数据存储的精简性和有序性,提升了查询便利性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的数据存储方法的流程示意图;

图2是本发明提供的数据存储方法中步骤120的流程示意图;

图3是本发明提供的数据存储方法中步骤121的流程示意图;

图4是本发明提供的数据存储方法中步骤122的流程示意图;

图5是本发明提供的对话语音的确定过程的示意图;

图6是本发明提供的数据存储方法的总体框架图;

图7是本发明提供的数据存储装置的结构示意图;

图8是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前的人机交互过程中,设备多以日记的方式直接记录交互数据,此种记录方式记录的十分全面,用户/监护人可以直接从设备的使用记录中调取交互数据,以查询所关注的交互聊天内容。

然而,设备日志记录的交互数据极为繁杂,且内容繁多,用户/监护人在查询所需的交互数据时,需对日志记录的所有内容逐一进行筛选,这不仅需要耗费大量的时间精力,还极易漏查误查,便利性差。

对此,本发明提供一种数据存储方法,旨在对用户需要或关注的数据进行存储,过程中通过要素拆解和重组可以有效的降低数据量,同时还是实现了数据的规整化,保证了数据存储的精简性和有序性,实现了后续查询过程中查询便利性的提升。

图1是本发明提供的数据存储方法的流程示意图,如图1所示,该方法可以应用于人机交互过程的对话语音,也可以应用于其他场景下的对话语音,如两方通话、多方会议等。为便于解释,以下实施例以对人机交互过程中的对话语音进行存储为例进行说明,该方法包括:

步骤110,确定待存储的对话语音,以及对话语音对应的对话文本;

此处,待存储的对话语音可以理解为人机交互过程中的设备与人进行对话的语音,但是其并非是人机交互过程中的原始交互语音,而是在原始交互语音的基础上进行筛选得到的,即可以对原始交互语音进行筛选,以滤除其中用户不关注的信息,得到仅包含用户需要或关注的信息的语音段,该语音段即待存储的对话语音。

值得注意的是,此处的对话语音除了是交互场景下的语音之外,也可以两方对话过程中的语音,例如两方通话,还可以多方讨论过程中的语音,例如多方会议,本发明实施例对此不做具体限定。

由于数据的存储是为了后续的查询,因而,在确定待存储的对话语音的过程中,可以以用户/监护人习性喜好为基准进行信息筛选,即可以根据用户的关注重点、侧重方向、表达习惯等,从原始交互语音中,筛选出其可能需要或关注的语音段,作为待存储的对话语音。

此处,针对于原始交互语音的筛选过程,可以过滤大量的无关信息,从而使得后续数据存储的数据量有了极大幅度的减少,降低了设备的存储压力,为设备的顺畅运行提供了关键性的助力。

而在得到待存储的对话语音之后,还需对其对应的对话文本,即可以通过语音识别、语音转写等技术,将待存储的对话语音转换为文本,从而得到对话文本,简而言之,需对对话语音进行语音识别/语音转写,从而得到对话语音对应的识别文本/转写文本,由于文本中包含的是对话信息,因而可称之为对话文本。

值得注意的是,为便于后续的数据处理,此处在生成对话文本时,可以借助语音转写引擎中的声学模型,直接生成分角色的对话文本,即该对话文本中的各语句或各段落包含对话双方中任一方的标注,即对话文本中包含对话双方(设备和用户),以及各自对应的文本信息。

步骤120,对对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系;

具体地,在得到待存储的对话语音对应的对话文本之后,可以执行步骤120,对对话文本中的用户语句进行要素拆解,以得到用户语句的各语句要素,以及各语句要素之间的要素关系,具体过程包括:

由于存储的数据多是为了后续用户/监护人查询或调用,而其关注的又多是用户在对话过程中输出的信息,因为从用户输出的信息中可以观测得到用户的情绪性格、表达能力、日常习惯、学习困惑等,因而,本发明实施例中主要针对于对话文本中用户输出的信息,即用户语句进行“瘦身”处理,并对处理后的存储信息进行单独保存,如此即可提升用户/监护人后续查询的便利性。

具体而言,首先需要从对话文本中确定用户语句,接着可以对用户语句要素拆解,以将用户语句中包含的有关于该语句的人物、动作、时间、情绪等的要素拆解出来,从而得到用户语句的各语句要素,此处的语句要素可以是用户语句中的人物、时间、动作、地点、情绪等。

其中,人物、时间、动作、地点等均可以归结为用户语句的语义信息对应的语义要素,而情绪则可以归属于用户语句蕴含的情绪信息对应情绪类别、情绪倾向、情绪积极分数等。

而在对用户语句进行要素拆解,以得到各语句要素后,还需确定各语句要素之间的要素关系,要素关系的确定依赖于用户语句及其语句要素,即可以在用户语句的基础上,对各语句要素进行语义理解,以明确用户语句的各语句要素之间的要素关系,此处的要素关系可以是主谓关系、时间关系、动宾关系、约束关系、时态关系等。

步骤130,基于各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,分别存储对话语音和存储信息。

具体地,在步骤120中,得到用户语句的各语句要素,以及各语句要素之间的要素关系之后,即可执行步骤130,借助各语句要素间的要素关系,对各语句要素进行重组,以得到用户语句的存储信息,并保存该存储信息,这一过程具体包括:

首先,可以利用各语句要素之间的要素关系,确定用户语句的重组规则,即可以以各语句要素之间的要素关系为基准,确定用户语句的各语句要素进行重组时的重组顺序,具体可以是,参照各语句要素之间的主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系等,确定用户语句的重组规则;

随即,可以依据用户语句的重组规则,对用户语句的各语句要素进行重组,以得到重组后的要素信息,该信息即用户语句的存储信息,具体可以是,利用重组规则反映的各语句要素之间的重组顺序,对用户语句的各语句要素进行重组拼接,从而得到用户语句的存储信息;

此后,即可对用户语句的存储信息进行存储,而在存储该存储信息的同时,为了保证信息的完整性,还可以对待存储的对话信息进行存储,不过用户语句的存储信息与待存储的对话语音的存储区域并不相同,即两者是分开存储的,如此可保证后续查询的便利性,避免了从众多数据中的逐一查询,基于存储信息的查询可以在极大程度上提升了查询效率,保证查询准确性。

本发明提供的数据存储方法,通过对待存储的对话语音对应的对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系;利用各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,分别存储对话语音和存储信息,克服了传统方案中存储的数据繁多,查询十分不便的缺陷,待存储的对话语音的确定,以及针对于用户语句的要素拆解和重组能够在极大程度上缩减存储的数据量,同时还实现了数据的规整化,保证了数据存储的精简性和有序性,提升了查询便利性。

基于上述实施例,图2是本发明提供的数据存储方法中步骤120的流程示意图,如图2所示,步骤120包括:

步骤121,对对话文本中的用户语句进行语义要素拆解,得到用户语句的各语义要素,以及各语义要素之间的语义要素关系;

步骤122,基于对话文本中的用户语句进行情绪识别,得到用户语句包含的各情绪类别,以及各情绪类别之间的情绪约束关系;

步骤123,基于各语义要素和语义要素关系,或各语义要素和语义要素关系,以及各情绪类别和情绪约束关系,确定用户语句的各语句要素,以及各语句要素之间的要素关系。

具体地,步骤120中,对对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系的过程,具体可以包括如下步骤:

由于用户语句的语句要素可以分为语义要素和情绪要素两个大类,其中语义要素对应用户语句中语义有关的要素,情绪要素则对应用户语句中情绪有关的要素,因而在对用户语句进行要素拆分,以确定各语句要素和要素关系时,可以分别确定此两者,以及对应的关系。

步骤121,首先可以用户语句进行语义要素拆解,以得到用户语句的各语义要素,以及各语义要素之间的语义要素关系,具体可以是,通过用户语句的要素分析,以拆解出其中有关于用户语句的语义信息的各个要素,从而得到用户语句的各语义要素,此处的语义要素可以是人物、时间、地点、实体、动作、时态、修饰语中的两种或多种;

而在得到用户语句中各语义要素之后,还需确定各语义要素之间的要素关系,即语义要素关系,具体可以是,在用户语句的基础上,通过对各语义要素进行语义理解,以明确用户语句的各语义要素之间的语义要素关系,此处的语义要素关系可以是主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系中的一种或多种。

步骤122,同时可以依据用户语句进行情绪识别,以确定用户语句中蕴含的各类情绪,从而得到其包含的各情绪类别,具体可以是,对用户语句进行情绪特征提取,以得到其情绪特征,然后可据此情绪特征进行情绪识别,从而得到情绪概率分布,该情绪概率分布中包含用户语句可能对应的各类情绪,以及对应于各类情绪的概率(置信度),而后即可将情绪概率分布中大于情绪阈值的概率对应的情绪类别作为用户语句中包含的各情绪类别。此处情绪阈值为预先设定的,用于判定对应情绪类别是否是用户语句包含的情绪的值,其具体数值可以根据实际需求、实际情况等相应设定,例如,可以是75%、80%等。

而在得到用户语句中包含的各情绪类别之后,还需确定各情绪类别之间的约束关系,即情绪约束关系,具体可以是,以用户语句,以及用户语句包含的各情绪类别为基准,进行语义理解,以明确用户语句的各情绪类别之间的情绪约束关系,此处的情绪约束关系可以是强度约束关系、时间约束关系、因果约束关系中的一种或多种。

步骤123,此后即可通过用户语句的各语义要素和语义要素关系,或各语义要素和语义要素关系,以及各情绪类别和情绪约束关系,确定用户语句的各语句要素,以及各语句要素之间的要素关系,即可以直接将各语义要素,以及各语义要素之间的语义要素关系,作为用户语句的各语句要素,以及各语句要素之间的要素关系,也可以结合各语义要素和各情绪类别,共同确定用户语句的各语句要素,结合各语句要素之间的要素关系,以及各情绪类别之间的情绪约束关系,确定各语句要素之间的要素关系。

基于上述实施例,图3是本发明提供的数据存储方法中步骤121的流程示意图,如图3所示,步骤121包括:

步骤121-1,将对话文本中的用户语句输入至语义拆解模型中的语义拆解层,得到语义拆解层输出的用户语句的各语义要素;

步骤121-2,将用户语句,以及用户语句的各语义要素输入至语义拆解模型中的语义理解层,得到语义理解层输出的各语义要素之间的语义要素关系;

语义拆解模型基于样本语句、样本语句的各样本语义要素,以及各样本语义要素之间的语义要素关系训练得到。

具体地,对用户语句进行语义要素拆解,得到用户语句的各语义要素,以及各语义要素之间的语义要素关系的过程,具体可以包括:

针对于用户语句的语义要素拆解,可以借助语义拆解模型实现,具体可以是,先将用户语句输入至语义拆解模型,然后由语义拆解模型对输入的用户语句进行语义要素拆解,最终可以得到语义拆解模型输出的用户语句的各语义要素,以及各语义要素之间的语义要素关系。

此处,语义拆解模型包括语义拆解层和语义理解层,其中语义拆解层用于对用户语句进行语义要素拆解,得到用户语句的各语义要素;语义理解层则用于在用户语句的基础上,对各语义要素进行语义理解,得到各语义要素之间的语义要素关系。

具体而言,首先可以将用户语句输入至语义拆解模型中的语义拆解层,由语义拆解层对输入的用户语句进行语义要素拆解,以拆解出其中有关于用户语句的语义信息的各个语义要素,并输出各语义要素;

接着可以将用户语句,以及语义拆解层输出的各语义要素输入至语义拆解模型中的语义理解层,由语义理解层进行语义理解,以确定各语义要素之间的语义要素关系,即可以在用户语句的基础上,应用语义理解层,对各语义要素进行语义理解,从而明确语义要素关系。

而在将用户语句输入至语义拆解模型之前,还可以应用样本语句,样本语句的各样本语义要素,以及各样本语义要素之间的语义要素关系,预先训练得到语义拆解模型。模型训练过程包括:首先,收集大量的样本语句,并标注样本语句的各样本语义要素,以及各样本语义要素之间的语义要素关系;随即,基于样本语句,样本语句的各样本语义要素,以及各样本语义要素之间的语义要素关系,对初始语义拆解模型进行训练,从而得到训练完成的语义拆解模型。

基于上述实施例,图4是本发明提供的数据存储方法中步骤122的流程示意图,如图4所示,步骤122包括:

步骤122-1,将对话文本中的用户语句输入至情绪识别模型中的情绪识别层,得到情绪识别层输出的用户语句包含的各情绪类别;

步骤122-2,将用户语句,以及用户语句包含的各情绪类别输入至情绪识别模型中的语义理解层,得到语义理解层输出的各情绪类别之间的情绪约束关系;

情绪识别模型基于样本语句、样本语句对应的各情绪类别标签,以及各情绪类别标签之间的情绪约束关系训练得到。

具体地,利用用户语句进行情绪识别,得到用户语句包含的各情绪类别,以及各情绪类别之间的情绪约束关系的过程,具体可以包括:

针对于用户语句的情绪识别拆解,可以借助情绪识别模型实现,具体可以是,先将用户语句输入至情绪识别模型,然后由情绪识别模型对输入的用户语句进行情绪识别,最终可以得到情绪识别模型输出的用户语句的各情绪类别,以及各情绪类别之间的情绪约束关系。

此处,情绪识别模型包括情绪识别层和语义理解层,其中情绪识别层用于对用户语句进行情绪识别,以得到用户语句的各情绪类别;语义理解层则用于根据用户语句,以及用户语句包含的各情绪类别,进行语义理解,得到各情绪类别之间的情绪约束关系。

具体而言,首先可以将用户语句输入至情绪识别模型中的情绪识别层,由情绪识别层对输入的用户语句进行情绪特征提取,得到其情绪特征,然后据此情绪特征进行情绪识别,将情绪识别所得的情绪概率分布中大于情绪阈值的概率对应的各情绪类别作为用户语句对应的各情绪类别,并输出各情绪类别;

接着可以将用户语句,以及情绪识别层输出的各情绪类别输入至情绪识别模型中的语义理解层,由语义理解层进行语义理解,以确定各情绪类别之间的情绪约束关系,即可以以用户语句,以及用户语句包含的各情绪类别为基准,进行语义理解,以明确用户语句的各情绪类别之间的情绪约束关系。

而在将用户语句输入至情绪识别模型之前,还可以应用基于样本语句、样本语句对应的各情绪类别标签,以及各情绪类别标签之间的情绪约束关系,预先训练得到情绪识别模型。

模型训练过程具体包括:首先,收集大量的样本语句,并对样本语句对应的各情绪类别,以及各情绪类别之间的情绪约束关系进行标注,以形成样本语句对应的各情绪类别标签,以及各情绪类别标签之间的情绪约束关系;随即,基于样本语句、样本语句对应的各情绪类别标签,以及各情绪类别标签之间的情绪约束关系,对初始情绪识别模型进行训练,从而得到训练完成的情绪识别模型。

基于上述实施例,步骤130中,基于各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,包括:

将各语句要素和各语句要素之间的要素关系输入至要素重组模型,得到要素重组模型输出的用户语句的存储信息;

要素重组模型包含各要素关系与存储模板之间的对应关系,要素重组模型用于基于各语句要素之间的要素关系,确定对应存储模板,并基于对应存储模板,对各语句要素进行规则拼接。

具体地,步骤130中,依据各语句要素之间的要素关系,对各语句要素进行重组,得到用户语句的存储信息的过程,具体可以包括:

首先,可以将用户语句的各语句要素,以及各语句要素之间的要素关系输入至要素重组模型;然后,要素重组模型可根据输入的各语句要素之间的要素关系,确定用户语句的重组规则,并可据此重组规则,对用户语句的各语句要素进行重组;最终,可以得到要素重组模型输出的用户语句的存储信息。

此处,要素重组模型可以理解为要素拼接器,其中,包含多种要素关系与存储模板之间的对应关系,而每一存储模板可以理解为一种固定的存储规则,换而言之,每一存储模板对应一种重组规则,按照这一存储规则进行要素重组,即可得到对应于存储模板的存储信息。

具体而言,要素重组模型首先可以根据输入的要素关系,从其下多种要素关系与存储模板之间的对应关系中,确定各语句要素之间的要素关系对应的存储模板,并以这一存储模板为基准,对用户语句的各语句要素进行重组,即按照这一存储模板对应的存储规则,对各语句要素进行规则拼接,从而得到用户语句的存储信息。

基于上述实施例,图5是本发明提供的对话语音的确定过程的示意图,如图5所示,对话语音基于如下步骤确定:

步骤510,基于用户的语言表达习性,从历史对话语音中确定对话筛选条件;

步骤520,基于对话筛选条件,从当前对话语音中确定待存储的对话语音,对话筛选条件包括时间条件、地点条件、人物条件、环境条件、动作条件、约束条件中的至少一种。

考虑到传统方案中按照日记的方式记录交互数据时,随着时间的推进,交互数据会越来越多,设备对于交互数据的存储压力也越来越大,即日益增加的交互数据会成为设备的负担,影响其运行的顺畅性。

鉴于此,本发明实施例中,可以对等待存储的交互数据进行过滤,滤除其中不重要、用户不需要、不关注的信息,仅保留所需或所关注的信息,如此即可在极大程度上缩减待存储的数据量,保证顺畅运行。

具体地,待存储的对话语音的确定过程,具体可以包括如下步骤:

步骤510,首先需要确定用户的语言表达习性,可以是用户语言表达时的着重点、偏向角、惯用词等,即用户的关注重点、侧重方向、表达习惯等,然后可以根据用户的语言表达习惯,从历史对话语音中确定一个或多个筛选因子,以组建形成对话筛选条件;

此处,筛选因子可以是时间关键词、动作关键词、人物关键词、地点关键词等,据此组建的对话筛选条件则可以包括时间条件、地点条件、人物条件、环境条件、动作条件、约束条件中的一种或多种。

步骤520,随即可以利用这一对话筛选条件,从当前对话语音中确定待存储的对话语音,具体可以是,从当前对话语音中筛选出对应于对话筛选条件中的时间条件、地点条件、人物条件、环境条件、动作条件、约束条件中的至少一种的语音段,该语音段即包含用户所需或关注的信息的精简语音段,将其作为待存储的对话语音。

此处,历史对话语音和当前对话语音,均与对话语音的场景相同,历史对话语音可以是人机交互过程中以往设备与用户的对话语音;对应的,当前对话语音则可以是人机交互过程中本次对话的对话语音。

本发明实施例中,借助用户的语言表达习性进行信息筛选,可以过滤掉当前对话语音中大量的无关信息,得到包含用户所需或关注信息的对话语音,解决了传统方案中数据繁多,以致存储压力过大的问题,降低了后续存储过程中存储的数据量,减轻了设备的存储压力,为设备的顺畅运行和查询的高效便利提供了关键性的助力。

基于上述实施例,各语义要素包括人物、时间、地点、实体、动作、时态、修饰语中的至少两种;

各语义要素之间的语义要素关系包括主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系中的至少一种。

具体地,用户语句的各语义要素可以是人物、时间、地点、实体、动作、时态、修饰语中的两种或两种以上,各语义要素之间的语义要素关系则可以是主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系中的一种或多种。

例如,当用户语句为“我昨天和妈妈一起去动物园了”时,通过语义拆解模型和情绪识别模型,得到的各语义要素、语义要素关系、情绪类别、情绪约束关系,可以表示为如下形式:

“{"emotion":["中性"],"express":[],"interpersonal":[],"sp_label":[],"relation_triples":[[1,2,"时态"],[1,3,"主谓"],[1,4,"时间"],[1,5,"主谓"],[1,6,"约束"],[1,7,"动状"]],"node_sequence":{"0":"ROOT","1":"前往","2":"过去时","3":"我","4":"昨天","5":"妈妈","6":"一起","7":"动物园"},"elements":[{"object":["我","妈妈"],"time":["昨天"],"decorate":["一起"],"location":["动物园"],"actions":["前往"],"tenses":["past"]}]}”

其中,"emotion"表示情绪类别,"relation_triples"表示各语义要素之间的语义要素关系,"node_sequence"表示各语义要素及其编号,"object"为人物,"time"为时间、"decorate"为修饰语,"location"为地点,"actions"为动作,"tenses"为时态。

又例如,当用户语句为“我学会骑自行车了”时,通过语义拆解模型和情绪识别模型,得到的各语义要素、语义要素关系、情绪类别、情绪约束关系,可以表示为如下形式:

“{"emotion":["自豪"],"express":[],"interpersonal":[],"sp_label":[],"relation_triples":[[1,6,"动宾"],[3,2,"时态"],[3,4,"动宾"],[3,5,"主谓"],[4,1,"动宾"]],"node_sequence":{"0":"ROOT","1":"骑","2":"过去时","3":"学","4":"能动","5":"我","6":"自行车"},"elements":[{"object":["我"],"content":["自行车"],"actions":["骑","学","能动"],"tenses":["past"]}]}”

其中,"emotion"表示情绪类别,"relation_triples"表示各语义要素之间的语义要素关系,"node_sequence"表示各语义要素及其编号,"object"为人物,"content"为实体,"actions"为动作,"tenses"为时态。

图6是本发明提供的数据存储方法的总体框架图,如图6所示,该方法包括:

首先,确定待存储的对话语音,以及对话语音对应的对话文本;

其中,对话语音基于如下步骤确定:基于用户的语言表达习性,从历史对话语音中确定对话筛选条件;基于对话筛选条件,从当前对话语音中确定待存储的对话语音,对话筛选条件包括时间条件、地点条件、人物条件、环境条件、动作条件、约束条件中的至少一种。

随即,对对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系,具体可以是,对对话文本中的用户语句进行语义要素拆解,得到用户语句的各语义要素,以及各语义要素之间的语义要素关系;基于对话文本中的用户语句进行情绪识别,得到用户语句包含的各情绪类别,以及各情绪类别之间的情绪约束关系;基于各语义要素和语义要素关系,或各语义要素和语义要素关系,以及各情绪类别和情绪约束关系,确定用户语句的各语句要素,以及各语句要素之间的要素关系;

其中,对对话文本中的用户语句进行语义要素拆解,得到用户语句的各语义要素,以及各语义要素之间的语义要素关系,具体包括:将对话文本中的用户语句输入至语义拆解模型中的语义拆解层,得到语义拆解层输出的用户语句的各语义要素;将用户语句,以及用户语句的各语义要素输入至语义拆解模型中的语义理解层,得到语义理解层输出的各语义要素之间的语义要素关系;语义拆解模型基于样本语句、样本语句的各样本语义要素,以及各样本语义要素之间的语义要素关系训练得到。

此处,各语义要素包括人物、时间、地点、实体、动作、时态、修饰语中的至少两种;各语义要素之间的语义要素关系包括主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系中的至少一种。

基于对话文本中的用户语句进行情绪识别,得到用户语句包含的各情绪类别,以及各情绪类别之间的情绪约束关系,具体包括:将对话文本中的用户语句输入至情绪识别模型中的情绪识别层,得到情绪识别层输出的用户语句包含的各情绪类别;将用户语句,以及用户语句包含的各情绪类别输入至情绪识别模型中的语义理解层,得到语义理解层输出的各情绪类别之间的情绪约束关系;情绪识别模型基于样本语句、样本语句对应的各情绪类别标签,以及各情绪类别标签之间的情绪约束关系训练得到。

随后,基于各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,分别存储对话语音和存储信息,具体可以是,将各语句要素和各语句要素之间的要素关系输入至要素重组模型,得到要素重组模型输出的用户语句的存储信息;此处,要素重组模型包含各要素关系与存储模板之间的对应关系,要素重组模型用于基于各语句要素之间的要素关系,确定对应存储模板,并基于对应存储模板,对各语句要素进行规则拼接。

本发明实施例提供的方法,通过对待存储的对话语音对应的对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系;利用各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,分别存储对话语音和存储信息,克服了传统方案中存储的数据繁多,查询十分不便的缺陷,待存储的对话语音的确定,以及针对于用户语句的要素拆解和重组能够在极大程度上缩减存储的数据量,同时还实现了数据的规整化,保证了数据存储的精简性和有序性,提升了查询便利性。

下面对本发明提供的数据存储装置进行描述,下文描述的数据存储装置与上文描述的数据存储方法可相互对应参照。

图7是本发明提供的数据存储装置的结构示意图,如图7所示,该装置包括:

确定单元710,用于确定待存储的对话语音,以及所述对话语音对应的对话文本;

拆解单元720,用于对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;

重组单元730,用于基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音。

本发明提供的数据存储装置,通过对待存储的对话语音对应的对话文本中的用户语句进行要素拆解,得到用户语句的各语句要素,以及各语句要素之间的要素关系;利用各语句要素之间的要素关系,对用户语句的各语句要素进行重组,得到用户语句的存储信息,分别存储对话语音和存储信息,克服了传统方案中存储的数据繁多,查询十分不便的缺陷,待存储的对话语音的确定,以及针对于用户语句的要素拆解和重组能够在极大程度上缩减存储的数据量,同时还实现了数据的规整化,保证了数据存储的精简性和有序性,提升了查询便利性。

基于上述实施例,拆解单元720用于:

对所述对话文本中的用户语句进行语义要素拆解,得到所述用户语句的各语义要素,以及所述各语义要素之间的语义要素关系;

基于所述对话文本中的用户语句进行情绪识别,得到所述用户语句包含的各情绪类别,以及所述各情绪类别之间的情绪约束关系;

基于所述各语义要素和所述语义要素关系,或所述各语义要素和所述语义要素关系,以及所述各情绪类别和所述情绪约束关系,确定所述用户语句的各语句要素,以及所述各语句要素之间的要素关系。

基于上述实施例,拆解单元720用于:

将所述对话文本中的用户语句输入至语义拆解模型中的语义拆解层,得到所述语义拆解层输出的所述用户语句的各语义要素;

将所述用户语句,以及所述用户语句的各语义要素输入至所述语义拆解模型中的语义理解层,得到所述语义理解层输出的所述各语义要素之间的语义要素关系;

所述语义拆解模型基于样本语句、所述样本语句的各样本语义要素,以及所述各样本语义要素之间的语义要素关系训练得到。

基于上述实施例,拆解单元720用于:

将所述对话文本中的用户语句输入至情绪识别模型中的情绪识别层,得到所述情绪识别层输出的所述用户语句包含的各情绪类别;

将所述用户语句,以及所述用户语句包含的各情绪类别输入至所述情绪识别模型中的语义理解层,得到所述语义理解层输出的所述各情绪类别之间的情绪约束关系;

所述情绪识别模型基于样本语句、所述样本语句对应的各情绪类别标签,以及所述各情绪类别标签之间的情绪约束关系训练得到。

基于上述实施例,重组单元730用于:

将所述各语句要素和所述各语句要素之间的要素关系输入至要素重组模型,得到所述要素重组模型输出的所述用户语句的存储信息;

所述要素重组模型包含各要素关系与存储模板之间的对应关系,所述要素重组模型用于基于所述各语句要素之间的要素关系,确定对应存储模板,并基于对应存储模板,对所述各语句要素进行规则拼接。

基于上述实施例,确定单元710用于:

基于用户的语言表达习性,从历史对话语音中确定对话筛选条件;

基于所述对话筛选条件,从当前对话语音中确定待存储的对话语音,所述对话筛选条件包括时间条件、地点条件、人物条件、环境条件、动作条件、约束条件中的至少一种。

基于上述实施例,所述各语义要素包括人物、时间、地点、实体、动作、时态、修饰语中的至少两种;

所述各语义要素之间的语义要素关系包括主谓关系、时间关系、动宾关系、约束关系、时态关系、动状关系中的至少一种。

图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行数据存储方法,该方法包括:确定待存储的对话语音,以及所述对话语音对应的对话文本;对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音。

此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的数据存储方法,该方法包括:确定待存储的对话语音,以及所述对话语音对应的对话文本;对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法所提供的数据存储方法,该方法包括:确定待存储的对话语音,以及所述对话语音对应的对话文本;对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术分类

06120115848966