导航：首页> 计算；推算；计数>用于人车交互的训练样本的生成方法、装置及电子设备

用于人车交互的训练样本的生成方法、装置及电子设备

文献发布时间：2024-04-18 19:58:26

技术领域

本申请的实施方式涉及自然语言处理领域，更具体地，涉及一种用于人车交互的训练样本的生成方法、装置、电子设备及存储介质。

背景技术

自然语言处理是人工智能技术领域中的重要研究方向之一，其模型的训练离不开大量的语料数据支持。目前，相关技术人员主要通过对已有数据集进行手动标注和配置，来获得用于训练模型的语料数据。在智能座舱人机交互场景中，这种方式效率较低，难以满足实际使用需求。

发明内容

本申请的实施方式提供了一种可至少部分解决现有技术中存在的上述问题或其他问题的用于人车交互的训练样本的生成方法、装置、电子设备及存储介质。

本申请的实施方式第一方面提供了一种用于人车交互的训练样本的生成方法，包括：基于车机操控功能信息，确定意图标签和意图对象；基于人车交互的历史语料数据，为意图标签配置指令模板；将指令模板与意图对象进行匹配，生成与意图标签对应的训练样本集。

本申请的实施方式第二方面提供了一种用于人车交互的训练样本的生成装置，包括：确定模块，被配置为基于车机操控功能信息，确定意图标签和意图对象；配置模块，被配置为基于人车交互的历史语料数据，为意图标签配置指令模板；匹配模块，被配置为将指令模板与意图对象进行匹配，生成与意图标签对应的训练样本集。

本申请的实施方式第三方面提供了一种电子设备，包括：至少一个处理器和存储器。存储器与至少一个处理器通信连接，并存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如上述实施方式提及的用于人车交互的训练样本的生成方法。

本申请的实施方式第四方面提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，实现如上述实施方式提及的用于人车交互的训练样本的生成方法。

在本申请的一些实施方式中，可以首先基于车机操控功能信息，确定意图标签和意图对象，然后基于人车交互的历史语料数据，为意图标签配置指令模板，最后通过指令模板和意图对象的相互匹配，可以快速生成与意图标签对应的训练样本集，提高了训练样本的生成效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例的详细描述，本申请的其它特征、目的和优点将会变得更明显。其中：

图1是根据本申请的一些实施例的用于人车交互的训练样本的生成方法的流程示意图；

图2是根据本申请的另一些实施例的用于人车交互的训练样本的生成方法的流程示意图；

图3是根据本申请的又一些实施例的用于人车交互的训练样本的生成方法的流程示意图；

图4是根据本申请的再一些实施例的用于人车交互的训练样本的生成方法的流程示意图；

图5是根据本申请的一些实施例的用于人车交互的训练样本的生成装置的示意性框图；以及

图6是用来实现本申请的一些实施例的用于人车交互的训练样本的生成方法的电子设备的示意性框图。

具体实施方式

为了更好地理解本申请，将参考附图对本申请的各个方面做出更详细的说明。应理解，这些详细说明只是对本申请的示例性实施方式的描述，而非以任何方式限制本申请的范围。在说明书全文中，相同的附图标号指代相同的元件。表述“和/或”包括相关联的所列项目中的一个或多个的任何和全部组合。

还应理解的是，诸如“包括”、“包括有”、“具有”、“包含”和/或“包含有”等表述在本说明书中是开放性而非封闭性的表述，其表示存在所陈述的特征、元件和/或部件，但不排除一个或多个其它特征、元件、部件和/或它们的组合的存在。此外，当诸如“...中的至少一个”的表述出现在所列特征的列表之后时，其修饰整列特征，而非仅仅修饰列表中的单独元件。此外，当描述本申请的实施方式时，使用“可”表示“本申请的一个或多个实施方式”。并且，用语“示例性的”旨在指代示例或举例说明。

除非另外限定，否则本文中使用的所有措辞(包括工程术语和科技术语)均具有与本申请所属领域普通技术人员的通常理解相同的含义。还应理解的是，除非本申请中有明确的说明，否则在常用词典中定义的词语应被解释为具有与它们在相关技术的上下文中的含义一致的含义，而不应以理想化或过于形式化的意义解释。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。另外，除非明确限定或与上下文相矛盾，否则本申请所记载的方法中包含的具体步骤不必限于所记载的顺序，而可以任意顺序执行或并行地执行。下面将参考附图并结合实施例来详细说明本申请。

在自然语言处理领域进行深度学习时，首先需要对待学习的语料数据进行人工标注，然后才能基于标注结果进行深度学习。由于在进行人工标注时，需要相关人员对语料数据中的每个话术进行逐一配置，因此不但样本的获取效率低下，而且得到的样本数量和范围也都有限。

基于此，为了至少解决部分上述问题，本申请实施方式提供了一种训练样本的生成方法。本申请实施方式所提供的训练样本的生成方法一般由计算机设备或服务器执行，相应地，训练样本的生成装置一般设置于计算机设备或服务器中。

图1是根据本申请的一些实施例的用于人车交互的训练样本的生成方法的流程示意图。如图1所示，训练样本的生成方法100可以包括以下步骤：

步骤101、基于车机操控功能信息，确定意图标签和意图对象。

在本实施例中，训练样本的生成方法的执行主体(如计算机设备或服务器)可以首先获取预先配置的操控功能信息，该操控功能信息可以是根据对智能终端的实际操控需求，预先定义的用来描述操控动作的信息。需要说明的是，本申请实施例生成的训练样本，主要用于训练用于人车交互的自然语言处理模型，因此获取的操控功能信息也是与各种智能终端，尤其是智能车机的人车交互操作匹配的功能信息。示例性的，若要训练与自动驾驶车辆或智能座舱进行交互的语言模型，则预先定义的操控功能信息可以包括与自动驾驶、自动导航等功能相关的描述信息；若要训练与智能座舱或智能音箱进行交互的语言模型，则预先定义的操控功能信息可以包括与播放音乐、设定闹钟等功能相关的描述信息。

上述执行主体在获得操控功能信息后，可以进一步对获得的信息进行语义分析，并根据语义分析的结果确定意图标签和意图对象，其中，意图标签可以代表需要实现的操作功能，意图对象可以代表操作功能的执行对象，并且意图标签和意图对象之间具有对应关系。例如，若通过语义分析确定车机操控功能信息中包括对U盘音乐的播放、暂停、退出等控制功能，则可以确定出“开始播放U盘音乐”、“暂停播放U盘音乐”、“退出播放U盘音乐”等意图标签，同时，确定出的意图对象可以包括“U盘音乐”、“U盘歌曲”、“USB音乐”、“USB歌曲”等多个对象。

步骤102、基于人车交互的历史语料数据，为意图标签配置指令模板。

在确定了意图标签之后，上述执行主体可以进一步基于人车交互的历史语料数据，为意图标签配置对应的指令模板。其中，历史语料数据可以包括用户在以往的与智能车端交互的过程中，所发出的语音指令、文字指令。这些历史语料数据可能被保存在智能车端的服务器上，也可能被保存在专业数据库中。执行主体可以根据实际的使用需求和权限，获取需要的历史语料数据，然后根据历史语料中与意图标签相关的话术，确定意图标签所要实现的操控功能中的指令动作，最后根据指令动作确定指令模板。或者直接将指令动作作为指令模板。示例性的，对于“开始播放U盘音乐”这个意图标签，从历史语料数据中可以获得相应的话术包括“播放一下U盘里面的歌曲”、“打开U盘里面的音乐”等语句，这些话术里面包括有“播放”和“打开”等指令动作，这时配置的指令模板就可以包括“播放模板”和“打开模板”。

步骤103、将指令模板与意图对象进行匹配，生成与意图标签对应的训练样本集。

上述执行主体在为意图标签配置指令模板之后，可以进一步将指令模板与该意图标签对应的意图对象进行匹配，具体可以将每个指令模板与每个意图标签分别进行匹配，从而得到成与意图标签对应的训练样本集。示例性的，对于“开始播放U盘音乐”这个意图标签，若其配置的指令模板包括播放模板和打开模板，其对应的意图对象包括“U盘音乐”、“U盘歌曲”、“USB音乐”、“USB歌曲”，则进行匹配后，得到的训练样本集中包括的训练样本有“播放U盘音乐”、“播放U盘歌曲”、“播放USB音乐”、“播放USB歌曲”、“打开U盘音乐”、“打开U盘歌曲”、“打开USB音乐”以及“打开USB歌曲”。

在本实施例的一些可选实现方式中，指令模板可以包括至少一个指令句式，其中指令句式可以是对指令动作的不同语言表达方式。示例性的，打开模板包括的指令句式可以有“打开【】”，“开下【】”，“开开【】”、“打开下【】”、“开启【】”等，其中，“【】”代表占位符。在将指令模板与意图对象进行匹配时，可以遍历指令模板中的全部句式和对应的全部意图对象，并用每一个意图对象替换动作模板中的占位符，就可以得到与意图标签对应的训练样本集。

在本实施例的一些可选实现方式中，通过上述训练样本的生成方法，可以获得多个意图标签及其各自对应的训练样本集。之后可以对这些样本集进行深度学习，例如可以将训练样本集作为输入，将对应的意图标签作为期望输出，进行模型训练，并将训练完成的模型保存在智能终端(如车机端)上作为用于人车交互的自然语言处理模型。在智能终端接收到用户发起的操作指令后，可以将该指令作为模型的输入，并将模型的输出结果作为用户的操作意图，以便基于操作意图执行相应的操作动作。

本实施例提供的用于人车交互的训练样本的生成方法，可以首先基于车机操控功能信息，确定意图标签和意图对象，然后基于人车交互的历史语料数据，为意图标签配置指令模板，最后通过指令模板和意图对象的相互匹配，可以快速生成与意图标签对应的训练样本集，避免了对训练样本的人工标注，提高了训练样本的生成效率。

图2是根据本申请的另一些实施例的用于人车交互的训练样本的生成方法的流程示意图。如图2所示，用于人车交互的训练样本的生成方法200可以包括以下步骤：

步骤201、基于车机操控功能信息，确定意图标签和意图对象。

步骤202、基于人车交互的历史语料数据，为意图标签配置指令模板。在本实施例中，步骤201-202具体操作已在图1所示的实施例中步骤101-102进行了详细的介绍，在此不再赘述。

步骤203、将一个意图对象确定为目标对象。

在本实施例中，一个意图标签可以对应多个意图对象，这多个意图对象通常代表对同一个实体对象或者动作执行对象的不同描述方式，例如前述意图对象“U盘音乐”、“U盘歌曲”、“USB音乐”、“USB歌曲”都可以被看作是对U盘音乐的描述。执行主体可以从多个意图对象中选取一个意图对象作为目标对象，在选取时可以随机选取，也可以预定的规则选取，例如可以根据各个意图对象在历史语料中出现的次数来选取，具体可以将出现次数最多的意图对象确定为目标对象。

步骤204、将指令模板包含的全部指令句式均与目标对象进行匹配，生成与意图标签对应的训练样本集。

本实施例中的指令模板可以包括至少一个指令句式，在生成训练样本集时，可以将目标对象与每个指令句式分别匹配，作为训练样本。示例性的，若指令模板配置有N个指令句式，N为自然数，将目标对象分别与这N个指令句式匹配后，生成的训练样本集中会包括N个样本。由于一个指令模板所包含的指令句式是各不相同的，因此这N个样本的句式也是互不相同的。

在本实施例中，指令模板和意图对象的匹配方式是首先确定一个目标对象，然后将指令模板包含的全部指令句式均与目标对象进行匹配，这样能够确保每个指令句式仅进行一次匹配，使得样本集中每个样本具有不同的句式，从而确保了样本的多样性和差异性。

图3是根据本申请的又一些实施例的用于人车交互的训练样本的生成方法的流程示意图。如图3所示，用于人车交互的训练样本的生成方法300可以包括以下步骤：

步骤301、基于车机操控功能信息，确定意图标签和意图对象。

步骤302、基于人车交互的历史语料数据，为意图标签配置指令模板。

步骤303、将指令模板与意图对象进行匹配，生成与意图标签对应的训练样本集。

在本实施例中，步骤301-303具体操作已在图1所示的实施例中步骤101-103进行了详细的介绍，在此不再赘述。

步骤304、从训练样本集中选取多个训练样本作为目标样本，得到目标样本集。

前述执行主体在得到与意图标签对应的训练样本集之后，可以进一步对训练样本集进行筛选。具体地，可以首先从训练样本集中选取多个训练样本作为目标样本，得到目标样本集。执行主体可以使用随机选取的方式确定目标样本，也可以按照预定的规则选取，例如选取包括相同意图对象的训练样本作为目标样本。选取出的目标样本的数量通常多于一个且少于预定的样本需求量，这些目标样本可以组成目标样本集。

步骤305、将训练样本集中未被选中的训练样本作为候选样本，得到候选样本集。

在训练样本集中，那些未被选为目标样本的训练样本，可以作为候选样本，组成候选样本集。候选样本集中的候选样本可以被进一步筛选，并根据筛选结果确定是否需要被加入目标样本集。

步骤306、对候选样本集执行样本筛选操作。

本实施例中的样本筛选操作，可以包括下述两个步骤306a和306b。

步骤306a、从候选样本集中选择一个候选样本，并计算该候选样本与各目标样本之间的相似度。

上述执行主体可以从候选样本集中随机选取一个候选样本，然后分别计算该候选样本与目标样本集中各目标样本的相似度。相似度可以用来表征两个样本之间的相似程度。在本实施例中，可以使用本领域通用的相似度计算方法，例如采用杰卡德字符相似度，来计算候选样本与各目标样本之间的相似度。

步骤306b、响应于该候选样本与各目标样本的相似度均小于相似度阈值，将该候选样本确定为目标样本并添加到目标样本集中。

在计算完相似度之后，可以进一步将上述候选样本与各目标样本的相似度分别与预先设定的相似度阈值进行比较，其中，相似度阈值可以是根据经验和/或实际需求设定的。若计算的相似度均小于阈值，则说明候选样本与各目前样本的差异性都比较大，则可以将该候选样本作为目标样本，并加入到目标样本集中。若计算的相似度有小于阈值的情况，则说明候选样本与至少一个目前样本比较相近，则不能将该候选样本作为目标样本，并仍然将其保留在候选样本集中。

步骤307、响应于目标样本集中的样本数量小于样本需求量，再次执行样本筛选操作。

在执行完一次样本筛选操作后，可以判断一下目标样本集中的样本数量和样本需求量之间的关系，其中，样本需求量可以是根据实际需求设定的、训练模型所需要的样本量。若目标样本集中的样本数量小于样本需求量，则说明样本数量不足，因此可以再次对候选样本执行前述样本筛选操作，即步骤306a和306b。若目标样本集中的样本数量等于样本需求量，则说明样本数量已经满足训练要求，因此可以停止执行样本筛选操作。

在本实施例中，经过样本筛选后的目标样本集可以作为候选模型训练中使用的训练样本。具体可以将目标样本集作为输入，与原训练样本集对应的意图标签作为期望输出，进行模型训练，并将训练完成的模型保存在智能终端(如车机端)上作为用于人车交互的自然语言处理模型。

本实施例提供的用于人车交互的训练样本的生成方法，在获得训练样本集后，可以根据相似度进一步对训练样本集进行筛选，将与目标样本的相似度均小于相似度阈值的候选样本，加入到目标样本集。这样可使得目标样本集中的各目标样本之间具有一定差异性，确保了训练样本的多样性。在通过目标样本集进行模型训练时，也可以进一步提升训练后模型的泛化性。

在本实施例的一些可选实现方式中，用于人车交互的训练样本的生成方法还包括：响应于各候选样本均被执行过样本筛选操作，且目标样本集中的样本数量小于样本需求量，调整相似度阈值并再次执行样本筛选操作。在本实施例中，若候选样本集中的各候选样本均被执行过前述候选操作，则在最后一个候选样本被筛选后，可以进一步判断目标样本集中的样本数量是否满足样本需求量。若样本数量小于样本需求量，则说明样本数量不足，需要重新对候选样本进行筛选。此时，可以调整相似度阈值，具体可以将相似度阈值调整得高一些，放宽一些对样本的差异性要求，并再次对当前候选样本集执行样本筛选操作。

可选地，在调整相似度阈值时，可以先设定一个相似度阈值序列区间，例如[0.7,0.8,0.9,0.95],该序列区间可以基于经验和/或实际应用需求确定。在进行上述筛选操作时，可以首先将相似度阈值设定为上述区间的最小值，例如0.7。若各候选样本均被执行过样本筛选操作后，目标样本集中的样本数量仍然小于样本需求量，则可以将相似度阈值调大一档，例如修改为0.8，并再次对候选样本集执行筛选操作。若相似度阈值调整到上述区间的最大值后，样本数量仍然小于样本需求量，还可以通过随机采样的方式直接从候选样本集中选取需要数量的训练样本。本实施例通过调整相似度阈值，并重复执行筛选操作的方式，确保目标样本集中有足够的样本供后续模型训练使用，确保了训练后模型的识别准确度。

图4是根据本申请的再一些实施例的用于人车交互的训练样本的生成方法的流程示意图。如图4所示，用于人车交互的训练样本的生成方法400可以包括以下步骤：

步骤401、获取关于车机操控功能的说明文档。

在本实施例中，关于车机操控功能的说明文档可以是智能车端的说明书、使用手册或开发文档。上述执行主体可以通过各种在线平台或服务器获取相关已发行产品的说明文档，也可以通过内部服务器获取在开发中产品的开发文档。

步骤402、对说明文档进行语义识别，得到车机操控功能信息。

具体地，可以通过语义识别的方式，确定说明文档中与操控功能相关的语句、段落或表格，作为操控功能信息。示例性的，产品说明书中和“操作说明”相关的语句，可以被识别为车机操控功能信息。

步骤403、基于车机操控功能信息指示的操控意图，确定意图标签。

车机操控功能信息通常可以涵盖用户对智能车端的各种具体操作，每种具体操作的操作内容可以被确定为操作意图，并作为一种意图标签。示例性的，“打开收音机”、“退出收音机”都可以作为意图标签。在确定意图标签时，应尽可能涵盖智能终端的全部操控功能，以使后续获得训练样本更加全面和可靠。

步骤404、将车机操控功能信息指示的操控对象确定为意图对象。

通常情况下，操控功能信息中还包括有各种具体操作所要操控的对象，操控对象可以是智能车端中集成的功能模块，该功能模块可以是硬件模块也可以是软件模块，例如显示器或音乐播放应用等。在本实施例中，可以将操控对象作为意图对象。

步骤405、基于多个意图标签包含的动作意图，确定指令模板。

在确定好所需要的多个意图标签后，可以对全部意图标签进行分析，将不同意图标签共性的动作抽象出来的。例如，意图标签“打开蓝牙音乐”和“打开USB音乐”的共性动作就是“打开”，因此可以将打开模板作为一个指令模板，并配置给这两个意图标签。通过类似方式提取出的指令模板还可以包括播放模板、关闭模板、切换模板等。

步骤406、从人车交互的历史语料数据中筛选出与动作意图匹配的历史话术。

本实施例中的历史语料数据与图1实施例的步骤102中获取的历史语料相同，都包括用户在以往的与智能终端交互的过程中，所发出的各类操控指令。执行主体可以通过语义分析、相似度匹配等方式，从历史语料数据中筛选出与各个动作意图所匹配的历史话术。

步骤407、基于历史话术，为指令模板配置指令句式。

通过对历史话术的统计分析，可以确定实现某种操控动作常用的句式。示例性的，可以将历史话术拆分为动词短语+宾语的形式，并对所有动词短语的出现次数进行统计，将出现次数最多的预定数量个动词短语保留，并将对应宾语出现的位置替换为占位符，从而得到相应的指令句式。需要说明的是，一个意图标签可以匹配有多个指令模板，同一个指令模板所包含的指令句式通常是固定的。示例性的，意图标签“播放蓝牙音乐”可以匹配有打开模板、播放模板和切换模板等多个指令模板。

步骤408、将指令模板与意图对象进行匹配，生成与意图标签对应的训练样本集。

在本实施例中，步骤408具体操作已在图1所示的实施例中步骤103进行了详细的介绍，在此不再赘述。

在本实施例的用于人车交互的训练样本的生成方法中，可以从关于车机操控功能的说明文档中提取意图标签和意图对象，由于说明文档对智能车端的功能描述较为全面和准确，因此可以提供后续得到的训练样本的准确性和适用性。同时，本实施例还根据历史话术配置指令句式，由于历史话术涵盖了大量多样的历史语句，因此后续生成的训练样本会更加丰富和全面。

在本实施例的一些可选实现方式是，指令模板还可以包括全局模板。全局模板可以被认为是一种特殊类型的指令模板，其指令句式也是唯一的，只包括一个占位符【】。全局模板通常配置给特殊类型的意图标签，示例性的，对于“导航搜索”这个意图标签，其没有上述常规意义上的意图对象，历史话术通常包括“导航到【目的地】”、“帮我导航去【目的地】”、“给我导航到【目的地】”等，也难以提取出动作指令。在这种情况下，可以将其指令模板配置为全局模板，将历史话术中的每个话术作为意图对象，在将指令模板与意图对象进行匹配后，生成的训练样本就是历史话术。通过设置全局模板，可以进一步扩展指令模板的适用范围，进一步提高生成的训练样本的全面性。

在本实施例的一些可选实现方式中，训练样本的生成方法还包括：从人车交互的历史语料数据中获取具有槽位的话术句式；对话术句式进行槽位填充，得到补充样本集。在用户表达意图的句子中，用来准确表达该意图的关键信息的标识，被称为槽位。示例性的，在表达导航搜索意图是，出发地和目的地都可以被作为槽位。本实施例通过从历史语料数据中获取具有槽位的话术句式，并对话术句式进行有限次数的槽位填充，不但能对训练样本进行有效补充，也能避免样本数据过多导致的过拟合。在后续进行模型训练时，可以对与意图标签匹配的训练样本集和补充样本集一起进行训练，使得训练完成的模型不但能够进行意图分类，还能进行槽位识别，提高了模型的适用性。

进一步参考图5，作为对上述图1-图4所示方法的实现，本申请提供了一种用于人车交互的训练样本的生成装置的一个实施例，该装置实施例与图1-图4所示的方法实施例相对应，该装置具体可以应用于计算机设备或服务器中。

如图5所示，本实施例的用于人车交互的训练样本的生成装置500可以包括确定模块501、配置模块502和匹配模块503。其中，确定模块501，被配置为基于车机操控功能信息，确定意图标签和意图对象；配置模块502，被配置为基于人车交互的历史语料数据，为意图标签配置指令模板；匹配模块503，被配置为将指令模板与意图对象进行匹配，生成与意图标签对应的训练样本集。

在本实施例中，训练样本的生成装置500中：确定模块501、配置模块502和匹配模块503的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤101-103的相关说明，在此不再赘述。

在本实施例的一些可选实现方式中，指令模板包括至少一个指令句式。匹配模块503包括：确定单元，被配置为将一个意图对象确定为目标对象；匹配单元，被配置为将指令模板包含的全部指令句式均与目标对象进行匹配，生成与意图标签对应的训练样本集。

在本实施例的一些可选实现方式中，训练样本的生成装置500还包括：第一选取模块，被配置为从训练样本集中选取多个训练样本作为目标样本，得到目标样本集；第二选取模块，被配置为将训练样本集中未被选中的训练样本作为候选样本，得到候选样本集；样本筛选模块，被配置为对候选样本集执行样本筛选操作。其中，样本筛选操作包括：从候选样本集中选择一个候选样本，并计算该候选样本与各目标样本之间的相似度；响应于该候选样本与各目标样本的相似度均小于相似度阈值，将该候选样本确定为目标样本并添加到目标样本集中。重复模块，被配置为响应于目标样本集中的样本数量小于样本需求量，调用上述样本筛选模块再次执行样本筛选操作。

在本实施例的一些可选实现方式中，训练样本的生成装置500还包括：阈值调整模块，被配置为响应于各候选样本均被执行过样本筛选操作，且目标样本集中的样本数量小于样本需求量，调整相似度阈值并调用上述样本筛选模块再次执行样本筛选操作。

在本实施例的一些可选实现方式中，确定模块501包括：获取单元，被配置为获取关于车机操控功能的说明文档；识别单元，被配置为对说明文档进行语义识别，得到车机操控功能信息；标签确定单元，被配置为基于车机操控功能信息指示的操控意图，确定意图标签；对象确定单元，被配置为将车机操控功能信息指示的操控对象确定为意图对象。

在本实施例的一些可选实现方式中，配置模块502包括：模板确定单元，被配置为基于多个意图标签包含的动作意图，确定指令模板；话术筛选单元，被配置为从人车交互的历史语料数据中筛选出与动作意图匹配的历史话术；句式配置单元，被配置为基于历史话术，为指令模板配置指令句式。

在本实施例的一些可选实现方式中，训练样本的生成装置500还包括：获取模块，被配置为从人车交互的历史语料数据中获取具有槽位的话术句式；填充模块，被配置为对话术句式进行槽位填充，得到补充样本集。

需要说明的是，在本申请的技术方案中，所涉及的用户个人信息的获取、存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。还需要说明的是，本实施例中的信息均是在经用户授权提供(即，征得用户本人同意)之后所获取的。另外，所获取的信息/数据并非旨在表征某一特定类型的用户，因而也无法反映出某一特定类型的用户的个人信息。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本申请的实施方式还提供一种电子设备，如图6所示，电子设备600可包括：至少一个处理器601和存储器608，存储器608与至少一个处理器601通信连接，并存储有可被至少一个处理器601执行的指令，指令被至少一个处理器601执行，以使至少一个处理器能够执行上述用于人车交互的训练样本的生成方法。

本申请的一个实施方式还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序被处理器执行时，实现用于人车交互的训练样本的生成方法。

图6是根据本申请的一些实施方式的电子设备600的示意性框图。如图6所示，电子设备600包括处理器601，其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储器608加载到随机访问存储器(RAM)603中的计算机程序，来执行各种适当的动作和处理。在RAM 603中，还可存储电子设备600操作所需的各种程序和数据。处理器601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

电子设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如，车机的按钮、触控屏等；输出单元607，与例如各种类型的显示器、扬声器等连接，以输出各种形式的信号；存储器608，包括用于存储计算机可执行程序的任意媒介；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如局域网或其它无线通信网络与其他设备交换信息/数据。

处理器601可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器601执行上文所描述的各个方法和处理，例如用于人车交互的训练样本的生成方法。例如，在一些实施方式中，用于人车交互的训练样本的生成方法可被实现为计算机软件程序，其被有形地包含于计算机可读存储介质，例如存储器608。在一些实施方式中，计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM 603并由处理器601执行时，可以执行上文描述的用于人车交互的训练样本的生成方法的一个或多个步骤。备选地，在其他实施方式中，处理器601可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行用于人车交互的训练样本的生成方法。

本文中参照根据本申请示例性实施方式的方法、设备(系统)、和计算机程序产品的流程图和/或时序图描述了本申请的各个方面。应当理解，流程图和/或时序图的每个步骤以及流程图和/或时序图中各步骤的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给电子设备600中的处理器、通用计算机、专用计算机或其它可编程数据处理装置的处理单元，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时，产生了实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤。

附图中的流程图和时序图显示了根据本申请的多个实施方式的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或时序图中的每个步骤可以代表一个模块、程序段或指令的一部分，该模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实施方式中，步骤中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的步骤实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，时序图和/或流程图中的每个步骤、以及时序图和/或流程图中的步骤的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上描述仅为本申请的实施方式以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的保护范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离技术构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：博泰车联网科技(上海)股份有限公司;

上一篇：特征提取网络的训练方法、分类方法、装置及电子设备
下一篇：一种从原生粘土型锂矿中富集回收锂的选矿方法