导航：首页> 发电、变电或配电>一种养老服务的人机对话方法、装置、介质及电子设备

一种养老服务的人机对话方法、装置、介质及电子设备

文献发布时间：2023-06-19 09:29:07

技术领域

本申请实施例涉及人机交互技术领域，尤其涉及一种养老服务的人机对话方法、装置、介质及电子设备。

背景技术

目前随着全球人口步入老龄化阶段，养老服务已成为全社会的热门话题。

目前，绝大多数的养老服务需求的发出，是很难通过老年人自己完成的。养老服务需求主要依靠人工方式(呼叫中心工作人员、社区工作人员、养老服务机构服务人员等)代替老年人操作，人力成本高、效率低下，而且，还会造成养老服务需求响应速度慢，订单形成过程复杂的问题。

发明内容

本申请实施例提供一种养老服务的人机对话方法、装置、介质及电子设备，可以通过人机对话的手段，快速的对养老服务需求进行识别和处理，以达到提高对养老服务需求处理效率，并降低养老服务的人力成本的目的。

第一方面，本申请实施例提供了一种养老服务的人机对话方法，所述方法包括：

接收用户的语音内容，将所述语音内容转换为自然语言文本；

根据所述自然语言文本，确定目标服务类型；

采用与所述目标服务类型对应的槽位类型对槽位信息进行填充；

根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。

进一步的，在确定目标服务类型之后，所述方法还包括：

根据所述自然语言文本，从所述目标服务类型中确定用户意图；

相应的，根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单，包括：

根据已填充的槽位信息以及所述用户意图，生成养老服务订单，并执行所述养老服务订单。

进一步的，接收用户的语音内容，将所述语音内容转换为自然语言文本，包括：

对所述语音内容进行有效信息提取预处理，得到去除两端静音的有效语音内容；

对所述有效语音内容进行分帧处理，得到有效语音帧；

对所述有效语音帧进行处理，得到自然语言文本。

进一步的，对所述有效语音帧进行处理，得到自然语言文本，包括：

对所述有效语音帧通过线性预测倒谱系数进行特征提取；

采用声学模型和/或语言模型对所提取到的特征进行解码，得到自然语言文本。

进一步的，所述声学模型包括隐马尔科夫模型；所述语言模型包括n-gram模型。

进一步的，所述目标服务类型，包括：养老服务订单、养老服务评价、社区养老活动以及养老服务建议中的至少一种。

进一步的，根据所述自然语言文本，确定目标服务类型，包括：

采用TF-IDF算法提取所述自然语言文本的语料特征向量；

将所述语料特征向量输入至支持向量机，根据所述支持向量机的输出结果确定目标服务类型。

进一步的，采用与所述目标服务类型对应的槽位类型对槽位信息进行填充，包括：

根据所述自然语言文本，采用循环神经网络模型来进行槽位信息填充。

进一步的，在采用与所述目标服务类型对应的槽位类型对槽位信息进行填之后，和，在根据所述自然语言文本，从所述目标服务类型中确定用户意图之后，所述方法还包括：

根据所述槽位信息，以及所述用户意图，确定执行动作。

进一步的，所述执行动作包括：执行任务、澄清槽位、确认槽值、匹配失败。

进一步的，若所述执行动作为执行服务，则执行：

根据已填充的槽位信息以及所述用户意图，生成养老服务订单，并执行所述养老服务订单。

进一步的，若所述执行动作为澄清槽位，则根据槽位的槽值信息，发出提问语句；

若所述执行动作为确认槽值，则根据向用户发出待确认槽值信息，供用户确认。

第二方面，本申请实施例提供了一种养老服务的人机对话装置，所述装置包括：

自然语言文本转换模块，用于接收用户的语音内容，将所述语音内容转换为自然语言文本；

目标服务类型确定模块，用于根据所述自然语言文本，确定目标服务类型；

槽位信息填充模块，用于采用与所述目标服务类型对应的槽位类型对槽位信息进行填充；

订单生成模块，用于根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。

第三方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例所述的养老服务的人机对话方法。

第四方面，本申请实施例提供了一种电子设备，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例所述的养老服务的人机对话方法。

本申请实施例所提供的技术方案，接收用户的语音内容，将所述语音内容转换为自然语言文本；根据所述自然语言文本，确定目标服务类型；采用与所述目标服务类型对应的槽位类型对槽位信息进行填充；根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。本申请所提供的技术方案，可以通过人机对话的手段，快速的对养老服务需求进行识别和处理，以达到提高对养老服务需求处理效率，并降低养老服务的人力成本的目的。

附图说明

图1是本申请实施例提供的养老服务的人机对话方法的流程图；

图2是本申请实施例提供的另一养老服务的人机对话方法的示意图；

图3是本申请实施例提供的养老服务的人机对话系统模块示意图；

图4是本申请实施例提供的养老服务的人机对话装置的结构示意图；

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

图1是本申请实施例提供的养老服务的人机对话方法的流程图，本实施例可适用于养老服务情况，该方法可以由本申请实施例所提供的养老服务的人机对话装置执行，该装置可以由软件和/或硬件的方式来实现，并可集成于智能终端等电子设备中。

如图1所示，所述养老服务的人机对话方法包括：

S110、接收用户的语音内容，将所述语音内容转换为自然语言文本。

其中，用户可以是老年人，也可以是老年人的子女等，接收用户的语音内容，可以是在老年人通过移动终端呼叫固定号码之后来接收，还可以是通过其他方式获取，如通过微信的公众号获取老年人发出的语音信息，或者通过在老年人家中安装的前端语音获取设备来获取。

将所述语音内容转换为自然语言文本，其中，自然语言文本可以是语音对应的文字内容，还可以是采用一些手段对语言进行编码后得到的字符串等。

在本实施例中，可选的，接收用户的语音内容，将所述语音内容转换为自然语言文本，包括：

对所述语音内容进行有效信息提取预处理，得到去除两端静音的有效语音内容；

对所述有效语音内容进行分帧处理，得到有效语音帧；

对所述有效语音帧进行处理，得到自然语言文本。

其中，有效语音内容可以是对语言的前后两端的静音内容去除掉之后得到的。在经过去除静音之后，还可以按照时间顺序对语音进行分帧，得到各个帧的语音信息。其中，可以按照每秒25帧或者30帧的数量进行划分。在得到有效语音帧之后，可以对有效语音帧进行进一步的识别处理，得到自然语言文本。本方案通过这样的设置，可以更加准确的得到用户语音的文本内容。

本方案中，可选的，对所述有效语音帧进行处理，得到自然语言文本，包括：

对所述有效语音帧通过线性预测倒谱系数进行特征提取；

采用声学模型和/或语言模型对所提取到的特征进行解码，得到自然语言文本。

具体的，切除两端静音、完成声音分帧。然后通过线性预测倒谱系数(LPCC)进行特征提取，得到包含声音信息的多位向量：

式中，{a

此处线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)是线性预测系数(Linear Prediction Coefficient,LPC)在倒谱域中的表示。该特征是基于语音信号为自回归信号的值设，利用线性预测分析获得倒谱系数。

下一步，根据声学模型、语言模型等对特征进行解码。

在本方案中，可选的，所述声学模型包括隐马尔科夫模型；所述语言模型包括n-gram模型。

声学模型采用隐马尔科夫模型(HMM)：

P(Y)＝∑

Y＝y(0),y(1),…,y(l-1)；

X＝x(0),x(1),…,x(l-1)；

式中，观察到的结果为Y，隐藏条件为X，长度为l；

语言模型采用n-gram模型,假定某一个字的输出只与前面N-1个字出现的概率有关系,模型公式如下：

P(w)＝P(w

根据以上两个模型与词典解码后，产生自然语言文本并作为领域识别步骤的输入。

本方案通过采用上述的已经熟练使用的模型，可以达到提高自然语言文本识别的准确度的效果，能够更加精准的定位老年服务需求。

S120、根据所述自然语言文本，确定目标服务类型。

其中，针对不同的老年服务需求，可以确定目标服务类型。可以理解的，服务类型可以包括多种，可以通过自然语言文本的识别，确定当前老年人的语音内容是需要哪一种服务类型，所确定的服务类型即为目标服务类型。

在本方案中，可选的，所述目标服务类型，包括：养老服务订单、养老服务评价、社区养老活动以及养老服务建议中的至少一种。其中，养老服务订单服务类型和养老服务评价服务类型，是在实际使用过程中最多涉及的，分别可以是订单下单，订单查询，订单区域以及对已完成的订单进行评价等服务功能。社区养老活动和养老服务建议一般较少，但是为了满足老年人的实际需求，可以保留作为对老年人的语音信息的归类中的一种。

在本方案中，可选的，根据所述自然语言文本，确定目标服务类型，包括：

采用TF-IDF算法提取所述自然语言文本的语料特征向量；

将所述语料特征向量输入至支持向量机，根据所述支持向量机的输出结果确定目标服务类型。

具体的，确定目标服务类型的流程如下：

1.使用TF-IDF算法提取用户输入语料的特征：

tfiidf

其中，n

2.根据已预设养老服务领域，将上一步的特征向量输入支持向量机模型(SVM)，输出领域分类。SVM的目标函数：

其中，m为样本个数，w和γ分别为SVM模型超参数，求出以上最优化函数的最优解，从而实现分类

通过采用TF-IDF算法提取特征向量，以及采用支持向量机完成对服务类型的分类，可以实现无需人工介入，准确的对用户的需求进行所属类型的确定的目的。

S130、采用与所述目标服务类型对应的槽位类型对槽位信息进行填充。

其中，槽位类型可以是与目标服务类型相对应的，即如果有四种服务类型，则可以由四种槽位类型。每种槽位类型所需要的槽位信息可以是不同的，如养老服务订单的槽位定义，可以包括服务项目，服务数量，预约时间，支付方式以及用户编号。

在本技术方案中，可选的，采用与所述目标服务类型对应的槽位类型对槽位信息进行填充，包括：

根据所述自然语言文本，采用循环神经网络模型来进行槽位信息填充。

采用循环神经网络(RNN)模型来完成槽位填充。RNN模型定义如下：

本方案可以采用循环神经网络对槽位快速和准确的填充

S140、根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。

如果识别到槽位信息填充完成，或者已经无法再继续填充，则可以根据槽位信息生成养老服务订单。并执行该养老服务订单。

在上述技术方案的基础上，可选的，在确定目标服务类型之后，所述方法还包括：

根据所述自然语言文本，从所述目标服务类型中确定用户意图；

相应的，根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单，包括：

根据已填充的槽位信息以及所述用户意图，生成养老服务订单，并执行所述养老服务订单。

此处，可以通过识别用户输入意图并记录，且不同的意图，会匹配不同的槽位；举例，针对养老服务订单领域，用户的意图包括：生成新订单、取消已有订单、查看订单信息。意图检测模块与领域识别模块处理流程相同，只是输入与输出不同。可以理解的，通过增加意图识别过程，可以更加准确的把握用户的实际意图，提高用户的体验。

在本方案中，可选的，在采用与所述目标服务类型对应的槽位类型对槽位信息进行填之后，和，在根据所述自然语言文本，从所述目标服务类型中确定用户意图之后，所述方法还包括：

根据所述槽位信息，以及所述用户意图，确定执行动作。

其中，所确定的执行动作可以包括继续确认，或者已经确认完成，或者确认失败等操作，执行动作可以做出相应的操作，如继续向用户返回信息作进一步的确认，或者确定信息确认完成，可以根据当前的信息生成订单，或者直接确定信息确认失败，无法下单等。

在上述技术方案的基础上，可选的，所述执行动作包括：执行任务、澄清槽位、确认槽值、匹配失败。

具体的，若所述执行动作为执行服务，则执行：

根据已填充的槽位信息以及所述用户意图，生成养老服务订单，并执行所述养老服务订单。

若所述执行动作为澄清槽位，则根据槽位的槽值信息，发出提问语句；

若所述执行动作为确认槽值，则根据向用户发出待确认槽值信息，供用户确认。

此处，可以根据已记录的槽位填充、意图识别信息进行智能养老服务处理。例如为用户生成养老服务订单、记录养老服务评价等等。

否则，可以根据模板方，将槽位填充信息、待执行对话动作等结构化信息转化为自然语言描述，并生成语音，反馈给用户。该步骤中采用基于模板的方法进行反馈。具体的，可以采用如下操作过程：

步骤1.根据对话状态、待执行动作、槽值对组合进行反馈。如果待执行动作为“澄清槽位”，或者“确认槽值”，则执行语音识别，继续确定响应信息，；如果待执行动作为“完成任务”，执行相应的任务；如果待执行动作为“匹配失败”，则执行步骤4；

步骤2.根据槽位及动作，状态，匹配模板并填充内容，生成应答信息；反馈给用户后，并继续接受用户发出的语音内容并识别；

步骤3.根据所确定的执行动作，执行成功或失败结果，匹配模板并填充内容，生成应答信息后，结束对话流程；

步骤4.返回无法识别应答。

本技术方案，用户接入养老服务对话系统，输入语音内容；系统首先进行语音识别，将语音转换为文本；接着，完成领域识别、槽位填充、意图识别确认用户养老服务需求内容；通过对话状态管理明确后续系统动作；基于动作与模板生成语音回复，最终自动完成相应养老服务业务操作，并结束对话。

图2是本申请实施例提供的另一养老服务的人机对话方法的示意图，如图2所示，该方法包括：

用户主动向系统发起对话，发送语音内容；

系统接收语音内容后，将语音内容转换为自然语言文本；

识别用户输入语音所属的具体领域，并引导用户确认进入对应领域的功能模块；

识别用户输入意图并记录，且不同的意图，会匹配不同的槽位；

接收槽位填充信息及意图识别结果，综合对话信息和历史状态，更新当前对话状态，生产待执行的对话动作；

若待执行动作是“执行任务”，则根据已记录的槽位填充、意图识别信息进行智能养老服务处理；

根据模板方，将槽位填充信息、待执行对话动作等结构化信息转化为自然语言描述，并生成语音，反馈给用户；具体的：i.根据对话状态、待执行动作、槽值对组合进行反馈。如果待执行动作为“澄清槽位”“确认槽值”，如果待执行动作为“完成任务”，执行成功或失败结果，匹配模板并填充内容，生成应答信息后，结束对话流程；如果待执行动作为“匹配失败”，返回无法识别应答。

本方案通过人机对话系统应用于养老服务领域的处理流程：用户接入养老服务对话系统，输入语音内容；系统首先进行语音识别，将语音转换为文本；接着，完成领域识别、槽位填充、意图识别确认用户养老服务需求内容；通过对话状态管理明确后续系统动作；基于动作与模板生成语音回复，最终自动完成相应养老服务业务操作，并结束对话。

图3是本申请实施例提供的养老服务的人机对话系统模块示意图，如图3所示，所述养老服务的人机对话系统包括：用户接入模块、语音识别模块、领域识别模块、意图检测模块、槽位填充模块、对话管理模块、智能养老服务处理模块以及回复处理模块。

本系统可以对客户的语音进行语义分析与理解，识别客户的养老服务需求，智能处理养老服务业务

图4是本申请实施例提供的养老服务的人机对话装置的结构示意图。如图4所示，所述养老服务的人机对话装置包括：

自然语言文本转换模块410，用于接收用户的语音内容，将所述语音内容转换为自然语言文本；

目标服务类型确定模块420，用于根据所述自然语言文本，确定目标服务类型；

槽位信息填充模块430，用于采用与所述目标服务类型对应的槽位类型对槽位信息进行填充；

订单生成模块440，用于根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。

本申请实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种养老服务的人机对话方法，该方法包括：

接收用户的语音内容，将所述语音内容转换为自然语言文本；

根据所述自然语言文本，确定目标服务类型；

采用与所述目标服务类型对应的槽位类型对槽位信息进行填充；

根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。

存储介质——任何的各种类型的存储器电子设备或存储电子设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如DRAM、DDR RAM、SRAM、EDO RAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同未知中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的养老服务的人机对话操作，还可以执行本申请任意实施例所提供的养老服务的人机对话方法中的相关操作。

本申请实施例提供了一种电子设备，该电子设备中可集成本申请实施例提供的养老服务的人机对话装置。图5是本申请实施例提供的一种电子设备的结构示意图。如图5所示，本实施例提供了一种电子设备500，其包括：一个或多个处理器520；存储装置510，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器520执行，使得所述一个或多个处理器520实现本申请实施例所提供的养老服务的人机对话方法，该方法包括：

接收用户的语音内容，将所述语音内容转换为自然语言文本；

根据所述自然语言文本，确定目标服务类型；

采用与所述目标服务类型对应的槽位类型对槽位信息进行填充；

根据已填充的槽位信息生成养老服务订单，并执行所述养老服务订单。

当然，本领域技术人员可以理解，处理器520还实现本申请任意实施例所提供的养老服务的人机对话方法的技术方案。

图5显示的电子设备500仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，该电子设备500包括处理器520、存储装置510、输入装置530和输出装置540；电子设备中处理器520的数量可以是一个或多个，图5中以一个处理器520为例；电子设备中的处理器520、存储装置510、输入装置530和输出装置540可以通过总线或其他方式连接，图5中以通过总线550连接为例。

存储装置510作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块单元，如本申请实施例中的养老服务的人机对话方法对应的程序指令。

存储装置510可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储装置510可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置510可进一步包括相对于处理器520远程设置的存储器，这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置530可用于接收输入的数字、字符信息或语音信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏、扬声器等电子设备。

本申请实施例提供的电子设备，可以通过人机对话的手段，快速的对养老服务需求进行识别和处理，以达到提高对养老服务需求处理效率，并降低养老服务的人力成本的目的。

上述实施例中提供的养老服务的人机对话装置、存储介质及电子设备可执行本申请任意实施例所提供的养老服务的人机对话方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的养老服务的人机对话方法。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：何颖妮;周春春;
专利申请人：中国建设银行股份有限公司;

上一篇：一种PEA检测用的试剂盒及其使用方法
下一篇：一种配电网动态重构中的时段划分方法