掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本申请涉及自然语言处理技术领域,特别涉及一种语义识别方法及设备。

背景技术

当前智能设备在利用文本或语音对用户的用户语义进程识别判断时,在其语义识别库中大多仅定义一些地点、事件、物品的标准词,如在通用词典库中定义的地点有会议室、咖啡厅、卫生间、电梯、办公室等标准词,智能设备在引领导航场景下能对其进行识别即可明白用户的意图并将其带导航至对应地点。

但是对于一个标准词,在不同的场景下如在不同企业中应用的场景下都可能有不同的别称,如“咖啡厅”这个标准词应用在不同企业的场景下的导航系统,即在A企业中,“咖啡厅”成为“彼岸”,在B企业中,“咖啡厅”称为“啡博士”,因此智能设备用在不同场景时,需要能够正确理解特定场景中的指定地点的别称(即地点对应的同义词),进而能够正确理解用户的真实语义并将其导航到正确的地点。

综上所述,智能设备在对获取的文本信息进行语义解析时,对一些词语在不同应用场景中的同义词无法准确识别,进而导致对文本信息的语义解析结果不准确的问题。

发明内容

本申请提供一种用户语义识别方法及设备,用以解决现有技术中,智能设备在对获取的文本信息进行语义解析时,对一些词语在不同应用场景中的同义词无法准确识别,进而导致对文本信息的语义解析结果不准确的问题。

第一方面,本申请提供一种语义识别方法,该方法包括:

确定获取到的文本信息中需要进行同义词识别的待识别词语;

对于每个待识别词语,根据预设的同义词语映射关系,确定与所述待识别词语同义的目标词语;

根据所确定的目标词语,确定所述文本信息的语义解析结果。

上述方法,通过预设的同义词语映射关系,搜索待识别词语同义的能被理解的目标词语,根据搜索到的目标词语能确定文本信息的真实语义解析结果,进而理解用户的真实意图。

在一种可能的实现方式中,确定获取到的文本信息中需要进行同义词识别的待识别词语,包括:

对所述文本信息进行槽位解析,得到各槽位项对应的槽位值,将所得到的槽位值确定为所述待识别词语。

在一种可能的实现方式中,对所述文本信息进行槽位解析,包括:

通过文本规则匹配方式,对所述文本信息进行槽位解析;或者

通过自然语言理解NLU模型,对所述文本信息进行槽位解析。

在一种可能的实现方式中,根据预设的同义词语映射关系,确定与所述待识别词语同义的目标词语,包括:

根据智能设备的属性信息以及同义词库配置的生效范围,确定对于所述智能设备有效的目标同义词库;

根据所述目标同义词库中包含的同义词语映射关系,确定与所述待识别词语同义的词语为目标词语。

在一种可能的实现方式中,所述同义词库包括专属同义词库和通用同义词库;根据所述目标同义词库中包含的同义词语映射关系,确定与所述待识别词语同义的词语为目标词语,包括:

若所述目标同义词库为专属同义词库,根据所述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词为目标词语;和/或

若所述目标同义词库为通用同义词库,根据所述通用同义词库中包含的各标准词以及所述标准词的同义词,确定与所述待识别词语同义的标准词为目标词语。

在一种可能的实现方式中,所述目标同义词库包括专属同义词库和通用同义词库,根据所述目标同义词库中包含的同义词语映射关系,确定与所述待识别词语同义的词语为目标词语,包括:

分别根据所述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词为目标词语,及根据通用同义词库中包含的各标准词以及所述标准词的同义词,确定与所述待识别词语同义的标准词;或者

根据所述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词,若任一所述专属同义词库中均不存在与所述待识别词语同义的专属词,再根据所述通用同义词库中包含的各标准词以及所述标准词的同义词,确定与所述待识别词语同义的标准词。

在一种可能的实现方式中,若有效的目标同义词库包括多个专属同义词库,根据所述目标同义词库中包含的同义词语映射关系,确定与所述待识别词语同义的词语为目标词语,包括:

按照专属同义词库的优先级从高到低的顺序,依次在所述多个专属同义词库中,根据所述多个专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词为目标词语;或者

分别在所述多个专属同义词库中,根据所述多个专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词,若确定出多个与所述待识别词语同义的专属词时,确定最高优先级的专属同义词库中的专属词为目标词语。

在一种可能的实现方式中,根据所确定的目标词语,确定所述文本信息的语义解析结果之前,还包括:

若确定任一待识别词语的目标词语为至少两个,控制智能设备输出提示信息,所述提示信息用于提示对所述至少两个目标词语进行选择;

根据所述智能设备获取到的反馈信息,确定被选择的目标词语为所述任一待识别词语最终语义解析的目标词语。

在一种可能的实现方式中,所述同义词库配置的生效范围,包括如下至少一种:

对于指定设备生效、对于指定企业生效、对于指定业务线生效、对于指定应用程序生效、对于指定领域生效、以及对于所有设备生效。

第二方面,本申请还提供一种语义识别装置,该装置包括:

确定单元,用于确定获取到的文本信息中需要进行同义词识别的待识别词语;

同义词识别单元,用于对于每个待识别词语,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语;

解析单元,用于根据所确定的目标词语,确定文本信息的语义解析结果。

在一种可能的实现方式中,确定单元具体用于:对所述文本信息进行槽位解析,得到各槽位项对应的槽位值,将所得到的槽位值确定为所述待识别词语。

确定单元用于,通过文本规则匹配方式,对所述文本信息进行槽位解析;或者通过NLU模型,对所述文本信息进行槽位解析。

在一种可能的实现方式中,同义词识别单元具体用于:根据智能设备的属性信息以及同义词库配置的生效范围,确定对于所述智能设备有效的目标同义词库;根据所述目标同义词库中包含的同义词语映射关系,确定与所述待识别词语同义的词语为目标词语。

在一种可能的实现方式中,所述同义词库包括专属同义词库和通用同义词库;所述同义词识别单元具体用于:若所述目标同义词库为专属同义词库,根据所述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词为目标词语;和/或

若所述目标同义词库为通用同义词库,根据所述通用同义词库中包含的各标准词以及所述标准词的同义词,确定与所述待识别词语同义的标准词为目标词语。

在一种可能的实现方式中,所述目标同义词库包括专属同义词库和通用同义词库,所述同义词识别单元具体用于:分别根据所述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词为目标词语,及根据所述通用同义词库中包含的各标准词及所述标准词的同义词,确定与所述待识别词语同义的标准词;或者

根据所述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词,若任一所述专属同义词库中均不存在与所述待识别词语同义的专属词,再根据所述通用同义词库中包含的各标准词以及所述标准词的同义词,确定与所述待识别词语同义的标准词。

在一种可能的实现方式中,所述同义词单元具体用于:按照专属同义词库的优先级从高到低的顺序,依次在所述多个专属同义词库中,根据所述多个专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词为目标词语;或者

分别在所述多个专属同义词库中,根据所述多个专属同义词库中包含的各专属词以及所述专属词的同义词,确定与所述待识别词语同义的专属词,若确定出多个与所述待识别词语同义的专属词时,确定最高优先级的专属同义词库中的专属词为目标词语。

在一种可能的实现方式中,所述同义词识别单元还用于:根据所确定的目标词语,确定所述文本信息的语义解析结果之前,若确定任一待识别词语的目标词语为至少两个,控制智能设备输出提示信息,所述提示信息用于提示对所述至少两个目标词语进行选择;根据所述智能设备获取到的反馈信息,确定被选择的目标词语为所述任一待识别词语最终语义解析的目标词语。

第三方面,本申请提供一种电子设备,该设备包括处理器和存储器,其中,所述存储器存储可执行程序,所述程序执行时,所述处理器实现第一方面所述方法的步骤。

第四方面,本申请还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理单元执行时实现第一方面所述方法的步骤。

第五方面,本申请实施例提供的一种计算机程序产品,包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现第一方面所述方法的步骤。

另外,第二方面和第五方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种语义识别的方法示意图;

图2为本申请实施例提供的一种对文本信息进行槽位解析的过程示意图;

图3为本申请实施例提供的一种语义识别的完整过程示意图;

图4为本申请实施例提供的一种电子设备的设备示意图;

图5为本申请实施例提供的一种语义识别装置的示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

下面对文中出现的一些词语进行解释:

1、本申请实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

2、本申请实施例中的智能设备可以是具有一定功能的智能机器人,如具有引领功能、接待功能、导览功能、讲解功能、聊天功能、业务查询功能、播放音乐等功能的智能设备等,智能设备也可以为便携设备(例如:手机、平板、笔记本电脑等)或者个人电脑(PC,Personal Computer),还可以是智能音箱等,本发明实施例中不对智能设备的具体形式进行限定。

本申请实施例描述的应用场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。

当前的智能设备中大多定义一些通用的词语,具有一些通用的词典,智能设备能够理解这些通用的词典中的词语,比如在通用的词典中定义了“卫生间”和“电梯”,具有一定功能(如接待功能)的智能设备便可以理解词语“卫生间”和“电梯”,并可以根据文本信息理解用户的意图,如文本信息为“请带我去电梯”,智能设备便可以理解用户的意图,并将其带引导到电梯的地点,但是一些词语常常有不止一种的通用表达形式,如“卫生间”,通常也被表达成“洗手间”、“厕所”、“WC”、“茅厕”等词语,此时,若智能设备采集到的地点词是“WC”、“厕所”和“茅厕”时,则不能理解这些词语,进而不能正确理解用户意图。

另外,不同的企业会有自己专属的词语,以地点名称为例,不同的企业有不同的专属地点名称,比如在A企业“咖啡厅”叫做“彼岸”,在B企业“咖啡厅”叫做“啡博士”,智能设备需要能够正确理解不同企业中的专属地点名称,因此,本申请为了能够正确理解用户的真实语义,并对用户语义做出对应的回应,提供了一种基于同义词的语义识别方法,该方法中,首先获取文本信息,并确定获取到的文本信息中需要进行同义词识别的待识别词语,进而对于每个待识别词语,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语,具体可以基于目标同义词库包含的同义词语映射关系确定与上述待识别词语同义的目标词语,进而根据所确定的目标词语,确定上述文本信息的语义解析结果。

应当说明的是,本申请实施例中的智能设备均指具有一定功能的智能设备,可以但不局限于包括具有引导功能、查询功能、播放音乐等功能的智能设备等。

本申请中通过预先构建同义词库的方式,实现根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语,上述同义词库中保存有上述预设的同义词语映射关系,以下首先对上述构建的同义词库进行说明:

在本申请中可以基于表达同一语义的标准词与同义词的关系构建一个通用同义词库,用以保存能被理解的标准词(标准词为在表达语义时常用的词语,如卫生间、咖啡厅、地铁站等),且上述通用同义词库中保存有各标准词以及上述标准词的同义词(如上述标准词为“卫生间”时,与其表达同一语义的同义词为“WC”、“厕所”、“茅厕”)作为预设的同义词语映射关系,当确定待识别词语后,根据预设的各标准词以及上述标准词的同义词映射关系,分别确定与各个待识别词语同一语义的目标词语,如待识别词语为标准词“卫生间”时,根据预设的同义词映射关系查询不到“卫生间”同义的目标词语,此时将标准词“卫生间”确定为目标词语,待识别词语为“WC”或者“厕所”时,根据预设的映射关系,确定与其同一语义的标准词“卫生间”为目标词语。

其中,还可以基于应用场景的不同,构建一个或多个专属同义词库,上述专属同义词库,用以保存在特定应用场景下能被理解的专属词(专属词为在特定应用场景下,表达语义时专用的表达词语,如在不同的企业下,“咖啡厅”可能对应词语“啡博士”、“彼岸”等,此时,“啡博士”、“彼岸”即为专属词),且上述每个专属同义词库中保存有各专属词以及上述专属词的同义词作为预设的同义词语映射关系;当确定待识别词语后,根据专属同义词库中预设的同义词语映射关系,分别确定与各个待识别词语同义的目标词语,如待识别词语为专属词“啡博士”时,根据预设的同义词映射关系查询不到专属词“啡博士”同一语义的目标词语,此时即将专属词“啡博士”确定为目标词语,待识别词语为“咖啡厅”时,根据预设的同义词映射关系,确定与其同一语义的专属词“啡博士”为目标词语。

其中,在每个同义词库(包括通用同义词库和专属同义词库)中,与同一个基准词或专属词具有同一语义的同义词可以为1个,也可以为多个;且可以但不局限于,将上述每个同义词库中预设的同义词映射关系保存为一张同义词语映射表。上述同义词语映射表可以但不局限于为如下表1或表2的形式:

表1:

在上述表1中,位于同一行的标准词和同义词具有同一语义,空格表示不存在多余的同义词,其中,对于标准词1而言,具有2个同义词(即同义词11和同义词12),对于标准词2而言,具有1个同义词(即同义词21),对于标准词n而言,具有2个同义词(即同义词n1和同义词n2)或者更多。

表2:

在上述表2中,位于同一行的专属词和同义词具有同一语义,空格表示不存在多余的同义词,其中,对于专属词1而言,具有2个同义词(即同义词11和同义词12),对于专属词2而言,具有1个同义词(即同义词21),对于专属词n而言,具有2个同义词(即同义词n1和同义词n2)或者更多。

进一步,在预先构建了多个同义词库时,为了更好地区分每个同义词库的适用范围,为每个同义词库(包括通用同义词库和/或专属同义词库)配置生效范围。

上述任一同义词库的生效范围可以但不局限于包括:

1)设备级生效。

设备级生效指示对于指定设备生效,可以根据场景需要或实际需要,配置上述任一同义词库生效范围为对于指定设备(即上述智能设备)生效,如配置同义词库1的生效范围为智能设备A和智能设备B,同义词库2的生效范围为智能设备C,则对于智能设备B而言,对其生效的同义词库为同义词库1。

设备级生效还可以指示对于指定设备类型的设备生效,可以根据场景需要或实际需要,配置上述任一同义词库生效范围为对于指定设备类型的设备生效,如智能设备A和智能设备B的设备类型都为设备类型a,智能设备C的设备类型都为设备类型b,当配置同义词库1的生效范围为设备类型a时,则对于智能设备A和智能设备B而言,同义词库1都生效;

其中,上述指定设备类型可以但不局限于为指定功能的设备等,如具有引领功能的智能设备等。

2)企业级生效。企业级生效指示对指定企业生效,可以根据场景需要或实际需要,配置上述任一同义词库生效范围为对于指定企业的设备生效,如配置同义词库1的生效范围为企业A,同义词库2的生效范围为企业B,则对于企业A下的智能设备而言,对其生效的同义词库为同义词库1,而对于企业B下的智能设备而言,对其生效的同义词库为同义词库2。

3)业务线级生效。业务线级生效指示对指定业务线生效,可以根据场景需要或实际需要,配置上述任一同义词库生效范围为对于指定业务线的设备生效,如配置同义词库1的生效范围为业务线A,同义词库2的生效范围为业务线B,则对于业务线A下的智能设备而言,对其生效的同义词库为同义词库1。

4)应用程序级生效。应用程序级生效指示对指定应用程序生效,可以根据场景需要或实际需要,配置上述任一同义词库生效范围为对于指定应用程序的设备生效,如配置同义词库1的生效范围为应用程序A,同义词库2的生效范围为应用程序B,则对于执行应用程序A的智能设备而言,对其生效的同义词库为同义词库1。

5)领域级生效。领域级生效指示对指定领域生效,可以根据场景需要或实际需要,配置上述任一同义词库生效范围为对于指定领域的设备生效,如配置同义词库1的生效范围为领域A,同义词库2的生效范围为领域B,则对于领域A下的智能设备而言,对其生效的同义词库为同义词库1。

6)对所有设备生效。可以配置上述任一同义词库生效范围为对所有设备生效,如配置同义词库1的生效范围为对所有设备生效,则对于任一智能设备而言,同义词库1都对其生效。

进一步地,可以根据上述生效范围设置同义词库的优先级,可以但不局限于将同义词库的优先级的先后顺序设置为按照如下顺序:

优先级从高到低的顺序依次为:对于指定设备生效的同义词库、对于指定企业生效的同义词库,对于指定应用程序生效的同义词库、对于指定业务线生效的同义词库,对于指定领域生效的同义词库、对于所有设备生效的同义词库。

应当理解的是,上述多个专属同义词库的生效范围越小,其优先级越高,上述同义词库的优先级按照从前至后的顺序,优先级依次递减。

需要说明的是,上述各个同义词库可以保存在其生效的智能设备中,也可以保存在服务器中。

下面结合说明书附图及上述同义词库对本申请实施例做进一步详细描述。

首先需要说明的是,本申请实施例提供的一种语义识别方法中,先确定文本信息中需要进行同义词识别的待识别词语,进而根据保存的各个同义词库中预设的同义词语映射关系,确定与上述待识别词语同义的目标词语;在确定出与待识别词语同义的目标词语后,可以但不局限于根据该目标词语确定文本信息的语义解析结果,且确定与所述语义解析结果对应的响应数据,从而控制智能设备输出该响应数据。

本申请实施例所提供的方法的执行主体可以是智能设备的控制器,也可以是服务器,本申请不对执行主体进行限定。

以下仅以服务器作为执行主体,对本申请提供的语义识别方法进行示例性详述,如图1所示,本实施例提供的一种语义识别方法,具体包括以下步骤:

步骤S101,确定获取到的文本信息中需要进行同义词识别的待识别词语。

在本步骤之前,可以获取智能设备直接向服务器上传的文本信息,或者获取智能设备上传的语音信息,并通过语音识别模块对上述语音信息进行识别,获得该语音信息对应的文本信息。

其中,上述智能设备上传的文本信息,可以是智能设备直接获取的文本信息,也可以是智能设备对获取的语音信息进行处理得到的文本信息。

其中智能设备可以通过语音采集装置获取语音信息,通过显示模块获取直接获取文本信息,对上述语音采集装置和显示模块不做过多限定,本领域的技术人员可根据实际需求获取,如采用麦克风作为上述语音采集装置,采用液晶交互显示屏作为上述显示模块。

可选地,在本步骤中,服务器可以对上述文本信息进行槽位解析,得到各槽位项对应的槽位值,可以但不局限于将所得到的各个槽位值确定为上述待识别词语,其中可以但不局限于通过如下方式对文本信息进行槽位解析:

槽位解析方式1:通过文本规则匹配方式,对上述文本信息进行槽位解析;

槽位解析方式2:通过自然语言理解NLU模型,对上述文本信息进行槽位解析。

在以槽位解析的方式确定上述步骤S101中的待识别词语之后,进入如下步骤102。

步骤S102,对于每个待识别词语,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语。

根据本申请实施例的上述内容可知,上述预设的同义词语映射关系可以但不局限于包括:专属同义词库中保存的各专属词以及上述专属词的同义词之间的映射关系、通用同义词库中保存的各标准词以及上述标准词的同义词映射关系;以及为每个同义词库(包括上述通用同义词库和专属同义词库)配置生效范围。

其中,在本实施例步骤S101之前,智能设备向服务器上传文本信息或者语音信息时,可以同时向服务器上传该智能设备的属性信息。

上述智能设备的属性信息用以标识上述智能设备的身份信息以及适用场景等,上述属性信息可以但不局限于包括:设备身份标识ID、设备类型、设备归属企业等。

在本步骤中,可以但不局限于通过如下方式,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语:

根据智能设备的属性信息以及同义词库配置的生效范围,确定对于上述智能设备有效的目标同义词库;

根据上述目标同义词库中包含的同义词语映射关系,确定与上述待识别词语同义的词语为目标词语。

以下对上述确定对于上述智能设备有效的目标同义词库进行示例性说明:

若配置了同义词库1-3,其中同义词库1的生效范围为智能设备A和智能设备B,同义词库2的生效范围为企业A,同义词库3的生效范围为企业B,同时获知智能设备B归属的企业为企业A;此时,根据智能设备的属性信息以及各同义词库配置的生效范围,确定对于智能设备B有效的目标同义词库为同义词库1和同义词库2。

此处需要说明的是,对上述智能设备有效的目标同义词库可能为1个,也可能为多个。

以下对上述确定与上述待识别词语同义的词语为目标词语进行示例性说明:

如当确定的目标同义词库为通用同义词库,且确定的待识别词语为“WC”时,可以根据标准词“卫生间”以“卫生间”和“WC”之间的映射关系,确定“卫生间”为“WC”的目标词语;

如当确定的目标同义词库为生效范围为企业A的某个专属同义词库,且确定的待识别词语为“电梯”时,可以根据专属词“电梯A”(此处的“电梯A”为“电梯”在企业A中的专属地点名称)以及该专属同义词库中“电梯A”和“电梯”之间的映射关系,确定“电梯A”为“电梯”的目标词语;当确定的目标同义词库为生效范围为企业B的某个专属同义词库,且确定的待识别词语为“电梯”时,可以根据专属词“电梯B”(此处的“电梯B”为“电梯”在企业B中的专属地点名称)以及该专属同义词库中“电梯B”和“电梯”之间的映射关系,确定“电梯B”为“电梯”的目标词语。

确定待识别词语的目标词语之后,执行如下步骤S103;

步骤S103,根据所确定的目标词语,确定上述文本信息的语义解析结果。

具体实施中,如上述步骤S101中获取的文本信息为“请带我去WC”,确定的待识别词语为“WC”,步骤S102中确定“WC”的目标词语为“卫生间”,则此步骤将“WC”映射为上述目标词语“卫生间”。

进一步,基于上述语义解析结果确定文本信息对应的响应数据,并控制对应的智能设备输出该响应数据;

本领域的技术人员可以根据实际需求设置上述响应数据的输出形式,如可以但不局限于将上述响应数据设置为控制指令(例如引领、跳舞等)、语音播报、文本显示、多媒体播放(音频、视频、图片等)等的形式输出。

在一种可能的实施方式中,如图2所示,在本申请实施例中的上述步骤S101中,主要包括以下几个步骤:

步骤S201,对文本信息进行领域识别,确定上述文本信息对应的领域;

步骤S202,对上述文本信息进行意图识别,确定上述文本信息对应的意图类别;

步骤S203,对上述文本信息进行槽位抽取,确定抽取出的槽位对应的槽位值为上述待识别词语。

其中,领域(domain),是指同一类型的数据或者资源,以及围绕这些数据或资源提供的服务,比如导航、百科、天气、音乐、火车票、闲聊等。意图(intent),是通过用户的交互输入识别出的用户所要表达的目的。通常,意图是指对于领域数据的操作,一般以动宾短语来命名,比如询问天气、查找音乐、购买火车票等。槽位(slot),是将初步用户意图转化为明确用户指令所需要补全的信息。一个槽位与一件事情的处理中所需要获取的一种信息相对应。例如,要想执行查看天气的任务,需要知道地点、时间这些必要的元素,这些必要元素就是槽位。

在另一种可能的实施方式中,还可以通过如下方法确定上述步骤S101确定文本信息中的待识别词语:

对所述文本信息进行槽位解析,得到各槽位项对应的槽位值,将在对智能设备生效的通用词典中查询不到的槽位值确定为待识别词语。

应当理解的是,在上述确定待识别词语的方法中,服务器在获取智能设备上传的文本信息时,同时获取上述智能设备的属性信息,并根据上述智能设备的属性信息以及预设的通用词典的生效范围,确定预设的通用词典中对该智能设备生效的通用词典;进而在该生效的通用词典中查找上述各槽位值,将未在该生效的通用词典中查找到的槽位值确定为待识别词语。

其中,上述智能设备的属性信息用以标识上述智能设备的身份信息以及适用场景等,上述属性信息可以但不局限于包括:设备身份标识ID、设备类型、设备归属企业等。

在一种可能的实现方式中,可以基于通用的表达词语构建上述通用词典,如可在上述通用词典中保存针对指定智能设备通用的表达词语(如卫生间、咖啡厅、地铁站等),也可以基于应用场景的不同,构建一个或多个针对指定智能设备的通用词典,且上述通用词典可以包括地点名称词典,可在上述通用词典中保存指定企业下的多个专属的表达词语,以地点名称词典为例,不同的企业有不同的专属地点名称,比如在A企业“咖啡厅”叫做“彼岸”,在B企业“咖啡厅”叫做“啡博士”,可以在A企业生效的地点名称词典中,保存专属地点名称“彼岸”,在A企业生效的地点名称词典中,保存专属地点名称“啡博士”。

上述预设的通用词典的生效范围可参照上述同义词库的生效范围进行设置,此处不再做重复叙述。

在本申请实施例中的上述步骤S102中,在对任一待识别词语进行同义词识别时,对于上述智能设备有效的目标同义词库可能为通用同义词库,也可能为专属同义词库,且上述有效的目标同义词库可能为一个或多个,以下提供几个具体的可能的情况,对不同情况下根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语进行说明:

情况1)上述有效的目标同义词库仅为一个,该情况下,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语,具体包括:

上述目标同义词库为专属同义词库时,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语;和/或

若上述目标同义词库为通用同义词库,根据上述通用同义词库中包含的各标准词以及上述标准词的同义词,确定与上述待识别词语同义的标准词为目标词语。

情况2)上述有效的目标同义词库既包括专属同义词库和通用同义词库时,该情况下,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语,可以但不局限于如下两种方式:

目标词语确定方式1:分别根据上述专属同义词库中各专属词所映射的同义词,确定与上述待识别词语同义的专属词为目标词语,及在通用同义词库中根据各标准词所映射的同义词,确定与上述待识别词语同义的标准词;

具体实施中,若目标同义词库既包括专属同义词库和通用同义词库,可以同时分别在专属同义词库和通用同义词库中进行同义词识别,以确定与上述待识别词语同义的目标词语。

进一步的,若仅在任一同义词库识别得到上述待识别词语同义的词语(如标准词或专属词),则将识别得到的词语确定为目标词语;若在专属同义词库和通用同义词库均识别得到上述待识别词语同义的词语,则根据同义词库的优先级,选择优先级高的同义词库中识别得到的词语确定为目标词语。由于专属同义词库的优先级高于通用同义词库,因此,可将在专属同义词库中识别得到的词语确定为目标词语。

举例说明,若根据智能设备的属性信息以及各同义词库的生效范围,确定专属同义词库1以及通用同义词库均为目标同义词库,且待识别词语为“WC”时,可根据专属同义词库1中预设的同义词语映射关系,在专属同义词库1中搜索与“WC”同义的专属词,若搜索到与“WC”同义的专属词,将该专属词确定为“WC”的目标词语;同时根据通用同义词库中预设的同义词语映射关系,在通用同义词库中搜索与“WC”同义的标准词,若搜索到与“WC”同义的专属词或与“WC”同义的标准词时,将该标准词确定为“WC”的目标词语。

目标词语确定方式2:在上述专属同义词库中各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词,若任一上述专属同义词库中均不存在与上述待识别词语同义的专属词,再在上述通用同义词库中根据各标准词以及上述标准词的同义词,确定与上述待识别词语同义的标准词。

具体实施中,若目标同义词库既包括专属同义词库和通用同义词库,可以先在专属同义词库中进行同义词识别,若在上述专属同义词库中识别得到上述待识别词语同义的专属词,则将该专属词确定为上述待识别词语同义的目标词语;若在任一专属同义词库中都未识别得到上述待识别词语同义的词语(专属词),则再在通用同义词库中进行同义词识别,以确定与上述待识别词语同义的目标词语。

进一步的,若仅在任一专属同义词库识别得到上述待识别词语同义的专属词,则将识别得到的专属词确定为目标词语;若在多个专属同义词库均识别得到上述待识别词语同义的专属词,则根据专属同义词库的优先级,选择优先级高的专属同义词库中识别得到的专属词确定为目标词语。

举例说明,若根据智能设备的属性信息以及各同义词库的生效范围,确定专属同义词库1、专属同义词库2以及通用同义词库均为目标同义词库,且待识别词语为“WC”时,可以先根据专属同义词库1以及专属同义词库2中预设的同义词语映射关系,在专属同义词库1中和专属同义词库2中搜索与“WC”同义的专属词,确定在专属同义词库1中和专属同义词库2中搜索到与“WC”同义的专属词时,将上述与“WC”同义的专属词作为“WC”的目标词语;确定在专属同义词库1中和专属同义词库2中都未搜索到与“WC”同义的专属词时,再根据通用同义词库中预设的同义词语映射关系,在通用同义词库中搜索与“WC”同义的标准词,若搜索到与“WC”同义的标准词,将与“WC”同义的标准词确定为“WC”的目标词语。

其中,上述情况1)和情况2)中,当上述有效的目标同义词库仅包括多个专属同义词库,可以但不局限于按照如下任一方式根据上述目标同义词库中包含的同义词语映射关系,确定与上述待识别词语同义的词语为目标词语:

1)按照多个专属同义词库的优先级从高到低的顺序,依次在上述优先级最高的专属同义词库中,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语;

具体实施中,若目标同义词库包括多个专属同义词库,可以根据多个专属同义词库的优先级从高到低的顺序,先在优先级最高的专属同义词库中进行同义词识别,若在上述专属同义词库中识别得到上述待识别词语同义的专属词,则将该专属词确定为上述待识别词语同义的目标词语;若在上述优先级最高的专属同义词库中未识别得到上述待识别词语同义的专属词,则再在优先级次高的专属同义词库中进行同义词识别,以此类推,直至在某一专属同义词库识别得到上述待识别词语同义的专属词,或者,直至确定所有的专属同义词库中均未识别得到上述待识别词语同义的专属词。

举例说明,若设定专属同义词库的优先级从高到低的顺序为:对于指定设备生效的同义词库、对于指定企业生效的同义词库,对于指定应用程序生效的同义词库。

已知目标同义词库包括专属同义词库1、专属同义词库2和专属同义词库3,并且专属同义词库1的生效范围为对于指定设备生效,专属同义词库2的生效范围为对于指定应用程序生效,专属同义词库3的生效范围为对于指定企业生效,则此时按照优先级从高到低的顺序,依次在专属同义词库1、专属同义词库3以及专属同义词库2中查找待识别词语同义的专属词为目标词语。

2)同时根据在上述多个专属同义词库中,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定是够存在与上述待识别词语同义的专属词,在确定出多个与上述待识别词语同义的专属词时,确定最高优先级的专属同义词库中的专属词为目标词语。

具体实施中,若目标同义词库包括多个专属同义词库,可同时分别在上述多个专属同义词库中进行同义词识别,若仅在任一专属同义词库识别得到上述待识别词语同义的专属词,则将识别得到的专属词确定为目标词语;若在多个专属同义词库均识别得到上述待识别词语同义的专属词,则根据专属同义词库的优先级,选择优先级高的专属同义词库中识别得到的专属词确定为目标词语。

举例说明,若设定专属同义词库的优先级从高到低的顺序为:对于指定设备生效的同义词库、对于指定企业生效的同义词库,对于指定应用程序生效的同义词库。已知目标同义词库包括专属同义词库1、专属同义词库2和专属同义词库3,并且专属同义词库1的生效范围为对于指定设备生效,专属同义词库2的生效范围为对于指定应用程序生效,专属同义词库3的生效范围为对于指定企业生效,则此时同时在专属同义词库1、专属同义词库3以及专属同义词库2中查找待识别词语同义的专属词为目标词语,若分别在专属同义词库1和专属同义词库2中查找到了与待识别词语同义的专属词1和专属2,此时将优先级最高的专属同义词库1中查找到的专属词1确定为该待识别词语的目标词语。

基于上述任一具体的实施例,在确定出与上述待识别词语同义的目标词语之后,且根据所确定的目标词语,确定上述文本信息的语义解析结果之前,该方法还包括:

若确定任一待识别词语的目标词语为至少两个,控制智能设备输出提示信息,上述提示信息用于提示对上述至少两个目标词语进行选择;

根据上述智能设备获取到的反馈信息,确定被选择的目标词语为上述任一待识别词语最终语义解析的目标词语。

其中,可以控制智能设备按照如下方式输出提示信息:

提示信息输出方式1)控制智能设备通过语音播报的方式向用户发出语音提示信息;

对语音播报的装置不做过多限定,本领域的技术人员可根据实际需求获取,如采用喇叭作为上述语音播报装置。

提示信息输出方式2)控制智能设备通过显示模块输出显示文本信息形式的提示信息;

对上述显示设备不做过多限定,本领域的技术人员可根据实际需求获取,如采用液晶交互显示屏作为上述交互显示设备。

对应地,智能设备可以根据如下方式获得反馈信息:

反馈信息获取方式1)通过智能设备的语音采集装置获取用户发出的语音反馈信息。

反馈信息获取方式2)通过智能设备的显示设备获取文本信息形式的反馈信息。

为了便于理解本实施例提供的语义识别方法,以下提供一个示例性的完整过程的说明,本实施例中以地点名称为例进行说明。如图3所示,具体包括:

步骤S301,通过智能设备获取文本信息;

步骤S302,通过语义理解系统领域分类模块对文本信息进行领域识别,确定上述文本信息对应的领域;

步骤S303,通过意图分类模块对文本信息进行意图识别,确定上述文本信息对应的意图类别;

步骤S304,对上述文本信息进行槽位抽取,确定抽取出的槽位对应的地点名称;

本示例中,仅以地点名称作为槽位对应的槽位值为例进行说明;

步骤S305,判断在对该智能设备有效的地点名称词典中是否查找到上述地点名称,若查未查找到,进入步骤S306;否则,进入步骤309;

步骤S306,确定在有效的地点名称词典中查询不到的地点名称为待识别词语,并根据智能设备的属性信息以及各个同义词库的生效范围,确定有效的目标同义词库;其中,上述目标同义词库可以是通用同义词库和/或一个或多个专属同义词库;

步骤S307,在目标同义词库中,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语;

其中,目标同义词库为通用同义词库时,若文本信息为“带我去厕所”,槽位解析确定待识别词语为“厕所”且上述有效的地点名称词典中未查询到“厕所”,此时根据通用同义词库中各标准词以及上述标准词的同义词的映射关系,将“厕所”映射为标准词“卫生间”,同理文本信息为“带我去WC”时,可以将“WC”映射为标准词“卫生间”,即标准词“卫生间”为上述待识别词语的目标词语。

目标同义词库为对企业A生效的专属同义词库时,若槽位解析确定待识别词语为“咖啡厅”且在有效的地点名称词典中未查询到“咖啡厅”,此时根据企业A生效的专属同义词库中各专属词以及上述标准词的同义词的映射关系,将“咖啡厅”映射为专属词“啡博士”,同理可根据企业B生效的专属同义词库中同义词的映射关系,将“咖啡厅”映射为企业B咖啡厅的专属词“彼岸”;同理,若企业A和企业B分别将“电梯”配置成专属词“电梯A”和“电梯B”,此处,根据对企业A生效的专属同义词库可将“电梯”映射为“电梯A”,根据对企业B生效的专属同义词库可将“电梯”映射为“电梯B”。

步骤S308,根据确定的目标词语确定上述文本信息的语义解析结果;

步骤S309,根据查找到的地点名称确定上述文本信息的语义解析结果。

如文本信息为“带我去卫生间”,抽取出的槽位对应的地点名称为“卫生间”,且有效的地点词典中查询到“卫生间”,此时可以直接确定该文本信息的语义解析结果为“带我去卫生间”。

本申请提供的语义识别方法中,可以针对应用在特定场景下表达一定含义的专属词进行同义词的识别,进而使得智能设备能够解析出获取的文本信息的真实语义,并根据上述文本信息的真实语义得知用户的意图,以便智能设备正确地对上述文本信息作出回应,如播放用户想听的音乐,将用户引领到指定地点以及回答用户的询问能,给用户提供更好的体验。

如图4所示,基于相同的发明构思本发明实施例还提供一种电子设备,该设备包括处理器401和存储器402,其中,上述存储器存储可执行程序,上述程序执行时,上述处理器实现如下过程:

确定获取到的文本信息中需要进行同义词识别的待识别词语;

对于每个待识别词语,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语;

根据所确定的目标词语,确定上述文本信息的语义解析结果。

可选地,上述处理器具体用于,对上述文本信息进行槽位解析,得到各槽位项对应的槽位值,将所得到的槽位值确定为上述待识别词语。

可选地,上述处理器具体用于,通过文本规则匹配方式,对上述文本信息进行槽位解析;或者

通过自然语言理解NLU模型,对上述文本信息进行槽位解析。

可选地,上述处理器具体用于,根据智能设备的属性信息以及同义词库配置的生效范围,确定对于上述智能设备有效的目标同义词库;根据上述目标同义词库中包含的同义词语映射关系,确定与上述待识别词语同义的词语为目标词语。

上述同义词库包括专属同义词库和通用同义词库;可选地,上述处理器具体用于,若上述目标同义词库为专属同义词库,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语;和/或

若上述目标同义词库为通用同义词库,根据上述通用同义词库中包含的各标准词以及上述标准词的同义词,确定与上述待识别词语同义的标准词为目标词语。

上述目标同义词库包括专属同义词库和通用同义词库,可选地,上述处理器具体用于,分别根据上述专属同义词库中包含的各专属词以及所述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语,及在通用同义词库中包含的各标准词以及所述标准词的同义词,确定与上述待识别词语同义的标准词;或者

根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词,若任一上述专属同义词库中均不存在与上述待识别词语同义的专属词,再根据上述通用同义词库中包含的根据各标准词以及上述标准词的同义词,确定与上述待识别词语同义的标准词。

可选地,上述处理器具体用于,按照多个专属同义词库的优先级从高到低的顺序,依次在上述优先级最高的专属同义词库中,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语;或者

同时根据在上述多个专属同义词库中,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定是够存在与上述待识别词语同义的专属词,在确定出多个与上述待识别词语同义的专属词时,确定最高优先级的专属同义词库中的专属词为目标词语。

根据所确定的目标词语,确定上述文本信息的语义解析结果之前,上述处理器还用于:

若确定任一待识别词语的目标词语为至少两个,控制智能设备输出提示信息,上述提示信息用于提示对上述至少两个目标词语进行选择;

根据上述智能设备获取到的反馈信息,确定被选择的目标词语为上述任一待识别词语最终语义解析的目标词语。

可选地,上述同义词库配置的生效范围,包括如下至少一种:

对于指定设备生效、对于指定企业生效、对于指定业务线生效、对于指定应用程序生效、对于指定领域生效、以及对于所有设备生效。

如图5所示,基于相同的发明构思本发明实施例还提供一种语义识别装置,该装置包括:

确定单元501,用于确定获取到的文本信息中需要进行同义词识别的待识别词语;

同义词识别单元502,用于对于每个待识别词语,根据预设的同义词语映射关系,确定与上述待识别词语同义的目标词语;

解析单元503,用于根据所确定的目标词语,确定上述文本信息的语义解析结果。

可选地,上述确定单元具体用于,对上述文本信息进行槽位解析,得到各槽位项对应的槽位值,将所得到的槽位值确定为上述待识别词语。

可选地,上述确定单元具体用于,通过文本规则匹配方式,对上述文本信息进行槽位解析;或者通过NLU模型,对上述文本信息进行槽位解析。

可选地,上述同义词识别单元具体用于:根据智能设备的属性信息以及同义词库配置的生效范围,确定对于上述智能设备有效的目标同义词库;根据上述目标同义词库中包含的同义词语映射关系,确定与上述待识别词语同义的词语为目标词语。

上述同义词库包括专属同义词库和通用同义词库;可选地,上述同义词识别单元具体用于:若上述目标同义词库为专属同义词库,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语;和/或

若上述目标同义词库为通用同义词库,根据上述通用同义词库中包含的各标准词以及上述标准词的同义词,确定与上述待识别词语同义的标准词为目标词语。

上述目标同义词库包括专属同义词库和通用同义词库,可选地,上述同义词识别单元具体用于:分别根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语,及根据上述通用同义词库中包含的各标准词及上述标准词的同义词,确定与上述待识别词语同义的标准词;或者

根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词,若任一上述专属同义词库中均不存在与上述待识别词语同义的专属词,再根据上述通用同义词库中包含的根据各标准词以及上述标准词的同义词,确定与上述待识别词语同义的标准词。

可选地,上述同义词识别单元具体用于:按照多个专属同义词库的优先级从高到低的顺序,依次在上述优先级最高的专属同义词库中,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定与上述待识别词语同义的专属词为目标词语;或者

同时根据在上述多个专属同义词库中,根据上述专属同义词库中包含的各专属词以及上述专属词的同义词,确定是够存在与上述待识别词语同义的专属词,在确定出多个与上述待识别词语同义的专属词时,确定最高优先级的专属同义词库中的专属词为目标词语。

可选地,根据所确定的目标词语,确定上述文本信息的语义解析结果之前,上述同义词识别单还用于:

若确定任一待识别词语的目标词语为至少两个,控制智能设备输出提示信息,上述提示信息用于提示对上述至少两个目标词语进行选择;

根据上述智能设备获取到的反馈信息,确定被选择的目标词语为上述任一待识别词语最终语义解析的目标词语。

可选地,上述同义词库配置的生效范围,包括如下至少一种:

对于指定设备生效、对于指定企业生效、对于指定业务线生效、对于指定应用程序生效、对于指定领域生效、以及对于所有设备生效。

基于相同的发明构思,本申请实施例还提供一种计算机可读非易失性存储介质,包括程序代码,当上述程序代码在计算终端上运行时,上述程序代码用于使上述计算终端执行上述本申请实施例提供的语义识别方法的步骤。

以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。

相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

相关技术
  • 语义识别方法、语义识别装置、存储介质及电子设备
  • 语音语义识别模型构建方法、语义识别方法、装置及设备
技术分类

06120112197461