掌桥专利:专业的专利平台
掌桥专利
首页

一种基于双重渠道特征匹配的语义识别方法及系统

文献发布时间:2023-06-19 11:32:36


一种基于双重渠道特征匹配的语义识别方法及系统

技术领域

本发明涉及人工智能技术领域,具体涉及一种基于双重渠道特征匹配的语义识别方法及系统。

背景技术

一般来讲基于自然语义处理的智能交互系统,系统在与用户进行交互时是以以下步骤的串行进行:首先是适配模块接收到来自用户的上送问题,进行基本的分词匹配处理;然后进入自然语言处理(Natural Language Processing,NLP)模块通过隐马尔科夫模型、深度学习模型等进行词性、词向量、实体识别,获取用户意图;接着按照搜索和深度学习结合框架完成对常见问题解答(Frequently Asked Questions,FAQ)的匹配打分,返回对应知识答案。

为了能够有针对性的与用户进行交互,当前系统是在适配层根据接入智能交互系统的不同来源渠道,将渠道特征上送至智能交互系统。在FAQ的答案维护中,设置相对应的不同来源渠道特征标签,提供给系统根据上送的渠道特征匹配返回答案使用,可以获得较为精准的回答。

对于现有的基于自然语义处理的智能交互系统,在处理不同来源渠道的客户问答请求的时候,通过上送的渠道特征路由至不同的FAQ问答答案分支进行对客内容的呈现。这样可以获得针对性的精准回答,提升客户体验,但是也会造成另外一个业务痛点是渠道针对性过强,无法做到全覆盖的服务效果,用户难以获得优质的全量服务。

发明内容

(一)要解决的技术问题

针对上述问题,本发明提供了一种基于双重渠道特征匹配的语义识别方法及系统,用于至少部分解决传统方法渠道针对性过强、无法做到全覆盖服务等技术问题。

(二)技术方案

本发明一方面提供了一种基于双重渠道特征匹配的语义识别方法,包括:获取用户发送的问题信息以及该问题信息的发送渠道特征;根据问题信息获取用户意图;根据意图获取对应的标准问题;判断问题信息中是否存在语义渠道特征,若是,向用户发送标准问题下与该语义渠道特征相匹配的答案信息,否则,向用户发送标准问题下与发送渠道特征相匹配的答案信息。

进一步地,根据问题信息获取用户意图包括:通过自然语言处理问题信息,获取问题信息的语义特征,并根据该语义特征获取意图候选集,从该意图候选集中选取用户意图。

进一步地,从该意图候选集中选取用户意图包括:从该意图候选集中选取匹配度最高的意图作为用户意图。

进一步地,根据意图获取对应的标准问题包括:基于预先构建的FAQ数据库进行检索,确定对应的标准问题,该标准问题对应至少一个渠道的答案。

进一步地,预先构建的FAQ数据库设置有“语义渠道特征”维度,该“语义渠道特征”维度与“发送渠道特征”维度并列。

进一步地,“语义渠道特征”维度、“发送渠道特征”维度以标记形式落入FAQ数据库中。

进一步地,判断问题信息中是否存在语义渠道特征包括:通过句法模板,对问题信息进行问题实体抽取,并判断是否存在语义渠道特征。

进一步地,获取用户发送的问题信息的形式包括文本、音频、视频文件中的至少一种。

进一步地,获取用户发送的问题信息包括:对问题信息进行文本处理,文本处理的方式包括文本分词。

本发明另一方面提供了一种基于双重渠道特征匹配的语义识别系统,包括:接收模块,用于接收用户发送的问题信息以及该问题信息的发送渠道特征;自然语言处理模块,用于根据问题信息获取用户意图;生成模块,根据意图获取对应的标准问题;输出模块,用于判断问题信息中是否存在语义渠道特征,若是,向用户发送标准问题下与该语义渠道特征相匹配的答案信息,否则,向用户发送标准问题下与发送渠道特征相匹配的答案信息。

进一步地,还包括:文本处理模块,用于对问题信息进行文本处理,文本处理的方式包括文本分词。

本发明还有一方面提供了一种电子设备,包括:处理器;存储器,其存储有计算机可执行程序,该程序在被处理器执行时,使得处理器执行如前述基于双重渠道特征匹配的语义识别方法。

本发明还有一方面提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如前述基于双重渠道特征匹配的语义识别方法。

(三)有益效果

本公开实施例提供的一种基于双重渠道特征匹配的语义识别方法及系统,根据用户上送问题的语义渠道特征,结合来源渠道上送特征综合判定后返回对应答案,提高了客服系统问答的准确率,能使客户获得更优质的体验服务。

附图说明

图1示意性示出了根据本公开实施例基于双重渠道特征匹配的语义识别方法及系统的应用场景;

图2示意性示出了根据本公开实施例基于双重渠道特征匹配的语义识别方法的流程图;

图3示意性示出了根据本公开实施例基于双重渠道特征匹配的语义识别系统的框图;

图4示意性示出了根据本公开实施例基于双重渠道特征匹配的语义识别具体方法的流程图;

图5示意性示出了根据本公开实施例的计算机系统的框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。

因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。

本公开的实施例提供了一种基于双重渠道特征匹配的语义识别方法,请参见图1,包括:获取用户发送的问题信息以及该问题信息的发送渠道特征;根据问题信息获取用户意图;根据意图获取对应的标准问题;判断问题信息中是否存在语义渠道特征,若是,向用户发送标准问题下与该语义渠道特征相匹配的答案信息,否则,向用户发送标准问题下与发送渠道特征相匹配的答案信息。

图1示意性示出了根据本公开实施例的基于双重渠道特征匹配的语义识别方法及系统的应用场景100。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示,根据本公开的实施例,该基于双重渠道特征匹配的语义识别方法及系统的应用场景,可以适用于客服系统,包括PC端、手机端、平板端等电子设备的客服系统,本公开不做具体限定,只要能实现打开客服系统的电子设备都在本公开的保护范围之内。

对于现有的基于自然语义处理的智能交互系统,在处理不同来源渠道的客户问答请求的时候,通过上送渠道特征路由至不同的FAQ问答答案分支进行对客内容呈现。本公开的痛点业务场景如下描述:请参见图1,FAQ知识为【如何办理信用卡】,对于PC渠道的用户配置答案:请登录ICBC门户首页;对于手机渠道用户配置答案:请登陆ICBC APP。当用户通过PC渠道提问【手机如何办理信用卡】,意图识别并进行渠道特征匹配后,智能交互系统回答【请登录ICBC门户首页】,与客户预期不符合。

图2示意性示出了根据本公开实施例的基于双重渠道特征匹配的语义识别方法的流程图。

如图2所示,该方法包括操作S1~S4。其中:

在S1,用户上送的问题进入智能交互系统,获取用户发送的问题信息的内容以及发送的渠道,渠道包括PC渠道、手机渠道、平板渠道等等。

在S2,对问题信息的内容进行处理,包括通过隐马尔科夫模型、深度学习模型等进行词性、词向量、实体识别,获取用户意图;

在S3,在预先构建的FAQ数据库中,通过检索得到与该用户意图相匹配的标准问题;

在S4,通过判断用户发送的问题信息中是否包含语义渠道的内容,若是,则返回标准问题下与该语义渠道特征相匹配的答案,若否,则返回标准问题下与发送的渠道特征相匹配的答案。

由此,当用户通过PC渠道提问【手机如何办理信用卡】,意图识别并进行语义渠道特征匹配后,智能交互系统回答【请登陆ICBC APP】,达到客户预期。因此,本公开的语义识别方法可以更为准确地理解客户实际想问的问题,而不是仅仅根据硬渠道标识返回给客户一个只针对发送渠道的标准答案。传统方法往往会忽略问题信息中的限定性内容,使得渠道针对性过强,无法做到全覆盖的服务效果。本公开的方法通过发送渠道特征、语义渠道特征组合判定的方法,并且优先以语义渠道特征为准,使客户获得更加全面、更加精准的问答体验。

在上述实施例的基础上,根据问题信息获取用户意图包括:通过自然语言处理问题信息,获取问题信息的语义特征,并根据该语义特征获取意图候选集,从该意图候选集中选取用户意图。

自然语言处理使计算机理解自然语言文本的意义,实现人和计算机的对话;主要包括语料预处理步骤;特征工程步骤,把分词之后的字和词语表示成计算机能够计算的类型;模型训练步骤;指标评价步骤,对模型进行必要的评估,使模型对语料具备较好的泛化能力。进入NLP通过隐马尔科夫模型、深度学习模型等进行词性、词向量、实体识别,获取问题信息的语义特征,并根据该语义特征获取意图候选集,其中意图候选集包括若干意图类别下的标准问题。

在上述实施例的基础上,从该意图候选集中选取用户意图包括:从该意图候选集中选取匹配度最高的意图作为用户意图。

获取意图候选集后,需要对意图候选集的每个意图进行打分,以获取每个意图与用户发送的问题信息的匹配度,分值最高的意图则为匹配度最高的意图,是与客户的问题信息最契合的意图,选取匹配度最高的意图作为用户意图。

在上述实施例的基础上,根据意图获取对应的标准问题包括:基于预先构建的FAQ数据库进行检索,确定对应的标准问题,该标准问题对应至少一个渠道的答案。

FAQ数据库中将多个标准问题与标准答案进行组合,形成多个“标准问题-标准答案”对,这里每个标准问题对应多个发送渠道的标准答案,例如问题为【如何办理信用卡】,对于PC渠道的用户配置答案:请登录ICBC门户首页;对于手机渠道用户配置答案:请登陆ICBC APP。在FAQ的答案维护中,设置相对应的不同来源渠道特征标签,供系统根据上送的渠道特征匹配返回答案使用,可以获得较为精准的回答。通过FAQ数据库进行检索,确定与用户问题意图匹配的标准问题,得到与用户问题意图和上送渠道匹配的标准问题的答案,并输出该答案。

在上述实施例的基础上,预先构建的FAQ数据库设置有“语义渠道特征”维度,该“语义渠道特征”维度与“发送渠道特征”维度并列。

本发明在智能交互系统FAQ答案维护处新增设计了“特征值”维度,该维度与“接入渠道”维度并列,采用句法模板形式实现。

在上述实施例的基础上,“语义渠道特征”维度、“发送渠道特征”维度以标记形式落入FAQ数据库中。

两个维度均以标记形式落入FAQ数据库中,在意图匹配结束后,供返回答案选择判定使用。在智能交互系统对客前,由业务根据热点触发答案预期的语义渠道特征,维护进对应的“特征值”维度,该维护不影响NLP模型自身,无需重新训练,可以立即生效。

在上述实施例的基础上,判断问题信息中是否存在语义渠道特征包括:通过句法模板,对问题信息进行问题实体抽取,并判断是否存在语义渠道特征。

句法模板通过对复杂问题进行问题实体抽取、模板匹配和问题依赖图生成等处理,实现对复杂问题的分解。判断是否存在语义渠道特征,例如当用户询问:手机如何办理信用卡,这里手机即为包含在用户问题信息中的渠道特征,该渠道特征相比于用户的发送渠道特征,会更加契合用户意图,因此,以语义渠道特征为优先级。

在上述实施例的基础上,获取用户发送的问题信息的形式包括文本、音频、视频文件中的至少一种。

用户发送的问题信息的形式可以包括一段文字、一段语音或者一段视频,当然其他发送方式也是可行的,只要接收端可以识别该信息即可。

在上述实施例的基础上,获取用户发送的问题信息包括:对问题信息进行文本处理,文本处理的方式包括文本分词。

根据问题信息获取用户意图前还包括对问题信息的预处理;若为文本,则直接进行分词处理;若为音频,进行语音识别,将语音识别的结果转化为文本数据后进行分词处理;若为视频,则解析成文本数据和图像,对图像进行识别并转化为文本数据后进行分词处理。文本信息的分词处理又包括根据输入的文本信息将其进行标记与拆分;参数标注,根据预定规则,将标记及拆分好的文本信息进行匹配,并提取出关键信息;关键信息的输出,根据答复规则,将关键信息生成向对应的答复模板,并进行输出。

本公开的另一实施例提供了一种基于双重渠道特征匹配的语义识别系统300,请参见图3,包括:接收模块,用于接收用户发送的问题信息以及该问题信息的发送渠道特征;自然语言处理模块,用于根据问题信息获取用户意图;生成模块,根据意图获取对应的标准问题;输出模块,用于判断问题信息中是否存在语义渠道特征,若是,向用户发送标准问题下与该语义渠道特征相匹配的答案信息,否则,向用户发送标准问题下与发送渠道特征相匹配的答案信息。

图3示意性示出了相关技术信息处理方法的结构图。接收模块,用于获取用户发送的问题信息的内容以及发送的渠道,渠道包括PC渠道、手机渠道、平板渠道等等;NLP模块,用于获取用户意图;生成模块,用于通过检索得到与该用户意图相匹配的标准问题;输出模块,用于通过判断用户发送的问题信息中是否包含语义渠道的内容,若是,则返回标准问题下与该语义渠道特征相匹配的答案,若否,则返回标准问题下与发送的渠道特征相匹配的答案。

在上述实施例的基础上,还包括:文本处理模块,用于对问题信息进行文本处理,文本处理的方式包括文本分词。

文本信息的分词处理又包括根据输入的文本信息将其进行标记与拆分;参数标注,根据预定规则,将标记及拆分好的文本信息进行匹配,并提取出关键信息;关键信息的输出,根据答复规则,将关键信息生成向对应的答复模板,并进行输出。

图4为本公开语义识别方法的一具体实施例。用户上送问题进入智能交互系统后,获取用户发送的问题信息,即为S1;适配模块进行基本的分词匹配处理;然后进入NLP模块通过隐马尔科夫模型、深度学习模型等进行词性、词向量、实体识别,获取用户意图,即为S2;对意图进行打分后,获取匹配上的标准问信息,该标准问下挂多个渠道答案,即为S3。首先通过答案中的句法模板判定是否在客户上送提问中存在渠道信息,如果存在则返回对应答案,否则通过应用侧上送的硬渠道标识判定渠道信息并返回答案,即为S4。

图5示意性示出了根据本公开另一实施例的电子设备的框图。

如图5所示,电子设备500包括处理器510、计算机可读存储介质520。该电子设备500可以执行根据本公开实施例的方法。

具体地,处理器510例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器510还可以包括用于缓存用途的板载存储器。处理器510可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

计算机可读存储介质520,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。

计算机可读存储介质520可以包括计算机程序521,该计算机程序521可以包括代码/计算机可执行指令,其在由处理器510执行时使得处理器510执行根据本公开实施例的方法流程及其任何变形。

计算机程序521可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序521中的代码可以包括一个或多个程序模块,例如包括521A、模块521B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器510执行时,使得处理器510可以执行根据本公开实施例的方法流程及其任何变形。

本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/系统/系统中所包含的,也可以是单独存在,而未装配入该设备/系统/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。

尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于双重渠道特征匹配的语义识别方法及系统
  • 一种基于自然语言理解的语义多渠道分发处理系统及方法
技术分类

06120112965275