掌桥专利:专业的专利平台
掌桥专利
首页

基于人工智能的答案生成方法、装置、计算机设备及介质

文献发布时间:2023-06-19 10:00:31


基于人工智能的答案生成方法、装置、计算机设备及介质

技术领域

本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的答案生成方法、装置、计算机设备及介质。

背景技术

问答系统(Question Answering System,QA)是信息检索系统的一种高级形式,其融合了信息检索、信息抽取以及自然语言处理等技术,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。通常问答系统是在获取到的数据中进行信息抽取,以获取问题对应的答案,但是由于汉语表达方式灵活,具有相同语义句子的关键词的出现的位置也不定,因此容易抽取到错误的答案。目前,信息抽取通常是基于命名实体识别模型,由于命名实体识别模型对输入文本的限制,可能造成信息的缺失,导致难以抽取完整的数据信息,所以容易导致信息抽取的准确率不高,从而导致问答系统回答问题的准确率较低。

因此,如何提高问答系统回答问题的准确率成为亟待解决的技术问题。

发明内容

鉴于以上内容,有必要提出一种基于人工智能的答案生成方法、装置、计算机设备及介质,能够提高问答系统回答问题的准确率。

本发明的第一方面提供了一种基于人工智能的答案生成方法,所述方法包括:

获取数据信息,并使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本;

当所述文本的长度大于预设长度阈值时,根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段;

接收查询信息,并根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题;

将每个所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量;

根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量计算每个文本字符对应的第一起始概率,并根据预设的第二概率计算公式和所述输入信息中每个文本字符对应的特征向量计算每个文本字符对应的第二结束概率每个文本字符每个文本字符每个文本字符;

根据预设的第三概率计算公式计算所述输入信息的错误概率;

当所述错误概率不超过预设的错误概率阈值时,根据多个所述文本字符对应的起始概率和多个所述文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。

根据本发明的一个可选的实施例,在所述使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本之后,所述答案生成方法还包括:

判断所述文本中是否存在错误文字;

若所述文本中存在错误文字,从预设词库中查找与所述错误文字的相似度大于预设的相似度阈值的词,得到候选词组;

根据编辑距离算法在所述候选词组中确定第一文字;

使用所述第一文字替换所述错误文字,并根据替换后的文本得到新的文本。

根据本发明的一个可选的实施例,所述根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段包括:

从所述文本的第一个文本字符开始无重叠滑动所述滑动窗口,并在每次滑动之后判断是否满足滑动结束条件;

当确定满足滑动结束条件时,停止所述滑动窗口的滑动,并将每次滑动时所述滑动窗口在所述文本中的开始位置和结束位置确定为字符切分节点;

从每个所述字符切分节点开始,从所述文本中切分出所述预设长度阈值的文本字符,得到多个文本片段。

根据本发明的一个可选的实施例,所述查询信息包括至少一个查询句子,所述根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题包括:

对各所述查询句子进行句法分析和命名实体识别,得到每个查询句子对应的语法树;

将各所述查询句子对应的语法树与预先建立的问题模板数据库中的问题模板进行匹配;

当所述问题模板数据库中存在一问题模板与一语法树相匹配时,将所述语法树对应的查询句子转换为基于所述语法树相匹配的问题模板的疑问句,得到查询问题。

根据本发明的一个可选的实施例,所述对各所述查询句子进行句法分析和命名实体识别,得到每个查询句子对应的语法树包括:

对各所述查询句子进行词分割,得到多个查询词;

对所述多个查询词进行词性标注,得到各所述查询词对应的词性标注标签;

对所述多个查询词进行命名实体识别,确定所述多个查询词中的命名实体词;

根据所述多个查询词对应的词性标注标签和所述命名实体词得到各所述查询句子对应的语法树。

根据本发明的一个可选的实施例,所述将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量之前,所述答案生成方法还包括:

确定所述输入信息中每个文字字符对应的初始向量、类别向量和位置向量,其中,所述类别向量用于表示所述每个文字字符对应的内容对象,所述位置向量用于表示所述每个文字字符在所述输入信息中的相对位置;

将所述输入信息中每个文字字符对应的初始向量、类别向量和位置向量进行叠加,得到所述每个文字字符对应的目标向量;

所述将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量,包括:

将所述每个文字字符对应的目标向量输入预先训练的BERT模型,得到所述输入信息中每个文字字符对应的特征向量。

根据本发明的一个可选的实施例,所述在所述文本片段中确定所述查询问题对应的问题答案之后,所述答案生成方法还包括:

获取所述查询问题对应的机密级别,以及获取用户的用户级别;

判断所述用户级别与所述机密级别是否匹配;

当所述用户级别与所述机密级别匹配时,输出所述查询问题对应的问题答案。

本发明的第二方面提供了一种基于人工智能的答案生成装置,所述装置包括:

文本生成模块,用于获取数据信息,并使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本;

切分处理模块,用于当所述文本的长度大于预设长度阈值时,根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段;

问题生成模块,用于接收查询信息,并根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题;

向量确定模块,用于将每个所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量;

概率计算模块,用于根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率,并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率;

所述概率计算模块,还用于根据预设的第三概率计算公式计算所述输入信息的错误概率;

答案生成模块,用于当所述错误概率不超过预设的错误概率阈值时,根据多个所述文本字符对应的起始概率和多个所述文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。

本发明的第三方面提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序时实现如上述的基于人工智能的答案生成方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述的基于人工智能的答案生成方法。

本申请实施例公开了一种基于人工智能的答案生成方法、装置、计算机设备及存储介质,通过根据数据信息的信息类型对数据信息进行处理得到文本片段,如采用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本,对文本进行切分得到文本片段,其中数据信息的信息类型有多种,不局限于文字类型,提高问答系统的使用范围,同时对数据信息进行预处理可以得到更准确的文本片段,从而提高问题答案的准确率;接着将获取的查询信息和预设的问题模板生成所述查询信息对应的查询问题,避免因查询信息不清晰影响问题答案生成的情况发生,从而提高问题答案的准确率;将所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量,通过将所述文本片段和所述查询问题进行拼接得到输入信息实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的速率,同时将文本片段和查询问题进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高每个文本字符对应的特征向量的准确率,进一步提高问题答案生成的准确率;然后根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率;并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个所述文本字符对应的结束概率;根据预设的第三概率计算公式计算所述输入信息的错误概率;最后当所述错误概率不超过预设的错误概率阈值时,根据所述多个文本字符对应的起始概率和所述多个文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案,通过预设的错误概率阈值,在错误概率超过预设的错误概率阈值时确定文本片段中不包括问题答案,可避免在不包括问题答案的文本片段中确定出错误的问题答案,进一步提高了问答系统回答问题的准确率。

附图说明

图1是本发明实施例提供的一种基于人工智能的答案生成方法的流程示意图;

图2是本发明实施例提供的一种基于人工智能的答案生成装置的示意性框图;

图3是是本发明实施例提供的一种计算机设备的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本申请实施例提供一种基于人工智能的答案生成方法、装置、计算机设备及计算机可读存储介质。其中,该基于人工智能的答案生成方法可应用于终端设备或服务器中,该终端设备可以手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备,该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。以下以该基于人工智能的答案生成方法应用于服务器为例进行解释说明。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参阅图1,图1是本申请实施例提供的一种基于人工智能的答案生成方法的示意流程图。

如图1所示,所述基于人工智能的答案生成方法具体包括步骤S11至S17,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。

S11、获取数据信息,并使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本。

其中,所述信息类型可以为文字类型,也可以为图片类型,还可以是语音类型,本发明实施例不做限定。当所述数据信息的信息类型为非文字类型时,将所述数据信息的信息类型转换为文字类型,并根据转换后的数据信息得到文本。例如,当所述数据信息的信息类型为图片类型时,将所述数据信息输入预设的图像识别模型,得到所述数据信息对应的文本信息,并根据所述数据信息对应的文本信息得到文本;当所述数据信息的信息类型为语音类型时,将所述数据类型输入预设的语音识别模型,得到所述数据信息对应的文本信息,并根据所述数据信息对应的文本信息得到文本。数据信息的信息类型有多种,不局限于文字类型,提高问答系统的使用范围。

在一实施方式中,当所述数据信息为语音类型时,在所述获取数据信息之后,所述方法具体还包括:

识别所述数据信息所属的区域口音类型;基于所述区域口音类型对所述数据信息进行语音纠正处理;

所述使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本包括:

将处理后的数据信息输入预设的语音识别模型得到所述数据信息对应的文本信息;通过所述数据信息对应的文本信息得到文本。

不同区域的用户在输入语音时,会自带本区域的口音,由于口音的区域化,会导致识别困难,容易造成语音识别的错误。基于所述区域口音类型,对所述数据信息进行语音纠正处理,可以获得符合标准的普通话,进而可以更准确的识别出数据信息的内容,得到更准确的文本,从而提高答案生成的准确率。

在一实施方式中,在所述使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本之后,所述方法具体还包括以下步骤:

判断所述文本中是否存在错误文字;

若所述文本中存在错误文字,从预设词库中查找与所述错误文字的相似度大于预设的相似度阈值的词,得到候选词组;

根据编辑距离算法在所述候选词组中确定第一文字;

使用所述第一文字替换所述错误文字,并根据替换后的文本得到新的文本。

在该可选的实施方式中,当文本出现单词拼写错误、同音字时,问答系统可以自动识别纠错。汉字的纠错使用编辑距离算法实现,首先在预设词库(通常是与该文本同一行业领域的词库)中查找词相似度以及拼音相似度较高的词作为候选词,以缩小编辑距离计算范围,之后计算各个候选词与需要纠错词的编辑距离,取编辑距离最小的候选词,如果编辑距离值超过设置的纠错阀值,则作为结果返回。

通过根据所述数据信息的信息类型对所述数据信息进行预处理得到文本,数据信息的信息类型有多种,不局限于文字类型,提高问答系统的使用范围,同时对数据信息进行预处理可以得到更准确的文本片段,从而提高问题答案的准确率。

需要说明的是,为了保证上述数据信息过程中的数据的私密性和安全性,所述处理过程中的信息数据,比如获取到的数据信息、识别所述数据信息得到的文本等可存储于区块链中。

S12、当所述文本的长度大于预设长度阈值时,根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段。

其中,所述预设长度阈值为BERT模型所能够识别的最大文本长度。

在一实施方式中,所述根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段,具体包括基于人工智能的以下步骤:

从所述文本的第一个文本字符开始无重叠滑动所述滑动窗口,并在每次滑动之后判断是否满足滑动结束条件;

当确定满足滑动结束条件时,停止所述滑动窗口的滑动,并将每次滑动时所述滑动窗口在所述文本中的开始位置和结束位置确定为字符切分节点;

从每个所述字符切分节点开始,从所述文本中切分出所述预设长度阈值的文本字符,得到多个文本片段。

其中,当每次滑动之后所述滑动窗口在所述文本中的结束位置与所述文本的结束位置之间的差值小于或者等于所述长度阈值时,确定满足所述预设滑动结束条件;当每次滑动之后所述滑动窗口在所述文本中的结束位置与所述文本的结束位置之间的差值大于所述长度阈值时,确定未满足所述预设滑动结束条件。

示例性的,BERT模型允许输入的最大文本长度,即文本长度阈值,记为m。当文本T的长度L大于所设定的最大文本长度m,那么需要将文本T进行切分,如按照预先设定的滑动窗口d对文本T进行切分得到多个文本片段。例如,BERT模型的文本预设长度阈值m为500,预设的滑动窗口为40,现有一文本T的长度L为600,如文本T=[t

根据BERT模型的文本预设长度阈值对文本进行切分处理,避免因文本过长导致文本信息读取不全的情况发生,进一步提高了答案生成的准确率。

S13、接收查询信息,并根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题。

示例性的,用户在问答系统的搜索页面上输入需要查询的查询信息,问答系统获取该查询信息,并根据该查询信息的内容和预先设置的问题模板生成所述查询信息对应的查询问题。例如用户输入需要查询的查询信息为“小李的出院日期”,根据预先设置的问题模板和该查询信息生成该查询信息对应的查询问题为:小李的出院日期是什么。

在一实施方式中,所述查询信息包括至少一个查询句子,所述根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题包括:

对各所述查询句子进行句法分析和命名实体识别,得到每个查询句子对应的语法树;

将各所述查询句子对应的语法树与预先建立的问题模板数据库中的问题模板进行匹配;

当所述问题模板数据库中存在一问题模板与一语法树相匹配时,将所述语法树对应的查询句子转换为基于所述语法树相匹配的问题模板的疑问句,得到查询问题。

示例性的,所述问题模板可包括以下几种,其中,数据库中的问题模板的格式可如下:

表示“多少”的问题模板:QP

表示“第几”的问题模板:QP

因果关系问题模板:((IP|PP=reason<<由于|因为)..(IP|PP|VP)<<(IP|PP|VP<<所以|于是));

转折关系问题模板:((IP|PP=front<<虽然).IP=however)|<<(IP|PP=front(IP|PP|VP=however<<但是|但)))。

其中的符号均来自斯坦福自然语言实验室对语法树中存在的成分的定义。当某个问题模板在当前查询句子的语法树上匹配成功时,就利用该问题模板将当前的查询句子改写成基于该问题模板的疑问句,从而就生成了查询问题。

其中,对于所述问题模板数据库,是从大量的文章数据中,学习语言规则而得到大量的问题模板,构成所述问题模板数据库。对于所述查询内容中的每一个查询句子,都利用各自的语法树去匹配问题模板数据库中的问题模板,一旦匹配成功,就利用与之匹配的问题模板直接将查询句子转化为相应的疑问句,从而生成相应的查询问题。当句子与当前的问题模板数据库中的问题模板都不匹配时,即该查询句子不能生成问题;通过批量统计不能生成查询问题的句子,制定新的问题模板,更新到所述问题模板数据库。在此仅举例说明问题模板和问题模板数据库,本实施例对问题模板和问题模板数据库不做任何限制。

在一实施方式中,所述对各所述查询句子进行句法分析和命名实体识别,得到每个查询句子对应的语法树包括:

对各所述查询句子进行词分割,得到多个查询词;

对所述多个查询词进行词性标注,得到各所述查询词对应的词性标注标签;

对所述多个查询词进行命名实体识别,确定所述多个查询词中的命名实体词;

根据所述多个查询词对应的词性标注标签和所述命名实体词得到各所述查询句子对应的语法树。

示例性的,对查询句子进行句法分析和命名实体识别的过程可以包括以下步骤:先对查询句子进行词分割得到多个查询词,然后根据句法分析中用于表示时间名词的符号对每个查询词进行词性标注得到各所述查询词对应的词性标注标签,并对每个查询词进行命名实体的识别,比如是人名、机构名、地名还是其它以名称为标识的实体,从而确定所述多个查询词中的命名实体词。在对查询句子完成句法分析和命名实体识别后,就可以根据该查询句子中各查询词对应的词性标注标签和该查询句子中的命名实体词对该查询句子建立相应的语法树。

例如,一查询句子为“2020年因冠状病毒大势蔓延”,对该查询句子进行词的分割,得到多个查询词,如“2020年|因|冠状|病毒|大势|蔓延”其中用符号“|”表示分割,然后根据句法分析中用于表示时间名词的符号对每个查询词进行加注词性标注标签,例如,“NT”在句法分析中表示常用名词,因此“2020年”被标注为“NT”;并对每个查询词进行命名实体的识别,确定所述多个查询词中的命名实体词,如将2020年确定为以时间为标识的命名实体词、将冠状、病毒确定为以名称为标识的命名实体词。最后根据查询句子中多个查询词对应的词性标注标签和所述命名实体词得到该查询句子对应的语法树。利用所述查询句子对应的语法树与预先建立的问题模板数据库中的问题模板进行匹配生成查询句子对应的查询问题,可以提高查询问题生成的准确率,从而提高问题答案的准确率。

通过根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题,避免因查询信息不清晰影响问题答案生成的情况发生,从而提高问题答案的准确率。

S14、将每个所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量。

示例性的,所述BERT模型的训练任务可以包括掩码语言模型(Masked LanguageModel,MLM)任务和/或下一句预测(Next Sentence Prediction,NSP)任务,其中所述MLM任务用于对训练文本片段中的预设比例的词进行掩码处理并预测被掩码处理的词,上述预设比例可以根据实际情况进行合理设置,例如,上述预设比例可以为15%、20%等;所述NSP任务用于预测句子对关系,如判断句子B是否是句子A的下文。通过使用预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量,由于BERT模型融合全文语义信息的能力,可以提高每个文本字符对应的特征向量的准确率,从而提高问题答案的准确率。

示例性的,所述将所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型,具体可以包括:通过查询字向量表将所述文本片段和所述查询问题中的每个字符转换为一维向量,将转换为一维向量后的文本片段和转换为一维向量后的查询问题进行拼接,得到输入信息,所述输入信息包括多个文本字符。例如,文本片段为文本w,通过查询字向量表将文本W中的各个字符转换为一维向量,如W=[w

示例性的,可在查询问题前面添加专用分类记号,如CLS记号,进行标记;将查询问题和文本段落拼接在一起时,中间使用专用记号,如SEP记号,进行区别标记,如[CLSq

示例性的,预先训练的BERT模型根据所述输入信息确定所述输入信息对应的全文语义信息,并根据所述全文语义信息对所述输入信息中各字符的向量进行处理,得到所述输入信息中各字符融合全文语义信息后对应的向量表示,即得到输入信息中每个文本字符对应的特征向量,如特征向量V=[v

通过将文本片段和查询问题进行拼接得到输入信息,实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的速率。同时将文本片段和查询问题进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高问题答案生成的准确率。

在一实施方式中,所述将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量之前,还包括:

确定所述输入信息中每个文字字符对应的初始向量、类别向量和位置向量,其中,所述类别向量用于表示所述每个文字字符对应的内容对象,所述位置向量用于表示所述每个文字字符在所述输入信息中的相对位置;

分别将所述输入信息中每个文字字符对应的初始向量、类别向量和位置向量进行叠加,得到所述每个文字字符对应的目标向量;

所述将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量,包括:将所述每个文字字符对应的目标向量输入预先训练的BERT模型,得到所述输入信息中每个文字字符对应的特征向量。

输入信息中的每个文字字符可以称为一个标记(Token),上述每个文字字符对应的初始向量也可以称为词嵌入(Token embedding),可以是指每个文本字符的初始化的向量。上述每个文本字符对应的类别向量也可以称为分割嵌入(Segment embedding),用于表示每个文字字符对应的内容对象,可用于区分所述输入信息中的查询问题和文本片段,例如文本字符A为所述查询问题中的文本字符,文本字符B为所述文本片段中的文本字符,文本字符A的类别向量是0,文本字符B的类别向量是1。上述每个文本字符对应的位置向量也可以称为位置嵌入(Position Embedding),用于表示所述每个文本字符在所述输入信息中的相对位置。

通过将所述文本片段和所述查询问题进行拼接得到输入信息实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的速率。同时将文本片段和查询问题进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高每个文本字符对应的特征向量的准确率,进一步提高问题答案生成的准确率。

S15、根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率,并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率。

示例性的,所述第一概率计算公式为:

其中,v

根据所述第一概率计算公式和所述输入信息中每个文本字符语义融合后对应的特征向量,计算所述文本片段中每个文本字符对应的起始概率,即问题答案的起始概率。例如,文本片段W=[w

示例性的,所述第二概率计算公式为:

其中,v

根据所述第二概率计算公式和所述输入信息中每个文本字符语义融合后对应的特征向量,计算所述文本片段中每个文本字符对应的结束概率,即问题答案的结束概率。例如,文本片段W=[w

S16、根据预设的第三概率计算公式计算所述输入信息的错误概率。

示例性的,所述第三概率计算公式为:

P

其中,σ是sigmoid函数,w是BERT模型中可学习的权值矩阵,b是BERT模型的错误概率参数,v

获取输入信息中每个文本字符语义融合后对应的特征向量后,将输入信息V中CLS记号对应的特征向量,代入所述第三概率计算公式计算所述输入信息的错误概率,即计算所述输入信息中所述文本片段中不包含问题答案的概率。

S17、当所述错误概率不超过预设的错误概率阈值时,根据多个所述文本字符对应的起始概率和多个所述文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。

示例性的,所述错误概率阈值设为0.5,当所述错误概率的值小于或者等于0.5时,确定所述文本片段中存在所述查询问题对应的问题答案,并根据所述多个文本字符对应的起始概率和所述多个文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。通过分别计算每个文本字符对应的起始概率和其他所有文本字符对应的结束概率的乘积数值,确定最大的乘积数值,将该最大的乘积数值对应的两个文本字符之间的文本确定为所述查询问题对应的问题答案。例如,文本片段中包括文本字符[w

示例性的,当所述错误概率超过预设的错误概率阈值时,可按照预设的提示规则生成提示指令。例如,所述错误概率阈值设为0.5,当所述错误概率的值大于0.5时,确定所述文本片段中不存在所述查询问题对应的问题答案,按照预设的提示规则生成提示指令。

通过预设的错误概率阈值,在错误概率超过预设的错误概率阈值时确定文本片段中不包括问题答案,可避免在不包括问题答案的文本片段中确定出错误的问题答案,从而提高问题答案的准确率。

在一实施方式中,所述在所述文本片段中确定所述查询问题对应的问题答案之后,所述方法还包括:

获取所述查询问题对应的机密级别,以及获取用户的用户级别;

判断所述用户级别与所述机密级别是否匹配;

当所述用户级别与所述机密级别匹配时,输出所述查询问题对应的问题答案。

核实当前用户的用户身份,确定用户级别,将用户级别与当前查询问题的机密级别进行匹配,当所述用户级别与所述机密级别匹配时,输出所述查询问题对应的问题答案,当所述用户级别与所述机密级别不匹配时,不输出所述查询问题对应的问题答案。通过将机密级别与用户级别进行匹配判断,可以对当前用户进行身份校验,如果匹配,表明当前用户属于用于查询问题对应的搜索权限。通过这种用户身份的校验,可以确保信息的安全性。

上述实施例提供的基于人工智能的答案生成方法,通过根据数据信息的信息类型对数据信息进行处理得到文本片段,如采用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本,对文本进行切分得到文本片段,其中数据信息的信息类型有多种,不局限于文字类型,提高问答系统的使用范围,同时对数据信息进行预处理可以得到更准确的文本片段,从而提高问题答案的准确率;接着将获取的查询信息和预设的问题模板生成所述查询信息对应的查询问题,避免因查询信息不清晰影响问题答案生成的情况发生,从而提高问题答案的准确率;将所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量,通过将所述文本片段和所述查询问题进行拼接得到输入信息实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的速率,同时将文本片段和查询问题进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高每个文本字符对应的特征向量的准确率,进一步提高问题答案生成的准确率;然后根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率;并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率;根据预设的第三概率计算公式计算所述输入信息的错误概率;最后当所述错误概率不超过预设的错误概率阈值时,根据所述多个文本字符对应的起始概率和所述多个文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案,通过预设的错误概率阈值,在错误概率超过预设的错误概率阈值时确定文本片段中不包括问题答案,可避免在不包括问题答案的文本片段中确定出错误的问题答案,从而提高了问答系统回答问题的准确率。

请参阅图2,图2是本申请的实施例还提供一种基于人工智能的答案生成装置的示意性框图,该答案生成装置用于执行前述的基于人工智能的答案生成方法。其中,该答案生成装置可以配置于服务器或终端中。

其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。

如图2所示,基于人工智能的答案生成装置20包括:文本生成模块201、切分处理模块202、问题生成模块203、向量确定模块204、概率计算模块205和答案生成模块206。

文本生成模块201,用于获取数据信息,并使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本;

切分处理模块202,用于当所述文本的长度大于预设长度阈值时,根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段;

问题生成模块203,用于接收查询信息,并根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题;

向量确定模块204,用于将每个所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量;

概率计算模块205,用于根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率,并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率;

概率计算模块205,还用于根据预设的第三概率计算公式计算所述输入信息的错误概率;

答案生成模块206,用于当所述错误概率不超过预设的错误概率阈值时,根据多个所述文本字符对应的起始概率和多个所述文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述基于人工智能的答案生成方法实施例中的对应过程,在此不再赘述。

上述实施例提供的答案生成装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。

请参阅图3,图3为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端设备。

如图3所示,该计算机设备30包括通过系统总线连接的处理器301和存储器302,其中,存储器302可以包括非易失性存储介质和易失性存储介质。

存储器302可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器301执行任意一项所述的基于人工智能的答案生成方法。

处理器301用于提供计算和控制能力,支撑整个计算机设备的运行。

在一可行实施例中,所述计算机设备还包括网络接口,所述网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器301是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一个实施例中,所述处理器执行存储在存储器中的计算机程序,以实现如下步骤:

获取数据信息,并使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本;

当所述文本的长度大于预设长度阈值时,根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段;

接收查询信息,并根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题;

将每个所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量;

根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率,并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率;

根据预设的第三概率计算公式计算所述输入信息的错误概率;

当所述错误概率不超过预设的错误概率阈值时,根据多个所述文本字符对应的起始概率和多个所述文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。

具体地,所述处理器对上述程序指令的具体实现方法可参考前述基于人工智能的答案生成方法实施例中相关步骤的描述,在此不赘述。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时实现以下步骤:

获取数据信息,并使用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本;

当所述文本的长度大于预设长度阈值时,根据预设的滑动窗口对所述文本进行切分处理,得到多个文本片段;

接收查询信息,并根据所述查询信息和预设的问题模板生成所述查询信息对应的查询问题;

将每个所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量;

根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率,并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率;

根据预设的第三概率计算公式计算所述输入信息的错误概率;

当所述错误概率不超过预设的错误概率阈值时,根据多个所述文本字符对应的起始概率和多个所述文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案。

具体地,上述程序指令被所述处理器执行时的具体实现方法可参考前述基于人工智能的答案生成方法实施例中相关步骤的描述,在此不赘述。

其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。

前述实施例提供的答案生成装置、计算机设备及计算机可读存储介质,通过根据数据信息的信息类型对数据信息进行处理得到文本片段,如采用与所述数据信息的信息类型对应的信息识别模型识别所述数据信息得到文本,对文本进行切分得到文本片段,其中数据信息的信息类型有多种,不局限于文字类型,提高问答系统的使用范围,同时对数据信息进行预处理可以得到更准确的文本片段,从而提高问题答案的准确率;接着将获取的查询信息和预设的问题模板生成所述查询信息对应的查询问题,避免因查询信息不清晰影响问题答案生成的情况发生,从而提高问题答案的准确率;将所述文本片段和所述查询问题进行拼接得到输入信息,并将所述输入信息输入预先训练的BERT模型得到所述输入信息中每个文本字符对应的特征向量,通过将所述文本片段和所述查询问题进行拼接得到输入信息实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的速率,同时将文本片段和查询问题进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高每个文本字符对应的特征向量的准确率,进一步提高问题答案生成的准确率;然后根据预设的第一概率计算公式和所述输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的起始概率;并根据预设的第二概率计算公式和输入信息中每个文本字符对应的特征向量,计算每个文本字符对应的结束概率;根据预设的第三概率计算公式计算所述输入信息的错误概率;最后当所述错误概率不超过预设的错误概率阈值时,根据所述多个文本字符对应的起始概率和所述多个文本字符对应的结束概率在所述文本片段中确定所述查询问题对应的问题答案,通过预设的错误概率阈值,在错误概率超过预设的错误概率阈值时确定文本片段中不包括问题答案,可避免在不包括问题答案的文本片段中确定出错误的问题答案,从而提高了问答系统回答问题的准确率。

本申请中所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 基于人工智能的答案生成方法、装置、计算机设备及介质
  • 基于人工智能的答案检索方法、装置、电子设备及介质
技术分类

06120112388555