掌桥专利:专业的专利平台
掌桥专利
首页

基于AI Chat bot的结构化数据库存储分析方法及软件产品

文献发布时间:2024-01-17 01:18:42


基于AI Chat bot的结构化数据库存储分析方法及软件产品

技术领域

本发明涉及大数据、人工智能和数据库技术领域,尤其涉及一种基于AI Chat bot的结构化数据库存储分析方法及软件产品。

背景技术

聊天机器人(chat bots),也称为阿尔贝特,是经由对话或文字进行交谈的计算机程序。随着人工智能(Artificial Intelligence)的发展,聊天机器人的智能化程度越来越高,当下AI聊天机器人的应用场景可以涉及智能客服、虚拟机器人、数字化服务、大数据检索、信息咨询等领域。

随着大数据、云计算、区块链、数字化等前沿技术的不断成熟,AI聊天机器人与这些领域的结合越来越紧密,由此生成的对话数据也颇具分析价值,而如何高质量地实现这些对话数据的存储显得尤为重要。

对于上述对话数据的存储,结构化存储不失为一个优选项。结构化存储方法,是把树状文件系统的原理应用到单个的文件中,使得单个文件也能象文件系统一样包含子目录,子目录还可以包含更深层次的子目录,各个目录可以含多个文件,从而实现把原来需要多个文件存储的内容按树状结构和层次保存到一个文件中去。结构化存储能够直观反映对话数据的特征联系,便于后期进行针对性的调用和大数据挖掘分析等。然而结构化数据库在对上述对话数据进行结构化存储时,难以准确高效地判断相关对话数据是否适合结构化存储。

发明内容

本发明提供一种基于AI Chat bot的结构化数据库存储分析方法及软件产品,能够利用AI深度决策树网络对拟存储AI Chat人机互动文本进行存储条件达标判别。该方案的整体约束性不强,可以应用到不同类型和场景的AI Chat人机互动文本下,提高了针对结构化数据库的存储分析时效性,可保障结构化数据库内存储的数据的有序性,为实现上述技术目的,本发明采用如下技术方案。

第一方面是一种基于AI Chat bot的结构化数据库存储分析方法,应用于大数据决策分析服务器,所述方法包括:

获取与待分析结构化存储任务对应的拟存储AI Chat人机互动文本;

确定最少一个AI算法组件分别对应的传入信息;其中,每个AI算法组件的传入信息包括所述拟存储AI Chat人机互动文本、以及在相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量中的至少一种;

利用各所述AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,并对所述场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量;

依据每个所述AI算法组件分别生成的文本语义聚合向量,确定与所述待分析结构化存储任务对应的存储条件达标判别信息。

在一些可选的示例中,所述获取与待分析结构化存储任务对应的拟存储AI Chat人机互动文本,包括:

获取基础AI Chat人机互动文本,并确定所述基础AI Chat人机互动文本中待分析结构化存储任务的AI人机对话文本集;

对所述AI人机对话文本集进行规模更新,得到目标对话文本集;

提取所述目标对话文本集,得到匹配待分析结构化存储任务的拟存储AI Chat人机互动文本。

在一些可选的示例中,所述确定最少一个AI算法组件分别对应的传入信息,包括:

对于最少一个AI算法组件中的第一个AI算法组件,将所述拟存储AI Chat人机互动文本作为所述第一个AI算法组件的传入信息;

对于最少一个AI算法组件中的除第一个AI算法组件以外的每个AI算法组件,都将相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量,作为相应AI算法组件的传入信息。

在一些可选的示例中,所述利用各所述AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,并对所述场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量,包括:

利用多个AI算法组件中的第一个AI算法组件,对所述拟存储AI Chat人机互动文本进行文本语义挖掘,得到第一场景层面文本语义和第一段落层面文本语义,并对所述第一场景层面文本语义和第一段落层面文本语义进行文本语义聚合处理,得到第一个AI算法组件生成的文本语义聚合向量;

对于除第一个AI算法组件以外的各AI算法组件,皆对相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量进行文本语义挖掘,得到第二场景层面文本语义和第二段落层面文本语义,并对所述第二场景层面文本语义和第二段落层面文本语义进行文本语义聚合处理,得到相应AI算法组件生成的文本语义聚合向量。

在一些可选的示例中,所述利用各所述AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,包括:

对于最少一个AI算法组件中的每个AI算法组件,皆利用当前AI算法组件提取对应传入信息中的场景级原始语义和段落级原始语义;

利用所述当前AI算法组件,对所述段落级原始语义进行第一下采样处理,得到所述段落级原始语义中的段落级下采样语义,并依据所述段落级原始语义与段落级下采样语义之间的语义距离,得到相应的段落级语义差异;

利用所述当前AI算法组件,分别对所述场景级原始语义和段落级语义差异进行语义细节衍生处理,得到对应的场景层面文本语义和段落层面文本语义。

在一些可选的示例中,所述分别对所述场景级原始语义和段落级语义差异进行语义细节衍生处理,得到对应的场景层面文本语义和段落层面文本语义,包括:

从所述段落级语义差异中提取场景级对话特征,并将所述场景级对话特征增添到所述场景级原始语义,得到场景层面文本语义;

从所述场景级原始语义中提取段落级属性特征,并将所述段落级属性特征增添到所述段落级语义差异,得到段落层面文本语义。

在一些可选的示例中,所述对所述场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量,包括:

确定所述场景层面文本语义和段落层面文本语义分别对应的语义强化因子;

基于所述场景层面文本语义和段落层面文本语义分别对应的语义强化因子,对所述场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。

在一些可选的示例中,所述确定所述场景层面文本语义和段落层面文本语义分别对应的语义强化因子,包括:

分别对所述场景层面文本语义和段落层面文本语义进行窗口化滤波操作,得到场景级语义滤波特征和段落级语义滤波特征,并对所述场景级语义滤波特征和段落级语义滤波特征进行拼接操作,得到对应的语义拼接结果;

依据所述语义拼接结果,确定所述场景层面文本语义和段落层面文本语义分别对应的语义强化因子。

在一些可选的示例中,所述依据所述语义拼接结果,确定所述场景层面文本语义和段落层面文本语义分别对应的语义强化因子,包括:

确定与所述场景层面文本语义所对应第一特征关系列表和第一标准化算法层,以及确定与所述段落层面文本语义所对应第二特征关系列表和第二标准化算法层;

对所述语义拼接结果进行第二下采样处理,得到语义拼接下采样特征;

利用所述第一特征关系列表和第一标准化算法层对所述语义拼接下采样特征进行第一特征映射,得到与所述场景层面文本语义对应的语义强化因子;

利用所述第二特征关系列表和第二标准化算法层对所述语义拼接下采样特征进行第二特征映射,得到与所述段落层面文本语义对应的语义强化因子。

在一些可选的示例中,所述基于AI Chat bot的结构化数据库存储分析方法由深度决策树网络执行,所述深度决策树网络利用网络调试思路调试所得,所述网络调试思路包括:

获取拟调试的深度决策树网络、AI Chat人机互动调试文本、以及与所述AI Chat人机互动调试文本所对应调试注释;所述深度决策树网络包括最少一个拟调试AI算法组件;

确定最少一个拟调试AI算法组件分别对应的调试传入数据;

所述最少一个拟调试AI算法组件中的当前拟调试AI算法组件的调试传入数据包括所述AI Chat人机互动调试文本、以及在前拟调试AI算法组件生成的文本语义聚合推演向量中的至少一种;

利用各所述AI算法组件分别对相应的调试传入数据进行文本语义挖掘,得到场景层面文本推演语义和段落层面文本推演语义,并对所述场景层面文本推演语义和段落层面文本推演语义进行文本语义聚合处理,得到相应的文本语义聚合推演向量;

依据每个所述拟调试AI算法组件分别生成的文本语义聚合推演向量,确定对所述AI Chat人机互动调试文本进行存储条件推演分析的推演分析结果;

依据所述推演分析结果和所述调试注释,对所述深度决策树网络进行调试,直到符合调试完成要求时终止,得到调试完成的深度决策树网络。

在一些可选的示例中,所述推演分析结果包括文本结构分布推演结果和存储条件推演分析标识;所述依据每个所述拟调试AI算法组件分别生成的文本语义聚合推演向量,确定对所述AI Chat人机互动调试文本进行存储条件推演分析的推演分析结果,包括:

利用所述深度决策树网络中的文本结构分布生成组件,对每个所述拟调试AI算法组件分别生成的文本语义聚合推演向量进行文本结构分布生成处理,得到对应的文本结构分布推演结果;

利用所述深度决策树网络中的存储条件分析组件,对每个所述拟调试AI算法组件分别生成的文本语义聚合推演向量进行存储条件推演分析,得到对应的存储条件推演分析标识。

在一些可选的示例中,所述调试注释包括目标文本结构分布和存储条件认证注释;所述依据所述推演分析结果和所述调试注释,对所述深度决策树网络进行调试,直到符合调试完成要求时终止,包括:

确定所述文本结构分布推演结果与所述目标文本结构分布之间的第一比较结果,以及确定所述存储条件推演分析标识与所述存储条件认证注释之间的第二比较结果;

利用所述第一比较结果和所述第二比较结果,对所述深度决策树网络进行调试,直到符合调试完成要求时终止。

第二方面是一种大数据决策分析服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述大数据决策分析服务器执行第一方面的方法。

第三方面是一种用于实现基于AI Chat bot的结构化数据库存储分析方法的软件产品,包括计算机程序/指令,其中,当所述计算机程序/指令被执行时,实现执行第一方面的方法。

第四方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。

本发明实施例提供的基于AI Chat bot的结构化数据库存储分析方法及软件产品,利用获取拟存储AI Chat人机互动文本以及上游AI算法组件生成的文本语义聚合向量,可基于拟存储AI Chat人机互动文本和上游AI算法组件生成的文本语义聚合向量,确定每个AI算法组件分别对应的传入信息,从而各AI算法组件均可对分别对应的传入信息进行文本语义挖掘和文本语义聚合处理,得到对应的文本语义聚合向量;利用得到每个AI算法组件分别生成的文本语义聚合向量,可结合各文本语义聚合向量,得到与待分析结构化存储任务对应的存储条件达标判别信息。

鉴于是结合场景层面文本语义和段落层面文本语义来对拟存储AI Chat人机互动文本进行存储条件达标判别的,相比于利用扰动条件来确定存储条件达标判别信息,本发明实施例能够在拟存储AI Chat人机互动文本不符合“拟存储AI Chat人机互动文本和标准AI Chat人机互动文本之间的区别可能满足的某一扰动条件”这一基准时,仍然可以获得精准可靠的存储条件达标判别信息。

另外,鉴于没有对场景层面文本语义和段落层面文本语义进行过多限制,因而整体方案的约束性不会太强,这样可以应用到不同类型和场景的AI Chat人机互动文本下,确保深度决策树网络能够对不同状态的AI Chat人机互动文本进行准确的存储条件达标判别。且本发明实施例不用要求AI Chat人机互动文本的分布形式,可快速、高效地对AI Chat人机互动文本进行存储条件达标判别,提高了针对结构化数据库的存储分析时效性,确保存储条件达标判别信息能够准确可信地反映拟存储AI Chat人机互动文本是否能够实现结构化存储,保障结构化数据库内存储的数据的有序性。

附图说明

图1为本发明实施例提供的基于AI Chat bot的结构化数据库存储分析方法的流程示意图。

具体实施方式

以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。

图1示出了本发明实施例提供的基于AI Chat bot的结构化数据库存储分析方法的流程示意图,基于AI Chat bot的结构化数据库存储分析方法可以通过大数据决策分析服务器实现,大数据决策分析服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令。

其中,当所述处理器执行所述计算机指令时,使得所述大数据决策分析服务器执行STEP202-STEP208。

STEP202,获取与待分析结构化存储任务对应的拟存储AI Chat人机互动文本。

本发明实施例中,待分析结构化存储任务可以是结构化数据库对应的数据库系统向大数据决策分析服务器发送的,在数据库系统准备存储待分析结构化存储任务对应的拟存储AI Chat人机互动文本之前,需要提前判断拟存储AI Chat人机互动文本是否可以进行树状结构的转换,也即拟存储AI Chat人机互动文本的存储条件是否达标。鉴于结构化数据库的侧重于数据存储和管理,因此对于拟存储AI Chat人机互动文本的存储条件是否达标的判断,可以交由大数据决策分析服务器实现,这样可以实现任务分流和分工合作,提高不同系统/服务器的运行效率。

举例而言,拟存储AI Chat人机互动文本可以是数字用户端和AI聊天机器人之间的互动文本记录,比如可以涉及电子商务对话、数字孪生相关技术的对话、元宇宙服务对话、数据搜索对话、问答对话、数字办公对话、远程教育对话、智慧医疗就诊对话等,在此不做限定。

示例性的,当需要进行存储条件达标判别时,大数据决策分析服务器可获取拟存储AI Chat人机互动文本。其中,拟存储AI Chat人机互动文本的存储条件达标判别信息可以包括拟存储AI Chat人机互动文本中的待分析结构化存储任务满足结构化存储条件、以及拟存储AI Chat人机互动文本中的待分析结构化存储任务不满足结构化存储条件。当存储条件达标判别信息表征拟存储AI Chat人机互动文本中的待分析结构化存储任务满足结构化存储条件时,可以认为该拟存储AI Chat人机互动文本能够进行树状结构化处理并存储;当存储条件达标判别信息表征拟存储AI Chat人机互动文本中的待分析结构化存储任务不满足结构化存储条件时,可以认为该拟存储AI Chat人机互动文本不能够进行树状结构化处理,因而不满足数据库系统的存储要求。

在一些示例下,获取与待分析结构化存储任务对应的拟存储AI Chat人机互动文本,包括:获取基础AI Chat人机互动文本,并确定所述基础AI Chat人机互动文本中待分析结构化存储任务的AI人机对话文本集;对所述AI人机对话文本集进行规模更新,得到目标对话文本集;提取所述目标对话文本集,得到匹配待分析结构化存储任务的拟存储AI Chat人机互动文本。

示例性的,大数据决策分析服务器可获取基础AI Chat人机互动文本,并利用文本捕捉模块确定基础AI Chat人机互动文本中的待分析结构化存储任务的AI人机对话文本集,得到用以标记AI人机对话文本集的文本窗口。其中,文本捕捉模块可以为大数据决策分析服务器自带的,也可以是调用其他神经网络模型得到的。进一步地,为了保障待分析结构化存储任务的分析完整性,大数据决策分析服务器还可以延展文本窗口的规模,以实现对AI人机对话文本集的规模更新,得到对应的目标对话文本集,并提取该目标对话文本集,得到匹配待分析结构化存储任务的拟存储AI Chat人机互动文本。其中,规模更新可以理解为尽可能保障AI人机对话文本集的信息量的最大化,从而为结构化分析提供可靠基础。

可见,利用对AI人机对话文本集进行规模更新,使得基于规模更新后的拟存储AIChat人机互动文本可以包含尽可能多的内容的AI人机对话文本集,从而保障基于完整的AI人机对话文本集进行存储条件达标判别的结果的准确性。

STEP204,确定最少一个AI算法组件分别对应的传入信息;每个AI算法组件的传入信息包括拟存储AI Chat人机互动文本、以及在相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量中的至少一种。

示例性的,可利用深度决策树网络对拟存储AI Chat人机互动文本中的待分析结构化存储任务进行存储条件达标判别。其中,深度决策树网络可以是完成调试的初始的具有存储条件达标判别性能的人工智能神经网络。该深度决策树网络示例性可以包括最少一个AI算法组件,每个AI算法组件分别对相应的传入信息进行处理,从而得到每个AI算法组件分别生成的文本语义聚合向量。其中,最少一个AI算法组件中的当前AI算法组件的传入信息包括拟存储AI Chat人机互动文本、以及上游AI算法组件生成的文本语义聚合向量中的至少一种。此外,AI算法组件还可以理解为处理单元、网络单元或者网络层等。上游AI算法组件可以理解为当前算法组件的前一个算法组件。文本语义聚合向量是对文本语义特征进行融合之后得到的。

在一些示例下,确定最少一个AI算法组件分别对应的传入信息包括:对于最少一个AI算法组件中的第一个AI算法组件,将拟存储AI Chat人机互动文本作为第一个AI算法组件的传入信息;对于最少一个AI算法组件中的除第一个AI算法组件以外的每个AI算法组件,都将相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量,作为相应AI算法组件的传入信息。

示例性的,深度决策树网络中的各AI算法组件可以级联,形成AI算法组件链,大数据决策分析服务器将拟存储AI Chat人机互动文本作为AI算法组件链中的第一个AI算法组件的传入信息,也即将拟存储AI Chat人机互动文本作为最少一个AI算法组件链中的第一个AI算法组件的传入信息;对于AI算法组件链中的除第一个AI算法组件以外的每个AI算法组件,都将相应的上游AI算法组件生成的文本语义聚合向量作为当前AI算法组件的传入信息,换言之,将相应的上游AI算法组件生成的文本语义聚合向量,作为最少一个AI算法组件中除第一个AI算法组件以外的当前AI算法组件的传入信息。其中,上游AI算法组件可以理解为与当前AI算法组件为邻居、且位于当前AI算法组件之前的一个AI算法组件。

示例性的,该深度决策树网络中可包括有三个AI算法组件,分别为AI算法组件Algorithm component1、AI算法组件Algorithm component2和AI算法组件Algorithmcomponent3,其中,AI算法组件Algorithm component1的传入信息为拟存储AI Chat人机互动文本,AI算法组件Algorithm component2的传入信息为AI算法组件Algorithmcomponent1生成的文本语义聚合向量,AI算法组件Algorithm component3的传入信息均为AI算法组件Algorithm component2生成的文本语义聚合向量。

本发明实施例中,利用确定各AI算法组件分别对应的传入信息,使得各AI算法组件可以对相应的传入信息进行处理,从而得到各AI算法组件分别生成的输出信息。

STEP206,利用各AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,并对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。

其中,AI算法组件包括文本语义挖掘子网和文本语义聚合子网。文本语义挖掘子网可以理解为用以提取传入信息中的场景层面文本语义和段落层面文本语义的网络架构;文本语义聚合子网可以理解为用以对场景层面文本语义和段落层面文本语义进行文本语义聚合的网络架构。文本语义挖掘子网和文本语义聚合子网都可以为联合架构,比如,文本语义挖掘子网可以是由滑动平均子网、池化子网和抽样子网所形成的。文本语义聚合子网可以是由滑动平均子网、第二下抽样子网、标准化子网和全连接子网所形成的。

进一步地,场景层面文本语义可以理解为用以反映待分析结构化存储任务对应的整体文本的特征。段落层面文本语义可以理解为用以反映待分析结构化存储任务的局部文本的特征。场景层面文本语义比如可以是对话领域的特征、对话概述的特征等,段落层面文本语义可以是用户兴趣文本特征、AI应答文本的匹配性特征、追问特征、AI问答服务反馈特征等。

示例性的,大数据决策分析服务器可利用每个AI算法组件分别对相应的传入信息进行文本语义挖掘处理(文本特征提取操作),比如,对于最少一个AI算法组件中的当前AI算法组件,大数据决策分析服务器可利用当前AI算法组件中的文本语义挖掘子网提取出传入信息中的场景层面文本语义和段落层面文本语义。进一步地,大数据决策分析服务器还可利用每个AI算法组件分别对各自挖掘得到的场景层面文本语义和段落层面文本语义进行文本语义聚合处理,以得到对应的文本语义聚合向量。比如,对于最少一个AI算法组件中的当前AI算法组件,大数据决策分析服务器可利用当前AI算法组件中的文本语义聚合子网,对当前AI算法组件中的文本语义挖掘子网提取出的场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到当前AI算法组件生成的文本语义聚合向量。

当深度决策树网络中只包含了一个AI算法组件时,可依次实施STEP202和STEP204;当深度决策树网络中包括有多于一个的AI算法组件时,可交替实施STEP202和STEP204,比如,可先确定第一个AI算法组件的传入信息,并利用第一个AI算法组件对传入信息进行处理,得到第一个AI算法组件生成的文本语义聚合向量,再确定后一AI算法组件的传入信息,并利用后一AI算法组件对该传入信息进行处理,得到后一AI算法组件生成的文本语义聚合向量。如此反复,直到得到末端AI算法组件生成的文本语义聚合向量。

在一些示例下,利用各AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,并对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量,包括:利用多个AI算法组件中的第一个AI算法组件,对拟存储AI Chat人机互动文本进行文本语义挖掘,得到第一场景层面文本语义和第一段落层面文本语义,并对第一场景层面文本语义和第一段落层面文本语义进行文本语义聚合处理,得到第一个AI算法组件生成的文本语义聚合向量;对于除第一个AI算法组件以外的各AI算法组件,皆对相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量进行文本语义挖掘,得到第二场景层面文本语义和第二段落层面文本语义,并对第二场景层面文本语义和第二段落层面文本语义进行文本语义聚合处理,得到相应AI算法组件生成的文本语义聚合向量。

示例性的,由于第一个AI算法组件的传入信息为拟存储AI Chat人机互动文本,因此,大数据决策分析服务器利用第一个AI算法组件对拟存储AI Chat人机互动文本进行文本语义挖掘处理,得到第一场景层面文本语义和第一段落层面文本语义,并对第一场景层面文本语义和第一段落层面文本语义进行文本语义聚合处理,得到第一个AI算法组件生成的文本语义聚合向量,比如,第一个AI算法组件对第一场景层面文本语义和第一段落层面文本语义进行权重强化聚合处理,得到对应的文本语义聚合向量。进一步地,深度决策树网络将第一个AI算法组件生成的文本语义聚合向量作为第二个AI算法组件的传入信息,并利用第二个AI算法组件对该传入信息进行进一步的文本语义挖掘以及文本语义聚合处理,得到第二个AI算法组件生成的文本语义聚合向量。如此反复,直到得到末端AI算法组件生成的文本语义聚合向量。

在一些可能的示例下,大数据决策分析服务器获取与待分析结构化存储任务对应的拟存储AI Chat人机互动文本,并利用多个AI算法组件中的第一个AI算法组件,对拟存储AI Chat人机互动文本进行文本语义挖掘,得到第一场景层面文本语义和第一段落层面文本语义,并对第一场景层面文本语义和第一段落层面文本语义进行文本语义聚合处理,得到第一个AI算法组件生成的文本语义聚合向量;对于除第一个单元以外的各AI算法组件,皆对相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量进行文本语义挖掘,得到第二场景层面文本语义和第二段落层面文本语义,并对第二场景层面文本语义和第二段落层面文本语义进行文本语义聚合处理,得到相应AI算法组件生成的文本语义聚合向量;依据每个AI算法组件分别生成的文本语义聚合向量,确定与待分析结构化存储任务对应的存储条件达标判别信息。

本发明实施例中,通过配置多个目标AI算法组件,并将上游AI算法组件的生成结果作为当前AI算法组件的传入信息,可以使得AI算法组件链中各AI算法组件生成的文本语义聚合向量的细节表达逐渐优化,以提高文本语义聚合向量的质量。

STEP208,依据每个AI算法组件分别生成的文本语义聚合向量,确定与待分析结构化存储任务对应的存储条件达标判别信息。

在本发明实施例中,深度决策树网络中还可包括有存储条件分析组件,利用存储条件分析组件可输出存储条件达标判别信息。比如,当存储条件分析组件输出设定判别值时,可认为拟存储AI Chat人机互动文本能够进行树状结构化处理并存储,当存储条件分析组件输出非设定判别值时,可认为拟存储AI Chat人机互动文本不能够进行树状结构化处理,因而不满足数据库系统的存储要求。

示例性的,当获取得到每个AI算法组件分别生成的文本语义聚合向量时,深度决策树网络可将每个AI算法组件分别生成的文本语义聚合向量加载到存储条件分析组件中,利用存储条件分析组件输出对拟存储AI Chat人机互动文本进行存储条件达标判别的判别变量。进一步地,深度决策树网络判断该判别变量是否达到设定判别变量,若达到设定判别变量,则可认为拟存储AI Chat人机互动文本能够进行树状结构化处理并存储,若小于设定判别变量时,则认为拟存储AI Chat人机互动文本不能够进行树状结构化处理,因而不满足数据库系统的存储要求。

鉴于除第一个AI算法组件以外的每个AI算法组件,均是将上游AI算法组件的生成结果作为当前AI算法组件的传入信息,由当前AI算法组件对上游AI算法组件的生成结果进行进一步的处理,以得到尽可能精准可靠的文本语义聚合向量的,鉴于此,各AI算法组件分别生成的文本语义聚合向量的特征阶各不相同,从而使得结合特征阶各不相同的文本语义聚合向量所得到的存储条件达标判别信息尽可能精准可靠。

可见,通过以上内容,利用获取拟存储AI Chat人机互动文本以及上游AI算法组件生成的文本语义聚合向量,可基于拟存储AI Chat人机互动文本和上游AI算法组件生成的文本语义聚合向量,确定每个AI算法组件分别对应的传入信息,从而各AI算法组件均可对分别对应的传入信息进行文本语义挖掘和文本语义聚合处理,得到对应的文本语义聚合向量;利用得到每个AI算法组件分别生成的文本语义聚合向量,可结合各文本语义聚合向量,得到与待分析结构化存储任务对应的存储条件达标判别信息。鉴于是结合场景层面文本语义和段落层面文本语义来对拟存储AI Chat人机互动文本进行存储条件达标判别的,相比于利用扰动条件来确定存储条件达标判别信息,本发明实施例能够在拟存储AI Chat人机互动文本不符合“拟存储AI Chat人机互动文本和标准AI Chat人机互动文本之间的区别可能满足的某一扰动条件”这一基准时,仍然可以获得精准可靠的存储条件达标判别信息。

另外,鉴于没有对场景层面文本语义和段落层面文本语义进行过多限制,因而整体方案的约束性不会太强,这样可以应用到不同类型和场景的AI Chat人机互动文本下,确保深度决策树网络能够对不同状态的AI Chat人机互动文本进行准确的存储条件达标判别。且本发明实施例不用要求AI Chat人机互动文本的分布形式,可快速、高效地对AI Chat人机互动文本进行存储条件达标判别,提高了针对结构化数据库的存储分析时效性,确保存储条件达标判别信息能够准确可信地反映拟存储AI Chat人机互动文本是否能够实现结构化存储,保障结构化数据库内存储的数据的有序性。

在一些示例下,利用各AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,包括:对于最少一个AI算法组件中的每个AI算法组件,皆利用当前AI算法组件提取对应传入信息中的场景级原始语义和段落级原始语义;利用当前AI算法组件,对段落级原始语义进行第一下采样处理,得到段落级原始语义中的段落级下采样语义,并依据段落级原始语义与段落级下采样语义之间的语义距离,得到相应的段落级语义差异;利用当前AI算法组件,分别对场景级原始语义和段落级语义差异进行语义细节衍生处理,得到对应的场景层面文本语义和段落层面文本语义。

示例性的,为了得到尽可能精准可靠的存储条件达标判别信息,每个AI算法组件中的文本语义挖掘子网皆可挖掘对应传入信息中的多维语义向量,得到场景层面文本语义和段落层面文本语义。

比如,AI算法组件中的文本语义挖掘子网中可包括有场景文本语义挖掘分支和段落文本语义挖掘分支,在AI算法组件获取得到传入信息时,可将该传入信息加载到场景文本语义挖掘分支和段落文本语义挖掘分支,使得场景文本语义挖掘分支对传入信息进行窗口化滤波操作,得到场景级原始语义,以及使得段落文本语义挖掘分支对传入信息进行窗口化滤波操作,得到段落级原始语义。其中,原始语义可以理解为初始特征,窗口化滤波操作可以理解为卷积处理。

为了进一步提取传入信息中的特征内容,以得到尽可能优质的段落层面文本语义,文本语义挖掘子网中的段落文本语义挖掘分支还可对段落级原始语义进行第一下采样处理(局部池化处理),得到段落级原始语义中的段落级下采样语义,并确定段落级原始语义与段落级下采样语义之间的语义距离(特征差异),基于语义距离得到尽可能优质的段落层面文本语义,也即得到段落级语义差异(局部特征距离)。

由于场景级原始语义中可包括有传入信息中的特征内容,段落级语义差异也可包括有传入信息中的整体语义细节,因此,文本语义挖掘子网可分别对场景级原始语义和段落级语义差异进行语义细节衍生处理,得到场景层面文本语义和段落层面文本语义。在一些可能的示例下,场景级原始语义的特征规模(向量尺寸)异于段落级原始语义的特征规模(向量尺寸)。

在一些可能的示例下,AI算法组件可将段落级原始语义与段落级下采样语义进行减法处理,从而快速得到相应的段落级语义差异,从而提升了段落级语义差异的确定时效性。

在一些可能的示例下,AI算法组件可包括有文本语义挖掘子网,用以提取传入信息中的场景层面文本语义和段落层面文本语义。其中,文本语义挖掘子网可包括有场景文本语义挖掘分支和段落文本语义挖掘分支,利用场景文本语义挖掘分支可提取传入信息中的场景级原始语义,并对场景级原始语义进行语义细节衍生处理(语义特征补充处理),得到场景层面文本语义;利用段落文本语义挖掘分支可提取传入信息中的段落级原始语义,并对段落级原始语义进行第一下采样处理,得到段落级下采样语义,以及依据段落级原始语义与段落级下采样语义之间的语义距离,得到段落级语义差异,对段落级语义差异进行语义细节衍生处理,得到段落层面文本语义。由于AI算法组件中的段落文本语义挖掘分支是用以提取传入信息中的段落层面文本语义,其主要针对于传入信息中的特征内容,而场景文本语义挖掘分支是用以提取传入信息中的场景层面文本语义,可见,在段落文本语义挖掘分支中,将段落级原始语义减去段落级下采样语义,可以得到更好的特征内容。而场景文本语义挖掘分支无需提取特征内容,因此,场景文本语义挖掘分支不用实施语义距离的确定捕捉。

可见,利用确定段落级原始语义与段落级下采样语义之间的语义距离,可以得到包括有尽可能优质特征内容的段落级语义差异,从而使得后续基于段落级语义差异得到的段落层面文本语义可尽可能精准可靠。另外,利用在段落级原始语义中清洗掉段落级下采样语义,可以实现噪声特征的清洗,减少分析误差,提高深度决策树网络的转用性。

在一些示例下,分别对场景级原始语义和段落级语义差异进行语义细节衍生处理,得到对应的场景层面文本语义和段落层面文本语义,包括:从段落级语义差异中提取场景级对话特征,并将场景级对话特征增添到场景级原始语义,得到场景层面文本语义;从场景级原始语义中提取段落级属性特征,并将段落级属性特征增添到段落级语义差异,得到段落层面文本语义。

示例性的,段落级语义差异中可能包含了场景级对话特征,相应的,场景级原始语义中也可能包含了段落级属性特征,因此,为了得到包含了更多语义细节的段落层面文本语义,AI算法组件还可以从场景级原始语义中提取出段落级属性特征,并将段落级属性特征增添到段落级语义差异中,得到段落层面文本语义。以及为了得到包含了更多整体特征的场景层面文本语义,当前AI算法组件可从段落级语义差异中提取出场景级对话特征,并将场景级对话特征增添到场景级原始语义中,得到场景层面文本语义。其中,场景级对话特征反映了待分析结构化存储任务的整体文本,段落级属性特征反映了待分析结构化存储任务的文本段落的信息。

在一些可能的示例下,AI算法组件可利用场景文本语义挖掘分支对场景级原始语义进行窗口化滤波操作,得到第一窗口化滤波结果,以及对段落级语义差异进行窗口化滤波操作和特征扩展,得到场景级对话特征。进一步地,场景文本语义挖掘分支可对场景级对话特征和第一窗口化滤波结果进行聚合处理,以将场景级对话特征增添到场景级原始语义中,得到场景层面文本语义。比如,场景文本语义挖掘利用对场景级对话特征和第一窗口化滤波结果进行整理,得到相应的场景层面文本语义。

AI算法组件可利用段落文本语义挖掘分支对段落级语义差异进行窗口化滤波操作,得到第二窗口化滤波结果,以及对场景级原始语义进行窗口化滤波操作,得到段落级属性特征,并将段落级属性特征与第二窗口化滤波结果进行聚合处理,以将段落级属性特征增添到段落级语义差异中,得到段落细节特征。

可见,利用将段落级语义差异中的场景级对话特征增添到场景级原始语义中,可以得到包含了更多待分析结构化存储任务整体文本的场景层面文本语义;利用将场景级原始语义中的段落级属性特征增添到段落级语义差异中,可以得到包含了更多待分析结构化存储任务段落级属性特征的段落层面文本语义;利用得到包含了更多待分析结构化存储任务整体文本的场景层面文本语义、和包含了更多待分析结构化存储任务段落级属性特征的段落层面文本语义,可以使得基于场景层面文本语义和段落层面文本语义确定得到的存储条件达标判别信息尽可能精准可信。

在一些示例下,对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量,包括:确定场景层面文本语义和段落层面文本语义分别对应的语义强化因子;基于场景层面文本语义和段落层面文本语义分别对应的语义强化因子,对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。

示例性的,语义强化因子为相关的语义权重或者语义特征权重,对于最少一个AI算法组件中的每个AI算法组件,均可利用各AI算法组件中的文本语义聚合子网对相应的场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。

示例性的,在AI算法组件中的文本语义挖掘子网提取出传入信息中的场景层面文本语义和段落层面文本语义时,AI算法组件中的文本语义聚合子网即可确定该场景层面文本语义和段落层面文本语义分别对应的语义强化因子,并基于场景层面文本语义和段落层面文本语义分别对应的语义强化因子,对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。比如,AI算法组件中的文本语义聚合子网可对场景层面文本语义和段落层面文本语义进行权重强化聚合处理,得到文本语义聚合向量。

可见,通过差异化的语义强化因子配置,可以使得文本语义聚合子网能够适应性地提炼高质量的多维数据,这样基于高质量的多维数据得到的文本语义聚合向量能够能够提高文本结构语义的表征性能。

在一些示例下,确定场景层面文本语义和段落层面文本语义分别对应的语义强化因子,包括:分别对场景层面文本语义和段落层面文本语义进行窗口化滤波操作,得到场景级语义滤波特征和段落级语义滤波特征,并对场景级语义滤波特征和段落级语义滤波特征进行拼接操作,得到对应的语义拼接结果(可以理解为聚合特征);依据语义拼接结果,确定场景层面文本语义和段落层面文本语义分别对应的语义强化因子。

示例性的,在AI算法组件需要确定场景层面文本语义和段落层面文本语义分别对应的语义强化因子时,AI算法组件中的文本语义聚合子网可分别对场景层面文本语义和段落层面文本语义进行窗口化滤波操作,得到场景级语义滤波特征和段落级语义滤波特征,并对场景级语义滤波特征和段落级语义滤波特征进行融合,得到用于确定语义强化因子的基础。

进一步地,文本语义聚合子网依据语义拼接结果,确定场景层面文本语义和段落层面文本语义分别对应的语义强化因子。从而后续可利用所确定的语义强化因子,从段落层面文本语义和场景层面文本语义中挑选得到泛化评分更高的细节,避免噪声特征的干扰,从而提高深度决策树网络的转用性。

在一些示例下,依据语义拼接结果,确定场景层面文本语义和段落层面文本语义分别对应的语义强化因子,包括:确定与场景层面文本语义所对应第一特征关系列表和第一标准化算法层,以及确定与段落层面文本语义所对应第二特征关系列表和第二标准化算法层;对语义拼接结果进行第二下采样处理,得到语义拼接下采样特征;利用第一特征关系列表和第一标准化算法层对语义拼接下采样特征进行第一特征映射,得到与场景层面文本语义对应的语义强化因子;利用第二特征关系列表和第二标准化算法层对语义拼接下采样特征进行第二特征映射,得到与段落层面文本语义对应的语义强化因子。

其中,特征关系列表可以理解为特征矩阵,标准化处理可以理解为归一化处理。示例性的,AI算法组件中的文本语义聚合子网可确定与场景层面文本语义所对应第一特征关系列表和第一标准化算法层,以及确定与段落层面文本语义所对应第二特征关系列表和第二标准化算法层。其中,第一特征关系列表、第一标准化算法层、第二特征关系列表和第二标准化算法层均可利用深度决策树网络调试得到,比如,深度决策树网络可利用最后一次循环调试,得到第一特征关系列表、第一标准化算法层、第二特征关系列表和第二标准化算法层。其中,第一特征关系列表和第二特征关系列表示例性可以分别是一个全连接子网。第一标准化算法层和第二标准化算法层具体也可分别为一个标准化子网。

进一步地,当获取得到语义拼接结果时,文本语义聚合子网可对该语义拼接结果进行第二下采样处理(全局平均池化处理),得到语义拼接下采样特征。比如,文本语义聚合子网可对语义拼接结果所对应的整个语义向量关系网进行平均化处理,得到语义拼接下采样特征。文本语义聚合子网将语义拼接下采样特征加载到与第一特征关系列表所对应全连接子网,并将与第一特征关系列表对应的全连接子网生成的数据加载到与第一标准化算法层对应的标准化子网,以利用第一特征关系列表和第一标准化算法层对语义拼接下采样特征进行第一特征映射,得到与场景层面文本语义对应的语义强化因子。相应的,文本语义聚合子网将语义拼接下采样特征加载到与第二特征关系列表所对应全连接子网,并将与第二特征关系列表对应的全连接子网生成的数据加载到与第二标准化算法层对应的标准化子网,以利用第二特征关系列表和第二标准化算法层对语义拼接下采样特征进行第二特征映射,得到与段落层面文本语义对应的语义强化因子。

可见,通过对语义拼接下采样特征进行全连接子网处理和标准化处理,能够确定相应的语义强化因子,如此,提高了语义强化因子的确定时效性。

在一些示例下,当深度决策树网络中只包含了一个AI算法组件时,大数据决策分析服务器获取拟存储AI Chat人机互动文本,并将拟存储AI Chat人机互动文本作为AI算法组件的传入信息,利用该AI算法组件对传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,并对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到文本语义聚合向量。进一步地,深度决策树网络将AI算法组件生成的文本语义聚合向量加载到存储条件分析组件中,利用存储条件分析组件输出对拟存储AI Chat人机互动文本进行存储条件达标判别的存储条件达标判别信息。

在一些示例下,当深度决策树网络包括有多个AI算法组件时,大数据决策分析服务器获取拟存储AI Chat人机互动文本,并将拟存储AI Chat人机互动文本作为第一个AI算法组件的传入信息,利用第一个AI算法组件对传入信息进行文本语义挖掘、文本语义聚合处理,得到第一个AI算法组件生成的文本语义聚合向量。深度决策树网络将第一个AI算法组件生成的文本语义聚合向量作为第二个AI算法组件的传入信息,以使第二个AI算法组件对传入信息进行文本语义挖掘、文本语义聚合处理,得到第二个AI算法组件生成的文本语义聚合向量,如此反复,直到得到各AI算法组件分别生成的文本语义聚合向量,从而深度决策树网络中的存储条件分析组件可基于各AI算法组件分别生成的文本语义聚合向量,得到存储条件达标判别信息。

在先的技术,是通过假定拟存储AI Chat人机互动文本和标准AI Chat人机互动文本之间的区别可能满足的某一扰动条件,之后利用AI算法确定出非结构化要素的语义向量关系网,并基于该非结构化要素的语义向量关系网对拟存储AI Chat人机互动文本进行存储条件达标判别。但是这种思路使用了拟存储AI Chat人机互动文本中的部分信息(为非结构化要素的信息)来进行存储条件达标判别,而忽略了拟存储AI Chat人机互动文本中结构化要素的信息,从而使得当拟存储AI Chat人机互动文本不符合“拟存储AI Chat人机互动文本和标准AI Chat人机互动文本之间的区别可能满足的某一扰动条件”这一基准时,难以准确实现存储条件达标判别。而能够综合不同规模的文本信息,以显著提高深度决策树网络对不同形式的拟存储AI Chat人机互动文本的存储条件达标判别性能,提高了结构化存储的前序判定的精度和可信度。

在一些示例下,基于AI Chat bot的结构化数据库存储分析方法由深度决策树网络执行,深度决策树网络利用网络调试思路调试所得,网络调试思路包括:获取拟调试的深度决策树网络、AI Chat人机互动调试文本、以及与AI Chat人机互动调试文本所对应调试注释;深度决策树网络包括最少一个拟调试AI算法组件;确定最少一个拟调试AI算法组件分别对应的调试传入数据;最少一个拟调试AI算法组件中的当前拟调试AI算法组件的调试传入数据包括AI Chat人机互动调试文本、以及在前拟调试AI算法组件生成的文本语义聚合推演向量中的至少一种;利用各AI算法组件分别对相应的调试传入数据进行文本语义挖掘,得到场景层面文本推演语义和段落层面文本推演语义,并对场景层面文本推演语义和段落层面文本推演语义进行文本语义聚合处理,得到相应的文本语义聚合推演向量;依据每个拟调试AI算法组件分别生成的文本语义聚合推演向量,确定对AI Chat人机互动调试文本进行存储条件推演分析的推演分析结果;依据推演分析结果和调试注释,对深度决策树网络进行调试,直到符合调试完成要求时终止,得到调试完成的深度决策树网络。

其中,上述的调试文本可以理解为训练文本,调试注释通常作样本标签理解,进一步地,文本语义聚合推演向量可以理解为文本语义聚合向量的预测结果。

示例性的,在利用深度决策树网络对拟存储AI Chat人机互动文本进行存储条件达标判别之前,还需对该深度决策树网络进行调试。大数据决策分析服务器可获取充足的AI Chat人机互动调试文本、以及各AI Chat人机互动调试文本分别对应的调试注释,从而大数据决策分析服务器可基于获取得到的AI Chat人机互动调试文本和相应的调试注释,对拟调试的深度决策树网络进行循环调试。在循环调试的单次调试过程中,大数据决策分析服务器将AI Chat人机互动调试文本作为最少一个拟调试AI算法组件中的第一个拟调试AI算法组件的调试传入数据,从而第一个拟调试AI算法组件可对调试传入数据进行文本语义挖掘,得到场景层面文本推演语义和段落层面文本推演语义,并对场景层面文本推演语义和段落层面文本推演语义进行文本语义聚合处理,得到第一个拟调试AI算法组件生成的文本语义聚合推演向量。进一步地,当拟调试的深度决策树网络中包括有多个AI算法组件时,深度决策树网络可将第一个拟调试AI算法组件生成的文本语义聚合推演向量作为第二个拟调试AI算法组件的调试传入数据,以使第二个拟调试AI算法组件对调试传入数据进行文本语义挖掘和文本语义聚合处理,得到第二个拟调试AI算法组件生成的文本语义聚合推演向量。进一步地,深度决策树网络将第二个拟调试AI算法组件生成的文本语义聚合推演向量,作为第三个拟调试AI算法组件的调试传入数据,如此反复,直到得到末端拟调试AI算法组件生成的文本语义聚合推演向量。其中,拟调试AI算法组件输出文本语义聚合推演向量的过程可参考上述AI算法组件输出文本语义聚合向量的过程。

进一步地,深度决策树网络依据每个拟调试AI算法组件分别生成的文本语义聚合推演向量,确定对AI Chat人机互动调试文本进行存储条件推演分析的推演分析结果,并依据推演分析结果(存储条件是否达标的预测结果)与相应的调试注释之间的区别,对深度决策树网络进行调试。当进行设定轮次的循环调试,或者深度决策树网络生成的结果符合调试完成条件时,可认为已符合调试完成要求,此时大数据决策分析服务器终止对深度决策树网络进行调试,得到调试完成的深度决策树网络。

本发明实施例中,对拟调试的深度决策树网络进行调试,使得基于调试后的深度决策树网络生成的存储条件达标判别结果可以尽可能精准。

在一些示例下,推演分析结果包括文本结构分布推演结果和存储条件推演分析标识;依据每个拟调试AI算法组件分别生成的文本语义聚合推演向量,确定对AI Chat人机互动调试文本进行存储条件推演分析的推演分析结果,包括:利用深度决策树网络中的文本结构分布生成组件,对每个拟调试AI算法组件分别生成的文本语义聚合推演向量进行文本结构分布生成处理,得到对应的文本结构分布推演结果;利用深度决策树网络中的存储条件分析组件,对每个拟调试AI算法组件分别生成的文本语义聚合推演向量进行存储条件推演分析,得到对应的存储条件推演分析标识。

其中,文本结构分布推演结果可以理解为拟调试深度决策树网络生成的用以反映AI Chat人机互动调试文本中待分析结构化存储任务文本逻辑架构数据的文本结构分布,比如,文本结构分布推演结果具体可为AI Chat人机互动调试文本中待分析结构化存储任务条目的文本结构分布。存储条件推演分析标识可以理解为拟调试深度决策树网络生成的、用以反映调试文本是否满足存储条件的注释,比如,存储条件推演分析标识示例性可以为“AI Chat人机互动调试文本能够进行树状结构化处理并存储”,以及可以为“AI Chat人机互动调试文本不能够进行树状结构化处理,因而不能进行结构化存储”。

示例性的,拟调试的深度决策树网络中可包括有文本结构分布生成组件和存储条件分析组件。当获取得到各AI算法组件分别生成的文本语义聚合推演向量时,存储条件分析组件可将各AI算法组件分别生成的文本语义聚合推演向量加载到文本结构分布生成组件、以及加载到存储条件分析组件,从而文本结构分布生成组件可基于各AI算法组件分别生成的文本语义聚合推演向量,得到与AI Chat人机互动调试文本所对应文本结构分布推演结果,存储条件分析组件可基于各AI算法组件分别生成的文本语义聚合推演向量,得到与AI Chat人机互动调试文本所对应存储条件推演分析标识。其中,存储条件分析组件示例性可以为一个分类器。在一些可能的示例下,文本结构分布生成组件可仅用于对深度决策树网络进行调试,而不涉及对拟存储AI Chat人机互动文本进行判别的过程。

在一些可能的示例下,拟调试的深度决策树网络可利用各拟调试AI算法组件输出相应的文本语义聚合推演向量,从而文本结构分布生成组件和存储条件分析组件可基于各文本语义聚合推演向量得到相应的文本结构分布推演结果和存储条件推演分析标识。

可见,利用得到文本结构分布推演结果和存储条件推演分析标识,可基于文本结构分布推演结果和存储条件推演分析标识对拟调试深度决策树网络进行调试处理。

在一些示例下,调试注释包括目标文本结构分布和存储条件认证注释;依据推演分析结果和调试注释,对深度决策树网络进行调试,直到符合调试完成要求时终止,包括:确定文本结构分布推演结果与目标文本结构分布之间的第一比较结果,以及确定存储条件推演分析标识与存储条件认证注释之间的第二比较结果;利用第一比较结果和第二比较结果,对深度决策树网络进行调试,直到符合调试完成要求时终止。

其中,目标文本结构分布可以理解为标准的文本结构分布,存储条件认证注释可以理解为正确的存储条件达标判别结果。在获取得到AI Chat人机互动调试文本时,可对AIChat人机互动调试文本进行注释处理,得到相应的目标文本结构分布和存储条件认证注释。

示例性的,大数据决策分析服务器可确定文本结构分布推演结果与相应的目标文本结构分布之间的第一比较结果,以及确定存储条件推演分析标识与存储条件认证注释之间的第二比较结果,并利用第一比较结果生成第一训练代价函数、以及利用第二比较结果生成第二训练代价函数,利用所生成的第一训练代价函数和第二训练代价函数对深度决策树网络进行调试,直到符合调试完成要求时终止。其中,训练代价函数可以理解为损失函数。

可见,利用生成文本结构分布推演结果和存储条件推演分析标识,可结合文本结构分布推演结果与目标文本结构分布之间的第一比较结果、以及存储条件推演分析标识与存储条件认证注释之间的第二比较结果,对深度决策树网络进行调试,使得调试后的深度决策树网络可以尽可能精准。

在另一个设计思路下,基于AI Chat bot的结构化数据库存储分析方法包括如下内容。

STEP302,获取基础AI Chat人机互动文本,并确定基础AI Chat人机互动文本中待分析结构化存储任务的AI人机对话文本集;对AI人机对话文本集进行规模更新,得到目标对话文本集;提取目标对话文本集,得到匹配待分析结构化存储任务的拟存储AI Chat人机互动文本。

STEP304,对于最少一个AI算法组件中的第一个AI算法组件,将拟存储AI Chat人机互动文本作为第一个AI算法组件的传入信息。

STEP306,对于最少一个AI算法组件中的除第一个AI算法组件以外的每个AI算法组件,都将相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量,作为相应AI算法组件的传入信息,其中,上游AI算法组件可以理解为与当前AI算法组件为邻居、且位于当前AI算法组件之前的一个AI算法组件。

STEP308,AI算法组件包括文本语义挖掘子网,对于最少一个AI算法组件中的每个AI算法组件,皆利用当前AI算法组件中的文本语义挖掘子网提取对应传入信息中的场景级原始语义和段落级原始语义,并对段落级原始语义进行第一下采样处理,得到段落级原始语义中的段落级下采样语义,依据段落级原始语义与段落级下采样语义之间的语义距离,得到相应的段落级语义差异。

STEP310,利用当前AI算法组件中的文本语义挖掘子网,从段落级语义差异中提取场景级对话特征,并将场景级对话特征增添到场景级原始语义,得到场景层面文本语义;从场景级原始语义中提取段落级属性特征,并将段落级属性特征增添到段落级语义差异,得到段落层面文本语义。

STEP312,AI算法组件还包括文本语义聚合子网,利用文本语义聚合子网分别对场景层面文本语义和段落层面文本语义进行窗口化滤波操作,得到场景级语义滤波特征和段落级语义滤波特征,并对场景级语义滤波特征和段落级语义滤波特征进行拼接操作,得到语义拼接结果。

STEP314,利用文本语义聚合子网确定与场景层面文本语义所对应第一特征关系列表和第一标准化算法层,以及确定与段落层面文本语义所对应第二特征关系列表和第二标准化算法层,比如,第一特征关系列表和第二特征关系列表示例性可以分别是一个全连接子网,第一标准化算法层和第二标准化算法层示例性可以分别是一个标准化子网。

STEP316,利用文本语义聚合子网对语义拼接结果进行第二下采样处理,得到语义拼接下采样特征;比如,文本语义聚合子网可对语义拼接结果所对应的整个语义向量关系网进行平均化处理,得到语义拼接下采样特征。

STEP318,利用文本语义聚合子网,并基于第一特征关系列表和第一标准化算法层对语义拼接下采样特征进行第一特征映射,得到与场景层面文本语义对应的语义强化因子;利用第二特征关系列表和第二标准化算法层对语义拼接下采样特征进行第二特征映射,得到与段落层面文本语义对应的语义强化因子。

STEP320,利用文本语义聚合子网,并基于场景层面文本语义和段落层面文本语义分别对应的语义强化因子,对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。

STEP322,依据每个AI算法组件分别生成的文本语义聚合向量,确定与待分析结构化存储任务对应的存储条件达标判别信息,比如,将每个AI算法组件分别生成的文本语义聚合向量加载到存储条件分析组件中,利用存储条件分析组件输出对拟存储AI Chat人机互动文本进行存储条件达标判别的判别变量。

在基于AI Chat bot的结构化数据库存储分析方法中,利用获取拟存储AI Chat人机互动文本以及上游AI算法组件生成的文本语义聚合向量,可基于拟存储AI Chat人机互动文本和上游AI算法组件生成的文本语义聚合向量,确定每个AI算法组件分别对应的传入信息,从而各AI算法组件均可对分别对应的传入信息进行文本语义挖掘和文本语义聚合处理,得到对应的文本语义聚合向量;利用得到每个AI算法组件分别生成的文本语义聚合向量,可结合各文本语义聚合向量,这样,得到与待分析结构化存储任务对应的存储条件达标判别信息。鉴于是结合场景层面文本语义和段落层面文本语义来对拟存储AI Chat人机互动文本进行存储条件达标判别的,相比于利用扰动条件来确定存储条件达标判别信息,本发明实施例能够在拟存储AI Chat人机互动文本不符合“拟存储AI Chat人机互动文本和标准AI Chat人机互动文本之间的区别可能满足的某一扰动条件”这一基准时,仍然可以获得精准可靠的存储条件达标判别信息。

在另一个设计思路下,基于AI Chat bot的结构化数据库存储分析方法包括如下内容。

STEP402,获取拟调试的深度决策树网络、AI Chat人机互动调试文本、以及与AIChat人机互动调试文本所对应调试注释;深度决策树网络包括最少一个拟调试AI算法组件。

STEP404,确定最少一个拟调试AI算法组件分别对应的调试传入数据,比如,与第一个拟调试的AI算法组件所对应调试传入数据为AI Chat人机互动调试文本,与除第一个拟调试的AI算法组件以外的其余AI算法组件所对应调试传入数据为文本语义聚合推演向量;最少一个拟调试AI算法组件中的当前拟调试AI算法组件的调试传入数据包括AI Chat人机互动调试文本、以及在前拟调试AI算法组件生成的文本语义聚合推演向量中的至少一种。

STEP406,利用各AI算法组件分别对相应的调试传入数据进行文本语义挖掘,得到场景层面文本推演语义和段落层面文本推演语义,并对场景层面文本推演语义和段落层面文本推演语义进行文本语义聚合处理,得到相应的文本语义聚合推演向量。

STEP408,利用深度决策树网络中的文本结构分布生成组件,对每个拟调试AI算法组件分别生成的文本语义聚合推演向量进行文本结构分布生成处理,得到对应的文本结构分布推演结果,比如,得到AI Chat人机互动调试文本中待分析结构化存储任务条目的文本结构分布。

STEP410,利用深度决策树网络中的存储条件分析组件,对每个拟调试AI算法组件分别生成的文本语义聚合推演向量进行存储条件推演分析,得到对应的存储条件推演分析标识,比如,得到“AI Chat人机互动调试文本能够进行树状结构化处理并存储”的判别结果,或得到“AI Chat人机互动调试文本不能够进行树状结构化处理,因而不能进行结构化存储”的判别结果。

STEP412,确定文本结构分布推演结果与目标文本结构分布之间的第一比较结果,比如,将文本结构分布推演结果与目标文本结构分布相减,得到第一比较结果,以及确定存储条件推演分析标识与存储条件认证注释之间的第二比较结果;利用第一比较结果和第二比较结果,对深度决策树网络进行调试,直到符合调试完成要求时终止,比如,直到符合预设循环调试次数时终止。

STEP414,获取与待分析结构化存储任务对应的拟存储AI Chat人机互动文本;确定最少一个AI算法组件分别对应的传入信息;每个AI算法组件的传入信息包括拟存储AIChat人机互动文本、以及在相应AI算法组件之前的上游AI算法组件生成的文本语义聚合向量中的至少一种。

STEP416,利用各AI算法组件分别对相应的传入信息进行文本语义挖掘,得到场景层面文本语义和段落层面文本语义,并对场景层面文本语义和段落层面文本语义进行文本语义聚合处理,得到对应的文本语义聚合向量。

STEP418,依据每个AI算法组件分别生成的文本语义聚合向量,确定与待分析结构化存储任务对应的存储条件达标判别信息。

在上述内容的基础上,在一些可独立的实施例中,在依据每个所述AI算法组件分别生成的文本语义聚合向量,确定与所述待分析结构化存储任务对应的存储条件达标判别信息之后,所述方法还包括:响应于针对所述存储条件达标判别信息为存储条件达标的结构化存储辅助请求,将所述拟存储AI Chat人机互动文本进行树状结构化转换,得到结构化AI Chat文本;将所述结构化AI Chat文本发送给数据库系统。

这样,可以将数据库系统的树状结构化转换任务进行分摊,从而释放数据库系统的处理压力,提高数据库系统的数据存储和管理效率。

在上述内容的基础上,在一些可独立的实施例中,在得到结构化AI Chat文本之后,所述方法还包括:将所述结构化AI Chat文本进行缓存;响应于针对所述结构化AI Chat文本的调用请求,对调用服务器进行数据安全检测得到检测结果,在所述检测结果表征所述调用服务器不存在安全隐患的前提下,将所述结构化AI Chat文本下发给所述调用服务器。

可见,大数据决策分析服务器在转换得到结构化AI Chat文本之后,可以将结构化AI Chat文本缓存时间,在缓存时间内,如果接收到针对所述结构化AI Chat文本的调用请求,可以实现对调用服务器的安全检测,从而在调用服务器不存在安全隐患的前提下,将所述结构化AI Chat文本下发给所述调用服务器。如此,可以避免数据库系统在存储结构化AIChat文本的过程中反复处理相关的调用请求,且大数据决策分析服务器的算力强于数据库系统,因而可以实现调用前的精准安全分析,提高结构化AI Chat文本在调用过程中的安全性。

在上述内容的基础上,在一些可独立的实施例中,所述对调用服务器进行数据安全检测得到检测结果,包括:获取所述调用服务器的检测应答线性数组和互动反馈线性数组,所述检测应答线性数组反映所述调用服务器中的检测应答数据,所述互动反馈线性数组反映所述调用服务器中的互动反馈数据;对所述检测应答线性数组,基于所述互动反馈线性数组中与所述检测应答线性数组关联的部分线性数组,获取第一安全评估线性数组,所述第一安全评估线性数组反映融合了互动反馈线性数组的检测应答线性数组;对所述互动反馈线性数组,基于所述检测应答线性数组中与所述互动反馈线性数组关联的部分线性数组,获取第二安全评估线性数组,所述第二安全评估线性数组反映融合了检测应答线性数组的互动反馈线性数组;将所述第一安全评估线性数组与所述第二安全评估线性数组融合,得到联动安全评估线性数组;基于所述联动安全评估线性数组,确定所述调用服务器所对应的安全检测标签。

如此,通过结合检测应答数据和互动反馈数据进行综合分析,能够准确得到调用服务器所对应的安全检测标签。

在上述内容的基础上,在一些可独立的实施例中,所述获取调用服务器的检测应答线性数组和互动反馈线性数组包括:提取所述检测应答数据的检测应答倾向线性数组,将所述检测应答倾向线性数组与检测应答状态线性数组进行融合,得到所述检测应答线性数组;提取所述互动反馈数据的互动反馈观点线性数组,将所述互动反馈观点线性数组与互动反馈状态线性数组进行融合,得到所述互动反馈线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述检测应答数据包括应答项目数据和应答内容数据;所述检测应答线性数组包括应答项目线性数组和应答内容线性数组;所述提取所述检测应答数据的检测应答倾向线性数组包括:提取所述应答项目数据的应答项目倾向线性数组和所述应答内容数据的应答内容倾向线性数组;所述将所述检测应答倾向线性数组与检测应答状态线性数组进行融合,得到所述检测应答线性数组包括:将所述应答项目倾向线性数组与应答项目状态线性数组进行融合,得到所述应答项目线性数组;将所述应答内容倾向线性数组与应答内容状态线性数组进行融合,得到所述应答内容线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述第一安全评估线性数组包括应答项目安全评估线性数组和应答内容安全评估线性数组,所述对所述检测应答线性数组,基于所述互动反馈线性数组中与所述检测应答线性数组关联的部分线性数组,获取第一安全评估线性数组包括:对所述应答项目线性数组,基于所述应答内容线性数组和所述互动反馈线性数组中分别与所述应答项目线性数组关联的部分线性数组,获取所述应答项目安全评估线性数组,所述应答项目安全评估线性数组反映融合了应答内容线性数组和互动反馈线性数组之后的应答项目线性数组;对所述应答内容线性数组,基于所述应答项目线性数组和所述互动反馈线性数组中分别与所述应答内容线性数组关联的部分线性数组,获取所述应答内容安全评估线性数组,所述应答内容安全评估线性数组反映融合了应答项目线性数组和互动反馈线性数组之后的应答内容线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述基于所述应答内容线性数组和所述互动反馈线性数组中分别与所述应答项目线性数组关联的部分线性数组,获取所述应答项目安全评估线性数组包括:基于所述应答内容线性数组中与所述应答项目线性数组关联的部分线性数组,获取第一应答项目安全评估线性数组;基于所述互动反馈线性数组中与所述应答项目线性数组关联的部分线性数组,获取第二应答项目安全评估线性数组;将所述第一应答项目安全评估线性数组和所述第二应答项目安全评估线性数组进行拼接,得到第三应答项目安全评估线性数组;对所述第三应答项目安全评估线性数组进行处理,得到所述应答项目安全评估线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述基于所述应答项目线性数组和所述互动反馈线性数组中分别与所述应答内容线性数组关联的部分线性数组,获取所述应答内容安全评估线性数组包括:基于所述应答项目线性数组中与所述应答内容线性数组关联的部分线性数组,获取第一应答内容安全评估线性数组;基于所述互动反馈线性数组中与所述应答内容线性数组关联的部分线性数组,获取第二应答内容安全评估线性数组;将所述第一应答内容安全评估线性数组和所述第二应答内容安全评估线性数组进行拼接,得到第三应答内容安全评估线性数组;对所述第三应答内容安全评估线性数组进行处理,得到所述应答内容安全评估线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述对所述互动反馈线性数组,基于所述检测应答线性数组中与所述互动反馈线性数组关联的部分线性数组,获取第二安全评估线性数组包括:对所述互动反馈线性数组,基于所述应答项目线性数组和所述应答内容线性数组中分别与所述互动反馈线性数组关联的部分线性数组,获取所述第二安全评估线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述基于所述应答项目线性数组和所述应答内容线性数组中分别与所述互动反馈线性数组关联的部分线性数组,获取所述第二安全评估线性数组包括:基于所述应答项目线性数组中与所述互动反馈线性数组关联的部分线性数组,获取第一互动反馈安全评估线性数组;基于所述应答内容线性数组中与所述互动反馈线性数组关联的部分线性数组,获取第二互动反馈安全评估线性数组;将所述第一互动反馈安全评估线性数组和所述第二互动反馈安全评估线性数组进行拼接,得到第三互动反馈安全评估线性数组;对所述第三互动反馈安全评估线性数组进行处理,得到所述第二安全评估线性数组。

在上述内容的基础上,在一些可独立的实施例中,所述基于所述联动安全评估线性数组,确定所述调用服务器所对应的安全检测标签包括:对所述联动安全评估线性数组进行预测,得到安全预测线性数组;对所述安全预测线性数组进行特征映射,得到所述调用服务器属于多个候选标签的多个可信系数;选择最大可信系数所对应的候选标签为所述调用服务器所对应的安全检测标签。

本发明实施例还提供了一种用于实现基于AI Chat bot的结构化数据库存储分析方法的软件产品,包括计算机程序/指令,其中,当所述计算机程序/指令被执行时,实现执行上述的方法。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述的方法。

综上,大数据决策分析服务器能够利用AI深度决策树网络对拟存储AI Chat人机互动文本进行存储条件达标判别。该方案的整体约束性不强,可以应用到不同类型和场景的AI Chat人机互动文本下,提高了针对结构化数据库的存储分析时效性,可保障结构化数据库内存储的数据的有序性

以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。

技术分类

06120116121043