掌桥专利:专业的专利平台
掌桥专利
首页

一种数据处理方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 09:46:20


一种数据处理方法、装置、电子设备及存储介质

技术领域

本申请涉及数据处理领域,具体可应用于医疗技术领域,尤其涉及一种数据处理方法、一种数据处理装置、一种电子设备及一种计算机存储介质。

背景技术

自然语言处理是一门多学科融合的学科,它研究能实现人与计算机之间用自然语言进行有效沟通的各种理论和方法。近年来随着信息量的增多,如何利用海量数据来挖掘出更多的业务需求所需要的实体关系是目前亟需解决的问题,也是目前自然语言研究的一个重要方向。

现有的关系分类模型相比传统的深度学习模型已经得到了改进。但是,在实际的使用过程中,我们希望选择一种最好的模型来实现我们的需求。现有方法需要工程师去验证每一个关系分类模型是否是最优秀的,得到的关系分类模型不一定适合特定的数据集,因此如何提高确定语句中实体之间关系的准确性,成为一个亟待解决的问题。

发明内容

本申请实施例提供了一种数据处理方法、装置、电子设备及可读存储介质,可以提高确定实体之间关系的准确性。

第一方面,本申请实施例提供了一种数据处理方法,该方法包括:

获取用于构建搜索空间的配置信息,所述配置信息指示了待构建搜索空间中各网络层的类型、各网络层的层级关系以及各网络层的数据处理方式;

依照所述配置信息的指示构建搜索空间,所述搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式;

调用预创建的目标控制器确定所述搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为所述任一网络层对应至少一个数据处理方式中的一个或多个;

根据各目标处理方式的网络层构建目标关系分类模型;

调用所述目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定所述输入语句中目标实体之间的关系。

第二方面,本申请实施例提供了一种数据处理装置,该装置包括:

获取模块,用于获取用于构建搜索空间的配置信息,所述配置信息指示了待构建搜索空间中各网络层的类型、各网络层的层级关系以及各网络层的数据处理方式;

构建模块,用于依照所述配置信息的指示构建搜索空间,所述搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式;

确定模块,用于调用预创建的目标控制器确定所述搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为所述任一网络层对应至少一个数据处理方式中的一个或多个;

所述构建模块还用于根据各目标处理方式的网络层构建目标关系分类模型;

数据处理模块,用于调用所述目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定所述输入语句中目标实体之间的关系。

第三方面,本申请实施例提供了一种电子设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行上述第一方面所述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面所述的方法。

在本申请实施例中,基于配置信息构建得到搜索空间,然后调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,根据各目标处理方式的网络层构建目标关系分类模型;最后调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中目标实体之间的关系。通过预创建的目标控制器从搜索空间中筛选得到目标关系分类模型,从而使得目标关系分类模型更能适应当前的数据集,进而提升对实体之间关系预测的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数据处理系统的架构示意图;

图2是本申请实施例提供的一种数据处理方法的流程示意图;

图3是本申请实施例提供的另一种数据处理方法的流程示意图;

图4是本申请实施例提供的一种控制器的结构示意图;

图5是本申请实施例提供的一种数据处理装置的结构示意图;

图6是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例中提供一种数据处理方法、装置、电子设备及存储介质。在该方法中,先依照获取的配置信息的指示构建得到搜索空间,该搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式。然后调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为任一网络层对应至少一个数据处理方式中的一个或多个;并根据各目标处理方式的网络层构建目标关系分类模型。最后,调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中目标实体之间的关系。相对于其他方案,本申请实施例中的目标关系分类模型是通过预创建的目标控制器从搜索空间中筛选得到的,从而得到的目标关系分类模型更能适应当前的数据集,提升对实体之间关系预测的准确性。

请参见图1,是本申请实施例提供的一种数据处理系统的架构示意图,该数据处理系统包括区块链网络10、电子设备102和数据处理平台103,其中:

区块链网络10是指用于进行节点与节点之间数据共享的网络,区块链网络中可以包括多个节点101。每个节点101在进行正常工作可以接收到输入信息,并基于接收到的输入信息维护区块链网络内的共享数据(即区块链)。为了保证区块链网络内的信息互通,每个节点之间可以存在信息连接,任意两个节点之间可以实现点对点(Peer To Peer,P2P)通信,具体可以通过有线通信链路或无线通信链路进行P2P通信。例如,当区块链网络中的任意节点接收到输入信息时,其他节点便根据共识算法获取该输入信息,将该输入信息作为共享数据中的数据进行存储,使得区块链网络中全部节点上存储的数据均一致。

电子设备102、数据处理平台103可以接入该区块链网络,并可以与区块链网络中的节点进行通信,例如,向节点发起数据获取等等。其中,电子设备102具体可以是智能手机、平板电脑、笔记本电脑、台式电脑、车载智能终端等,本申请实施例不做限定。

需要说明的是,图1中所示的节点的数目仅仅是示意性的,根据实际需要,可以部署任意数目的节点,电子设备102、数据处理平台103可以与区块链网络中的同一节点进行通信,也可以分别与区块链网络中的不同节点进行通信。

在一种可行的实施例中,用户可以通过电子设备102登录数据处理平台103,当想要确定输入语句中实体之间的关系时,用户可以通过电子设备102提交对输入语句的数据处理请求,该数据处理请求用于指示数据处理平台确定该输入语句中目标实体之间的关系。

在一种可行的实施例中,数据处理平台103在接收到数据处理请求后,可以调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中目标实体之间的关系。

其中,上述目标实体之间的关系在不同的应用领域具有不同的含义,该应用领域可以包括医疗技术领域、网络领域等。以医疗技术领域为例,输入语句中的目标实体可以包括与疾病关联的第一实体和与药物关联的第二实体,第一实体和第二实体之间的关系可以包括以下任一种或者多种:不良反应、治疗关系和无关系。

例如输入语句为“健肾平喘汤联合硫酸沙丁胺醇气雾剂吸入治疗慢性持续期哮喘临床研究”,该语句中包括与疾病关联的第一实体“慢性持续期哮喘”,与药物关联的第二实体“健肾平喘汤”,“健肾平喘汤”与“慢性持续期哮喘”之间的关系为治疗关系,具体的治疗关系为:通过药物“健肾平喘汤”可以治疗疾病“慢性持续期哮喘”。

在一种可行的实施例中,数据处理平台103可以将目标关系分类模型上传至区块链网络10,以便后续可以直接从区块链网络10中获取目标关系分类模型,并利用目标关系分类模型对输入语句进行数据处理,进而确定输入语句中目标实体之间的关系。

请参见图2,图2是本申请实施例基于图1所示的数据处理系统提供的一种数据处理方法的流程示意图,该数据处理方法应用于数据处理平台,该数据处理方法包括步骤S201-S205:

S201:获取用于构建搜索空间的配置信息,配置信息指示了待构建搜索空间中各网络层的类型、各网络层的层级关系以及各网络层的数据处理方式。

在一个可行的实施方式中,电子设备可以通过用户在搜索空间参数配置页面的配置操作,生成用于构建搜索空间的配置信息。在另一个可行的实施方式中,电子设备可以获取数据处理平台对应的安装包,并从该数据处理平台对应的安装包中解析得到用于构建搜索空间的配置信息。

S202:依照配置信息的指示构建搜索空间,搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式。

在一些可行的实施方式中,该搜索空间可以包括五层,其中第一层为标记层、第二层为嵌入层、第三层为编码层、第四层为特征提取层、第五层为池化层。

在一些可行的实施方式中,标记层对应有多个数据处理方式(也可以说标记层对应有多个标记方式),标记层用于以标记方式标记输入语句得到标记序列;标记层对应的多个标记方式包括:

可选的,用“[CLS]”附加到每个输入语句的开头,作为标记序列的第一个标记,“[SEP]”作为标记序列的最后一个标记。

例如,输入语句x=[x

可选的,不仅用“[CLS]”附加到每个输入语句的开头作为标记序列的第一个标记,“[SEP]”作为标记序列的最后一个标记,而且在目标实体的开始和结束添加特殊标记。

例如,输入语句x=[x

可选的,不仅用“[CLS]”附加到每个输入语句的开头,作为标记序列的第一个标记,“[SEP]”作为标记序列的最后一个标记,还利用特殊标记标记输入语句中的目标实体。

例如,输入语句x=[x

在一些可行的实施方式中,嵌入层对应有多个数据处理方式(也可以说嵌入层对应有多个嵌入方式),嵌入层用于以嵌入方式嵌入标记序列得到嵌入向量;嵌入层对应的多个嵌入方式包括:

可选的,直接利用bert的嵌入层嵌入得到嵌入向量。可选的。先利用bert的嵌入层处理标记序列,然后在嵌入层输出的嵌入向量中添加位置编码向量。

在一些可行的实施方式中,编码层对应有多个数据处理方式(也可以说编码层对应有多个编码方式),编码层用于以编码方式对嵌入向量进行编码得到编码向量;编码层对应的多个编码方式包括:

可选的,若嵌入向量是直接利用bert的嵌入层嵌入得到的,在一种可行的实施方式中,编码层可以直接利用bert的编码层对嵌入向量进行编码得到编码向量。另一种可行的实施方式中,编码层可以先利用bert的编码层对嵌入向量进行编码,然后在编码层输出的编码向量中添加位置编码向量。

可选的,若嵌入层是先利用bert的嵌入层处理标记序列,然后在嵌入层输出的嵌入向量中添加位置编码向量。编码层可以直接利用bert的编码层对嵌入向量进行编码得到编码向量。

在一些可行的实施方式中,特征提取层对应有多个数据处理方式(也可以说特征提取层对应有多个特征提取方式),特征提取层用于以特征提取方式对编码向量进行特征提取得到子特征向量;特征提取层对应的多个特征提取方式包括:(1)目标实体e

其中,交互作用可包括两个向量的点积或绝对差。

在一些可行的实施方式中,池化层对应有多个数据处理方式(也可以说池化层对应有多个池化方式),池化层用于以池化方式对子特征向量进行池化得到固定长度的特征向量。池化层对应的多个池化方式包括:平常池化、最大池、自注意池、动态路由池、开始池。

S203:调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为任一网络层对应至少一个数据处理方式中的一个或多个。

在一个可行的实施方式中,目标控制器是基于时间循环神经网络构建的多层控制网络层。任一控制网络层包含隐藏层、线性层以及分类计算层。可选的,获取搜索空间包含的各网络层中任一网络层的输入向量(包括上一层输出的隐藏向量和当前层的预设输入向量),然后将输入向量输入隐藏层得到隐藏向量。接着将隐藏向量输入线性层,并将线性层的结果输入分类计算层得到网络层的至少一个数据处理方式的概率;将至少一个数据处理方式的概率中的最大概率对应的数据处理方式作为目标处理方式。

S204:根据各目标处理方式的网络层构建目标关系分类模型。

在一个可行的实施方式中,目标关系分类模型包括八层,其中第一层为输入层,第二层为以目标标记方式标记输入语句的标记层,第三层为以目标嵌入方式嵌入标记序列的嵌入层,第四层以目标编码方式编码嵌入向量的编码层,第五层为以目标特征提取方式对编码向量进行特征提取的特征提取层,第六层为以目标池化方式对子特征向量进行池化的池化层,第七层为分类计算层,第八层为输出层。

S205:调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中目标实体之间的关系。

其中,上述目标实体之间的关系在不同的应用领域具有不同的含义,该应用领域可以包括医疗技术领域、网络领域等。以医疗技术领域为例,输入语句中的目标实体可以包括与疾病关联的第一实体和与药物关联的第二实体,第一实体和第二实体之间的关系可以包括以下任一种或者多种:不良反应、治疗关系、无关系。在一个可行的实施方式中,调用目标关系分类模型对包含目标实体(即第一实体和第二实体)的输入语句进行数据处理,并基于数据处理结果确定输入语句中第一实体和第二实体之间的关系。

可选的,在得到输入语句中第一实体和第二实体之间的关系之后,可以依照输入语句中第一实体与第二实体之间的关系在输入语句中添加与第一实体和第二实体关联的标记信息,并输出添加有标记信息的输入语句。

在一个可行的实施方式中,与第一实体和第二实体关联的标记信息可以是不同的高亮显示。例如,第一实体和第二实体之间为不良反应时,第一实体和第二实体显示为红色。第一实体和第二实体之间为治疗关系时,第一实体和第二实体显示为绿色。第一实体和第二实体之间为无关系时,第一实体和第二实体显示为黄色。

在另一个可行的实施方式中,与第一实体和第二实体关联的标记信息可以是与第一实体和第二实体关联的文本批注。该文本批注指示了第一实体和第二实体之间的关系。

可选的,在得到输入语句中第一实体和第二实体之间的关系之后,可以依照输入语句中第一实体与第二实体之间的关系在知识图谱中查找第一实体和第二实体之间关系的描述信息,并输出添加有描述信息的输入语句。例如,在第一实体和第二实体之间为不良反应时,可以根据知识图谱确定该不良反应的描述信息,如不良反应的症状等;在第一实体和第二实体之间为治疗关系时,可以根据知识图谱确定该治疗关系的描述信息,如治疗效果等;在第一实体和第二实体之间为无关系时,无描述信息。

在本申请实施例中,基于配置信息构建得到搜索空间,然后调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,根据各目标处理方式的网络层构建目标关系分类模型;最后调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中目标实体之间的关系。通过预创建的目标控制器从搜索空间中筛选得到目标关系分类模型,从而使得目标关系分类模型更能适应当前的数据集,进而提升对实体之间关系预测的准确性。并且,当本申请实施例应用在医疗技术领域中时,在获取到目标实体之间的关系后,可以输出添加有标记信息或者描述信息的输入语句,便于提示用户,提升用户体验。

在调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式之前,需要对控制器进行训练得到目标控制器。基于此,请参见图3,图3是本申请实施例提供的另一种数据处理方法,该数据处理方法包括步骤S301-S308:

S301:获取用于构建搜索空间的配置信息,配置信息指示了待构建搜索空间中各网络层的类型、各网络层的层级关系以及各网络层的数据处理方式。

S302:依照配置信息的指示构建搜索空间,搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式。

S303:获取控制器的网络参数,基于该网络参数构建得到控制器。

在一个可行的实施方式中,控制器的网络参数包括各个控制网络层的参数。可选的,该控制器的网络参数是根据经验或业务需求设置的。可选的,该控制器的网络参数是通过预训练确定的。这里不做限定。

在一个可行的实施方式中,可以通过时间循环神经网络构建得到包含多个控制网络层的控制器。每一个控制网络层包含隐藏层、线性层以及分类计算层。每一个控制网络层对应一个网络层。

示例性的,请参见图4,图4是本申请实施例提供的一种控制器的结构示意图。如图4所示,该控制器包括第一控制网络层401、第二控制网络层402、第三控制网络层403、第四控制网络层404、第五控制网络层405。

S304:基于该控制器生成候选关系分类模型。

在一个可行的实施方式中,任一控制网络层的输入向量输入隐藏层得到隐藏向量。接着将隐藏向量输入线性层,并将线性层的结果输入分类计算层得到该控制网络层对应的网络层的至少一个数据处理方式的概率;将至少一个数据处理方式的概率中的最大概率对应的数据处理方式作为候选处理方式。

其中,控制网络层的输入向量包括上一层输出的隐藏向量和当前层的预设输入向量。例如,在图4中,第一控制网络层401的输入向量包括上一层输出的隐藏向量(即初始向量h

其中,分类计算层可得到该网络层的各个数据处理方式的预测概率。在一个可行的实施方式中,可以通过概率公式计算出每一层各个数据处理方式的预测概率。具体地计算公式如下所示:

在一个可行的实施方式中,可以通过控制器的第一控制网络层确定标记层的各个标记方式的概率,并将最大预测概率对应的标记方式作为候选标记方式。可以通过控制器的第二控制网络层确定嵌入层的各个嵌入方式的概率,并将最大预测概率对应的嵌入方式作为候选嵌入方式。可以通过控制器的第三控制网络层确定编码层各个编码方式的预测概率,并将最大预测概率对应的编码方式作为候选编码方式。可以通过控制器的第四控制网络层确定特征提取层各个特征提取方式的预测概率,并将多个较大预测概率对应的特征提取方式作为候选特征提取方式。可以通过控制器的第五控制网络层确定池化层各个池化方式的预测概率,并将最大预测概率对应的池化方式作为候选池化方式。

例如,请参见图4,输出的y

以输入层为第一层,以候选标记方式标记输入语句的标记层为第二层,以候选嵌入方式嵌入标记序列的嵌入层为第三层,以候选编码方式编码嵌入向量的编码层为第四层,以候选特征提取方式对编码向量进行特征提取的特征提取层为第五层,以候选池化方式对子特征向量进行池化的池化层为第六层,以分类计算层为第七层,以输出层为第八层构成候选关系分类模型。

在一个可行的实施方式中,利用训练语句对构建的候选关系分类模型进行训练,直至训练后的候选关系分类模型确定的预测关系的置信度满足预设条件。其中,预测关系的置信度可以是指候选关系分类模型确定的训练语句中实体之间的预测关系与训练语句中实体之间实际关系之间的相对偏差。

S305:调用候选关系分类模型对测试语句进行测试处理,并基于测试处理结果得到候选关系分类模型的性能参数。

在一些可行的实施方式中,候选关系分类模型的性能参数可以包括宏观F1指标、微观F1指标、Top-K指标等等,这里不做限定。

S306:根据候选关系分类模型的性能参数更新控制器的网络参数得到目标控制器。

在一个可行的实施方式中,可以通过控制器生成N个候选关系分类模型,然后获取N个候选关系分类模型的性能参数,接着根据N个候选关系分类模型的性能参数通过策略梯度算法更新控制器的网络参数得到更新后的控制器。重复迭代更新K次,更新K次网络参数得到控制器即为目标控制器。

在一个可行的实施方式中,策略梯度算法可以通过以下表达式表征:

其中,网络参数为

S307:调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为任一网络层对应至少一个数据处理方式中的一个或多个。

S308:根据各目标处理方式的网络层构建目标关系分类模型,并调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中目标实体之间的关系。

在本申请实施例中,基于配置信息构建得到搜索空间。然后通过交织优化的方式得到目标控制器,并调用优化后的目标控制器确定搜索空间中各网络层的目标处理方式,根据各目标处理方式的网络层构建目标关系分类模型;最后调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中实体之间的关系。通过交织优化后的目标控制器从搜索空间中筛选得到目标关系分类模型,从而得到性能更优的目标控制器,经过该目标控制器得到的目标关系分类模型更能适应当前的数据集,在节省人力物力的同时提升对实体之间关系预测的准确性。

请参见图5,图5为本申请实施例提供的一种数据处理装置的结构示意图。本实施例中所描述的数据处理装置,包括获取模块501、构建模块502、确定模块503、数据处理模块504。

获取模块501,用于获取用于构建搜索空间的配置信息,所述配置信息指示了待构建搜索空间中各网络层的类型、各网络层的层级关系以及各网络层的数据处理方式;

构建模块502,用于依照所述配置信息的指示构建搜索空间,所述搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式;

确定模块503,用于调用预创建的目标控制器确定所述搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为所述任一网络层对应至少一个数据处理方式中的一个或多个;

所述构建模块502还用于根据各目标处理方式的网络层构建目标关系分类模型;

数据处理模块504,用于调用所述目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定所述输入语句中目标实体之间的关系。

在一些可行的实施方式中,目标控制器为基于时间循环神经网络构建的多层控制网络层,任一控制网络层包含隐藏层、线性层以及分类计算层,所述确定模块503调用预创建的目标控制器确定所述搜索空间中各网络层的目标处理方式,具体包括:

获取所述搜索空间包含的各网络层中任一网络层的输入向量;

将所述输入向量输入所述隐藏层得到隐藏向量;

将所述隐藏向量输入所述线性层,并将所述线性层的输出结果输入所述分类计算层得到所述网络层的至少一个数据处理方式的概率;

将所述至少一个数据处理方式的概率中的最大概率对应的数据处理方式确定为所述任一网络层的目标处理方式。

在一些可行的实施方式中,所述确定模块503调用预创建的目标控制器确定所述搜索空间中各网络层的目标处理方式之前,所述确定模块503还用于:

基于控制器生成候选关系分类模型;

调用所述候选关系分类模型对测试语句进行测试处理,并基于测试处理结果得到所述候选关系分类模型的性能参数;

根据所述候选关系分类模型的性能参数更新所述控制器的网络参数,以得到目标控制器。

在一些可行的实施方式中,所述确定模块503具体用于:

获取至少一个候选关系分类模型的性能参数;

基于所述至少一个候选关系分类模型的性能参数通过策略梯度算法更新所述控制器的网络参数,以得到目标控制器。

在一些可行的实施方式中,所述确定模块503还用于:

利用训练语句对所述候选关系分类模型进行训练,直至通过所述训练后的候选关系分类模型确定的预测关系的置信度满足预设条件。

在一些可行的实施方式中,所述网络层包括以下一种或多种:标记层、嵌入层、编码层、特征提取层和池化层;其中,

所述标记层用于以标记方式标记所述输入语句得到标记序列;

所述嵌入层用于以嵌入方式对所述标记序列进行嵌入得到嵌入向量;

所述编码层用于以编码方式对所述嵌入向量进行编码得到编码向量;

所述特征提取层用于以特征提取方式对所述编码向量进行特征提取得到子特征向量;

所述池化层用于以池化方式对所述子特征向量进行池化得到特征向量。

在一些可行的实施方式中,所述数据处理模块504还用于:

依照所述输入语句中目标实体之间的关系在所述输入语句中添加与所述目标实体关联的标记信息;

输出添加有所述标记信息的输入语句。

可以理解的是,本实施例的数据处理装置的各功能模块可根据上述方法实施例图2或者图3中的方法具体实现,其具体实现过程可以参照上述方法实施例图2或者图3的相关描述,此处不再赘述。

本实施例可以适用于医疗技术领域。在本申请实施例中,基于配置信息构建得到搜索空间,然后调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,根据各目标处理方式的网络层构建目标关系分类模型;最后调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中实体之间的关系。通过预创建的目标控制器从搜索空间中筛选得到目标关系分类模型,从而使得目标关系分类模型更能适应当前的数据集,进而提升对实体之间关系预测的准确性。

请参阅图6,图6为本申请实施例提供的一种电子设备的结构示意图。该电子设备可以包括:一个或多个处理器601;一个或多个输入设备602,一个或多个输出设备603和存储器604。上述处理器601、输入设备602、输出设备603和存储器604通过总线605连接。存储器604用于存储计算机程序,所述计算机程序包括程序指令,处理器601用于执行存储器604存储的程序指令,执行以下操作:

获取用于构建搜索空间的配置信息,所述配置信息指示了待构建搜索空间中各网络层的类型、各网络层的层级关系以及各网络层的数据处理方式;

依照所述配置信息的指示构建搜索空间,所述搜索空间包括至少一个网络层,任一网络层对应至少一个数据处理方式;

调用预创建的目标控制器确定所述搜索空间中各网络层的目标处理方式,任一网络层的目标处理方式为所述任一网络层对应至少一个数据处理方式中的一个或多个;

根据各目标处理方式的网络层构建目标关系分类模型;

调用所述目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定所述输入语句中目标实体之间的关系。

在一种实施方式中,所述目标控制器为基于时间循环神经网络构建的多层控制网络层,任一控制网络层包含隐藏层、线性层以及分类计算层,处理器601具体用于:

获取所述搜索空间包含的各网络层中任一网络层的输入向量;

将所述输入向量输入所述隐藏层得到隐藏向量;

将所述隐藏向量输入所述线性层,并将所述线性层的输出结果输入所述分类计算层得到所述网络层的至少一个数据处理方式的概率;

将所述至少一个数据处理方式的概率中的最大概率对应的数据处理方式确定为所述任一网络层的目标处理方式。

在一种实施方式中,处理器601还用于:

基于控制器生成候选关系分类模型;

调用所述候选关系分类模型对测试语句进行测试处理,并基于测试处理结果得到所述候选关系分类模型的性能参数;

根据所述候选关系分类模型的性能参数更新所述控制器的网络参数,以得到目标控制器。

在一种实施方式中,处理器601具体用于:

获取至少一个候选关系分类模型的性能参数;

基于所述至少一个候选关系分类模型的性能参数通过策略梯度算法更新所述控制器的网络参数,以得到目标控制器。

在一种实施方式中,处理器601还用于:

利用训练语句对所述候选关系分类模型进行训练,直至通过所述训练后的候选关系分类模型确定的预测关系的置信度满足预设条件。

在一种实施方式中,所述各网络层包括以下一种或多种:标记层、嵌入层、编码层、特征提取层和池化层;其中

所述标记层用于以标记方式标记所述输入语句得到标记序列;

所述嵌入层用于以嵌入方式对所述标记序列进行嵌入得到嵌入向量;

所述编码层用于以编码方式对所述嵌入向量进行编码得到编码向量;

所述特征提取层用于以特征提取方式对所述编码向量进行特征提取得到子特征向量;

所述池化层用于以池化方式对所述子特征向量进行池化得到特征向量。

在一种实施方式中,处理器601还用于:

依照所述输入语句中目标实体之间的关系在所述输入语句中添加与所述目标实体关联的标记信息;

输出添加有所述标记信息的输入语句。

应当理解,在本申请实施例中,所称处理器601可以是中央处理单元(CentralProcessing Unit,CPU),该处理器601还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器604可以包括只读存储器和随机存取存储器,并向处理器601提供指令和数据。存储器604的一部分还可以包括非易失性随机存取存储器。该存储器604可用于存储用于构建搜索空间的配置信息。

具体实现中,本申请实施例中所描述的处理器601、输入设备602、输出设备603和存储器604可执行本申请实施例提供的数据处理方法所描述的实现方式,也可执行本申请实施例所描述的数据处理装置的实现方式,在此不再赘述。

本实施例可以适用于医疗技术领域。在本申请实施例中,基于配置信息构建得到搜索空间,然后调用预创建的目标控制器确定搜索空间中各网络层的目标处理方式,根据各目标处理方式的网络层构建目标关系分类模型;最后调用目标关系分类模型对输入语句进行数据处理,并基于数据处理结果确定输入语句中实体之间的关系。通过预创建的目标控制器从搜索空间中筛选得到目标关系分类模型,从而使得目标关系分类模型更能适应当前的数据集,进而提升对实体之间关系预测的准确性。

本申请实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,可执行上述数据处理方法实施例中所执行的步骤。

本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述数据处理方法实施例中所执行的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于发明所涵盖的范围。

相关技术
  • 一种数据处理方法、装置、电子设备和存储介质
  • 一种图像数据处理方法、装置、电子设备及其存储介质
技术分类

06120112297025