掌桥专利:专业的专利平台
掌桥专利
首页

一种数据处理方法及装置

文献发布时间:2023-06-19 11:52:33


一种数据处理方法及装置

技术领域

本发明涉及数据处理技术领域,尤其涉及一种数据处理方法及装置。

背景技术

随着智能科学技术的提高,银行对于网点机器人的部署及应用范围不断扩大。

网点机器人可以是银行网点部署的交易处理设备,可以在与客户闲聊和协助解答客户问题的基础上,学习交易办理流程,办理客户提出的交易请求,解决客户需求。其中,银行网点需要处理的交易类型众多,网点机器人由于处理资源有限而无法全面覆盖所有交易。

但是,现有技术无法有效确定网点机器人的待学习交易。

发明内容

鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法及装置,技术方案如下:

一种数据处理方法,包括:

针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,所述待评估交易集中包括至少一个待评估交易,所述整体知识图谱中包括各所述待评估交易的交易要素;

根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各所述待评估交易的交易复杂度;

对各所述待评估交易的交易复杂度进行排序,将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度;

将所述目标交易复杂度所对应的所述待评估交易,确定为所述网点机器人的待学习交易。

可选的,所述针对待评估交易集中的各待评估交易,建立整体知识图谱,包括:

分别建立各所述待评估交易的知识图谱;

基于各所述待评估交易间的上下游关系,利用各所述待评估交易的知识图谱建立所述整体知识图谱。

可选的,所述对各所述待评估交易的交易复杂度进行排序,包括:

按照由低至高的次序,对各所述待评估交易的交易复杂度进行排序;

所述将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度,包括:

将不大于预设序号阈值的排序序号所对应的交易复杂度确定为目标交易复杂度。

可选的,所述根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各所述待评估交易的交易复杂度,包括:

将所述待评估交易集中的一个所述待评估交易,确定为当前的目标待评估交易;

根据交易要素的使用率、信息提取难度和训练语料数量,分别确定当前的目标待评估交易中各交易要素的复杂度;

将当前的目标待评估交易中各交易要素的复杂度的均值,确定为当前的目标待评估交易的交易复杂度;

返回执行所述将所述待评估交易集中的一个所述待评估交易,确定为当前的目标待评估交易的步骤,直至确定所述待评估交易集中各所述待评估交易的交易复杂度。

可选的,所述根据交易要素的使用率、信息提取难度和训练语料数量,分别确定当前的目标待评估交易中各交易要素的复杂度,包括:

将当前的目标待评估交易中的一个交易要素,确定为当前的目标交易要素;

确定当前的目标交易要素的使用率;

确定当前的目标交易要素的信息提取难度;

确定当前的目标交易要素的训练语料数量;

根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,确定当前的目标交易要素的复杂度;

返回执行所述将当前的目标待评估交易中的一个交易要素,确定为当前的目标交易要素的步骤,直至确定所述当前的目标待评估交易中各交易要素的复杂度。

可选的,所述确定当前的目标交易要素的使用率,包括:

将各第一待评估交易的交易量占比的和值,确定为当前的目标交易要素的使用率,所述第一待评估交易为所述待评估交易集中包含有当前的目标交易要素的所述待评估交易。

可选的,所述确定当前的目标交易要素的信息提取难度,包括:

计算当前的目标交易要素分别与所述整体知识图谱中其它交易要素的余弦距离;

按照由大至小的次序,对计算出的各所述余弦距离进行排序,将排序序号不大于预设阈值的余弦距离均确定为目标余弦距离;

计算各所述目标余弦距离的平均值;

将计算出的所述平均值的倒数值确定为当前的目标交易要素的信息提取难度。

可选的,所述根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,确定当前的目标交易要素的复杂度,包括:

对当前的目标交易要素的使用率进行归一化处理,获得处理后使用率;

对当前的目标交易要素的信息提取难度进行归一化处理,获得处理后信息提取难度;

对当前的目标交易要素的训练语料数量进行归一化处理,获得处理后训练语料数量;

将所述处理后使用率、所述处理后信息提取难度和所述处理后训练语料数量输入至复杂度计算公式:

S=r+n-df

中;其中,S为当前的目标交易要素的复杂度,r为当前的目标交易要素的处理后使用率,n为当前的目标交易要素的处理后信息提取难度,df为当前的目标交易要素的处理后训练语料数量;

获得所述复杂度计算公式输出的当前的目标交易要素的复杂度。

一种数据处理装置,包括:第一建立单元、第一确定单元、第一排序单元、第二确定单元和第三确定单元,其中:

所述第一建立单元,被配置为执行:针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,所述待评估交易集中包括至少一个待评估交易,所述整体知识图谱中包括各所述待评估交易的交易要素;

所述第一确定单元,被配置为执行:根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各所述待评估交易的交易复杂度;

所述第一排序单元,被配置为执行:对各所述待评估交易的交易复杂度进行排序;

所述第二确定单元,被配置为执行:将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度;

所述第三确定单元,被配置为执行:将所述目标交易复杂度所对应的所述待评估交易,确定为所述网点机器人的待学习交易。

可选的,所述第一建立单元包括:第二建立单元和第三建立单元,其中:

所述第二建立单元,被配置为执行:分别建立各所述待评估交易的知识图谱;

所述第三建立单元,被配置为执行:基于各所述待评估交易间的上下游关系,利用各所述待评估交易的知识图谱建立所述整体知识图谱。

可选的,所述第一排序单元,被配置为执行:按照由低至高的次序,对各所述待评估交易的交易复杂度进行排序;

所述第二确定单元,被配置为执行:将不大于预设序号阈值的排序序号所对应的交易复杂度确定为目标交易复杂度。

可选的,所述第一确定单元,包括:第四确定单元、第五确定单元、第六确定单元和第一触发单元,其中:

所述第四确定单元,被配置为执行:将所述待评估交易集中的一个所述待评估交易,确定为当前的目标待评估交易;

所述第五确定单元,被配置为执行:根据交易要素的使用率、信息提取难度和训练语料数量,分别确定当前的目标待评估交易中各交易要素的复杂度;

所述第六确定单元,被配置为执行:将当前的目标待评估交易中各交易要素的复杂度的均值,确定为当前的目标待评估交易的交易复杂度;

所述第一触发单元,被配置为执行:触发所述第四确定单元,直至确定所述待评估交易集中各所述待评估交易的交易复杂度。

可选的,所述第五确定单元,包括:第七确定单元、使用率确定单元、难度确定单元、语料数量确定单元、复杂度确定单元和第二触发单元,其中:

所述第七确定单元,被配置为执行:将当前的目标待评估交易中的一个交易要素,确定为当前的目标交易要素;

所述使用率确定单元,被配置为执行:确定当前的目标交易要素的使用率;

所述难度确定单元,被配置为执行:确定当前的目标交易要素的信息提取难度;

所述语料数量确定单元,被配置为执行:确定当前的目标交易要素的训练语料数量;

所述复杂度确定单元,被配置为执行:根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,确定当前的目标交易要素的复杂度;

所述第二触发单元,被配置为执行:触发所述第七确定单元,直至确定所述当前的目标待评估交易中各交易要素的复杂度。

可选的,所述使用率确定单元,包括:将各第一待评估交易的交易量占比的和值,确定为当前的目标交易要素的使用率,所述第一待评估交易为所述待评估交易集中包含有当前的目标交易要素的所述待评估交易。

可选的,所述难度确定单元,包括:余弦距离计算单元、第二排序单元、第八确定单元、平均值计算单元和第九确定单元,其中:

所述余弦距离计算单元,被配置为执行:计算当前的目标交易要素分别与所述整体知识图谱中其它交易要素的余弦距离;

所述第二排序单元,被配置为执行:按照由大至小的次序,对计算出的各所述余弦距离进行排序;

所述第八确定单元,被配置为执行:将排序序号不大于预设阈值的余弦距离均确定为目标余弦距离;

所述平均值计算单元,被配置为执行:计算各所述目标余弦距离的平均值;

所述第九确定单元,被配置为执行:将计算出的所述平均值的倒数值确定为当前的目标交易要素的信息提取难度。

可选的,所述复杂度确定单元,包括:第一处理单元、第一获得单元、第二处理单元、第二获得单元、第三处理单元、第三获得单元、输入单元和第四获得单元,其中:

所述第一处理单元,被配置为执行:对当前的目标交易要素的使用率进行归一化处理;

所述第一获得单元,被配置为执行:获得处理后使用率;

所述第二处理单元,被配置为执行:对当前的目标交易要素的信息提取难度进行归一化处理;

所述第二获得单元,被配置为执行:获得处理后信息提取难度;

所述第三处理单元,被配置为执行:对当前的目标交易要素的训练语料数量进行归一化处理;

所述第三获得单元,被配置为执行:获得处理后训练语料数量;

所述输入单元,被配置为执行:将所述处理后使用率、所述处理后信息提取难度和所述处理后训练语料数量输入至复杂度计算公式:

S=r+n-df

中;其中,S为当前的目标交易要素的复杂度,r为当前的目标交易要素的处理后使用率,n为当前的目标交易要素的处理后信息提取难度,df为当前的目标交易要素的处理后训练语料数量;

所述第四获得单元,被配置为执行:获得所述复杂度计算公式输出的当前的目标交易要素的复杂度。

本实施例提出的数据处理方法及装置,可以针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,待评估交易集中包括至少一个待评估交易,整体知识图谱中包括各待评估交易的交易要素,根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各待评估交易的交易复杂度,对各待评估交易的交易复杂度进行排序,将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度,将目标交易复杂度所对应的待评估交易,确定为网点机器人的待学习交易。本发明可以有效确定网点机器人的待学习交易。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1示出了本发明实施例提供的第一种数据处理方法的流程图;

图2示出了本发明实施例提供的一种挂失交易的知识图谱;

图3示出了本发明实施例提供的一种整体知识图谱;

图4示出了本发明实施例提供第二种数据处理方法的流程图;

图5示出了本发明实施例提供的第一种数据处理装置的结构示意图;

图6示出了本发明实施例提供的第二种数据处理装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

如图1所示,本实施例提出了第一种数据处理方法。该方法可以包括以下步骤:

S101、针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,待评估交易集中包括至少一个待评估交易,整体知识图谱中包括各待评估交易的交易要素;

需要说明的是,本发明可以应用于网点机器人,也可以应用于如手机和平板电脑的电子设备。

其中,待评估交易集中的待评估交易可以由银行的技术人员根据银行网点的实际交易处理情况进行制定,本发明对此不做限定。

其中,整体知识图谱可以由各待评估交易的知识图谱构成。

可选的,在本实施例提出的其它数据处理方法中,步骤S101可以包括:

分别建立各待评估交易的知识图谱;

基于各待评估交易间的上下游关系,利用各待评估交易的知识图谱建立整体知识图谱。

其中,待评估交易的知识图谱可以包括待评估交易及其交易要素。比如,“挂失”的知识图谱可以如图2所示,在“挂失”的知识图谱中,卡号和密码即为“挂失”的交易要素。

具体的,本发明可以根据各待评估交易间的上下游关系,利用各待评估交易的知识图谱来构建整体知识图谱。如图3所示整体知识图谱中,“补卡”为“挂失”的下游交易,即在办理“补卡”之前,需先行办理“补卡”,“补卡”的交易要素包括有密码。

需要说明的是,对于不存在与其它待评估交易具有上下游关系的待评估交易,也可以纳入至整体知识图谱中。比如,图3所示的整体知识图谱中的“转账”,其交易要素包括有收款人、金额和收款账号,“转账”与整体知识图谱中的其它待评估交易不存在上下游关系。

其中,在构建整体知识图谱的过程中,本发明可以对各待评估交易中的交易要素进行消岐,即对同一含义而名称不同的交易要素,使用同一名称对其进行统一描述。比如,对于“账号”和“账户”,本发明可以对该两个交易要素进行消岐,统一使用“账号”这一名称对其进行描述。

S102、根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各待评估交易的交易复杂度;

其中,交易要素的使用率可以为交易要素在各待评估交易中的使用率。具体的,交易要素的使用率可以为包含有交易要素的各待评估交易的交易量占比的和值。比如,第一交易要素的使用率,可以为包含有第一交易要素的各待评估交易的交易量占比的和值。

需要说明的是,本发明可以在银行网点实际办理客户请求的交易的过程中,收集客户输出的文本语句或者语音语句,并通过人工标注语句中存在的交易要素,从而获得可以用于训练信息提取模型的训练语料,使用训练语料对信息提取模型进行训练,以获得训练好的信息提取模型,使用信息提取模型来对客户输入的语句中提取交易要素。

其中,交易要素的信息提取难度可以为信息提取模型在客户输入包含有交易要素的语句时,从该语句中识别及提取出交易要素的难度。比如,第一交易要素的信息提取难度可以为信息提取模型在客户输入包含有第一交易要素的语句时,从该语句中识别及提取出第一交易要素的难度。

其中,交易要素的训练语料数量可以为包含有交易要素的训练语料的数量。

具体的,本发明可以根据交易要素的使用率、信息提取难度和训练语料数量,来确定交易要素的复杂度。比如,对于第一交易要素,本发明可以根据第一交易要读的使用率、信息提取难度和训练语料数量,来确定第一交易要素的复杂度;再比如,对于第二交易要素,本发明可以根据第二交易要读的使用率、信息提取难度和训练语料数量,来确定第二交易要素的复杂度。

可以理解的是,本发明可以根据某个待评估交易中各交易要素的复杂度,来确定该待评估交易的交易复杂度。比如,对于第一待评估交易,本发明可以根据第一待评估交易中各交易要素的复杂度,来确定第一待评估交易的交易复杂度;再比如,对于第二待评估交易,本发明可以根据第二待评估交易中各交易要素的复杂度,来确定第二待评估交易的交易复杂度。

S103、对各待评估交易的交易复杂度进行排序;

具体的,本发明可以在确定各待评估交易的交易复杂度后,对各待评估交易的交易复杂度进行排序。

可选的,本发明可以按照由高至低的次序,对各交易复杂度进行排序;本发明也可以按照由低至高的次序,对各交易复杂度进行排序。

S104、将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度;

其中,目标序号可以为高交易复杂度或低交易复杂度对应的序号。目标序号可以包括一个或多个排序序号,本发明对此不做限定。

需要说明的是,本发明可以从排序的各交易复杂度中,确定出高交易复杂度,并选取高交易复杂度对应的待评估交易作为网点机器人的待学习交易(此时高交易复杂度即为目标交易复杂度),使得网点机器人可以办理交易复杂度高的交易,在提高交易办理效率的同时,减少人工办理复杂交易所消耗的人力资源。

可选的,本发明也可以从排序的各交易复杂度中,确定出低交易复杂度,并选取低交易复杂度对应的待评估交易作为网点机器人的待学习交易(此时低交易复杂度即为目标交易复杂度),使得网点机器人可以办理交易复杂度低的交易,在提高交易办理效率的同时,降低网点机器人对于交易办理的学习难度,保证网点机器人办理交易的成功率。

可选的,当按照由高至低的次序对各交易复杂度进行排序时,本发明可以将排序在前列的一定数量的交易复杂度确定为高交易复杂度,将排序在后列的一定数量的交易复杂度确定为低交易复杂度,此时若将高交易复杂度对应的待评估交易确定为网点机器人的待学习交易,则目标序号可以包括不大于某个预设阈值的序号,若将低交易复杂度对应的待评估交易确定为网点机器人的待学习交易,则目标序号可以包括不小于某个预设阈值的序号。

可以理解的是,本发明可以在确定目标序号后,将目标序号对应的交易复杂度确定为目标交易复杂度。

S105、将目标交易复杂度所对应的待评估交易,确定为所述网点机器人的待学习交易。

具体的,本发明可以在确定目标交易复杂度后,将目标交易复杂度所对应的待评估交易确定为网点机器人的待学习交易。

可选的,在本实施例提出的其它数据处理方法中,步骤S104可以具体为:按照由低至高的次序,对各待评估交易的交易复杂度进行排序;步骤S105可以具体为:将不大于预设序号阈值的排序序号所对应的交易复杂度确定为目标交易复杂度。

其中,本发明可以按照由低至高的次序对各交易复杂度进行排序,将排序在前列的一定数量的排序序号确定为目标序号。比如,本发明可以将前5的排序序号确定为目标序号。此时,本发明可以将低交易复杂度对应的待评估交易确定为网点机器人的待学习交易。

其中,预设序号阈值可以由技术人员根据实际工作情况进行制定,本发明对此不做限定。

本实施例提出的数据处理方法,可以针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,待评估交易集中包括至少一个待评估交易,整体知识图谱中包括各待评估交易的交易要素,根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各待评估交易的交易复杂度,对各待评估交易的交易复杂度进行排序,将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度,将目标交易复杂度所对应的待评估交易,确定为网点机器人的待学习交易。本发明可以有效确定网点机器人的待学习交易。

基于图1所示步骤,如图4所示,本实施例提出第二种数据处理方法。在该方法中,步骤S102可以包括以下步骤:

S201、将待评估交易集中的一个待评估交易,确定为当前的目标待评估交易;

需要说明的是,本发明可以通过依次将待评估交易集中的待评估交易确定为当前的目标待评估交易,确定当前的目标待评估交易的交易复杂度,来获得待评估交易集中各待评估交易的交易复杂度。

S202、根据交易要素的使用率、信息提取难度和训练语料数量,分别确定当前的目标待评估交易中各交易要素的复杂度;

具体的,本发明可以根据某个交易要素的使用率、信息提取难度和训练语料数量,来确定该交易要素的复杂度。比如,对于当前的目标待评估交易中的第一交易要素,本发明可以根据第一交易要素的使用率、信息提取难度和训练语料数量,来确定第一交易要素的复杂度。

S203、将当前的目标待评估交易中各交易要素的复杂度的均值,确定为当前的目标待评估交易的交易复杂度;

具体的,本发明可以在确定出当前的目标待评估交易中各交易要素的复杂度之后,计算各交易要素的复杂度的均值,将计算出的均值确定为当前的目标待评估交易的交易复杂度。

S204、返回执行步骤S201,直至确定待评估交易集中各待评估交易的交易复杂度。

可以理解的是,本发明可以通过执行步骤S201、S202、S203和S204,来确定待评估交易集中各待评估交易的交易复杂度。

本实施例提出的数据处理方法,可以通过依次将待评估交易集中的待评估交易确定为当前的目标待评估交易,确定当前的目标待评估交易的交易复杂度,来获得待评估交易集中各待评估交易的交易复杂度,保证对各待评估交易的交易复杂度的获得成功率。

基于图4所示的步骤,本实施例提出第三种数据处理方法。在该方法中,步骤S202可以包括以下步骤:

S301、将当前的目标待评估交易中的一个交易要素,确定为当前的目标交易要素;

其中,本发明可以通过依次将当前的目标待评估交易中的各交易要素确定为当前的目标交易要素,计算当前的目标交易要素的复杂度,来获得当前的目标待评估交易中各交易要素的复杂度。

S302、确定当前的目标交易要素的使用率;

可选的,步骤S302可以包括:

将各第一待评估交易的交易量占比的和值,确定为当前的目标交易要素的使用率,第一待评估交易为待评估交易集中包含有当前的目标交易要素的待评估交易。

其中,某个交易的交易量占比,可以为该交易的交易量与待评估交易集中所有待评估交易的交易量的比值。

具体的,本发明可以将包含有当前的目标交易要素的各待评估交易的交易量占比的和值,确定为当前的目标交易要素的使用率。比如,如果存在有两个包括有当前的目标交易要素的第一待评估交易,其交易量占比分别为0.2和0.5,则当前的目标交易要素的使用率可以为0.7。

S303、确定当前的目标交易要素的信息提取难度;

可选的,步骤S303可以包括:

计算当前的目标交易要素分别与整体知识图谱中其它交易要素的余弦距离;

按照由大至小的次序,对计算出的各余弦距离进行排序,将排序序号不大于预设阈值的余弦距离均确定为目标余弦距离;

计算各目标余弦距离的平均值;

将计算出的平均值的倒数值确定为当前的目标交易要素的信息提取难度。

可以理解的是,当某个交易要素与其它交易要素的区分度越大时,其信息提取难度越小;当某个交易要素与其它交易要素的区分度越小时,其信息提取难度越大。其中,本发明可以根据某个交易要素与其它交易要素的余弦距离,来确定交易要素的区分度。

其中,本发明在计算交易要素间的余弦距离的过程中,可以先行使用词向量模型,对整体知识图谱中的各交易要素进行文本向量化,获得文本向量化表示的各交易要素,之后对于待计算余弦距离的两个交易要素,本发明根据向量间的余弦距离计算公式,来对两个交易要素对应的文本向量进行余弦距离的计算,以获得两个交易要素间的余弦距离。

具体的,在计算出当前的目标交易要素与整体知识图谱中的其它各交易要素的余弦距离后,可以按照由大至小的次序对各余弦距离进行排序,将排序在前列的一定数量的余弦距离确定为目标余弦距离,比如,可以将前10%的余弦距离确定为目标余弦距离。之后,本发明可以将目标余弦距离的平均值确定为当前的目标交易要素与其它交易要素的区分度,并将区分度的倒数确定为当前的目标交易要素的信息提取难度。

S304、确定当前的目标交易要素的训练语料数量;

具体的,本发明可以将信息提取模型在训练阶段中,所使用的针对当前的目标交易要素的训练语料数量,确定为当前的目标交易要素的训练语料数量。

S305、根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,确定当前的目标交易要素的复杂度;

具体的,本发明可以使用某种计算公式,来根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,计算出当前的目标交易要素的复杂度。比如,可以先行将当前的目标交易要素的使用率加上训练语料数量,以获得相应的和值,再将获得的和值减去信息提取难度所获得的差值确定为当前的目标交易要素的复杂度;比如,可以对使用率、信息提取难度和训练语料数量分配相应权重,之后再结合权重进行上述加减计算过程。

S306、返回执行步骤S301,直至确定当前的目标待评估交易中各交易要素的复杂度。

可以理解的是,本发明可以循环执行步骤S301、S302、S303、S304、S305和S306,直至确定当前的目标待评估交易中各交易要素的复杂度。

本实施例提出的数据处理方法,可以通过依次将当前的目标待评估交易中的各交易要素确定为当前的目标交易要素,计算当前的目标交易要素的复杂度,来获得当前的目标待评估交易中各交易要素的复杂度,保证对当前的目标待评估交易中各交易要素的复杂度的获得成功率,从而进一步保证对各待评估交易的交易复杂度的获得成功率。

基于上述第三种数据处理方法,本实施例提出第四种数据处理方法。在第四种数据处理方法中,步骤S305可以包括以下步骤:

对当前的目标交易要素的使用率进行归一化处理,获得处理后使用率;

对当前的目标交易要素的信息提取难度进行归一化处理,获得处理后信息提取难度;

对当前的目标交易要素的训练语料数量进行归一化处理,获得处理后训练语料数量;

将处理后使用率、处理后信息提取难度和处理后训练语料数量输入至复杂度计算公式:

S=r+n-df

中;其中,S为当前的目标交易要素的复杂度,r为当前的目标交易要素的处理后使用率,n为当前的目标交易要素的处理后信息提取难度,df为当前的目标交易要素的处理后训练语料数量;

获得复杂度计算公式输出的当前的目标交易要素的复杂度。

可以理解的是,本发明在根据使用率、信息提取难度和训练语料数量计算复杂度的过程中,为有效提高定量衡量复杂度的准确性,可以先行应用归一化处理技术分别对使用率、信息提取难度和训练语料数量进行归一化处理,之后再使用归一化处理后的使用率、信息提取难度和训练语料数量来计算复杂度。

其中,本发明可以在获得整体知识图谱中各交易要素的使用率、信息提取难度和训练语料数量后,分别针对各交易要素的使用率、信息提取难度和训练语料数量进行归一化处理,将使用率、信息提取难度和训练语料数量的值均映射到0至1的区间范围内。比如,本发明在对当前的目标交易要素的使用率进行归一化处理时,可以根据当前的目标交易要素的使用率和整体知识图谱中各交易要素的使用率,来进行归一化处理。

具体的,本发明可以在获得当前的目标交易要素的处理后使用率、处理后信息提取难度和处理后训练语料数量后,根据复杂度计算公式计算当前的目标交易要素的复杂度。

本实施例提出的数据处理方法,可以先行应用归一化处理技术分别对使用率、信息提取难度和训练语料数量进行归一化处理,之后再使用归一化处理后的使用率、信息提取难度和训练语料数量来计算复杂度,有效提高对交易要素的复杂度进行定量计算的准确性。

与图1所示方法相对应,如图5所示,本实施例提出第一种数据处理装置。该装置可以包括:第一建立单元101、第一确定单元102、第一排序单元103、第二确定单元104和第三确定单元105,其中:

第一建立单元101,被配置为执行:针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,待评估交易集中包括至少一个待评估交易,整体知识图谱中包括各待评估交易的交易要素;

需要说明的是,本发明可以应用于网点机器人,也可以应用于如手机和平板电脑的电子设备。

其中,待评估交易集中的待评估交易可以由银行的技术人员根据银行网点的实际交易处理情况进行制定,本发明对此不做限定。

其中,整体知识图谱可以由各待评估交易的知识图谱构成。

可选的,在本实施例提出的其它数据处理装置中,第一建立单元101可以包括:第二建立单元和第三建立单元,其中:

第二建立单元,被配置为执行:分别建立各待评估交易的知识图谱;

第三建立单元,被配置为执行:基于各待评估交易间的上下游关系,利用各待评估交易的知识图谱建立整体知识图谱。

其中,待评估交易的知识图谱可以包括待评估交易及其交易要素。

具体的,本发明可以根据各待评估交易间的上下游关系,利用各待评估交易的知识图谱来构建整体知识图谱。需要说明的是,对于不存在与其它待评估交易具有上下游关系的待评估交易,也可以纳入至整体知识图谱中。

其中,在构建整体知识图谱的过程中,本发明可以对各待评估交易中的交易要素进行消岐。

第一确定单元102,被配置为执行:根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各待评估交易的交易复杂度;

其中,交易要素的使用率可以为交易要素在各待评估交易中的使用率。具体的,交易要素的使用率可以为包含有交易要素的各待评估交易的交易量占比的和值。

需要说明的是,本发明可以在银行网点实际办理客户请求的交易的过程中,收集客户输出的文本语句或者语音语句,并通过人工标注语句中存在的交易要素,从而获得可以用于训练信息提取模型的训练语料,使用训练语料对信息提取模型进行训练,以获得训练好的信息提取模型,使用信息提取模型来对客户输入的语句中提取交易要素。

其中,交易要素的信息提取难度可以为信息提取模型在客户输入包含有交易要素的语句时,从该语句中识别及提取出交易要素的难度。

其中,交易要素的训练语料数量可以为包含有交易要素的训练语料的数量。

具体的,本发明可以根据交易要素的使用率、信息提取难度和训练语料数量,来确定交易要素的复杂度。

可以理解的是,本发明可以根据某个待评估交易中各交易要素的复杂度,来确定该待评估交易的交易复杂度。

第一排序单元103,被配置为执行:对各待评估交易的交易复杂度进行排序;

具体的,本发明可以在确定各待评估交易的交易复杂度后,对各待评估交易的交易复杂度进行排序。

可选的,本发明可以按照由高至低的次序,对各交易复杂度进行排序;本发明也可以按照由低至高的次序,对各交易复杂度进行排序。

第二确定单元104,被配置为执行:将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度;

其中,目标序号可以为高交易复杂度或低交易复杂度对应的序号。目标序号可以包括一个或多个排序序号,本发明对此不做限定。

需要说明的是,本发明可以从排序的各交易复杂度中,确定出高交易复杂度,并选取高交易复杂度对应的待评估交易作为网点机器人的待学习交易(此时高交易复杂度即为目标交易复杂度),使得网点机器人可以办理交易复杂度高的交易,在提高交易办理效率的同时,减少人工办理复杂交易所消耗的人力资源。

可选的,本发明也可以从排序的各交易复杂度中,确定出低交易复杂度,并选取低交易复杂度对应的待评估交易作为网点机器人的待学习交易(此时低交易复杂度即为目标交易复杂度),使得网点机器人可以办理交易复杂度低的交易,在提高交易办理效率的同时,降低网点机器人对于交易办理的学习难度,保证网点机器人办理交易的成功率。

可选的,当按照由高至低的次序对各交易复杂度进行排序时,本发明可以将排序在前列的一定数量的交易复杂度确定为高交易复杂度,将排序在后列的一定数量的交易复杂度确定为低交易复杂度,此时若将高交易复杂度对应的待评估交易确定为网点机器人的待学习交易,则目标序号可以包括不大于某个预设阈值的序号,若将低交易复杂度对应的待评估交易确定为网点机器人的待学习交易,则目标序号可以包括不小于某个预设阈值的序号。

可以理解的是,本发明可以在确定目标序号后,将目标序号对应的交易复杂度确定为目标交易复杂度。

第三确定单元105,被配置为执行:将目标交易复杂度所对应的待评估交易,确定为网点机器人的待学习交易。

具体的,本发明可以在确定目标交易复杂度后,将目标交易复杂度所对应的待评估交易确定为网点机器人的待学习交易。

可选的,在本实施例提出的其它数据处理装置中,第一排序单元103,被配置为执行:按照由低至高的次序,对各待评估交易的交易复杂度进行排序;第二确定单元104,被配置为执行:将不大于预设序号阈值的排序序号所对应的交易复杂度确定为目标交易复杂度。

其中,本发明可以按照由低至高的次序对各交易复杂度进行排序,将排序在前列的一定数量的排序序号确定为目标序号。

其中,预设序号阈值可以由技术人员根据实际工作情况进行制定,本发明对此不做限定。

本实施例提出的数据处理装置,可以针对待评估交易集中的各待评估交易,建立整体知识图谱,其中,待评估交易集中包括至少一个待评估交易,整体知识图谱中包括各待评估交易的交易要素,根据交易要素的使用率、信息提取难度和训练语料数量,分别确定各待评估交易的交易复杂度,对各待评估交易的交易复杂度进行排序,将排序序号为目标序号所对应的交易复杂度确定为目标交易复杂度,将目标交易复杂度所对应的待评估交易,确定为网点机器人的待学习交易。本发明可以有效确定网点机器人的待学习交易。

基于图5所示结构示意图,如图6所示,本实施例提出第二种数据处理装置。在该装置中,第一确定单元102,可以包括:第四确定单元201、第五确定单元202、第六确定单元203和第一触发单元204,其中:

第四确定单元201,被配置为执行:将待评估交易集中的一个待评估交易,确定为当前的目标待评估交易;

需要说明的是,本发明可以通过依次将待评估交易集中的待评估交易确定为当前的目标待评估交易,确定当前的目标待评估交易的交易复杂度,来获得待评估交易集中各待评估交易的交易复杂度。

第五确定单元202,被配置为执行:根据交易要素的使用率、信息提取难度和训练语料数量,分别确定当前的目标待评估交易中各交易要素的复杂度;

具体的,本发明可以根据某个交易要素的使用率、信息提取难度和训练语料数量,来确定该交易要素的复杂度。

第六确定单元203,被配置为执行:将当前的目标待评估交易中各交易要素的复杂度的均值,确定为当前的目标待评估交易的交易复杂度;

具体的,本发明可以在确定出当前的目标待评估交易中各交易要素的复杂度之后,计算各交易要素的复杂度的均值,将计算出的均值确定为当前的目标待评估交易的交易复杂度。

第一触发单元204,被配置为执行:触发第四确定单元201,直至确定待评估交易集中各待评估交易的交易复杂度。

需要说明的是,本发明可以循环执行上述过程,以确定待评估交易集中各待评估交易的交易复杂度。

本实施例提出的数据处理装置,可以通过依次将待评估交易集中的待评估交易确定为当前的目标待评估交易,确定当前的目标待评估交易的交易复杂度,来获得待评估交易集中各待评估交易的交易复杂度,保证对各待评估交易的交易复杂度的获得成功率。

基于图6所示结构示意图,本实施例提出第三种数据处理装置。在该装置中,第五确定单元202,可以包括:第七确定单元、使用率确定单元、难度确定单元、语料数量确定单元、复杂度确定单元和第二触发单元,其中:

第七确定单元,被配置为执行:将当前的目标待评估交易中的一个交易要素,确定为当前的目标交易要素;

其中,本发明可以通过依次将当前的目标待评估交易中的各交易要素确定为当前的目标交易要素,计算当前的目标交易要素的复杂度,来获得当前的目标待评估交易中各交易要素的复杂度。

使用率确定单元,被配置为执行:确定当前的目标交易要素的使用率;

可选的,使用率确定单元,可以包括:将各第一待评估交易的交易量占比的和值,确定为当前的目标交易要素的使用率,第一待评估交易为待评估交易集中包含有当前的目标交易要素的待评估交易。

其中,某个交易的交易量占比,可以为该交易的交易量与待评估交易集中所有待评估交易的交易量的比值。

具体的,本发明可以将包含有当前的目标交易要素的各待评估交易的交易量占比的和值,确定为当前的目标交易要素的使用率。

难度确定单元,被配置为执行:确定当前的目标交易要素的信息提取难度;

可选的,难度确定单元,可以包括:余弦距离计算单元、第二排序单元、第八确定单元、平均值计算单元和第九确定单元,其中:

余弦距离计算单元,被配置为执行:计算当前的目标交易要素分别与整体知识图谱中其它交易要素的余弦距离;

第二排序单元,被配置为执行:按照由大至小的次序,对计算出的各余弦距离进行排序;

第八确定单元,被配置为执行:将排序序号不大于预设阈值的余弦距离均确定为目标余弦距离;

平均值计算单元,被配置为执行:计算各目标余弦距离的平均值;

第九确定单元,被配置为执行:将计算出的平均值的倒数值确定为当前的目标交易要素的信息提取难度。

可以理解的是,当某个交易要素与其它交易要素的区分度越大时,其信息提取难度越小;当某个交易要素与其它交易要素的区分度越小时,其信息提取难度越大。其中,本发明可以根据某个交易要素与其它交易要素的余弦距离,来确定交易要素的区分度。

其中,本发明在计算交易要素间的余弦距离的过程中,可以先行使用词向量模型,对整体知识图谱中的各交易要素进行文本向量化,获得文本向量化表示的各交易要素,之后对于待计算余弦距离的两个交易要素,本发明根据向量间的余弦距离计算公式,来对两个交易要素对应的文本向量进行余弦距离的计算,以获得两个交易要素间的余弦距离。

具体的,在计算出当前的目标交易要素与整体知识图谱中的其它各交易要素的余弦距离后,可以按照由大至小的次序对各余弦距离进行排序,将排序在前列的一定数量的余弦距离确定为目标余弦距离,比如,可以将前10%的余弦距离确定为目标余弦距离。之后,本发明可以将目标余弦距离的平均值确定为当前的目标交易要素与其它交易要素的区分度,并将区分度的倒数确定为当前的目标交易要素的信息提取难度。

语料数量确定单元,被配置为执行:确定当前的目标交易要素的训练语料数量;

具体的,本发明可以将信息提取模型在训练阶段中,所使用的针对当前的目标交易要素的训练语料数量,确定为当前的目标交易要素的训练语料数量。

复杂度确定单元,被配置为执行:根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,确定当前的目标交易要素的复杂度;

具体的,本发明可以使用某种计算公式,来根据当前的目标交易要素的使用率、信息提取难度和训练语料数量,计算出当前的目标交易要素的复杂度。

第二触发单元,被配置为执行:触发第七确定单元,直至确定当前的目标待评估交易中各交易要素的复杂度。

具体的,本发明可以循环执行上述过程,直至确定当前的目标待评估交易中各交易要素的复杂度。

本实施例提出的数据处理装置,可以通过依次将当前的目标待评估交易中的各交易要素确定为当前的目标交易要素,计算当前的目标交易要素的复杂度,来获得当前的目标待评估交易中各交易要素的复杂度,保证对当前的目标待评估交易中各交易要素的复杂度的获得成功率,从而进一步保证对各待评估交易的交易复杂度的获得成功率。

基于上述第三种数据处理装置,本实施例提出第四种数据处理装置。在第四种数据处理装置中,复杂度确定单元,可以包括:第一处理单元、第一获得单元、第二处理单元、第二获得单元、第三处理单元、第三获得单元、输入单元和第四获得单元,其中:

第一处理单元,被配置为执行:对当前的目标交易要素的使用率进行归一化处理;

第一获得单元,被配置为执行:获得处理后使用率;

第二处理单元,被配置为执行:对当前的目标交易要素的信息提取难度进行归一化处理;

第二获得单元,被配置为执行:获得处理后信息提取难度;

第三处理单元,被配置为执行:对当前的目标交易要素的训练语料数量进行归一化处理;

第三获得单元,被配置为执行:获得处理后训练语料数量;

输入单元,被配置为执行:将处理后使用率、处理后信息提取难度和处理后训练语料数量输入至复杂度计算公式:

S=r+n-df

中;其中,S为当前的目标交易要素的复杂度,r为当前的目标交易要素的处理后使用率,n为当前的目标交易要素的处理后信息提取难度,df为当前的目标交易要素的处理后训练语料数量;

第四获得单元,被配置为执行:获得复杂度计算公式输出的当前的目标交易要素的复杂度。

可以理解的是,本发明在根据使用率、信息提取难度和训练语料数量计算复杂度的过程中,为有效提高定量衡量复杂度的准确性,可以先行应用归一化处理技术分别对使用率、信息提取难度和训练语料数量进行归一化处理,之后再使用归一化处理后的使用率、信息提取难度和训练语料数量来计算复杂度。

其中,本发明可以在获得整体知识图谱中各交易要素的使用率、信息提取难度和训练语料数量后,分别针对各交易要素的使用率、信息提取难度和训练语料数量进行归一化处理,将使用率、信息提取难度和训练语料数量的值均映射到0至1的区间范围内。

具体的,本发明可以在获得当前的目标交易要素的处理后使用率、处理后信息提取难度和处理后训练语料数量后,根据复杂度计算公式计算当前的目标交易要素的复杂度。

本实施例提出的数据处理装置,可以先行应用归一化处理技术分别对使用率、信息提取难度和训练语料数量进行归一化处理,之后再使用归一化处理后的使用率、信息提取难度和训练语料数量来计算复杂度,有效提高对交易要素的复杂度进行定量计算的准确性。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

相关技术
  • 图像数据处理方法、用于图像数据处理方法的程序、记录有用于图像数据处理方法的程序的记录介质和图像数据处理装置
  • 药箱的数据处理方法、装置、数据处理方法和装置
技术分类

06120113083850