掌桥专利:专业的专利平台
掌桥专利
首页

一种预测方法及装置

文献发布时间:2023-06-19 19:30:30


一种预测方法及装置

技术领域

本申请涉及金融技术领域,特别是涉及一种预测方法及装置。

背景技术

随着金融技术领域的不断发展,用户的很多用户行为会存在风险,其对提供保险服务的公司不利,所以在用户提交该用户行为后,公司需要对其用户行为进行预测。

目前,大多数的公司均采用人工对用户行为进行预测,其根本就是利用单一性的可视化图表展示给工作人员,工作人员利用该可视化图表,根据专家经验对用户行为进行预测,然后基于该预测结果对用户行为进行判定,但是此种方法会存在预测结果可信度不高和预测效率不高的缺点。

因此,如何提高预测效率和预测结果的可信度是本领域技术人员关注的重点问题。

发明内容

基于上述问题,本申请提供了一种预测方法及装置,以提高预测效率和预测结果的可信度。本申请实施例公开了如下技术方案:

第一方面,本申请公开了一种预测方法,包括:

获取用户行为;

基于预测模型对所述用户行为进行预测,获得预测数据;

响应于所述预测数据小于第一阈值,将所述用户行为标识为正常;

响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。

可选的,在所述基于预测模型对所述用户行为进行预测,获得预测数据之前,还包括:

获取内部平台提供的多个数据集合和多个外部平台提供的多个数据集合,所述多个数据集合用于构建不同类型的预测网络图,所述不同类型的预测网络图对应不同类型的预测场景;

基于所述不同类型的预测网络图确定目标特征数据集合。

可选的,还包括:

将所述不同类型的预测网络图存储在所述不同类型的预测网络图对应的图数据库中,其中,每个外部平台均存在多个图数据库。

可选的,所述目标数据集合为所述多个数据集合中的任意一个,在所述基于所述不同类型的预测网络图确定目标特征数据集合之前,还包括:

确定所述内部平台中与所述用户行为对应的目标数据集合;

根据所述目标数据集合确定目标预测网络图;

根据所述目标预测网络图提取所述多个外部平台中与所述目标预测网络图对应的多个预测网络图;

所述基于所述不同类型的预测网络图确定目标特征数据集合,包括:

将所述目标预测网络图和所述多个预测网络图结合起来进行计算,获得所述目标数据集合对应的目标特征数据集合。

可选的,构建所述预测模型的过程如下:

获取所述目标数据集合,根据所述目标特征数据集合确定所述目标数据集合对应的样本预测标签,所述样本预测标签用于标识所述用户行为是否符合预测规则;

将所述目标数据集合输入到初始预测模型中,获得待定预测标签;

根据所述样本预测标签和所述待定预测标签之间的差异,调整所述初始预测模型,获得预测模型。

第二方面,本申请公开了一种预测装置,包括:

获取模块,用于获取用户行为;

预测模块,用于基于预测模型对所述用户行为进行预测,获得预测数据;

第一标识模块,用于响应于所述预测数据小于第一阈值,将所述用户行为标识为正常;

第二标识模块,用于响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。

可选的,还包括:

获取子单元,用于获取内部平台提供的多个数据集合和多个外部平台提供的多个数据集合,所述多个数据集合用于构建不同类型的预测网络图,所述不同类型的预测网络图对应不同类型的预测场景;

确定模块,用于基于所述不同类型的预测网络图确定目标特征数据集合。

可选的,还包括:

存储模块,用于将所述不同类型的预测网络图存储在所述不同类型的预测网络图对应的图数据库中,其中,每个外部平台均存在多个图数据库。

可选的,还包括:

第一确定子单元,用于确定所述内部平台中与所述用户行为对应的目标数据集合;

第二确定子单元,用于根据所述目标数据集合确定目标预测网络图;

提取模块,用于根据所述目标预测网络图提取所述多个外部平台中与所述目标预测网络图对应的多个预测网络图;

所述确定模块,包括:

计算模块,用于将所述目标预测网络图和所述其余多个预测网络图结合起来进行计算,获得所述目标数据集合对应的目标特征数据集合。

可选的,构建所述预测模型的过程如下:

第二获取子单元,用于获取所述目标数据集合,根据所述目标特征数据集合确定所述目标数据集合对应的样本预测标签,所述样本预测标签用于标识所述用户行为是否符合预测规则;

获得模块,用于将所述目标数据集合输入到初始预测模型中,获得待定预测标签;

调整模块,用于根据所述样本预测标签和所述待定预测标签之间的差异,调整所述初始预测模型,获得预测模型。

第三方面,本申请实施例提供了一种电子设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现上述预测方法的步骤。

第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述预测方法的步骤。

相较于现有技术,本申请具有以下有益效果:

本申请首先获取用户行为,然后基于预测模型对所述用户行为进行预测,获得预测数据,最后响应于所述预测数据小于第一阈值,将所述用户行为标识为正常;响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。如此,在本申请中,通过采用预测模型对用户行为进行预测,由于是通过多方平台提供的数据集合来构建的预测模型,使得其预测多元化,从而提高了预测结果的可信度,进而提高了预测效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种预测方法的流程图;

图2为本申请实施例提供的一种预测装置的结构示意图;

图3为本申请实施例提供的一种电子设备结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。

需要说明的是,本申请提供的一种预测方法及装置,用于金融技术领域,上述仅为示例,并不对本申请提供的方法及装置名称的应用领域进行限定。

正如前文描述,随着金融技术领域的不断发展,用户的很多用户行为会存在风险,其对提供保险服务的公司不利,所以在用户提交该用户行为后,公司需要对其用户行为进行预测。目前,大多数的公司均采用人工对用户行为进行预测,其根本就是利用单一性的可视化图表展示给工作人员,工作人员利用该可视化图表,根据专家经验对用户行为进行预测,然后基于该预测结果对用户行为进行判定,但是此种方法会存在预测结果可信度不高和预测效率低下的缺点。由此,如何提高预测效率和预测结果的可信度是本领域技术人员关注的重点问题。

所以发明人提出本申请技术方案,本申请首先获取用户行为,然后基于预测模型对所述用户行为进行预测,获得预测数据,最后响应于所述预测数据小于第一阈值,将所述用户行为标识为正常;响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。如此,在本申请中,通过采用预测模型对用户行为进行预测,由于是通过多方平台提供的数据来构建的预测模型,使得其预测多元化,从而提高了预测结果的可信度,进而提高了预测效率。

本申请实施例提供的方法可以由终端设备上的软件执行。所述终端设备例如可以是手机、平板电脑、计算机等设备。所述软件例如可以是系统软件。

接下来对本申请中可能出现的技术术语进行解释说明。

关联网络是基于图数据库建立的一种网络图,是通过节点和边高效描述实体、关系和属性的数据模型。在保险行业的应用中,主要根据案件中人、车、物之间的共性信息关联成网络。

为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。

方法实施例

以下通过一个实施例,对本申请提供的一种预测方法进行说明。

参见图1,该图为本申请实施例提供的一种预测方法的流程图,如图1所示,该方法包括:

S1O1:获取用户行为。

在本步骤中,当用户向内部平台提交用户行为后,服务器获取该用户行为,并将其发送给预测模型,以便用户模型对该用户行为进行预测,内部平台就是用户对应的内部平台。需要说明的是,用户行为可以是用户在发生车祸时提供的证件号码、电话号码、现场图片或车辆数据等,在此不做具体限定。

S1O2:基于预测模型对所述用户行为进行预测,获得预测数据。

在采用预测模型对用户行为进行预测之前,会获取内部平台提供的多个数据集合,以及获取多个外部平台提供的多个数据集合,多个数据集合用于构建不同类型的预测网络图,不同类型的预测网络图对应不同类型的预测场景,然后将不同类型的预测网络图存储在不同类型的预测网络图对应的图数据库节点中,其中,每个外部平台均存在多个图数据库节点,且每个图数据库节点仅用于存储一种类型的图数据,图数据就是上述不同类型的预测网络图。在获取到多个数据集合之前,每个平台会将各数据集合进行清洗,清洗操作包括对电话号码、驾驶证号/身份证号、车牌号/车架号进行有效性验证等,将其处理成可以进行构图的关系型数据集合。

需要说明的是,在本方案中,多个平台方的多个数据集合的打通(联合计算和建模)是通过隐私保护计算技术来实现的,其数据集合是不出各方本地的,如此保证了各方数据的安全性,且只需在后续过程中提供相应的预测网络图即可。

也就是说每个平台都会存在多个数据集合构建的不同类型的预测网络图,其中,每个平台中多个数据集合的类型是相互对应的,但每个平台中多个数据集合所对应数据存在互补性。比如,A平台中A预测网络图对应的数据集合有{a,b},B平台中A预测网络图对应的数据集合有{a,c},那么A预测网络图对应的数据集合就是{a,b,c}。

具体的,内部平台和多个外部平台共同约定,进行N个特定类型的图关联网络的构建(预测网络图的构建),包括配置每类网络中节点类型、边属性和关联方式等等。在获取到每个平台提供的数据集合后,依次构建N个图网络结构,分别用G

在一种可实现的实施方式中,数据集合可以表现为:人员:包含事故的被保险人、标的驾驶员(标的/三者)、伤者(标的/三者)、支付人;车辆:包含标的车、三者车;电话号码:包含报案人、驾驶员(标的/三者)、被保险人;物损信息;车辆维修厂信息;查勘定损员信息。不同类型的预测网络图可以表现为:人-车-物的预测网络图:节点类型为人、车、电话、修求车厂等;人-人的预测网络图:节点类型全部为人,各节点通过案件、电话,车辆等信息进行关联形成的预测网络图;以案件为中心的关联网络:通过案件向外发散的预测网络图。

进一步的,首先确定内部平台中与用户行为对应的目标数据集合,并根据目标数据集合确定出目标预测网络图,也就是确定出目标预测网络图的构图方式,然后根据目标预测网络图提取多个外部平台中与目标预测网络图对应的多个预测网络图,最后基于目标预测网络图和多个预测网络图获得与目标数据集合对应的目标特征数据集合。目标数据集合为多个数据集合中的任意一个。可以理解的是,在获取到用户行为之后,在内部平台的图数据库中找到与用户行为对应的目标数据集合,并确定出内部平台中的目标预测网络图,由于内部平台的数据会存在单一化的情况,此时需要借助外部平台中的数据利用多方安全计算技术来补齐数据,即根据目标预测网络图类型确定外部平台中与目标预测网络图类型对应的多个预测网络图,并将目标预测网络图和多个预测网络图结合起来进行计算,以获得共同的目标特征数据集合。

在上述描述中,类型j(j∈{1,2,...,N})的关联网络“全局图”为G

SMPG系统的工作步骤具体表现为(这里的图数据库以Neo4j为例):①查询提交:发起方(平台之一)将Cypher联合查询语句提交到SMPG系统的coordinator上。②查询转换:Coordinator将查询转换成为针对各平台方的单独查询,并提交给各平台方。③查询处理:每个平台对接收到的单独查询语句进行处理,生成一个可以在MPC后端执行的json配置文件。④查询执行:每个平台在Neo4j图数据库上,通过调用后端(例如,MPC Conclave系统)来执行json配置文件中指定的工作流。⑤MPC计算:每个平台的相关信息会被传递到Jiff(实现MPC的JavaScript库)服务器端,利用MPC协议为每一项查询提供计算结果。⑥结果返回:Jiff服务器将查询和计算涉及的各方的结果发回给每个平台。

其中,将假设Q

进一步的,经过上述描述后,构建预测模型的过程如下:首先获取目标数据集合,并根据目标特征数据集合确定目标数据集合对应的样本预测标签,样本预测标签用于标识用户行为是否符合预测规则,然后将目标数据集合输入到初始预测模型中,获得待定预测标签,最后根据样本预测标签和待定预测标签之间的差异,调整初始预测模型,获得预测模型。

可以理解的是,各平台方将计算结果图数据与底层挖掘的风险特征和欺诈标签整合成为特征作为模型输入,然后借助于联邦学习系统,在数据不出本地的前提下联合各个平台方进行联邦学习模型训练,获得预测模型。

需要进行说明的是,目前的联邦学习系统结构一般由一个中心服务器和各个平台的客户端组成,中心服务器提供全局共享的模型。因此,基于相似的风险特征和分布在各个平台低重合度的样本,各平台采用横向联邦学习对评分模型进行训练。具体的步骤为,各平台客户端在中心服务器下载模型,对数据集合进行训练,每一次迭代,更新本地的评分模型参数后发送给中心服务器,中心服务器将接收到的各平台的参数聚合后得到本次迭代的新的模型参数,再将新的参数返回给每个平台进行新一轮的训练。以此循环直到参数收敛,最终每个平台得到的都是相同并且完整的模型,且利用得到的联邦学习模型,各平台方在本地就可完成预测。其提出联合图特征和联邦学习技术进行预测模型的联合建模,突破了行业企业间的数据壁垒。

S103:响应于所述预测数据小于第一阈值,将所述用户行为标识为正常。

S104:响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。

在这两个步骤中,第一阈值为根据不同的用户行为所对应的场景所设定。可以理解的是,各平台可以根据业务场景设定阈值,筛选出异常的案件,至此完成基于图因子和隐私保护计算技术的用户行为预测。

可见,本可选方案主要是说明如何提高预测效率和预测结果的可信度。具体的,在本可选方案中,本申请首先获取用户行为,然后基于预测模型对所述用户行为进行预测,获得预测数据,最后响应于所述预测数据小于第一阈值,将所述用户行为标识为正常;响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。

综上,在本实施例中通过采用预测模型对用户行为进行预测,由于是通过多方平台提供的数据来构建的预测模型,使得其预测多元化,从而提高了预测结果的可信度,进而提高了预测效率。也就是构建各种类型的预测网络图,为不同的业务场景提供多种预测网络图,再联合多个外部平台,通过在图数据库上的多方安全计算,实现对“全局”图网络上的图查询和计算,从而提取出全部数据集合的图特征,进行横向联邦学习来建立更加精准的预测评分模型。本方案同时具备了图数据库、图计算、多方安全计算和联邦学习技术的优点,最终达到提升预测的效率和准确性的目的。

装置实施例

下面对本申请实施例提供的一种预测装置进行介绍,下文描述的一种预测装置与上文描述的一种预测方法可相互对应参照。

参见图2,该图为本申请实施例提供的一种预测装置的结构示意图,如图2所示,该装置包括:

获取模块100,用于获取用户行为;

预测模块200,用于基于预测模型对所述用户行为进行预测,获得预测数据;

第一标识模块300,用于响应于所述预测数据小于第一阈值,将所述用户行为标识为正常;

第二标识模块400,用于响应于所述预测数据大于或等于第一阈值,将所述用户行为标识为异常。

可选的,还包括:

获取子单元,用于获取内部平台提供的多个数据集合和多个外部平台提供的多个数据集合,所述多个数据集合用于构建不同类型的预测网络图,所述不同类型的预测网络图对应不同类型的预测场景;

确定模块,用于基于所述不同类型的预测网络图确定目标特征数据集合。

可选的,还包括:

存储模块,用于将所述不同类型的预测网络图存储在所述不同类型的预测网络图对应的图数据库中,其中,每个外部平台均存在多个图数据库。

可选的,还包括:

第一确定子单元,用于确定所述内部平台中与所述用户行为对应的目标数据集合;

第二确定子单元,用于根据所述目标数据集合确定目标预测网络图;

提取模块,用于根据所述目标预测网络图提取所述多个外部平台中与所述目标预测网络图对应的多个预测网络图;

所述确定模块,包括:

计算模块,用于将所述目标预测网络图和所述其余多个预测网络图结合起来进行计算,获得所述目标数据集合对应的目标特征数据集合。

可选的,构建所述预测模型的过程如下:

第二获取子单元,用于获取所述目标数据集合,根据所述目标特征数据集合确定所述目标数据集合对应的样本预测标签,所述样本预测标签用于标识所述用户行为是否符合预测规则;

获得模块,用于将所述目标数据集合输入到初始预测模型中,获得待定预测标签;

调整模块,用于根据所述样本预测标签和所述待定预测标签之间的差异,调整所述初始预测模型,获得预测模型。

本申请实施例所提供的预测装置与上述实施例提供的预测方法具有相同的有益效果,因此不再赘述。

电子设备实施例

参见图3,该图为本申请实施例提供的一种电子设备结构示意图,如图3所示,包括:

存储器11,用于存储计算机程序;

处理器12,用于执行所述计算机程序时实现上述任意方法实施例所述预测方法的步骤。

在本实施例中,设备可以是车载电脑、PC(Personal Computer,个人电脑),也可以是智能手机、平板电脑、掌上电脑、便携计算机等终端设备。

该设备可以包括存储器11、处理器12和总线13。其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是设备的内部存储单元,例如该设备的硬盘。存储器11在另一些实施例中也可以是设备的外部存储设备,例如设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括设备的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于设备的应用软件及各类数据,例如执行故障预测方法的程序代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行故障预测方法的程序代码等。

该总线13可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

进一步地,设备还可以包括网络接口14,网络接口14可选的可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该设备与其他电子设备之间建立通信连接。

可选地,该设备还可以包括用户接口15,用户接口15可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口15还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在设备中处理的信息以及用于显示可视化的用户界面。

图3仅示出了具有组件11-15的设备,本领域技术人员可以理解的是,图3示出的结构并不构成对设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

可读存储介质实施例

本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例所述预测方法的步骤。其中,该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,本发明提供的一种预测方法可用于金融技术领域。上述仅为示例,并不对本发明提供的一种预测方法的应用领域进行限定。

还需要说明的是,本申请实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种预测方法及装置进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

相关技术
  • 一种人格预测方法及人格预测装置
  • 一种网约车订单量预测方法及装置
  • 一种热负荷预测方法、装置、可读介质及电子设备
  • 一种预测油气藏位置的方法和装置
  • 动态图像预测编码装置、动态图像预测编码方法、动态图像预测编码设备、动态图像预测解码装置、动态图像预测解码方法、动态图像预测解码设备
  • 图像预测编码装置、图像预测编码方法、图像预测编码程序、图像预测解码装置、图像预测解码方法以及图像预测解码程序
技术分类

06120115929758