掌桥专利:专业的专利平台
掌桥专利
首页

风险评估方法、设备、存储介质及程序产品

文献发布时间:2023-06-19 11:14:36


风险评估方法、设备、存储介质及程序产品

技术领域

本发明涉及风控技术领域,尤其涉及一种风险评估方法、设备、存储介质及程序产品。

背景技术

银行、保险公司、证券公司等金融机构在业务场景中普遍需要对客户进行风险评估,以进行风险控制。例如,银行在贷款前对客户进行风险评估,针对高风险客户拒绝对其进行贷款;又如,保险公司在办理保险业务之前对投保者进行风险评估,对风险高的投保者拒绝办理保险。但是现有技术中,一般金融机构对客户进行风险评估是依据在业务办理过程中所收集的客户信息来进行评估,例如依据客户填写的基本信息表格,由于评估所依据的信息特征少,不够全面,导致风险评估的准确率较低。

发明内容

本发明的主要目的在于提供一种风险评估方法、设备、存储介质及程序产品,旨在解决现有金融机构在业务办理过程中所收集的客户信息来进行评估,风险评估的准确率较低的问题。

为实现上述目的,本发明提供一种风险评估方法所述方法应用于第一设备,所述方法包括:

获取待评估用户的表格特征数据,以及获取所述待评估用户的位置隐向量,其中,所述位置隐向量是由所述待评估用户在预设时间段内的位置序列数据转化得到的;

将所述表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

可选地,所述第一设备与第二设备通信连接,所述获取所述待评估用户的位置隐向量,其中,所述位置隐向量是由所述待评估用户在预设时间段内的位置序列数据转化得到的步骤包括:

接收所述第二设备发送的所述待评估用户的位置隐向量,其中,所述第二设备将所述待评估用户在预设时间段内的位置序列数据输入预设特征提取模型处理得到所述位置隐向量。

可选地,所述接收所述第二设备发送的所述待评估用户的位置隐向量的步骤之前,还包括:

对所述待评估用户的用户编号进行哈希计算得到哈希值;

将所述哈希值发送给所述第二设备,以供所述第二设备将预设用户列表中与所述哈希值匹配的用户编号作为所述待评估用户的用户编号,并根据所述用户编号获取所述位置序列数据。

可选地,所述预设风险评估模型为二分类模型,所述将所述表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果的步骤包括:

将所述表格特征数据和所述位置隐向量进行向量拼接得到拼接结果;

将所述拼接结果输入所述二分类模型进行分类处理,得到所述待评估用户的风险评估结果,其中,所述风险评估结果用于表征所述待评估用户是否属于高风险用户。

为实现上述目的,本发明还提供一种风险评估方法,所述方法应用于第二设备,所述第二设备与第一设备通信连接,所述方法包括:

获取待评估用户在预设时间段内的位置序列数据;

将所述位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量;

将所述位置隐向量发送给所述第一设备,以供所述第一设备将所述待评估用户的表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

可选地,所述将所述位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量的步骤包括:

将所述位置序列数据中各个时间点对应的位置名称输入预设语言表示模型进行转换,得到各所述位置名称对应的初始隐向量;

将各所述初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量。

可选地,所述将各所述初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量的步骤包括:

将各所述初始隐向量分别添加上对应时间点的预设标记,得到各带标记向量;

将所述各带标记向量输入预设特征提取模型进行特征提取得到位置隐向量。

可选地,所述获取待评估用户在预设时间段内的位置序列数据的步骤之前,还包括:

接收所述第一设备发送的哈希值,其中,所述哈希值是由所述第一设备将所述待评估用户的用户编号进行哈希计算得到的;

将所述哈希值与预设用户列表中各个用户编号的哈希值进行匹配,将匹配成功的用户编号作为待评估用户的用户编号;

所述获取待评估用户在预设时间段内的位置序列数据的步骤包括:

从用户数据库中提取所述待评估用户的用户编号对应的预设时间段内的位置序列数据。

为实现上述目的,本发明还提供一种风险评估设备,所述风险评估设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的风险评估程序,所述风险评估程序被所述处理器执行时实现如上所述的风险评估方法的步骤。

此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有风险评估程序,所述风险评估程序被处理器执行时实现如上所述的风险评估方法的步骤。

此外,为实现上述目的,本发明还提出一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的风险评估方法的步骤。

本发明中,通过获取待评估用户的表格特征数据和用户在预设时间段内的位置序列数据转化得到的位置隐向量,将表格特征数据和位置隐向量输入预设风险评估模型进行处理得到待评估用户的风险评估结果。由于用户的位置信息能够反映出用户一定的行为和习惯等信息,因此在本发明中提出采用用户的位置信息来进行用户风险评估;但是用户的位置信息属于高频数据,与低频的表格特征数据难以结合用于风险评估,故在本发明中,通过将用户高频的位置序列数据转化为位置隐向量,再与用户低频的表格特征数据输入风险评估模型得到风险评估结果,实现了结合高频的位置信息和低频的表格特征数据进行风险评估,以扩充风险评估的数据依据,提高用户风险评估的准确度。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的结构示意图;

图2为本发明风险评估方法第一实施例的流程示意图;

图3为本发明实施例涉及的一种第一设备和第二设备的交互流程示意图;

图4为本发明风险评估方法第三实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。

需要说明的是,本发明实施例风险评估设备可以是智能手机、个人计算机和服务器等设备,在此不做具体限制。

如图1所示,该风险评估设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的设备结构并不构成对风险评估设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及风险评估程序。其中,操作系统是管理和控制设备硬件和软件资源的程序,支持风险评估程序以及其它软件或程序的运行。在图1所示的设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于其他设备建立通信连接。

当所述风险评估设备是第一设备时,处理器1001可以用于调用存储器1005中存储的风险评估程序,并执行以下操作:

获取待评估用户的表格特征数据,以及获取所述待评估用户的位置隐向量,其中,所述位置隐向量是由所述待评估用户在预设时间段内的位置序列数据转化得到的;

将所述表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

进一步地,所述第一设备与第二设备通信连接,所述获取所述待评估用户的位置隐向量,其中,所述位置隐向量是由所述待评估用户在预设时间段内的位置序列数据转化得到的步骤包括:

接收所述第二设备发送的所述待评估用户的位置隐向量,其中,所述第二设备将所述待评估用户在预设时间段内的位置序列数据输入预设特征提取模型处理得到所述位置隐向量。

进一步地,所述接收所述第二设备发送的所述待评估用户的位置隐向量的步骤之前,处理器1001还可以用于调用存储器1005中存储的风险评估程序,执行以下操作:

对所述待评估用户的用户编号进行哈希计算得到哈希值;

将所述哈希值发送给所述第二设备,以供所述第二设备将预设用户列表中与所述哈希值匹配的用户编号作为所述待评估用户的用户编号,并根据所述用户编号获取所述位置序列数据。

进一步地,所述预设风险评估模型为二分类模型,所述将所述表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果的步骤包括:

将所述表格特征数据和所述位置隐向量进行向量拼接得到拼接结果;

将所述拼接结果输入所述二分类模型进行分类处理,得到所述待评估用户的风险评估结果,其中,所述风险评估结果用于表征所述待评估用户是否属于高风险用户。

进一步地,当所述风险评估设备是第二设备时,处理器1001可以用于调用存储器1005中存储的风险评估程序,并执行以下操作:

获取待评估用户在预设时间段内的位置序列数据;

将所述位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量;

将所述位置隐向量发送给所述第一设备,以供所述第一设备将所述待评估用户的表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

进一步地,所述将所述位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量的步骤包括:

将所述位置序列数据中各个时间点对应的位置名称输入预设语言表示模型进行转换,得到各所述位置名称对应的初始隐向量;

将各所述初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量。

进一步地,所述将各所述初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量的步骤包括:

将各所述初始隐向量分别添加上对应时间点的预设标记,得到各带标记向量;

将所述各带标记向量输入预设特征提取模型进行特征提取得到位置隐向量。

进一步地,所述获取待评估用户在预设时间段内的位置序列数据的步骤之前,处理器1001还可以用于调用存储器1005中存储的风险评估程序,执行以下操作:

接收所述第一设备发送的哈希值,其中,所述哈希值是由所述第一设备将所述待评估用户的用户编号进行哈希计算得到的;

将所述哈希值与预设用户列表中各个用户编号的哈希值进行匹配,将匹配成功的用户编号作为待评估用户的用户编号;

所述获取待评估用户在预设时间段内的位置序列数据的步骤包括:

从用户数据库中提取所述待评估用户的用户编号对应的预设时间段内的位置序列数据。

基于上述的结构,提出风险评估方法的各实施例。

参照图2,图2为本发明风险评估方法第一实施例的流程示意图。需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本发明风险评估方法应用于第一设备,第一设备可以是智能手机、个人计算机和服务器等设备。在本实施例中,风险评估方法包括:

步骤S10,获取待评估用户的表格特征数据,以及获取所述待评估用户的位置隐向量,其中,所述位置隐向量是由所述待评估用户在预设时间段内的位置序列数据转化得到的;

在本实施例中,第一设备可以是部署于银行、证券公司、保险公司等金融机构的设备。第一设备中存储有用户数据,用户数据一般包括用户(客户)在办理业务时所填写的表格类型的数据,例如年龄、收入、借贷次数等特征数据。金融机构的业务场景中,往往需要对用户进行风险管控,进行风险管控则需要对用户进行风险评估,以确定用户是否为高风险用户,或者确定一个表征用户风险程度的等级或数值,根据风险评估的结果对用户进行管控,例如,允许贷款或不允许贷款。在本实施例中,对风险评估的具体场景并不限制,例如,可以是银行在贷款前或贷款后对客户的还款风险评估,也可以是保险公司在核保过程中对投保人的个人风险评估等。根据具体的风险评估场景不同,对用户进行风险评估所需要采用的用户数据中的特征属性不同,例如,银行的还款风险评估需要使用到用户的收入、借贷次数、信用值等特征数据,保险公司的个人风险评估需要使用到投保人的年龄、职业、特殊爱好、高风险国家旅游史、是否曾犯罪等特征数据。因此,可以从用户数据中选取与风险评估场景相应的特征数据用于对用户进行风险评估,由于该特征数据一般是表格类型的数据,故将第一设备中用于进行风险评估的用户特征数据称为表格特征数据。

第一设备可获取待评估用户的表格特征数据。其中,待评估用户是指需要评估风险的用户,例如,某用户在银行办理贷款业务,提交贷款申请后,第一设备可将该用户作为待评估用户。第一设备确定待评估用户后,从存储用户数据的数据库中获取该用户的表格特征数据。具体地,在数据库中,不同用户可以采用唯一编号(ID)进行区分,例如用户的电话号码、身份证号码或其他常用的ID。

第一设备进一步地还获取待评估用户的位置隐向量,即表征用户位置的隐向量(embedding)。其中,位置隐向量是由待评估用户在预设时间段内的位置序列数据转化得到的,其数据形式是一个包含多个元素的向量,各个元素的数值隐含着用户位置的特征,但是人无法直接理解。具体地,转化操作可以是由第一设备来执行,或者是由其他设备执行后将转化得到的位置隐向量发送给第一设备。也即,在一实施方式中,第一设备保存有待评估用户在预设时间段内的位置序列数据,或者第一设备从其他设备中获取到待评估用户的位置序列数据;第一设备将该位置序列数据转化为位置隐向量。在另一实施方式中,其他设备保存有待评估用户在预设时间段内的位置序列数据,该设备将该位置序列数据转化为位置隐向量后发送给第一设备。

其中,预设时间段可以是根据具体的风险评估场景进行设置的,一般是设置为最近多长时间,例如最近三个月。位置序列数据可以是包括待评估用户在预设时间段内的多个时间点对应的位置信息,例如,包括待评估用户在最近一个月内每天五个时间点所在位置的信息;其中,位置信息具体可以采用该位置的名称或该位置在地图中的坐标值等数据形式来表示。将位置序列数据转化为位置隐向量的方式也有多种,例如在一实施方式中,当位置信息采用坐标值来表示时,可将各个坐标值按照其对应的时间点的先后顺序进行排列,作为特征提取模型的输入,也即将按照时间先后顺序排列的各个坐标值输入到特征提取模型中,得到能够表征待评估用户在预设时间段内所在位置的隐向量,也即得到位置隐向量。其中,特征提取模型可以采用常用的特征提取模型来实现,例如Transformer(转换器)系列的模型;特征提取模型与下面将提到的预设风险评估模型可以预先经过联合训练,以提高其提取特征的准确度。

步骤S20,将所述表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

第一设备将待评估用户的表格特征数据和位置隐向量输入到预设风险评估模型中进行处理,得到待评估用户的风险评估结果。其中,预设风险评估模型可以采用常用的分类或预测模型结构,例如MLP(多层感知器)模型。预设风险评估模型输出的风险评估结果的数据形式可以根据具体风险评估的场景来设置,例如,在银行对用户进行还款风险评估的场景,风险评估结果的数据形式可以设置为用于表征用户是否是高风险用户的数据形式,如设置预设风险评估模型输出0或1,0表示用户不是高风险用户,1表示用户是高风险用户,以便银行业务人员根据风险评估结果来确定是否给该用户进行贷款。

进一步地,预设风险评估模型可以是预先经过训练的,或者与上述的特征提取模型经过联合训练得到的,训练过程可以在第一设备中执行,也可以在其他设备中执行,或者由第一设备和其他设备联合训练。具体地,以第一设备和其他设备(已下称为第二设备)联合训练为例进行说明:第一设备可以从数据库中获取多个历史用户的表格特征数据作为训练样本数据,并获取各个历史用户的风险标签,作为模型训练的监督信息;该风险标签是能够表征用户的风险性的标签,例如表征用户是否为高风险用户,标签的数据形式具体根据模型训练的具体方法而设置,在本实施例中不作限制;该风险标签可以是银行业务人员在业务处理过程中对用户标记的标签,或者可以是根据用户的业务办理结果自动生成的标签,例如,用户贷款业务的办理结果是不予贷款,则生成该用户的风险标签为1,表示该用户是高风险用户;第二设备可以是部署于地图数据公司的设备,存储有用户各个时间段的位置序列数据,第二设备从数据库中获取到与第一设备中各个历史用户对应的位置序列数据,将该位置序列数据作为训练样本数据;第二设备将各个用户的位置序列数据转化为位置隐向量后发送给第一设备;第一设备将各个用户的位置隐向量和表格特征数据进行对应结合,然后输入到预设风险评估模型,得到各个用户的风险评估结果,根据用户的风险评估结果和风险标签计算损失函数,再计算损失函数相对于预设风险评估模型中各个参数的梯度值,采用梯度值更新各个参数;若第二设备中转化位置序列数据需要用到特征提取模型,则第一设备还可计算出损失函数相对于位置隐向量的梯度值,并将该梯度值发送给第二设备,第二设备根据该梯度值按照反向传播方法计算得到特征提取模型中各个参数的梯度值,然后采用梯度值更新各个参数;第一设备和第二设备经过多轮联合训练后,当检测到迭代训练的停止条件时,停止训练,将采用最终更新得到的预设风险评估模型和特征提取模型来对待评估用户进行风险评估;其中,停止条件可以是损失函数收敛、达到一定的训练时长或达到一定的训练轮数。

在本实施例中,通过获取待评估用户的表格特征数据和用户在预设时间段内的位置序列数据转化得到的位置隐向量,将表格特征数据和位置隐向量输入预设风险评估模型进行处理得到待评估用户的风险评估结果。由于用户的位置信息能够反映出用户一定的行为和习惯等信息,因此在本实施例中提出采用用户的位置信息来进行用户风险评估;但是用户的位置信息属于高频数据,与低频的表格特征数据难以结合用于风险评估,故在本实施例中,通过将用户高频的位置序列数据转化为位置隐向量,再与用户低频的表格特征数据输入风险评估模型得到风险评估结果,实现了结合高频的位置信息和低频的表格特征数据进行风险评估,以扩充风险评估的数据依据,提高用户风险评估的准确度。

进一步地,基于上述第一实施例,提出本发明风险评估方法第二实施例,在本实施例中,所述第一设备与第二设备通信连接,所述步骤S10包括:

步骤S101,接收所述第二设备发送的所述待评估用户的位置隐向量,其中,所述第二设备将所述待评估用户在预设时间段内的位置序列数据输入预设特征提取模型处理得到所述位置隐向量。

在一些场景下,第一设备中没有用户的位置信息,并由于用户位置信息涉及到用户的隐私,第一设备无法直接获取并利用用户位置信息,为使得第一设备能够结合用户位置信息来进行用户风险评估,在本实施例中,第一设备在无法直接获取到用户位置信息的情况下,可以与拥有用户位置信息的第二设备配合完成用户风险评估。其中,第二设备可以是部署于地图数据公司的设备,也可以是用户的移动终端,也即,第二设备可以是任何拥有用户位置信息的设备。

具体地,第一设备与第二设备预先确实待评估用户。在一实施方式中,第一设备可以直接将待评估用户的身份证号码或手机号码等用户编号发送给第二设备,以使得第二设备确定的待评估用户与第一设备是统一的。

第二设备从其数据库中获取待评估用户在预设时间段内的位置序列数据,并将该位置序列数据输入到预设的特征提取模型进行处理,得到位置隐向量。其中,预设时间段可以是第一设备临时发送给第二设备的,或者可以是第一设备与第二设备预先确定后固定使用的默认值。预设的特征提取模型可以是第二设备中预先设置的一个特征提取模型,该特征提取模型的解释参照上述第一实施例中的特征提取模型。

需要说明的是,第二设备中的特征提取模型可以是如上述第一实施例中所述的,是与第一设备联合训练得到的;也可以是由第一设备发送给第二设备的,也即,第一设备独自训练了特征提取模型和风险评估模型后,在需要与第二设备联合进行风险评估时,将特征提取模型发送给第二设备。例如,一种应用场景是,用户在银行办理贷款业务,部署于银行的第一设备需要结合该用户的位置信息来评估该用户的信贷风险,而该用户又不想向银行直接暴露自己的位置信息;此时,第一设备可以与该用户的移动终端(第二设备)建立通信连接,将特征提取模型以及其他一些必要信息(如预设时间段、位置序列数据的提取方法等)发送至该移动终端;由移动终端从其记录的用户位置信息中提取预设时间段内的位置序列数据,将位置序列数据输入到特征提取模型中进行处理,得到位置隐向量,将位置隐向量返回给第一设备;第一设备将位置隐向量和该用户的表格特征数据输入到预设风险评估模型,得到该用户的风险评估结果;整个过程用户的原始位置信息并未暴露给第一设备,第一设备根据位置隐向量也推导不出用户的原始位置信息,从而使得第一设备在能够不侵犯用户隐私的前提下,结合用户位置信息来完成用户风险评估,从而扩充了用户风险评估的数据依据,提高了风险评估的准确率。

进一步地,在一实施方式中,所述步骤S101之前,还包括:

步骤S102,对所述待评估用户的用户编号进行哈希计算得到哈希值;

步骤S103,将所述哈希值发送给所述第二设备,以供所述第二设备将预设用户列表中与所述哈希值匹配的用户编号作为所述待评估用户的用户编号,并根据所述用户编号获取所述位置序列数据。

在一些应用场景下,第二设备可能拥有待评估用户的位置信息,也可能没有,为避免第一设备将第二设备中没有的用户编号暴露给第二设备,以导致用户隐私泄露,在本实施例中,第一设备可将待评估用户的用户编号进行哈希计算得到哈希值,将哈希值发送给第二设备。其中,第一设备进行哈希计算可以采用按照哈希算法来计算,哈希算法具体是接收一段明文,然后以一种不可逆的方式将它转换成一段(通常更小)密文(也即哈希值),第一设备可以采用常用的哈希算法,例如SHA-1或MD5等。

第二设备接收到哈希值后,将用户列表中各个用户的用户编号分别采用与第一设备相同的哈希算法进行哈希计算,得到各个用户编号的哈希值。第二设备将从第一设备接收到的哈希值与计算得到各个用户编号的哈希值一一比较,相同则确定是匹配成功,匹配成功的哈希值所对应的用户编号就是待评估用户的用户编号。第二设备根据该用户编号获取位置序列信息,也即,从数据库中该用户编号对应的位置数据中获取预设时间段内的位置序列数据。

进一步地,第一设备和第二设备联合训练特征提取模型和风险评估模型之前,第一设备和第二设备也可以采用哈希值的方式来确定训练样本。具体地,第一设备有多个用户的表格特征数据,第二设备中有多个用户的位置序列数据,第一设备需要与第二设备确定双方共同的用户;第一设备可将其所有用户的用户编号分别进行哈希计算,得到各个用户编号的哈希值,发送给第二设备;第二设备也将其所有用户的用户编号进行哈希计算,得到各个用户编号的哈希值;第二设备比较两组哈希值,得到两组哈希值的并集,将并集中各个哈希值对应的用户编号作为共同的用户,将共同用户的用户编号所对应的位置序列数据作为训练样本;第二设备将共同用户的用户编号发送给第一设备,以供第一设备将共同用户的用户编号所对应的表格特征数据作为训练样本。

一实施方式中,第一设备和第二设备的交互流程如图3所示。第一设备将待评估用户ID的哈希值发送给第二设备;第二设备根据哈希值匹配确定待评估用户ID,再获取待评估用户ID对应的位置序列数据,并转化为位置隐向量,将位置隐向量发送给第一设备;第一设备获取待评估用户ID对应的表格特征数据,将位置隐向量和表格特征数据输入预设风险评估模型处理得到风险评估结果。

进一步地,在一实施方式中,所述预设风险评估模型为二分类模型,所述步骤S20包括:

步骤S201,将所述表格特征数据和所述位置隐向量进行向量拼接得到拼接结果;

在本实施例,预设风险评估模型可以是二分类模型,具体可以采用常用的二分类模型结构来实现,模型的输出设置为属于高风险用户和不属于高风险用户两类,例如,可以设置为输出1表示属于高风险用户,输出0表示不属于高风险用户。第一设备在获取到表格特征数据和位置隐向量后,将表格特征数据和位置隐向量进行向量拼接得到拼接结果。具体地,表格特征数据一般包括多个特征下的数值,故可采用向量形式来表示,也即,有N个特征,则表格特征数据为N个元素的向量。将表格特征数据和位置隐向量做常规的向量拼接,例如,位置隐向量是M个元素,则拼接得到的拼接结果的元素个数为N+M个。

步骤S202,将所述拼接结果输入所述二分类模型进行分类处理,得到所述待评估用户的风险评估结果,其中,所述风险评估结果用于表征所述待评估用户是否属于高风险用户。

第一设备将拼接结果输入到二分类模型分类处理,得到用于表征待评估用户是否属于高风险用户的风险评估结果。需要说明的是,在具体场景中,经过二分类模型处理后,输出的结果是0或1,则第一设备可以将0或1对应的文字结果后输出,以便业务人员或待评估用户能够直观地了解待评估用户是否属于高风险用户。

需要说明的是,在预设风险评估模型采用其他类型的模型来实现时,第一设备也可以将表格特征数据和位置隐向量进行向量拼接后输入预设风险评估模型进行处理。

进一步地,参照图4,图4为本发明风险评估方法第三实施例的流程示意图。基于上述第一和/或第二实施例,提出本发明风险评估方法第三实施例,在本实施例中,本发明风险评估方法应用于第二设备,所述第二设备与第一设备通信连接,所述第一设备和第二设备可以是智能手机、个人计算机和服务器等设备。在本实施例中,风险评估方法包括:

步骤A10,获取待评估用户在预设时间段内的位置序列数据;

步骤A20,将所述位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量;

步骤A30,将所述位置隐向量发送给所述第一设备,以供所述第一设备将所述待评估用户的表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

在本实施例中,第二设备可以是保存有用户位置信息的设备,例如部署于地图数据公司的设备或用户的移动终端。第二设备从其数据库中获取待评估用户在预设时间段内的位置序列数据,将位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量。第二设备将位置隐向量发送给第一设备,第一设备在获取到待评估用户的位置隐向量后,将待评估用户的表格特征数据和位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。具体实施方式可参照上述第一和/或第二实施例。

在本实施例中,通过第二设备获取待评估用户在预设时间段内的位置序列数据,将位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量,将位置隐向量发送给第一设备,以供第一设备将待评估用户的表格特征数据和位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。由于用户的位置信息能够反映出用户一定的行为和习惯等信息,因此在本实施例中提出采用用户的位置信息来进行用户风险评估;但是用户的位置信息属于高频数据,与低频的表格特征数据难以结合用于风险评估,故在本实施例中,通过将用户高频的位置序列数据转化为位置隐向量,再与用户低频的表格特征数据输入风险评估模型得到风险评估结果,实现了结合高频的位置信息和低频的表格特征数据进行风险评估,以扩充风险评估的数据依据,提高用户风险评估的准确度。又由于第二设备发送给第一设备的是位置隐向量,而不是用户原始的位置序列数据,使得第一设备无法推导出用户原始的位置信息,从而实现了在保证用户隐私安全的前提下,扩充风险评估的数据依据,提高用户风险评估的准确度。

基于上述第三实施例,提出本发明风险评估方法第四实施例,在本实施例中,所述步骤A20包括:

步骤A201,将所述位置序列数据中各个时间点对应的位置名称输入预设语言表示模型进行转换,得到各所述位置名称对应的初始隐向量;

在本实施例中,第二设备中的位置序列数据可以包括多个时间点对应的位置名称,位置名称可以是采用中文或英文表示。例如,预设时间段设置为最近N天,则位置序列数据可包括N条数据,也即一天对应一条数据;一条数据包括M个位置名称,分别是用户当天M个时间点所处位置的名称,或用户当天停留时间最长的N个位置的名称;也即,按照时间先后顺序排列各个位置名称,位置序列数据是一个由N*M个位置名称组成的序列。

第二设备可将位置序列中各个时间点对应的位置名称分别输入到预设语言表示模型进行转换,得到各个位置名称对应的初始隐向量。其中,预设语言表示模型可以是预先设置的一个语言表示模型,具体可以采用开源的语言表示模型,例如bert模型。语言表示模型是采用大量的训练语料预训练过的,其具体是将中文或英文的词进行编码,以表示成计算机所能够处理的数值形式,一般采用一个向量来表示,故也可以将语言表示模型称为字典。例如,位置序列数据中的一条数据为2020年9月20日用户在三个时间点所处的位置名称:腾讯滨海大厦、南山XX小区、福田XX酒吧。

步骤A202,将各所述初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量。

第二设备将各个初始隐向量输入到预设特征提取模型进行特征提取得到位置隐向量。具体地,当在具体应用场景中用户所停留的位置时间先后顺序对风险评估没有影响时,第二设备可以将各个初始隐向量不分先后顺序地拼接为一个向量,再将该向量输入到预设特征提取模型进行特征提取,得到位置隐向量。当在具体应用场景中用户所停留的位置时间先后顺序对风险评估有影响时,第二设备可以将各个位置名称的初始隐向量按照各个位置名称所对应的时间先后顺序进行向量拼接,得到一个向量,再将该向量输入特征提取模型进行特征提取,得到位置隐向量。

在本实施例中,通过将位置序列数据中的位置名称输入到预设语言表示模型处理得到各个位置名称对应的初始隐向量,再将初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量,使得用户字符形式的位置数据也能够用于对用户进行风险评估。

进一步地,在一实施方式中,所述步骤A202包括:

步骤A2021,将各所述初始隐向量分别添加上对应时间点的预设标记,得到各带标记向量;

第二设备可将各初始隐向量分别加上其所对应时间点的预设标记,得到各个带标记向量。其中,预设标记是预先设置的,预设时间段内不同的时间点对应设置不同的标记,例如,当如上述例子位置序列数据是一个由N*M个位置名称组成的序列时,预设标记也预先设置N*M个,以分别对应各个时间点的位置名称。需要说明的是,预设标记可以是一个数值,也可以是一个多个数值组成的向量,具体数值大小不限制,只要不同时间点对应的预设标记不同即可。将初始隐向量加上其对应时间点的预设标记,可以是将初始隐向量与预设标记进行拼接,例如,初始隐向量是a个元素,预设标记是b个元素,则拼接得到a+b个元素的带标记向量。

步骤A2022,将所述各带标记向量输入预设特征提取模型进行特征提取得到位置隐向量。

将各带标记向量输入预设特征提取模型进行特征提取得到位置隐向量。具体可以是将各带标记向量进行向量拼接(不分时间顺序或分时间顺序)得到一个向量,再将该向量输入预设特征提取模型进行特征提取得到位置隐向量。

在本实施例中,通过将初始隐向量分别添加上与其对应时间点的预设标记得到带标记向量,再将带标记向量输入预设特征提取模型进行特征提取,使得不同位置名称的初始隐向量带上了与时间点相对应的标记,从而能够区分开相同位置名称在不同时间点时对风险评估所起的作用,使得特征提取模型能够将用户所处位置在时间先后上的顺序特征也能够提取出,进而使得风险评估模型能够依据顺序特征进行风险评估,进一步扩充了风险评估的数据依据,进而提高风险评估结果的准确度。

进一步地,在一实施方式中,所述步骤A10之前,还包括:

步骤A40,接收所述第一设备发送的哈希值,其中,所述哈希值是由所述第一设备将所述待评估用户的用户编号进行哈希计算得到的;

步骤A50,将所述哈希值与预设用户列表中各个用户编号的哈希值进行匹配,将匹配成功的用户编号作为待评估用户的用户编号;

步骤A60,所述获取待评估用户在预设时间段内的位置序列数据的步骤包括:

步骤A40,从用户数据库中提取所述待评估用户的用户编号对应的预设时间段内的位置序列数据。

在一些应用场景下,第二设备可能拥有待评估用户的位置信息,也可能没有,为避免第一设备将第二设备中没有的用户编号暴露给第二设备,以导致用户隐私泄露,在本实施例中,第一设备可将待评估用户的用户编号进行哈希计算得到哈希值,将哈希值发送给第二设备。其中,第一设备进行哈希计算可以采用按照哈希算法来计算,哈希算法具体是接收一段明文,然后以一种不可逆的方式将它转换成一段(通常更小)密文(也即哈希值),第一设备可以采用常用的哈希算法,例如SHA-1或MD5等。

第二设备接收到哈希值后,将用户列表中各个用户的用户编号分别采用与第一设备相同的哈希算法进行哈希计算,得到各个用户编号的哈希值。第二设备将从第一设备接收到的哈希值与计算得到各个用户编号的哈希值一一比较,相同则确定是匹配成功,匹配成功的哈希值所对应的用户编号就是待评估用户的用户编号。第二设备根据该用户编号获取位置序列信息,也即,从数据库中该用户编号对应的位置数据中获取预设时间段内的位置序列数据。

此外本发明实施例还提出一种风险评估装置,所述装置部署于第一设备,所述装置包括:

获取模块,用于获取待评估用户的表格特征数据,以及获取所述待评估用户的位置隐向量,其中,所述位置隐向量是由所述待评估用户在预设时间段内的位置序列数据转化得到的;

处理模块,用于将所述表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

进一步地,所述第一设备与第二设备通信连接,所述获取模块包括:

接收单元,用于接收所述第二设备发送的所述待评估用户的位置隐向量,其中,所述第二设备将所述待评估用户在预设时间段内的位置序列数据输入预设特征提取模型处理得到所述位置隐向量。

进一步地,所述装置还包括:

计算模块,用于对所述待评估用户的用户编号进行哈希计算得到哈希值;

发送模块,用于将所述哈希值发送给所述第二设备,以供所述第二设备将预设用户列表中与所述哈希值匹配的用户编号作为所述待评估用户的用户编号,并根据所述用户编号获取所述位置序列数据。

进一步地,所述预设风险评估模型为二分类模型,所述处理模块包括:

拼接单元,用于将所述表格特征数据和所述位置隐向量进行向量拼接得到拼接结果;

处理单元,用于将所述拼接结果输入所述二分类模型进行分类处理,得到所述待评估用户的风险评估结果,其中,所述风险评估结果用于表征所述待评估用户是否属于高风险用户。

此外本发明实施例还提出一种风险评估装置,所述装置部署于第二设备,所述第二设备与第一设备通信连接,所述装置包括:

获取模块,用于获取待评估用户在预设时间段内的位置序列数据;

提取模块,用于将所述位置序列数据输入预设特征提取模型进行特征提取得到位置隐向量;

发送模块,用于将所述位置隐向量发送给所述第一设备,以供所述第一设备将所述待评估用户的表格特征数据和所述位置隐向量输入预设风险评估模型处理得到所述待评估用户的风险评估结果。

进一步地,所述提取模块包括:

转换单元,用于将所述位置序列数据中各个时间点对应的位置名称输入预设语言表示模型进行转换,得到各所述位置名称对应的初始隐向量;

提取单元,用于将各所述初始隐向量输入预设特征提取模型进行特征提取得到位置隐向量。

进一步地,所述提取单元包括:

添加子单元,用于将各所述初始隐向量分别添加上对应时间点的预设标记,得到各带标记向量;

提取子单元,用于将所述各带标记向量输入预设特征提取模型进行特征提取得到位置隐向量。

进一步地,所述装置还包括:

接收模块,用于接收所述第一设备发送的哈希值,其中,所述哈希值是由所述第一设备将所述待评估用户的用户编号进行哈希计算得到的;

匹配模块,用于将所述哈希值与预设用户列表中各个用户编号的哈希值进行匹配,将匹配成功的用户编号作为待评估用户的用户编号;

所述获取模块还用于从用户数据库中提取所述待评估用户的用户编号对应的预设时间段内的位置序列数据。

本发明风险评估装置的具体实施方式的拓展内容与上述风险评估方法各实施例基本相同,在此不做赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述存储介质上存储有风险评估程序,所述风险评估程序被处理器执行时实现如上所述的风险评估方法的步骤。

本发明还提出一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的风险评估方法的步骤。

本发明风险评估设备、计算机可读存储介质和计算机产品的各实施例,均可参照本发明风险评估方法各实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 风险评估方法、设备、计算机可读存储介质及程序产品
  • 一种金融产品的风险评估方法、装置、设备及存储介质
技术分类

06120112857950