掌桥专利:专业的专利平台
掌桥专利
首页

一种风险识别方法和装置

文献发布时间:2023-06-19 10:06:57


一种风险识别方法和装置

技术领域

本发明涉及计算机技术领域,尤其涉及一种风险识别方法和装置。

背景技术

随着电子银行业务的快速发展,用户可以通过手机银行、网上银行进行转账等交易,生活变得更加便利。但是,随着交易数量的增长,一些不法分子冒充本人进行交易,给用户造成了严重的经济损失。

为此,现有技术根据不法分子的常用手段设定规则,基于规则识别风险交易。

但是,随着不法分子手段的变化,规则的调整存在较大的滞后性。而且,对于一些复杂、隐蔽的手段,该方法的识别准确度较低。

发明内容

有鉴于此,本发明实施例提供一种风险识别方法和装置,能够及时、准确地识别存在风险的交易,保证用户的资金安全。

第一方面,本发明实施例提供了一种风险识别方法,包括:

根据多个历史交易报文,确定训练样本;

将所述训练样本输入设定有当前超参数的支持向量机模型,得到输出结果;

根据所述输出结果更新所述当前超参数;

确定是否满足终止条件,如果满足,将预测样本输入设定有更新后当前超参数的支持向量机模型,得到风险识别结果;

其中,所述预测样本由当前交易报文确定。

可选地,

根据所述输出结果更新所述当前超参数,包括:

根据所述输出结果,计算个体适应度;

根据所述个体适应度更新所述当前超参数。

可选地,

该方法还包括:

如果不满足所述终止条件,则根据更新后当前超参数执行步骤:将所述训练样本输入设定有当前超参数的支持向量机模型。

可选地,

所述根据多个历史交易报文,确定训练样本,包括:

确定各个所述历史交易报文的类型;其中,所述类型包括:正报文和负报文;

分别从所述正报文和所述负报文中提取特征;其中,从所述正报文提供的特征构成正训练样本,从所述负报文提取的特征构成负训练样本。

可选地,

当前超参数包括:核函数γ。

可选地,

当前超参数包括:惩罚因子C。

可选地,

如果不满足所述终止条件,则在将所述训练样本输入设定有当前超参数的支持向量机模型之前,该方法还包括:

将迭代次数加1;

所述终止条件,包括:所述迭代次数达到预设的次数阈值。

可选地,

该方法还包括:

根据所述多个历史交易报文,确定测试样本;

根据所述测试样本评估所述支持向量机模型。

可选地,

所述训练样本与所述测试样本的数量之比为9:1。

可选地,

当所述风险识别结果为有风险时,该方法还包括:

将所述当前交易报文发送至分析平台。

第二方面,本发明实施例提供了一种风险识别装置,包括:

确定模块,配置为根据多个历史交易报文,确定训练样本;

训练模块,配置为将所述训练样本输入设定有当前超参数的支持向量机模型,得到输出结果;

更新模块,配置为根据所述输出结果更新所述当前超参数;

预测模块,配置为确定是否满足终止条件,如果满足,将预测样本输入设定有更新后当前超参数的支持向量机模型,得到风险识别结果;其中,所述预测样本由当前交易报文确定。

第三方面,本发明实施例提供了一种电子设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的方法。

第四方面,本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述任一实施例所述的方法。

上述发明中的一个实施例具有如下优点或有益效果:本发明实施例通过训练样本对支持向量机模型的超参数进行优化,优化得到的支持向量机模型能够更加准确地对风险交易进行识别。当不法分子的手段发生变化后,可以通过训练样本及时调整支持向量机模型的参数,保证用户的资金安全。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是本发明的一个实施例提供的一种风险识别方法的流程图;

图2是本发明的另一个实施例提供的一种风险识别方法的流程图;

图3是本发明的又一个实施例提供的一种风险识别方法的流程图;

图4是本发明的一个实施例提供的一种风险识别装置的示意图;

图5是本发明实施例可以应用于其中的示例性系统架构图;

图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

现有的风险识别方法通过设定的规则实现,但是其存在以下两方面的问题:一方面,相对于不法分子的手段变化,现有方法适应过程存在延后。基于规则的风险识别方法针对性较强,但是容易受手段变化的影响,当手段变化后,其需要一段时间积累新的风险事件,通过专家分析,对已有规则进行调整后才能再次生效;另一方面,现有方法受限于规则本身的特性,以及对命中率等指标的要求,对于一些相对复杂或者隐蔽的风险模式,其发现能力相对偏弱。

鉴于此,本发明实施例提供了一种风险识别方法,包括:

步骤101:根据多个历史交易报文,确定训练样本。

历史交易报文是相对于要识别的当前交易报文而言。在实际应用场景中,可以通过抓取、实时拦截等方式获取历史交易报文,当前交易报文与其类似,以下将不再单独进行说明。

历史交易报文中包括登录信息、注册信息、转账信息等,从历史交易报文中可以提取登录、注册、转账等相关特征,以生成训练样本。

提取的特征包括但不限于:终端一段时间内的登录次数、同一终端在一段时间内注册指定业务的用户数量、一段时间内向指定用户支付笔数、一段时间内支付金额大于指定阈值的笔数、最近指定笔数的交易发生的城市、在一段时间内签约网银次数、最近指定天数总交易次数、转账对象是否为历史收款人、终端登录省份与手机银行签约省份是否相同。

训练样本包括正训练样本和负训练样本,

正训练样本指的是不存在风险的历史交易报文,负训练样本指的是存在风险的历史交易报文。在实际应用场景中,可以先将历史交易报文划分为不同的类型,即正训练样本或负训练样本,再从不同类型的样本中提取特征;还可以先从历史交易报文中提取特征,再确定其对应的类型。

步骤102:将训练样本输入设定有当前超参数的支持向量机模型,得到输出结果。

提取的不同特征构成训练样本,将训练样本输入具有当前超参数的支持向量机模型。

步骤103:根据输出结果更新当前超参数。

根据输出结果与真实结果的偏差,更新当前超参数。

步骤104:确定是否满足终止条件。

在实际应用场景中,可以根据更新次数、输出结果与真实结果的偏差程度等设定不同的终止条件。

步骤105:当满足终止条件时,将预测样本输入设定有更新后当前超参数的支持向量机模型,得到风险识别结果。

其中,预测样本由当前交易报文确定。

当满足终止条件时,说明当前超参数无需继续调整,可以用于后续的风险识别过程。本发明实施例通过训练样本对支持向量机模型的超参数进行优化,优化得到的支持向量机模型能够更加准确地对风险交易进行识别。当不法分子的手段发生变化后,可以通过训练样本及时调整支持向量机模型的参数,保证用户的资金安全。

在本发明的一个实施例中,根据输出结果更新当前超参数,包括:

根据输出结果,计算个体适应度;

根据个体适应度更新当前超参数。

本发明实施例可以采用方向性距离函数或其他现有的方式计算班级成员的个体适应度,并从中选择出最高的个体适应度值,根据最高的个体适应度值更新当前超参数。

在实际应用场景中,可以采用教与学优化算法或改进的教与学优化算法确定当前超参数。

在本发明的一个实施例中,该方法还包括:

如果不满足终止条件,则根据更新后当前超参数执行步骤:将训练样本输入设定有当前超参数的支持向量机模型。

当不满足终止条件时,需要对当前超参数继续进行优化。终止条件可以是迭代次数。通过终止条件可以得到更优的当前超参数,使得支持向量机模型的预测结果更加准确,同时避免当前超参数的优化过程持续过长时间。

在本发明的一个实施例中,根据多个历史交易报文,确定训练样本,包括:

确定各个历史交易报文的类型;其中,类型包括:正报文和负报文;

分别从正报文和负报文中提取特征;其中,从正报文提供的特征构成正训练样本,从负报文提取的特征构成负训练样本。

在本发明的一个实施例中,当前超参数可以包括核函数γ和惩罚因子C。

在本发明的一个实施例中,如果不满足终止条件,则在将训练样本输入设定有当前超参数的支持向量机模型之前,进一步包括:

将迭代次数加1;

终止条件,包括:迭代次数达到预设的次数阈值。

本发明实施例根据次数阈值约束迭代次数,在保证当前超参数优化优化效果的同时,避免优化过程花费过程的时间。

在本发明的一个实施例中,该方法还包括:

根据多个历史交易报文,确定测试样本;

根据测试样本评估支持向量机模型。

为了确定得到的支持向量机模型的性能,本发明实施例通过历史交易报文获取测试样本。具体地,可以采用十折交叉方法对支持向量机模型进行评估,训练样本和预测样本的数量之比为9:1。

在本发明实施例中,该方法还包括:当风险识别结果为有风险时,将当前交易报文发送至分析平台。存在风险的交易报文将被发送至分析平台,以便于技术人员对其进行详细分析。

如图2所示,本发明实施例提供了一种风险识别方法,包括:

步骤201:采集多个历史交易报文。

步骤202:确定各个历史交易报文的类型;其中,类型包括:正报文和负报文。

存在风险的历史交易报文为负报文,不存在风险的历史交易报文为正报文。

步骤203:分别从正报文和负报文中提取特征;其中,从正报文提供的特征构成正训练样本,从负报文提取的特征构成负训练样本。

提取的特征包括:发送历史交易报文的终端3天内的登录次数、终端在1小时内注册业务A的用户个数、10分钟内向支付平台快捷支付的笔数、1小时内金额大于100元的次数、最近三次交易发生的城市、当天签约网银次数、最近七天总交易次数、当笔转账对象姓名是否属于历史收款人、终端登录省份与手机银行签约省份是否相同。

步骤204:将训练样本输入设定有当前超参数的支持向量机模型,得到输出结果;当前超参数包括:核函数γ和惩罚因子C。

步骤205:根据输出结果,计算个体适应度。

步骤206:根据个体适应度更新当前超参数。

根据各个训练样本对应的最高个体适应度更新当前超参数。

步骤207:确定迭代次数是否达到预设的次数阈值,如果满足,执行步骤208,否则,执行步骤209。

步骤208:将预测样本输入设定有更新后当前超参数的支持向量机模型,得到风险识别结果,执行步骤210。

其中,预测样本由当前交易报文确定。

步骤209:将迭代次数加1,根据更新后当前超参数执行步骤204。

步骤210:当风险识别结果为有风险时,将当前交易报文发送至分析平台。

本发明实施例通过迭代过程优化支持向量机的超参数,使得到的支持向量机模型更为优化,预测结果更加准确。

如图3所示,本发明实施例提供了一种风险识别方法,包括:

步骤301:初始化班级成员的成绩。

步骤302:对当前超参数进行编码。

步骤303:将训练样本输入具有当前超参数的支持向量机模型。

步骤304:根据输出结果,计算各个班级成员的适应度值。

步骤305:更新最高适应度值。

步骤306:将迭代次数加1。

步骤307:更新班级成员的成绩。

步骤308:对当前超参数进行编码。

步骤309:将训练样本输入具有当前超参数的支持向量机模型。

步骤310:根据输出结果,计算班级成员的适应度值。

步骤311:更新当前最高适应度值和最高成绩。

步骤312:确定迭代次数是否达到次数阈值,如果是,执行步骤313,否则,执行步骤306。

步骤313:根据最高适应度值和最高成绩,确定当前超参数。

步骤314:根据具有当前超参数的支持向量机模型识别预测样本是否存在风险。

本发明实施例通过次数阈值进行边界约束,已对教与学优化算法进行改进,利用改进后的教与学优化算法确定模型的超参数。基于该模型的风险识别方法具有更高的识别准确度,能够发现交易中隐藏的风险,并对手段变化及时响应。

如图4所示,本发明实施例提供了一种风险识别装置,包括:

确定模块401,配置为根据多个历史交易报文,确定训练样本;

训练模块402,配置为将所述训练样本输入设定有当前超参数的支持向量机模型,得到输出结果;

更新模块403,配置为根据所述输出结果更新所述当前超参数;

预测模块404,配置为确定是否满足终止条件,如果满足,将预测样本输入设定有更新后当前超参数的支持向量机模型,得到风险识别结果;其中,所述预测样本由当前交易报文确定。

在本发明的一个实施例中,更新模块403,配置为根据所述输出结果,计算个体适应度;根据所述个体适应度更新所述当前超参数。

在本发明的一个实施例中,预测模块404,配置为如果不满足所述终止条件,则根据更新后当前超参数触发训练模块402。

在本发明的一个实施例中,确定模块401,配置为确定各个所述历史交易报文的类型;其中,所述类型包括:正报文和负报文;分别从所述正报文和所述负报文中提取特征;其中,从所述正报文提供的特征构成正训练样本,从所述负报文提取的特征构成负训练样本。

在本发明的一个实施例中,当前超参数包括:核函数γ,和/或,惩罚因子C。

在本发明的一个实施例中,预测模块404,配置为如果不满足所述终止条件,则将迭代次数加1;

所述终止条件,包括:所述迭代次数达到预设的次数阈值。

在本发明的一个实施例中,确定模块401,配置为根据所述多个历史交易报文,确定测试样本;根据所述测试样本评估所述支持向量机模型。

在本发明的一个实施例中,所述训练样本与所述测试样本的数量之比为9:1。

在本发明的一个实施例中,预测模块404,配置为当所述风险识别结果为有风险时,将所述当前交易报文发送至分析平台。

本发明实施例提供了一种电子设备,

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的方法。

本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如上述任一实施例所述的方法。

图5示出了可以应用本发明实施例的风险识别方法或风险识别装置的示例性系统架构500。

如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是,本发明实施例所提供的风险识别方法一般由服务器505执行,相应地,风险识别装置一般设置于服务器505中。

应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括发送模块、获取模块、确定模块和第一处理模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,发送模块还可以被描述为“向所连接的服务端发送图片获取请求的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:

根据多个历史交易报文,确定训练样本;

将所述训练样本输入设定有当前超参数的支持向量机模型,得到输出结果;

根据所述输出结果更新所述当前超参数;

确定是否满足终止条件,如果满足,将预测样本输入设定有更新后当前超参数的支持向量机模型,得到风险识别结果;

其中,所述预测样本由当前交易报文确定。

根据本发明实施例的技术方案,通过训练样本对支持向量机模型的超参数进行优化,优化得到的支持向量机模型能够更加准确地对风险交易进行识别。当不法分子的手段发生变化后,可以通过训练样本及时调整支持向量机模型的参数,保证用户的资金安全。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 风险识别方法、风险识别装置、云风险识别装置及系统
  • 一种调整风险参数的方法、风险识别方法及装置
技术分类

06120112421935