掌桥专利:专业的专利平台
掌桥专利
首页

物联网卡风险识别方法、装置、设备及计算机存储介质

文献发布时间:2024-04-18 20:00:50


物联网卡风险识别方法、装置、设备及计算机存储介质

技术领域

本申请涉及风险识别技术领域,尤其涉及一种物联网卡风险识别方法、装置、设备及计算机存储介质。

背景技术

物联网卡,也称为M2M卡,是运营商为物联网服务企业所提供的用于智能终端设备联网的卡片。物联网卡采用移动通信网络进行数据传输,可实现设备之间的互联和互通,支持各种物联网应用,如远程监控、智能家居、车联网等。

在进行物联网卡安全监测管控时,一般需要对卡的风险类型进行标记输出,对于风险类型较高并且对于特定的风险类型卡进行有针对性的关停,及时遏制风险的发生。一般的做法是对特定的风险类型进行打标,采用分类识别的方法,最终模型输出分类标签。

在现有技术中仅是针对排序算法的数据样本的初始位置偏差进行关注,并未在算法本身进行优化,此类方法只能对于一般类型数据有效,一旦样本数据初始位置偏差较小,则对算法计算结果的准确性会产生一定的影响。

发明内容

本申请提供一种物联网卡风险识别方法、装置、设备及计算机存储介质,用以解决现有技术中存在的对风险类型识别时存在的结果不准确的缺陷。

第一方面,本申请提供一种物联网卡风险识别方法,包括:

获取预设时段内的物联网卡数据表,所述物联网卡数据表用于指示预设时段内的多个物联网卡数据;

将所述预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,所述风险识别模型是根据历史物联网卡数据训练得到的;

根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型

可选的,获取预设时段内的物联网卡数据表之前,所述方法还包括:

获取历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型;

根据所述历史异常物联网卡数据,生成正负训练样本集;

根据所述正负训练样本集以及每个历史异常物联网卡对应的风险类型,对识别模型进行训练处理,得到训练好的风险识别模型。

可选的,所述获取历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型,包括:

从多个客户端中获取对应的历史物联网卡数据,所述历史物联网卡数据包括:实时流数据以及离线数据;

对所述历史物联网卡数据进行分布式风险识别处理,得到多个历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。

可选的,所述根据所述正负训练样本集以及每个历史异常物联网卡对应的风险类型,对识别模型进行训练处理,得到训练好的风险识别模型,包括:

采用正则化处理对所述正负训练样本集进行特征化处理,得到所述正负训练样本集中每个历史异常物联网卡数据对应的样本特征;

根据每个历史异常物联网卡数据对应的样本特征,对所述正负训练样本集进行特征筛选,得到目标正负训练样本集;

将所述目标正负训练样本集以及所述目标正负训练样本集中的每个历史异常物联网卡对应的风险类型输入至识别模型中,以使所述识别模型根据输入数据进行迭代处理,得到训练好的风险识别模型。

可选的,所述根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型,包括:

获取多个风险类型对应的预设风险分数;

根据多个物联网卡对应的风险分数以及所述预设风险分数,确定每个物联网卡的风险类型。

可选的,所述根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型之后,所述方法还包括:

根据每个物联网卡的风险类型,按照预设规则对多个物联网卡进行排序处理,不同的风险类型对应的优先级不同;

按照顺序输出所述多个物联网卡以及每个物联网卡对应的风险类型。

第二方面,本申请提供一种物联网卡风险识别装置,该装置包括:

获取模块,用于获取预设时段内的物联网卡数据表,所述物联网卡数据表用于指示预设时段内的多个物联网卡数据;

输入模块,用于将所述预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,所述风险识别模型是根据历史物联网卡数据训练得到的;

确定模块,用于根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型。

可选的,所述装置还包括:生成模块、训练模块;

所述获取模块,还用于获取历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型;

生成模块,用于根据所述历史异常物联网卡数据,生成正负训练样本集;

训练模块,用于根据所述正负训练样本集以及每个历史异常物联网卡对应的风险类型,对识别模型进行训练处理,得到训练好的风险识别模型。

可选的,所述装置还包括,处理模块;

所述获取模块,还用于从多个客户端中获取对应的历史物联网卡数据,所述历史物联网卡数据包括:实时流数据以及离线数据;

处理模块,用于对所述历史物联网卡数据进行分布式风险识别处理,得到多个历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。

可选的,所述装置还包括,筛选模块;

所述处理模块,还用于采用正则化处理对所述正负训练样本集进行特征化处理,得到所述正负训练样本集中每个历史异常物联网卡数据对应的样本特征;

筛选模块,用于根据每个历史异常物联网卡数据对应的样本特征,对所述正负训练样本集进行特征筛选,得到目标正负训练样本集;

所述输入模块,还用于将所述目标正负训练样本集以及所述目标正负训练样本集中的每个历史异常物联网卡对应的风险类型输入至识别模型中,以使所述识别模型根据输入数据进行迭代处理,得到训练好的风险识别模型。

可选的,所述获取模块,还用于获取多个风险类型对应的预设风险分数;

所述确定模块,还用于根据多个物联网卡对应的风险分数以及所述预设风险分数,确定每个物联网卡的风险类型。

可选的,所述装置还包括,输出模块;

所述处理模块,还用于根据每个物联网卡的风险类型,按照预设规则对多个物联网卡进行排序处理,不同的风险类型对应的优先级不同;

输出模块,还用于按照顺序输出所述多个物联网卡以及每个物联网卡对应的风险类型。

第三方面,本申请提供一种物联网卡风险识别设备,该设备包括:

存储器;

处理器;

其中,所述存储器存储计算机执行指令;

所述处理器执行所述存储器存储的计算机执行指令,以实现如上述第一方面及第一方面各种可能的实现方式所述的物联网卡风险识别方法。

第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述第一方面及第一方面各种可能的实现方式所述的物联网卡风险识别方法。

本申请提供的物联网卡风险识别方法、装置、设备及计算机存储介质,该方法通过获取预设时段内的物联网卡数据表,物联网卡数据表用于指示预设时段内的多个物联网卡数据;将预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,风险识别模型是根据历史物联网卡数据训练得到的;进而根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型。该方法可以准确的确定出每个物联网卡的风险类型,从而提高了确定风险物联网卡的效率;同时提高了后续根据风险物联网卡进行筛选和处理的效率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1为本申请提供的物联网卡风险识别方法的流程示意图一;

图2为本申请提供的物联网卡风险识别方法的流程示意图二;

图3为本申请提供的物联网卡风险识别方法的流程示意图三;

图4为本申请提供的物联网卡风险识别装置的结构示意图;

图5为本申请提供的物联网卡风险识别设备的结构示意图。

通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、产品或设备固有的其它步骤或单元。

本申请实施例中,“示例性的”或者“例如”等词用于表示例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

首先对本申请所涉及的名词进行解释:

物联网卡:是指通过射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络,主要用于给电子硬件联网,针对于物联网企业,不能用于个人。

Lasso(Least absolute shrinkage and selection operator)回归:Lasso回归也叫线性回归的L1正则化,是一种数据挖掘方法,即在常用的多元线性回归中,添加惩罚函数,不断压缩系数,从而达到精简模型的目的,以避免共线性和过拟合。当系数为0时,同时达到筛选变量的效果。

归一化折损累计增益(Normalized Discounted Cumulative Gain简称“NDCG”):这个指标通常用于衡量和评价排序的准确性。有高关联度的结果出现在更靠前的位置的时候,指标会越高。

回归树(Regression Tree):是一种基于决策树(Decision Tree)的机器学习算法,用于解决回归问题。回归树的目标是预测连续型的数值输出。

物联网卡,也称为M2M卡,是运营商为物联网服务企业所提供的用于智能终端设备联网的卡片。物联网卡采用移动通信网络进行数据传输,可实现设备之间的互联和互通,支持各种物联网应用,如远程监控、智能家居、车联网等。

在进行物联网卡安全监测管控时,一般需要对卡的风险类型进行标记输出,对于风险类型较高并且对于特定的风险类型卡进行有针对性的关停,及时遏制风险的发生。一般的做法是对特定的风险类型进行打标,采用分类识别的方法,最终模型输出分类标签。

在现有技术中仅是针对排序算法的数据样本的初始位置偏差进行关注,并未在算法本身进行优化,此类方法只能对于一般类型数据有效,一旦样本数据初始位置偏差较小,则对算法计算结果的准确性会产生一定的影响。

针对上述问题,本申请提出了一种物联网卡风险识别方法,该方法通过获取物联网卡数据表,将物联网卡数据输入至风险识别模型,确定出物联网卡的风险类型,使得后续业务人员根据风险类型,核实后及时关停高风险卡,及时规避因物联网卡使用不规范所产生的风险。

图1为本申请实施例提供的物联网卡风险识别方法的流程示意图一。本实施例的执行主体例如可以是物联网卡安全监测管控系统,如图1所示,该方法包括:

S101:获取预设时段内的物联网卡数据表,所述物联网卡数据表用于指示预设时段内的多个物联网卡数据。

其中,物联网卡数据表是指物联网卡中的所有数据的集合,预设时段可以是当前时段物联网卡的运行数据,也可以是之前某段时间内的物联网卡运行数据。

可以理解的,在需要进行物联网卡安全监测时,可获取当前时段或者所需时段的物联网卡数据表,从物联网卡数据表中获取物联网卡的多个数据,示例性的,多个数据可包括实时流话单类数据,实时流位置数据,离线属性数据等。获取到的数据可作为风险识别模型的输入,在风险识别模型中进行进一步的监测。

S102:将所述预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,所述风险识别模型是根据历史物联网卡数据训练得到的。

其中,风险识别模型是对物联网卡数据进行风险识别的模型,将实时获取到的物联网卡的数据与历史物联网卡数据进行比对,得到物联网卡对应的风险分数。

可以理解的,将需要检测的物联网卡数据输入到风险识别模型,风险识别模型对比当前物联网卡数据与历史物联网卡数据,得到物联网卡对应的风险分数。示例性的,风险识别模型检测到此时所对比的物联网卡数据有一处与历史数据相同,具有此历史数据的物联网卡的风险类型为手机端使用,则说明当前物联网卡正在手机端使用,根据模型的预设规则将当前物联网卡标记为3,也即当前物联网卡风险分数为3。

S103:根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型。

其中,风险分数是用来指示物联网卡所出现的具体风险类型。

可以理解的,根据风险识别模型可得出物联网卡的风险分数,风险分数有0、1、2、3四个风险分数,不同的风险分数对应不同的风险类型,四个风险分数分别对应跨地区使用、机卡分离、超阈值使用以及手机端使用这四种风险类型。示例性的,物联网卡的风险分数为1,即此物联网卡风险类型为机卡分离。根据风险识别模型输出的各个物联网卡的风险分数可确定与之对应的风险类型。

本实施例提供的物联网卡风险识别方法。通过获取预设时段内的物联网卡数据表,物联网卡数据表用于指示预设时段内的多个物联网卡数据。将预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,风险识别模型是根据历史物联网卡数据训练得到的。根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型。该方法可以准确的确定出每个物联网卡的风险类型,从而提高了确定风险物联网卡的效率;同时提高了后续根据风险物联网卡进行筛选和处理的效率。

图2为本申请实施例提供的物联网卡风险识别方法的流程示意图二。本实施例是在图1实施例的基础上,对物联网卡风险识别方法进行详细说明。如图2所示,该方法包括:

S201:获取历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。

其中,历史异常物联网卡对应的风险类型例如可以包括:手机端使用、超阈值使用、机卡分离、跨地区使用4种。

可以理解的,在进行模型训练时首先需要获取物联网卡的历史数据,采集物联网卡的多端数据流获取物联网卡的历史数据,历史数据分别是实时流数据和离线数据。将物联网卡的历史数据进行风险类型识别处理获得历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。

S202:根据所述历史异常物联网卡数据,生成正负训练样本集。

其中,正负训练样本集是指历史异常物联网卡的数据在按照类型整合之后的数据集合。正样本为训练所需要的样本数据,即存在违规行为时的历史异常物联网卡的某一位置的数据,负样本即历史异常物联网卡数据正常位置的数据集合。

可以理解的,物联网卡中存在多端数据,将采集到的历史异常数据按照类型进行整合与计算,将具有违规行为的物联网卡的异常数据整合在一起,作为正样本方便后续与实时物联网卡的数据进行对比。正负训练样本集中的样本数据比例应保持平衡,防止出现过拟合现象。采用过采样方法对少数类样本进行过采样,多数类样本进行随机下采样以维持正负样本的平衡,示例性的,可保持所有样本的正负比例约为1:3。

S203:根据所述正负训练样本集以及每个历史异常物联网卡对应的风险类型,对识别模型进行训练处理,得到训练好的风险识别模型。

其中,正负训练样本集包括历史异常物联网卡中异常位置的数据与正常位置的物联网卡数据,将其与历史异常物联网卡对应的风险类型相结合,对识别模型进行训练处理,使得训练好的风险识别模型可准确输出异常物联网卡数据及其对应的物联网卡类型。具体的模型训练过程请参见实施例3,在此不再赘述。

S204:获取预设时段内的物联网卡数据表,所述物联网卡数据表用于指示预设时段内的多个物联网卡数据。

其中,步骤S204与步骤S101类似,不再赘述。

S205:将所述预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,所述风险识别模型是根据历史物联网卡数据训练得到的。

其中,步骤S205与步骤S102类似,不再赘述。

S206:获取多个风险类型对应的预设风险分数。

其中,预设风险分数是风险识别模型在训练的过程中所指定的规则,此规则是固定不变的,业务人员可根据此规则确定物联网卡的风险类型。

可以理解的,只通过风险评估模型得到风险分数无法确定其对应的风险类型,在获取到风险分数之后,应该与预设风险类型一一对应。风险分数越高,风险类型出现造成的结果影响越严重。

S207:根据多个物联网卡对应的风险分数以及所述预设风险分数,确定每个物联网卡的风险类型。

可以理解的,根据风险识别模型可得出物联网卡对应的风险分数,风险分数有0、1、2、3四个风险分数,而根据风险识别模型预设的规则,0、1、2、3四个风险分数按照顺序分别对应跨地区使用、机卡分离、超阈值使用以及手机端使用这四种类型。示例性的,物联网卡的风险分数为0,即此物联网卡风险类型为跨地区使用。

S208:根据每个物联网卡的风险类型,按照预设规则对多个物联网卡进行排序处理,不同的风险类型对应的优先级不同。

可以理解的,每个数据异常的物联网卡的风险类型可能不相同,在历史异常物联网卡中包括有四种不同的风险类型,包括手机端使用、超阈值使用、机卡分离和跨地区使用。不同的风险类型所产生的结果严重性不同,其中手机端使用为影响最大的风险类型,所以手机端使用的输出优先级最高,风险类型的输出优先级排序由高到低是手机端使用、超阈值使用、机卡分离、跨地区使用。优先输出风险类型优先级最高的物联网卡以使业务人员优先处理,避免产生不可挽回的结果。

S209:按照顺序输出所述多个物联网卡以及每个物联网卡对应的风险类型。

可以理解的,物联网卡的违规行为有手机端使用、超阈值使用、机卡分离、跨地区使用四种,不同的违规行为所产生的结果影响程度不同,示例性的,手机端使用为风险最高的风险类型,在进行风险排序时应将具有手机端使用的物联网卡优先输出。所以在物联网卡风险评估过程中应按照预设规则输出物联网卡以及物联网卡对应的风险类型。

本实施例提供的物联网卡风险识别方法。通过获取历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。再根据历史异常物联网卡数据,生成正负训练样本集。根据正负训练样本集以及每个历史异常物联网卡对应的风险类型,对识别模型进行训练处理,得到训练好的风险识别模型。在使用的时候直接获取当前时段的物联网卡数据表,将物联网卡数据输入到风险识别模型,获取多个风险类型对应的预设风险分数,与预设风险分数对比确定物联网卡的风险类型,按照预设规则对多个物联网卡进行排序处理,输出物联网卡及每个物联网卡对应的风险类型,以便业务人员对具有风险的物联网卡进行关停处理。该方法可以准确的确定出每个物联网卡的风险类型,同时还可以根据不同的风险类型按照顺序进行输出,不仅提高了确定风险物联网卡的效率,还可以根据特定需求进行排序筛选,方便了用户的使用。

图3为本申请实施例提供的物联网卡风险识别方法的流程示意图三。本实施例是在图1实施例与图2实施例的基础上,对物联网卡风险识别方法中风险识别模型的训练过程进行详细说明。如图3所示,该方法包括:

S301:从多个客户端中获取对应的历史物联网卡数据,所述历史物联网卡数据包括:实时流数据以及离线数据。

其中,物联网卡数据中的实时流数据以及离线数据具体包括实时计费信息、cmp平台数据、Jasper平台数据,话单数据、实时上网日志。

可以理解的,在进行风险识别模型训练时需要大量数据来帮助模型更好地寻找问题的本质规律,因此需要获取多个物联网卡的历史数据。通过对历史数据的进一步分析与挖掘,了解历史物联网卡在正常使用与异常使用时的数据的异同。

S302:对所述历史物联网卡数据进行分布式风险识别处理,得到多个历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。

其中,分布式处理是将不同地点的,或具有不同功能的,或拥有不同数据的多台计算机通过通信网络连接起来,在控制系统的统一管理控制下,协调地完成大规模信息处理任务的计算机系统。

可以理解的,物联网卡中包括的历史数据多种多样,对物联网卡中所有位置的数据进行识别处理需要耗费大量时间所以采用分布式处理,从而做到在同一时间处理多个数据。将所有物联网卡的数据进行遍历处理,找出历史异常物联网卡数据,将获取到的历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型保存至NDFS,保存样本的格式如下:

label cust_id+vid

S303:根据所述历史异常物联网卡数据,生成正负训练样本集。

其中,步骤S303与步骤S202类似,不再赘述。

S304:采用正则化处理对所述正负训练样本集进行特征化处理,得到所述正负训练样本集中每个历史异常物联网卡数据对应的样本特征。

其中,特征化处理是指Lasso回归通过L1正则化可以有效地进行特征选择,即自动地从原始特征中选择出对目标变量有显著影响的特征。引入L1正则化项,目的是为了尽可能地将模型系数稀疏化,通过迫使不相关的特征系数趋向于零的方式来减少模型的过拟合风险。非零系数的特征即为对目标变量有重要影响的特征。

其中,使用优化算法(如坐标下降法、梯度下降法等)迭代地最小化损失函数,可求解出模型的系数。损失函数定义:定义衡量模型预测值与真实标签之间差异的损失函数。设置模型的损失函数,通常为:损失函数=平方误差+L1正则化项,公式表示为:

J(δ)=∑(y-Xδ)

可以理解的,通过引入L1正则化项可以使得与评估物联网卡风险类型无关的样本特征趋于零,同时得到相关性高的样本特征的位置与数量,方便后续对样本特征进行进一步处理,可保证样本特征的多样性,减少对风险评估模型的影响。

S305:根据每个历史异常物联网卡数据对应的样本特征,对所述正负训练样本集进行特征筛选,得到目标正负训练样本集。

可以理解的,在添加L1正则化后,正负训练样本集中与风险类型评估无关的样本特征系数已经趋于零,相关性高的特征也已经进行了标注处理,将其进行筛选处理,得到目标正负训练样本集,也即目标正负训练样本集中只包括每个历史异常物联网卡的数据特征以及其对应的风险类型。示例性的,正负样本训练集中具有30个样本特征,在进行特征对比之后,得到目标正负训练样本集,此时目标正负训练样本集中具有15个样本特征,也即筛选出了相关性高的特征以及与风险类型无关的样本特征。

S306:将所述目标正负训练样本集以及所述目标正负训练样本集中的每个历史异常物联网卡对应的风险类型输入至识别模型中,以使所述识别模型根据输入数据进行迭代处理,得到训练好的风险识别模型。

其中,采用Lightgbm框架对接受筛选后的特征进行识别模型训练,具体训练过程是:

NDCG(original)=DCG/IDCG

|△NDCG|=|NDCG(original)-NDCG(swap(i,j)|

其中,NDCG(original)=DCG/IDCG是计算归一化折损累计增益(NDCG)的标准公式。DCG的计算公式如下:DCG=rel_1+rel_2/log2(2)+rel_3/log2(3)+…。rel_i是排序结果中第i个项目的相关性(如相关性分数或标签值),log2(i)为位置i的折损因子。λ为回归树的标签。

其中,DCG是根据排序结果的相关性和排序位置计算得到的累计得分,它考虑了相关性的权重和位置的折损因子。DCG越大,表示排序结果的相关性越好。IDCG是理想排序结果的折损累计增益值,即按照最佳的相关性顺序排列得到的折损累计增益值。NDCG(original)的结果范围在0到1之间,越接近1表示排序结果质量越好,相关性排序越准确。△NDCG是两个排序结果的NDCG差异(或者表示增益差异)。

其中,label(i)和label(j)分别是项目i和项目j的相关性标签或相关性得分。公式中的第一项表示对于当前项目i,与其相关性较高(label(i)>label(j))的其他项目j所造成的NDCG差异,使用0.5×|△NDCG|表示。公式中的第二项表示对于当前项目i,与其相关性较低(label(i)

可以理解的,首先将目标正负训练样本集输入到风险识别模型中。这些样本集包含历史异常物联网卡数据以及它们对应的风险类型标签。通过将这些数据输入到识别模型中,可以让模型了解异常物联网卡数据和相应的风险类型之间的关系。接着,识别模型开始进行迭代处理。通过多次的筛选与输出过程,不断调整模型参数,使模型逐渐收敛到最优解。在每次迭代中,模型会根据输入的样本集进行训练和学习。通过学习样本集中的特征和它们与风险类型之间的关联,模型逐渐提高自身的准确性和预测能力。最终,经过多次迭代的训练,得到了训练好的风险识别模型。这个模型可以用于识别新的物联网卡数据的风险类型,从而帮助系统进行风险识别与检测。

本实施例提供的物联网卡风险识别方法。通过从多个客户端中获取对应的历史物联网卡数据,对历史物联网卡数据进行分布式风险识别处理,得到多个历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。根据历史异常物联网卡数据,生成正负训练样本集。采用正则化处理对正负训练样本集进行特征化处理,得到每个历史异常物联网卡数据对应的样本特征。根据每个历史异常物联网卡数据对应的样本特征,对正负训练样本集进行特征筛选,得到目标正负训练样本集。将目标正负训练样本集以及目标正负训练样本集中的每个历史异常物联网卡对应的风险类型输入至识别模型中,以使识别模型根据输入数据进行迭代处理,得到训练好的风险识别模型,以便快速识别物联网卡的风险类型。

图4为本申请提供的物联网卡风险识别装置的结构示意图。如图4所示,本申请提供的物联网卡风险识别装置400,包括:

获取模块401,用于获取预设时段内的物联网卡数据表,所述物联网卡数据表用于指示预设时段内的多个物联网卡数据;

输入模块402,用于将所述预设时段内的多个物联网卡数据输入至风险识别模型中,得到每个物联网卡对应的风险分数,所述风险识别模型是根据历史物联网卡数据训练得到的;

确定模块403,用于根据多个物联网卡对应的风险分数,确定每个物联网卡的风险类型。

可选的,所述装置还包括:生成模块404、训练模块405;

所述获取模块401,还用于获取历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型;

生成模块404,用于根据所述历史异常物联网卡数据,生成正负训练样本集;

训练模块405,用于根据所述正负训练样本集以及每个历史异常物联网卡对应的风险类型,对识别模型进行训练处理,得到训练好的风险识别模型。

可选的,所述装置还包括,处理模块406;

所述获取模块401,还用于从多个客户端中获取对应的历史物联网卡数据,所述历史物联网卡数据包括:实时流数据以及离线数据;

处理模块406,用于对所述历史物联网卡数据进行分布式风险识别处理,得到多个历史异常物联网卡数据以及每个历史异常物联网卡对应的风险类型。

可选的,所述装置还包括,筛选模块407;

所述处理模块406,还用于采用正则化处理对所述正负训练样本集进行特征化处理,得到所述正负训练样本集中每个历史异常物联网卡数据对应的样本特征;

筛选模块407,用于根据每个历史异常物联网卡数据对应的样本特征,对所述正负训练样本集进行特征筛选,得到目标正负训练样本集;

所述输入模块402,还用于将所述目标正负训练样本集以及所述目标正负训练样本集中的每个历史异常物联网卡对应的风险类型输入至识别模型中,以使所述识别模型根据输入数据进行迭代处理,得到训练好的风险识别模型。

可选的,所述获取模块401,还用于获取多个风险类型对应的预设风险分数;

所述确定模块403,还用于根据多个物联网卡对应的风险分数以及所述预设风险分数,确定每个物联网卡的风险类型。

可选的,所述装置还包括,输出模块408;

所述处理模块406,还用于根据每个物联网卡的风险类型,按照预设规则对多个物联网卡进行排序处理,不同的风险类型对应的优先级不同;

输出模块408,还用于按照顺序输出所述多个物联网卡以及每个物联网卡对应的风险类型。

图5为本申请提供的物联网卡风险识别设备的结构示意图。如图5所示,本申请提供一种物联网卡风险识别设备,该物联网卡风险识别设备500包括:接收器501、发送器502、处理器503以及存储器504。

接收器501,用于接收指令和数据;

发送器502,用于发送指令和数据;

存储器504,用于存储计算机执行指令;

处理器503,用于执行存储器504存储的计算机执行指令,以实现上述实施例中物联网卡风险识别方法所执行的各个步骤。具体可以参见前述物联网卡风险识别方法实施例中的相关描述。

可选地,上述存储器504既可以是独立的,也可以跟处理器503集成在一起。

当存储器504独立设置时,该电子设备还包括总线,用于连接存储器504和处理器503。

本申请还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上述物联网卡风险识别设备所执行的物联网卡风险识别方法。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

相关技术
  • 一种台区低电压识别方法、装置及终端设备
  • 一种净水监测终端、监测系统及其数据传输方法
  • 一种台区电表监测方法、系统及终端
  • 台区电表时间超差监测方法、装置、监测终端和存储介质
技术分类

06120116542129