掌桥专利:专业的专利平台
掌桥专利
首页

区域风险等级的评估方法、装置、计算机设备及存储介质

文献发布时间:2023-06-19 12:19:35


区域风险等级的评估方法、装置、计算机设备及存储介质

技术领域

本申请涉及人工智能技术领域,尤其涉及到一种区域风险等级的评估方法、装置、计算机设备及存储介质。

背景技术

随着人工智能的迅速发展,“智慧”一词,不再仅仅用来形容人类,还可以形容一座城市或一个国家。从政府决策与服务,到人们衣食住行的生活方式,再到城市的产业布局和规划,以及城市的运营和管理方式,这些都将在人工智能支撑下走向“智慧化”,智慧城市的风险监控网络,是预防城市风险的重要建设,未来城市将承载越来越多的人口,为保证城市安全,建设城市风险监控网络是重中之重。城市风险事故的发生不是一个孤立的事件,而是一系列事件相继发生的结果。从自然环境、社会环境、人的缺点、人的不安全行为到物的不安全状态、事故、伤害,环环相扣。

现有技术中,对于区域风险尚无完整可靠的风险评估方法,且风险评估较为抽象,相关部门难以准确把握风险评估的适用情况,进而导致区域风险等级评估的效率较低,准确度不高。

发明内容

有鉴于此,本申请提供了一种区域风险等级的评估方法、装置、计算机设备及存储介质,可用于解决目前在进行区域风险评估时,导致区域风险等级评估的效率较低,准确度不高的技术问题。

根据本申请的一个方面,提供了一种区域风险等级的评估方法,该方法包括:

对待进行区域风险评估的目标区域数据进行初始化处理,得到各个预设维度的指标数据,所述指标数据至少包括类别特征下的第一指标数据以及连续特征下的第二指标数据;

基于多模态异构算法训练得到符合预设训练标准的风险评级模型,所述风险评级模型包括适用于所述第一指标数据识别的类别特征风险评级子模型,以及适用于所述第二指标数据识别的连续特征风险评级子模型;

将所述第一指标数据和所述第二指标数据分别输入所述类别特征风险评级子模型和所述连续特征风险评级子模型中,得到目标区域属于不同预设风险等级的预测概率;

将对应所述预测概率最高的预设风险等级确定为所述目标区域的风险评估等级。

根据本申请的另一个方面,提供了一种区域风险等级的评估装置,该装置包括:

处理模块,用于对待进行区域风险评估的目标区域数据进行初始化处理,得到各个预设维度的指标数据,所述指标数据至少包括类别特征下的第一指标数据以及连续特征下的第二指标数据;

训练模块,用于基于多模态异构算法训练得到符合预设训练标准的风险评级模型,所述风险评级模型包括适用于所述第一指标数据识别的类别特征风险评级子模型,以及适用于所述第二指标数据识别的连续特征风险评级子模型;

输入模块,用于将所述第一指标数据和所述第二指标数据分别输入所述类别特征风险评级子模型和所述连续特征风险评级子模型中,得到目标区域属于不同预设风险等级的预测概率;

确定模块,用于将对应所述预测概率最高的预设风险等级确定为所述目标区域的风险评估等级。

根据本申请的又一个方面,提供了一种非易失性可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述区域风险等级的评估方法。

根据本申请的再一个方面,提供了一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述区域风险等级的评估方法。

借由上述技术方案,本申请提供的一种区域风险等级的评估方法、装置、计算机设备及存储介质,与目前区域风险等级的评估方式相比,本申请可通过将待进行风险评估的目标区域进行栅格划分,确定得到各个栅格单元,提取各个栅格单元内多个预设维度的指标数据。基于能够避免过拟合的多模态异构算法,创建并且训练得到多个能够用于识别指标数据中类别特征的类别特征风险评级子模型,以及能够识别指标数据中连续特征的连续特征风险评级子模型,并且采用了在不同的数据批次训练时,随机选取不同的算法,进而能够有效防止模型出现过拟合问题。对于新的栅格单元,可首先将栅格单元内的指标数据划分为类别特征和连续特征,进而将类别特征和连续特征分别输入类别特征风险评级子模型和连续特征风险评级子模型对应的多个模型中,综合得到该栅格单元属于不同风险级别的预测概率,最终将预测概率最大的风险评级作为栅格的最终风险评估等级。在本方案中,通过利用包含致险因子、有利因子、脆弱性和防范能力等多个维度的指标数据进行风险评估,能够比较全面地考量一个区域的风险,使得计算结果更加精确。并且通过层次分析法,对各风险因子进行加权求和,引入了科学的方法确定权重,从这个方面来看,计算结果也会更加精确和合理。故通过本申请中的技术方案,可提高区域风险评估的效率,使区域风险等级的评估结果更为精准。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:

图1示出了本申请实施例提供的一种区域风险等级的评估方法的流程示意图;

图2示出了本申请实施例提供的另一种区域风险等级的评估方法的流程示意图;

图3示出了本申请实施例提供的一种区域风险等级的评估装置的结构示意图;

图4示出了本申请实施例提供的另一种区域风险等级的评估装置的结构示意图。

具体实施方式

下文将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。

针对目前在进行区域风险评估时,导致区域风险等级评估的效率较低,准确度不高的技术问题,本申请提供了一种区域风险等级的评估方法,如图1所示,该方法包括:

101、对待进行区域风险评估的目标区域数据进行初始化处理,得到各个预设维度的指标数据,指标数据至少包括类别特征下的第一指标数据以及连续特征下的第二指标数据。

其中,目标区域数据为在待进行区域风险评估的目标区域中提取的数据,在提取目标区域数据时,可首先确定多个对区域风险存在影响的预设维度,具体可从致险因子、有利因子、防范能力(如区域GDP、配套设施、医疗水平等)等多个维度进行数据获取。在本方案中,可获取以下五个维度的指标数据:(1)、自然灾害数据:地震数据、台风数据、泥石流、洪涝等数据;(2)、人文数据:经济(GDP数据)、人口(人口密度);(3)、高危因子:化工厂、水电站、烟花厂等数量数据;(4)、有利因子:消防站、医院、救护站等数量数据;(5)、保险数据:标的地址、保费数据、赔付数据;其中自然灾害数据包括该地区历史灾害发生的次数及强度;为了保证预设维度数据的参考价值,保险数据只统计最近2年的数据即可。

对于本实施例,为了保证各指标数据量纲的影响,初始化处理具体可包括归一化处理,通过归一化处理将各个维度下的指标数据均控制在预设数值区间内,进而便于对指标数据的分析处理。在进行归一化处理后,还可对携带有位置信息的指标数据(如保险数据的标的地址、自然灾害数据中的自然灾害标的地址等)进行经纬度坐标校正。相应的,由于指标数据对应的数据形式不同,会对分类划分具有不同的影响,具体可包括离散数据(如对于高危风险因子、有利因子的有无以及数量等离散数据)和连续数据(如对于GDP数据、人口密度数据、保费数据、赔付数据等连续数值)。故在本申请中,在对指标数据进行对归一化处理以及经纬度坐标矫正处理后,还需要对指标数据进行类别特征和连续特征的划分,进一步将指标数据划分为类别特征下的第一指标数据以及连续特征下的第二指标数据。

102、基于多模态异构算法训练得到符合预设训练标准的风险评级模型,风险评级模型包括适用于第一指标数据识别的类别特征风险评级子模型,以及适用于第二指标数据识别的连续特征风险评级子模型。

对于本实施例,可首先搭建并训练风险评级模型,为了方便对不同指标数据的精准识别,风险评级模型可包括适用于第一指标数据识别的类别特征风险评级子模型,以及适用于第二指标数据识别的连续特征风险评级子模型。在具体的应用场景中,可利用样本标签数据分别训练类别特征风险评级子模型和连续特征风险评级子模型,进而利用训练完成的类别特征风险评级子模型和连续特征风险评级子模型综合组建成风险评级模型,以便利用风险评级模型实现对不同指标下目标区域数据的风险精准性评估。

103、将第一指标数据和第二指标数据分别输入类别特征风险评级子模型和连续特征风险评级子模型中,得到目标区域属于不同预设风险等级的预测概率。

其中,预设风险等级可根据实际应用场景进行具体划分,例如可根据严重程度将预设风险等级划分为高风险、中风险、低风险三个评价级别,此外还可进行更为详细的划分,如将预设风险等级划分为高风险、较高风险、中风险、较低风险、低风险五个等级。根据预设风险等级的评价级别设定,类别特征风险评级子模型和连续特征风险评级子模型对应不同的输出结果,当预设风险等级对应三个评价级别时,风险评级模型的输出结果为长度为3的向量,分别表示属于3个不同预设风险等级的预测概率;当预设风险等级对应五个评价级别时,风险评级模型的输出结果为长度为5的向量,分别表示属于5个不同预设风险等级的预测概率。在本申请中优选将预设风险等级划分为高风险、较高风险、中风险、较低风险、低风险五个等级。

在具体的应用场景中,在判定风险评级模型训练完成后,可进一步将指标数据按照指标类型输入到风险评级模型当中,即将第一指标数据和第二指标数据分别输入类别特征风险评级子模型和连续特征风险评级子模型中,各自得到对应指标数据下的预测结果,进而将类别特征和连续特征的预测结果进行加和,即可确定得到目标区域属于不同预设风险等级的预测概率。

例如,若目标区域内的指标数据共包括a、b、c、d、e、f,进一步按照指标类型将指标数据划分为类别特征下的第一指标数据a、b、c、d,以及连续特征下的第二指标数据e、f。在进行目标区域风险等级的评估时,可将第一指标数据a、b、c、d输入至类别特征风险评级子模型,获取得到目标区域属于不同预设风险等级的第一预测概率,将第二指标数据e、f输入至连续特征风险评级子模型,获取得到目标区域属于不同预设风险等级的第二预测概率,进而可将第一预测概率和第二预测概率进行加和计算,即可计算得到目标区域属于不同预设风险等级的最终预测概率。

104、将对应预测概率最高的预设风险等级确定为目标区域的风险评估等级。

对于本实施例,若基于风险评估模型得到目标区域属于不同预设风险等级的预测概率分别为:高风险40%、较高风险10%、中风险20%、较低风险15%、低风险15%,通过对比分析,可确定高风险对应的预测概率最高,故可将高风险确定为目标区域的风险评估等级。

通过本实施例中区域风险等级的评估方法,可通过将待进行风险评估的目标区域进行栅格划分,确定得到各个栅格单元,提取各个栅格单元内多个预设维度的指标数据。基于能够避免过拟合的多模态异构算法,创建并且训练得到多个能够用于识别指标数据中类别特征的类别特征风险评级子模型,以及能够识别指标数据中连续特征的连续特征风险评级子模型,并且采用了在不同的数据批次训练时,随机选取不同的算法,进而能够有效防止模型出现过拟合问题。对于新的栅格单元,可首先将栅格单元内的指标数据划分为类别特征和连续特征,进而将类别特征和连续特征分别输入类别特征风险评级子模型和连续特征风险评级子模型对应的多个模型中,综合得到该栅格单元属于不同风险级别的预测概率,最终将预测概率最大的风险评级作为栅格的最终风险评估等级。在本方案中,通过利用包含致险因子、有利因子、脆弱性和防范能力等多个维度的指标数据进行风险评估,能够比较全面地考量一个区域的风险,使得计算结果更加精确。并且通过层次分析法,对各风险因子进行加权求和,引入了科学的方法确定权重,从这个方面来看,计算结果也会更加精确和合理。故通过本申请中的技术方案,可提高区域风险评估的效率,使区域风险等级的评估结果更为精准。

进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,提供了另一种区域风险等级的评估方法,如图2所示,该方法包括:

201、对目标区域内的目标区域数据进行栅格划分处理,得到预设尺寸大小的多个栅格单元,栅格单元内包含有各个预设维度的栅格数据。

对于本实施例,在确定出目标区域后,可首先对目标区域进行区域栅格化处理,将目标区域按照某种规则划分成若干个预设尺寸大小的栅格单元,以便判断每个栅格单元的风险级别,比如可判定该区域的风险为高风险、较高风险、中风险或较低风险、低风险等五个级别。常用的栅格划分包括道路、水系进行区域划分或者根据经纬度来进行标准矩形划分。本提案采用的经纬度来对区域进行栅格化,其中分辨率取2公里,即将目标区域划分为2*2的正方形。

在确定得到各个栅格单元后,可进一步提取各个栅格单元内的栅格数据,具体可从致险因子、有利因子、防范能力(如区域GDP、配套设施、医疗水平等)等多个维度进行数据获取。在本方案中,可获取以下五个维度的指标数据:(1)、自然灾害数据:地震数据、台风数据、泥石流、洪涝等数据;(2)、人文数据:经济(GDP数据)、人口(人口密度);(3)、高危因子:化工厂、水电站、烟花厂等数量数据;(4)、有利因子:消防站、医院、救护站等数量数据;(5)、保险数据:标的地址、保费数据、赔付数据;其中自然灾害数据包括该地区历史灾害发生的次数及强度;为了保证预设维度数据的参考价值,保险数据只统计最近2年的数据即可。

202、对各个栅格数据进行初始化处理,得到各个栅格单元内关于类别特征的第一指标数据以及关于连续特征的第二指标数据,初始化处理至少包括归一化处理、坐标矫正处理、类别特征和连续特征的划分处理。

对于本实施例,在获取得到栅格数据后,可对栅格数据进行归一化、经纬度坐标校正以及类别特征和连续特征划分的一系列处理。在进行归一化处理时,本申请可采用min-max标准化的处理方式,具体形式如下:

其中X

在进行归一化处理后,可对携带有位置信息的指标数据(如保险数据的标的地址、自然灾害数据中的自然灾害标的地址等)进行经纬度坐标矫正。在具体的应用场景中,为将标的地址归属到相应的栅格单元,需要获取标的地址的经纬度信息。在具体的应用场景中,具体可采用现有地图导航应用来对地址的经纬度信息进行解析。对于同一条地址,可采用不同的地图导航应用分别解析标的地址,进而对比选择解析地理层级更精细的经纬度信息作为最终的经纬度坐标。

相应的,由于栅格数据对应的数据形式不同,会对分类划分具有不同的影响,具体可包括离散数据(如对于高危风险因子、有利因子的有无以及数量等离散数据)和连续数据(如对于GDP数据、人口密度数据、保费数据、赔付数据等连续数值)。为保证模型识别的精准性,在本申请中,在对栅格数据进行归一化以及经纬度坐标校正处理后,还需要对栅格数据进行类别特征和连续特征的划分,进一步划分得到类别特征下的第一指标数据以及连续特征下的第二指标数据。

203、利用CART分类树算法和朴素贝叶斯算法分别训练适用于类别特征识别的第一风险评级子模型以及第二风险评级子模型,利用多项逻辑回归模型和支持向量机算法分别训练适用于连续特征识别的第三风险评级子模型以及第四风险评级子模型。

对于本实施例,可基于多模态异构算法,即针对每个指标类型分别训练多个可选用识别的风险评级子模型,通过对多个风险评级子模型预估结果的整合,确定得到最终的预测结果。在本申请中,针对类别特征,可基于CART分类树算法和朴素贝叶斯算法分别训练得到第一风险评级子模型和第二风险评级子模型,即使类别特征风险评级子模型包括第一风险评级子模型和第二风险评级子模型;针对连续特征,可基于多项逻辑回归模型和支持向量机算法分别训练得到第三风险评级子模型以及第四风险评级子模型,即使连续特征风险评级子模型包括第三风险评级子模型和第四风险评级子模型。在本实施例中,通过设置多个风险评级子模型,进而对多个风险评级子模型的输出结果整合得到最终的风险评估结果,可保证风险预测的准确性。需要说明的是,在本申请中,可基于多模态异构算法,针对类别特征和连续特征分别训练两个风险评级子模型,本领域技术人员容易想到,针对每个特征类型还可同时训练一个或多个(大于两个)风险评级子模型,进而达到本申请或优于本申请中的技术效果。故针对每个特征类型利用其它相关机器学习算法训练一个或多个风险评级子模型,进而保证模型风险评估准确率的技术方案均应落入本申请中的保护范围,在此不做具体限定。

204、基于样本标签数据以及第一风险评级子模型、第二风险评级子模型、第三风险评级子模型、第四风险评级子模型分批次训练风险评级模型,以使风险评级模型符合预设训练标准。

其中,样本标签数据中标记有各个预设风险级别下的风险评级概率。

在具体的应用场景中,由于保险理赔数据更能直观显现风险等级结果,故在本实施例中,在确定出样本数据后,可首先依据样本数据中的历史保险数据计算保险赔付率,即:

一般来说V

进而可依据保险赔付率确定对应的风险级别,具体可将区间[0,1]划分为5个小区间[0,0.2]、[0.2,0.4]、[0.4,0.6]、[0.6,0.8]和[0.8,1.0],根据赔付比率R的所处区间分别将栅格单元划分为低风险、较低风险、中风险、较高风险、高风险等级。针对随机选取的10000个栅格单元,可得到带标签的数据样本

基于这些标签数据

进一步的,可利用数据增强后的样本标签数据训练适用于类别特征的第一风险评级子模型(记为F1)、第二风险评级子模型(记为F2),以及适用于连续特征的第三风险评级子模型(记为F3)以及第四风险评级子模型(记为F4)。

具体的,由于数据量较大,故可采用数据批次训练的方法,将15000个样本标签数据进行训练批次划分,例如共划分为15个批次,每个批次包含100条样本标签数据。在每个批次中可针对类别特征和连续特征随机选取风险评级子模型进行模型训练。在进行模型训练时,可将每个训练批次下数据增强后的带标签数据照比例8:2比例,分成训练集和验证集,将训练集的输入特征分为类别特征和连续特征。在第一风险评级子模型和第二风险评级子模型中随机选取一个作为训练识别当前数据批次下类别特征X_category的类别特征风险评级子模型F_category,在第三风险评级子模型和第四风险评级子模型中随机选取一个作为训练识别当前数据批次下连续特征X_cont的连续特征风险评级子模型F_cont,得到:

F=w1*F_category(X_category)+w2*F_cont(X_cont)

其中w1和w2分别表示F_category和F_cont的权重,设置w1:w2=类别特征数目:连续特征数目;F为长度5的向量,分别表示属于五个不同预设风险等级的概率。

由于标的风险等级数据通常是不平衡的(一般处于高风险等级的栅格数要少得多),因此为了提高模型的准确率,将Focal Loss函数作为模型的损失函数,将Focal Loss函数作为目标函数,即损失函数为:

其中,F

来确定参数θ;

对于本实施例,在风险评级模型训练过程中,当判定每个训练批次下各个风险评级子模型的损失函数均达到收敛状态,或判定损失函数的数值均小于预设阈值时,可判定第一风险评级子模型、第二风险评级子模型以及第三风险评级子模型和第四风险评级子模型符合预设训练标准,进一步可将训练完成的第一风险评级子模型、第二风险评级子模型以及第三风险评级子模型和第四风险评级子模型组合构建得到风险评级模型。需要说明的是,由于数据增强后的带标签数据的数据量较大,故在训练时,可将标签数据进行数据批次的划分,对于每个数据批次,分别随机选取不同的类别特征风险评级子模型F_category以及连续特征风险评级子模型F_cont,进而能够有效防止模型出现过拟合问题。

相应的,实施例步骤204具体可以包括:将样本标签数据划分为多个训练批次;针对每个训练批次,将第一风险评级子模型和第二风险评级子模型中的任意一个确定为类别特征风险评级子模型,将第三风险评级子模型和第四风险评级子模型中的任意一个确定为连续特征风险评级子模型;依据样本标签数据中标记的风险评级概率,训练各个训练批次下的类别特征风险评级子模型和连续特征风险评级子模型;若判断任意一个训练批次下,类别特征风险评级子模型和连续特征风险评级子模型的损失函数均小于预设阈值,则判定风险评级模型完成训练。

205、将第一指标数据分别输入第一风险评级子模型和第二风险评级子模型中,获取得到第一预测结果和第二预测结果。

对于本实施例,在提取出目标区域针对类别特征的第一指标数据后,可将第一指标数据同时输入值第一风险评级子模型和第二风险评级子模型中,获取到两个风险评级子模型针对第一指标数据的不同预测结果。

206、将第二指标数据分别输入第三风险评级子模型和第四风险评级子模型中,获取得到第三预测结果和第四预测结果。

对于本实施例,在提取出目标区域针对连续特征的第二指标数据后,可将第二指标数据同时输入值第三风险评级子模型和第四风险评级子模型中,获取到两个风险评级子模型针对第二指标数据的不同预测结果。

207、根据第一预测结果、第二预测结果、第三预测结果和第四预测结果计算各个栅格单元针对各个预设风险级别的预测概率。

对于本实施例,在计算得到针对第一指标数据的第一预测结果、第二预测结果,以及针对第二指标数据的第三预测结果和第四预测结果后,可依据整合计算公式计算得到第一预测结果、第二预测结果、第三预测结果和第四预测结果的整合结果,进一步将整合结果确定为栅格单元针对各个预设风险级别的预测概率。

整合计算公式的特征描述为:

P=0.5(F1(X_category)+F2(X_category)+F3(X_cont)+F4(X_cont))

其中,P为长度5的向量,由于F1和F2同属于类别特征下的预测结果,F3和F4同属于连续特征下的预测结果,故在综合计算栅格单元属于不同风险级别的概率时,需要将第一风险评级子模型、第二风险评级子模型、第三风险评级子模型和第四风险评级子模型的概率加和结果整体除以2,即在计算得到四个风险子模型的加和结果后,将加和结果乘0.5,即可得到栅格单元分别表示属于五个不同风险级别(高、较高、中、较低、低)的概率,对于本实施例,可将概率最大的风险评级作为栅格单元的最终风险等级。

相应的,作为一种可选方式,对于上述整合计算公式中第一风险评级子模型、第二风险评级子模型、第三风险评级子模型和第四风险评级子模型的配置权重均为50%。然而在具体的应用场景中,还可根据各个模型预测的精准度,为不同风险评级子模型配置不同的权重。例如,针对第一风险评级子模型,可配置权重为a,第二风险评级子模型可配置权重为(1–a),针对第三风险评级子模型,可配置权重为b,第四风险评级子模型可配置权重为(1–b),其中a、b均为大于0小于或等于1的数值。

相应的,上述整合计算公式的特征描述可变换为:

P=a*F1(X_category)+(1-a)*F2(X_category)+b*F3(X_cont)+(1-b)*F4(X_cont)

208、将对应预测概率最高的预设风险级别确定为各个栅格单元的风险评估等级。

在具体的应用场景中,作为一种优选方式,在确定得到目标区域中各个栅格单元的风险评估等级后,可进一步根据目标区域内各个栅格单元的风险评估等级,对栅格单元进行风险标记;针对风险评估等级大于预设风险阈值的栅格单元生成风险防控推荐。

具体的,在确定得到目标区域内各个栅格单元对应的风险等级后,可依据风险等级生成风险分布图,在风险分布图中以风险等级对各个栅格区域进行颜色标记,例如,可分别用红、橙、黄、蓝、绿作为高、较高、中等、较低、低五级预警级别所对应的预警颜色,可以采用自然断点法、标准差法和等距分割法等进行色彩分级,在此不作限定。通过风险分布图可能够更加直观的显示风险分布情况,便于对风险的预警分析。以便在目标区域内未发生风险之前就进行区域风险等级的预测,以便提前进行预防和维护。进一步的,对于风险等级较高的区域,还可生成相应的风险防控策略,如可根据五个维度的指标数据对应的特征信息匹配目标保险产品,进而为目标区域生成目标保险产品推荐等。

借由上述区域风险等级的评估方法,可通过将待进行风险评估的目标区域进行栅格划分,确定得到各个栅格单元,提取各个栅格单元内多个预设维度的指标数据。基于能够避免过拟合的多模态异构算法,创建并且训练得到能够用于识别指标数据中类别特征的类别特征风险评级子模型,以及能够识别指标数据中连续特征的连续特征风险评级子模型,并且采用了在不同的数据批次训练时,随机选取不同的算法,进而能够有效防止模型出现过拟合问题。对于新的栅格单元,可首先将栅格单元内的指标数据划分为类别特征和连续特征,进而将类别特征和连续特征分别输入类别特征分类模型和连续特征分类模型对应的多个模型中,综合得到该栅格单元属于不同风险级别的预测概率,最终将预测概率最大的风险评级作为栅格的最终风险评估等级。在本方案中,通过利用包含致险因子、有利因子、脆弱性和防范能力等多个维度的指标数据进行风险评估,能够比较全面地考量一个区域的风险,使得计算结果更加精确。并且通过层次分析法,对各风险因子进行加权求和,引入了科学的方法确定权重,从这个方面来看,计算结果也会更加精确和合理。故通过本申请中的技术方案,可提高区域风险评估的效率,使区域风险等级的评估结果更为精准。

进一步的,作为图1和图2所示方法的具体实现,本申请实施例提供了一种区域风险等级的评估装置,如图3所示,该装置包括:处理模块31、训练模块32、输入模块33、确定模块34;

处理模块31,可用于对待进行区域风险评估的目标区域数据进行初始化处理,得到各个预设维度的指标数据,指标数据至少包括类别特征下的第一指标数据以及连续特征下的第二指标数据;

训练模块32,可用于基于多模态异构算法训练得到符合预设训练标准的风险评级模型,风险评级模型包括适用于第一指标数据识别的类别特征风险评级子模型,以及适用于第二指标数据识别的连续特征风险评级子模型;

输入模块33,可用于将第一指标数据和第二指标数据分别输入类别特征风险评级子模型和连续特征风险评级子模型中,得到目标区域属于不同预设风险等级的预测概率;

确定模块34,可用于将对应预测概率最高的预设风险等级确定为目标区域的风险评估等级。

在具体的应用场景中,为了基于目标区域数据得到各个预设维度的指标数据,处理模块31,具体可用于对目标区域内的目标区域数据进行栅格划分处理,得到预设尺寸大小的多个栅格单元,栅格单元内包含有各个预设维度的栅格数据;对各个栅格数据进行初始化处理,得到各个栅格单元内关于类别特征的第一指标数据以及关于连续特征的第二指标数据,初始化处理至少包括归一化处理、坐标矫正处理、类别特征和连续特征的划分处理。

相应的,在训练符合预设训练标准的风险评级模型时,训练模块32,具体可用于利用CART分类树算法和朴素贝叶斯算法分别训练适用于类别特征识别的第一风险评级子模型以及第二风险评级子模型;利用多项逻辑回归模型和支持向量机算法分别训练适用于连续特征识别的第三风险评级子模型以及第四风险评级子模型;基于样本标签数据以及第一风险评级子模型、第二风险评级子模型、第三风险评级子模型、第四风险评级子模型分批次训练风险评级模型,以使风险评级模型符合预设训练标准。

在具体的应用场景中,样本标签数据中标记有各个预设风险级别下的风险评级概率;相应的,在基于样本标签数据以及第一风险评级子模型、第二风险评级子模型、第三风险评级子模型、第四风险评级子模型分批次训练风险评级模型,以使风险评级模型符合预设训练标准时,训练模块32,具体可用于将样本标签数据划分为多个训练批次;针对每个训练批次,将第一风险评级子模型和第二风险评级子模型中的任意一个确定为类别特征风险评级子模型,将第三风险评级子模型和第四风险评级子模型中的任意一个确定为连续特征风险评级子模型;依据样本标签数据中标记的风险评级概率,训练各个训练批次下的类别特征风险评级子模型和连续特征风险评级子模型;若判断任意一个训练批次下,类别特征风险评级子模型和连续特征风险评级子模型的损失函数均小于预设阈值,则判定风险评级模型完成训练。

相应的,为了确定得到目标区域属于不同预设风险等级的预测概率,输入模块33,具体可用于将第一指标数据分别输入第一风险评级子模型和第二风险评级子模型中,获取得到第一预测结果和第二预测结果;将第二指标数据分别输入第三风险评级子模型和第四风险评级子模型中,获取得到第三预测结果和第四预测结果;根据第一预测结果、第二预测结果、第三预测结果和第四预测结果计算各个栅格单元针对各个预设风险级别的预测概率。

在具体的应用场景中,为了基于目标区域属于不同预设风险等级的预测概率,确定目标区域的风险评估等级,确定模块34,具体可用于将对应预测概率最高的预设风险级别确定为各个栅格单元的风险评估等级。

相应的,为了基于目标区域内各个栅格单元的风险评估等级,实现对风险的展示与防控,如图4所示,该装置还包括:标记模块35、生成模块36;

标记模块35,可用于根据目标区域内各个栅格单元的风险评估等级,对栅格单元进行风险标记;

生成模块36,可用于针对风险评估等级大于预设风险阈值的栅格单元生成风险防控推荐。

需要说明的是,本实施例提供的一种区域风险等级的评估装置所涉及各功能单元的其他相应描述,可以参考图1至图2的对应描述,在此不再赘述。

基于上述如图1至图2所示方法,相应的,本实施例还提供了一种非易失性存储介质,其上存储有计算机可读指令,该可读指令被处理器执行时实现上述如图1至图2所示的区域风险等级的评估方法。

基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。

基于上述如图1至图2所示的方法和图3、图4所示的虚拟装置实施例,为了实现上述目的,本实施例还提供了一种计算机设备,该计算机设备包括存储介质和处理器;非易失性存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的区域风险等级的评估方法。

可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。

本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。

非易失性存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现非易失性存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。

通过应用本申请的技术方案,与目前现有技术相比,本申请可通过将待进行风险评估的目标区域进行栅格划分,确定得到各个栅格单元,提取各个栅格单元内多个预设维度的指标数据。基于能够避免过拟合的多模态异构算法,创建并且训练得到多个能够用于识别指标数据中类别特征的类别特征风险评级子模型,以及能够识别指标数据中连续特征的连续特征风险评级子模型,并且采用了在不同的数据批次训练时,随机选取不同的算法,进而能够有效防止模型出现过拟合问题。对于新的栅格单元,可首先将栅格单元内的指标数据划分为类别特征和连续特征,进而将类别特征和连续特征分别输入类别特征风险评级子模型和连续特征风险评级子模型对应的多个模型中,综合得到该栅格单元属于不同风险级别的预测概率,最终将预测概率最大的风险评级作为栅格的最终风险评估等级。在本方案中,通过利用包含致险因子、有利因子、脆弱性和防范能力等多个维度的指标数据进行风险评估,能够比较全面地考量一个区域的风险,使得计算结果更加精确。并且通过层次分析法,对各风险因子进行加权求和,引入了科学的方法确定权重,从这个方面来看,计算结果也会更加精确和合理。故通过本申请中的技术方案,可提高区域风险评估的效率,使区域风险等级的评估结果更为精准。

本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

相关技术
  • 区域风险等级的评估方法、装置、计算机设备及存储介质
  • 传染病的区域风险评估方法、装置、存储介质及设备
技术分类

06120113254561