一种钞盒状态预测模型的训练方法、装置及设备

文献发布时间：2023-06-19 11:02:01

技术领域

本申请涉及大数据领域，特别涉及一种钞盒状态预测模型的训练方法、装置及设备。

背景技术

随着科技的快速发展，在较为发达的地区对ATM(Automated Teller Machine，自动取款机)设备的可用性要求变得越来越高。钞盒作为ATM设备的核心部件，其有效稳定的工作对整个ATM设备的稳定运行有重要的影响。因此，对钞盒状态进行检测变得比较重要。

现有技术中，对钞盒状态进行检测主要基于银行对ATM设备做定期维护时进行的，这种方式主要依靠维修人员进行人工检测，不仅耗费大量的人力、物力和财力，而且一旦ATM设备出现故障，维修效率较低。

因此，业内亟需一种可以解决上述技术问题的技术方案。

发明内容

本说明书实施例提供了一种钞盒状态预测模型的训练方法、装置及设备，可以事先对钞盒状态进行预测分析，对还未故障的设备进行针对性的维修保养，从而降低设备损坏后的维修成本和风险，提高维修效率。

本说明书提供的一种钞盒状态预测模型的训练方法、装置及设备是包括以下方式实现的。

一种钞盒状态预测模型的训练方法，包括：获取与ATM设备关联的指标数据；根据所述指标数据中出钞或入钞状态是否异常，为所述ATM设备分配类别标签；利用随机森林算法对所述指标数据进行特征提取，获得所述ATM设备的特征数据；所述特征数据表示影响所述ATM设备钞盒状态的因素；利用所述ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。

一种钞盒状态预测模型的训练装置，包括：获取模块，用于获取与ATM设备关联的指标数据；分配模块，用于根据所述指标数据中出钞或入钞状态是否异常，为所述ATM设备分配类别标签；提取模块，用于利用随机森林算法对所述指标数据进行特征提取，获得所述ATM设备的特征数据；所述特征数据表示影响所述ATM设备钞盒状态的因素；训练模块，用于利用所述ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。

一种钞盒状态预测模型的训练设备，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现本说明书实施例中任意一个方法实施例方法的步骤。

一种计算机可读存储介质，其上存储有计算机指令，所述指令被执行时实现本说明书实施例中任意一个方法实施例的步骤。

本说明书提供的一种钞盒状态预测模型的训练方法、装置及设备。一些实施例中可以从数据湖和/或数据库中获取与ATM设备关联的指标数据，根据指标数据中出钞或入钞状态是否异常，为ATM设备分配类别标签。进一步，还可以利用随机森林算法对指标数据进行特征提取，获得ATM设备的特征数据，利用ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。采用本说明书提供的实施方案，可以事先对钞盒状态进行预测分析，对还未故障的设备进行针对性的维修保养，降低维修人员在途时间，降低设备损坏后的维修成本和风险，提高维修效率。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，并不构成对本说明书的限定。在附图中：

图1是本说明书提供的一种钞盒状态预测模型的训练方法的一个实施例的流程示意图；

图2是本说明书提供的利用随机森林算法将指标数据中指标按照重要度排序后的前15个指标的示意图；

图3是本说明书提供的一种钞盒状态预测模型的训练装置的一个实施例的模块结构示意图；

图4是本说明书提供的一种钞盒状态预测模型的训练服务器的一个实施例的硬件结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书中的一部分实施例，而不是全部的实施例。基于本说明书中的一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书实施例保护的范围。

钞盒作为银行ATM机的核心部件，其有效稳定的工作对整个ATM机的稳定运行有重要的影响。在较为发达的地区，人口密度高，自助设备投产的体量巨大，区域竞争激烈，客户要求高，对ATM设备的可用性有很高的要求。目前为了保证ATM设备的高可用性，银行会对ATM设备做定期的维护，如清洗、除尘、检查线路、更换色带等，以保障ATM设备正常的运行工作，但是检查工作比较繁琐，维护成本高。具体的，例如，如果按照每年4次保养的频度来计算，平均到每个工作日大概需要50-100台次的保养，耗费大量的人力、物力和财力。此外，根据前期统计，一旦ATM设备损坏，实际现场处理的时间平均大约为1.5小时左右，报修建单流转约10分钟左右，维修人员上门平均需要1个小时左右，所以上门维修故障的修复时间大约在2个半小时以上，而在途时间占整个时间的40％左右，如果按每天60台次计，在途时间约60个机时(相当于每天5台ATM的在途损耗)。这样，使得维修效率较低。

本说明书提供一种钞盒状态预测模型的训练方法，可以事先对钞盒进行预测分析，对还未故障的设备进行针对性的维修保养，从而降低设备损坏后的维修成本和风险，提高维修效率。

下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的，图1是本说明书提供的一种钞盒状态预测模型的训练方法的一个实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构，但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。

本说明书提供的一种实施方案可以应用到客户端、服务器等中。所述客户端可以包括终端设备，如智能手机、平板电脑等。所述服务器可以包括单台计算机设备，也可以包括多个服务器组成的服务器集群，或者分布式系统的服务器结构等。

需要说明的是，下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图1所示，本说明书提供的一种钞盒状态预测模型的训练方法的一种实施例中，所述方法可以包括以下步骤。

S0：获取与ATM设备关联的指标数据。

本说明书实施例中，与ATM设备关联的指标数据可以包括ATM设备的基本信息、状态信息、业务信息、交易信息等。

一些实施例中，可以从数据湖和/或数据库中获取与ATM设备关联的数据表，然后将所述数据表中的数据作为与ATM设备关联的指标数据。其中，所述数据表可以包括档案表、业务报表、交易量统计表、设备状态信息表、状态统计表等。其中，所述档案表可以用于记录每个ATM设备的基本信息；所述业务报表可以用于统计每个ATM设备当月使用情况；所述交易量统计表可以用于记录每个ATM设备在每个交易日的使用情况；所述设备状态信息表可以用于记录每个ATM设备钞盒的信息；所述状态统计表可以用于记录每个ATM设备的故障信息。数据湖是一个以原始格式存储数据的存储库或系统，其可以按原样存储数据，而无需事先对数据进行结构化处理。一个数据湖可以存储结构化数据、半结构化数据、非结构化数据、二进制数据等。数据库可以是Oracle数据库、MySQL数据库等。

一些实施场景中，可以从总行数据湖获取业务报表、交易量统计表和状态统计表，从OME系统数据库获取档案表、设备状态信息表。其中，业务报表可以包括设备的存取款、转账笔数和金额、交易笔数、金额合计等信息；交易量统计表可以包括设备号、现金交易等信息；状态统计表可以包括服务状态不正常次数暂停服务的次数、因管理状态而导致暂停服务的次数、读卡故障次数、钞箱技术故障次数、钞箱业务故障次数、缺钞/低钞/无钞次数、出钞模块出错次数、入钞模块出错次数等信息；档案表可以包括设备类型、设备使用状态、停机标志等信息；设备状态信息表可以包括各钞盒现有钞票张数、状态、类型等信息。OME系统数据库是ATM设备厂商对应的数据库。

一些实施场景中，从数据湖和/或数据库中获取与ATM设备关联的数据表后，可以将数据表中提取指定时间内的数据作为指标数据。其中，指定时间可以是1年、半年等，具体可以根据实际场景进行设定，本说明书对此不作限定。例如一些实施场景中，可以从总行数据湖获取业务月报表、交易量统计表和状态统计表，从OME系统数据库获取档案表、设备状态信息表，然后从业务月报表中提取过去9个月的数据、从交易量统计表中提取过去半年的数据、从状态统计表中提取1年内的数据、从档案表提取设备的基本信息、从设备状态信息表提取过去半年的数据，从而获得与ATM设备关联的指标数据。当然，上述只是进行示例性说明，获取指标数据的方式不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

本说明书实施例中，通过从数据湖和/或数据库中获取与ATM设备关联的指标数据，可以为后续构建钞盒状态预测模型对钞盒状态进行预测分析提供保障。

S2：根据所述指标数据中出钞或入钞状态是否异常，为所述ATM设备分配类别标签。

本说明书实施例中，在获取与ATM设备关联的指标数据后，可以根据指标数据中出钞或入钞状态是否异常，为每个ATM设备分配类别标签。

一些实施例中，可以根据设备状态信息表中的CDMSTATUS/DEPSTATUS即出钞模块状态/入钞模块状态两个状态是否为异常来定义设备的异常，从而对每个ATM设备进行编码。出钞状态也可以称为出钞模块状态(CDMSTATUS)，入钞状态也可以称为入钞模块状态(DEPSTATUS)。

一些实施场景中，若某设备出钞模块状态和入钞模块状态中存在一个为异常，则可以为该设备分配标签值为1，若二者均不存在异常，则可以为该设备分配标签值为0。

一些实施场景中，还可以根据预设时间内设备出钞模块状态和入钞模块状态，为ATM设备分配类别标签。例如，若某设备在过去一周内的出钞模块状态或入钞模块状态存在异常，则可以为该设备分配标签值为1，若不存在异常，则可以为该设备分配标签值为0。当然，上述分配的标签值只是进行示例性说明，标签值还可以为其它标识，例如可以是字母、数字、字符中一种或多种的组合等，本说明书对此不做限定。预设时间还可以根据实际场景进行设定，例如可以是一周、一个月等，本说明书对此不作限定。

S4：利用随机森林算法对所述指标数据进行特征提取，获得所述ATM设备的特征数据；所述特征数据表示影响所述ATM设备钞盒状态的因素。

本说明书实施例中，在为ATM设备分配类别标签后，可以对所述指标数据进行特征提取，获得ATM设备的特征数据。特征数据可以表示影响ATM设备钞盒状态的因素。

一些实施例中，上述获取的指标数据可能会存在维度高、数据量大、数据存在噪声、数据缺失等问题，为了使后续获得的钞盒状态预测模型的准确度更高，在对指标数据进行特征提取前，可以对指标数据进行相应处理。

一些实施例中，所述利用随机森林算法对所述指标数据进行特征提取前，可以包括：对所述指标数据进行预处理，获得第一指标数据。其中，所述预处理可以包括删除缺失率大于第一预设值的指标数据、合并相似度大于第二预设值的指标数据。

一些实施场景中，可以统计指标数据中同一指标对应的数据缺失比例，然后删除缺失比例大于第一预设值的指标数据。其中，缺失比例也可以称为缺失率，其可以理解为同一指标对应的数据缺失数占总样本数的比值。一些实施场景中，在删除缺失比例大于第一预设值的指标数据后，可以计算不同指标数据之间的相似度，然后判断相似度是否大于第二预设值，若大于，则可以将其进行合并为一个指标，从而达到数据降维的目的，提高数据的质量。例如一些实施场景中，可以统计指标数据中同一指标对应的数据缺失比例，然后删除缺失比例大于70％的指标数据，在删除缺失比例大于第一预设值的指标数据后，可以计算不同指标数据之间的相似度，然后判断相似度是否大于85％，若大于85％，则可以将其进行合并为一个指标，从而达到数据降维的目的，提高数据的质量。其中，第一预设值和第二预设值可以根据实际场景进行设定，例如，可以是70％、85％等，本说明书对此不做限定。当然，上述只是进行示例性说明，对指标数据进行预处理的方式不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

一些实施例中，所述利用随机森林算法对所述指标数据进行特征提取前，还可以构造新指标，根据指标数据确定新指标对应的数据。

一些实施场景中，可以针对ATM设备档案表中的数据，构造新指标。其中，构造的新指标可以包括下述至少之一：购置日期到当前日期的天数，启用日期到当前日期的天数，上次更新日期到当前日期的天数，上次签到日期到当前日期的天数，非营业日停机标志拆分后的停机标志等。进一步，可以根据ATM设备档案表中的数据确定新指标对应的数据，例如，可以求购置日期到当前日期的天数，启用日期到当前日期的天数，上次更新日期到当前日期的天数，上次签到日期到当前日期的天数，非营业日停机标志按天拆为周一、周二、周三、周四、周五、周六、周日、法定长假8个停机标志等。

一些实施场景中，由于部分ATM设备会在网点之间进行转换，因此可以针对ATM设备交易量统计表中的数据，构造新指标，例如，最近一次转换到当前的天数。进一步，可以根据ATM设备交易量统计表中的数据计算在最近一次转换到当前的天数内的圈存笔数、圈存金额、圈提笔数、圈提金额、存折取款笔数、存折取款金额、存折存款笔数、存折存款金额、手机预约取款笔数、手机预约取款金额、跨行转账笔数、跨行转账金额、卡内转账笔数、卡内转账金额、总交易金额的均值、最大值、最小值、总和(最近10天、最近20天、最近30天、最近60天、最近90天)等。

一些实施场景中，针对ATM设备状态信息表中的数据，构造的新指标可以包括每个设备过去180天出现故障的日期到当前日期的天数等。一些实施场景中，若过去180天未出现故障，可以为该新构造的指标赋预设值，例如-99等。

一些实施场景中，针对ATM设备业务报表中的数据，构造的新指标可以包括取款笔数、取款金额、存款笔数、存款金额、转帐笔数、转帐金额、查询笔数、改密笔数、其他笔数、业务笔数合计、交易笔数合计、交易金额合计、币种等的隔月、往前隔2个月、往前隔3个月共3个月的数据。

一些实施场景中，针对ATM设备状态统计表中的数据，构造的新指标可以包括钞箱技术故障次数、钞箱业务故障次数、缺钞/低钞/无钞次数、出钞模块出错次数、入钞模块出错次数、钞票处理模块故障次数、加钞累计金额、累计吐钞金额等在过去180天的均值、最大值、最小值、总和。

当然，上述只是进行示例性说明，构造新指标的方式不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

一些实施例中，在获得第一指标数据和新指标对应的数据后，可以将新指标对应的数据和第一指标数据合并，获得第二指标数据。

本说明书实施例，通过对最初获取的与ATM设备关联的指标数据进行删除、合并等预处理，可以解决数据中存在噪声、数据缺失等问题，使后续获得的钞盒状态预测模型的准确度更高。通过构造新指标对指标数据进行扩展，可以生成能够更好体现业务特性、与类别标签关系紧密的新指标，从而能更好地解释模型，使后续获得的钞盒状态预测模型的准确度更高。

一些实施例中，在获得第二指标数据后，可以对第二指标数据的重要性进行排序，筛选出对钞盒状态影响明显的指标数据。其中，确定对钞盒状态影响是否明显可以通过预设重要性阈值来确定，当指标数据的重要性大于预设重要性阈值时，可以认为其是对钞盒状态影响明显的指标数据，否则，可以认为不是对钞盒状态影响明显的指标数据。其中，预设重要性阈值可以根据实际场景进行设定，如，可以是10％、20％等，本说明书对此不作限定。

一些实施场景中，在获得第二指标数据后，可以利用随机森林算法对第二指标数据进行特征提取，获得ATM设备的特征数据。具体的，可以引入随机森林算法对第二指标数据中指标的重要性进行排序，然后提取出重要性超过预设重要性阈值的指标，将提取出的指标对应的数据作为ATM设备的特征数据。例如，可以利用随机森林算法将原先1400多个指标进行排序，然后选择其中280个指标作为最终指标，将280个指标对应的数据作为模型训练的数据。这样可以有效解决原始数据维度高、数据存在噪声等问题。其中，随机森林算法具有极高的准确率，其因为引入随机性，不容易过拟合，有很好的抗噪声能力，并且可以处理高维度的数据，得到变量的重要性排序。当然，上述只是进行示例性说明，对指标数据进行特征提取的方式不限于上述举例，例如主成分分析法等，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

如图2所示，图2是本说明书提供的利用随机森林算法将指标数据中指标按照重要度排序后的前15个指标的示意图，其中，横坐标表示重要度，纵坐标表示指标名称，gap_mon_date为最近一次维修日期距离当前日期的天数，gap_purchase_date为购买日期距离当前日期的天数，cashamt_max为一年内180天最大库存累计金额，mon_cnt_6为故障发生时间在0～5点钟，gap_enabledate为启用日期距离当前日期的天数，servcount_max为一年内180天最大服务状态不正常次数暂停服务的次数，othcount_max_10为一年内10天最大其他笔数，requirecount_sum为一年内180天累计设备应上报次数，norruncount_sum为一年内180天累计正常上报次数，servcount_avg为一年内180天平均服务状态不正常次数暂停服务的次数，chgpwdcount_avg_90为一年内90天平均改密笔数，fixeddeposit_qry_count_avg_90为一年内90天平均定期产品查询笔数，cwdcount_3为近三个月取款笔数，cctamt_avg为一年内180天平均累计吐钞金额，trfamt_max_90为一年内90天最大卡转账金额。

一些实施例中，在对指标数据中指标的重要性进行排序，提取出重要性超过预设重要性阈值的指标后，可以将提取出的指标对应的数据作为ATM设备的特征数据。一些实施场景中，所述特征数据可以包括以下至少之一：最近一次维修日期距离当前日期的天数、购买日期距离当前日期的天数、一年内180天最大库存累计金额、故障发生时间在0～5点钟、启用日期距离当前日期的天数、一年内180天最大服务状态不正常次数暂停服务的次数、一年内10天最大其他笔数；一年内180天累计设备应上报次数、一年内180天累计正常上报次数、一年内180天平均服务状态不正常次数暂停服务的次数、近三个月取款笔数、一年内180天平均累计吐钞金额、一年内90天平均改密笔数、一年内90天平均定期产品查询笔数、一年内90天最大卡转账金额。当然，上述只是进行示例性说明，特征数据不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

S6：利用所述ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。

本说明书实施例中，在获得ATM设备的特征数据后，可以利用ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。钞盒状态预测模型可以用于预测ATM设备中钞盒状态。钞盒状态可以包括正常和异常。这样，通过构建钞盒状态预测模型对钞盒状态进行预测分析，事先对还未故障的设备进行针对性的维修保养，可以大大降低维修人员在途时间，降低设备损坏后的维修成本和风险，从而提升客户的满意度。

一些实施例中，可以从预设模型算法库中选择要进行训练的模型，然后利用ATM设备的特征数据和类别标签对模型进行训练，获得初始预测模型，进一步可以基于预设性能指标调整初始预测模型的参数，获得钞盒状态预测模型。其中，预设模型算法库中可以预先存储不同类型的机器学习模型，例如，可以LightGBM、随机森林、XgBoost、GBDT等。其中，LightGBM是一种基于决策树的学习算法。随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。XGBoost(Extreme Gradient Boosting)主要可以用来解决有监督学习问题，此类问题利用包含多个特征的训练数据来预测目标变量。GBDT(Gradient BoostingDecision Tree)是一种迭代的决策树算法，其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型。预设性能指标可以用于评价训练获得的模型的性能，例如可以包括AUC值、KS值等。其中，AUC值可以体现出容忍样本倾斜的能力，检验模型对正负样本排序能力的强弱，其直观含义表示任意取一个正样本和负样本，正样本排在负样本前面的概率。KS值可以用于评估模型将正样本和负样本分开的能力。KS值越大，模型的预测准确度越高。一些实施场景中，通常KS值大于0.2，即可认为模型有比较好的预测准确性。

由于随机森林在某些噪音大的分类问题上容易过拟合并且对取值划分较多的属性敏感，XGBoost对系统资源要求很高，LightGBM模型在大样本、高维度的故障预测任务中呈现训练速度快、内存使用更低，准确率更高的优势，适合大规模数据训练。因此本说明书实施例中从预设模型算法库中选择要进行训练的模型优选为LightGBM模型。

一些实施例中，所述利用所述ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型，可以包括：利用所述ATM设备的特征数据和类别标签，对LightGBM模型进行训练，获得初始预测模型；基于AUC值和/或KS值调整所述初始预测模型的参数，获得钞盒状态预测模型。

一些实施场景中，利用ATM设备的特征数据和类别标签，对LightGBM模型进行训练前，可以配置模型的初始参数。其中，初始参数可以包括以下至少之一：树个数、树深度、学习率、树的行采样率、树的列采样率、叶子节点最小样本数、最大合并组数、最大叶子数、叶子节点最小海森矩阵和、叶子节点最小数据等。

一些实施场景中，在配置好模型的初始超参数后，可以利用ATM设备的特征数据和类别标签，对LightGBM模型进行训练，获得初始预测模型。一些实施场景中，在训练过程中，可以将特征数据划分为训练集和测试集。其中，训练集可以用来训练模型；测试集可以用来验证训练模型的准确率，防止模型发生过拟合。例如，获得的特征数据包括84000条，此时，可以将84000条中的19000条数据作为测试集，65000条数据作为训练集。当然，上述只是进行示例性说明，对数据集的划分方式不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

一些实施场景中，在获得初始预测模型后，可以基于AUC值和/或KS值对初始预测模型的参数进行调优，获得最优参数组合，进而将最优参数组合对应的模型作为钞盒状态预测模型。

一些实施场景中，还可以使用网格搜索和交叉验证的方法调整模型参数，获得规定参数范围内最优的参数组合。其中，网格搜索(Grid Search)是一种调优方法，其可以在参数列表中进行穷举搜索，对每种情况进行训练，找到最优的参数。交叉验证(CrossValidation)可以将原始样本数据(dataset)进行分组，一部分作为训练集(train set)，另一部分作为验证集(validation set or test set)，然后用训练集对分类器进行训练，再利用验证集测试训练得到的模型(model)，以此来评价分类器的性能。当然，上述只是进行示例性说明，调整模型参数的方式不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

一些实施场景中，获得的最优参数组合可以为：树个数ntrees为100；树深度max_depth为6；学习率learn_rate为0.1；树的行采样率sample_rate为1；树的列采样率col_sample_rate_per_tree为1；叶子节点最小样本数min_rows为10；最大合并组数max_bins为256；最大叶子数max_leaves为0；叶子节点最小海森矩阵和min_sum_hessian_in_leaf为100；叶子节点最小数据min_data_in_leaf为0。当然，上述只是进行示例性说明，不同场景中获得的最优参数组合不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

一些实施例中，在获得钞盒状态预测模型后，可以将其存储在数据库或存储器中，这样，在需要对钞盒进行故障预测时，可以直接调用钞盒状态预测模型对目标ATM设备的钞盒进行故障预测，从而提高信息处理效率。

一些实施例中，在获得钞盒状态预测模型后，还可以获取目标ATM设备的特征数据，将所述目标ATM设备的特征数据输入所述钞盒状态预测模型，获得对所述目标ATM设备钞盒状态的预测结果。其中，预测结果可以包括异常或正常。需要说明的是，钞盒状态通常主要表现为出钞和入钞过程中发生异常，出现故障常见的原因通常包括三种：钞盒内无钞、钞盒没有推到位、保险箱门没有关闭或者钞票堵塞在传输通道中。

一些实施例中，在获得钞盒状态预测模型后，可以利用钞盒状态预测模型对目标ATM设备的钞盒状态进行预测分析，这样可以事先对还未故障的设备进行针对性的维修保养。一些实施场景中，基于钞盒状态预测模型，事先对还未故障的设备进行针对性的维修保养，不仅可以为维修人员节约在途时间(如可以节约30％-50％)，可以使设备的故障率下降(如可以下降10-20％左右)，还可以整体上使每天增加ATM设备日间运行时间，提升经济效益。

本说明书实施例中，通过事先对设备进行针对性的预测分析，可以大大降低维修人员在途时间，降低设备损坏后的维修成本和风险，从而提升客户的满意度。

当然，上述只是进行示例性说明，本说明书实施例不限于上述举例，所属领域技术人员在本申请技术精髓的启示下，还可能做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

从以上的描述中，可以看出，本申请实施例通过从数据湖和/或数据库中获取与ATM设备关联的指标数据，根据指标数据中出钞或入钞状态是否异常，为ATM设备分配类别标签，可以为后续构建钞盒状态预测模型对钞盒状态进行预测分析提供保障。通过对最初获取的与ATM设备关联的指标数据进行删除、合并等预处理，可以解决数据中存在噪声、数据缺失等问题，使后续获得的钞盒状态预测模型的准确度更高。通过构造新指标对指标数据进行扩展，可以生成能够更好体现业务特性、与类别标签关系紧密的新指标，从而能更好地解释模型，使后续获得的钞盒状态预测模型的准确度更高。通过利用随机森林算法对指标数据进行特征提取，获得ATM设备的特征数据，利用ATM设备的特征数据和类别标签构建钞盒状态预测模型，可以事先对钞盒状态进行预测分析，对还未故障的设备进行针对性的维修保养，相比现有技术中维修人员手工定时维护，可以大大降低维修人员在途时间，降低设备损坏后的维修成本和风险，提升客户的满意度。

本说明书中上述方法的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参加即可，每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。

基于上述所述一种钞盒状态预测模型的训练方法，本说明书一个或多个实施例还提供一种钞盒状态预测模型的训练装置。所述的装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思，本说明书实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似，因此本说明书实施例具体的装置的实施可以参见前述方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

具体地，图3是本说明书提供的一种钞盒状态预测模型的训练装置的一个实施例的模块结构示意图，如图3所示，本说明书提供的一种钞盒状态预测模型的训练装置可以包括：获取模块120，分配模块122，提取模块124，训练模块126。

获取模块120，可以用于获取与ATM设备关联的指标数据；

分配模块122，可以用于根据所述指标数据中出钞或入钞状态是否异常，为所述ATM设备分配类别标签；

提取模块124，可以用于利用随机森林算法对所述指标数据进行特征提取，获得所述ATM设备的特征数据；所述特征数据表示影响所述ATM设备钞盒状态的因素；

训练模块126，可以用于利用所述ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。

需要说明的，上述所述的装置根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本说明书还提供一种钞盒状态预测模型的训练设备的实施例，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：获取与ATM设备关联的指标数据；根据所述指标数据中出钞或入钞状态是否异常，为所述ATM设备分配类别标签；利用随机森林算法对所述指标数据进行特征提取，获得所述ATM设备的特征数据；所述特征数据表示影响所述ATM设备钞盒状态的因素；利用所述ATM设备的特征数据和类别标签，对预设分类模型进行训练，获得钞盒状态预测模型。

需要说明的，上述所述的设备根据方法或装置实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本说明书所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图4是本说明书提供的一种钞盒状态预测模型的训练服务器的一个实施例的硬件结构框图，该服务器可以是上述实施例中的钞盒状态预测模型的训练装置或钞盒状态预测模型的训练设备。如图4所示，服务器10可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器200、以及用于通信功能的传输模块300。本领域普通技术人员可以理解，图4所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器10还可包括比图4中所示更多或者更少的组件，例如还可以包括其他的处理硬件，如数据库或多级缓存、GPU，或者具有与图4所示不同的配置。

存储器200可用于存储应用软件的软件程序以及模块，如本说明书实施例中的钞盒状态预测模型的训练方法对应的程序指令/模块，处理器100通过运行存储在存储器200内的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器200可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器200可进一步包括相对于处理器100远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输模块300包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输模块300可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上，所述的存储介质可以计算机读取并执行，实现本说明书实施例所描述方案的效果。所述存储介质可以包括用于存储信息的物理装置，通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质可以包括：利用电能方式存储信息的装置如，各式存储器，如RAM、ROM等；利用磁能方式存储信息的装置如，硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘；利用光学方式存储信息的装置如，CD或DVD。当然，还有其他方式的可读存储介质，例如量子存储器、石墨烯存储器等等。

本说明书提供的上述钞盒状态预测模型的训练方法或装置实施例可以在计算机中由处理器执行相应的程序指令来实现，如使用windows操作系统的c++语言在PC端实现、linux系统实现，或其他例如使用android、iOS系统程序设计语言在智能终端实现，以及基于量子计算机的处理逻辑实现等。

需要说明的是说明书上述所述的装置、设备、系统根据相关方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照对应方法实施例的描述，在此不作一一赘述。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个时可以把部分模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。

本发明是参照根据本发明实施例的方法、装置、设备、系统的流程图和/或方框图来描述的。应理解可由计算机程序指令实现，可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

本领域技术人员应明白，本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。

以上所述仅为本说明书一个或多个实施例的实施例而已，并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说，本说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在权利要求范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：朱芳鹏;赵文怡;
专利申请人：中国工商银行股份有限公司;

上一篇：一种利用折叠结构进行挡雨的配电箱
下一篇：高光谱图像和激光雷达数据本征高光谱点云生成方法