掌桥专利:专业的专利平台
掌桥专利
首页

一种价值分类方法和相关装置

文献发布时间:2024-04-18 19:52:40



技术领域

本申请涉及数据处理领域,特别是涉及一种价值分类方法和相关装置。

背景技术

在金融领域中会涉及各类金融对象,例如用户、商户、物品、产品等。在金融行为下,基于行为需求,需要对金融对象在行为需求下进行准确的价值分类,以便依据价值分类更好的进行金融行为。

相关技术中主要通过训练网络模型来对金融对象进行价值分类。

然而,基于网络模型得到的价值分类依然难以准确的体现出金融对象的实际情况,导致金融行为的效率低下。

发明内容

为了解决上述技术问题,本申请提供了一种价值分类方法和相关装置,能够满足金融行为中对金融对象稳定性和持续性的考察需求,从而大大提高了金融行为的效率。

本申请实施例公开了如下技术方案:

一方面,本申请实施例提供了一种价值分类方法,所述方法包括:

确定金融行为中待识别的金融对象;

通过与所述金融行为对应的第i个版本的网络模型,确定所述金融对象的待定价值分类,i>1;

获取历史版本网络模型预先对所述金融对象确定的历史价值分类,所述历史版本网络模型为所述第i个版本的网络模型的前N个版本的网络模型,i-N≥1,N≥1;其中,所述历史版本网络模型中的第i-j个版本的网络模型是根据样本对象中重要特征维度训练得到,所述重要特征维度为从样本对象的初始特征维度中选择的,所述第i-j个版本的网络模型对应的所述历史价值分类,是根据所述金融对象的所述重要特征维度确定的,j∈N;

根据所述待定价值分类和所述历史价值分类的差异程度,确定所述金融对象针对所述金融行为的实际价值分类。

另一方面,本申请实施例提供了一种价值分类装置,所述装置包括第一确定单元、第二确定单元、获取单元和第三确定单元:

所述第一确定单元,用于确定金融行为中待识别的金融对象;

所述第二确定单元,用于通过与所述金融行为对应的第i个版本的网络模型,确定所述金融对象的待定价值分类,i>1;

所述获取单元,用于获取历史版本网络模型预先对所述金融对象确定的历史价值分类,所述历史版本网络模型为所述第i个版本的网络模型的前N个版本的网络模型,i-N≥1,N≥1;其中,所述历史版本网络模型中的第i-j个版本的网络模型是根据样本对象中重要特征维度训练得到,所述重要特征维度为从样本对象的初始特征维度中选择的,所述第i-j个版本的网络模型对应的所述历史价值分类,是根据所述金融对象的所述重要特征维度确定的,j∈N;

所述第三确定单元,用于根据所述待定价值分类和所述历史价值分类的差异程度,确定所述金融对象针对所述金融行为的实际价值分类。

在一种可能的实现方式中,所述第三确定单元还用于:

当所述差异程度超过差异阈值时,根据所述待定价值分类和所述历史价值分类确定所述金融对象针对所述金融行为的实际价值分类;

当所述差异程度未超过所述差异阈值时,将所述待定价值分类作为所述金融对象针对所述金融行为的实际价值分类。

在一种可能的实现方式中,所述装置还包括识别单元,所述识别单元,用于在所述第i个版本的网络模型的上线使用期间,根据初始特征维度和用于训练得到所述第i个版本的网络模型的重要特征维度,对所述第i个版本的网络模型进行模型质量的稳定性识别,得到质量稳定性结果。

在一种可能的实现方式中,所述第三确定单元还用于根据所述历史版本网络模型和所述第i个版本的网络模型分别对应的质量稳定性结果,确定所述待定价值分类和所述历史价值分类的差异程度。

在一种可能的实现方式中,所述获取单元还用于:

获取金融平台中与所述金融对象具有相同金融对象类型的待处理对象,所述待处理对象中包括所述金融对象;

在所述历史版本网络模型上线使用前,根据所述历史版本网络模型,通过离线方式确定所述待处理对象分别对应的历史价值分类。

在一种可能的实现方式中,针对所述第i个版本的网络模型,所述装置还包括训练单元,所述训练单元用于:

获取用于训练得到所述第i个版本的网络模型的目标样本对象;

通过所述目标样本对象的初始特征维度和对应的目标算子,确定所述初始特征维度分别对应的特征质量参数;

获取从所述初始特征维度中基于所述特征质量参数选择的重要特征维度;

根据所述目标样本对象的重要特征维度,训练得到所述第i个版本的网络模型。

在一种可能的实现方式中,所述训练单元还用于:

根据所述金融行为对应的金融对象类型,从初始样本对象中确定符合所述金融对象类型的所述目标样本对象;

根据对象类型和特征维度间的第一关联关系,确定与所述金融对象类型具有关联关系的初始特征维度。

在一种可能的实现方式中,所述训练单元还用于:

根据特征维度和算子间的第二关联关系,确定所述目标样本对象的初始特征维度分别对应的初始算子;

从所述初始算子中确定所述目标样本对象的初始特征维度分别对应的目标算子。

在一种可能的实现方式中,所述训练单元还用于:

获取所述目标样本对象在所述初始特征维度的初始样本特征;

通过所述目标算子对所述初始样本特征进行特征预处理,得到用于训练得到所述第i个版本的网络模型的样本特征;

根据所述样初始特征维度分别对应的样本特征,确定所述初始特征维度分别对应的特征质量参数。

在一种可能的实现方式中,所述训练单元还用于:

根据针对多个待定模型算法的选择操作,从所述多个待定模型算法中确定目标模型算法;

获取针对所述目标模型算法的算法参数;

根据所述目标样本对象的重要特征维度,通过所述目标模型算法和所述算法参数训练得到所述第i个版本的网络模型。

在一种可能的实现方式中,所述训练单元还用于当所述第i-1个版本的网络模型达到预设的模型更新周期时,在所述模型更新周期内确定所述目标样本对象。

又一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行以上方面所述的方法。

又一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行以上方面所述的方法。

又一方面,本申请实施例提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行以上方面所述的方法。

由上述技术方案可以看出,当金融行为涉及金融对象时,通过与金融行为对应的第i个版本的网络模型,确定金融对象的待定价值分类,并获取该网络模型的前N个版本的历史版本网络模型预先对所述金融对象确定的历史价值分类。该历史价值分类是通过金融对象的重要特征维度确定的,由于该重要特征维度不仅是用于训练得到历史版本网络模型的特征维度,而且相对于历史版本网络模型被使用时期,重要特征维度比初始特征维度能够更有效的体现金融对象的实际情况。从而基于历史价值分类能够准确的体现出金融对象在历史版本网络模型被使用时的价值分类。通过待定价值分类和历史价值分类的差异程度,直观的体现出金融对象在各版本网络模型使用时期内的变化趋势和波动情况,相对于相关技术中仅依据待定价值分类确定金融对象的实际情况,该差异程度可以更为准确的标识金融对象,所体现出的变化趋势和波动情况能够满足金融行为中对金融对象稳定性和持续性的考察需求,从而大大提高了金融行为的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种价值分类场景的示意图;

图2为本申请实施例提供的一种价值分类方法的方法流程图;

图3为本申请实施例提供的一种初始特征维度和特征质量参数的展示示意图;

图4为本申请实施例提供的一种维度方向和特征维度的展示示意图;

图5为本申请实施例提供的一种针对初始特征维度选择目标算子的展示示意图;

图6为本申请实施例提供的一种特征预处理的流程示意图;

图7为本申请实施例提供的一种特征拼接示意图;

图8为本申请实施例提供的一种模型训练参数的设置示意图;

图9为本申请实施例提供的一种价值分类装置的装置结构图;

图10为本申请实施例提供的一种终端设备的结构图;

图11为本申请实施例提供的一种服务器的结构图。

具体实施方式

下面结合附图,对本申请的实施例进行描述。

金融领域中的金融行为的成功效率与对所涉及金融对象的价值分类准确性有着直接关系,然而,相关技术中通过网络模型得到的价值分类难以体现金融对象的实际情况,导致金融行为的效率低下。

为此,本申请实施例提供了一种价值分类方法和相关装置,能够满足金融行为中对金融对象稳定性和持续性的考察需求,从而大大提高了金融行为的效率。

本申请实施例所提供的价值分类方法可以通过计算机设备实施,该计算机设备可以是终端设备或服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。

本申请实施例提供的价值分类方法可以应用于人工智能,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。

本申请涉及了机器学习方向,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

例如本申请实施例在对网络模型进行自动化建模时,通过机器学习实现模型训练、预测应用等。

可以理解的是,在本申请的具体实施方式中,涉及到用户信息等特征维度下相关的数据,当本申请以上实施例运用到具体产品或技术中时,每一项均需要单独获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

图1为本申请实施例提供的一种价值分类场景的示意图,以服务器100作为前述计算机设备进行说明。

当金融行为涉及金融对象时,例如贷款行为中涉及的需要贷款的用户,终端设备200可向服务器100发送该贷款行为。

服务器100针对贷款行为的网络模型,目前使用的是第8个版本的网络模型(即i=8),对应可用的历史版本网络模型有第5个至第7个版本的网络模型(即N=3)。上述各个版本的网络模型均属于针对贷款行为这一金融行为的、能够为金融对象进行价值分类的网络模型。这些网络模型可以是同一类型的网络模型,也可以不同类型的网络模型,其版本上的差异用于区分训练得到网络模型的时间。在这些网络模型为同一类型的网络模型时,可以是依次在上一个版本的基础上迭代训练得到的,例如第8个版本的网络模型是基于第7个版本的网络模型训练得到的,也可以是分别训练得到的。

服务器100通过第8个版本的网络模型,确定用户的待定价值分类,并获取该网络模型的第5个至第7个版本的历史版本网络模型预先对该用户确定的历史价值分类。价值分类可用于标识用户针对贷款行为的价值大小,例如可以是评分,不同的评分针对不同的可贷款额度。待定价值分类和历史价值分类均属于不同版本的网络模型对该用户做出的价值分类。

该历史价值分类是通过用户的重要特征维度确定的,由于该重要特征维度不仅是用于训练得到历史版本网络模型的特征维度,而且相对于历史版本网络模型被使用时期,重要特征维度比初始特征维度能够更有效的体现用户的实际情况。

从而基于历史价值分类能够准确的体现出作为金融对象的用户在历史版本网络模型被使用时的价值分类。通过待定价值分类和历史价值分类的差异程度,直观的体现出该用户在各版本网络模型使用时期内的变化趋势和波动情况,相对于相关技术中仅依据待定价值分类确定金融对象的实际情况,该差异程度可以更为准确的标识用户,所体现出的变化趋势和波动情况能够满足金融行为中对金融对象稳定性和持续性的考察需求,从而大大提高了服务器100处理金融行为的效率,例如提升本次用户的贷款行为的准确率和成功率。

服务器100可向终端设备200返回确定出的实际价值分类,或者返回基于实际价值分类确定出的用户可贷款额度等。

图2为本申请实施例提供的一种价值分类方法的方法流程图,以服务器作为前述计算机设备进行说明,所述方法包括:

S201:确定金融行为中待识别的金融对象。

金融行为可以为金融邻域中的各类行为,例如贷款行为、按期还款行为、逾期后指示还款行为等。

针对不同的金融行为,在建模过程中,需要构建多种网络模型如A卡模型(申请评分卡,对授信阶段提交的资料赋值的模型或规则),B卡模型(行为评分卡,对贷后可以收集到的用户信息进行评分模型或规则),C卡模型(还款评分卡,对已逾期用户未来还款能力做判断评分的模型或规则)等,通过网络模型的来提高支付金融业务的精细化运营和增长,如金融产品的用户留存,用户的信用分数评估等。

金融对象可以为金融行为中所涉及的对象,如用户、商户、物品、产品等。例如当金融行为是贷款行为时,金融对象可以为用户、商户,当金融行为是理财行为时,金融对象可以为理财产品。

S202:通过与所述金融行为对应的第i个版本的网络模型,确定所述金融对象的待定价值分类。

不同类型的金融行为可以对应不同的网络模型。本步骤确定的网络模型与S201中的金融行为具有对应关系,用于确定涉及该类型金融行为中金融用户的。

本实施例所涉及各个版本的网络模型(如第i个版本的网络模型和历史版本网络模型)均属于针对该金融行为的、能够为金融对象进行价值分类的网络模型。这些网络模型可以是同一类型的网络模型,也可以不同类型的网络模型,其版本上的差异用于区分训练得到网络模型的时间。在这些网络模型为同一类型的网络模型时,这些网络模型可以是分别独立训练得到的,也可以是依次在上一个版本的网络模型基础上迭代训练得到的,例如第i个版本的网络模型是基于第i-1个版本的网络模型训练得到的。

本步骤确定的是第i个版本的网络模型,即该网络模型当前被使用的版本。其中,i为大于1的整数,也就是说,该网络模型具有至少一个历史版本网络模型,例如第i-1个版本的网络模型。

服务器通过第i个版本的网络模型,确定所述金融对象的待定价值分类,该待定价值分类属于标识该金融对象的一个价值分类,该价值分类可用于标识金融对象针对金融行为的价值大小,可以通过评分等形式进行量化表达,在百分制下可以是50分、84分等。价值分类越好,证明该金融对象相对于金融行为越具有价值,成功进行该金融行为的可能性就越高,例如针对贷款行为,当作为金融对象的用户的价值分类所标识的价值越高,可成功贷款的可能性就越大,从而可以基于准确的价值分类提高金融行为的效率。

为了得到金融对象准确的价值分类,本申请在对金融对象进行价值分类时,不仅要依据待定价值分类,还需要参考金融对象的历史价值分类。

S203:获取历史版本网络模型预先对所述金融对象确定的历史价值分类,所述历史版本网络模型为所述第i个版本的网络模型的前N个版本的网络模型。

历史版本网络模型可以预先对金融对象进行价值分类的确定,以得到历史价值分类,

这里所述的历史版本网络模型有至少一个,且最小版本为第1个版本的网络模型,即i-N≥1,N≥1;

其中,所述历史版本网络模型中的第i-j个版本的网络模型是根据样本对象中重要特征维度训练得到,所述重要特征维度为从样本对象的初始特征维度中选择的,所述第i-j个版本的网络模型对应的所述历史价值分类,是根据所述金融对象的所述重要特征维度确定的,j∈N。

待定价值分类和历史价值分类均属于不同版本的网络模型对该金融对象做出的价值分类。

该历史价值分类是通过用户的重要特征维度确定的,由于该重要特征维度是用于训练得到历史版本网络模型的特征维度,而不同版本的网络模型所对应的重要特征维度可能有所不同,故通过历史版本网络模型确定出的历史价值分类更为准确。

而且相对于历史版本网络模型的被使用时期,重要特征维度比初始特征维度能够更有效的体现用户的实际情况。

在一种可能的实现方式中,本申请数量提供了一种通过历史版本网络模型预先确定历史价值分类的方式,所述方法还包括:

S11:获取金融平台中与所述金融对象具有相同金融对象类型的待处理对象,所述待处理对象中包括所述金融对象。

S12:在所述历史版本网络模型上线使用前,根据所述历史版本网络模型,通过离线方式确定所述待处理对象分别对应的历史价值分类。

也就是说,在历史版本网络模型被训练好后,但尚未上线使用之前,可以通过离线的方式将金融平台中所有与金融对象具有相同类型的待处理对象进行价值分类预测,并将预测得到的历史价值分类进行存储,例如存储在分布式文件系统(Hadoop DistributedFile System,HDFS)中,以便后续在S203中进行提取。

这种全量对象的离线预测,由于是离线进行的,故并不会影响网络模型实际上线后的处理效率,而且存储的历史价值分类可以有效的体现出当时金融对象针对金融行为的实际价值大小,能够在后续为待定价值分类的评价做出准确参考。而且,在历史版本网络模型上线后,还可以在早期为价值分类的需求直接提供离线预测的历史价值分类,有效的在上线早期为网络模型减轻处理负担,降低可能的高并发所带来的影响。

S204:根据所述待定价值分类和所述历史价值分类的差异程度,确定所述金融对象针对所述金融行为的实际价值分类。

金融行为更需要考察金融对象的稳定性和持续性,大幅波动造成的价值分类突然变好或变坏对于金融行为来说都是负面的,容易导致出现金融风险。故仅根据待定价值分类仅能体现出金融对象当前针对金融行为的价值,无法提供该金融对象的历史价值变化。

而如前所述,历史价值分类可以有效的体现出当时金融对象针对金融行为的实际价值大小,故通过待定价值分类和历史价值分类的差异程度,直观的体现出金融对象在各版本网络模型使用时期内的变化趋势和波动情况,从而更为全面的标识金融对象针对金融行为的价值,所体现出的变化趋势和波动情况能够满足金融行为中对金融对象稳定性和持续性的考察需求。

确定出的实际价值分类可以准确的体现出金融对象针对金融行为的价值大小,由此服务器可以基于该实际价值分类有效进行金融行为的处理,降低出现金融风险的可能。

在一种可能的实现方式中,S204包括:

当所述差异程度超过差异阈值时,根据所述待定价值分类和所述历史价值分类确定所述金融对象针对所述金融行为的实际价值分类;

当所述差异程度未超过所述差异阈值时,将所述待定价值分类作为所述金融对象针对所述金融行为的实际价值分类。

也就是说,当差异程度较大时,证明金融对象这一段时间针对金融行为的价值出现了较大波动,不具有稳定性和持续性。当前的待定价值分类并不能真实体现出该金融对象的实际价值分类,需要结合历史价值分类和待定价值分类一起,综合历史和当前的价值分类才能确定出金融对象的实际价值分类,例如通过求均值的方式等,从而避免了潜在的金融风险。

当差异程度较小时,证明金融对象这一段时间针对金融行为的价值较为稳定,具有稳定性和持续性。当前的待定价值分类已经可以较为准确的衡量金融对象的实际价值,可将待定价值分类直接作为实际价值分类,提高了金融行为的效率。

由此可见,当金融行为涉及金融对象时,通过与金融行为对应的第i个版本的网络模型,确定金融对象的待定价值分类,并获取该网络模型的前N个版本的历史版本网络模型预先对所述金融对象确定的历史价值分类。该历史价值分类是通过金融对象的重要特征维度确定的,由于该重要特征维度不仅是用于训练得到历史版本网络模型的特征维度,而且相对于历史版本网络模型被使用时期,重要特征维度比初始特征维度能够更有效的体现金融对象的实际情况。从而基于历史价值分类能够准确的体现出金融对象在历史版本网络模型被使用时的价值分类。通过待定价值分类和历史价值分类的差异程度,直观的体现出金融对象在各版本网络模型使用时期内的变化趋势和波动情况,相对于相关技术中仅依据待定价值分类确定金融对象的实际情况,该差异程度可以更为准确的标识金融对象,所体现出的变化趋势和波动情况能够满足金融行为中对金融对象稳定性和持续性的考察需求,从而大大提高了金融行为的效率。

需要注意的是,相关技术中网络模型上线使用后,一般缺少质量管理,当网络模型的应用环境出现变化,或者金融对象、金融行为出现调整后,网络模型可能不再适用价值分类,或者对价值分类的预测准确性出现降低。为了能够及时发现这类问题,本申请实施例提供了一种对网络模型进行线上质量管理的方式,以下基于第i个版本的网络模型为例进行说明,该方式还可以在任意历史版本网络模型上线时对该历史版本网络模型实施。

在一种可能的实现方式中,所述方法还包括:

在所述第i个版本的网络模型的上线使用期间,根据初始特征维度和用于训练得到所述第i个版本的网络模型的重要特征维度,对所述第i个版本的网络模型进行模型质量的稳定性识别,得到质量稳定性结果。

也就是说,通过训练网络模型的源头:初始特征维度和重要特征维度来作为评估模型质量的依据,从而从根源上分析网络模型的质量问题,提高模型质量的确定准确性。从而模型维护者可以基于模型质量对模型参数进行相应的调整,降低模型应用环境的变化对价值分类质量的影响。同时,还可以将难以通过模型参数调整提高模型质量的网络模型进行淘汰,及时淘汰不合格版本的网络模型,提高网络模型整体版本的稳定性和可信度。

当可以为各个版本的网络模型进行模型质量评价后,在确定前述差异程度时,可以结合模型质量进行更为准确的差异程度计算。

故在一种可能的实现方式中,所述方法还包括:

根据所述历史版本网络模型和所述第i个版本的网络模型分别对应的质量稳定性结果,确定所述待定价值分类和所述历史价值分类的差异程度。

也就是说,当某一个版本的网络模型的质量稳定性结果示出模型质量不佳时,其输出的价值分类(待定价值分类或历史价值分类)在确定差异程度时所造成的影响将会被降低,当某一个版本的网络模型的质量稳定性结果示出模型质量好时,其输出的价值分类(待定价值分类或历史价值分类)在确定差异程度时所造成的影响将会被提升。使得最终确定出的差异程度能够最大可能的贴合金融对象的实际情况,从而提升S204中基于差异程度确定实际价值分类的准确性和可信度。

在相关技术的建模过程中,网络模型的生成需要算法工程师在大量的数据源中选择合适的特征,样本,接着对特征和样本进行拼接,通过采用合适的算法和算子构建评分较好的网络模型,整个网络模型的生产过程需要维护好样本,特征,算子,算法的关系,生产的模型需要进行多维度的对比才能构建一个完整的模型。但是,上述特征,算子,样本,算法的维护是人工维护,也就是说网络模型的构建流程复杂需要大量人工干预,导致复刻一个一样的模型耗费较大。而且模型上线后无法回溯,网络模型的构建流程以及无法完整的对模型进行复刻,不利于模型质量完整的回溯,门槛及难度高,严重影响业务的发展。而且,金融领域所涉及的金融行为种类繁多,需要基于金融行为的需求进行大量的网络模型构建,且还需要频繁的版本迭代。

为此,在本申请实施例中,提供了一种自动化建模的方式,以快速应对不同价值分类需求进行网络模型的构建。接下来以第i个版本的网络模型为例对自动化建模进行说明。所述方法还包括:

S21:获取用于训练得到所述第i个版本的网络模型的目标样本对象。

需要注意的是,本申请实施例提供的网络模型可以是周期性训练的,每一个周期会产生一个新的版本号来标识该周期训练得到的网络模型。故该目标样本对象可以是在第i个版本的网络模型所对应周期下采集得到的。

故在一种可能的实现方式中,本步骤包括:当所述第i-1个版本的网络模型达到预设的模型更新周期时,在所述模型更新周期内确定所述目标样本对象。

通过上述获取方式,每一个版本的网络模型都是通过最新的目标样本对象训练得到,例如模型更新周期为一个月,第i-1个版本的网络模型是根据五月份的目标样对象训练得到的,并在整个六月上线使用,而第i个版本的网络模型是根据六月份的目标样对象训练得到的,并在整个七月上线使用。由此可以使得每一个版本的网络模型在上线后都能够更为敏锐的发现金融场景的行为、市场变化,可提供准确的价值分类预测结果,大大提高了模型精度。

S22:通过所述目标样本对象的初始特征维度和对应的目标算子,确定所述初始特征维度分别对应的特征质量参数。

S23:获取从所述初始特征维度中基于所述特征质量参数选择的重要特征维度。

S24:根据所述目标样本对象的重要特征维度,训练得到所述第i个版本的网络模型。

通过S21和S22可以得到目标样本各个初始特征维度在对应目标算子下的特征质量参数,该特征质量参数可以标识各个初始特征维度在目标算子的计算方式下,初始特征维度下的样本特征能够为第i个版本的网络模型的训练提供的影响方向和程度,当一个初始特征维度的特征质量参数较好时,则通过这个初始特征维度下的样本特征训练得到的第i个版本的网络模型的质量可能较好,当一个初始特征维度的特征质量参数较低时,则通过这个初始特征维度下的样本特征训练得到的第i个版本的网络模型的质量可能较低。

由于模型训练不需要太多的特征维度,故当基于目标算子确定出各个初始特征维度分别对应的特征质量参数后,可从中选择一部分进行实际的模型训练。S23中获取的重要特征维度可以是通过特征质量参数自动选取的,例如选择最高的topN个,也可以是通过开发者自行选择的,例如将初始特征维度和分别对应的特征质量参数通过列表进行展示,例如图3所示,在终端设备200中显示了大量初始特征维度以及对应的特征质量参数,其中,初始特征参数对应的目标算子通过“&”隔开,特征质量参数示例性的通过IV值表示。开发者基于本次训练需求从列表中进行针对性的选择,得到所需的重要特征维度。

通过对初始特征维度进行挑选,选择质量好的特征维度进行模型训练,该步骤也可称为特征精选。通过特征精选可以过滤掉低质量特征维度,使基于S24训练的网络模型效果更好。

在一种可能的实现方式中,S21中的目标样本对象通过如下方式获取:

根据所述金融行为对应的金融对象类型,从初始样本对象中确定符合所述金融对象类型的所述目标样本对象。

本步骤中获取的目标样本对象可以为金融平台中全部或分别具有金融对象类型的金融对象。由于本申请实施例提供的网络模型是针对某一种类型的金融对象进行的价值分类预测,故在针对一类金融对象进行建模时,也需要获取金融平台中的这类金融对象作为建模的样本对象。这种基于单个类型的金融对象进行建模的方式可以记为基于单主键(key)的金融建模。

金融对象的金融对象类型可以包括用户类型、商户类型、物品类型等,若以主键(key)的方式进行标识,可以为用户主键,商户主键,物品主键等。

本申请实施例通过金融对象类型对进行样本对象的配置,以便系统对样本对象进行统一管理,方便回溯样本对象的生产及保存的全过程。而且通过主键的方式进行样本对象的筛选可以有效的提高自动化建模程度,加快建模效率。

在上述获取目标样本对象的基础上,所述方法还包括:根据对象类型和特征维度间的第一关联关系,确定与所述金融对象类型具有关联关系的初始特征维度。

在构建网络模型时,需要选择大量的特征维度作为训练依据,一个金融对象可能涉及的特征维度非常大,相关技术中多为开发者自行总结,导致新开发者在进行金融建模时选择特征维度的成本很高,且耗时。

为此,本申请通过系统将金融对象类型和初始特征维度进行关联化存储,得到对象类型和特征维度间的第一关联关系,在需要基于某一个主键进行金融建模时,开发者可以直接基于该第一关联关系获取金融对象类型对应的初始特征维度,进一步提高了自动化建模的效率。

如图4所示,其通过终端设备200示出了金融对象类型为用户时,对应的特征维度,该特征维度被划分在不同的维度方向甚至维度子方向中,例如维度方向可以为基础属性、用户爱好等,维度子方向可以是娱乐偏好、餐饮偏好等。右侧列出了在选中方向为餐饮偏好时具体涉及的特征维度,例如特征维度1-3,开发者可以直接基于方向选择本次建模所需的初始特征维度,例如选择特征维度2为本次训练所需的初始特征维度。

而且,开发者后续复刻模型或对比模型效果时可快速获取该网络模型的特征维度配置信息,有效管理模型要素中的特征。

在金融建模的过程中,除了需要选择初始特征维度,还需要选择在训练过程中通过何种计算方式来对这些特征维度的样本特征进行处理,相关技术的配置过程中开发者需要维护算子和特征维度间多对多的关系,维护使用较为复杂,且非常依赖个人经验。

故为了进一步提高自动化建模的自动化程度,在一种可能的实现方式中,所述方法还包括:

根据特征维度和算子间的第二关联关系,确定所述目标样本对象的初始特征维度分别对应的初始算子;

从所述初始算子中确定所述目标样本对象的初始特征维度分别对应的目标算子。

其中,算子可以包括各种对特征维度中样本特征的计算方式,例如平均值,时间旧值,标准差等,传统的配置过程中用户需要维护算子和特征多对多的关系,不仅耗时还需要依赖个人经验。

在本申请实施例中,通过将常用算子针对各个初始特征维度进行枚举,建立特征维度和算子间的第二关联关系,以此标识初始特征维度和算子间的关系。当选择完待用于本次金融建模的初始特征维度后,可以根据第二关联关系展示初始特征维度分别对应的初始算子,开发者可以在系统中勾选需要配置的算子或者直接使用系统推荐的默认算子。通过特征维度和算子的关联关系配置可方便维护网络模型的要素,方便模型质量管理。例如图5所示,其通过终端设备200示出了针对初始特征维度3,对应有哪些算子可供选择。其中包括了衍生算子和工程算子,图5示出了选择衍生算子1的情况,开发者可以基于选择的算子输入对应的算子参数。

在一种可能的实现方式中,S22:通过所述目标样本对象的初始特征维度和对应的目标算子,确定所述初始特征维度分别对应的特征质量参数,包括:

S221:获取所述目标样本对象在所述初始特征维度的初始样本特征;

S222:通过所述目标算子对所述初始样本特征进行特征预处理,得到用于训练得到所述第i个版本的网络模型的样本特征;

S223:根据所述样初始特征维度分别对应的样本特征,确定所述初始特征维度分别对应的特征质量参数。

由此,针对基于单key的自动化金融建模,在配置完样本对象,特征维度和算子后,系统可以自动进行特征的预处理,特征预处理可以包括特征拼接、特征衍生聚合、特征工程转换等,预处理的结果为样本特征,可用于模型训练,通过自动化的样本特征预处理可以加快自动建模的效率。而且确定出的样本特征还可以用于进行特征质量参数的确定,以此为使用那些初始特征维度作为重要特征维度做出了判断依据。

如图6所示,特征预处理时,先进行特征拼接,然后特征衍生聚合,然后进行特征工程转换。特征工程转换后的样本特征可以用于特征分析,得到初始特征维度分别对应的特征质量参数。其中:

特征拼接:系统自动进行特征维度和样本表的拼接。拼接结果将样本表与每个标识特征维度的特征表关联上,拼接结果可存储至HDFS。

可以如图7所示,样本表用于标识获取的目标样本对象,特征表1-K用于K个不同的初始特征维度,通过将样本表分别与不同的特征表进行拼接,拼接结果可实现对目标样本对象提取初始特征维度下的初始样本特征的效果。

特征衍生聚合:通过目标样本对象配置中指定的衍生周期,读取对应的特征日期分区数即初始样本特征进行聚合计算。聚合过程主要通过初始样本特征所在初始特征维度关联的算子进行处理,如常见的求和,最大值,平均值等几十种衍生算子。

特征工程转换:工程转换主要也由特征配置的算子进行处理,如woe(设置分箱方式),max_abs(数据除以绝对值最大值进行归一化处理)等。特征工程转换的结果可以为前述的样本特征。

特征分析:对特征工程的结果进行群体稳定性指标(Population StabilityIndex,PSI),信息值(Information Value,IV),均值(avg)等一系列的统计分析,分析结果可作为样本特征的初始特征维度的特征质量参数。

在进行网络模型的训练前,还需要确定网络模型所使用的模型算法和算法参数,在一种可能的实现方式中,所述方法还包括:

根据针对多个待定模型算法的选择操作,从所述多个待定模型算法中确定目标模型算法;

获取针对所述目标模型算法的算法参数。

传统的模型训练中需要进行特征向量生成、超参搜索、模型训练、模型效果验证等四个步骤。本申请通过对样本,特征,算子,算法等要素的关系存储后,通过自动化的配置,组装成完整的自动化训练流程pipeline。

开发者在自动化化系统中只需配置算法类型和算法参数,即可对选择的入模特征(即前述样本特征)进行模型训练。如图8所示,开发者在从系统提供的多个待定模型算法中选择了目标模型算法(算法类型为xgboost,算法名称为xgb158)后,可以通过终端设备200展示该目标模型算法需要配置的算法参数,开发者输入所需的算法参数完成对算法参数的配置,例如将算法参数1的值设置为1,算法参数2的值设置为3。由此进一步的提高了自动化建模程度。

相应的,在确定好目标模型算法和对应的算法参数后,S24:根据所述目标样本对象的重要特征维度,训练得到所述第i个版本的网络模型,包括:

根据所述目标样本对象的重要特征维度,通过所述目标模型算法和所述算法参数训练得到所述第i个版本的网络模型。

开发者在自动化化系统在只需配置算法类型和算法参数,即可对选择的入模特征进行训练。模型训练完毕后即可查看模型的效果质量,通过常见的算法指标ks,auc等判断模型质量。可以保存生产网络模型的各种要素,同时具备完整自动化等建模能力后,开发者可以轻松的不对不同算法和参数对模型最终对质量影响,达到快速选择高质量模型的要求。

由此可见,本申请实现了自动化的构建单key金融建模流程,并对生产模型的要素:样本对象,特征维度,算子,算法等进行了有效的关联管理,方便模型的复刻与质量的回溯。传统建模流程主要由用户手动管理模型生产要素,模型的训练与推理需要由经验的算法工程师进行处理,整个流程耗时较久,门槛较高。本申请将网络模型的生产流程进行了加工,形成了完整的构建模型pipeline。由样本对象选择,特征维度选择,特征预处理,特征精选,模型训练,预测应用以及质量管理和上线部署形成了体系的pipeline建模流程。开发者在该流程中只需选择样本对象,特征维度及算子和算法即可完成建模,同时流程具有质量管理保证模型的高质量。整个系统在实现建模自动化的基础上,提高了模型构建的效率和质量,大大释放了人员效率,对金融业务的发展也有较高的提升。

在前述实施例的基础上,本申请实施例还提供了一种价值分类装置的装置结构图,如图9所示,所述价值分类装置900包括第一确定单元901、第二确定单元902、获取单元903和第三确定单元904:

所述第一确定单元901,用于确定金融行为中待识别的金融对象;

所述第二确定单元902,用于通过与所述金融行为对应的第i个版本的网络模型,确定所述金融对象的待定价值分类,i>1;

所述获取单元903,用于获取历史版本网络模型预先对所述金融对象确定的历史价值分类,所述历史版本网络模型为所述第i个版本的网络模型的前N个版本的网络模型,i-N≥1,N≥1;其中,所述历史版本网络模型中的第i-j个版本的网络模型是根据样本对象中重要特征维度训练得到,所述重要特征维度为从样本对象的初始特征维度中选择的,所述第i-j个版本的网络模型对应的所述历史价值分类,是根据所述金融对象的所述重要特征维度确定的,j∈N;

所述第三确定单元904,用于根据所述待定价值分类和所述历史价值分类的差异程度,确定所述金融对象针对所述金融行为的实际价值分类。

在一种可能的实现方式中,所述第三确定单元还用于:

当所述差异程度超过差异阈值时,根据所述待定价值分类和所述历史价值分类确定所述金融对象针对所述金融行为的实际价值分类;

当所述差异程度未超过所述差异阈值时,将所述待定价值分类作为所述金融对象针对所述金融行为的实际价值分类。

在一种可能的实现方式中,所述装置还包括识别单元,所述识别单元,用于在所述第i个版本的网络模型的上线使用期间,根据初始特征维度和用于训练得到所述第i个版本的网络模型的重要特征维度,对所述第i个版本的网络模型进行模型质量的稳定性识别,得到质量稳定性结果。

在一种可能的实现方式中,所述第三确定单元还用于根据所述历史版本网络模型和所述第i个版本的网络模型分别对应的质量稳定性结果,确定所述待定价值分类和所述历史价值分类的差异程度。

在一种可能的实现方式中,所述获取单元还用于:

获取金融平台中与所述金融对象具有相同金融对象类型的待处理对象,所述待处理对象中包括所述金融对象;

在所述历史版本网络模型上线使用前,根据所述历史版本网络模型,通过离线方式确定所述待处理对象分别对应的历史价值分类。

在一种可能的实现方式中,针对所述第i个版本的网络模型,所述装置还包括训练单元,所述训练单元用于:

获取用于训练得到所述第i个版本的网络模型的目标样本对象;

通过所述目标样本对象的初始特征维度和对应的目标算子,确定所述初始特征维度分别对应的特征质量参数;

获取从所述初始特征维度中基于所述特征质量参数选择的重要特征维度;

根据所述目标样本对象的重要特征维度,训练得到所述第i个版本的网络模型。

在一种可能的实现方式中,所述训练单元还用于:

根据所述金融行为对应的金融对象类型,从初始样本对象中确定符合所述金融对象类型的所述目标样本对象;

根据对象类型和特征维度间的第一关联关系,确定与所述金融对象类型具有关联关系的初始特征维度。

在一种可能的实现方式中,所述训练单元还用于:

根据特征维度和算子间的第二关联关系,确定所述目标样本对象的初始特征维度分别对应的初始算子;

从所述初始算子中确定所述目标样本对象的初始特征维度分别对应的目标算子。

在一种可能的实现方式中,所述训练单元还用于:

获取所述目标样本对象在所述初始特征维度的初始样本特征;

通过所述目标算子对所述初始样本特征进行特征预处理,得到用于训练得到所述第i个版本的网络模型的样本特征;

根据所述样初始特征维度分别对应的样本特征,确定所述初始特征维度分别对应的特征质量参数。

在一种可能的实现方式中,所述训练单元还用于:

根据针对多个待定模型算法的选择操作,从所述多个待定模型算法中确定目标模型算法;

获取针对所述目标模型算法的算法参数;

根据所述目标样本对象的重要特征维度,通过所述目标模型算法和所述算法参数训练得到所述第i个版本的网络模型。

在一种可能的实现方式中,所述训练单元还用于当所述第i-1个版本的网络模型达到预设的模型更新周期时,在所述模型更新周期内确定所述目标样本对象。

由此可见,当金融行为涉及金融对象时,通过与金融行为对应的第i个版本的网络模型,确定金融对象的待定价值分类,并获取该网络模型的前N个版本的历史版本网络模型预先对所述金融对象确定的历史价值分类。该历史价值分类是通过金融对象的重要特征维度确定的,由于该重要特征维度不仅是用于训练得到历史版本网络模型的特征维度,而且相对于历史版本网络模型被使用时期,重要特征维度比初始特征维度能够更有效的体现金融对象的实际情况。从而基于历史价值分类能够准确的体现出金融对象在历史版本网络模型被使用时的价值分类。通过待定价值分类和历史价值分类的差异程度,直观的体现出金融对象在各版本网络模型使用时期内的变化趋势和波动情况,相对于相关技术中仅依据待定价值分类确定金融对象的实际情况,该差异程度可以更为准确的标识金融对象,所体现出的变化趋势和波动情况能够满足金融行为中对金融对象稳定性和持续性的考察需求,从而大大提高了金融行为的效率。

本申请实施例还提供了一种计算机设备,该计算机设备为前述介绍的计算机设备,可以包括终端设备或服务器,前述的价值分类装置可以配置在该计算机设备中。下面结合附图对该计算机设备进行介绍。

若该计算机设备为终端设备,请参见图10所示,本申请实施例提供了一种终端设备,以终端设备为手机为例:

图10示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图10,手机包括:射频(Radio Frequency,简称RF)电路1410、存储器1420、输入单元1430、显示单元1440、传感器1450、音频电路1460、无线保真(简称WiFi)模块1470、处理器1480、以及电源1490等部件。本领域技术人员可以理解,图10中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图10对手机的各个构成部件进行具体的介绍:

RF电路1410可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1480处理;另外,将设计上行的数据发送给基站。

存储器1420可用于存储软件程序以及模块,处理器1480通过运行存储在存储器1420的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1430可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1430可包括触控面板1431以及其他输入设备1432。

显示单元1440可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1440可包括显示面板1441。

手机还可包括至少一种传感器1450,比如光传感器、运动传感器以及其他传感器。

音频电路1460、扬声器1461,传声器1462可提供用户与手机之间的音频接口。

WiFi属于短距离无线传输技术,手机通过WiFi模块1470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。

处理器1480是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1420内的软件程序和/或模块,以及调用存储在存储器1420内的数据,执行手机的各种功能和处理数据。

手机还包括给各个部件供电的电源1490(比如电池)。

在本实施例中,该终端设备所包括的处理器1480还具有以下功能:

确定金融行为中待识别的金融对象;

通过与所述金融行为对应的第i个版本的网络模型,确定所述金融对象的待定价值分类,i>1;

获取历史版本网络模型预先对所述金融对象确定的历史价值分类,所述历史版本网络模型为所述第i个版本的网络模型的前N个版本的网络模型,i-N≥1,N≥1;其中,所述历史版本网络模型中的第i-j个版本的网络模型是根据样本对象中重要特征维度训练得到,所述重要特征维度为从样本对象的初始特征维度中选择的,所述第i-j个版本的网络模型对应的所述历史价值分类,是根据所述金融对象的所述重要特征维度确定的,j∈N;

根据所述待定价值分类和所述历史价值分类的差异程度,确定所述金融对象针对所述金融行为的实际价值分类。

若计算机设备为服务器,本申请实施例还提供一种服务器,请参见图11所示,图11为本申请实施例提供的服务器1500的结构图,服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,简称CPU)1522(例如,一个或一个以上处理器)和存储器1532,一个或一个以上存储应用程序1542或数据1544的存储介质1530(例如一个或一个以上海量存储设备)。其中,存储器1532和存储介质1530可以是短暂存储或持久存储。存储在存储介质1530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1522可以设置为与存储介质1530通信,在服务器1500上执行存储介质1530中的一系列指令操作。

服务器1500还可以包括一个或一个以上电源1526,一个或一个以上有线或无线网络接口1550,一个或一个以上输入输出接口1558,和/或,一个或一个以上操作系统1541,例如Windows Server

上述实施例中由服务器所执行的步骤可以基于图11所示的服务器结构。

另外,本申请实施例还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序用于执行上述实施例提供的方法。

本申请实施例还提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例提供的方法。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:Read-only Memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。而且本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。因此,本申请的保护范围应该以权利要求的保护范围为准。

技术分类

06120116334634