资源回收策略获取方法、装置、电子设备及存储介质

文献发布时间：2023-06-19 19:35:22

技术领域

本申请涉及人工智能领域，具体涉及一种资源回收策略获取方法、装置、电子设备及存储介质。

背景技术

在众多领域中，资源通常是有限的。为了保证资源的高效利用或者出于其他考虑，当某一部分资源长时间滞留在某一对象时，需要对该对象所持有资源进行回收。例如：在计算机系统中，为了保证CPU资源的高效利用，当某一部分CPU资源长时间地被某一进程占用时，需要对该进程所持有CPU资源进行回收。

同时，很多情况下，资源的控制权是掌握在持有该资源的对象手中的。因此，为了成功回收对象所持有资源，需要针对性地制定资源回收策略。现有技术中制定出的资源回收策略较为单一且片面，一定程度上缺乏合理性。

发明内容

本申请的一个目的在于提出一种资源回收策略获取方法、装置、电子设备及存储介质，能够提高资源回收策略的合理性。

根据本申请实施例的一方面，公开了一种资源回收策略获取方法，所述方法包括：

获取样本对象的标签，其中，所述标签用于描述样本对象所持有资源的滞留程度；

获取所述样本对象在资源滞留过程中各个阶段的特征数据；

分别以所述样本对象在资源滞留过程中各个阶段的特征数据为输入，以所述标签为映射目标，对预设的分类模型进行训练，直到以满足预设条件的准确率将所述分类模型的输出结果映射为所述标签，得到训练完成的分类模型；

响应于目标对象在资源滞留过程中所处阶段的更新，更新所述目标对象在资源滞留过程中所处阶段的特征数据，并将所述目标对象的更新后特征数据输入所述训练完成的分类模型，得到所述训练完成的分类模型针对所述目标对象更新的输出结果；

根据针对所述目标对象更新的输出结果，更新针对所述目标对象的资源回收策略。

根据本申请实施例的一方面，公开了一种资源回收策略获取装置，所述装置包括：

第一获取模块，配置为获取样本对象的标签，其中，所述标签用于描述样本对象所持有资源的滞留程度；

第二获取模块，配置为获取所述样本对象在资源滞留过程中各个阶段的特征数据；

训练模块，配置为分别以所述样本对象在资源滞留过程中各个阶段的特征数据为输入，以所述标签为映射目标，对预设的分类模型进行训练，直到以满足预设条件的准确率将所述分类模型的输出结果映射为所述标签，得到训练完成的分类模型；

第一更新模块，配置为响应于目标对象在资源滞留过程中所处阶段的更新，更新所述目标对象在资源滞留过程中所处阶段的特征数据，并将所述目标对象的更新后特征数据输入所述训练完成的分类模型，得到所述训练完成的分类模型针对所述目标对象更新的输出结果；

第二更新模块，配置为根据针对所述目标对象更新的输出结果，更新针对所述目标对象的资源回收策略。

在本申请的一示例性实施例中，所述第一获取模块配置为：

针对预设数目个的统计对象，基于所述预设数目个的统计对象的资源滞留记录，获取已滞留不同天数的资源在次日继续滞留的概率；

基于所述概率与预设的概率阈值之间的对比结果，确定用于划分评级的滞留天数阈值；

获取所述样本对象所持有资源的最大滞留天数；

基于所述样本对象所持有资源的最大滞留天数与所述滞留天数阈值之间的对比结果，生成所述样本对象的标签。

在本申请的一示例性实施例中，所述第一获取模块配置为：

基于所述概率与预设的概率阈值之间的对比结果，确定用于划分评级的第一滞留天数阈值；

获取预设的用于划分评级的第二滞留天数阈值，其中，所述第二滞留天数阈值大于所述第一滞留天数阈值；

若所述样本对象所持有资源的最大滞留天数小于或等于所述第一滞留天数阈值，则将第一评级作为所述样本对象的标签；

若所述样本对象所持有资源的最大滞留天数大于所述第一滞留天数阈值且小于或等于所述第二滞留天数阈值，则将第二评级作为所述样本对象的标签；

若所述样本对象所持有资源的最大滞留天数大于所述第二滞留天数阈值，则将第三评级作为所述样本对象的标签。

在本申请的一示例性实施例中，所述装置配置为：

将标签为第二评级的样本对象剔除，并将标签为第一评级以及第三评级的样本对象用于训练所述分类模型。

在本申请的一示例性实施例中，所述训练模块配置为：

分别将所述样本对象在资源滞留过程中各个阶段的特征数据输入所述分类模型，得到所述分类模型输出的滞留概率，其中，所述滞留概率用于描述在预设的滞留天数阈值内成功回收所述样本对象所持有资源的概率或者在所述滞留天数阈值后所述样本对象所持有资源继续滞留的概率；

基于滞留概率与标签之间的映射关系，将所述分类模型输出的滞留概率转换为对应的标签，得到模型分类标签；

基于所述模型分类标签与所述样本对象的标签之间的偏差，向减小所述偏差的方向对所述分类模型进行调整。

在本申请的一示例性实施例中，所述训练模块配置为：

分别将所述样本对象在资源滞留过程中各个阶段的特征数据输入所述分类模型，得到所述分类模型输出的最大滞留天数，其中，所述最大滞留天数用于描述所述样本对象所持有资源的最大滞留天数；

基于最大滞留天数与标签之间的映射关系，将所述分类模型输出的最大滞留天数转换为对应的标签，得到模型分类标签；

基于所述模型分类标签与所述样本对象的标签之间的偏差，向减小所述偏差的方向对所述分类模型进行调整。

在本申请的一示例性实施例中，所述特征数据包括：用于描述对象的基础属性信息的对象基础数据，用于描述对象针对其所持有资源所作历史调度行为的对象行为数据，用于描述自对象所持有资源滞留以来针对对象所作回收措施的对象回收数据。

在本申请的一示例性实施例中，所述对象回收数据包括：回收行为数据，回收文本数据，其中，所述回收行为数据用于描述自对象所持有资源滞留以来针对对象所作回收行为的属性信息，所述回收文本数据以文本形式描述自对象所持有资源滞留以来在回收资源过程中与对象之间的交互信息。

在本申请的一示例性实施例中，所述装置配置为：

获取自对象所持有资源滞留以来在回收过程中与对象之间的交互文本；

基于所述交互文本生成所述回收文本数据。

在本申请的一示例性实施例中，所述装置配置为：

获取自对象所持有资源滞留以来在回收过程中与对象之间的交互语音；

基于所述交互语音生成所述回收文本数据。

在本申请的一示例性实施例中，所述分类模块包括第一子模型、第二子模型以及主模型，所述分类模型的输出结果为所述主模型的输出结果，所述主模型的输入为所述第一子模型的输出结果以及所述第二子模型的输出结果，所述第一子模型的输入为所述回收文本数据，所述第二子模型的输入为除所述回收文本数据以外的特征数据。

在本申请的一示例性实施例中，所述第二更新模块配置为：

根据针对所述目标对象更新的滞留概率，更新所述目标对象的评级，得到所述目标对象的更新后评级；

根据所述目标对象的更新后评级，更新针对所述目标对象的资源回收策略。

根据本申请实施例的一方面，公开了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现以上任一项实施例。

根据本申请实施例的一方面，公开了一种计算机程序介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行以上任一项实施例。

根据本申请实施例的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实现方式中提供的方法。

本申请实施例中，通过将样本对象的资源滞留过程划分为多个阶段，并分别以样本对象在资源滞留过程中各个阶段的特征数据为输入对预设的分类模型进行训练，使得训练完成的分类模型能够根据样本对象在资源滞留过程中各个阶段的特征数据准确地描述出样本对象所持有资源的滞留程度，从而使得训练完成的分类模型能够根据目标对象在资源滞留过程中各个阶段的特征数据准确地描述出目标对象所持有资源的滞留程度。从而通过训练完成的分类模型，能够使得针对目标对象的资源回收策略动态地适应目标对象在资源滞留过程中所处阶段的更新，从而提高资源回收策略的合理性。

本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

通过参考附图详细描述其示例实施例，本申请的上述和其它目标、特征及优点将变得更加显而易见。

图1示出了根据本申请一个实施例的所提供技术方案的示例性系统架构的示意图。

图2示出了根据本申请一个实施例的资源回收策略获取方法的流程图。

图3示出了根据本申请一个实施例的分类模型的结构示意图。

图4示出了根据本申请一个实施例的分类模型的训练示意图。

图5示出了根据本申请一个实施例的评级与资源回收策略之间的映射关系示意图。

图6示出了根据本申请一个实施例的资源回收策略获取装置的框图。

图7示出了根据本申请一个实施例的电子设备硬件图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些示例实施方式使得本申请的描述将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本申请的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中，提供许多具体细节从而给出对本申请的示例实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本申请的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、步骤等。在其它情况下，不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本申请的各方面变得模糊。

附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

本申请提出了一种资源回收策略获取方法，涉及人工智能领域中的机器学习，主要用于针对所持有资源发生滞留的目标对象，确定对应的资源回收策略。本申请中的对象可以为计算机系统中的进程或者服务，对象所持有资源为计算机资源(例如：存储资源、CPU资源等)；本申请中的对象也可以为虚拟交互系统中的用户，对象所持有资源为虚拟资源(例如：虚拟道具、虚拟材料等)；本申请中的对象也可以为借款客户，对象所持有资源为所借贷款。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

图1示出了本申请一实施例的所提供技术方案的示例性系统架构的示意图。

如图1所示，该系统架构可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种，当然也可以是台式计算机等)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线通信链路、无线通信链路等等。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

其中，终端设备主要用于供服务器105获取样本对象的特征数据，或者获取目标对象的特征数据。服务器105主要用于根据本申请所提供的资源回收策略获取方法，获取样本对象的标签以及样本对象在资源滞留过程中各个阶段的特征数据，进而在此基础上训练预设的分类模型，进而将训练完成的分类模型用于更新针对目标对象的资源回收策略。

需要说明的是，该实施例只是示例性地展示了本申请可以应用的系统架构，不应对本申请的功能和使用范围造成限制。

图2示出了本申请所提出的资源回收策略获取方法的流程图。示例性的，该方法的执行主体可以为服务器，该方法包括：

步骤S210、获取样本对象的标签，其中，该标签用于描述该样本对象所持有资源的滞留程度；

步骤S220、获取该样本对象在资源滞留过程中各个阶段的特征数据；

步骤S230、分别以该样本对象在资源滞留过程中各个阶段的特征数据为输入，以该标签为映射目标，对预设的分类模型进行训练，直到以满足预设条件的准确率将该分类模型的输出结果映射为该标签，得到训练完成的分类模型；

步骤S240、响应于目标对象在资源滞留过程中所处阶段的更新，更新该目标对象在资源滞留过程中所处阶段的特征数据，并将该目标对象的更新后特征数据输入该训练完成的分类模型，得到该训练完成的分类模型针对该目标对象更新的输出结果；

步骤S250、根据针对该目标对象更新的输出结果，更新针对该目标对象的资源回收策略。

本申请实施例中，选取出样本对象后，获取样本对象的标签。其中，标签用于描述对应的样本对象所持有资源的滞留程度。例如：若样本对象过长时间地持有资源，其所持有资源被确认为重度滞留，则该样本对象的标签为“低分段”；若样本对象较长时间地持有资源，其所持有资源被确认为中度滞留，则该样本对象的标签为“中分段”；若样本对象短时间地持有资源，其所持有资源被确认为轻度滞留，则该样本对象的标签为“高分段”。

并且本申请实施例中，预先按照时间的先后顺序将滞留过程划分为多个阶段。选取出样本对象后，还要获取样本对象在资源滞留过程中各个阶段的特征数据，各个阶段的特征数据用于描述样本对象在对应阶段的资源持有行为的相关特征。例如：预先按照时间的先后顺序将每个自然日划分为一个阶段。滞留的第1天为第一滞留阶段，滞留的第2天为第二滞留阶段，滞留的第3天为第三滞留阶段，以此类推。进而选取出样本对象后，获取样本对象在第一滞留阶段的特征数据，在第二滞留阶段的特征数据，在第三滞留阶段的特征数据，以此类推。

进而分别将样本对象在资源滞留过程中各个阶段的特征数据输入预设的分类模型，得到该分类模型的输出结果。进而按照预设的映射关系对每个输出结果进行映射，映射目标为样本对象的标签。即，若某个输出结果在映射后得到样本对象的标签，则说明该输出结果准确映射为样本对象的标签；若某个输出结果在映射后未得到样本对象的标签，则说明该输出结果未准确映射为样本对象的标签。

对该分类模型进行训练，直到能够以满足预设条件的准确率将该分类模型的输出结果映射为样本对象的标签，得到训练完成的分类模型。由于根据训练完成的分类模型的输出结果能够准确地映射得到样本对象的标签，说明训练完成的分类模型能够根据样本对象在资源滞留过程中各个阶段的特征数据准确地描述出样本对象所持有资源的滞留程度，因此训练完成的分类模型亦能够根据目标对象在资源滞留过程中各个阶段的特征数据准确地描述目标对象所持有资源的滞留程度。

进而针对待确定资源回收策略的目标对象，每当该目标对象在资源滞留过程中所处阶段发生更新，相应更新该目标对象在资源滞留过程中所处阶段的特征数据，进而将该目标对象的更新后特征数据输入该训练完成的分类模型，得到该训练完成的分类模型针对目标对象更新的输出结果。进而根据针对该目标对象更新的输出结果，更新针对目标对象的资源回收策略。例如：目标对象滞留1天时，进入到第一滞留阶段，将目标对象在第一滞留阶段的特征数据输入训练完成的分类模型，进而根据该训练完成的分类模型针对该目标对象更新的输出结果，更新针对该目标对象的资源回收策略；目标对象滞留2天时，进入到第二滞留阶段，将目标对象在第二滞留阶段的特征数据输入训练完成的分类模型，进而根据该训练完成的分类模型针对该目标对象更新的输出结果，更新针对该目标对象的资源回收策略。以此类推。

由此可见，本申请实施例中，通过将样本对象的资源滞留过程划分为多个阶段，并分别以样本对象在资源滞留过程中各个阶段的特征数据为输入对预设的分类模型进行训练，使得训练完成的分类模型能够根据样本对象在资源滞留过程中各个阶段的特征数据准确地描述出样本对象所持有资源的滞留程度，从而使得训练完成的分类模型能够根据目标对象在资源滞留过程中各个阶段的特征数据准确地描述出目标对象所持有资源的滞留程度。从而通过训练完成的分类模型，能够使得针对目标对象的资源回收策略动态地适应目标对象在资源滞留过程中所处阶段的更新，从而提高资源回收策略的合理性。

在一实施例中，样本对象的标签包括样本对象的评级。针对预设数目个的统计对象，基于该预设数目个的统计对象的资源滞留记录，获取已滞留不同天数的资源在次日继续滞留的概率。基于该概率与预设的概率阈值之间的对比结果，确定用于划分评级的滞留天数阈值。获取该样本对象所持有资源的最大滞留天数。基于该样本对象所持有资源的最大滞留天数与该滞留天数阈值之间的对比结果，生成该样本对象的标签。

具体的，该实施例的方案设计思路可以概括为：获取已滞留不同天数的资源在次日继续滞留的概率；进而结合预设的概率阈值，确定滞留天数阈值；进而结合样本对象所持有资源的最大滞留天数，生成样本对象的标签。

其中，通过滚动率分析的方式，从统计对象的资源滞留记录中获取已滞留不同天数的资源在次日继续滞留的概率。已滞留不同天数的资源在次日继续滞留的概率可以通过已滞留不同天数的资源在次日继续滞留的比例进行描述。例如：100个已滞留1天的资源中，在次日继续滞留的有40个，则已滞留1天的资源在次日继续滞留的概率为40/100＝40％；40个已滞留2天的资源中，在次日继续滞留的有24个，则已滞留2天的资源在次日继续滞留的概率为24/40＝60％，以此类推。

通常情况下，已滞留天数越久，资源在次日继续滞留的概率越大。记预设的概率阈值为P，已滞留N天的资源在次日继续滞留的概率为P

该实施例的优点在于，通过基于已滞留不同天数的资源在次日继续滞留的概率确定用于划分评级的滞留天数阈值，能够更客观地生成样本对象的标签。

在一实施例中，基于该概率与预设的概率阈值之间的对比结果，确定用于划分评级的第一滞留天数阈值。获取预设的用于划分评级的第二滞留天数阈值，其中，该第二滞留天数阈值大于该第一滞留天数阈值。若该样本对象所持有资源的最大滞留天数小于或等于该第一滞留天数阈值，则将第一评级作为该样本对象的标签。若该样本对象所持有资源的最大滞留天数大于该第一滞留天数阈值且小于或等于该第二滞留天数阈值，则将第二评级作为该样本对象的标签。若该样本对象所持有资源的最大滞留天数大于该第二滞留天数阈值，则将第三评级作为该样本对象的标签。

具体的，通过两个滞留天数阈值(第一滞留天数阈值、第二滞留天数阈值)将样本的评级划分为三个评级(第一评级、第二评级、第三评级)，第一滞留天数阈值是基于已滞留不同天数的资源在次日继续滞留的概率与概率阈值之间的对比结果确定的，第二滞留天数阈值是预设的，第一滞留天数小于第二滞留天数。

记第一滞留天数阈值为T1，第二滞留天数阈值为T2，样本对象所持有资源的最大滞留天数为T，T1＜T2。若T≤T1，则样本对象的标签为第一评级；若T1＜T≤T2，则样本对象的标签为第二评级；若T2＜T，则样本对象的标签为第三评级。

例如：在对象为借款客户，对象所持有资源为所借贷款时，对象所持有资源的最大滞留天数可以为对象所借贷款的最大逾期天数，滞留天数阈值为所借贷款的逾期天数阈值。

一般情况下，会以30天作为对象逾期程度严重与否的界限。若所借贷款的最大逾期天数大于30天，则对象严重逾期；若最大逾期天数小于或等于30天，则对象非严重逾期。则可以将第二逾期天数阈值设为30。

若基于已逾期不同天数的所借贷款在次日继续逾期的概率与概率阈值之间的对比结果，确定第一逾期天数阈值为20，则将第一逾期天数阈值设为20。

若样本对象所借贷款的最大逾期天数小于或等于20，说明样本对象为低风险对象，则样本对象的标签为第一评级；若样本对象所借贷款的最大滞留天数大于20，小于或等于30，说明样本对象为中风险对象，则样本对象的标签为第二评级；若样本对象所借贷款的最大滞留天数大于30，说明样本对象为高风险对象，则样本对象的标签为第三评级。

在一实施例中，将标签为第二评级的样本对象剔除，并将标签为第一评级以及第三评级的样本对象用于训练该分类模型。

具体的，在确定出三个层次的样本对象后，将中间层次的样本对象从建模样本中剔除，仅使用其他两个层次的样本对象训练分类模型。

该实施例的优点在于，通过将中间层次的样本对象从建模样本中剔除，仅使用其他两个层次的样本对象训练分类模型，使得分类模型具有更强的风险区分能力。

在一实施例中，分别将该样本对象在资源滞留过程中各个阶段的特征数据输入该分类模型，得到该分类模型输出的滞留概率，其中，该滞留概率用于描述在预设的滞留天数阈值内成功回收该样本对象所持有资源的概率或者在该滞留天数阈值后该样本对象所持有资源继续滞留的概率。基于滞留概率与标签之间的映射关系，将该分类模型输出的滞留概率转换为对应的标签，得到模型分类标签。基于该模型分类标签与该样本对象的标签之间的偏差，向减小该偏差的方向对该分类模型进行调整。

具体的，分类模型用于预测在预设的滞留天数阈值内成功回收样本对象所持有资源的概率P，或者用于预测样本对象所持有资源在该滞留天数阈值后继续滞留的概率(1-P)。进而按照滞留概率与标签之间的映射关系，将分类模型预测所得的P或者(1-P)转换为对应的标签，转换得到的该标签为模型分类标签。进而基于模型分类标签与样本对象的标签之间的偏差，调整分类模型，使得该偏差不断减小，以提高分类模型的滞留概率的准确性。

例如：分类模型用于预测在30天内成功回收对象所借贷款的概率P。若P大于或等于80％，则映射得到的模型分类标签为第一评级；若P大于或等于60％，且小于80％，则映射得到的模型分类标签为第二评级；若P小于60％，则映射得到的模型分类标签为第三评级。

在一实施例中，分别将该样本对象在资源滞留过程中各个阶段的特征数据输入该分类模型，得到该分类模型输出的最大滞留天数，其中，该最大滞留天数用于描述该样本对象所持有资源的最大滞留天数。基于最大滞留天数与标签之间的映射关系，将该分类模型输出的最大滞留天数转换为对应的标签，得到模型分类标签。基于该模型分类标签与该样本对象的标签之间的偏差，向减小该偏差的方向对该分类模型进行调整。

具体的，分类模型输出的滞留概率用于预测样本对象所持有资源的最大滞留天数T。进而按照最大滞留天数与标签之间的映射关系，将分类模型预测所得的T转换为对应的标签，转换得到的该标签为模型分类标签。进而基于模型分类标签与样本对象的标签之间的偏差，调整分类模型，使得该偏差不断减小，以提高分类模型的滞留概率的准确性。

在一实施例中，该特征数据包括：用于描述对象的基础属性信息的对象基础数据，用于描述对象针对其所持有资源所作历史调度行为的对象行为数据，用于描述自对象所持有资源滞留以来针对对象所作回收措施的对象回收数据。

具体的，对象基础数据包括：用于描述对象的职责类别的数据、用于描述对象的生存时长的数据等。

对象行为数据包括：用于描述对象获取资源的历史行为的数据、用于描述对象释放资源的历史行为的数据等。

对象回收数据包括：用于描述自对象所持有资源滞留以来针对对象所作的回收频率的数据，用于描述自对象所持有资源滞留以来针对对象所作的回收方式的数据，用于描述自对象所持有资源滞留以来针对对象所作的交互信息的数据等。

该实施例的优点在于，通过将动态更新的对象回收数据用于构建对象的特征数据，使得对象的特征数据能够更全面地反映出施加给对象的外部影响，提高了特征数据的表达能力。

在一实施例中，该对象回收数据包括：回收行为数据，回收文本数据，其中，该回收行为数据用于描述自对象所持有资源滞留以来针对对象所作回收行为的属性信息，该回收文本数据以文本形式描述自对象所持有资源滞留以来在回收资源过程中与对象之间的交互信息。

具体的，针对对象所作回收行为的属性信息包括：针对对象所作的回收频率、针对对象所作的回收方式等。

需要说明的是，对象回收数据可以仅包含回收行为数据，也可以仅包含回收文本数据，也可以同时包含回收行为数据以及回收文本数据。

在一实施例中，获取自对象所持有资源滞留以来在回收过程中与对象之间的交互文本。基于该交互文本生成该回收文本数据。

具体的，在回收过程中，可以通过短信、电子邮件等方式与对象进行交互以回收资源。在这种情况下，可以基于短信或者电子邮件中包含的交互文本生成回收文本数据，并将该回收文本数据作为该对象的特征数据的一部分。

例如：自目标对象所持有资源滞留以来一直通过短信与目标对象进行交互以回收资源，记在第一滞留阶段与目标对象进行交互的短信为TEXT1，在第二滞留阶段与目标对象进行交互的短信为TEXT2。目标对象所持有资源滞留1天时，进入到第一滞留阶段，进而第一滞留阶段的目标对象的特征数据包含基于TEXT1生成的回收文本数据；目标对象所持有资源滞留2天时，进入到第二滞留阶段，进而第二滞留阶段的目标对象的特征数据包含基于TEXT1以及TEXT2生成的回收文本数据。

在一实施例中，获取自对象所持有资源滞留以来在回收过程中与对象之间的交互语音。基于该交互语音生成该回收文本数据。

具体的，在回收过程中，可以通过电话、语音消息等方式与对象进行交互以回收资源。在这种情况下，可以通过语音转文本的技术，将电话或者语音消息包含的交互语音转换为回收文本数据，并将该回收文本数据作为该对象的特征数据的一部分。

例如：自目标对象所持有资源滞留以来一直通过电话与目标对象进行交互以回收资源，记在第一滞留阶段与目标对象进行交互的电话包含的交互语音为VOICE1，在第二滞留阶段与目标对象进行交互的电话包含的交互语音为VOICE2。目标对象所持有资源滞留1天时，进入到第一滞留阶段，进而第一滞留阶段的目标对象的特征数据包含基于VOICE1生成的回收文本数据；目标对象所持有资源滞留2天时，进入到第二滞留阶段，进而第二滞留阶段的目标对象的特征数据包含基于VOICE1以及VOICE2生成的回收文本数据。

在一实施例中，该分类模块包括第一子模型、第二子模型以及主模型，该分类模型的输出结果为该主模型的输出结果，该主模型的输入为该第一子模型的输出结果以及该第二子模型的输出结果，该第一子模型的输入为该回收文本数据，该第二子模型的输入为除该回收文本数据以外的特征数据。

具体的，参考图3示出的本申请一实施例的分类模型的结构示意图。该实施例中，将数据源分为两部分：仅包含回收文本数据的数据源1，不包含回收文本数据的数据源2。该第一子模型可以为LR模型或者Xgboost模型，该第二子模型可以为Xgboost模型，该主模型可以为LR模型。

将数据源1采用Word2vec或Glove算法后转换为Embedding特征，再用LR算法或者Xgboost算法建模，得到第一子模型；将数据源2经过特征工程组成聚合形成特征后采用Xgboost算法建模，得到第二子模型。进而通过主模型将上述两个子模型融合，得到完整的分类模型。

图4示出了本申请一实施例的分类模型的训练示意图。

参考图4所示，该实施例中，在训练分类模型之初，先要选择用于获取建模样本的样本对象。具体的，选择过去一段时间的借款客户作为样本对象，将样本对象的特征数据作为建模样本。在选择建模样本时，一方面需要选择尽量靠近建模时间点的特征数据作为建模样本，另一方面尽量避免类似营销活动、季节等因素的干扰。

从开始逾期一直到出催前，样本对象的特征数据始终在建模样本内，即，建模样本会重复包含一个样本对象的特征数据若干次直到该样本对象不再逾期为止。

该分类模型的目的是预测所借贷款在逾期的30天后是否会继续逾期，因此表现期是所借贷款开始逾期后的30天。标签定义一般有两种方法，一种方法是运用业务经验确定一个逾期天数阈值，若样本对象所借贷款的最大逾期天数小于该逾期天数阈值，则将样本对象的标签确定为第一评级，若样本对象所借贷款的最大逾期天数介于该逾期天数阈值与30天之间，则将样本对象的标签确定为第二评级，若样本对象所借贷款的最大逾期天数大于30天，则将样本对象的标签确定为第三评级；另一种方法是运用逾期滚动率分析的方法，通过分析当前逾期N天的所借贷款在第二天继续逾期的概率确定一个逾期天数阈值，进而同理于第一种方法根据样本的最大逾期天数、该逾期天数阈值以及30天之间的对比，确定样本对象的标签。

特征工程的过程中，获取到对象基础数据、对象行为数据、回收行为数据以及回收文本数据这些特征数据。将这些特征数据划分为两个数据源：仅包含回收文本数据的数据源1，包含除回收文本数据以外的其他特征数据的数据源2。

得到完整的分类模型后对其进行训练以及评估，直到评估结果确定分类模型符合上线标准，将该分类模型部署落地。

分类模型部署落地时，特征工程环境的特征加工逻辑最好形成解释性的需求文档供模型部署人员查阅。分类模型部署完成后，需要对部署结果进行验证，在正式上线前保证部署逻辑与开发逻辑一致。

分类模型输出的为对象的评级。分类模型正式上线前，可以定义评级与回收策略之间的映射关系，以使得分类模型上线后，能够根据分类模型输出的不同评级确定不同的资源回收策略。

分类模型上线后，按月监控模型指标，一方面要确定分类模型在业务应用中能够对好坏客户具有一定的区分能力，另一方面时刻关注分类模型输出的分布与建模样本的偏移程度。

分类模型的区分能力主要是关注KS(Kolmogorov-Smirnov)指标，KS用于对模型风险区分能力进行评估，衡量的是好坏样本累计分布之间的差值。好坏样本累计差异越大，KS指标越大，分类模型的风险区分能力越强。

分类模型输出的分布与建模样本的偏移程度主要是关注aPSI(PopulationStability Index)指标，aPSI指标反映了验证样本在各评级的分布与建模样本分布的稳定性。稳定性是有参照的，因此需要有两个分布——实际分布(actual)和预期分布(expected)。在建模时通常以训练样本作为预期分布，验证样本作为实际分布。

在一实施例中，针对该目标对象更新的输出结果包括针对该目标对象更新的滞留概率，针对该目标对象更新的滞留概率用于描述在预设的滞留天数阈值内成功回收该目标对象所持有资源的概率或者在该滞留天数阈值后该目标对象所持有资源继续滞留的概率。根据针对该目标对象更新的滞留概率，更新该目标对象的评级，得到该目标对象的更新后评级。根据该目标对象的更新后评级，更新针对该目标对象的资源回收策略。

具体的，通过目标对象的评级确定针对目标对象的资源回收策略。每当目标对象在资源滞留过程中所处阶段发生更新，通过训练完成的分类模型获取针对该目标对象更新的滞留概率，进而更新该目标对象的评级，进而更新针对该目标对象的资源回收策略。

例如：参考图5示出的本申请一实施例的评级与资源回收策略之间的映射关系示意图，若目标对象的更新后评级为第一评级，说明目标对象在当前阶段为低风险对象，则针对该目标对象的资源回收策略可以为不提醒归还资源；若目标对象的更新后评级为第二评级，说明目标对象在当前阶段为中风险对象，则针对该目标对象的资源回收策略可以为较为低频率地提醒目标对象归还资源；若目标对象的更新后评级为第三评级，说明目标对象在当前阶段为高风险对象，则针对该目标对象的资源回收策略可以为较为高频率地提醒目标对象归还资源。

图6示出了根据本申请一实施例的资源回收策略获取装置的框图，所述装置包括：

第一获取模块310，配置为获取样本对象的标签，其中，所述标签用于描述样本对象所持有资源的滞留程度；

第二获取模块320，配置为获取所述样本对象在资源滞留过程中各个阶段的特征数据；

训练模块330，配置为分别以所述样本对象在资源滞留过程中各个阶段的特征数据为输入，以所述标签为映射目标，对预设的分类模型进行训练，直到以满足预设条件的准确率将所述分类模型的输出结果映射为所述标签，得到训练完成的分类模型；

第一更新模块340，配置为响应于目标对象在资源滞留过程中所处阶段的更新，更新所述目标对象在资源滞留过程中所处阶段的特征数据，并将所述目标对象的更新后特征数据输入所述训练完成的分类模型，得到所述训练完成的分类模型针对所述目标对象更新的输出结果；

第二更新模块350，配置为根据针对所述目标对象更新的输出结果，更新针对所述目标对象的资源回收策略。

在本申请的一示例性实施例中，所述第一获取模块配置为：

针对预设数目个的统计对象，基于所述预设数目个的统计对象的资源滞留记录，获取已滞留不同天数的资源在次日继续滞留的概率；

基于所述概率与预设的概率阈值之间的对比结果，确定用于划分评级的滞留天数阈值；

获取所述样本对象所持有资源的最大滞留天数；

基于所述样本对象所持有资源的最大滞留天数与所述滞留天数阈值之间的对比结果，生成所述样本对象的标签。

在本申请的一示例性实施例中，所述第一获取模块配置为：

基于所述概率与预设的概率阈值之间的对比结果，确定用于划分评级的第一滞留天数阈值；

获取预设的用于划分评级的第二滞留天数阈值，其中，所述第二滞留天数阈值大于所述第一滞留天数阈值；

若所述样本对象所持有资源的最大滞留天数小于或等于所述第一滞留天数阈值，则将第一评级作为所述样本对象的标签；

若所述样本对象所持有资源的最大滞留天数大于所述第一滞留天数阈值且小于或等于所述第二滞留天数阈值，则将第二评级作为所述样本对象的标签；

若所述样本对象所持有资源的最大滞留天数大于所述第二滞留天数阈值，则将第三评级作为所述样本对象的标签。

在本申请的一示例性实施例中，所述装置配置为：

将标签为第二评级的样本对象剔除，并将标签为第一评级以及第三评级的样本对象用于训练所述分类模型。

在本申请的一示例性实施例中，所述训练模块配置为：

基于滞留概率与标签之间的映射关系，将所述分类模型输出的滞留概率转换为对应的标签，得到模型分类标签；

基于所述模型分类标签与所述样本对象的标签之间的偏差，向减小所述偏差的方向对所述分类模型进行调整。

在本申请的一示例性实施例中，所述训练模块配置为：

基于最大滞留天数与标签之间的映射关系，将所述分类模型输出的最大滞留天数转换为对应的标签，得到模型分类标签；

基于所述模型分类标签与所述样本对象的标签之间的偏差，向减小所述偏差的方向对所述分类模型进行调整。

在本申请的一示例性实施例中，所述装置配置为：

获取自对象所持有资源滞留以来在回收过程中与对象之间的交互文本；

基于所述交互文本生成所述回收文本数据。

在本申请的一示例性实施例中，所述装置配置为：

获取自对象所持有资源滞留以来在回收过程中与对象之间的交互语音；

基于所述交互语音生成所述回收文本数据。

在本申请的一示例性实施例中，所述第二更新模块配置为：

根据针对所述目标对象更新的滞留概率，更新所述目标对象的评级，得到所述目标对象的更新后评级；

根据所述目标对象的更新后评级，更新针对所述目标对象的资源回收策略。

下面参考图7来描述根据本申请实施例的电子设备40。图7显示的电子设备40仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，电子设备40以通用计算设备的形式表现。电子设备40的组件可以包括但不限于：上述至少一个处理单元410、上述至少一个存储单元420、连接不同系统组件(包括存储单元420和处理单元410)的总线430。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元410执行，使得所述处理单元410执行本说明书上述示例性方法的描述部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元410可以执行如图2中所示的各个步骤。

存储单元420可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202，还可以进一步包括只读存储单元(ROM)4203。

存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204，这样的程序模块4205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线430可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备40也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备40交互的设备通信，和/或与使得该电子设备40能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。输入/输出(I/O)接口450与显示单元440相连。并且，电子设备40还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器460通过总线430与电子设备40的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备40使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本申请实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。

在本申请的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行上述方法实施例部分描述的方法。

根据本申请的一个实施例，还提供了一种用于实现上述方法实施例中的方法的程序产品，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如JAVA、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本申请中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本申请实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由所附的权利要求指出。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：喻凯;
专利申请人：腾讯科技（深圳）有限公司;

上一篇：一种资源推荐方法及装置、存储介质、计算机设备
下一篇：医用磨留置针砂轮及其制造方法