导航：首页> 测量；测试>催收决策的确定方法、相关装置及计算机存储介质

催收决策的确定方法、相关装置及计算机存储介质

文献发布时间：2023-06-19 11:49:09

技术领域

本申请涉及计算机技术领域，特别涉及一种催收决策的确定方法、相关装置及计算机存储介质。

背景技术

目前，国内宏观经济处于缓慢下行通道中，商业银行均加大了零售业务的发展力度。个人贷款，尤其是短期消费贷款和信用卡的业务增速加快，个人贷款余额持续增长。但是，个人不良资产具有小额分散的特点，与传统的不良资产处置有较大区别。

在现有技术中，对于大量的个人贷款的不良资产项目，业务人员主要是逐个了解项目情况，并依据经验采取不同的催收处置策略，暂时还不能通过系统快速高效获取决策信息，面对不良的个人贷款笔数多、类型化的特点，业务人员往往需要消耗大量的时间和精力。

发明内容

有鉴于此，本申请提供了一种催收决策的确定方法、相关装置及计算机存储介质，用于快速、精确的确定针对目标客户的催收决策。

本申请第一方面提供了一种催收决策的确定方法，包括：

获取目标客户的债务信息；

对所述债务信息进行指标提取，得到至少一个目标指标信息；

将所有所述目标指标信息输入至催收决策确定模型中，输出得到针对所述目标客户的催收决策；其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。

可选的，所述催收决策确定模型的构建方法，包括：

构建训练样本集；其中，所述训练样本集包括至少一个训练样本客户的历史债务信息，以及训练样本客户针对每一种催收策略的敏感度；

将所述训练样本客户的历史债务信息输入至预设的模型中的多个二分类预测模型中，得到针对每一种催收策略的预测结果；

针对每一种催收策略，利用所述预设的模型中的智能决策模型对催收策略的有效性进行预测，得到第一预测结果；所述智能决策模型为逻辑回归模型；

利用所述预设的模型中的专家规则模型对所述第一预测结果进行校准后，得到第二预测结果；所述专家规则模型为预先设置的规则模型；

利用所述催收策略的第二预测结果与所述训练样本客户针对所述催收策略的敏感度的误差，对所述预设的模型进行调整，直至调整后的预设的模型输出针对所述催收策略的第二预测结果与所述训练样本客户针对所述催收策略的敏感度的误差满足预设的收敛条件时，将所述调整后的预设的模型作为催收决策确定模型。

可选的，所述构建训练样本集，包括：

获取训练样本客户的历史债务信息；

对所述训练样本客户的历史债务信息进行指标提取，得到至少一个样本指标信息；

对每一个所述样本指标信息进行预处理，得到目标预处理数据；

分别为每一个所述样本指标信息制定对应的规则，并为每一个样本指标组设置对应的催收处置策略；其中，所述样本指标组包括至少一个所述样本指标信息；

确定训练样本客户对每一个所述催收处置策略的敏感度。

可选的，所述对每一个所述样本指标信息进行预处理，得到目标预处理数据，包括：

针对每一个样本指标信息，对所述样本指标信息中的结构化数据进行预处理，得到第一预处理数据；

针对每一个样本指标信息，对所述样本指标信息中的非结构化数据进行预处理，得到第二预处理数据；

将所有所述第一预处理数据以及所有所述第二预处理数据，作为目标预处理数据。

可选的，所述针对每一个样本指标信息，对所述样本指标信息中的结构化数据进行预处理，得到第一预处理数据，包括：

针对每一个所述结构化数据，判断所述结构化数据的缺失值是否大于第一阈值；

若判断出所述结构化数据的缺失值大于第一阈值，则删除所述结构化数据；

若判断出所述结构化数据的缺失值不大于第一阈值，则判断所述结构化数据是否为连续型变量；

若判断出所述结构化数据为连续型变量，则对所述结构化数据进行分箱；

对分箱后的结构化数据进行信息值选择，得到第一预处理数据；

若判断出所述结构化数据不是连续型变量，则判断所述结构化数据的水平数是否大于第二阈值；

若判断出所述结构化数据的水平数大于第二阈值，则对所述结构化数据进行变量聚类；

对变量聚类后的结构化数据进行信息值选择，得到第一预处理数据；

若判断出所述结构化数据的水平数不大于第二阈值，则对所述结构化数据进行信息值选择，得到第一预处理数据。

可选的，所述催收决策的确定方法，还包括：

对所有所述分箱进行优化；

去除每一个所述分箱中具有共线性的结构化数据。

可选的，所述针对每一个样本指标信息，对所述样本指标信息中的非结构化数据进行预处理，得到第二预处理数据，包括：

对所述非结构化数据进行语料清洗后，得到第一目标数据；

对所述第一目标数据进行分词处理，得到第二目标数据；

对所述第二目标数据进行关键词提取，得到第三目标数据；

对所述第三目标数据进行特征提取，得到第二预处理数据。

本申请第二方面提供了一种催收决策的确定装置，包括：

第一获取单元，用于获取目标客户的债务信息；

第一提取单元，用于对所述债务信息进行指标提取，得到至少一个目标指标信息；

第一确定单元，用于将所有所述目标指标信息输入至催收决策确定模型中，输出得到针对所述目标客户的催收决策；其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。

可选的，所述催收决策确定模型的构建单元，包括：

训练样本集构建单元，用于构建训练样本集；其中，所述训练样本集包括至少一个训练样本客户的历史债务信息，以及训练样本客户针对每一种催收策略的敏感度；

输入单元，用于将所述训练样本客户的历史债务信息输入至预设的模型中的多个二分类预测模型中，得到针对每一种催收策略的预测结果；

预测单元，用于针对每一种催收策略，利用所述预设的模型中的智能决策模型对催收策略的有效性进行预测，得到第一预测结果；所述智能决策模型为逻辑回归模型；

校准单元，用于利用所述预设的模型中的专家规则模型对所述第一预测结果进行校准后，得到第二预测结果；所述专家规则模型为预先设置的规则模型；

调整单元，用于利用所述催收策略的第二预测结果与所述训练样本客户针对所述催收策略的敏感度的误差，对所述预设的模型进行调整，直至调整后的预设的模型输出针对所述催收策略的第二预测结果与所述训练样本客户针对所述催收策略的敏感度的误差满足预设的收敛条件时，将所述调整后的预设的模型作为催收决策确定模型。

可选的，所述样本集构建单元，包括：

第二获取单元，用于获取训练样本客户的历史债务信息；

第二提取单元，用于对所述训练样本客户的历史债务信息进行指标提取，得到至少一个样本指标信息；

预处理单元，用于对每一个所述样本指标信息进行预处理，得到目标预处理数据；

设置单元，用于分别为每一个所述样本指标信息制定对应的规则，并为每一个样本指标组设置对应的催收处置策略；其中，所述样本指标组包括至少一个所述样本指标信息；

第二确定单元，用于确定训练样本客户对每一个所述催收处置策略的敏感度。

可选的，所述预处理单元，包括：

第一预处理子单元，用于针对每一个样本指标信息，对所述样本指标信息中的结构化数据进行预处理，得到第一预处理数据；

第二预处理子单元，用于针对每一个样本指标信息，对所述样本指标信息中的非结构化数据进行预处理，得到第二预处理数据；

第三确定单元，用于将所有所述第一预处理数据以及所有所述第二预处理数据，作为目标预处理数据。

可选的，所述第一预处理子单元，包括：

第一判断单元，用于针对每一个所述结构化数据，判断所述结构化数据的缺失值是否大于第一阈值；

删除单元，若所述第一判断单元判断出，所述结构化数据的缺失值大于第一阈值，则删除所述结构化数据；

第二判断单元，用于若所述第一判断单元判断出，所述结构化数据的缺失值不大于第一阈值，则判断所述结构化数据是否为连续型变量；

分箱单元，用于若所述第二判断单元判断出，所述结构化数据为连续型变量，则对所述结构化数据进行分箱；

信息值选择单元，用于对分箱后的结构化数据进行信息值选择，得到第一预处理数据；

第三判断单元，用于若所述第二判断单元判断出，所述结构化数据不是连续型变量，则判断所述结构化数据的水平数是否大于第二阈值；

变量聚类单元，用于若所述第三判断单元判断出，所述结构化数据的水平数大于第二阈值，则对所述结构化数据进行变量聚类；

所述信息值选择单元，还用于对变量聚类后的结构化数据进行信息值选择，得到第一预处理数据；

所述信息值选择单元，还用于若所述第三判断单元判断出，所述结构化数据的水平数不大于第二阈值，则对所述结构化数据进行信息值选择，得到第一预处理数据。

可选的，所述催收决策的确定装置，还包括：

优化单元，用于对所有所述分箱进行优化；

去除单元，用于去除每一个所述分箱中具有共线性的结构化数据。

可选的，所述第二预处理子单元，包括：

清洗单元，用于对所述非结构化数据进行语料清洗后，得到第一目标数据；

分词单元，用于对所述第一目标数据进行分词处理，得到第二目标数据；

关键词提取单元，用于对所述第二目标数据进行关键词提取，得到第三目标数据；

特征提取单元，用于对所述第三目标数据进行特征提取，得到第二预处理数据。

本申请第三方面提供了一种服务器，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如第一方面任意一项所述的催收决策的确定方法。

本申请第四方面提供了一种计算机存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如第一方面任意一项所述的催收决策的确定方法。

由以上方案可知，本申请提供的一种催收决策的确定方法、相关装置及计算机存储介质中，所述催收决策的确定方法包括：首先，获取目标客户的债务信息；然后，对所述债务信息进行指标提取，得到至少一个目标指标信息；最后，将所有所述目标指标信息输入至催收决策确定模型中，输出得到针对所述目标客户的催收决策；其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。以达到快速、精确的确定针对目标客户的催收决策的目的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种催收决策的确定方法的具体流程图；

图2为本申请另一实施例提供的一种催收决策确定模型的构建方法的流程图；

图3为本申请另一实施例提供的一种构建训练样本集的流程图；

图4为本申请另一实施例提供的一种对样本指标信息进行预处理方法的流程图；

图5为本申请另一实施例提供的一种对结构化数据进行预处理方法的流程图；

图6为本申请另一实施例提供的一种对非结构化数据进行预处理方法的流程图；

图7为本申请另一实施例提供的一种催收决策的确定装置的示意图；

图8为本申请另一实施例提供的一种实现催收决策的确定方法的服务器的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要注意，本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系，而术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本申请实施例提供了一种催收决策的确定方法，如图1所示，具体包括以下步骤：

S101、获取目标客户的债务信息。

其中，债务信息包括但不限于个人贷款经营处置台账、历史催收记录、不良个人贷款明细台账、个人贷款委外催收信息、个人贷款诉讼信息、个人贷款明细、贷款基本信息、个人贷款还款流水、司法涉诉信息、征信信息、失信客户清单、运营商数据、欠费欠税客户清单、个人信用评分等，此处不做限定。

具体的，获取目标客户的债务信息的方式可以是从相关联的系统中获取，可以是但不限于资产保全经营管理平台、个人贷款信息系统、个人贷款客户信息、客户催收记录等，此处不做限定。

S102、对债务信息进行指标提取，得到至少一个目标指标信息。

其中，目标指标信息包括但不限于还款流水、贷款信息、目标客户信息、催收记录、消费信息、资产信息、外部数据等，此处不做限定。

S103、将所有目标指标信息输入至催收决策确定模型中，输出得到针对目标客户的催收决策。

其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。

可选的，本申请的另一实施例中，催收决策确定模型的构建方法，如图2所示，具体包括：

S201、构建训练样本集。

其中，训练样本集包括至少一个训练样本客户的历史债务信息，以及训练样本客户针对每一种催收策略的敏感度。

可选的，在本申请的另一实施例中，步骤S201的一种实施方式，如图3所示，包括：

S301、获取训练样本客户的历史债务信息。

S302、对训练样本客户的历史债务信息进行指标提取，得到至少一个样本指标信息。

其中，步骤S301和S302的具体实现方式可以分别参见上述实施例中S101和S102中内容，此处不再赘述。

S303、对每一个样本指标信息进行预处理，得到目标预处理数据。

可选的，在本申请的另一实施例中，步骤S303的一种实施方式，如图4所示，包括：

S401、针对每一个样本指标信息，对样本指标信息中的结构化数据进行预处理，得到第一预处理数据。

可选的，在申请的另一实施例中，步骤S401的一种实施方式，如图5所示，包括：

S501、针对每一个结构化数据，判断结构化数据的缺失值是否大于第一阈值。

其中，第一阈值由技术人员进行设定，且是可以根据实际应用情况进行更改的，此处不做限定。

具体的，对每一个结构化数据分别进行缺失值检验，得到结构化数据的缺失值，若判断出结构化数据的缺失值大于第一阈值，则执行步骤S502；若判断出结构化数据的缺失值不大于第一阈值，则执行S503。

S502、删除结构化数据。

S503、判断结构化数据是否为连续型变量。

具体的，若判断出结构化数据为连续型变量，则执行步骤S504；若判断出结构化数据不是连续型变量，则执行步骤S506。

S504、对结构化数据进行分箱。

需要说明的是，在进行分箱后，要确保每一个箱中的结构化数据要大于一定百分比，这个百分比同样由技术人员进行设定，且是可以根据实际应用情况进行更改的，此处不做限定。

S505、对分箱后的结构化数据进行信息值选择，得到第一预处理数据。

其中，信息值为(InformationValue)值，主要用来对输入变量进行编码和预测能力评估。且还可以为IV值设置一个阈值，这个阈值同样由技术人员进行设定，且是可以根据实际应用情况进行更改的，此处不做限定。

S506、判断结构化数据的水平数是否大于第二阈值。

其中，第二阈值由技术人员进行设定，且是可以根据实际应用情况进行更改的，此处不做限定。

具体的，若判断出结构化数据的水平数大于第二阈值，则执行步骤S507；若判断出所述结构化数据的水平数不大于第二阈值，则执行步骤S505。

S507、对结构化数据进行变量聚类。

其中，变量聚类可以采用但不限于卡方选择的方法，此处不做限定。

可选的，在本申请的另一实施例中，催收决策的确定方法的一种实施方式中，还包括：

对所有分箱进行优化，并去除每一个分箱中具有共线性的结构化数据。

其中，对分箱优化，从而保证训练的模型不会因为分箱过细致，从而导致过拟合的问题。并对每一个分箱进行共线性检查，去除每一个分箱中具有共线性的结构化数据。

S402、针对每一个样本指标信息，对样本指标信息中的非结构化数据进行预处理，得到第二预处理数据。

可选的，在本申请的另一实施例中，步骤S402的一种实施方式，如图6所示，包括：

S601、对非结构化数据进行语料清洗后，得到第一目标数据。

具体的，可以采用但不限于将大量的非结构化数据进行汇集，再采用正则表达式的方法，对其进行除标点、数字、英文、特殊符号等，在空值表格、残缺等进行清洗，此处不做限定。

S602、对第一目标数据进行分词处理，得到第二目标数据。

具体的，可以采用大不限于利用中文分词的开源模块库、分词工具等进行中文自动分词，此处不做限定。

S603、对第二目标数据进行关键词提取，得到第三目标数据。

具体的，可以采用但不限于，利用词频来提取关键词，此处不做限定。

S604、对第三目标数据进行特征提取，得到第二预处理数据。

需要说明的是，考虑到Word2Vec的向量经济性和能够表达词与词之间的相近关系(如余弦相似度模型)，因此，可以利用Word2Vec算法来进行特征抽取。同样，也可以采用其他的特征提取方式来进行特征提取，此处不做限定。

S403、将所有第一预处理数据以及所有第二预处理数据，作为目标预处理数据。

S304、分别为每一个样本指标信息制定对应的规则，并为每一个样本指标组设置对应的催收处置策略。

其中，样本指标为中包括至少一个样本指标信息。催收处置策略包括但不限于电话催收、上门催收、委外催收、司法催收、呆账核销等，此处不做限定。

例如：为指标A制定对应的规则、指标B制定对应的规则、指标C制定对应的规则等；为指标A、指标B和指标C制定对应的催收处置策略；为指标A和指标C制定对应的催收处置策略；为指标A制定对应的催收处置策略等。

假设：指标A为个人贷款强制执行时间，那么可以为指标A制定一个规则，如：个人贷款强制执行时间超过N天无法收回债权。

S305、确定训练样本客户对每一个催收处置策略的敏感度。

其中，主要指客户对催收处置策略的敏感程度，反映某一种催收处置策略应用于该客户的有效性。

具体的，由于催收处置策略进入没有明显的先后顺序，因此，只要遇到后一催收处置策略开始则宣告前一催收处置策略的结束。基于此，可以定义不同催收处置策略的观察期窗口。为考察训练样本客户对催收处置策略的敏感度，获取再采用催收处置策略时，该笔贷款应用该催收处置策略回收金额的现值占拖欠贷款本息的比重，其中现值计算时选择贷款日执行利率作为折现率，客户催收处置策略敏感度Y计算公式如下：

其中，T为距离拖欠日期的时间，单位为天。

S202、将训练样本客户的历史债务信息输入至预设的模型中的多个二分类预测模型中，得到针对每一种催收策略的预测结果。

其中，可以将多分类任务拆解为多个二分类任务求解，最终多个二分类预测模型输出的预测结果为使用多数投票的方式融合各个子模型的预测结果。例如：一共有5个二分类预测模型，有3个二分类预测模型对电话催收的预测结果为有效，2个二分类预测模型对电话催收的预测结果为无效，那么最终得到的结果为对电话催收的预测结果为有效。

需要说明的是，多个二分类预测模型可以得到初始模型预测概率，概率分值可以但不限于根据进入不良天数进行过滤。例如，某一债项进入不良天数大于30天，则调低电话催收概率，此处不做限定。

S203、针对每一种催收策略，利用预设的模型中的智能决策模型对催收策略的有效性进行预测，得到第一预测结果。

其中，智能决策模型为逻辑回归模型。

具体的，根据训练样本客户的历史债务信息，以及多个二分类预测模型中输出催收策略的预测结果，对催收策略的有效性进行预测，得到第一预测结果。

S204、利用预设的模型中的专家规则模型对第一预测结果进行校准后，得到第二预测结果。

其中，专家规则模型为预先设置的规则模型。

需要说明的是，若样本数量较少的催收策略，更加适合用专家规则模型的直接进行预测。

需要说明的是，可以但不限于根据规则命中结果进行过滤，若某一债项命中专家规则模型中某一专家规则，则调高相应概率分值，此处不做限定。

在根据规则命中结果进行过滤后，还可以通过名单过滤。例如：通过匹配建档立卡贫困户清单、债项黑名单等，调整相应概率分值。

经过多轮过滤后，概率分值可能出现不在0-1的区间范围内的情况，对此我们采用softmax函数将概率分值进行映射。假设我们有一个数组V，V

根据softmax的特征，我们可以将概率值映射到(0，1)范围内，且保证概率之和为1。

S205、判断催收策略的第二预测结果与训练样本客户针对催收策略的敏感度的误差，是否满足预设的收敛条件。

具体的，若判断出催收策略的第二预测结果与训练样本客户针对催收策略的敏感度的误差，满足预设的收敛条件，则执行步骤S206；若判断出催收策略的第二预测结果与训练样本客户针对催收策略的敏感度的误差，不满足预设的收敛条件，则执行步骤S207。

S206、将预设的模型作为催收决策确定模型。

S207、利用催收策略的第二预测结果与训练样本客户针对催收策略的敏感度的误差对预设的模型进行调整。

需要说明的是，在实际的应用过程中，会通过前端界面向业务人员展示相关信息。前端界面主要包括：查询框。并提供了经办行、客户名称、贷款账号、贷款种类、优先推荐策略等供业务人员快速查询；不良个贷基本信息。涵盖经办行、客户编号、客户名称、贷款账号、产品名称、贷款种类、进入不良时间、余额等；优先推荐策略。展示有效性最高的两种催收处置策略呈现给业务人员；有效性概率值。展示催收处置策略有效性概率分值。会对模型结果进行按日跑批，并以T+2的时效推送至业务平台。对于当月的数据，采取的数据存储策略是按日留存；对于非当月的历史数据，数据存储策略会对其进行自动归档。

由以上方案可知，本申请提供的一种催收决策的确定方法中：首先，获取目标客户的债务信息；然后，对债务信息进行指标提取，得到至少一个目标指标信息；最后，将所有目标指标信息输入至催收决策确定模型中，输出得到针对目标客户的催收决策；其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。以达到快速、精确的确定针对目标客户的催收决策的目的。

本申请另一实施例提供了一种催收决策的确定装置，如图7所示，具体包括：

第一获取单元701，用于获取目标客户的债务信息.

第一提取单元702，用于对债务信息进行指标提取，得到至少一个目标指标信息。

第一确定单元703，用于将所有目标指标信息输入至催收决策确定模型中，输出得到针对目标客户的催收决策。

其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图1所示，此处不再赘述。

可选的，在申请的另一实施例中，催收决策确定模型的构建单元的一种实施方式，包括：

训练样本集构建单元，用于构建训练样本集。

其中，训练样本集包括至少一个训练样本客户的历史债务信息，以及训练样本客户针对每一种催收策略的敏感度。

输入单元，用于将训练样本客户的历史债务信息输入至预设的模型中的多个二分类预测模型中，得到针对每一种催收策略的预测结果。

预测单元，用于针对每一种催收策略，利用预设的模型中的智能决策模型对催收策略的有效性进行预测，得到第一预测结果。

其中，智能决策模型为逻辑回归模型。

校准单元，用于利用预设的模型中的专家规则模型对第一预测结果进行校准后，得到第二预测结果。

其中，专家规则模型为预先设置的规则模型。

调整单元，用于利用催收策略的第二预测结果与训练样本客户针对催收策略的敏感度的误差，对预设的模型进行调整，直至调整后的预设的模型输出针对催收策略的第二预测结果与训练样本客户针对催收策略的敏感度的误差满足预设的收敛条件时，将调整后的预设的模型作为催收决策确定模型。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图2所示，此处不再赘述。

可选的，在本申请的另一实施例中，样本集构建单元的一种实施方式，包括：

第二获取单元，用于获取训练样本客户的历史债务信息。

第二提取单元，用于对训练样本客户的历史债务信息进行指标提取，得到至少一个样本指标信息。

预处理单元，用于对每一个样本指标信息进行预处理，得到目标预处理数据。

设置单元，用于分别为每一个样本指标信息制定对应的规则，并为每一个样本指标组设置对应的催收处置策略。

其中，样本指标组包括至少一个所述样本指标信息。

第二确定单元，用于确定训练样本客户对每一个催收处置策略的敏感度。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图3所示，此处不再赘述。

可选的，在本申请的另一实施例中，预处理单元的一种实施方式，包括：

第一预处理子单元，用于针对每一个样本指标信息，对样本指标信息中的结构化数据进行预处理，得到第一预处理数据。

第二预处理子单元，用于针对每一个样本指标信息，对样本指标信息中的非结构化数据进行预处理，得到第二预处理数据。

第三确定单元，用于将所有第一预处理数据以及所有第二预处理数据，作为目标预处理数据。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图4所示，此处不再赘述。

可选的，在本申请的另一实施例中，第一预处理子单元的一种实施方式，包括：

第一判断单元，用于针对每一个结构化数据，判断结构化数据的缺失值是否大于第一阈值。

删除单元，若第一判断单元判断出，结构化数据的缺失值大于第一阈值，则删除结构化数据。

第二判断单元，用于若第一判断单元判断出，结构化数据的缺失值不大于第一阈值，则判断结构化数据是否为连续型变量。

分箱单元，用于若第二判断单元判断出，结构化数据为连续型变量，则对结构化数据进行分箱。

信息值选择单元，用于对分箱后的结构化数据进行信息值选择，得到第一预处理数据。

第三判断单元，用于若第二判断单元判断出，结构化数据不是连续型变量，则判断结构化数据的水平数是否大于第二阈值。

变量聚类单元，用于若第三判断单元判断出，结构化数据的水平数大于第二阈值，则对结构化数据进行变量聚类。

信息值选择单元，还用于对变量聚类后的结构化数据进行信息值选择，得到第一预处理数据。

信息值选择单元，还用于若第三判断单元判断出，结构化数据的水平数不大于第二阈值，则对结构化数据进行信息值选择，得到第一预处理数据。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图5所示，此处不再赘述。

可选的，在本申请的另一实施例中，催收决策的确定装置的一种实施方式，还包括：

优化单元，用于对所有分箱进行优化。

去除单元，用于去除每一个分箱中具有共线性的结构化数据。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，此处不再赘述。

可选的，在本申请的另一实施例中，第二预处理子单元的一种实施方式，包括：

清洗单元，用于对非结构化数据进行语料清洗后，得到第一目标数据。

分词单元，用于对第一目标数据进行分词处理，得到第二目标数据。

关键词提取单元，用于对第二目标数据进行关键词提取，得到第三目标数据。

特征提取单元，用于对第三目标数据进行特征提取，得到第二预处理数据。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图6所示，此处不再赘述。

由以上方案可知，本申请提供的一种催收决策的确定装置中：首先，第一获取单元701获取目标客户的债务信息；然后，第一提取单元702对债务信息进行指标提取，得到至少一个目标指标信息；最后，第一确定单元703将所有目标指标信息输入至催收决策确定模型中，输出得到针对目标客户的催收决策；其中，催收决策确定模型由智能决策模型、专家规则模型以及多个二分类模型组成。以达到快速、精确的确定针对目标客户的催收决策的目的。

本申请另一实施例提供了一种服务器，如图8所示，包括：

一个或多个处理器801。

存储装置802，其上存储有一个或多个程序。

当所述一个或多个程序被所述一个或多个处理801执行时，使得所述一个或多个处理器801实现如上述实施例中任意一项所述的催收决策的确定方法。

本申请另一实施例提供了一种计算机存储介质，其上存储有计算机程序，其中，计算机程序被处理器执行时实现如上述实施例中任意一项所述的催收决策的确定方法。

在本申请公开的上述实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，直播设备，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：陆佳莹;林建贞;肖爱萍;李璐;章龙;
专利申请人：中国建设银行股份有限公司;