非法资金转移交易的识别方法及装置

文献发布时间：2024-04-18 19:58:26

技术领域

本发明涉及人工智能技术领域，尤其涉及一种非法资金转移交易的识别方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

非法资金转移是指通过各种方式转换、隐瞒、占有、处置等多种方式处理严重上游犯罪收益，主要目的是掩饰犯罪资金的真实来源、性质、资金流向等，将资金伪装成一种合理合法的收益。可疑交易报告是义务机构履行识别非法资金转移交易的核心内容之一，是识别非法资金转移交易工作成果的延伸，为打击非法资金转移提供帮助。义务机构通过在监测系统中镶嵌监测模型以及配合人工甄别可疑资金交易后，分析和提炼涉嫌非法资金转移的情报，有助于遏制非法资金转移的行为，可疑模型在其中发挥重要的作用。

目前，非法资金转移交易监测模型构建中没有融入行业内丰富的业务经验，而专家经验模型可以根据自身的经验并结合实际情况直接对指标赋值，代码开发完成后在生产环境试跑调整赋值，直至满足业务预期效果。但是，利用专家经验模型识别非法资金转移交易的方法存在以下缺陷：一方面当维度过高时容易顾此失彼且调试复杂导致整个模型研发周期拉长；另一方面，主观权重赋值几乎只和业务人员的意志和认识相关，权重缺乏客观性。可疑数据甄别结果有效性差，主要因为人工主观判断占比重、人工识别水平参差不齐。以目前来看，各银行机构的总行或分行层面可能拥有这样的人员配置条件，在大量的银行基层网点中，负责非法资金转移识别工作的人员相关专业素养大多较低，同时这就使得基层非法资金转移识别工作的效率和准确性不够高，导致主观判断出现偏颇。

发明内容

本发明实施例提供一种非法资金转移交易的识别方法，用以提高识别非法资金转移交易的效率和准确性，该方法包括：

获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点；

根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标，其中每个一级参考指标下包含多个二级参考指标；

采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重；

采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重；

根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

本发明实施例还提供一种非法资金转移交易的识别装置，用以提高识别非法资金转移交易的效率和准确性，该装置包括：

历史交易数据获取模块，用于获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点；

参考指标构建模块，用于根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标，其中每个一级参考指标下包含多个二级参考指标；

主观权重确定模块，用于采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重；

客观权重确定模块，用于采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重；

非法资金转移交易识别模型训练模块，用于根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

本发明实施例还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述非法资金转移交易的识别方法。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述非法资金转移交易的识别方法。

本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现上述非法资金转移交易的识别方法。

在本发明实施例中，获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点；根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标；采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重；采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重；根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

本发明通过融合机器学习算法和专家经验模型的人工赋值方法，提供了一种非法资金转移交易的识别方法，可以对海量交易数据进行可疑数据的挖掘，解决了专家经验模型存在着高度系统依赖，使得非法资金转移行为易于规避的问题。在特定类非法交易场景构建时，根据交易场景采用综合权重赋值法完成模型构建，解决了目前专家经验模型人为直接赋值导致维度过多时容易顾此失彼或者指标间出现矛盾的问题，还可以减少繁杂大量指标对比工作，提高识别非法资金转移交易的效率和准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本发明实施例中非法资金转移交易的识别方法的处理流程图；

图2为本发明实施例中构建重要性判断矩阵的方法流程图；

图3为本发明实施例中重新构建重要性判断矩阵的方法流程图；

图4为本发明实施例中非法资金转移交易识别模型的训练与测试过程的方法流程图；

图5为本发明实施例中确定具有非法资金转移风险的交易信息的方法流程图；

图6为本发明实施例中非法资金转移交易的识别装置的结构示意图；

图7为本发明一实施例的计算机设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

首先，对本发明实施例中的技术名词进行介绍：

专家经验模型：专家经验模型就是将业务经验人工编码为机器学习模型结构，并能够实现相同业务场景的复用和快速部署。

层次分析法：层次分析法是指将一个复杂的多目标决策问题作为一个系统，将目标分解为多个目标或准则，进而分解为多指标（或准则、约束）的若干层次，通过定性指标模糊量化方法算出层次单排序（权数）和总排序，以作为目标（多指标）、多方案优化决策的系统方法。

熵值法：熵值法属于一种客观赋值法，其利用数据携带的信息量大小计算权重，得到较为客观的指标权重。熵值是不确定性的一种度量，熵越小，数据携带的信息量越大，权重越大；相反熵越大，信息量越小，权重越小。

发明人发现，现有技术中利用专家经验模型识别非法资金转移交易的方法存在以下缺陷：

1）模型指标维度过多时人工无法顾及：基于业务逻辑完成指标拆分，通常直接拆分为一层，没比对不同属性间的重要性，一层中包含若干个指标信息，在此基础上直接进行赋值；同时由于金融机构监测范围广时，非法资金转移场景通常涉及多个维度监测，当指标过多时，直接考虑某个指标对目标的影响程度时，易出现考虑不周或者顾此失彼导致人为设定和实际认为的不一致数据，甚至出现矛盾数据；

2）主观赋权法过度依赖评分专家：

仅用主观经验直接赋值，无法反映客观性。易受人为主观判断影响，对专家本人综合素质依赖性高。为了客观评价模型引入更多专家时，导致对比更频繁，越容易产生矛盾。

3）头部机构交易量大，全量遍历压力大且不易挖掘潜在关联信息：

金融机构客户数量巨大，头部金融机构日均交易量以亿为单位，大多数资金账户的交易流水并非可疑的交易，可疑交易只是其中的一小部分，专业经验根据特定场景需要遍历全量交易分析，作业处理压力大；此外，业务专家面对高维特征时，不易挖掘出海量交易间潜在的关联关系。

为解决前述技术问题，发明人提出一种非法资金转移交易的识别方法。

图1为本发明实施例中非法资金转移交易的识别方法的处理流程图。如图1所示，本发明实施例中非法资金转移交易的识别方法可以包括：

步骤101、获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点；

步骤102、根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标，其中每个一级参考指标下包含多个二级参考指标；

步骤103、采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重；

步骤104、采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重；

步骤105、根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

下面介绍本发明实施例中非法资金转移交易的识别方法的具体执行步骤：

首先可以执行步骤101，获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点。

具体实施时，可以根据真实发生过的非法资金转移交易，从交易主体的身份信息、资金处理方法和特殊交易行为等方面，总结非法资金转移交易的发生场景和交易特点。

然后可以执行步骤102，根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标，其中每个一级参考指标下包含多个二级参考指标。

具体实施时，在根据非法资金转移交易的发生场景和交易特点构建参考指标时，可以将指标按类别完成自上而下的拆分，最顶层为目标层，通常设一个指标，最底层为指标层。目标层与指标层之间可以按需设置多层，例如可以针对非法资金转移交易的发生场景和交易特点，从身份信息、资金交易、行为三个属性类别出发，这里的三个属性类别即指的一级参考指标，是再根据每个类别（每个一级参考指标）分别设置相关指标（多个二级参考指标）。

接下来，可以执行步骤103、采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重。实施例中，重要性判断矩阵中的元素以预先设定的重要性量化值表征每两个参考指标之间的相对重要性，具体的，层次分析法可以由业务专家参与构建。

图2为本发明实施例中构建重要性判断矩阵的方法流程图。如图2所示，在一个实施例中，采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵，可以包括：

步骤201、采用层次分析法，确定每两个一级参考指标之间的第一重要性相对关系，根据第一重要性相对关系和预先设定的重要度量化值，构建第一重要性判断矩阵；

步骤202、采用层次分析法，分别确定每个一级参考指标下的每两个二级参考指标之间的第二重要性相对关系，根据第二重要性相对关系和预先设定的重要度量化值，构建多个第二重要性判断矩阵。

下面通过举例说明构建重要性判断矩阵的具体步骤：

在构建多个一级参考指标和二级参考指标之后，根据创建的指标层次架构，可明确上一层与下一层的从属关系。设置权重的目的是区分不同指标的重要程度，对大部分包含多个指标的复杂问题，区分指标的重要程度并不容易，层次分析法采用两两比较的方法。对某组n个指标构建判断矩阵，如下所示：

矩阵中a

表1

仍以多个一级参考指标，以及每个一级参考指标下的多个二级参考指标为例，根据指标体系结合数据统计辅助完成矩阵构建，可以得到1个第一重要性判断矩阵（矩阵A），3个第二重要性判断矩阵（矩阵B1、B2和B3），如下所示：

需要说明的是，以上各重要性判断矩阵包含了指标之间的相对重要性，根据矩阵理论中矩阵最大特征根对应的特征向量表征原矩阵的特征，故可用重要性判断矩阵的最大特征根对应的特征向量表征每个层次指标的相对权重。由于每层指标的权重和为一，因此用归一化后的最大特征向量作为指标的权重。表2示出了本发明实施例中每个参考指标的主观权重，由于二级参考指标对应的具体内容不宜公开，用子指标C1、 C2、C3 等替代，如表2所示：

表2 主观权重赋值结果

由于确定不同参考指标之间的重要性相对关系时，受人为影响较大，容易出现误差，导致后续主观权重赋值不准确，为进一步提高主观权重赋值的合理性和准确性，可以通过预先设定重要性相对关系的置信度，计算对应的置信区间，从而可以根据置信区间，调整重要性相对关系，重新构建对应的重要性判断矩阵。

图3为本发明实施例中重新构建重要性判断矩阵的方法流程图。如图3所示，在一个实施例中，还可以包括：

步骤301、预先设定第一重要性相对关系和第二重要性相对关系对应的置信度；

步骤302、根据第一重要性相对关系和第二重要性相对关系对应的置信度，计算对应的置信区间；

步骤303、根据所述置信区间，调整第一重要性相对关系和第二重要性相对关系；

步骤304、根据调整后的第一重要性相对关系和第二重要性相对关系，以及预先设定的重要性量化值，重新构建对应的重要性判断矩阵；

步骤305、将重新构建的重要性判断矩阵中最大特征值对应的特征向量作为新的权向量，其中新的权向量中的每个数值表征每个参考指标新的主观权重。

需要说明的是，多名专家标度基础上，引入统计学进行校验，辅助矩阵构建。置信度，即估计值与总体参数在一定允许的误差范围以内，其相应的概率有多大，这个相应的概率称作置信度。置信区间，由总体样本构造的对总体参数估计的一个区间，每一个置信区间会对应一个置信水平，表示真实参数落在置信区间中的概率，置信区间随着置信度的变化而变化，计算公式如下：

数学定理：x

下面介绍对重要性判断矩阵进行一致性校验的具体步骤：

具体实施时，在根据九级标度法构建重要性判断矩阵时，由于专家业务人员对各指标之间的相对重要程度存在主观偏好，有可能造成根据重要性判断矩阵计算的指标权重存在矛盾的情况。比如：对A，B，C三个指标进行九级标度时，认为A比B重要，B比C重要，而C又比A重要，则该标度存在逻辑矛盾，导致后续主观权重赋值不准确。

为避免因防止此类情况的发生，还可以对重要性判断矩阵进行一致性检验，并反复进行修正，直到各指标满足一致性。例如，可以矩阵阶数超过2时进行一致性校验，校验公式如下所示，采用平均随机性一致性指标RI(表3)修正CI计算得出CR，当CR小于0.1时，则判断矩阵通过一致性校验，否则调整矩阵重复以上步骤，直到通过一致性校验，即CR小于0.1。

其中，λ

表3

在确定每个参考指标的主观权重之后，可以执行步骤104确定每个参考指标的客观权重。在步骤104中，采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重。

下面介绍确定每个参考指标的客观权重的具体步骤：

具体实施时，首先为消除数据间量纲影响，对数据进行标准化处理，可以采用极差变换法对正负方向指标数据进行处理，正负指标处理公式如(5)(6)，数据标准化处理后存在数据为0的结果，而熵值法算法中存在对数函数要求数据不存在0，为了消除这种影响，标准化的矩阵进行平移处理公式如(7)，为了保证不破坏原数据的规律，顾的取值尽量小，本次选值为0.0001，最后得出标准化矩阵。

其中，

然后，对于标准化矩阵(包括m个样本，n个指标)，计算指标信息熵(8)，根据信息熵计算差异系数，进而得出指标的客观权重(9)，公式如下：

采用熵值法计算监测指标的客观权重，信息熵越小，无序程度越低，信息效用就越高，指标贡献度越高，则所占指标的权重就越大。其中，Ej为指标信息熵计算结果，1-Ej为差异系数，根据差异系数计算第i个指标的客观权重Wj。其中，信息用效用可用差异系数表示。

以前述一级参考指标资金交易为例，表4示出了其对应的多个二级参考指标的客观权重，如下所示：

表4 客观权重赋值结果

在确定每个参考指标的主观权重和每个参考指标的客观权重之后，执行步骤105，先根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；再根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

需要说明的是，层次分析法权重计算结果主要考虑的是业务人员的决策经验，主观性强，矩阵构建过程中随意性较大，与业务人员本身的专业素养息息相关。熵值法权重计算结果依托客观数据，客观性强，而可疑交易监测和行业经验息息相关，融入人为经验的经济价值更高。w

其中，

将层次分析法和熵值法计算的权重结果代入上面公式，最终计算出综合权重计算结果如表5所示：

表5 综合权重计算结果

图4为本发明实施例中非法资金转移交易识别模型的训练与测试过程的方法流程图。如图4所示，在一个实施例中，所述非法资金转移交易识别模型的训练与测试过程包括：

步骤401、将每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果作为样本数据，构建训练集和测试集；

步骤402、利用训练集对机器学习模型进行训练，得到所述非法资金转移交易识别模型；

步骤403、利用测试集对所述非法资金转移交易识别模型进行测试。

为进一步提高识别非法资金转移交易的效率，还可以在待识别的交易信息进行识别之前，引入高斯混合模型GMM，用于得到待识别交易信息的聚类分布特征，由于不法分子故意隐藏或采用特殊方法处理交易，导致非法资金转移交易的交易信息多显示为离群点或聚类簇小的交易。因此通过高斯混合模型GMM，可以快速提取出具有非法资金转移风险的交易信息，之后再对这些具有非法资金转移风险的交易信息进行识别，可以大大提高识别非法资金转移交易的效率。

图5为本发明实施例中确定具有非法资金转移风险的交易信息的方法流程图。如图5所示，在一个实施例中，还可以包括：

步骤501、获取多条待识别的交易信息，将多条待识别的交易信息输入高斯混合模型GMM，输出多条待识别的交易信息的聚类分布结果；

步骤502、根据多条待识别的交易信息的聚类分布结果和预先设定的风险交易分布特征，确定具有非法资金转移风险的交易信息；

步骤503、利用所述非法资金转移交易识别模型，对具有非法资金转移风险的交易信息进行识别。

下面介绍利用高斯混合模型GMM对待识别的交易信息的进行聚类分布的具体步骤：

1）原始交易预处理

筛选符合高斯分布的特征作为入模参数，交易流水中的银行卡号、开户机构、持卡人手机号等特征不符合本发明的预想的高斯分布需要剔除。将交易日期、交易时间、借方交易金额等符合预期的特征筛选出来。验证数据质量确定入模特征。

2）模型输入

将入模特征读取进去模型，GMM模型会根据输入的数据逐个计算高斯分布的方差，根据预先设定的高斯分布对应的权重大小来求得最大期望，通过迭代均值和方差求解最大似然值，数学表达式（4-1）如下：

其中，p(x)为总概率密度，n为高斯概率密度分量的总数，x为多维向量，

3）模型输出

GMM混合模型进行聚类信息提取，迭代处理直至收敛后输出。根据输出的结果，将离群点和聚类簇小的作为识别出的具有非法资金转移风险的可疑交易集合R。

本发明实施例中还提供了一种非法资金转移交易的识别装置，如下面的实施例所述。由于该装置解决问题的原理与非法资金转移交易的识别方法相似，因此该装置的实施可以参见非法资金转移交易的识别方法的实施，重复之处不再赘述。

图6为本发明实施例中非法资金转移交易的识别装置的结构示意图。如图6所示，本发明实施例中非法资金转移交易的识别装置具体可以包括：

历史交易数据获取模块601，用于获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点。

参考指标构建模块602，用于根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标，其中每个一级参考指标下包含多个二级参考指标；

主观权重确定模块603，用于采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重；

客观权重确定模块604，用于采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重；

非法资金转移交易识别模型训练模块605，用于根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

在一个实施例中，主观权重确定模块603具体用于：

采用层次分析法，确定每两个一级参考指标之间的第一重要性相对关系，根据第一重要性相对关系和预先设定的重要度量化值，构建第一重要性判断矩阵；

采用层次分析法，分别确定每个一级参考指标下的每两个二级参考指标之间的第二重要性相对关系，根据第二重要性相对关系和预先设定的重要度量化值，构建多个第二重要性判断矩阵。

在一个实施例中，还包括重要性判断矩阵重新构建模块，用于：

预先设定第一重要性相对关系和第二重要性相对关系对应的置信度；

根据第一重要性相对关系和第二重要性相对关系对应的置信度，计算对应的置信区间；

根据所述置信区间，调整第一重要性相对关系和第二重要性相对关系；

根据调整后的第一重要性相对关系和第二重要性相对关系，以及预先设定的重要性量化值，重新构建对应的重要性判断矩阵；

将重新构建的重要性判断矩阵中最大特征值对应的特征向量作为新的权向量，其中新的权向量中的每个数值表征每个参考指标新的主观权重。

在一个实施例中，所述非法资金转移交易识别模型的训练与测试过程包括：

将每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果作为样本数据，构建训练集和测试集；

利用训练集对机器学习模型进行训练，得到所述非法资金转移交易识别模型；

利用测试集对所述非法资金转移交易识别模型进行测试。

在一个实施例中，还包括聚类与识别模块，用于：

获取多条待识别的交易信息，将多条待识别的交易信息输入高斯混合模型GMM，输出多条待识别的交易信息的聚类分布结果；

根据多条待识别的交易信息的聚类分布结果和预先设定的风险交易分布特征，确定具有非法资金转移风险的交易信息；

利用所述非法资金转移交易识别模型，对具有非法资金转移风险的交易信息进行识别。

基于前述发明构思，如图7所示，本发明还提出了一种计算机设备700，包括存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序730，所述处理器720执行所述计算机程序730时实现前述非法资金转移交易的识别方法。

综上所述，在本发明实施例中，获取历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果；根据历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，确定非法资金转移交易的发生场景和交易特点；根据非法资金转移交易的发生场景和交易特点，构建识别非法资金转移交易的多个一级参考指标和二级参考指标；采用层次分析法，分别根据多个一级参考指标、每个一级参考指标下的多个二级参考指标，以及预先设定的重要性量化值，构建对应的重要性判断矩阵；将重要性判断矩阵中最大特征值对应的特征向量作为权向量，其中权向量中的每个数值表征每个参考指标的主观权重；采用极差变换法，分别对多个一级参考指标对应的历史交易数据、每个一级参考指标下的多个二级参考指标对应的历史交易数据进行数据标准化处理，得到对应的标准化矩阵；采用熵值法，计算标准化矩阵中每个参考指标的信息熵；根据每个参考指标的信息熵，计算每个参考指标的差异系数；根据每个参考指标的差异系数，确定每个参考指标的客观权重；根据每个参考指标的主观权重和每个参考指标的客观权重，确定每个参考指标的综合权重；根据每个参考指标的综合权重、每个参考指标对应的历史交易数据，以及历史交易数据实际对应的非法资金转移识别结果，对机器学习模型训练，得到非法资金转移交易识别模型；利用所述非法资金转移交易识别模型，对待识别的交易信息进行识别。

本发明通过融合机器学习算法和专家经验模型，提供了一种非法资金转移交易的识别方法，可以对海量交易数据进行可疑数据的挖掘，解决了专家经验模型存在着高度系统依赖，使得非法资金转移行为易于规避的问题。在特定类犯罪场景构建时，根据交易场景采用综合赋值法完成模型构建，解决了目前专家经验模型人为直接赋值导致维度过多时容易顾此失彼或者指标间出现矛盾的问题，同时融入统计学相关理论辅助专家判断，减少繁杂大量指标对比工作，提高识别非法资金转移交易的效率和准确性。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：中国建设银行股份有限公司;

上一篇：一种NetCDF气象数据处理方法及终端
下一篇：图像增强方法、图像处理方法、计算机设备及存储介质