掌桥专利:专业的专利平台
掌桥专利
首页

基于强化学习的个人金融信息敏感数据安全保护系统

文献发布时间:2024-04-18 19:58:53


基于强化学习的个人金融信息敏感数据安全保护系统

技术领域

本发明涉及人工智能和数据安全领域,尤其涉及一种基于强化学习的个人金融信息敏感数据安全保护系统,属于计算机软件。

背景技术

个人金融信息是指公民在进行与本人有关的财产、股票、存款、商品交易等金融有关的商业活动中涉及的个人基本信息,例如:公民的身份证、银行账号、住址和个人电话信息等;这些信息涉及公民的个人隐私数据。如果这些隐私数据被盗取或者滥用,会对用户造成不可估量的资金和财产损失。

个人金融信息敏感数据的安全保护是用户信息安全的重要内容,尤其对数据安全领域的各种隐私保护方法提出了严峻的挑战。一方面,由于个人金融业务数量的急剧增加,个人理财、存款、商品交易等金融衍生业务的不断扩展,交易数据量不断增加,单纯地依靠人工处理已经难以应对这种数据量增加的形势。另一个方面,由于在线支付、5G等互联网金融服务的大量涌现,各种在线交易平台的数据中保留了大量的个人金融信息,这些信息包括很多用户的敏感数据,例如:用户的信用卡账号、用户的手机和所购买商品的信息等,这些用户敏感数据的保护,对于保障用户金融数据的安全非常重要。

随着近年人工智能技术的不断发展,人工智能技术在诸多研究领域由实验室的研究阶段已经升级为产品阶段,并且不断地影响人们的生活。人工智能技术是一把“双刃剑”。人工智能技术可以带给人们极大的便利和提高工作的效率,例如:在某高校的宿舍入口安置的一台人脸识别闸机,利用人工智能的人脸识别技术可以不必安置保安人员而进行24小时无人看守出入监控;人工智能技术节约了大量的人力成本,提高了工作效率。然而,利用人工智能技术进行大数据的分析亦可发现某些客户的购物需求,不法商贩通过贩卖这些信息从中获利。

如何有效地利用人工智能技术保护个人金融信息敏感数据安全是一个重要的研究课题。一般而言,通过软件系统实现个人金融信息的安全保护可以分为二类:一类是将信息保护的方法集成到软件系统中,当用户使用的过程中直接进行信息保护,这里我们将这种类型的软件叫做“直接保护的软件系统”;例如:在大量的在线网站中使用的密码系统,为了避免系统管理员泄露用户密码,或者黑客的攻击,使用哈希的方法保存密码在数据库中,存储的密码是散列值。另一类是将信息保护的方法通过间接的第三方或者中间件的方式进行保护,通过中间软件对数据进行封装或者隐藏,避免用户敏感信息的泄露,这里我们将这种类型的软件叫做“间接保护的软件系统”;例如:通过数据脱敏系统或者通过授权的方式将使用的数据传送给使用者。

个人金融信息的敏感数据安全保护具有非常重要的意义,以下列举一些示例:

实例1:某信用卡公司需要通过用户的信用卡消费记录分析客户的购物习惯和行为,以提供个性化的推荐和定制化的服务。然而,如果这些数据存储为明文被人工智能数据公司使用,一旦服务器被攻击,客户的消费数据泄露将暴露用户的购物习惯、购物地点、身份信息等可能会导致用户被诈骗、个人信用破坏等问题。故而需要对这些敏感数据进行保护处理,这样可以保护用户的信息不被泄露,同时也不影响数据分析和处理,以精准提供个性化的推荐和服务。

实例2:某证券公司为了提高交易效率和客户满意度,推出的线上投资咨询服务为客户提供有利回报的投资产品,为此需要了解客户的需求,收录行业动态,公司财务状况等信息。则需要对用户的个人身份信息、银行卡号、支付宝账号等财务信息以及客户的投资需求、偏好、收益等信息进行数据分析处理。若这些信息泄露则可能被他人用于非法活动,如出售虚假账号、办理贷款,盗刷用户资金等。

实例3:某保险公司为确保其保险产品可行性和持续性,需要收录与保险风险相关的信息,包括保险人的基本信息,保险合同的条款和条件,保险产品的类型和投保规模等以及要收录与运营风险相关的信息,包括内部控制制度和流程,员工的素质和培训情况,业务运营的数据和统计信息等许多信息进行风险管理和模型验证。在此过程中如果有个人金融信息遭到泄露,那么存在保险客户身份信息泄露和财产损失的可能。保险公司的金融数据、投资策略等敏感信息泄露也可能导致投资风险增加,造成金融损失。

综上所述,个人金融信息敏感数据的安全保护对于用户、金融机构等具有重要的意义。

发明内容

(一)要解决的技术问题

本发明的目的是提出一种基于强化学习的个人金融信息敏感数据安全保护系统,使用户金融信息的敏感数据安全性更高,可以让金融机构更好地使用用户数据资源,为用户提供所需服务;其中,对于主要的技术问题阐述如下:

第一技术问题:目前还没有统一的标准提供给软件系统接口

虽然个人金融信息敏感数据已经获得立法保护,但是大部分采用人工授权和人工隐藏等方法,对于如何在数据库、分析软件和输出系统之间转换用户信息还没有统一的标准和规范,这种情况不利于数据的使用;

第二技术问题:由于使用的个人金融信息重复,影响数据分析的效果

由于软件系统所使用的个人金融信息大量存在重复数据,严重影响了大数据分析的正确性和准确性,此外,软件系统本身没有进行个人金融信息的特征提取,很难真实反映大部分客户的需求;

第三技术问题:个人金融信息的敏感信息数据分类不规范

不同的金融机构在个人金融信息的敏感数据使用中,侧重点不同,因此不同的分类信息造成敏感信息的不一致,导致用户信息泄露;此外,应该严格区分个人金融信息的敏感数据级别。

(二)技术方案

为了解决上述技术问题,本发明提供了一种基于强化学习的个人金融信息敏感数据安全保护系统,主要技术路线包括:

1. 针对解决软件接口的标准,本发明提出了对个人金融信息中基础信息的加密保护和映射,定义了主要的第三方或者中间件使用的数据接口标准,采用该标准的金融机构和软件公司可以方便、安全地进行数据处理;

2. 针对解决个人金融信息重复的问题,本发明提出利用强化学习的方法提取个人金融信息的特征,并通过不断地训练完善系统,达到真实反映大部分客户的需求,准确进行数据分析和处理;

3. 针对解决敏感数据信息分类不规范问题,本发明提供了一种初步的敏感数据分类方法,以及敏感数据权重值法,使得数据在使用中具有更高的安全性,增加系统的效率。

为了进一步阐述本发明的技术方案,实现步骤阐述如下:

Part_1,定义软件系统接口参数和数据格式,定义个人金融信息的敏感数据集合和加细分类集合,加密敏感数据,初始化系统参数和训练集,循环进行强化学习训练;

Part_2,由软件系统入口通过数据接口导入特征数据,提取特征,进行数据加工和处理;

Part_3,由软件系统出口还原用户基础数据,输出数据处理结果。

基于强化学习的个人金融信息敏感数据安全保护系统的具体过程描述如下:

首先进行数据结构、函数和过程的定义:

DataStruct_1:数据结构定义

DataStruct_1_1:索引值定义

定义i和j是整数,代表在集合、矩阵、向量中的索引值。

DataStruct_1_2:向量定义

向量Vector={vr_1, vr_2, ..., vr_i, ..., vr_LenSet

Vector

DataStruct_1_3:矩阵定义

矩阵Matrix=[

{mx_1_1, mx_1_2, ..., mx_1_j, ..., mx_1_LenJ},

{mx_2_1, mx_2_2, ..., mx_2_j, ..., mx_2_LenJ},

{mx_i_1, mx_i_2, ..., mx_i_j, ..., mx_i_LenJ},

{mx_LenI_1, mx_LenI_2, ..., mx_LenI_j, ..., mx_LenI_LenJ}]

其中,i代表矩阵Matrix的第i行,j代表矩阵Matrix的第j列,LenI代表矩阵的行数,LenJ代表矩阵的列数。

DataStruct_1_4:主键/键值定义

主键(Key)定义为关键字,在系统中具有唯一性,不重复;

键值(Value)定义为Key对应的值,Value可以对应数值、集合、矩阵、向量、指针、程序设计语言中的数据类型、字符串等。

DataStruct_1_5:在条件下取值定义

Condition代表条件

DataStruct_1_5_1:Condition(Sets)代表条件取值自集合Sets中元素;

DataStruct_1_5_2:Condition_1|Condition_2代表条件Condition_1在另一个条件Condition_2下取值。

DataStruct_2:集合的加细分类定义

假设集合Collection的任意两个划分Collection_A和Collection_B:

Collection_A={ca_1, ca_2, ..., ca_i, ..., ca_LenCollection

Collection_B={cb_1, cb_2, ..., cb_j, ..., cb_LenCollection

其中,ca_i是Collection_A的第i个元素,cb_j是Collection_B的第j个元素,LenCollection

如果对于每一个ca_i均有cb_j,且满足ca_i包含于cb_j中,那么Collection_A称为是Collection_B的加细分类集合。

DataStruct_3:个人金融信息定义

DataStruct_3_1:Person_BaseInfo定义为个人基本信息集合

Person_BaseInfo={身份证(PID), 护照号(PPassport), 姓名(PName), 个人电话(PPhone), 个人住址(PAddress), 工作单位(POrganization), Person_BaseInfo附加信息}

DataStruct_3_2:Person_BankCard定义为个人金融卡信息集合

Person_BankCard={信用卡_1, ..., 信用卡_i, ..., 储蓄卡_1, ..., 储蓄卡_j, Person_BankCard附加信息}

DataStruct_3_3:Person_OtherInfo定义为个人其它信息集合

Person_OtherInfo={国籍, 性别, 民族, 职业, 工作年限, 婚姻状况, 家庭状况, Person_OtherInfo附加信息}

DataStruct_3_4:Person_Property定义为个人财产信息集合

Person_Property={个人财产评估等级, 个人月收入, 个人年收入, 拥有的不动产数量, 拥有私人汽车数量, 个人月纳税额, 个人年纳税额, 公积金缴存金额, 个人账户总额, 月交易最大金额, 年交易最大金额, Person_Property附加信息}

DataStruct_3_5:Person_Credit定义为个人信用信息集合

Person_Credit={个人信用评估等级, 房贷/月, 车贷/月, 银行抵押, 信用卡还款/月, 贷款偿还/年, 支付宝信用等级, 个人贷款最大金额, Person_Credit附加信息}

DataStruct_3_6:Person_Financing定义为个人资金使用信息集合

Person_Financing={个人资金使用评估等级, 个人资金支付/结算情况, 个人国债, 个人理财, 个人保险, 个人证券, 个人基金, 个人期货, 个人定期存款, 个人海外投资, 个人海外资产, 个人接受海外投资, Person_Financing附加信息}

DataStruct_3_7:Person_Relating定义为个人金融衍生信息集合

Person_Relating={个人金融衍生指标评价等级, 个人网上交易记录, 个人消费习惯, 个人投资意愿, 个人市内主要交通工具, 个人出行主要交通工具, 个人月最大消费金额/商品, 个人最大年消费金额/商品, 个人年平均消费金额, 个人月平均消费金额,Person_Relating附加信息}

DataStruct_3_8:Person_UserDef定义为个人金融信息用户自定义集合。

DataStruct_4:Markov状态集RL_States定义

RL_States={rls_1, rls_2, ..., rls_i, ...}

DataStruct_5:Markov动作集RL_Actions定义

RL_Actions={rla_1, rla_2, ..., rla_i, ...}

DataStruct_6:Markov状态转移概率RL_Probability(RLP)定义

RL_Probability=RLP[rls_(t+1)|(rls_t, rla_t)]

其中,t代表时间步;

rls_t代表状态集RL_States在t时刻的值,下一个时刻(t+1)的值为rls_(t+1);

rla_t代表动作集RL_Actions在t时刻的值。

DataStruct_7:Markov即时奖励RL_Rewards(RLR)定义

RL_Rewards=RLR(t+1)|(rls_t, rla_t)

其中,RLR(t+1)代表RL_Rewards在(t+1)时刻的值。

DataStruct_8:策略和值函数

DataStruct_8_1:策略RL_Policy(RL_Actions|RL_States)表示在状态RL_States下执行动作RL_Actions的概率;

DataStruct_8_2:折扣回报RL_G定义

RL_G(t)=RLR(t+1)+RL_f *RLR(t+2)+…+RL_f

其中,T_end是终止时间步,RL_f是折扣因子;

DataStruct_8_3:状态-动作值函数RL_Value表示从当前状态cur_s出发且动作为cur_a的期望回报E:

RL_Value(cur_s, cur_a)=E[RL_G(t)|(RL_States(cur_s), RL_Actions(cur_a))]

DataStruct_9:软件系统指令集定义

DataStruct_9_1:Encrypt代表软件系统加密指令

DataStruct_9_2:Decrypt代表软件系统解密指令

DataStruct_9_3:RL_Training代表进行强化学习的训练指令

DataStruct_9_4:RL_ComputUpdate代表进行更新的指令

DataStruct_9_5:RL_FormatDataSets代表格式化数据集合指令

DataStruct_9_6:RL_GetProperty代表返回特征数据结果指令

DataStruct_9_7:RL_GetActions代表从动作集抽取元素指令

DataStruct_9_8:RL_MapReduce代表规约操作指令

数据结构定义结束。

其次,说明软件系统的基本函数和过程:

Procedure_1:过程定义

Procedure_1_1:初始化过程InitiatProc定义

InitiatProc(IPCommand, IP_InData, IP_OutData),其中,参数IPCommand代表在初始化过程InitiatProc中需要执行的系统命令,参数IP_InData代表所需输入的数据,参数IP_OutData代表完成初始化后输出的数据。

Procedure_1_2:软件系统入口SysEntry定义

SysEntry(SECommand, SE_InData, SE_OutData),其中,参数SECommand代表在软件系统入口SysEntry中需要执行的系统命令,参数SE_InData代表所需输入的数据,参数SE_OutData代表完成SysEntry后输出的数据。

Procedure_1_3:软件系统出口SysReturn定义

SysReturn(SRCommand, SR_InData, SR_OutData),其中,参数SRCommand代表在软件系统出口SysReturn中需要执行的系统命令,参数SR_InData代表所需输入的数据,参数SR_OutData代表完成SysReturn后输出的数据。

Procedure_1_4:执行过程ExecutProc定义

ExecutProc(ProcedureName),其中,参数ProcedureName代表在执行过程ExecutProc中需要完成的任务名称。

Function_1:函数定义

Function_1_1:初始化函数InitiatFunc定义

InitiatFunc(IF_InData, IF_Value),其中,初始化参数IF_InData所需的数据值来自参数IF_Value。

Function_1_2:执行函数ExecutFunc定义

ExecutFunc(FunctionName, EF_Sets),其中,参数FunctionName代表在执行函数ExecutFunc中需要完成的函数名称,参数EF_Sets代表执行计算的数据集合名称。

Function_1_3:Hash(HSMethodName, Key, Value)代表使用HSMethodName方法对Key进行散列后获得散列值为Value。

RL_Prediction代表强化学习预测过程,具体为:

定义and代表“与”;

定义empty代表空值;

定义MaxRewordValue代表最大回报值;

RL_Prediction_Step_1:

InitiatFunc(RL_Rewards, empty);

ExecutProc(RL_Policy(RL_Actions|RL_States));

RL_Prediction_Step_2:

for(i=0; i

RL_Prediction_Step_3:

ExecutFunc(RL_GetActions, RL_Actions);

RL_Prediction_Step_4:

ExecutFunc(RL_ComputUpdate, RL_Rewards and RL_States);

RL_Prediction_Step_5:

ExecutFunc(RL_ComputUpdate, RL_G(t));

RL_Prediction_Step_6:

ExecutProc(RL_Value(cur_s, cur_a));

RL_Prediction_Step_7:

If(cur_s is MaxRewordValue) 转向RL_Prediction_Step_8;

Else 转向RL_Prediction_Step_2;

RL_Prediction_Step_8:结束for循环;

RL_Prediction_Step_9:RL_Prediction过程结束。

Part_1具体实现过程如下:

Part_1_Step_1:采集个人金融信息,初始化训练集

在获得授权的情况下,通过DataStruct_3格式化个人金融信息的数据,这样做的主要目的在于:分离不同形式的数据,区别基础数据并加以保护,对特征数据进行加工和处理。建立个人金融信息的加细分类集合,按照权重分类定义Person_BaseInfo和Person_BankCard为敏感数据集合,定义数据分析集合以及用户自定义Person_UserDef集合扩展系统分析的数据,定义训练特征矩阵Matrix_Training、目标矩阵Matrix_Target、权重值矩阵Matrix_WeightVal;初始化Markov决策过程:初始化状态集RL_States、动作集RL_Actions和状态转移概率RL_Probability,初始化RLR(t=0)的值。

Part_1_Step_2:个人金融信息分类整理

根据DataStruct_1_4定义,建立在Person_BaseInfo集合上由PID、PPassport的Key/Value数据集,系统设定哈希算法HSMethodName,给定Key=PID,计算Hash(HSMethodName, PID, PID_Value),其中PID_Value为散列PID获得的值;如果PID_Value出现重复;那么,执行Key=PPassport,计算Hash(HSMethodName, PPassport, PPassport_Value),其中PPassport_Value为散列PPassport获得的值,当PPassport_Value相同时,建立在Person_BaseInfo集合上由PID、PPassport为Key/Value的特征数据,舍去数据中重复的特征数据,这样做的目的在于:对来自同源的数据进行规约和加细分类,统一在软件系统中进行加工和处理。

Part_1_Step_3:加密个人金融信息基础数据

经过初步整理的数据按照Key/Value进行加密处理:

SysEntry(Encrypt, Person_BaseInfo, Vector_Person_BaseInfo);

SysEntry(Encrypt, Person_BankCard, Vector_Person_BankCard);

Person_BaseInfo和Person_BankCard的个人金融信息的敏感数据均被加密到向量Vector_Person_BaseInfo和向量Vector_Person_BankCard进行保护,这样做的目的在于:在特征数据的使用中,避免个人金融信息的敏感数据泄露个人隐私。在已经建立的训练集中进行训练:

ExecutProc(RL_FormatDataSets);

ExecutProc(RL_Training);

ExecutFunc(RL_ComputUpdate, Matrix_WeightVal);

Part_1过程描述完毕。

Part_2具体实现过程如下:

Part_2 _Step_1:导入特征数据

InitiatFunc(Vector_Person_OtherInfo, Person_OtherInfo);

InitiatFunc(Vector_Person_Property, Person_Property);

InitiatFunc(Vector_Person_Credit, Person_Credit);

InitiatFunc(Vector_Person_Financing, Person_Financing);

InitiatFunc(Vector_Person_Relating, Person_Relating);

InitiatFunc(Vector_Person_UserDef , Person_UserDef);

其中,参数说明如下:

Vector_Person_OtherInfo代表Person_OtherInfo规格化向量

Vector_Person_Property代表Person_Property规格化向量

Vector_Person_Credit代表Person_Credit规格化向量

Vector_Person_Financing代表Person_Financing规格化向量

Vector_Person_Relating代表Person_Relating规格化向量

Vector_Person_UserDef代表Person_UserDef规格化向量

Part_2 _Step_2:特征提取

InitiatProc(RL_FormatDataSets, Vector_Person_OtherInfo, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_Property, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_Credit, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_Financing, Matrix_Target);

InitiatProc(RL_FormatDataSets,Vector_Person_Relating, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_UserDef, Matrix_Target);

Part_2 _Step_3:预测分析数据

ExecutProc(RL_Prediction);

Part_2过程描述完毕。

Part_3具体实现过程如下:

Part_3 _Step_1:软件系统出口规约数据

ExecutProc(RL_MapReduce);

Part_3 _Step_2:输出结果集

InitiatProc(RL_GetProperty, Matrix_Target, Vector

其中,Vector

Part_3 _Step_3:软件系统出口还原用户敏感信息

SysReturn(Decrypt, Vector_Person_BaseInfo, Person_BaseInfo);

SysReturn(Decrypt, Vector_Person_BankCard, Person_BankCard);

Part_3过程描述完毕。

(三)有益效果

本发明的有益效果体现在以下:

1.本发明提供了一种初级的个人金融信息敏感数据的加细集合分类方法,对于通过软件接口进行个人金融信息处理进行了一定的探索。

2.本发明通过人工智能的强化学习方法,从个人金融信息中发掘数据的特征,并进行训练,在充分保障个人信息安全的情况下最大限度利用人工智能进行数据处理。

3.本发明提供了一种在金融机构、软件供应商和第三方数据存储机构等共享数据的模式,在最大限度保护个人金融信息中敏感数据安全的前提下,探索了推动金融数据分析、处理的有效解决方案。

附图说明

图1是基于强化学习的个人金融信息敏感数据安全保护系统的结构图。

实施方式

下面结合附图和实例对本发明的实施方式进一步详细描述。以下实例用于说明本发明,但不能用来限制发明的范围。

实例1:某信贷机构AgentCredit进入软件系统入口,启动准备阶段。

进入软件系统入口准备阶段具体步骤如下:

Part_1_Step_1:采集个人金融信息,初始化训练集

首先,AgentCredit授权软件公司SoftComOne使用数据,在授权的情况下通过DataStruct_3格式化个人金融信息的数据。建立个人金融信息的加细分类集合,按照权重分类定义Person_BaseInfo和Person_BankCard为敏感数据集合,由于AgentCredit只具有个人信用信息,因此,对Person_Credit个人信用信息集合规格化处理,包括:个人信用评估等级(PersonCreditRank), 房贷/月, 车贷/月, 银行抵押, 信用卡还款/月, 贷款偿还/年, 支付宝信用等级, 个人贷款最大金额, Person_Credit附加信息;某信贷机构AgentCredit没有提供Person_Relating和Person_UserDef数据特征集,因此,忽略该特征数据集;其它个人金融信息的加细分类集合设置为默认值,定义训练特征矩阵Matrix_Training、目标矩阵Matrix_Target、权重值矩阵Matrix_WeightVal;初始化Markov决策过程:初始化状态集RL_States、动作集RL_Actions和状态转移概率RL_Probability,初始化RLR(t=0)的值。

Part_1_Step_2:个人金融信息分类整理

根据DataStruct_1_4定义,建立在Person_BaseInfo集合上由PID、PPassport的Key/Value数据集,系统设定哈希算法HSMethodName为MD5,给定Key=PID,计算Hash(MD5,PID, PID_Value),其中PID_Value为散列PID获得的值;如果PID_Value出现重复;那么,执行Key=PPassport,计算Hash(MD5, PPassport, PPassport_Value),其中PPassport_Value为散列PPassport获得的值,当PPassport_Value相同时,建立在Person_BaseInfo集合上由PID、PPassport为Key/Value的特征数据,舍去数据中重复的特征数据。

Part_1_Step_3:加密个人金融信息基础数据

经过初步整理的数据按照Key/Value进行加密处理:

SysEntry(Encrypt, Person_BaseInfo, Vector_Person_BaseInfo);

SysEntry(Encrypt, Person_BankCard, Vector_Person_BankCard);

Person_BaseInfo和Person_BankCard的个人金融信息的敏感数据均被加密到向量Vector_Person_BaseInfo和向量Vector_Person_BankCard进行保护,在已经建立的训练集中进行训练:

ExecutProc(RL_FormatDataSets);

ExecutProc(RL_Training);

ExecutFunc(RL_ComputUpdate, Matrix_WeightVal);

准备阶段结束。

实例2:软件公司SoftComOne进入软件系统入口,处理数据。

软件公司SoftComOne进入软件系统入口,开始处理数据,具体过程为:

Part_2 _Step_1:导入特征数据

InitiatFunc(Vector_Person_OtherInfo, Person_OtherInfo);

InitiatFunc(Vector_Person_Property, Person_Property);

InitiatFunc(Vector_Person_Credit, Person_Credit);

InitiatFunc(Vector_Person_Financing, Person_Financing);

由于某信贷机构AgentCredit没有提供Person_Relating和Person_UserDef数据特征集,因此,软件系统入口不需要处理该特征数据集。

Part_2 _Step_2:特征提取

InitiatProc(RL_FormatDataSets, Vector_Person_OtherInfo, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_Property, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_Credit, Matrix_Target);

InitiatProc(RL_FormatDataSets, Vector_Person_Financing, Matrix_Target);

由于某信贷机构AgentCredit没有提供Person_Relating和Person_UserDef数据特征集,因此,软件系统入口不需要提取该特征数据集。

Part_2 _Step_3:预测分析数据

ExecutProc(RL_Prediction);

软件公司SoftComOne处理数据完毕。

实例3:软件公司SoftComOne进入软件系统出口还原用户核心数据,输出结果集。

具体过程如下:

Part_3 _Step_1:软件系统出口规约数据

ExecutProc(RL_MapReduce);

Part_3 _Step_2:输出结果集

InitiatProc(RL_GetProperty, Matrix_Target, Vector

在Vector

Part_3 _Step_3:软件系统出口还原用户敏感信息

SysReturn(Decrypt, Vector_Person_BaseInfo, Person_BaseInfo);

SysReturn(Decrypt, Vector_Person_BankCard, Person_BankCard);

软件公司SoftComOne通过软件系统对采集的用户资料分析,给出了PersonCreditRank为“优秀客户资源类”用户库。

实例4:某金融机构AgentComB授权软件公司SoftComTwo使用其数据资源,利用软件系统进行数据分析。

假设某金融机构AgentComB提供了DataStruct_3_7所定义的Person_Relating个人金融衍生信息集合:个人金融衍生指标评价等级(PersonRelateRank), 个人网上交易记录, 个人消费习惯, 个人投资意愿, 个人市内主要交通工具, 个人出行主要交通工具,个人月最大消费金额/商品, 个人最大年消费金额/商品, 个人年平均消费金额, 个人月平均消费金额, Person_Relating附加信息;这些信息在软件系统中补充了数据集,进行了重新训练。

软件公司SoftComTwo通过软件系统对AgentComB采集的用户资料分析,给出了个人金融衍生指标评价等级PersonRelateRank为“优秀个人金融衍生产品客户类”的用户库。

综合上述实例,软件系统由于采用了加密个人金融信息的敏感数据,软件公司SoftComOne和SoftComTwo通过软件系统入口数据接口分别处理了金融机构AgentCredit和AgentComB的数据,把个人金融信息的敏感数据和特征信息分离,软件公司所分析的数据并不会对个人金融信息的敏感数据造成威胁。在软件系统中,由于个人金融信息的Person_BaseInfo集合中PID和PPassport在Key/Value数据集中的唯一性,因此,同一用户的数据特征是唯一的,避免了数据重复对分析效果的影响,例如:在某些注水的虚假交易中,用户使用了大量的银行卡信息进行虚假购物,在数据分析中由于没有去除这些重复数据,使得真实交易比例下降,影响了评价结果。此外,由于AgentCredit和AgentComB共享了客户信息,潜在的优秀客户资源可以被双方共享。第三,由于强化学习可以通过不断地训练接近真实用户的数据特征所反映的参数指标,因此,能够极大地提高金融数据分析和处理的效率。

最后应说明的是:以上实例仅用以说明本发明的技术方法,而非对其限制;尽管参照前述实例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实例技术方案的精神和范围。

相关技术
  • 一种基于机器学习的个人金融敏感信息检测方法及系统
  • 基于影子系统的敏感数据安全保护方法及系统
技术分类

06120116506810