掌桥专利:专业的专利平台
掌桥专利
首页

企业综合信用信息查验方法、系统、介质、计算机设备

文献发布时间:2023-06-19 10:08:35


企业综合信用信息查验方法、系统、介质、计算机设备

技术领域

本发明属于计算机应用技术领域,尤其涉及一种企业综合信用信息查验方法、系统、介质、计算机设备。

背景技术

目前,大宗商品是指可进入流通领域,但非零售环节,具有商品属性并用于工农业生产与消费使用的大批量买卖的物质商品。在金融投资市场,大宗商品指同质化、可交易、被广泛作为工业基础原材料的商品,如原油、有色金属、钢铁、农产品、铁矿石、煤炭等。包括3个类别,即能源商品、基础原材料和农副产品。

现有大宗商品交易市场的交易平台之间存在单一性、缺乏关联性等。一方面,企业安全指数难以保障,交易平台垂直单一不易发现数据背后隐藏的异常;另一方面不同大宗商品种类有着不同的交易平台,海量数据难以实现共享,很多重要信息无法关联挖掘,必然造成数据的浪费。在当今快速发展的大数据时代,运用数据挖掘分析技术可挖掘海量数据中的隐性信息,需要基于大宗商品交易平台研究一种跨平台信息可共享、企业主体属性相关联、动静态数据相结合的企业综合信用查验方法。系统查验结果最终以企业综合信用查验报告呈现,该查验报告包括四部分内容:(1)、基本信息,是指与企业的基础信息,如企业名称、企业组织机构代码、统一社会信用代码等;(2)、关联信息,是与该企业与之关联的企业的信息;(3)、综合信用评分信息,是运用数据挖掘分析技术、聚类降维以及AHP层次分析算法结合得到的综合信用评分信息;(4)、其他信息,指对一个企业信用影响度较大或其至关重要的信息。

通过上述分析,现有技术存在的问题及缺陷为:现有大宗商品交易市场的交易平台之间存在单一性、缺乏关联性;现有大宗商品交易市场的交易平台之间存在单一性、缺乏关联性,导致市场管理平台不规范、不集中、安全性低等问题,导致平台之间模式垂直单一,数据难以共享,主体缺乏关联等问题。

解决以上问题及缺陷的难度为:海量数据难以实现共享,很多重要信息无法关联挖掘,不易发现数据背后隐藏的异常。

解决以上问题及缺陷的意义为:平台间关联性更紧密,企业数据信用更准确,企业交易主体更安全,对市场管理或各交易平台监督性更高。

发明内容

针对现有技术存在的问题,本发明提供了一种企业综合信用信息查验方法、系统、介质、计算机设备。

本发明是这样实现的,一种企业综合信用信息查验方法,所述企业综合信用信息查验方法包括:

步骤一,采集多源数据,将多源数据进行融合,存储于数据池中,进行数据分类处理与整合;

步骤二,将数据池中整合的数据划分为用于生成基本信息数据的静态数据与用于生成关联信息数据、综合信用评分数据、其他重要数据的动态数据;

步骤三,对静态数据进行分析,对动态数据进行企业主体关联属性及相关数据的挖掘,并基于挖掘的数据对动态数据进行指标数据划分;

步骤四,对静态数据与动态数据分别进行处理,并基于静态数据与动态数据的处理结果生成企业综合信用查验报告。

进一步,步骤一中,所述多源数据包括:各平台历史交易数据、权威机构数据、第三方接口数据以及其他数据。

进一步,步骤二中,所述动态数据包括:

所述动态数据用于生成关联信息数据、综合信用评分数据、其他重要数据;

所述关联信息数据用于生成关联信息;

所述综合信用评分数据用于生成综合信用评分及各一级指标数据评分维度所占综合信用评分的比重;

所述其他重要数据用于生成企业相对重要的信息;

所述综合信用评分数据由动态数据处理得到;

所述关联信息数据以及其他重要数据依据动态数据中第三方接口数据或由其他源数据分别生成。

进一步,步骤三中,所述基于挖掘的数据对动态数据进行指标数据划分包括:

基于挖掘得到的企业主体关联属性确定的各企业属性之间的关联性即相关性系数,根据确定的相关性系数进行动态数据的聚类降维划分,将动态数据抓取生成三级指标数据,再由三级指标数据聚类降维生成二级指标数据,再由二级指标数据聚类降维生成一级指标数据。

进一步,步骤四中,所述对静态数据处理包括:将采集静态数据提取整理为规范化的基本信息。

进一步,步骤四中,所述对动态数据处理方法包括:

(1)从处理整合的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;

(2)将获取到的动态数据信息进行抓取、整理、降维、结构化;

(3)对结构化处理好的数据进行数据挖掘与分析,分析二指标数据中的关联信息、信用影响因素比例及其他数据,确定二级指标数据各属性之间的相关性系数即企业主体属性之间的关联性;

(4)依据该相关性系数运用层次分析算法计算出二级指标数据各属性的权重,依据权重进行K-means聚类降维,生成一级指标数据即决定信用评分的评分维度;

(5)确定一级指标数据各维度之间的相关性系数,运用AHP算法确定各维度的权重,为各维度进行权重分配,并利用综合信用评分值计算公式计算综合信用评分值,并计算各维度在综合信用评分值中所占的比例,得到综合信用评分数据。

进一步,所述步骤(2)进一步包括:

(1)从处理整合的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;

(2)将获取到的动态数据信息进行抓取、整理、降维、结构化;

(2.1)抓取企业属性关联性相对较大的属性,形成必要数据,再将数据进行清洗,预处理,整理出三级指标;数据预处理过程包括:数据清洗,数据变换,数据规约;其中数据清洗主要是对数据源中各属性在数值上的各种异常情况的进行处理,其中对某些异常值进行丢弃,对缺失值使用具有代表性的中位数、平均数或其他数值代替,将数据补充完整;数据变换将数据进行离散化和二元化。离散化主要是把各数据源中提取后清洗的数据进行离散划分,离散为各个不同的区间,二元化将两种状态区分,在数值上可定义为0或1,表示真或假,为数据规约做准备;数据规约减少数据源中的属性及各属性的数据量,初次降低数据的维度,删除无用信息或冗余数据,整理出三级指标数据;

(2.2)由三级指标数据经过算法分析计算,对数据进行量化,确定量化三级指标数据各属性的相关性系数;所述由三级指标数据经过算法分析计算,对数据进行量化包括:对三级指标数据进行归一化,将所有指标数据统一在一个量级;

所述对三级指标数据进行归一化包括:对三级指标数据中的数值型指标以及离散型直接利用归一化公式进行归一化处理;对三级指标数据中的字符型指标将部分等级数据转换成对应的数值之后再利用归一化公式进行归一化处理;

所述归一化公式为:

Yi=(Xi-Xmin)/(Xmax-Xmin);

其中,Xi、Yi分别表示处理前后的指标项,Xmin表示该三级指标数据的最小值,Xmax表示该三级指标数据的最大值,最终得到量化好的三级指标数据;

各属性间的相关性系数采用pearson相关性系数,反应的是主体的两个主体属性之间变化趋势的方向以及程度,其值范围为(-1,+1),0表示两个主体属性不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强,pearson相关性系数的公式如下:

P(X,Y)=cov(X,Y)/sX*sY;

其中P(X,Y)为变量X和Y之间的相关性系数,cov(X,Y)为两个变量X、Y之间的协方差,sX*sY为两个属性变量的标准差乘积;

(2.3)依据相关性系数进行K-means聚类降维,生成出二级指标数据,对二级指标数据进行结构化处理,处理成可供数据分析与挖掘的CSV文件、SQL文件、表格文件、或数据库表文件,用于数据挖掘与分析;k-means聚类将三级指标数据降维为二级指标数据,将二级指标数据降维为一级指标数据;聚类k值根据各级指标的属性个数来确定;

(3)对结构化处理好的数据进行数据挖掘与分析,分析二指标数据中的关联信息、信用影响因素比例及其他数据,确定二级指标数据各属性之间的相关性系数即企业主体属性之间的关联性;

(4)依据该相关性系数运用层次分析算法计算出二级指标数据各属性的权重,依据权重进行K-means聚类降维,生成一级指标数据即决定信用评分的评分维度;

(5)确定一级指标数据各维度之间的相关性系数,运用AHP算法确定各维度的权重,为各维度进行权重分配,并利用综合信用评分值计算公式计算综合信用评分值,并计算各维度在综合信用评分值中所占的比例,得到综合信用评分数;

所述综合信用评分值计算公式如下:

S=D1*W1+D2*W2+...+Dn*Wn;

其中,1、2、...、n为评分维度是第n个维度;D1为第1个评分维度;W1为第1个评分维度的权重;D2为第2个评分维度;W2为第2个评分维度的权重;Dn为第n个评分维度;Wn为第n个评分维度的权重;

所述计算各维度在综合信用评分值中所占的比例包括:

利用下式进行各维度在综合信用评分值中所占的比例的额计算:

Pi=(Di*Wi)/S,(i=1,2,...,n);

其中,Di为第i个维度;Wi为第i个评分维度的权重;S为综合评分值;Pi为第i个维度在综合评分S中的占比;

依据AHP层次分析算法确定各维度权重,基于维度权重划分,用各属性间的相关性系数来代替传统的专家评估数据,再运用AHP层次分析算法,计算出各维度的权重,同时提供一种权重计算的数字化方式。

进一步,步骤四中,所述企业综合信用查验报告包括:

所述企业综合信用查验报告包括基本信息、关联信息、综合信用评分信息、其他信息;

所述基本信息为与企业有关的基础信息,包括企业名称、企业组织机构代码、统一社会信用代码;

所述关联信息,为与企业关联的其他企业的信息;

所述其他信息,为对一个企业信用影响度较大或其至关重要的信息。

本发明的另一目的在于提供一种实施所述企业综合信用信息查验方法的企业综合信用信息查验系统,所述企业综合信用信息查验系统包括:

数据采集模块,用于进行多源数据的采集;

数据存储模块,用于将采集的多源数据进行融合,并利用数据池进行融合数据的存储;

数据预处理模块,用于对数据池中的融合数据进行数据分类处理与整合;

数据划分模块,用于将数据池中整合的数据划分为用于生成基本信息数据的静态数据与用于生成关联信息数据、综合信用评分数据、其他重要数据的动态数据;

数据分析模块,用于对静态数据进行分析,对动态数据进行企业主体关联属性及相关数据的挖掘,并基于挖掘的数据对动态数据进行指标数据划分;

数据处理模块,用于对静态数据与动态数据分别进行处理;

结果生成模块,用于基于数据处理结果生成企业综合信用查验报告。

进一步,所述数据处理模块包括:

静态数据处理单元与动态数据处理单元;

所述静态处理单元,用于将采集静态数据提取整理为规范化的基本信息;

所述动态数据处理单元包括:数据获取子单元、结构化子单元、数据挖掘与分析子单元、综合信用评分子单元;用于进行动态数据处理,生成关联信息数据、综合信用评分数据、其他重要数据。

进一步,所述企业综合信用信息查验系统还包括:最高权限管理员、平台管理员、大宗商品交易平台单重角色;

所述最高权限管理员用于管理分配平台管理员;

所述平台管理员用于管理交易平台用户的注册信息、增删改查,同时对各个交易平台进行管理审核;

所述大宗商品交易平台用于通过注册登录,进入系统查验各企业综合信用信息。

结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明的目的是提供一种基于大宗商品交易平台的跨平台信息共享、市场主体属性关联、动静态数据相结合的企业综合信用查验方法,解决了大宗商品交易市场的交易平台存在单一性、缺乏关联性等问题。本发明通过采集多源数据,对数据分类处理与整合,统一存储于数据资源池中,各个交易平台能够共享共用数据池中的数据,弥补现有大宗商品交易平台垂直单一的缺点,结合动静态数据分类处理,对数据进行综合分析,生成企业综合信用查验报告。

本发明利用数据挖掘与分析技术,对企业主体属性进行相关性分析,确定不同主体属性之间的相关性系数,运用聚类技术进行降维,挖掘企业主体属性关联关系以及海量数据背后的隐性信息。本发明是一种企业综合信用信息查验方法,设计了一套完整的查验实施流程和机制,实现一种跨平台信息可共享、市场主体属性相关联、动静态数据相结合的企业综合信用查验方法。

本发明通过集多源数据为一体,分析动静态数据,对动态数据进行数据挖掘与分析,挖掘企业主体属性关联关系,实现跨平台数据共享、企业主体属性关联、动静态数据相结合的企业综合信用查验方法和机制。本发明通过研究动静态数据处理方法和机制,将该方法应用并实践,实现企业综合信用信息查验系统。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的企业综合信用信息查验方法流程图。

图2是本发明实施例提供的企业综合信用查验方法的流程图。

图3是本发明实施例提供的动态数据处理原理图。

图4是本发明实施例提供的动态数据处理流程图。

图5是本发明实施例提供的模块核心技术流程图。

图6是本发明实施例提供的企业综合信用信息查验系统架构图。

图7是本发明实施例提供的企业综合信用查验系统功能界面流程图。

图8是本发明实施例提供的基于本发明方法可实现其企业综合信用查验系统原理图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

针对现有技术存在的问题,本发明提供了一种企业综合信用信息查验方法、系统、介质、计算机设备,下面结合附图对本发明作详细的描述。

如图1所示,本发明实施例提供的企业综合信用信息查验方法包括以下步骤:

S101,采集多源数据,将多源数据进行融合,存储于数据池中,进行数据分类处理与整合;

S102,将数据池中整合的数据划分为用于生成基本信息数据的静态数据与用于生成关联信息数据、综合信用评分数据、其他重要数据的动态数据;

S103,对静态数据进行分析,对动态数据进行企业主体关联属性及相关数据的挖掘,并基于挖掘的数据对动态数据进行指标数据划分;

S104,对静态数据与动态数据分别进行处理,并基于静态数据与动态数据的处理结果生成企业综合信用查验报告。

本发明提供的企业综合信用信息查验方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的企业综合信用信息查验方法仅仅是一个具体实施例而已。

步骤S101中,本发明实施例提供的多源数据包括:各平台历史交易数据、权威机构数据、第三方接口数据以及其他数据。

步骤S102中,本发明实施例提供的动态数据包括:

所述动态数据用于生成关联信息数据、综合信用评分数据、其他重要数据;

所述关联信息数据用于生成关联信息;

所述综合信用评分数据用于生成综合信用评分及各一级指标数据评分维度所占综合信用评分的比重;

所述其他重要数据用于生成企业相对重要的信息;

所述综合信用评分数据由动态数据处理得到;

所述关联信息数据以及其他重要数据依据动态数据中第三方接口数据或由其他源数据分别生成。

步骤S103中,本发明实施例提供的基于挖掘的数据对动态数据进行指标数据划分包括:

基于挖掘得到的企业主体关联属性确定的各企业属性之间的关联性即相关性系数,根据确定的相关性系数进行动态数据的聚类降维划分,将动态数据抓取生成三级指标数据,再由三级指标数据聚类降维生成二级指标数据,再由二级指标数据聚类降维生成一级指标数据。

步骤S104中,本发明实施例提供的对静态数据处理包括:将采集静态数据提取整理为规范化的基本信息。

如图3至图5所示,步骤S104中,本发明实施例提供的对动态数据处理方法包括:

(1)从处理整合的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;

(2)将获取到的动态数据信息进行抓取、整理、降维、结构化;

(3)对结构化处理好的数据进行数据挖掘与分析,分析二指标数据中的关联信息、信用影响因素比例及其他数据,确定二级指标数据各属性之间的相关性系数即企业主体属性之间的关联性;

(4)依据该相关性系数运用层次分析算法计算出二级指标数据各属性的权重,依据权重进行K-means聚类降维,生成一级指标数据即决定信用评分的评分维度;

(5)确定一级指标数据各维度之间的相关性系数,运用AHP算法确定各维度的权重,为各维度进行权重分配,并利用综合信用评分值计算公式计算综合信用评分值,并计算各维度在综合信用评分值中所占的比例,得到综合信用评分数据。

本发明实施例提供的步骤(2)进一步包括:

(2.1)抓取企业属性关联性相对较大的属性,形成必要数据,再将数据进行清洗,预处理,整理出三级指标;

(2.2)由三级指标数据经过算法分析计算,对数据进行量化,确定量化三级指标数据各属性的相关性系数;

(2.3)依据相关性系数进行K-means聚类降维,生成出二级指标数据,对二级指标数据进行结构化处理,处理成可供数据分析与挖掘的CSV文件、SQL文件、表格文件、或数据库表文件,用于数据挖掘与分析。

步骤(2.1)中,本发明实施例提供的数据预处理过程包括:数据清洗,数据变换,数据规约。

其中数据清洗主要是对数据源中各属性在数值上的各种异常情况的进行处理,其中对某些异常值进行丢弃,对缺失值使用具有代表性的中位数、平均数或其他数值代替,将数据补充完整。

数据变换主要是将数据进行离散化和二元化。离散化主要是把各数据源中提取后清洗的数据进行离散划分,离散为各个不同的区间。二元化主要是将两种状态区分,在数值上可定义为0或1,表示真或假,为数据规约做准备。

数据规约主要是减少数据源中的属性及各属性的数据量,初次降低数据的维度,删除无用信息或冗余数据,整理出三级指标数据。

步骤(2.2)中,本发明实施例提供的由三级指标数据经过算法分析计算,对数据进行量化包括:对三级指标数据进行归一化,将所有指标数据统一在一个量级;

所述对三级指标数据进行归一化包括:对三级指标数据中的数值型指标以及离散型直接利用归一化公式进行归一化处理;对三级指标数据中的字符型指标将部分等级数据转换成对应的数值之后再利用归一化公式进行归一化处理;

所述归一化公式为:

Yi=(Xi-Xmin)/(Xmax-Xmin);

其中,Xi、Yi分别表示处理前后的指标项,Xmin表示该三级指标数据的最小值,Xmax表示该三级指标数据的最大值,最终得到量化好的三级指标数据。

步骤(5)中,本发明实施例提供的综合信用评分值计算公式如下:

S=D1*W1+D2*W2+...+Dn*Wn;

其中,1、2、...、n为评分维度是第n个维度;D1为第1个评分维度;W1为第1个评分维度的权重;D2为第2个评分维度;W2为第2个评分维度的权重;Dn为第n个评分维度;Wn为第n个评分维度的权重。

步骤(2.2)中,本发明实施例提供的各属性间的相关性系数主要是采用pearson相关性系数,主要反应的是主体的两个主体属性之间变化趋势的方向以及程度,其值范围为(-1,+1),0表示两个主体属性不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强。pearson相关性系数的公式如下:

P(X,Y)=cov(X,Y)/sX*sY,

其中P(X,Y)为变量X和Y之间的相关性系数,cov(X,Y)为两个变量X、Y之间的协方差,sX*sY为两个属性变量的标准差乘积。

步骤(2.3)中,本发明实施例提供的k-means聚类主要是将三级指标数据降维为二级指标数据,将二级指标数据降维为一级指标数据。该方法中的聚类k值根据各级指标的属性个数来确定。

步骤(5)中,本发明实施例提供的计算各维度在综合信用评分值中所占的比例包括:

利用下式进行各维度在综合信用评分值中所占的比例的额计算:

Pi=(Di*Wi)/S,(i=1,2,...,n);

其中,Di为第i个维度;Wi为第i个评分维度的权重;S为综合评分值;Pi为第i个维度在综合评分S中的占比。

其中步骤(5),本发明实施例提供的依据AHP层次分析算法确定各维度权重,基于维度权重划分,本发明用各属性间的相关性系数来代替传统的专家评估数据,再运用AHP层次分析算法,计算出各维度的权重,同时提供一种权重计算的数字化方式,改善了人为打分而造成的不确定不公平的因素。

本发明实施例提供的企业综合信用查验报告包括:

所述企业综合信用查验报告包括基本信息、关联信息、综合信用评分信息、其他信息;

所述基本信息为与企业有关的基础信息,包括企业名称、企业组织机构代码、统一社会信用代码;

所述关联信息,为与企业关联的其他企业的信息;

所述其他信息,为对一个企业信用影响度较大或其至关重要的信息。

如图6-图7所示,本发明实施例提供的企业综合信用信息查验系统包括:

数据采集模块,用于进行多源数据的采集;

数据存储模块,用于将采集的多源数据进行融合,并利用数据池进行融合数据的存储;

数据预处理模块,用于对数据池中的融合数据进行数据分类处理与整合;

数据划分模块,用于将数据池中整合的数据划分为用于生成基本信息数据的静态数据与用于生成关联信息数据、综合信用评分数据、其他重要数据的动态数据;

数据分析模块,用于对静态数据进行分析,对动态数据进行企业主体关联属性及相关数据的挖掘,并基于挖掘的数据对动态数据进行指标数据划分;

数据处理模块,用于对静态数据与动态数据分别进行处理;

结果生成模块,用于基于数据处理结果生成企业综合信用查验报告。

本发明实施例提供的数据处理模块包括:

静态数据处理单元与动态数据处理单元;

所述静态处理单元,用于将采集静态数据提取整理为规范化的基本信息;

所述动态数据处理单元包括:数据获取子单元、结构化子单元、数据挖掘与分析子单元、综合信用评分子单元;用于进行动态数据处理,生成关联信息数据、综合信用评分数据、其他重要数据。

本发明实施例提供的企业综合信用信息查验系统还包括:最高权限管理员、平台管理员、大宗商品交易平台单重角色;

所述最高权限管理员用于管理分配平台管理员;

所述平台管理员用于管理交易平台用户的注册信息、增删改查,同时对各个交易平台进行管理审核;

所述大宗商品交易平台用于通过注册登录,进入系统查验各企业综合信用信息。

下面结合具体实施例对本发明的技术方案作进一步的描述。

实施例1:

本发明所述企业综合信用信息查验方法包括:包括如下步骤:

1)采集多源数据,实现跨平台信息共享;

2)分析动静态数据,对动态数据进行数据挖掘,挖掘企业主体关联属性;

3)完成动静态数据处理;

4)形成企业综合信用查验报告。

采集各平台历史交易数据、权威机构数据、第三方接口数据以及其他数据等多源数据为一体,统一存储于数据池中,进行数据分类处理与整合。

在一些说明性实施例中,将数据进行分类处理,主要分为静态数据和动态数据,挖掘动态数据中历史交易数据以及其他海量数据中的隐性信息,分析企业主体关联性,根据关联性进行指标数据划分。

对静态数据和动态数据分别进行静态数据处理和动态数据处理操作。

静态数据处理主要是将静态数据提取整理为规范化的基本信息。

在一些说明性实施例中,参照图3所示,动态数据处理主要由四个模块构成,包括数据获取模块、结构化模块、数据挖掘与分析模块、综合信用评分模块。动态数据最终形成关联信息数据、综合信用评分数据、其他重要数据。其中:

关联信息数据用于生成关联信息;

综合信用评分数据是动态数据处理的输出核心,用于确定企业综合信用评分及各评分维度所占综合信用评分的比重;

其他重要数据用于生成该企业相对重要的信息。

在一些说明性实施例中,动态数据处理详细步骤参照图3所示,所述动态数据处理详细步骤有:

由图4可知,数据获取模块主要是从多源数据汇集的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;

数据结构化模块和数据挖掘分析模块的核心技术流程图参照图4所示;

由图4可知,数据结构化模块主要将获取到的动态数据信息进行抓取、整理、降维、结构化;

由图5可知,在数据结构化模块中,应抓取企业属性关联性相对较大的属性,形成必要数据,再将数据进行清洗,预处理,整理出三级指标;由三级指标数据经过算法分析计算,对数据实现量化,确定量化三级指标数据各属性的相关性系数,依据相关性系数进行K-means聚类降维,生成出二级指标数据,对二级指标数据进行结构化处理,处理成可供数据分析与挖掘的CSV文件、SQL文件、表格文件、或数据库表文件等,便于数据挖掘与分析;

对三级指标进行算法量化主要是数据中有的量级很大不利于折算最终综合信用评分,因此需对三级指标数据进行归一化,将所有指标数据统一在一个量级。数值型指标可以直接套用归一化公式预处理;离散性指标,例如,只有两个值0、1的数据不需要预处理;字符型指标,例如,某些等级数据需转换成对应的数值1、2、3之后进行归一化处理;并利用公式:Yi=(Xi-Xmin)/(Xmax-Xmin)对三级指标数据做归一化处理,免去量级造成的的影响,其中,Xi、Yi分别表示处理前后的指标项,Xmin表示该三级指标数据的最小值,Xmax表示该三级指标数据的最大值,最终得到量化好的三级指标数据。

由图4可知,数据挖掘分析模块主要对结构化处理好的数据进行数据挖掘与分析;

由图5可知,数据挖掘分析模块主要分析其二指标数据中的关联信息、信用影响因素比例等等,确定二级指标数据各属性之间的Pearson相关性系数(企业主体属性之间的关联性),依据该相关性系数运用层次分析算法(AHP算法)计算出二级指标数据各属性的权重,依据权重进行K-means聚类降维,生成一级指标数据(即决定信用评分的评分维度),为最后信用评分做准备;

由图4可知,综合信用评分模块主要确定一级指标数据各维度之间的Pearson相关性系数,同样运用AHP算法确定各维度的权重,为各维度进行权重分配,最终计算得到企业综合信用评分值;

在一些说明性实施例中,所述企业综合信用评分计算公式为:S=D1*W1+D2*W2+...+Dn*Wn;其中,1、2、...、n为评分维度是第n个维度;D1为第1个评分维度;w1为第1个评分维度的权重;D2为第2个评分维度;w2为第2个评分维度的权重;Dn为第n个评分维度;wn为第n个评分维度的权重;

最后计算出各维度在综合评分值中所占的比例;

在一些说明性实施例中,所述综合评分值中各维度所占的比例计算公式为:Pi=(Di*Wi)/S,(i=1,2,...,n);其中,Di为第i个维度;Wi为第i个评分维度的权重;S为综合评分值;Pi为第i个维度在综合评分S中的占比。

现在参照图6,图6示出了企业综合信用信息查验系统架构图,如该系统框架图所示,公开了一种企业综合信用信息查验系统,包括:各交易平台001进行注册002;管理员用户审核平台信息003;交易平台进行系统登录004;多源数据005汇集到数据池006进行处理;将数据分类并分别进行静态数据处理和动态数据处理007;交易平台进入查验功能008;交易平台对企业进行综合信用查验009;基础信息与数据池进行对比核验010;查到被查验企业生成综合信用查验报告011;对综合信用查验报告进行展示并下载012。

在一些说明性实施例中,所述各交易平台注册登录,主要是集多平台于一体,实现多源数据共享,跨平台收集数据并进行数据挖掘分析处理,形成更具有代表性的企业综合信用查验。

在一些说明性实施例中,所述管理员用户003包括最高权限管理员和平台管理员。最高权限管理员主要分配各平台管理员权限;平台管理员对各交易平台注册信息进行管理核查和增删改查等操作。

在一些说明性实施例中,所述多源数据汇集数据池进行数据分类处理,是该企业综合信用查验方法在系统中的部分应用。

在一些说明性实施例中,所述数据分类处理,主要是分为静态数据处理和动态数据处理007,而动态数据处理主要有四个模块,包括:数据获取模块0071;结构化模块0072,数据挖掘分析模块0073;综合信用评分模块0074。

在一些说明性实施例中,所述查验功能008主要是利用该方法提供的整个流程和机制进行查验,输出企业综合信用信息,形成企业综合信用查验报告。

在一些说明性实施例中,所述基础信息与数据池进行对比核验010,是指静态数据处理过程,主要是将静态数据与数据池权威数据进行对比,形成综合信用信息中的基础信息。

在一些说明性实施例中,企业综合信用信息查验系统功能界面流程图如图7所示,由图可知企业综合信用信息查验系统的功能界面主要有5个,包括:注册界面、登录界面、管理员审核界面、查验界面、数据界面、查验报告展示界面。

在一些说明性实施例中,所述注册界面主要还涉及短信认证或者邮箱认证。

在一些说明性实施例中,所述登录界面包括交易平台用户登录界面、管理员用户登录界面。

在一些说明性实施例中,所述平台用户登录后可进行查验功能。查验功能主要包括查验界面、数据界面、查验报告展示界面。

在一些说明性实施例中,所述管理员用户登录后就会到管理员审核界面,主要是对用户平台进行增删改查等管理操作。

在一些说明性实施例中,所述数据界面是确定企业信用查验报告的重要信息;查验报告展示界面可下载企业信用查验报告保存到本地。

在动态数据处理中,主体属性的关联性分析、数据挖掘与分析技术、聚类降维技术,可由其他相同效果的技术代替。

在动态数据处理中,聚类降维得到的各级指标数据不限于本发明内容的设定。

在企业综合信用信息查验系统实现中,各界面功能可依据具体情景有其他具有相同效果的技术代替。

下面结合具体实施例对本发明的技术方案作进一步的描述。

基于本发明方法实现的企业综合信用查验系统,其实施框架路线图如图8所示。在各路数据接口对接的基础上,利用多关键变量主体属性融合、交叉聚类数据挖掘分析,生成企业综合信用查验报告。

依据本发明方法与数据处理机制,企业综合信用查验系统的实施框架主要由四部分构成,包括动静态数据管理库、规范化数据信息基础、企业信用查验系统设计、信用评分系统研究。

其中动静态数据管理库主要是动静态数据管理与处理;规范化数据信息基础主要是数据预处理、数据归一化以及各级指标数据划分;企业信用查验系统设计主要是依据方法设计实现系统;信用评分系统研究主要是基于动态数据处理,利用多关键变量主体属性融合、交叉聚类数据挖掘分析,来生成综合信用评分。各个部分最终集成为企业综合信用查验报告,基于本发明方法可实现其企业综合信用查验系统。如图8所示。

基于本发明方法实现的企业综合信用查验系统中,最大权限管理员分配管理各平台管理员,各平台管理员对各个平台进行管理和操作。平台用户则进行注册登录,申请平台管理员审核,通过审核后,平台用户进入系统,点击查验功能,输入所要查验的企业全称,在确定查验以后,系统会以企业综合信用查验报告的形式输出,企业综合信用查验报告的内容主要是该企业的基本信息、关联信息、信用评分信息、其他信息,平台用户根据这些信息来判断该企业的合法性、风险性,以及对企业各个方面进行了解。用户可以下载该综合信用查验报告,便于本地存储进行备份留存。

应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

相关技术
  • 企业综合信用信息查验方法、系统、介质、计算机设备
  • 一种结合信用信息的工业企业综合效益评价方法及系统
技术分类

06120112435500