掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、设备、存储介质及程序产品

文献发布时间:2024-04-18 20:02:40


数据处理方法、装置、设备、存储介质及程序产品

技术领域

本公开涉及大数据及金融科技技术领域,尤其涉及一种数据处理方法、装置、设备、存储介质和程序产品。

背景技术

随着金融机构相关业务种类的增加,需要将多个目标数据源(例如开源数据库、金融机构官网和业务年报)中的业务数据进行整合和分析,来对不同类型金融业务的业务效率进行评估。目前,常见的业务效率评估方法主要有:非期望SBM模型,通过处理投入变量与产出变量的效率测度问题,用于业务效率的分析;随机前沿方法(Stochastic FrontierApproach),利用随机前沿生产函数进行效率的估计。

在构思本公开的过程中,发明人发现在相关技术中针对业务效率的评估存在如下缺陷:待评估数据的数据量巨大且数据质量不高,导致系统资源开销较大,同时影响了评估结果的准确性;业务效率的评估方案固定单一,造成评估结果准确率低下。

发明内容

鉴于上述问题,本公开提供了一种数据处理方法、装置、设备、存储介质和程序产品。

根据本公开的第一个方面,提供了一种数据处理方法,包括:

调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求;

接收由上述目标数据源响应上述业务数据请求发送的在目标时间范围内产生的目标业务数据;

从上述目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,其中,上述初始待评估数据在类型上包括因变量初始待评估数据和自变量初始待评估数据;

将上述初始待评估数据输入至目标数据评估模型中,输出与上述初始待评估数据对应的初始业务评估的量化值;

基于上述初始业务评估的量化值及第二筛选规则更新上述初始待评估数据,得到目标待评估数据,其中,上述目标待评估数据的数据量小于上述初始待评估数据,上述目标待评估数据在类型上包括因变量目标待评估数据和自变量目标待评估数据,上述因变量目标待评估数据和自变量目标待评估数据,与上述因变量初始待评估数据和自变量初始待评估数据相关联;以及

将上述目标待评估数据输入至上述目标数据评估模型中,输出与上述目标待评估数据对应的目标业务评估的量化值。

根据本公开的实施例,上述将上述目标待评估数据输入至上述目标数据评估模型中,输出与上述目标待评估数据对应的目标业务评估的量化值之后,还包括:

将上述初始业务评估的量化值与上述目标业务评估的量化值进行比对,生成业务评估结果。

根据本公开的实施例,上述从上述目标业务数据目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,包括:

根据上述第一筛选规则对上述目标业务数据进行处理,构建与上述目标业务数据对应的分析矩阵;

根据上述分析矩阵对上述目标业务数据进行计算,生成与上述目标业务数据对应的分析结果,其中,上述分析结果包括第一分析结果和第二分析结果;以及

将上述分析结果与预设筛选阈值进行比对,得到上述初始待评估数据。

根据本公开的实施例,上述将上述初始待评估数据输入至目标数据评估模型中,输出与上述初始待评估数据对应的初始业务评估的量化值,包括:

将上述因变量初始待评估数据和上述自变量初始待评估数据输入至上述目标数据评估模型中,输出上述初始业务评估的量化值,其中,上述初始业务评估的量化值包括初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值。

根据本公开的实施例,上述因变量初始待评估数据在结构层次上包括子代因变量初始待评估数据,上述自变量初始待评估数据包括子代自变量初始待评估数据;

其中,上述基于上述初始业务评估的量化值及第二筛选规则更新上述初始待评估数据,得到目标待评估数据,包括:

根据上述初始业务评估的量化值,选取上述初始业务评估的量化值中的初始技术效率评估的量化值作为上述第二筛选规则中的因变量、上述子代因变量初始待评估数据与上述子代自变量初始待评估数据之间的比值作为上述第二筛选规则中的自变量,构建回归分析模型;

根据上述回归分析模型对上述初始业务评估的量化值进行分析,生成与上述初始业务评估的量化值对应的分析结果;以及

根据上述分析结果,从上述初始待评估数据中选取上述目标待评估数据。

根据本公开的实施例,上述因变量初始待评估数据还包括父代因变量初始待评估数据,上述父代因变量初始待评估数据包括业务运营成果数据,上述自变量初始待评估数据还包括业务投入数据、业务规模数据以及客户满意度数据。

根据本公开的实施例,上述将上述目标待评估数据输入至上述目标数据评估模型中,输出与上述目标待评估数据对应的目标业务评估的量化值,包括:

将上述因变量目标待评估数据和上述自变量目标待评估数据输入至上述目标数据评估模型中,输出与上述目标待评估数据对应的目标业务评估的量化值,其中,上述目标业务评估的量化值包括目标技术效率评估的量化值、目标纯技术效率评估的量化值以及目标规模效率评估的量化值。

本公开的第二方面提供了一种数据处理装置,包括:业务数据请求发送模块,用于调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求;

目标业务数据接收模块,用于接收由上述目标数据源响应上述业务数据请求发送的在目标时间范围内产生的目标业务数据;

目标业务数据筛选模块,用于从上述目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,其中,上述初始待评估数据在类型上包括因变量初始待评估数据和自变量初始待评估数据;

初始业务评估的量化值输出模块,用于将上述初始待评估数据输入至目标数据评估模型中,输出与上述初始待评估数据对应的初始业务评估的量化值;

初始待评估数据更新模块,用于基于上述初始业务评估的量化值及第二筛选规则更新上述初始待评估数据,得到目标待评估数据,其中,上述目标待评估数据的数据量小于上述初始待评估数据,上述目标待评估数据在类型上包括因变量目标待评估数据和自变量目标待评估数据,上述因变量目标待评估数据和自变量目标待评估数据,与上述因变量初始待评估数据和自变量初始待评估数据相关联;以及

目标业务评估的量化值输出模块,用于将上述目标待评估数据输入至上述目标数据评估模型中,输出与上述目标待评估数据对应的目标业务评估的量化值。

本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述方法。

本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述方法。

本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法。

根据本公开提供的数据处理方法、装置、设备、存储介质和程序产品,通过调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求,接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据,并从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,从而可以将筛选所得到的初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值,并基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到精减后的目标待评估数据,进而可以将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。由于经过了多次筛选和更新,缩减了第三待评估数据的数据量的同时提升了第三待评估数据的数据质量,进而减少了系统资源的占用,进一步提高了目标业务评估结果的准确性。

附图说明

通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:

图1A示意性示出了根据本公开实施例的目标业务评估结果应用场景图;

图1B示意性示出了根据本公开实施例的数据处理方法、装置、设备、存储介质和程序产品的应用场景图;

图2示意性示出了根据本公开实施例的数据处理方法的流程图;

图3示意性示出了根据本公开实施例的初始待评估数据生成的流程图;

图4示意性示出了根据本公开实施例的数据处理装置的结构框图;以及

图5示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的方框图。

具体实施方式

以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

在本公开的技术方案中,所涉及的用户信息(包括但不限于用户个人信息、用户图像信息、用户设备信息,例如位置信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、存储、使用、加工、传输、提供、公开和应用等处理,均遵守相关法律法规和标准,采取了必要保密措施,不违背公序良俗,并提供有相应的操作入口,供用户选择授权或者拒绝。

发明人发现,在相关技术中,针对业务效率的评估方面,待评估数据的数据量巨大且数据质量不高,导致系统资源开销较大,同时影响了评估结果的准确性;业务效率的评估方案固定单一,造成评估结果准确率低下。鉴于此,本公开通过调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求,接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据,并从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,从而可以将筛选所得到的初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值,并基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到精减后的目标待评估数据,进而可以将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。由于经过了多次筛选和更新,缩减了第三待评估数据的数据量的同时提升了第三待评估数据的数据质量,进而减少了系统资源的占用,进一步提高了目标业务评估结果的准确性。

本公开的实施例提供了一种数据处理方法、装置、设备、存储介质和程序产品。该方法包括:调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求;接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据;从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据;将初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值;基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到目标待评估数据;以及将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。

图1A示意性示出了根据本公开实施例的目标业务评估结果应用场景图。

根据本公开实施例的数据处理方法,得到目标业务评估结果之后,可以利用可视化技术对目标业务的评估结果进行可视化展示,同时,对目标业务对应的相关产品(例如理财产品)进行产品推荐。如图1A所示的应用场景中,包括终端A11和服务器A12,其中终端A11不限于手机、个人电脑、平板电脑、笔记本电脑等,终端A11上显示推荐产品界面,其上可设置有时间范围输入框A113和目标产品输入框A114、A115,可接收用户输入的目标时间范围选择指令以及目标产品选择指令;根据目标时间范围选择指令以及对比目标产品指令,可从服务器A12获取目标时间范围内与目标产品对应的目标业务评估结果数据;根据目标时间范围内的不同目标产品的评估结果(效率)数据生成目标产品A1、目标产品A2的效率曲线图A111,和/或效率统计表A112;根据预设策略对效率曲线图A111和/或效率统计表A112进行渲染,并在终端A11的目标推荐产品界面的预定位置上进行显示。

图1B示意性示出了根据本公开实施例的数据处理方法、装置、设备、存储介质和程序产品的应用场景图。

如图1B所示,根据该实施例的应用场景100可以包括第一终端设备101、第二终端设备102、第三终端设备103、网络104和服务器105。网络104用以在第一终端设备101、第二终端设备102、第三终端设备103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用第一终端设备101、第二终端设备102、第三终端设备103中的至少一个通过网络104与服务器105交互,以接收或发送消息等。第一终端设备101、第二终端设备102、第三终端设备103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

第一终端设备101、第二终端设备102、第三终端设备103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用第一终端设备101、第二终端设备102、第三终端设备103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。

需要说明的是,本公开实施例所提供的数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的数据处理装置一般可以设置于服务器105中。本公开实施例所提供的数据处理方法也可以由不同于服务器105且能够与第一终端设备101、第二终端设备102、第三终端设备103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据处理装置也可以设置于不同于服务器105且能够与第一终端设备101、第二终端设备102、第三终端设备103和/或服务器105通信的服务器或服务器集群中。

应该理解,图1B中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的数据处理方法的流程图。

如图2所示,该实施例的数据处理方法包括操作S210~操作S260。

在操作S210,调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求。

根据本公开的实施例,目标数据源可以是用于提供所需要的业务数据资源的第三方系统,包括数据库、数据网站,例如金融机构官网、理财登记中心、年报等。第三方系统可以是与计算平台之间存在关联关系的数据库或者数据网站,也可以是开源数据库。

在操作S220,接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据。

根据本公开的实施例,目标时间范围可以根据实际业务需求所设置的时间区间,例如,近五年时间范围内的业务数据,应该说明的是,目标时间范围可依据实际情况进行设定,具体在此不进行限制。目标业务数据的数据类型包括文本数据、语音数据和视频数据等,目标业务数据可以是金融机构目标业务相关的数据,例如,理财业务数据、存贷款业务数据、缴费类业务数据等。

在操作S230,从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,其中,初始待评估数据在类型上包括因变量初始待评估数据和自变量初始待评估数据。

根据本公开的实施例,第一筛选规则可以包括多元分析筛选类的规则、回归分析类的筛选规则,初始待评估数据为经过筛选后所得到的金融业务相关的基础数据。

在一种可行的实施例中,第一筛选规则可以是结构方程模型(StructuralEquation Model,SEM),或者是回归分析模型(SolutionsStatistical Package for theSocial Sciences,SPSS),也可以是结构方程模型与回归分析模型组合形成的筛选规则。

在操作S240,将初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值。

根据本公开的实施例,目标数据评估模型可以是数据包络分析方法(DataEnvelopment Analysis,DEA),数据包络分析方法根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型单位进行相对有效性评价的一种数量分析方法。具体到本公开中,多项投入指标可以作为目标数据评估模型的自变量初始待评估数据,多项产出指标可以作为目标数据评估模型的因变量初始待评估数据。初始业务评估的量化值可以是利用目标数据评估模型计算得到的与相关业务对应的初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值。

在操作S250,基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到目标待评估数据,其中,目标待评估数据的数据量小于初始待评估数据,目标待评估数据在类型上包括因变量目标待评估数据和自变量目标待评估数据,因变量目标待评估数据和自变量目标待评估数据,与因变量初始待评估数据和自变量初始待评估数据相关联。

根据本公开的实施例,第二筛选规则可以是回归分析模型(SolutionsStatistical Package for the Social Sciences,SPSS),根据初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值,选取关联度最大的初始技术效率评估的量化值作为回归分析模型中的因变量,选取净利润数据与人员成本数据的比值、营销费用数据与总资产数据的比值、间接投资额数据与产品余额数据的比值,代替营销费用数据、采购费用数据、人员成本数据、净利润数据、间接投资额数据、产品余额数据作为回归分析模型中的自变量,对初始待评估数据进行筛选,最终得到目标待评估数据,作为下一次目标数据评估模型的输入数据。

在一种可行的实施例中,因变量目标待评估数据可以包括人员成本数据、营销费用数据、产品余额数据和间接投资额数据;自变量目标待评估数据可以包括评级数据、总资产数据和净利润数据。

在操作S260,将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。

根据本公开的实施例,将目标待评估数据中的人员成本数据、营销费用数据、产品余额数据和间接投资额数据作为自变量,评级数据、总资产数据和净利润数据作为因变量,输入至目标数据评估模型中,可以得到目标业务评估的量化值,目标业务评估的量化值可以包括目标技术效率评估的量化值、目标纯技术效率评估的量化值及目标规模效率评估的量化值。

数据包络分析方法(Data Envelopment Analysis,DEA),是通过数学原理中的线性规划将决策单元(即目标业务)的多项产出与多项投入数据,分别投影在坐标空间中,进而计算出最大产出或者最小投入的边界效率,用来衡量各个DMU决策单元的实际生产效率。包络线即生产可能曲线,是指在各种不同的投入情况下,其最大的可能产出点的连线,落在包络线上的生产点就是有效生产点(效率生产点),否则则为无效生产点。具体到本公开中,银行相关业务中的所有投入因素(自变量)为目标数据评估模型的输入变量x1、x2...xn,例如营销费用数据、人员成本数据、上市时间数据、投入金额数据等;相关业务中的所有产出因素(因变量)为模型的输出变量y1、y2...yn,例如非利息收入数据、利息收入数据、总利润数据、净利润数据等。

根据本公开的实施例,假设n个决策单元(目标业务)对应的输入数据与输出数据为x

max(μ

s.t.ω

其中,ω

上述目标数据评估模型DEA的对偶规划具体操作如公式(3)-(5)所示:

minθ=V

其中,

对于目标数据评估模型DEA公式的对偶表述,具体如下所示:如果线性规划存在着最优解ω

如果θ

如果θ

引入非阿基米德无穷小量ε之后,可获得如下线性规划问题

max(μ

s.t.ω

其中,ω

的对偶规划/>

其中,

在一种可行的实施例中,采用结构方程模型筛选目标业务数据,得到初始待评估数据,因变量初始待评估数据可以包括总资产数据、净利润数据、评数据;自变量初始待评估数据可以包括人员成本数据、营销费用数据、采购费用数据、产品余额数据、间接投资额数据、直接投资额数据、客户投诉量数据,具体到本公开中,以表1为例进行说明,表1为根据本公开实施例的在目标时间范围(四年)内初始待评估数据的具体内容。

表1

利用目标数据评估模型对初始待评估数据进行计算,可以得到初始业务评估的量化值,具体到本公开中,以表2为例进行说明,表2为根据本公开实施例的初始业务评估的量化值的具体内容。

表2

从而可以根据初始业务评估的量化值及第二筛选规则(回归分析)更新初始待评估数据,得到目标待评估数据,具体到本公开中,以表3为例进行说明,表3为根据本公开实施例的回归分析自变量初始待评估数据间相关性分析的具体内容。

表3

可以通过回归分析模型(SolutionsStatistical Package for the SocialSciences,SPSS)对目标数据评估模型DEA计算得到的初始业务评估的量化值进行处理分析,得到回归分析方程:综合效率=A x营销费用/采购费用+B x净利润/人员成本+C x间接投资额/理财产品余额+D x上市时间+E x客户投诉量+F x评级/总资产,其中,A、B、C、D、E表示各自变量的参数,由SPSS软件处理第一次DEA分析的数据获得(示例:综合效率=-29.788x营销费用/总资产+0.562x净利润/人员成本+0.302x间接投资额/理财产品余额+0.006x上市时间-0.573客户投诉量+1.232评级),根据回归分析模型(SolutionsStatistical Package for the Social Sciences,SPSS)分析结果,上市时间数据对综合效率的影响程度较低,因此在进行第二次目标数据评估模型分析时,将自变量和因变量进行调整,排除“上市时间数据”自变量进行分析。并得到目标业务评估的量化值,具体到本公开中,以表4为例进行说明,表4为根据本公开实施例的目标业务评估的量化值的具体内容。

表4

将目标业务评估的量化值对比初始业务评估的量化值,可见目标技术效率评估的量化值、目标纯技术效率评估的量化值以及目标规模效率评估的量化值均有所降低,说明排除一个无关自变量“上市时间数据”后,目标业务评估的结果更加贴近实际真实情况,更加真实准确,在此基础上可以评估得出提升目标业务效率的关键因素。

根据本公开的实施例,通过调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求,接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据,并从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,从而可以将筛选所得到的初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值,并基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到精减后的目标待评估数据,进而可以将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。由于经过了多次筛选和更新,缩减了第三待评估数据的数据量的同时提升了第三待评估数据的数据质量,进而减少了系统资源的占用,进一步提高了目标业务评估结果的准确性。

根据本公开的实施例,将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值之后,还包括:将初始业务评估的量化值与目标业务评估的量化值进行比对,生成业务评估结果。

根据本公开的实施例,初始业务评估的量化值与目标业务评估的量化值进行比对的内容可以包括:将初始业务评估的量化值中的初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值,与目标业务评估的量化值中的目标技术效率评估的量化值、目标纯技术效率评估的量化值及目标规模效率评估的量化值分别进行比对,确定技术效率、纯技术效率与规模效率的变化数据。

图3示意性示出了根据本公开实施例的初始待评估数据生成的流程图。

如图3所示,该实施例的初始待评估数据生成方法包括操作S310~操作S330。

在操作S310,根据第一筛选规则对目标业务数据进行处理,构建与目标业务数据对应的分析矩阵。

根据本公开的实施例,第一筛选规则可以包括结构方程模型(StructuralEquation Model,SEM),和回归分析模型(SolutionsStatistical Package for theSocial Sciences,SPSS)。可以先利用结构方程模型(Structural Equation Model,SEM)对目标业务数据进行筛选,得到筛选后的目标业务数据,筛选后的目标业务数据在结构层次上包括父代目标业务数据和子代目标业务数据,父代目标业务数据在类型上可以包括父代因变量目标业务数据(例如,业务运营成果数据)和父代自变量目标业务数据(例如,业务投入数据、业务规模数据、客户满意度数据)。子代目标业务数据在类型上可以包括子代因变量目标业务数据(例如,总资产数据、净利润数据、实收资本数据和评级数据),以及子代自变量目标业务数据(例如,人员成本数据、营销费用数据、采购费用数据、上市时间数据、产品余额数据、产品数量数据、直接投资额数据、间接投资额数据、客户投诉量数据和资金转入转出比数据)。具体到本公开中,以表5为例进行说明,表5为根据本公开实施例的满足结构方程模型筛选规则的目标业务数据的具体内容。

表5

在操作S320,根据分析矩阵对目标业务数据进行计算,生成与目标业务数据对应的分析结果,其中,分析结果包括第一分析结果和第二分析结果。

根据本公开的实施例,分析矩阵可以是通过回归分析模型(SolutionsStatistical Package for the Social Sciences,SPSS)对目标业务数据进行筛选后的数据所构建的分析矩阵,分析矩阵可以用于分析目标业务数据之间的相关关系和显著性检验。通过分析矩阵的分析结果,选取分析结果中满足预设筛选阈值的目标业务数据作为初始业务数据。

在操作S330,将分析结果与预设筛选阈值进行比对,得到初始待评估数据。

根据本公开的实施例,分析结果可以包括标准化荷载系数值和显著性检验数值,预设筛选阈值可以包括与标准化荷载系数值对应的筛选阈值,以及。例如,与显著性检验数值对应的筛选阈值P<0.05时,且标准化载荷系数值对应的筛选阈值大于0.4时,选取对应的目标业务数据作为的业务评估变量(即初始待评估数据)。具体到本公开中,以表6为例进行说明,表6为根据本公开实施例利用分析矩阵分析目标业务数据所得到的分析结果。

表6

/>

根据本公开的实施例,通过利用第一筛选规则对目标业务数据进行筛选,使得筛选后的初始待评估数据的数据量更小、数据质量也得到了提升,从而提高了后续初始业务评估结果的准确性。

根据本公开的实施例,将初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值,包括:将因变量初始待评估数据和自变量初始待评估数据输入至目标数据评估模型中,输出初始业务评估的量化值,其中,初始业务评估的量化值包括初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值。

根据本公开的实施例,目标数据评估模型可以是数据包络分析模型(DataEnvelopment Analysis,DEA),通过目标数据评估模型对初始待评估数据进行分析和计算,得到初始业务评估的量化值,初始业务评估的量化值可以包括初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值。初始技术效率评估的量化值可以是在恒定的规模报酬的前提下,某一业务偏离生产前沿的差距,体现的是在确定投入的情况下某一业务获取最大可能产出的能力;初始纯技术效率评估的量化值可以是在可变的规模报酬的前提下,某一业务偏离生产前沿的差距;初始规模效率评估的量化值可以是在同类决策单元在规模报酬恒定情况下的生产前沿与其在规模报酬浮动情况下的生产前沿的差异。生产前沿可以是指某一业务规模报酬的最大边界线。可以理解的是,在数据处理时,若某个数据出现负值,由于数据包络分析模型运算无法使用负值,可以将负值取0进行计算。

在一种可行的实施例中,利用数据包络分析模型对初始待评估数据进行评估计算时,可以选取初始业务评估的量化值中趋近1(或量化值为1)的初始待评估数据作为一个有效前沿面,有效前沿面可以表征某一业务规模报酬有效边界。

根据本公开的实施例,因变量初始待评估数据在结构层次上包括子代因变量初始待评估数据,自变量初始待评估数据包括子代自变量初始待评估数据;其中,基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到目标待评估数据,包括:根据初始业务评估的量化值,选取初始业务评估的量化值中的初始技术效率评估的量化值作为第二筛选规则中的因变量、子代因变量初始待评估数据与子代自变量初始待评估数据之间的比值作为第二筛选规则中的自变量,构建回归分析模型;根据回归分析模型对初始业务评估的量化值进行分析,生成与初始业务评估的量化值对应的分析结果;以及根据分析结果,从初始待评估数据中选取目标待评估数据。

根据本公开的实施例,第二筛选规则可以是回归分析模型(SolutionsStatistical Package for the Social Sciences,SPSS),根据初始业务评估的量化值中的初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值,选取关联度大的初始技术效率评估的量化值作为回归分析模型的因变量;选取净利润数据与人员成本数据的比值、营销费用数据与总资产数据的比值、间接投资额数据与产品余额数据的比值代替营销费用数据、采购费用数据、人员成本数据、净利润数据、间接投资额数据和产品余额数据作为回归分析的自变量。

根据本公开的实施例,可以通过回归分析模型SPSS对初始业务评估的量化值进行处理分析,根据处理分析结果得到回归方程:综合效率=A x营销费用/采购费用+B x净利润/人员成本+C x间接投资额/理财产品余额+D x上市时间+E x客户投诉量+F x评级/总资产。其中,A、B、C、D、E表示各自变量(自变量和因变量)的参数。

例如,由回归分析模型SPSS处理初始业务评估的量化值:综合效率=-29.788x营销费用/总资产+0.562x净利润/人员成本+0.302x间接投资额/理财产品余额+0.006x上市时间-0.573客户投诉量+1.232评级。

根据本公开的实施例,通过利用初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到目标待评估数据,精减了目标待评估数据的数据数量,提升了目标待评估数据的数据质量,进而减少了系统资源的开销,为后续目标业务评估结果的计算提供了基础数据。

根据本公开的实施例,因变量初始待评估数据还包括父代因变量初始待评估数据,父代因变量初始待评估数据包括业务运营成果数据,自变量初始待评估数据还包括业务投入数据、业务规模数据以及客户满意度数据。

根据本公开的实施例,将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值,包括:将因变量目标待评估数据和自变量目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值,其中,目标业务评估的量化值包括目标技术效率评估的量化值、目标纯技术效率评估的量化值以及目标规模效率评估的量化值。

根据本公开的实施例,经过第二筛选规则筛选所得到的目标待评估数据作为目标数据评估模型的输入数据,进行计算得到目标业务评估的量化值,所得输入的因变量目标待评估数据可以包括评级数据、总资产数据和净利润因变量目标待评估数据和自变量目标待评估数据,所得输入的自变量目标待评估数据可以包括人员成本数据、营销费用数据、产品余额数据和间接投资额数据。

根据本公开的实施例,通过根据实际情况利用目标数据评估模型对初始待评估数据、目标待评估数据进行多次评估计算,评估的方式更加灵活科学,提高了评估结果的准确性。

基于上述数据处理方法,本公开还提供了一种数据处理装置。以下将结合图4对该装置进行详细描述。

图4示意性示出了根据本公开实施例的数据处理装置的结构框图。

如图4所示,该实施例的数据处理装置400包括业务数据请求发送模块410、目标业务数据接收模块420、目标业务数据筛选模块430、初始业务评估的量化值输出模块440、初始待评估数据更新模块450和目标业务评估的量化值输出模块460。

业务数据请求发送模块410,用于调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求。在一实施例中,业务数据请求发送模块410可以用于执行前文描述的操作S210,在此不再赘述。

目标业务数据接收模块420,用于接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据。在一实施例中,目标业务数据接收模块420可以用于执行前文描述的操作S220,在此不再赘述。

目标业务数据筛选模块430,用于从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,其中,初始待评估数据在类型上包括因变量初始待评估数据和自变量初始待评估数据。在一实施例中,目标业务数据筛选模块430可以用于执行前文描述的操作S230,在此不再赘述。

初始业务评估的量化值输出模块440,用于将初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值。在一实施例中,初始业务评估的量化值输出模块440可以用于执行前文描述的操作S240,在此不再赘述。

初始待评估数据更新模块450,用于基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到目标待评估数据,其中,目标待评估数据的数据量小于初始待评估数据,目标待评估数据在类型上包括因变量目标待评估数据和自变量目标待评估数据,因变量目标待评估数据和自变量目标待评估数据,与因变量初始待评估数据和自变量初始待评估数据相关联。在一实施例中,初始待评估数据更新模块450可以用于执行前文描述的操作S250,在此不再赘述。

目标业务评估的量化值输出模块460,用于将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。在一实施例中,目标业务评估的量化值输出模块460可以用于执行前文描述的操作S260,在此不再赘述。

根据本公开的实施例,通过数据处理装置400中的业务数据请求发送模块410、目标业务数据接收模块420、目标业务数据筛选模块430、初始业务评估的量化值输出模块440、初始待评估数据更新模块450和目标业务评估的量化值输出模块460,通过调用数据源访问接口,向目标数据源发送用于请求获取业务数据的业务数据请求,接收由目标数据源响应业务数据请求发送的在目标时间范围内产生的目标业务数据,并从目标业务数据中筛选满足第一筛选规则的业务数据作为初始待评估数据,从而可以将筛选所得到的初始待评估数据输入至目标数据评估模型中,输出与初始待评估数据对应的初始业务评估的量化值,并基于初始业务评估的量化值及第二筛选规则更新初始待评估数据,得到精减后的目标待评估数据,进而可以将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值。由于经过了多次筛选和更新,缩减了第三待评估数据的数据量的同时提升了第三待评估数据的数据质量,进而减少了系统资源的占用,进一步提高了目标业务评估结果的准确性。

根据本公开的实施例,数据处理装置还包括:业务评估结果生成模块,用于将目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值之后,将初始业务评估的量化值与目标业务评估的量化值进行比对,生成业务评估结果。

根据本公开的实施例,目标业务数据筛选模块包括:分析矩阵构建子模块、分析结果生成子模块和分析结果比对子模块。

分析矩阵构建子模块,用于根据第一筛选规则对目标业务数据进行处理,构建与目标业务数据对应的分析矩阵。

分析结果生成子模块,用于根据分析矩阵对目标业务数据进行计算,生成与目标业务数据对应的分析结果,其中,分析结果包括第一分析结果和第二分析结果。

分析结果比对子模块,用于将分析结果与预设筛选阈值进行比对,得到初始待评估数据。

根据本公开的实施例,初始业务评估的量化值输出模块包括:初始业务评估的量化值输出子模块,用于将因变量初始待评估数据和自变量初始待评估数据输入至目标数据评估模型中,输出初始业务评估的量化值,其中,初始业务评估的量化值包括初始技术效率评估的量化值、初始纯技术效率评估的量化值以及初始规模效率评估的量化值。

根据本公开的实施例,因变量初始待评估数据在结构层次上包括子代因变量初始待评估数据,自变量初始待评估数据包括子代自变量初始待评估数据;其中,初始待评估数据更新模块包括:回归分析模型构建子模块、分析结果生成子模块和目标待评估数据选取子模块。

回归分析模型构建子模块,用于根据初始业务评估的量化值,选取初始业务评估的量化值中的初始技术效率评估的量化值作为第二筛选规则中的因变量、子代因变量初始待评估数据与子代自变量初始待评估数据之间的比值作为第二筛选规则中的自变量,构建回归分析模型。

分析结果生成子模块,用于根据回归分析模型对初始业务评估的量化值进行分析,生成与初始业务评估的量化值对应的分析结果。

目标待评估数据选取子模块,用于根据分析结果,从初始待评估数据中选取目标待评估数据。

根据本公开的实施例,因变量初始待评估数据还包括父代因变量初始待评估数据,父代因变量初始待评估数据包括业务运营成果数据,自变量初始待评估数据还包括业务投入数据、业务规模数据以及客户满意度数据。

根据本公开的实施例,目标业务评估的量化值输出模块包括:目标业务评估的量化值输出子模块,用于将因变量目标待评估数据和自变量目标待评估数据输入至目标数据评估模型中,输出与目标待评估数据对应的目标业务评估的量化值,其中,目标业务评估的量化值包括目标技术效率评估的量化值、目标纯技术效率评估的量化值以及目标规模效率评估的量化值。

根据本公开的实施例,业务数据请求发送模块410、目标业务数据接收模块420、目标业务数据筛选模块430、初始业务评估的量化值输出模块440、初始待评估数据更新模块450和目标业务评估的量化值输出模块460中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,业务数据请求发送模块410、目标业务数据接收模块420、目标业务数据筛选模块430、初始业务评估的量化值输出模块440、初始待评估数据更新模块450和目标业务评估的量化值输出模块460中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,业务数据请求发送模块410、目标业务数据接收模块420、目标业务数据筛选模块430、初始业务评估的量化值输出模块440、初始待评估数据更新模块450和目标业务评估的量化值输出模块460中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。

图5示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的方框图。

如图5所示,根据本公开实施例的电子设备500包括处理器501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM 503中,存储有电子设备500操作所需的各种程序和数据。处理器501、ROM502以及RAM 503通过总线504彼此相连。处理器501通过执行ROM 502和/或RAM 503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 502和RAM 503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例,电子设备500还可以包括输入/输出(I/O)接口505,输入/输出(I/O)接口505也连接至总线504。电子设备500还可以包括连接至输入/输出(I/O)接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至输入/输出(I/O)接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。

本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。

根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 502和/或RAM 503和/或ROM 502和RAM 503以外的一个或多个存储器。

本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的数据处理方法。

在该计算机程序被处理器501执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分509被下载和安装,和/或从可拆卸介质511被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。

在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

相关技术
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • IP产品运营数据处理方法、装置、设备及可读存储介质
  • 数据仓库内数据处理方法、装置、计算机设备和存储介质
  • 产品数据的处理方法、装置、设备、存储介质及程序产品
  • 语音数据的处理方法、装置、设备、存储介质和程序产品
技术分类

06120116586026