银行业数据的处理方法、系统、终端设备及计算机存储介质

文献发布时间：2024-04-18 19:58:21

技术领域

本申请涉及银行业数据处理领域，尤其涉及一种银行业数据的处理方法、系统、终端设备及可读存储介质。

背景技术

随着数据作为新的生产要素得到广泛认识和深入应用，以银行业为代表的商业创新力量，基于数据驱动的业务比重越来越大、业务需求越来越多样、数据规模更是呈现爆炸性增长，因此，需要立足于银行业务，建设一套具备银行专业知识库、业务标签与规则建议的智能建模系统，降低银行数据模型设计的学习门槛、开发成本，并从银行业务角度在模型设计中提供安全合规建议和配套规则管控。

然而，传统数据建模及开发系统，主要提供库表结构的可视化设计、逻辑化设计、代码编写，是一种通用的类数据库开发的方案，不能解决多类型数据库、集群的重复开发问题，导致银行业数据进行处理分析的效率较低以及成本较高。例如，在银行业中，各类数据库及数据引擎普遍仍以SQL(Structured Query Language，结构化查询语言)作为开发语言，但是由于底层存储计算架构的差异、计算模型的差异、数据格式的差异等原因，各种大数据开源软件对SQL的要求和语法都不一样，比如Hive、Apache Spark SQL、GaussDB等。而基于场景考虑，应用系统针对存储计算效率和成本的差异，会同时采用不同的组件部署策略，可能同时使用不同的数据库工具、但其上会存储相同的数据，这导致一套业务需要在不同数据库上建模。而要实现这一目的，需要数据开发掌握多种数据库建模语言，并理解其最佳的设计实践，带来了极大的使用成本和效率瓶颈。

发明内容

本申请的主要目的在于提供一种银行业数据的处理方法、系统、终端设备及可读存储介质，旨在解决对银行业数据进行处理分析的效率低和成本高的技术问题。

为实现上述目的，本申请提供了一种银行业数据的处理方法，所述银行业数据的处理方法包括：

通过统一的语法规范，生成多个不同数据库的数据库建模需求信息；

根据各个所述数据库的数据库建模需求信息，并结合统一的逻辑建模结构，建立银行业专业知识库，其中，所述银行业专业知识库中包括字典、数据项，以及所述数据项对应的码值定义，所述字典包括词根字典和术语字典；

获取待处理的银行业数据，通过所述银行业专业知识库，将所述银行业数据对应的数据逻辑模型，翻译为所述银行业数据对应的数据物理模型；

根据所述数据物理模型，生成适配各个所述数据库的建模语句；

将所述建模语句输入至各个所述数据库对应的数据库环境进行执行，得到综合执行结果，将所述综合执行结果作为对银行业数据进行分析处理的结果。

可选地，所述通过所述银行业专业知识库，将所述银行业数据对应的数据逻辑模型，翻译为所述银行业数据对应的数据物理模型的步骤包括：

通过所述银行业专业知识库，将所述银行业数据对应的数据逻辑模型进行初始化标记，并输出预设的标签引导确认界面；

在接收到响应于所述标签引导确认界面而输入的确认指令后，根据初始化标记后的数据逻辑模型，生成所述银行业数据对应的多个预设目标属性，其中，所述预设目标属性包括业务标签和数据分布形态；

根据所述银行业数据对应的各所述预设目标属性，确定所述银行业数据对应的数据物理模型。

可选地，所述根据所述银行业数据对应的各所述预设目标属性，确定所述银行业数据对应的数据物理模型的步骤包括：

根据所述银行业数据对应的各所述预设目标属性，从所述银行业专业知识库检索得到所述银行业数据匹配的业务合规指标，其中，所述业务合规指标包括所述预设目标属性对应的取值范围信息、安全合规信息和监管要求信息；

根据所述业务合规指标，对所述银行业数据进行多集群的模型布控，得到所述银行业数据对应的数据物理模型。

可选地，所述根据所述数据物理模型，生成适配各个所述数据库的建模语句的步骤包括：

获取各个所述数据库对应的数据库特性，根据各个所述数据库对应的数据库特性，分别对所述数据物理模型进行模型优化和配置补充，得到与各个所述数据库各自适配的目标物理模型；

基于各个所述数据库各自适配的目标物理模型，生成适配各个所述数据库的建模语句；

其中，所述模型优化包括对所述数据物理模型的字段信息、主键与分布键信息的优化，所述配置补充包括对所述数据物理模型的生命周期、存储类型与分片规则的补充。

可选地，所述将所述建模语句输入至各个所述数据库对应的数据库环境进行执行，得到综合执行结果的步骤包括：

将所述建模语句输入至各个所述数据库对应的数据库环境，输出得到各个所述数据库环境对应的模型执行指令信息，其中，所述数据库环境包括数据库类型信息，所述模型执行指令信息为新建模型或者变更模型；

执行各所述模型执行指令信息适配的语句策略，得到综合执行结果。

可选地，在所述将所述银行业数据对应的数据逻辑模型，翻译为所述银行业数据对应的数据物理模型的步骤之前，所述方法还包括：

对所述银行业数据对应的数据逻辑模型进行规范性检查；

在所述银行业数据对应的数据逻辑模型中将所述规范性检查出的非规范信息进行校正更新。

可选地，所述获取待处理的银行业数据的步骤包括：

获取端到端输入的映射源银行业务数据；

通过所述映射源银行业务数据，结合事实模型设计和维度模型设计，筛选分析得到银行业的数仓核心数据；

将所述数仓核心数据，作为待处理的银行业数据。

此外，为实现上述目的，本申请还提供一种银行业数据的处理系统，所述系统包括：

语义定义模块，用于通过统一的语法规范，生成多个不同数据库的数据库建模需求信息；

逻辑设计模块，用于根据各个所述数据库的数据库建模需求信息，并结合统一的逻辑建模结构，建立银行业专业知识库，其中，所述银行业专业知识库中包括字典、数据项，以及所述数据项对应的码值定义，所述字典包括词根字典和术语字典；

物理转换模块，用于获取待处理的银行业数据，通过所述银行业专业知识库，将所述银行业数据对应的数据逻辑模型，翻译为所述银行业数据对应的数据物理模型；

语句生成模块，用于根据所述数据物理模型，生成适配各个所述数据库的建模语句；

语句执行模块，用于将所述建模语句输入至各个所述数据库对应的数据库环境进行执行，得到综合执行结果，将所述综合执行结果作为对银行业数据进行分析处理的结果。

此外，为实现上述目的，本申请还提供一种终端设备，所述终端设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的银行业数据的处理程序，所述银行业数据的处理程序被所述处理器执行时实现如上述的银行业数据的处理方法的步骤。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有银行业数据的处理程序，所述银行业数据的处理程序被处理器执行时实现如上述的银行业数据的处理方法的步骤。

本申请通过统一的语法规范，生成多个不同数据库的数据库建模需求信息，从而定义统一建模的语法规范、逻辑建模结构，并通过根据各个数据库的数据库建模需求信息，并结合统一的逻辑建模结构，建立银行业专业知识库，其中，该银行业专业知识库中包括字典、数据项，以及所述数据项对应的码值定义，所述字典包括词根字典和术语字典，然后获取待处理的银行业数据，通过银行业专业知识库，将银行业数据对应的数据逻辑模型，翻译为银行业数据对应的数据物理模型，从而采用统一语义建立逻辑模型，根据要建模的数据库，将逻辑模型翻译为对应数据库的物理模型，再通过根据数据物理模型，生成适配各个数据库的建模语句，从而实现根据物理模型，系统自动生成不同数据库的建模语句，并将建模语句输入至各个数据库对应的数据库环境进行执行，得到综合执行结果，将综合执行结果作为对银行业数据进行分析处理的结果，从而提供一种统一语义的逻辑化建模方法，本申请的数据开发只需定义一次业务模型、系统自动转换生成多引擎多集群的模型和任务，实现一次开发、多集群部署，大幅提升建模效率以及模型的可迁移性，并且降低数据开发的学习成本。

也即，本申请中银行业数据的处理方法可实现统一语义的数据逻辑化建模，通过统一标准的建模语义，满足各种不同数据库的建模需求，用户无需关心数据库的语法差异，能够使用统一语义完成不同数据库的建模。并且，通过统一语义语法的建模，可实现一次定义、多数据库同时建模，大幅提升建模效率，体现了逻辑建模的可复制性与可迁移性，同时统一语义支持扩展，实现不同数据库的兼容，降低了银行业数据在不同数据库上建模的成本和效率，进而有效解决了对银行业数据进行处理分析的效率低和成本高的技术问题。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的终端设备的结构示意图；

图2为本申请银行业数据的处理方法第一实施例的流程示意图；

图3为本申请银行业数据的处理方法第二实施例的流程示意图；

图4为本申请银行业数据的处理方法第三实施例的流程示意图；

图5为本申请银行业数据的处理方法第四实施例的流程示意图；

图6为本申请银行业数据的处理系统一实施例涉及的功能模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，图1为本申请实施例方案涉及的硬件运行环境的终端设备结构示意图。

需要说明的是，本申请实施例终端设备可以是执行本申请银行业数据的处理方法的设备，该终端设备具体可以是内部包含有银行业数据的处理系统的终端设备。

如图1所示，该终端设备可以包括：处理器1001，例如中央处理器(CentralProcessing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity，WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory，RAM)存储器，也可以是稳定的非易失性存储器(Non-Volatile Memory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对终端设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及银行业数据的处理程序。

在图1所示的终端设备中，网络接口1004主要用于与其他设备进行数据通信；用户接口1003主要用于与用户进行数据交互；本申请终端设备中的处理器1001、存储器1005可以设置在终端设备中，所述终端设备通过处理器1001调用存储器1005中存储的银行业数据的处理程序，并执行以下操作：

通过统一的语法规范，生成多个不同数据库的数据库建模需求信息；

根据各个所述数据库的数据库建模需求信息，并结合统一的逻辑建模结构，建立银行业专业知识库，其中，所述银行业专业知识库中包括字典、数据项，以及所述数据项对应的码值定义；

获取待处理的银行业数据，通过所述银行业专业知识库，将所述银行业数据对应的数据逻辑模型，翻译为所述银行业数据对应的数据物理模型；

根据所述数据物理模型，生成适配各个所述数据库的建模语句；

将所述建模语句输入至各个所述数据库对应的数据库环境进行执行，得到综合执行结果，将所述综合执行结果作为对银行业数据进行分析处理的结果。