掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、设备和存储介质

文献发布时间:2024-04-18 20:01:30


数据处理方法、装置、设备和存储介质

技术领域

本申请涉及计算机技术领域,具体涉及一种数据处理方法、装置、设备和存储介质。

背景技术

目前,随着计算机领域和AI领域的飞速发展,企业开展各项业务所需数据源越来越多,数据中台获取各业务方数据源中的业务数据,并对业务数据进行整理,并供其它业务方使用该业务数据。然而在数据源对业务数据进行版本迭代,导致相同字段下产生新的数值,而其它业务方无法获知及时获知该数值的含义,导致数据分析误差,可能使得其它业务方将该数值校验为异常数值,影响业务运行。

发明内容

本申请实施例提供一种数据处理方法、装置、设备和存储介质,旨在解决现有技术中业务数据更新迭代产生新数值时导致其它业务方误判的技术问题。

一方面,本申请实施例提供一种数据处理方法,数据处理方法包括以下步骤:

基于预设业务埋点采集数据中台中各目标业务端的业务数据;

获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

对异常业务数据进行标注,得到目标业务端的更新业务数据;

响应数据分发请求,将更新业务数据分发到预设下游数据端。

在本申请一种可能的实现方式中,获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据,包括:

获取业务数据中与预设监控字段对应的目标业务字段和字段标注信息;

若字段标注信息与预设监控字段中的每一预设标注信息均不相同,或字段标注信息为空,则将目标业务字段对应的业务数据设置为异常业务数据。

在本申请一种可能的实现方式中,对异常业务数据进行标注,得到目标业务端的更新业务数据,包括:

向目标业务端发送更新标注请求,获取目标业务端反馈的更新注释信息;

根据预设标注信息、更新注释信息和异常业务数据的字段标注信息,生成更新业务数据。

在本申请一种可能的实现方式中,根据预设标注信息、更新注释信息和异常业务数据的字段标注信息,生成更新业务数据,包括:

获取更新注释信息中的更新标注文本和更新标注数值;

将更新标注文本和更新标注数值输入预设标注信息,生成更新标注信息;

根据更新标注文本对异常业务数据对应的字段标注信息中的字段注释内容进行文本更新,生成更新业务数据。

在本申请一种可能的实现方式中,根据预设标注信息、更新注释信息和异常业务数据的字段标注信息,生成更新业务数据,包括:

获取异常业务数据的数据类型;

若异常业务数据的数据类型与目标业务字段的预设数据类型不同,则删除异常业务数据;

若异常业务数据的数据类型与目标业务字段的预设数据类型相同,则按照更新注释信息更新预设标注信息和字段标注信息,得到更新业务数据。

在本申请一种可能的实现方式中,响应数据分发请求,将正常业务数据和更新业务数据分发到预设下游数据端,包括:

获取所述业务数据中正常业务数据的第一字段名和所述更新业务数据的第二字段名;

若所述第一字段名和所述第二字段名相同,则对所述正常业务数据和所述更新业务数据进行合并入库操作,得到第一合并数据,并将所述第一合并数据分发到预设下游数据端。

在本申请一种可能的实现方式中,响应数据分发请求,将更新业务数据分发到预设下游数据端,包括:

获取业务数据中正常业务数据的第一字段名和第一注释内容和更新业务数据的第二字段名和第二注释内容;

若第一字段名和第二字段名不同,且第一注释内容和第二注释内容相同,则创建目标映射表;

基于目标映射表将正常业务数据和更新业务数据进行合并入库操作,得到第二合并数据,并将第二合并数据分发到预设下游数据端。

另一方面,本申请提供一种数据处理装置,数据处理装置包括:

数据获取模块,被配置为基于预设业务埋点采集数据中台中各目标业务端的业务数据;

异常识别模块,被配置获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

数据标注模块,被配置为对异常业务数据进行标注,得到目标业务端的更新业务数据;

数据分发模块,被配置为响应数据分发请求,将更新业务数据分发到预设下游数据端。

另一方面,本申请还提供一种数据处理设备,数据处理设备包括:

一个或多个处理器;

存储器;以及

一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行以实现的数据处理方法的步骤。

另一方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器进行加载,以执行的数据处理方法中的步骤。

本申请中基于预设业务埋点采集数据中台中各目标业务端的业务数据;获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;对异常业务数据进行标注,得到目标业务端的更新业务数据;响应数据分发请求,将更新业务数据分发到预设下游数据端。实现通过实时检测业务数据中未标注的异常业务数据,并对该异常业务数据进行标注,提高业务数据中标注信息的更新及时性和准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例数据处理方法的场景示意图;

图2为本申请实施例中数据处理方法的一个实施例的流程示意图;

图3为本申请实施例提供的数据处理方法中生成更新业务数据的一个实施例的流程示意图;

图4为本申请实施例提供的数据处理方法中进行去重入库的一个实施例的流程示意图;

图5为本申请实施例提供的数据处理装置的一个实施例的结构示意图;

图6为本申请实施例中提供的数据处理设备的一个实施例结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本发明,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本发明。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必要的细节使本发明的描述变得晦涩。因此,本发明并非旨在限于所示的实施例,而是与符合本申请所公开的原理和特征的最广范围相一致。

目前,随着计算机领域和AI领域的飞速发展,企业开展各项业务所需数据源越来越多,数据中台获取各业务方数据源中的业务数据,并对业务数据进行整理,并供其它业务方使用该业务数据。然而在数据源对业务数据进行版本迭代,导致相同字段下产生新的数值,而其它业务方无法获知及时获知该数值的含义,导致数据分析误差,可能使得其它业务方将该数值校验为异常数值,影响业务运行。

基于此,本申请提出一种数据处理方法、装置、设备和计算机可读存储介质,以解决现有技术中业务数据更新迭代产生新数值时导致其它业务方误判的技术问题。

本发明实施例中的数据处理方法应用于数据处理装置,数据处理装置设置于数据处理设备,数据处理设备中设置有一个或多个处理器、存储器,以及一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并被配置为由处理器执行以实施数据处理方法;其中,数据处理设备可以是智能终端,例如手机、平板电脑、网络设备和智能电脑等;可选的,数据处理设备还可以是一台服务器,或者多台服务器组成的服务集群。

如图1所示,图1为本申请实施例数据处理方法的场景示意图,本发明实施例中数据处理场景包括数据处理设备100(数据处理设备100中集成有数据处理装置)和目标业务端200,数据处理设备100中运行有数据处理方法对应的计算机可读存储介质,以执行数据处理方法的步骤。该目标业务终端200为与数据处理设备100进行数据对接,并对业务数据进行数据标注,或接收数据处理终端100分发的业务数据的业务终端。

可以理解的是,图1所示数据处理方法场景中的数据处理设备,或者数据处理设备中包含的装置并不构成对本发明实施例的限制,即数据处理方法的场景中包含的数据处理设备的设备数量、设备种类,或者各个设备中包含的装置数、装置种类不影响本发明实施例中技术方案的整体实现,均可以算作本发明实施例要求保护技术方案的等效替换或者衍生。

本发明实施例中数据处理设备100主要用于:基于预设业务埋点采集数据中台中各目标业务端的业务数据;

获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

对异常业务数据进行标注,得到目标业务端的更新业务数据;

响应数据分发请求,将更新业务数据分发到预设下游数据端。

本发明实施例中的数据处理设备100可以是独立的数据处理设备,例如手机、平板电脑、网络设备、服务器和智能电脑等智能终端,也可以是由多个数据处理设备组成的数据处理网络或数据处理集群。

本申请实施例提供一种数据处理方法、装置、设备和计算机可读存储介质,以下分别进行详细说明。

本领域技术人员可以理解的是,图1中所示出的应用环境,仅仅是与本申请方案相关的其中一种应用场景,并不构成对本申请方案应用场景的限定,其它的应用环境还可以包括比图1所示出的更多或更少的数据处理设备,或者数据处理网络连接关系,例如图1中仅示出一个数据处理设备,可以理解的是该数据处理方法的场景还可以包括一个或多个数据处理设备,具体在此不做限定;该数据处理设备100中还可以包括存储器,用于存储业务数据。

需要说明的是,图1所示的数据处理方法的场景示意图仅仅是一个示例,本发明实施例描述的数据处理方法的场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对本发明实施例提供的技术方案的限定。

基于上述数据处理方法的场景,提出本发明所公开的数据处理方法的各个实施例。

如图2所示,图2为本申请实施例中数据处理方法的一个实施例的流程示意图,该数据处理方法包括如下步骤201~步骤204:

201、基于预设业务埋点采集数据中台中各目标业务端的业务数据;

本实施例中的数据处理方法应用于数据处理设备,数据处理设备的种类和数量不做具体限定,即,数据处理设备可以是一个或多个智能终端或者服务器,在一个具体实施例中,数据处理设备为智能电脑。

具体的,数据处理设备预先建立了用于接收并处理各上游的目标业务端传来的业务数据的数据中台。并在数据处理设备运行过程中,响应业务数据采集请求。其中,该业务数据采集请求未驱动数据处理设备根据预设业务埋点获取关联目标业务端的业务数据的操作请求。其中,该业务数据采集请求的触发方式在此不做具体限定,例如,业务数据采集请求可以由用户主动触发的,例如,用户通过点击数据处理设备中的数据采集按钮,主动触发业务数据采集请求。可选的,该业务数据采集请求还可以由数据处理设备自动触发,例如,该数据中台设置了自动采集进程,在预设时间段内自动触发业务数据采集请求。

具体的,数据处理设备预先在目标业务端中插入预设业务埋点,在接收到业务数据采集请求后,通过该预设业务埋点根据业务数据对应的数据采集方式采集该目标业务端中授权采集的业务数据,并将业务数据传输到数据中台,且经过预设的大数据运算工具和大数据传输工具将业务数据传输到数据中台中的数据仓库,并存入数据仓库中的大数据存储查询数据表中。其中,在一个具体实施例中,该大数据运算工具为Flink计算引擎,该大数据传输工具为kafka消息系统。其中,业务数据为目标业务端中各业务线产生的异构数据。该数据中台为被配置为将多个目标业务端的数据源进行集成,统一进行数据存储,再根据数据处理方式对数据进行分层,各业务端可根据需要自行获取数据处理不同阶段的数据,最后进行个性化处理输出的数据管理平台。

202、获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

具体的,数据处理设备在获取到业务数据后,还获取业务数据中的目标业务字段和字段标注信息,并根据目标业务字段和关联的字段标注信息提取业务数据中的异常业务数据。

具体的,数据处理设备预先设置了针对业务数据进行判定的预设监控字段,通过该预设监控字段判断该业务数据是否为注释不清楚,或没有注释的异常业务数据,从而避免下游数据端因异常业务数据导致分析误差。

具体的,数据处理设备获取业务数据中与预设监控字段对应的目标业务字段和字段标注信息,根据该预设监控字段、目标业务字段和字段标注信息对业务数据进行数据监督,从而确定业务数据中的异常业务数据。其中,目标业务字段为携带特定标注信息,用于进行业务数据校验的数据字段。可选的,在一个具体实施例中,该业务数据为视听业务数据,该目标业务字段为节目类型,该目标业务字段包括数值1,对应的字段标注信息为电视剧;数值2,对应的字段标注信息为电影;数值3,对应的字段标注信息为动画片等。

具体的,数据处理设备在获取预设监控字段、目标业务字段和字段标注信息后,将预设监控字段和目标业务字段及字段标注信息进行比较,从而确定异常业务数据。

可选的,若业务数据中的目标业务字段中的字段值和对应字段标注信息和预设监控字段中的每一预设标注信息均不相同,即业务数据中存在未知标注信息的业务数据,则数据处理设备将该目标业务字段关联的业务数据设置为异常业务数据,并相对应的目标业务端发送对应的提醒信息。

在一个具体实施例中,预设监控字段中的取值范围为[1,3]中的整数,每一整数对应的预设标注信息为视听业务数据的节目类型。若业务数据中的目标业务字段中的字段值超过该取值范围,或字段标注信息与预设监控字段中对应字段值的预设标注信息不同,则数据处理设备确定目标业务字段对应的业务数据为异常业务数据。可选的,该预设监控字段的取值范围可以根据不同业务数据的业务类型或数据类型进行自定义设置。

可选的,若业务数据中的与预设监控字段对应的目标业务字段的字段标注信息为空,即,业务数据中存在未标注的业务数据,则数据处理设备将该目标业务字段对应的业务数据设置为异常业务数据。

203、对异常业务数据进行标注,得到目标业务端的更新业务数据;

具体的,数据处理设备在通过预设监控字段、目标业务字段和字段标注信息确定业务数据中的异常业务数据后,还对异常业务数据进行标注,从而得到目标业务端的更新业务数据。

可选的,数据处理设备在获取异常业务数据后,还对异常业务数据进行错误判定,从而确定该异常业务数据为由于上游的目标业务端版本更新生成的数据处理设备未定义的正常业务数据,还是由于乱码、网络错误或测试数据误入等原因产生的错误数据。

可选的,数据处理设备获取异常业务数据的数据类型;若异常业务数据的数据类型与目标业务字段的预设数据类型不同,则数据处理设备判断该异常业务数据为错误数据,并删除该错误数据。

若异常业务数据的数据类型与目标业务字段的预设数据类型相同,则数据处理设备判断该异常业务数据为由于上游的目标业务端版本更新生成的数据处理设备未定义的正常业务数据,按照更新注释信息更新预设标注信息和字段标注信息,得到更新业务数据。

数据处理设备在确定异常业务数据为错误数据后,对该错误数据进行错误追溯,并对错误追溯后的错误数据进行删除或纠错处理。

具体的,数据处理设备在确定异常业务数据为正常业务数据后,向该异常业务数据的数据源,即上游的目标业务端发送更新标注请求,并接收该目标业务端反馈的更新注释信息,其中,该更新注释信息为数据更新后生成的业务数据注释信息。

具体的,数据处理设备在获取到更新注释信息后,根据更新注释信息、预设监控字段中对应的预设标注信息和异常业务数据的字段标注信息进行注释更新操作,对异常业务数据中的异常标注信息进行更新,生成更新业务数据。

204、响应数据分发请求,将更新业务数据分发到预设下游数据端。

具体的,数据处理设备在获取到目标业务端的更新业务数据后,将业务数据中的正常业务数据和更新业务数据进行合并去重并存入预设大数据集群数据库,并根据预设周期进行更新覆盖,并响应预设下游数据端的数据分发请求,将更新业务数据分发到预设下游数据端。

具体的,数据处理设备根据预设字段名和预设字段内容对业务数据进行去重入库后,还响应预设下游数据端发送的数据分发请求,并解析该数据分发请求,将数据分发请求中指定的正常业务数据和更新业务数据发送到指定页面前端,各预设下游数据端能够通过该页面前端查询或处理该业务数据。

本实施例中,数据处理设备基于预设业务埋点采集数据中台中各目标业务端的业务数据;获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;对异常业务数据进行标注,得到目标业务端的更新业务数据;响应数据分发请求,将更新业务数据分发到预设下游数据端。实现通过实时检测业务数据中未标注的异常业务数据,并对该异常业务数据进行标注,提高业务数据中标注信息的更新及时性和准确性。

如图3所示,图3为本申请实施例提供的数据处理方法中生成更新业务数据的一个实施例的流程示意图,具体的,该数据处理方法包括步骤S301~步骤S303:

301、获取更新注释信息中的更新标注文本和更新标注数值;

302、将更新标注文本和更新标注数值输入预设标注信息,生成更新标注信息;

303、根据更新标注文本对异常业务数据对应的字段标注信息中的字段注释内容进行文本更新,生成更新业务数据。

基于上述实施例,本实施例中,数据处理设备在获取更新注释信息后,根据更新注释信息中的更新标注文本和更新标注数值对异常业务数据进行标注更新,生成更新业务数据。

具体的,数据处理设备获取更新注释信息中的更新标注文本和更新标注数值。其中,该更新标注文本为用于更新异常业务数据中的字段标注信息的标注文本信息。该更新标注数值为与更新标注文本相映射的业务字段数值。

具体的,数据处理设备在获取更新标注文本和更新标注数值后,基于更新标注文本和更新标注数值对预设标注信息进行更新,即,将更新标注文本和更新标注数值输入预设标注信息,若该预设标注信息未存储该更新标注数值及更新标注文本关联的历史版本标注信息,则在预设标注信息中新增该更新标注文本和更新标注数值的映射,生成更新标注信息。若该预设标注信息中存储有更新标注数值及更新标注文本的历史版本标注信息,则数据处理设备将更新标注数值和更新标注文本覆盖该历史版本标注信息,生成更新标注信息。

具体的,数据处理设备还根据更新标注文本和更新标注数值对异常业务数据进行文本更新,若该异常业务数据中存在目标业务字段和字段标注信息与更新标注文本和更新标注数值不匹配,则数据处理设备通过更新标注文本对该异常业务数据对应的字段标注信息中的字段注释内容进行文本更新,生成更新业务数据,该更新业务数据中的目标业务字段和关联的字段标注信息与更新标注数值和更新标注文本相同。

本实施例中,数据处理设备通过获取更新注释信息中的更新标注文本和更新标注数值;将更新标注文本和更新标注数值输入预设标注信息,生成更新标注信息;根据更新标注文本对异常业务数据对应的字段标注信息中的字段注释内容进行文本更新,生成更新业务数据。实现及时获取更新注释信息,并根据更新注释信息更新预设标注信息和异常业务数据,提高业务数据的可解释性,降低数据误判概率。

如图4所示,图4为本申请实施例提供的数据处理方法中进行去重入库的一个实施例的流程示意图,具体的,包括步骤401~步骤403:

401、获取业务数据中正常业务数据的第一字段名和第一注释内容和更新业务数据的第二字段名和第二注释内容;

402、若第一字段名和第二字段名不同,且第一注释内容和第二注释内容相同,则创建目标映射表;

403、基于目标映射表将正常业务数据和更新业务数据进行合并入库操作,得到第二合并数据,并将第二合并数据分发到预设下游数据端。

基于上述实施例,本实施例中,数据处理设备在响应数据分发请求之前,预先对业务数据中的正常业务数据和更新业务数据进行去重入库操作。

具体的,在一个实施例中,数据处理设备获取该业务数据中各正常业务数据的第一字段名和第一注释内容,以及更新业务数据中的第二字段名和第二字段内容。其中,第一字段名为业务数据中未更新的正常业务数据中预设的用于去重识别的预设字段名称。第二字段名为更新业务数据中与第一字段名相对应的预设字段名称。第一注释内容为该第一字段名对应字段关联的字段注释内容。第二注释内容为第二字段名对应字段关联的字段注释内容。

具体的,数据处理设备在获取到第一字段名和第二字段名,以及第一注释内容和第二注释内容后,根据第一字段名、第二字段名、第一注释内容和第二注释内容对业务数据进行去重入库处理。

可选的,在一个实施例中,数据处理设备将第一字段名和第二字段名进行比对,根据比对结果执行去重入库处理。

若比对结果为第一字段名和第二字段名相同,则数据处理设备将正常业务数据和更新业务数据进行合并入库操作,将相同维度字段进行合并,并在大数据集群数据库中对应数据表进行备注,使得正常业务数据和更新业务数据合并统一化存储。

可选的,在另一个实施例中,若第一字段名和第二字段名不同,则数据处理设备进一步比对第一注释内容和第二注释内容,若第一注释内容和第二注释内容相同,即第一字段名和第二字段名不同,且第一注释内容和第二注释内容相同,则数据处理设备创建与该正常业务数据和更新业务数据对应的目标映射表,并基于该目标映射表将正常业务数据和更新业务数据进行转换,并将转换后的正常业务数据和更新业务数据统一化存入大数据集群数据库。

可选的,数据处理设备还能够将不同正常业务数据的第一字段名和第一注释内容按照上述步骤进行比较,并根据第一字段名和第一注释内容对不同正常业务数据进行去重入库处理。

可选的,数据处理设备还能够将不同更新业务数据的第二字段名和第二注释内容按照上述步骤进行比较,并根据第二字段名和第二追溯内容对不同更新业务数据进行去重入库处理。

本实施例中,数据处理设备通过获取业务数据中正常业务数据的第一字段名和第一注释内容和更新业务数据的第二字段名和第二注释内容;若第一字段名和第二字段名不同,且第一注释内容和第二注释内容相同,则创建目标映射表;基于目标映射表将正常业务数据和更新业务数据进行合并入库操作,得到第二合并数据,并将第二合并数据分发到预设下游数据端。实现根据字段名和注释内容对大数据集群数据库中的业务数据进行合并统一化存储,提高数据存储效率和集成度。

为了更好实施本申请实施例中数据处理方法,在数据处理方法基础之上,本申请实施例中还提供一种数据处理装置,如图5所示,图5为本申请实施例提供的数据处理装置的结构示意图,具体的,数据处理装置500包括:

数据获取模块501,被配置为基于预设业务埋点采集数据中台中各目标业务端的业务数据;

异常识别模块502,被配置获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

数据标注模块503,被配置为对异常业务数据进行标注,得到目标业务端的更新业务数据;

数据分发模块504,被配置为响应数据分发请求,将更新业务数据分发到预设下游数据端。

在本实施例一种可能的实现方式中,数据处理装置获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据,包括:

获取业务数据中与预设监控字段对应的目标业务字段和字段标注信息;

若字段标注信息与预设监控字段中的每一预设标注信息均不相同,或字段标注信息为空,则将目标业务字段对应的业务数据设置为异常业务数据。

在本实施例一种可能的实现方式中,数据处理装置对异常业务数据进行标注,得到目标业务端的更新业务数据,包括:

向目标业务端发送更新标注请求,获取目标业务端反馈的更新注释信息;

根据预设标注信息、更新注释信息和异常业务数据的字段标注信息,生成更新业务数据。

在本实施例一种可能的实现方式中,数据处理装置根据预设标注信息、更新注释信息和异常业务数据的字段标注信息,生成更新业务数据,包括:

获取更新注释信息中的更新标注文本和更新标注数值;

将更新标注文本和更新标注数值输入预设标注信息,生成更新标注信息;

根据更新标注文本对异常业务数据对应的字段标注信息中的字段注释内容进行文本更新,生成更新业务数据。

在本实施例一种可能的实现方式中,数据处理装置根据预设标注信息、更新注释信息和异常业务数据的字段标注信息,生成更新业务数据,包括:

获取异常业务数据的数据类型;

若异常业务数据的数据类型与目标业务字段的预设数据类型不同,则删除异常业务数据;

若异常业务数据的数据类型与目标业务字段的预设数据类型相同,则按照更新注释信息更新预设标注信息和字段标注信息,得到更新业务数据。

在本实施例一种可能的实现方式中,数据处理装置响应数据分发请求,将更新业务数据分发到预设下游数据端,包括:

获取所述业务数据中正常业务数据的第一字段名和所述更新业务数据的第二字段名;

若所述第一字段名和所述第二字段名相同,则对所述正常业务数据和所述更新业务数据进行合并入库操作,得到第一合并数据,并将所述第一合并数据分发到预设下游数据端。

在本实施例一种可能的实现方式中,数据处理装置响应数据分发请求,将更新业务数据分发到预设下游数据端,包括:

获取业务数据中正常业务数据的第一字段名和第一注释内容和更新业务数据的第二字段名和第二注释内容;

若第一字段名和第二字段名不同,且第一注释内容和第二注释内容相同,则创建目标映射表;

基于目标映射表将正常业务数据和更新业务数据进行合并入库操作,得到第二合并数据,并将第二合并数据分发到预设下游数据端。

本实施例中,数据处理装置基于预设业务埋点采集数据中台中各目标业务端的业务数据;获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;对异常业务数据进行标注,得到目标业务端的更新业务数据;响应数据分发请求,将更新业务数据分发到预设下游数据端。实现根据实时检测业务数据中未标注的异常业务数据,并对该异常业务数据进行标注,提高业务数据中标注信息的更新及时性和准确性。

本发明实施例还提供一种数据处理设备,如图6所示,图6为本申请实施例中提供的数据处理设备的一个实施例结构示意图。

数据处理设备集成了本发明实施例所提供的任意一种数据处理装置,该数据处理设备包括:

一个或多个处理器;

存储器;以及

一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行上述数据处理方法实施例中任一实施例中的数据处理方法中的步骤。

具体来讲:数据处理设备可以包括一个或者一个以上处理核心的处理器601、一个或一个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。本领域技术人员可以理解,图6中示出的数据处理设备结构并不构成对数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器601是该数据处理设备的控制中心,利用各种接口和线路连接整个数据处理设备的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器602内的数据,执行数据处理设备的各种功能和处理数据,从而对数据处理设备进行整体监控。可选的,处理器601可包括一个或多个处理核心;优选的,处理器601可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。

存储器602可用于存储软件程序以及模块,处理器601通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据数据处理设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。

数据处理设备还包括给各个部件供电的电源603,优选的,电源603可以通过电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源603还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该数据处理设备还可包括输入单元604,该输入单元604可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出,数据处理设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,数据处理设备中的处理器601会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器601来运行存储在存储器602中的应用程序,从而实现各种功能,如下:

基于预设业务埋点采集数据中台中各目标业务端的业务数据;

获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

对异常业务数据进行标注,得到目标业务端的更新业务数据;

响应数据分发请求,将更新业务数据分发到预设下游数据端。

为此,本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random AccessMemory)、磁盘或光盘等。其上存储有计算机程序,计算机程序被处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。例如,计算机程序被处理器进行加载可以执行如下步骤:

基于预设业务埋点采集数据中台中各目标业务端的业务数据;

获取业务数据中的目标业务字段和字段标注信息,根据目标业务字段和字段标注信息,提取业务数据中的异常业务数据;

对异常业务数据进行标注,得到目标业务端的更新业务数据;

响应数据分发请求,将更新业务数据分发到预设下游数据端。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。

具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法实施例,在此不再赘述。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

以上对本申请实施例所提供的一种数据处理方法进行了详细介绍,本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术分类

06120116561096