掌桥专利:专业的专利平台
掌桥专利
首页

一种智能化的数据指标管理方法

文献发布时间:2023-06-19 16:09:34



技术领域

本发明涉及一种管理方法,更具体的说是涉及一种智能化的数据指标管理方法。

背景技术

数据指标是衡量业务发展情况的重要标准,在一个典型的业务场景下,同一个数据指标往往根据统计的维度以及时间范围等筛选条件的不同,可以划分为更多的子指标。例如:活跃用户数可以根据统计时间分为日活跃用户数和月活跃用户数,也可以根据用户交互模式再分为登录活跃用户数和无登录活跃用户数。这些子指标之间互相存在关联关系,统计方式也只存在细微差别,如果将它们作为独立指标进行管理和维护,既无法体现指标间的内在联系,也会由于指标数量的膨胀导致难以维护和计算。

目前对于存在内在关联关系的数据指标主要是采用逻辑分组的方式来进行管理,但逻辑分组只能从业务概念上对数据指标进行区分,无法对相似指标的计算规则等方面进行有效的复用,而且对于多级关联的数据指标,逻辑分组也无法很好的标识指标之间的层级以及内在关系。

发明内容

针对现有技术存在的不足,本发明的目的在于提供一种基于派生和复合的指标管理方法,可以有效的简化关联数据指标的创建和维护过程,并实现数据指标间关系的可视化跟踪。

为实现上述目的,本发明提供了如下技术方案:一种智能化的数据指标管理方法,包括如下步骤:

步骤一,通过数据集、维度集合和度量集合创建数据模型;

步骤二,在数据模型的基础上通过定义出数据指标的各种属性构建出基础数据指标;

步骤三,在构建出基础指标之后,判断是否需要对指标进行扩展,若不需要扩展则直接继续下一步,若需要扩展,则扩展生成关联指标后继续下一步;

步骤四,采用计算公式将几个不同的基础指标进行组合,形成一个全新的复合指标。

作为本发明的进一步改进,所述步骤二中的基础数据指标包含以下四个属性:指标列:选择数据模型中定义的某一个度量列作为该指标的度量值,一个指标只能包含一个唯一的度量值;

统计维度:选择数据模型中定义的维度列,这个决定了指标的统计维度;

聚合方式:对指标列的度量值如何进行聚合;

修饰词:定义固定的条件约束。

作为本发明的进一步改进,所述步骤三中扩展生成管理指标的扩展形式包括:复合指标:是建立在基础指标之上,通过运算规则形成的计算指标;

派生指标:在基础指标或者复合指标之上,修改数据范围或约束条件,形成的新指标。

作为本发明的进一步改进,所述步骤三中还具有生成相应的关系图谱步骤,具体步骤如下:

步骤三一,搭载的系统自动记录指标所依赖的数据模型,以及数据模型背后的数据源,并在执行派生或者聚合操作生成新的指标时,记录指标间的相互关系;其中,指标间的相互关系可以通过其父指标进行逐级追溯,最终找到一个或多个根节点。

作为本发明的进一步改进,所述步骤三中扩展的复合指标和派生指标均为次级指标,次级指标会自动继承父指标所属的数据源、数据模型以及数据维度和计算公式,并且在父指标的相关内容被修改后,通过步骤三一中生成的关系图谱自动找到该指标所有的次级关联指标,之后动态修改所有子指标的相关配置。

本发明的有益效果,本发明在创建指标时,可以基于现有指标进行复合和派生操作,并可以动态调整指标的维度和约束条件,这样不但能够快速的创建出关联指标;而且指标间的层级以及内在关系无需再进行人为的调整,系统能够自动识别并生成相应的关系图谱。同时,由于指标的计算规则是可以由关联指标继承的,一旦计算规则由于业务变更而发生调整,只需要对父指标进行相应的调整,各个层级的关联指标都会自动调整相应的计算规则,避免人工调整的繁琐和遗漏。

附图说明

图1为根据示例数据集所构成的数据模型示意图;

图2为指标之间的相互关系示意图;

图3为生成关系图谱的流程示意图;

图4为复合指标的示意图。

具体实施方式

下面将结合附图所给出的实施例对本发明做进一步的详述。

本发明的核心概念为数据模型和从属于数据模型的数据指标。其中数据模型可以看作一个基础数据集,通过绑定特定数据源的SQL进行定义,并可以指定一些额外的配置项,例如:度量列,维度列等,数据模型是后续定义指标的基础。假设基于下表的数据集创建数据模型,则数据模型的构成由图1所示:

所以,一个数据模型可以看所为:数据集+维度集合+度量集合创建出数据模型之后,即可在数据模型的基础上通过定义出数据指标的各种属性构建出基础数据指标,一个基础数据指标应该包含以下四个属性:

·指标列:选择数据模型中定义的某一个度量列作为该指标的度量值,一个指标只能包含一个唯一的度量值,例如实际生成量或计划生成量;

·统计维度:选择数据模型中定义的维度列,这个决定了指标的统计维度;

·聚合方式:对指标列的度量值如何进行聚合,例如:求和,求平均值,计数等操作,一个指标只应该选择一种聚合方式;

·修饰词:定义固定的条件约束,可以看作是对基础数据集范围的限制,比如最近12个月内某个特定的产品类型的生成量

在构建出基础指标之后,如果需要对指标进行扩展,有两种扩展形式生成关联指标:

·复合指标:是建立在基础指标之上,通过一定运算规则形成的计算指标,例如:生成计划完成率=实际生成数量/计划生成数量

·派生指标:在基础指标或者复合指标之上,修改数据范围或约束条件(修饰词),形成的新指标,例如生成计划完成率的派生指标,可以是本年度生成计划完成率,近一个月生成计划完成率等。

这里借鉴了面向对象编程语言中的继承和组合的概念,一个派生指标会继承其父指标的各项属性和计算规则,并通过调整其中的部分属性达到业务扩展的目标;而复合指标是在其它指标的基础上,通过引入计算公式,将不同的基础指标进行二次组合计算从而生成全新的业务指标数据。其相互关系如图2所示。

其中,为了动态生成关系图谱,系统会自动记录指标所依赖的数据模型,以及数据模型背后的数据源,在执行派生或者聚合操作生成新的指标时,也会记录指标间的相互关系,指标间的相互关系可以通过其父指标进行逐级追溯,最终找到一个或多个根节点(基础指标)。通过记录如下链路的信息,即可动态生成指标与其它指标,数据模型,数据源之间的有向无环图(DAG)具体流程如图3所示,而次级指标会自动继承父指标所属的数据源,数据模型以及数据维度,计算公式等内容,当父指标的相关内容被修改后,系统会通过上述关系图自动找到该指标所有的次级关联指标(派生指标或聚合指标),然后动态修改所有子指标的相关配置,从而实现次级指标计算规则的动态变更,避免需要人工手动逐条调整规则的问题;

最后通过计算公式用于将几个不同的基础指标进行组合,并基于一定的运算规则,形成一个全新的复合指标。计算公式可使用语言相关的表达式(EL)的方式进行计算,基础指标在这里相当于表达式中的动态参数。一个完整的复合指标的示例如图4所示。

通过以上的定义,一个基础指标的配置可以最终解析为一个可执行的SQL文本,通过执行SQL就能够最终会得到满足条件的一个指标结果的集合,然后将每条结果的基础指标带入到公式中进行计算,从而得到复合指标的值。例如图4中“本年度产线A的生产计划完成率”解析配置后可得到如下的SQL:

然后将结果集中的pAmount和aAmount带入到公式round(aAmount/pAmount*100)/100中,从而计算得出完成的比率。计算结果存储格式大致为:

由此,便可有效的引入派生与组合的方式对关联数据指标进行管理,实现基于现有指标快速生成和维护新的关联数据指标的目的。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术分类

06120114726671