掌桥专利:专业的专利平台
掌桥专利
首页

一种时长标签的确定方法、装置及电子设备

文献发布时间:2023-06-19 18:37:28


一种时长标签的确定方法、装置及电子设备

技术领域

本申请涉及互联网技术领域,尤其涉及一种时长标签的确定方法、装置及电子设备。

背景技术

现有技术中,各个领域对用户画像系统的需求越来越强烈,客户标签是用户画像的基础,对客户标签的需求逐步精细化,新增客户标签需求的相应时间越来越短,标签需求越来越多样化。

针对日期类标签(例如首次网点接触日期),现有方式只能根据系统内部预先设置好的系统标签提供的日期数值进行特征项的分析,导致针对某一固定系统标签,其对应的数据统计范围受到限制,导致数据统计效率低、灵活性差。

发明内容

有鉴于此,本申请的目的在于至少提供一种时长标签的确定方法、装置及电子设备,通过时长标签,扩展数据统计范围,提高数据统计的生成效率低以及灵活性。

本申请主要包括以下几个方面:

第一方面,本申请实施例提供一种时长标签的确定方法,方法包括:

响应于新增时长标签操作,显示针对时长标签的标签配置界面,标签配置界面包括系统时间标签配置项、结束时间配置项、至少一个区间特征项配置项;响应于针对系统标签配置项执行的配置操作,从多个系统时间标签中确定目标系统时间标签;响应于用户针对结束时间配置项执行的输入操作,确定结束时间;针对每个时间区间配置项,响应于针对该时间区间配置项执行的配置操作,确定时间区间,由时间区间、目标系统时间标签和结束时间,形成区间特征项;由配置完成的至少一个区间特征项形成时长标签,并将时长标签保存至预设标签库。

在一种可能的实施方式中,由时间区间、目标系统时间标签和结束时间,确定区间特征项的步骤包括:根据目标系统时间标签对应的关联立方体信息,确定区间特征项对应的业务规则表达式;由时间区间、目标系统时间标签和、结束时间和业务规则表达式,形成区间特征项。

在一种可能的实施方式中,通过以下方式确定每个区间特征项对应的业务规则表达式:获取目标系统时间标签对应的元数据信息,元数据信息用于描述系统时间标签;基于目标系统时间标签对应的元数据信息确定目标系统时间标签的关联立方体信息,关联立方体信息指示系统时间标签对应的多维度下形成的数据立方体涉及的数据信息;对元数据信息以及关联立方体信息进行处理,获取该区间特征项对应的业务规则表达式。

在一种可能的实施方式中,针对每个区间特征项,对元数据信息以及关联立方体信息进行处理,获取多个业务规则表达式的步骤,包括:确定该区间特征项对应的时间区间;采用构造模式,将元数据信息中的标签名称、该区间特征项对应的时间区间以及关联立方体信息构造成该区间特征项对应的业务规则表达式。

在一种可能的实施方式中,时间区间配置项包括区间名称配置项和阈值区间配置项,阈值区间配置项包括第一阈值时间配置项和第二阈值时间配置项,其中,通过以下方式确定每个区间特征项对应的区间名称和时间区间:响应于针对区间名称配置项执行的区间名称输入操作,确定该时间区间特征项对应的区间名称;响应于针对第一阈值时间配置项执行的输入操作,确定第一阈值时间;响应于针对第二阈值时间配置项执行的输入操作,确定第二阈值时间;由第一阈值时间与第二阈值时间,形成该区间特征项对应的时间区间。

在一种可能的实施方式中,标签配置界面还包括时间区间单位配置项,其中,在对每个时间区间配置项进行配置之前,方法还包括:响应于针对时间区间单位配置项执行的配置操作,确定阈值区间配置项中第一阈值时间配置项和第一阈值时间配置项对应的时间单位。

在一种可能的实施方式中,方法还包括:从预设标签库中调用目标时长标签、目标时长标签对应的系统时间标签以及目标时长标签中每个区间特征项对应的业务规则表达式;分别对每个区间特征项对应的业务规则表达式进行解析,获得每个业务规则表达式对应的SQL条件表达式;利用每个区间特征项对应的SQL条件表达式,对目标时长标签对应的系统时间标签下的关联立方体信息进行特征分析,确定数据分析结果。

在一种可能的实施方式中,通过以下方式确定数据统计结果:针对每个区间特征项,利用该区间特征项对应的SQL条件表达式对目标时长标签对应的系统时间标签下的关联立方体信息进行数据筛选,获取满足SQL条件表达式的目标统计数据;由各区间特征项对应的目标统计数据,构成数据统计结果。

第二方面,本申请实施例还提供一种时长标签的确定装置,装置包括:显示模块,用于响应于新增时长标签操作,显示针对时长标签的标签配置界面,标签配置界面包括系统时间标签配置项、结束时间配置项、至少一个区间特征项配置项;第一配置模块,用于响应于针对系统标签配置项执行的配置操作,从多个系统时间标签中确定目标系统时间标签;输入模块,用于用户针对结束时间配置项执行的输入操作,确定结束时间;第二配置模块,用于针对每个时间区间配置项,响应于针对该时间区间配置项执行的配置操作,确定时间区间,由时间区间、目标系统时间标签和结束时间,形成区间特征项;保存模块,用于由配置完成的至少一个区间特征项形成时长标签,并将时长标签保存至预设标签库。

第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中提到的时长标签的确定方法的步骤。

本申请实施例提供的一种时长标签的确定方法、装置及电子设备,方法包括:响应于新增时长标签操作,显示针对时长标签的标签配置界面;响应于针对系统标签配置项执行的配置操作,从多个系统时间标签中确定目标系统时间标签;响应于用户针对结束时间配置项执行的输入操作,确定结束时间;针对每个时间区间配置项,响应于针对该时间区间配置项执行的配置操作,确定时间区间,由时间区间、目标系统时间标签和结束时间,形成区间特征项;由配置完成的至少一个区间特征项形成时长标签,并将时长标签保存至预设标签库。本申请通过基于数据区间配置时长标签,同时关联数据立方体确定所要圈选范围数据,扩展数据统计范围,提高数据统计的生成效率低,实现数据的快速检索及定位,便于后续开展相关的客群分析。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种时长标签确定方法的流程图;

图2示出了本申请实施例提供的一种时长确定装置的结构示意图;

图3示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。

现有技术中,银行客户标签画像针对日期类标签只能根据系统内置标签提供的日期数值进行特征项的分析,无法实现灵活自定义扩展和自定义区间范围以便于生成系统内置标签对应的多个衍生标签。

同时新标签生成需要根据经过重新定义模型,物理化模型,数据转换装载的复杂流程,数据统计效率低,即无法实现系统侧数据到业务侧数据的快速交付。

基于此,本申请实施例提供了一种时长标签的确定方法、装置及电子设备,通过时长标签,扩展数据统计范围,提高数据统计的生成效率低以及灵活性,具体如下:

请参阅图1,图1示出了本申请实施例所提供的一种时长标签确定方法的流程图。如图1所示,本申请实施例提供的时长标签确定方法,包括以下步骤:

S100、响应于新增时长标签操作,显示针对时长标签的标签配置界面。

其中,标签配置界面包括系统时间标签配置项、结束时间配置项、至少一个区间特征项配置项。

在具体实施中,在系统提供的标签设计界面上,显示有时长标签设计模式标识,响应于针对时长标签设计模式标识执行的选择操作,显示针对时长标签的标签配置界面,其中,系统可指用户画像标签系统。

S110、响应于针对系统标签配置项执行的配置操作,从多个系统时间标签中确定目标系统时间标签。

系统内预先设置有用于进行数据统计的、与时间/日期相关的多个系统时间标签,例如首次网点接触日期、首次网上银行登录日期、首次营销活动相应日期等,其中,不同类型的系统时间标签被划分到不同的标签类目下,以首次网点接触日期为例,首次网点接触日期属于客户时间,进一步的,标签类目还可以划分为多个等级,例如一级标签类目、二级标签类目等,例如,首次网点接触日期对应的一级标签类目为客户时间、二级类目标签为首次日期、三级类目标签为首次接触日期,系统时间标签所属的类目是预先设置好的。

在这种情况下,在从多个系统时间标签中确定目标系统时间标签时,针对系统标签配置项,可以依次选择目标系统时间标签对应的多级标签类目,以从目标系统时间标签对应的多级标签类目下的多个系统时间标签中,确定目标系统时间标签。

S120、响应于用户针对结束时间配置项执行的输入操作,确定结束时间。

一示例中,用户可以根据自身实际需求,利用结束时间配置项确定结束时间,例如设置好的结束时间为2022年08月23日。

S130、针对每个时间区间配置项,响应于针对该时间区间配置项执行的配置操作,确定时间区间,由时间区间、目标系统时间标签和结束时间,形成区间特征项。

其中,标签配置界面上还包括区间特征项添加标识,根据实际业务需求,响应于针对特征项添加标识的选择操作,可添加时间区间配置项,时间区间配置项包括区间名称配置项和阈值区间配置项。

针对每个时间区间配置项,响应于针对区间名称配置项执行的区间名称输入操作,确定该时间区间特征项对应的区间名称,例如,区间名称可以根据时间区间的长短进行设置,具体命名不做限制。

通过阈值区间配置项,可以根据实际业务需求,设置时间区间。

在一优选实施例中,所述阈值区间配置项包括第一阈值时间配置项和第二阈值时间配置项。

其中,通过以下方式确定每个区间特征项对应的时间区间:

响应于针对第一阈值时间配置项执行的输入操作,确定第一阈值时间,响应于针对第二阈值时间配置项执行的输入操作,确定第二阈值时间,由第一阈值时间与第二阈值时间,形成该区间特征项对应的时间区间。

在另一优选实施例中,标签配置界面还包括时间区间单位配置项,在对每个时间区间配置项进行配置之前,还包括:

响应于针对时间区间单位配置项执行的配置操作,确定阈值区间配置项中第一阈值时间配置项和第二阈值时间配置项对应的时间单位。

在一具体实施例中,时间单位包括但不限于年、月、日,用户可以根据实际需求输入第一阈值时间和第二阈值时间,例如,若时间单位为天,输入第一阈值时间为10,第一阈值时间为20,则对应形成的时间区间为10天~20天,针对第一阈值时间和第二阈值时间的每次输入,检查输入的第一阈值时间和第二阈值时间是否符合整型数值型规范,若不符合整型数值型规范,则清楚输入结果并进行相关提示,若目标系统时间标签为首次网点接触日,结束时间设置为2022年8月23日,则所形成的时间区间所表示的业务规则为首次网点接触日距离结束时间的时长在10天~20天。

在本申请实施例中,由时间区间、目标系统时间标签和结束时间,确定区间特征项的步骤包括:

根据目标系统时间标签对应的关联立方体信息,确定区间特征项对应的业务规则表达式,由时间区间、目标系统时间标签和、结束时间和业务规则表达式,形成区间特征项。

具体的,每个配置好的区间特征项会形成时长标签对应的子时长标签,业务规则表达式可以指当前区间特征项对应的数据筛选条件表达式。

示例性的,业务规则表达式为首次网点接触日距离结束时间的时长在10天以内。

在一种可能的实施方式中,通过以下方式确定每个区间特征项对应的业务规则表达式:

获取目标系统时间标签对应的元数据信息。

在一具体实施例中,系统内部预先设置好的多个系统时间标签都存在对应的元数据信息,元数据信息用于描述系统时间标签,系统内部设置有多个系统时间标签与多个元数据信息之间的映射关系。

元数据信息包括但不限于:标签名称、标签分类、标签类型、标签状态、标签类目路径。

标签分类包括但不限于:属性类标签、统计类标签、算法类标签。

标签类型包括但不限于:编码类、字符类、数值类。

标签状态包括:新建、开发中、已生效、已失效、已停用。

标签类目路径可指系统时间标签所在的标签类目的路径,标签类目路径用于确定系统时间标签对应的数据立方体。

基于目标系统时间标签对应的元数据信息确定目标系统时间标签的关联立方体信息。

在一具体实施例中,关联立方体信息指示系统时间标签对应的数据信息在多维度下形成的数据立方体,关联立方体信息包括但不限于:数据库中存储的数据立方体的立方体名称、标签列字段的字段名称、阈值列字段的字段名称、客户标识字段的字段名称。

关联立方体信息明确了数据立方体的各个字段的字段名称,数据立方体的信息会以一条记录的形式存储在数据库中,数据立方体可以是CUBE多维分析数据立方体。

在一可选实施例中,可以获取目标系统标签对应的元数据信息中指示的标签类目路径,通过标签类目路径确定与目标系统标签对应的数据立方体。

以标签类目路径为“客户时间/首次日期/首次接触日期/首次网点接触日期”为例,客户时间为多个数据立方体所在的立方体类目,首次日期为该立方体类目下的数据立方体,所以首次网点接触日期这一系统时间标签对应的数据立方体,即为首次日期数据立方体,将首次日期数据立方体的立方体信息作为关联立方体信息。

对元数据信息以及关联立方体信息进行处理,获取该区间特征项对应的业务规则表达式。

在一优选实施例中,针对每个区间特征项,对元数据信息以及关联立方体信息进行处理,获取多个业务规则表达式的步骤,包括:

确定该区间特征项对应的时间区间,采用构造模式,将元数据信息中的标签名称、该区间特征项对应的时间区间以及关联立方体信息构造成该区间特征项对应的业务规则表达式。

具体的,假设有3个区间特征项,这3个区间特征项的区间名称分别为第一时间区间、第二时间区间和第三时间区间,这3个区间特征项对应的时间区间分别为10天以内,10天~20天,20天以上,则可得到如下三个业务规则表达式:第一时间区间:首次网点接触日距离结束时间10天以内;第二时间区间:首次网点接触日距离结束时间10天~20天;第三时间区间:首次网点接触日距离结束时间20天以上。

S140、由配置完成的至少一个区间特征项形成时长标签,并将时长标签保存至预设标签库。

在一具体实施例中,标签配置界面还包括时长标签名称配置项、时长标签所属标签类目配置项以及统计数据所属日期配置项,响应于针对时长标签名称配置项执行的输入操作,确定时长标签名称,例如“首次网点接触日期区间划分”,响应于针对时长标签所属标签类目配置项执行的配置操作,将时长标签划分至系统预先设置的多个标签类目中的目标标签类目下,响应于针对统计数据所属日期配置项执行的配置操作,确定时长标签对应的待统计数据的数据日期(在关联立方体信息中存储有多个数据日期内的客户数据)。

在配置完至少一个区间特征项、时长标签名称、时长标签所属标签类目、目标系统时间标签以及结束时间,可完成对时长标签的保存。

S150、从预设标签库中调用目标时长标签、目标时长标签对应的系统时间标签以及目标时长标签中每个区间特征项对应的业务规则表达式。

在一具体实施例中,可以在时长标签所属的标签类目下,找到保存在预设标签库中的时长标签,也可以通过时长标签名称直接从预设标签库中进行调用。

S160、分别对每个区间特征项对应的业务规则表达式进行解析,获得每个业务规则表达式对应的SQL条件表达式。

在一具体实施例中,可以由系统预先配置好的解析模板,将业务规则表达式解析成对应的SQL条件表达式。

在一具体实施例中,可以调用kylin api执行业务规则表达式,具体的,通过calcite引擎将业务规则表达式进一步解析成SQLnode、验证、转换成RelNode得到SQL条件表达式。

S170、利用每个区间特征项对应的SQL条件表达式,对目标时长标签对应的系统时间标签下的关联立方体信息进行特征分析,确定数据分析结果。

在一优选实施例中,通过以下方式确定数据统计结果:

针对每个区间特征项,利用该区间特征项对应的SQL条件表达式对目标时长标签对应的系统时间标签下的关联立方体信息进行数据筛选,获取满足SQL条件表达式的目标统计数据,由各区间特征项对应的目标统计数据,构成数据统计结果。

在一具体实施例中,可以由各区间特征项对应的目标统计数据形成时长标签下的可视化分布图,以了解系统时间标签下数据的分布情况,可以根据可视化分布图向客户推送相关服务。

通过本申请的时长标签,实现了对系统时间标签的灵活自定义扩展,进一步可以剖析出系统时间标签下的数据分布情况,铺垫了标签画像多样化呈现、客群画像多角度刻画和分析场景,减少了系统侧进行数据分布统计的时间,缩短了项业务侧交付数据的周期。

基于同一申请构思,本申请实施例中还提供了与上述实施例提供的时长标签方法对应的时长确定装置,由于本申请实施例中的装置解决问题的原理与本申请上述实施例的时长标签的确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

请参阅图2,图2示出了本申请实施例提供的一种时长确定装置的结构示意图。

装置包括:

显示模块210,用于响应于新增时长标签操作,显示针对时长标签的标签配置界面,标签配置界面包括系统时间标签配置项、结束时间配置项、至少一个区间特征项配置项;

第一配置模块220,用于响应于针对系统标签配置项执行的配置操作,从多个系统时间标签中确定目标系统时间标签;

输入模块230,用于用户针对结束时间配置项执行的输入操作,确定结束时间;

第二配置模块240,用于针对每个时间区间配置项,响应于针对该时间区间配置项执行的配置操作,确定时间区间,由时间区间、目标系统时间标签和结束时间,形成区间特征项;

保存模块250,用于由配置完成的至少一个区间特征项形成时长标签,并将时长标签保存至预设标签库。

基于同一申请构思,请参阅图3,图3示出了本申请实施例提供的一种电子设备的结构示意图,电子设备300包括:处理器310、存储器320和总线330,所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过所述总线330进行通信,所述机器可读指令被所述处理器310运行时执行如上述实施例中任一所述的时长标签的确定方法的步骤。

基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例提供的时长标签的确定方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

技术分类

06120115635813