掌桥专利:专业的专利平台
掌桥专利
首页

一种用户分类方法、装置、设备及介质

文献发布时间:2024-04-18 19:58:21


一种用户分类方法、装置、设备及介质

技术领域

本申请涉及大数据领域或金融领域,特别涉及一种用户分类方法、装置、设备及介质。

背景技术

对于银行来说,合理地对用户群体进行划分,具有显著的商业价值和战略意义。在对用户群体进行划分后,银行可以针对不同的用户群体,提供定制化的银行产品和服务,从而提高资源的利用率,以及用户的满意度。

目前,对用户群体进行分类的方法通常是,相关技术人员通过银行系统中保存的用户信息进行人工筛选分类。然而,人工分类方法费时费力、效率低下,不仅降低了相关技术人员的工作效率,也降低了用户分类的准确程度。

发明内容

有鉴于此,本申请实施例提供了一种用户分类方法、装置、设备及介质,能够提高用户分类的准确率以及相关技术人员的工作效率。

本申请实施例公开了如下技术方案:

第一方面,本申请提供了一种用户分类方法,所述方法包括:

创建指标模板,所述指标模板用于表征用户类别;

将用户信息填写入所述指标模板,以获取第一用户模板,所述第一用户模板是未知用户类别的模板;

将所述第一用户模和第二用户模板输入至自然语言处理工具中,以对所述第一用户模板执行用户分类,所述第二用户模板是已知用户类别的模板。

可选的,所述用户信息的获取方法具体如下:

获取原始信息,所述原始信息包括用户姓名、用户年龄、用户性别、用户工作、用户信用等级、用户违约记录和用户购买商品中的一种或多种;

对所述原始信息进行脱敏处理,以获取用户信息。

可选的,所述对所述原始信息进行脱敏处理,以获取用户信息,包括:

对所述原始信息进行加盐处理,以获取用户信息。

可选的,所述将用户信息填写入所述指标模板,包括:

采集用户信息图像,所述用户信息图像中包含用户信息;

对所述用户信息图像进行光学字符文字识别,得到用户信息;

将所述用户信息填写入所述指标模板。

可选的,所述采集用户信息图像,包括:

获取原始图像;

对所述原始图像进行归一化处理,以获取用户信息图像,所述归一化处理包括对所述原始图像进行角度矫正归一化、比例缩放归一化、比例填充归一化、分辨率归一化和剪裁归一化中的一种或多种。

第二方面,本申请提供了一种用户分类装置,所述装置包括:创建模块、获取模块和执行模块;

所述创建模块,用于创建指标模板,所述指标模板用于表征用户类别;

所述获取模块,用于将用户信息填写入所述指标模板,以获取第一用户模板,所述第一用户模板是未知用户类别的模板;

所述执行模块,用于将所述第一用户模和第二用户模板输入至自然语言处理工具中,以对所述第一用户模板执行用户分类,所述第二用户模板是已知用户类别的模板。

可选的,所述获取模块具体包括:第一获取模块、第二获取模块和第三获取模块;

所述第一获取模块,用于采集用户信息图像,所述用户信息图像中包含用户信息;

所述第二获取模块,用于对所述用户信息图像进行光学字符文字识别,得到用户信息;

所述第三获取模块,用于将所述用户信息填写入所述指标模板。

可选的,所述第一获取模块具体包括:第一获取子模块和第二获取子模块;

所述第一获取子模块,用于获取原始图像;

所述第二获取子模块,用于对所述原始图像进行归一化处理,以获取用户信息图像,所述归一化处理包括对所述原始图像进行角度矫正归一化、比例缩放归一化、比例填充归一化、分辨率归一化和剪裁归一化中的一种或多种。

第三方面,本申请提供了一种用户分类设备,包括:存储器和处理器;

所述存储器,用于存储程序;

所述处理器,用于执行所述计算机程序时实现上述用户分类方法的步骤。

第四方面,本申请提供了一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述用户分类方法的步骤。

相较于现有技术,本申请具有以下有益效果:

本申请公开了一种用户分类方法、装置、设备及介质,该方法包括:创建指标模板,该指标模板用于表征用户类别;将用户信息填写入指标模板,以获取第一用户模板,该第一用户模板是未知用户类别的模板;将第一用户模和第二用户模板输入至自然语言处理工具中,以执行用户分类,该第二用户模板是已知用户类别的模板。由此,根据自然语言处理工具执行用户分类,可以提高用户分类的效率和准确率,进而根据不同分类的用户制定个性化的营销策略、推荐合适的金融产品和优质服务,从而提升客户满意度、增加客户留存率,并最终实现银行利润最大化。

附图说明

为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种用户分类方法的流程图;

图2为本申请实施例提供的一种用户分类装置的示意图;

图3为本申请实施例提供的一种计算机可读介质的示意图;

图4为本申请实施例提供的一种服务器的硬件结构示意图。

具体实施方式

目前,对目标用户进行识别的方法通常是,相关技术人员通过银行系统中保存的用户信息进行人工筛选。然而,人工方法费时费力、效率低下,不仅降低了相关技术人员的工作效率,也降低了用户分类的准确程度。

有鉴于此,本申请提供了一种用户分类方法、装置、设备及介质,该方法包括:创建指标模板,该指标模板用于表征用户类别;将用户信息填写入指标模板,以获取第一用户模板,该第一用户模板是未知用户类别的模板;将第一用户模和第二用户模板输入至自然语言处理工具中,以执行用户分类,该第二用户模板是已知用户类别的模板。由此,根据自然语言处理工具执行用户分类,可以提高用户分类的效率和准确率,进而根据不同分类的用户制定个性化的营销策略、推荐合适的金融产品和优质服务,从而提升客户满意度、增加客户留存率,并最终实现银行利润最大化。

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

参见图1,该图为本申请实施例提供的一种用户分类方法的流程图。该方法包括:

S101:创建指标模板。

首先,创建一个简洁明了的指标模板,该指标模板中包含了用户的资产、负债记录、交易记录和信用报告的信息指标,例如用户姓名、用户年龄、用户性别、用户工作、用户信用等级、用户违约记录和用户购买商品等。

在一些示例中,该指标模板可以以问答形式体现,例如:

Question:用户**,年龄**,性别**,工作**,存款**,信用等级**,有无违约记录**,购买了**款理财产品,请问该用户是第一类别用户还是第二类别用户?

Answer:该用户是第**类别用户。

在另一些示例中,该指标模板也可以以表格形式体现,例如如下表1所示:

表1

需要说明的是,对于具体的指标模板和用户类别个数,本申请不做限定。

S102:将用户信息填写入所述指标模板,以获取第一用户模板。

第一用户模板是随机将目标用户的目标信息填充入指标模板中后,所获取到的具有结构化和可读性的模板。需要说明的是,由于第一用户模板仅为将用户信息填写入后的模板,因此第一用户模板未知用户的分类结果。

在一些示例中,上述第一用户模板可以为prompt提示词模板,prompt是指一段给定的文本或语句,用于启动和引导机器学习模型生成特定类型、主题或格式的输出。其具体可以表示为:

Question:用户-A,年龄-40,性别-女,工作-老师,存款-100万,信用等级-高,有无违约记录-无,购买了-3-款理财产品,请问该用户是第一类别用户还是第二类别用户?

Answer:该用户是**类别用户。

在另一些示例中,上述第一用户模板也可以表示为如下表2:

表2

需要说明的是,上述用户信息可以是用户直接手动输入的,也可以是根据包含了用户信息的图像提取到的。具体的,可以对用户信息图像进行光学字符文字识别,得到用户信息;随后,再将用户信息填写入指标模板,从而得到第一用户模板。

可以理解的是,可以先对采集到的包含了用户信息的图像(即原始图像)进行预处理,例如归一化处理,随后再执行光学字符文字识别,得到用户信息。

具体的,归一化处理是将原始图像按照一定标准加工处理,从而方便后续得到用户信息的处理方法。示例性的,归一化处理可以指的是对原始图像进行角度矫正(即旋转)的归一化处理、对原始图像进行比例缩放与填充的归一化处理、对原始图像进行分辨率统一的归一化处理、对原始图像进行统一剪裁的归一化处理等中的一种或多种。需要说明的是,对于具体的归一化处理操作,本申请不做限定。

可以理解的是,除了归一化处理之外,还可以执行其他预处理方法,例如噪声处理、灰度化处理等。示例性的,灰度化处理指的是由彩色图像转化为灰度图像的操作,转化为灰度图像后可以在视觉上增加对比,突出原始图像的用户信息的区域。噪声处理可以是基于均值滤波算法、中值滤波算法、高斯滤波算法等方法,进行噪声处理。需要说明的是,对于具体的预处理方法,本申请不做限定。

在一些具体的实现方式中,由于需要对用户信息进行保密,因此,上述用户信息的获取方法可以具体如下:

第一步,获取原始信息,上述原始信息包括用户姓名、用户年龄、用户性别、用户工作、用户信用等级、用户违约记录和用户购买商品中的一种或多种;第二步,对原始信息进行脱敏处理,以获取用户信息。示例性的,上述脱敏处理可以是加盐处理方法,加盐处理方法是指通过在用户信息的任意固定位置插入特定的字符串,让散列后的结果和使用原始用户信息的散列结果不相符的方法。

S103:将第一用户模板和第二用户模板输入至自然语言处理工具中,以对第一用户模板执行用户分类。

第二用户模板是已知用户类别的模板。

在一些示例中,上述第二用户模板可以表示为:

Question:用户-A,年龄-35,性别-女,工作-律师,存款-150万,信用等级-高,有无违约记录-无,购买了-6-款理财产品,请问该用户是第一类别用户还是第二类别用户?

Answer:该用户是第一类别用户。

在另一些示例中,上述第一用户模板也可以表示为如下表3:

表3

在获取到第一用户模板和第二用户模板后,即可将二者输入至然语言处理工具中,以对第一用户模板执行用户分类。

可以理解的是,对于具体的用户类别,既可以以第一类别用户、第二类别用户进行区分,还可以以其他归类方式进行区分,对此本申请不做限定。

综上所述,本申请公开了一种用户分类方法,该方法包括:创建指标模板,该指标模板用于表征用户类别;将用户信息填写入指标模板,以获取第一用户模板,该第一用户模板是未知用户类别的模板;将第一用户模和第二用户模板输入至自然语言处理工具中,以执行用户分类,该第二用户模板是已知用户类别的模板。由此,根据自然语言处理工具执行用户分类,可以提高用户分类的效率和准确率,进而根据不同分类的用户制定个性化的营销策略、推荐合适的金融产品和优质服务,从而提升客户满意度、增加客户留存率,并最终实现银行利润最大化。

参见图2,该图为本申请实施例提供的一种用户分类装置,该用户分类装置200包括:创建模块201、获取模块202和执行模块203;

具体的,创建模块201,用于创建指标模板,指标模板用于表征用户类别;获取模块202,用于将用户信息填写入指标模板,以获取第一用户模板,第一用户模板是未知用户类别的模板;执行模块203,用于将第一用户模板和第二用户模板输入至自然语言处理工具中,以对第一用户模板执行用户分类,第二用户模板是已知用户类别的模板。

在一些具体的实现方式中,获取模块201具体包括:第一获取模块、第二获取模块和第三获取模块;

其中,第一获取模块,用于采集用户信息图像,用户信息图像中包含用户信息;第二获取模块,用于对用户信息图像进行光学字符文字识别,得到用户信息;第三获取模块,用于将用户信息填写入指标模板。

在一些具体的实现方式中,第一获取模块具体包括:第一获取子模块和第二获取子模块;

其中,第一获取子模块,用于获取原始图像;第二获取子模块,用于对原始图像进行归一化处理,以获取用户信息图像,归一化处理包括对原始图像进行角度矫正归一化、比例缩放归一化、比例填充归一化、分辨率归一化和剪裁归一化中的一种或多种。

在一些具体的实现方式中,上述用户信息的获取装置具体如下:

第一用户模块,用于获取原始信息,原始信息包括用户姓名、用户年龄、用户性别、用户工作、用户信用等级、用户违约记录和用户购买商品中的一种或多种;第二用户模块,用于对原始信息进行脱敏处理,以获取用户信息。

在一些具体的实现方式中,上述第二用户模块具体用于:对原始信息进行加盐处理,以获取用户信息。

综上,本申请公开了一种用户分类装置,包括创建模块、获取模块和执行模块。由此,根据自然语言处理工具执行用户分类,可以提高用户分类的效率和准确率,进而根据不同分类的用户制定个性化的营销策略、推荐合适的金融产品和优质服务,从而提升客户满意度、增加客户留存率,并最终实现银行利润最大化。

本发明提供的一种用户分类方法、装置、设备及介质可用于大数据领域或金融领域。上述仅为示例,并不对本发明提供的一种用户分类方法、装置、设备及介质的应用领域进行限定。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。

参见图3,该图为本申请实施例提供的一种计算机可读介质的示意图。该计算机可读介质300上存储有计算机程序311,该计算机程序311被处理器执行时实现上述图1的用户分类方法的步骤。

需要说明的是,本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

需要说明的是,本申请上述的机器可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

参见图4,该图为本申请实施例提供的一种服务器的硬件结构示意图,该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序440或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。

服务器400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。

上述实施例中由用户分类方法所执行的步骤可以基于该图4所示的服务器结构。

还需要说明的,根据本申请的实施例,上述图1中的流程示意图描述的用户分类方法的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行上述图1的流程示意图中所示的方法的程序代码。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

相关技术
  • 基于机器学习的用户风险分类方法、装置、介质及设备
  • 用户信息分类方法、装置、计算机设备和存储介质
  • 一种用户信息共享方法、装置、电子设备及存储介质
  • 一种用户留存分析方法、装置、电子设备及存储介质
  • 一种用户距离估算方法、装置、设备及存储介质
  • 用户分类方法、用户分类装置、存储介质与电子设备
  • 一种分布式K-means电力用户分类方法、存储介质及分类设备
技术分类

06120116483399