掌桥专利:专业的专利平台
掌桥专利
首页

一种页面操作障碍识别方法及装置

文献发布时间:2023-06-19 18:30:43


一种页面操作障碍识别方法及装置

技术领域

本发明涉及互联网技术领域,具体涉及一种页面操作障碍识别方法及装置。

背景技术

随着互联网技术的发展,越来越多的行业比如商务,比如金融理财等有了线上产品包括APP或者h5网页,以往线下服务时一般有专人在旁,客户有问题可以及时寻求帮助指导,但是如今线上产品很多需要用户自助操作,在此过程中若客户操作不顺利或遇到障碍大多只能放弃交易。比如说传统的银行网点在办理银行业务时有客户经理在一旁专人指导,遇到什么问题可以及时解答。但客户在使用通过互联网提供的金融产品时,客户往往是自助操作,遇到操作障碍时解决的途径很少。比如一些用户在使用银行的APP或h5网页提供的金融产品时,可能会出现使用行为的中断,比如客户申请贷款时填写信息不完整无法跳转到下一个界面导致行为中断,客户购买理财时页面卡了交易失败导致行为中断。操作行为中断有多种原因,可能是系统错误bug、客户遇到操作障碍、客户没有交易意愿等等其他原因。操作行为的中断可能意味着客户流失。

基于这个问题行业现行的做法是当客户出现操作行为中断了比如贷款申请行为中断时,有两种解决方案,一是被动等待客户主动咨询,二是让客服人员对客户进行外呼触达,客服人员通过询问客户结合客户在系统的操作记录,人工来判断客户是否遇到障碍,并对客户遇到的问题进行解答疑难。而现有技术的实现方式不足包括:现有方法中,主动咨询的客户毕竟时少数,因此被动等待的效率不高;而主动触达的方式,为了挽回部分真正遇到操作障碍的客户,而去打扰所有的客户,则不仅会浪费巨大的成本、而且会引起客户反感,损害客户体验。

发明内容

为了解决上述现有技术中存在的问题,本发明拟提供了一种页面操作障碍识别方法及装置,拟解决现有应用程序及相关网页在用户遇到操作障碍时无法及时精准响应给予帮助的问题。

一种页面操作障碍识别方法,包括如下步骤:

步骤1:收集一定数量的用户使用产品过程的相关数据并处理数据,其中一定数量可自定义;

步骤2:构建识别模型用于根据步骤1处理过的数据输出客户遇到操作障碍的概率,所述识别模型包括第一神经网络、第二神经网络、GBDT模型三个子模型;

步骤3:分布优化步骤2所得识别模型中的三个子模型使识别模型输出的概率更加准确;

优化第一神经网络:利用步骤1所处理过的数据有监督的训练第一神经网络得到最优第一神经网络;

优化第二神经网络:利用步骤1所处理过的数据有监督的训练第二神经网络得到最优第二神经网络;

优化GBDT模型:使用优化好的第一神经网络和第二神经网络所提取的特征结合用户的基本信息来训练GBDT模型得到最优GBDT模型;

步骤4:基于步骤3所得识别模型输出的用户有操作障碍的概率,结合用户有操作障碍概率的阈值判定用户使用产品过程中是否遇到障碍。

优选的,在所述步骤1中,所述用户使用产品过程的相关数据包括用户的页面操作历史数据、用户使用产品的页面链接的图网络结构数据,客服人员外呼触达用户反馈的结果,用户自身的基本信息数据;

所述用户的页面操作历史数据包括用户浏览页面的链路关系(比如从A页面跳转到C页面的再跳转到B页面)、在页面停留的时间、各个功能按钮点击的频次、使用时长、设备类型数据等;

所述用户使用产品的页面图网络结构数据,包括页面与页面的链接关系,链接的功能标签数据等;

所述收集客服人员外呼触达客户反馈的结果,通过分析反馈结果数据,将历史客户分为有操作障碍和无操作障碍两类,用于定义训练机器学习模型的标签。

优选的,在所述步骤1中,所述处理数据过程包括编码、分箱、截断、标准化和归一化。

优选的,所述步骤2包括以下步骤,其中步骤2.1和步骤2.2顺序可交换:

步骤2.1:构建第一神经网络用于提取用户页面操作行为的特征,所述第一神经网络包括输入层、特征嵌入层、输出层,其中特征嵌入层,包括转换器网络层,输入层和输出层均为全连接网络;

步骤2.2:构建第二神经网络用于提取客户使用产品的页面图网络结构特征,所述第二神经网络包括一个图编码层和输出层,其中图编码层包括一个GCN网络层,输出层为全连接网络;

步骤2.3:基于步骤2.1所述的第一神经网络提取的特征和步骤2.2所述的第二神经网络提取的特征、用户自身的信息构建一个GBDT模型用于输出用户有操作障碍的概率。

优选的,所述步骤3中优化第一神经网络包括如下步骤:

步骤3.1.1:初始化第一神经网络的参数,使其满足[-1,1]之间的均匀分布;

步骤3.1.2:使用初始化后的第一神经网络的输出output

Loss

式中Loss

步骤3.1.3:利用梯度下降的方法,优化模型的参数,得到更小的损失函数即:MinLoss

步骤3.1.4:重复步骤3.1.3,迭代多轮,直到Loss

优选的,所述步骤3中优化第二神经网络包括以下步骤:

步骤3.2.1:初始化第二神经网络的参数,使其满足标准正态分布;

步骤3.2.2:使用初始化第二神经网络的输出和用户是否遇到障碍标签计算交叉熵损失:

Loss

式中Loss

步骤3.2.3:利用梯度下降的方法,优化模型的参数,得到更小的损失函数即:MinLoss

步骤3.2.4:重复步骤3.2.3,迭代多轮,直到Loss

优选的,所述步骤3优化GBDT模型包括以下步骤:

步骤3.3.1:基于最优第一神经网络提取的特征、第二神经网络提取的特征和用户基本信息生成第一棵CART决策树D

步骤3.3.2:使用CART决策树的输出值ouput

Loss

式中Loss

步骤3.3.3:计算损失函数的梯度:

式中grad

步骤3.3.4:基于最优第一神经网络提取的特征、最优第二神经网络提取的特征和用户基本信息生成第二棵CART决策树D

步骤3.3.5:将新生成的CART决策树D

步骤3.3.6:计算新模型的损失函数梯度grad

式中grad

步骤3.3.7:重复执行步骤3.3.4到3.3.6,直到决策树的棵数达到预先设定的数量M即得到最优GBDT模型,即得到最优识别模型,其中M可自定义。

优选的,在所述步骤4中基于步骤3所得识别模型,输入基于步骤1处理过的相关用户操作产品数据和用户信息则可输出用户有操作障碍的概率,通过分析历史数据确定一个阈值概率,当客户操作障碍概率大于阈值概率时即认为客户遇到了操作障碍。

一种页面操作障碍识别装置,优选的,包括数据处理模块,识别模块,客服系统模块;其中数据处理模块从客服系统模块处获取用户使用产品过程的相关数据再将数据进行预处理传递给识别模块,识别模块根据数据提取特征然后计算得出用户遇到操作障碍的概率,并依据设定的阈值判定用户是否遇到障碍,最后将判定结果传输到客服系统模块以通知相关客服对用户及时给予帮助。

优选的,所述识别模块包括第一神经网络模块,第二神经网络模块,GBDT模块;其中第一神经网络模块用以提取用户页面操作行为的特征,第二神经网络模块用于提取客户使用产品的页面图网络结构特征,GBDT模块则结合两个神经网络模块提取的特征和用户基本信息输出客户有操作障碍的概率,通过分析历史数据确定一个阈值概率,当客户操作障碍概率大于阈值概率时即认为客户遇到了操作障碍。

本发明的有益效果包括:

利用客户的操作行为数据、页面链接图关系数据来构建机器学习模型,通过客服人员收集并反馈的历史操作障碍标签进行训练,所采用的双神经网络的模型结构能够有效提取和匹配客户的操作行为和页面本身的链接关系结构特征,从而对客户是否遇到操作障碍进行及时精准识别。

本发明是一种从全新的视角和数据维度来构建的操作障碍识别,不仅实现了自动识别,而且提升了识别准确性。

附图说明

图1为实施例1操作障碍标签获取示意图。

图2为实施例1一种页面操作障碍识别方法实施示意图。

图3为实施例2一种页面操作障碍识别装置结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

实施例1

下面结合附图2对本发明的具体实施例做详细的说明;

一种页面操作障碍识别方法,包括如下步骤:

步骤1:收集一定数量的用户使用产品过程的相关数据并处理数据,其中一定数量可自定义;

所述用户使用产品过程的相关数据包括用户的页面操作历史数据、用户使用产品的页面链接的图网络结构数据,客服人员外呼触达用户反馈的结果,用户自身的基本信息数据;

所述用户的页面操作历史数据包括用户浏览页面的链路关系(比如从A页面跳转到C页面的再跳转到B页面)、在页面停留的时间、各个功能按钮点击的频次、使用时长、设备类型数据等;

所述用户使用产品的页面图网络结构数据,包括页面与页面的链接关系,链接的功能标签数据等;

所述收集客服人员外呼触达客户反馈的结果,通过分析反馈结果数据,将历史客户分为有操作障碍和无操作障碍两类,用于定义训练机器学习模型的标签。

所述处理数据过程包括编码、分箱、截断、标准化和归一化。

步骤2:构建识别模型用于根据步骤1处理过的数据输出客户遇到操作障碍的概率,所述识别模型包括第一神经网络、第二神经网络、GBDT模型三个子模型;其中步骤2.1和步骤2.2顺序可交换:

步骤2.1:构建第一神经网络用于提取用户页面操作行为的特征,所述第一神经网络包括输入层、特征嵌入层、输出层,其中特征嵌入层,包括转换器网络层,输入层和输出层均为全连接网络;

步骤2.2:构建第二神经网络用于提取客户使用产品的页面图网络结构特征,所述第二神经网络包括一个图编码层和输出层,其中图编码层包括一个GCN网络层,输出层为全连接网络;

步骤2.3:基于步骤2.1所述的第一神经网络提取的特征和步骤2.2所述的第二神经网络提取的特征、用户自身的信息构建一个GBDT模型用于输出用户有操作障碍的概率。

步骤3:分布优化步骤2所得识别模型中的三个子模型使识别模型输出的概率更加准确;

优化第一神经网络:利用步骤1所处理过的数据有监督的训练第一神经网络得到最优第一神经网络;

步骤3.1.1:初始化第一神经网络的参数,使其满足[-1,1]之间的均匀分布;

步骤3.1.2:使用初始化后的第一神经网络的输出output

Loss

式中Loss

步骤3.1.3:利用梯度下降的方法,优化模型的参数,得到更小的损失函数即:MinLoss

步骤3.1.4:重复步骤3.1.3,迭代多轮,直到Loss

优化第二神经网络:利用步骤1所处理过的数据有监督的训练第二神经网络得到最优第二神经网络;

步骤3.2.1:初始化第二神经网络的参数,使其满足标准正态分布;

步骤3.2.2:使用初始化第二神经网络的输出和用户是否遇到障碍标签计算交叉熵损失:

Loss

式中Loss

步骤3.2.3:利用梯度下降的方法,优化模型的参数,得到更小的损失函数即:MinLoss

步骤3.2.4:重复步骤3.2.3,迭代多轮,直到Loss

优化GBDT模型:使用优化好的第一神经网络和第二神经网络所提取的特征结合用户的基本信息来训练GBDT模型得到最优GBDT模型;

步骤3.3.1:基于最优第一神经网络提取的特征、第二神经网络提取的特征和用户基本信息生成第一棵CART决策树D

步骤3.3.2:使用CART决策树的输出值output

Loss

式中Loss

式中grad

步骤3.3.4:基于最优第一神经网络提取的特征、最优第二神经网络提取的特征和用户基本信息生成第二棵CART决策树D

步骤3.3.5:将新生成的CART决策树D

步骤3.3.6:计算新模型的损失函数梯度grad

式中grad

步骤3.3.7:重复执行步骤3.3.4到3.3.6,直到决策树的棵数达到预先设定的数量M即得到最优GBDT模型,即得到最优识别模型,其中M可自定义。

步骤4:基于步骤3所得识别模型输出的用户有操作障碍的概率,结合用户有操作障碍概率的阈值判定用户使用产品过程中是否遇到障碍;

基于步骤3所得识别模型,输入基于步骤1处理过的相关用户操作产品数据和用户信息则可输出用户有操作障碍的概率,通过分析历史数据确定一个阈值概率,当客户操作障碍概率大于阈值概率时即认为客户遇到了操作障碍。

对应上述步骤1:

从客服系统收集模型训练和推理需要的数据,数据主要分为四部分:第一部分,用户的页面操作历史数据包括用户浏览页面的链路关系(比如从A页面跳转到C页面的再跳转到B页面)、在页面停留的时间、各个功能按钮点击的频次、使用时长、设备类型数据等作为第一神经网络提取特征的数据来源;第二部分,用户使用产品的页面图网络结构数据,包括产品页面图网络结构数据包括页面与页面的链接关系,链接的功能标签数据等作为第二神经网络提取特征的数据来源;第三部分,客服人员外呼触达结果反馈用于获取用户操作障碍标签,具体获取示意图如附图1;第四部分,用户自身的基本信息数据作为GBDT模型的输入;以上所收集四部分数据的类型包括非结构化数据(文本、语言等)、结构化数据(表格数据),因此需要对数据进行编码、分箱、截断、标准化、归一化等预处理,其中结构化数据比如性别、年龄、收入这种主要是进行缺失值填充(比如,性别缺失用众数填充)、取值截断(比如年收入大于100W取100W,小于5W取5W)、分箱(如年龄分段0-20,20-30,30-50,50-100等);非结构化比如文本、图片、语音等预处理主要是编码、标准化、归一化等,比如学历本科以上编码为3,本科以下编码为2,无学历编码为1,图片的RGB数值编码为多为数组,语言文本编码为词向量等。

对应上述步骤2:

构建识别模型;首先构建第一神经网络,第一神经网络由输入层、特征嵌入层、输出层构成,其中输入层由多个全连接网络层构成,主要功能在于将输入的页面操作历史数据的特征映射为特定的特征维度,以便输入特征嵌入层,特征嵌入层主要由转换器(Transformer)网络层构成,其主要功能是将输入层的结果进行处理和计算,提取其中的序列特征,输出层由多个全连接层构成,主要功能在于将特征嵌入层输入的特征映射为最终输出;然后构建第二神经网络,第二神经网络主要由一个图编码层和输出层构成,图编码层主要由一个GCN(Graph Convolution Neural Network)网络层构成,其主要功能是对页面链接之间的图网络关系进行编码,提取页面链接关系的中的有效特征,输出层结构由多个全连接层构成,主要功能在于将图编码层输入的特征映射为最终输出;最后将第一神经网络特征嵌入层和第二神经网络的图编码层的特征输出,结合用户基本信息作为GBDT模型的输入,由GBDT模型输出一个障碍概率再结合专家经验给定的概率阈值,得到客户是否遇到操作障碍的结果。

对应上述步骤3:

优化识别模型;由于识别模型采用了多个子模型结构,因此采用分步优化的方式;

首先优化第一神经网络,以下称model_nn

a)随机初始化model_nn

b)使用初始化的模型输出output

Loss

式中Loss

c)使用梯度下降方法,优化模型的参数,优化的目标是最小化损失函数即:

Min Loss

d)重复步c的工作,迭代多轮,直至Loss

然后优化第二神经网络,以下称model_nn

d)随机初始化model_nn2的参数,使其满足标准正态分布;

e)使用初始化的模型输出output

Loss

式中Loss

f)使用梯度下降方法,优化模型的参数,优化的目标是:

Min Loss

g)重复步g的工作,迭代多轮,直至Loss

最后优化GBDT模型,以下称model_gbdt;

g)使用model_nn

h)使用CART决策树的输出值ouput

Loss

式中Loss

计算损失函数的梯度:

式中grad

i)使用model_nn

j)将新生成的的CART决策树D

k)计算新模型的损失函数梯度;

式中grad

对应上述步骤4:

将触发关键交易操作行为中断的用户在使用产品过程的相关数据进行收集处理,将处理完成的数据传输到步骤3训练好的识别模型中得出用户有操作障碍的概率,通过分析历史数据确定一个阈值概率,当用户操作障碍概率大于阈值概率时即认为用户遇到了操作障碍,最后将用户是否遇到操作障碍的判定结果传输到客服系统。

本发明利用客户的操作行为数据、页面链接图关系数据来构建机器学习模型,通过客服人员收集并反馈的历史操作障碍标签进行训练,所采用的双神经网络的模型结构能够有效提取和匹配客户的操作行为和页面本身的链接关系结构特征,从而对客户是否遇到操作障碍进行及时精准识别,解决了现有应用程序及相关网页在用户遇到操作障碍时无法及时精准响应给予帮助的问题。

实施例2

参照附图3,附图3所示一种页面操作障碍识别装置的结构示意图,该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述附图2方法实施例对应,能够执行附图2方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。如附图3所示该装置包括数据处理模块、识别模块和客服系统模块,在具体实施过程中比如有一个客户使用某银行网上应用申请贷款,他在完成基本信息填写操作后,下一步的人脸识别一直未通过,再反复尝试了几次之后,最终放弃,此时贷款申请中断则会触发关键交易中断操作,这时客服系统模块将收集到的用户在使用产品过程中的相关数据包括用户的页面操作历史数据、用户使用产品的页面链接的图网络结构数据和用户自身的基本信息数据传输到数据处理模块,数据处理模块对数据进行一个预处理,之后将预处理完成的数据传输到识别模块,其中客户操作时的操作数据输入到第一神经网络模块,页面链接关系数据输入到第二神经网络模块,再将两个神经网络的中间层特征、客户基本信息输入到GBDT模块,GBDT模块则输出该客户是否遇到操作障碍的识别结果到客服系统模块,由客服及时联系用户给予相关帮助。

本发明利用客户的操作行为数据、页面链接图关系数据来构建机器学习模型,通过客服人员收集并反馈的历史操作障碍标签进行训练,所采用的双神经网络的模型结构能够有效提取和匹配客户的操作行为和页面本身的链接关系结构特征,从而对客户是否遇到操作障碍进行及时精准识别,解决了现有应用程序及相关网页在用户遇到操作障碍时无法及时精准响应给予帮助的问题。

以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

相关技术
  • 一种高压线路障碍物识别方法、装置、巡检机器人
  • 一种监控页面生成方法和装置
  • 一种页面管理的方法以及相关装置
  • 一种页面生成方法和装置
  • 一种障碍物识别方法、障碍物识别装置及移动机器人
  • 一种障碍物识别方法、障碍物识别装置及电子设备
技术分类

06120115594612