掌桥专利:专业的专利平台
掌桥专利
首页

目标事件的预测方法、模型、系统以及相关设备

文献发布时间:2024-01-17 01:16:56


目标事件的预测方法、模型、系统以及相关设备

技术领域

本申请涉及事件预测技术领域,特别是涉及一种目标事件的预测方法、事件预测模型、事件预测系统、计算机设备以及计算机可读存储介质。

背景技术

随着保险、电商等行业的快速发展,对各家企业而言提高用户使用体验以及降低自身风险是必要的,因此,对于成交、客诉、欺诈等事件的提前预测也是存在必要的。

以投诉事件为例,目前一般是被动等待客户进行投诉,当接收到客户投诉之后由人工客服介入,客服无法解决的问题再进一步移交专员进行处理,造成案件处理流转失效长,甚至引发进一步投诉。针对公司而言,投诉量大、投诉成本高、处理难度大、处理时效长则是长期存在的痛点。

发明内容

基于此,有必要针对上述技术问题,提供一种能够覆盖目标用户的交互链路,提高目标事件预测的可靠性的目标事件的预测方法、事件预测模型、事件预测系统、计算机设备以及计算机可读存储介质。

一方面,提供一种目标事件的预测方法,目标事件的预测方法包括:获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列;分别对交互事件进行编码,形成事件特征向量;对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态;融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

在本申请的一实施例中,对交互事件进行编码,形成事件特征向量包括:对交互事件的位置信息进行编码形成第一子向量,对交互事件的属性信息进行编码形成第二子向量;拼接第一子向量和第二子向量,形成属于当前交互事件的事件特征向量。

在本申请的一实施例中,交互事件的位置信息为,基于交互事件的发生时间决定的交互事件于行为序列的位置;属性信息包括交互事件的类型、时长、结果中的至少一者。

在本申请的一实施例中,对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量包括:基于各交互事件的发生顺序,依次对各事件特征向量结合在先交互事件的信息进行特征提取,得到行为特征向量;利用行为特征向量对在先形成的序列特征向量进行递归调用,形成作为所述隐状态的新的序列特征向量。

在本申请的一实施例中,融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果包括:对目标用户的静态属性进行特征变换,形成目标用户的静态属性特征向量;对序列特征向量与目标用户的静态属性特征向量进行融合处理,得到发生目标事件的预测结果。

在本申请的一实施例中,获取目标用户的若干个交互事件包括:以预设时长为间隔周期性地获取预设时长内所发生的交互事件;和/或,响应于发生新的交互事件,获取目标用户的交互事件。

另一方面,提供了一种事件预测模型,事件预测模型包括:编码模块、序列模型以及静态模型;编码模块用于对所获取的若干个目标用户交互事件分别进行编码,形成事件特征向量;其中,交互事件用于构成目标用户的行为序列;序列模型用于对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态;静态模型用于获取目标用户的静态属性;静态属性特征向量用于与隐状态融合,获取发生目标事件的预测结果。

另一方面,提供了一种事件预测系统,事件预测系统包括:事件预测模型以及融合模型;事件预测模型用于获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列;分别对交互事件进行编码,形成事件特征向量;对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态;融合模型用于融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列;分别对交互事件进行编码,形成事件特征向量;对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态;融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列;分别对交互事件进行编码,形成事件特征向量;对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态;融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

上述目标事件的预测方法、事件预测模型、事件预测系统、计算机设备以及计算机可读存储介质,将目标用户的交互事件视作用户的行为序列。基于目标用户的行为序列,对各交互事件进行特征提取以及序列化处理得到序列特征向量,将序列特征向量作为目标用户隐状态,隐状态表示预测得到的目标用户状态,从而实现隐状态能够覆盖目标用户的交互链路。结合目标用户的静态属性以及隐状态获取发生目标事件的预测结果,从而提高目标事件预测的可靠性。

附图说明

图1是本申请目标事件的预测方法一实施例的应用环境示意图;

图2是本申请目标事件的预测方法一实施例的流程示意图;

图3是本申请目标事件的预测方法另一实施例的流程示意图;

图4是图3所示目标事件的预测方法另一视角的流程示意图;

图5是本申请事件预测系统一实施例的结构示意图;

图6是本申请事件预测模型一实施例的结构示意图;

图7是图6所示事件预测模型所形成事件预测系统一实施例的结构示意图;

图8是本申请计算机设备一实施例的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

相关技术中典型机器学习技术均可以用于进行目标事件的预测。其中,目标事件可以是诸如投诉行为、欺诈行为等风险预测,也可以是诸如成交行为、好评行为等事件的预测。

相关技术中的预测模型通常是在关键环境对用户的风险水平等进行预测。预测模型可以是广义线性回归模型、树模型、核模型为代表的传统机器学习模型,也可以是以深度网络为代表的深度学习模型。同时,一些融合传统机器学习模型和深度学习模型二者优势的Wide&Deep结构模型、多模态融合模型也逐渐在实际业务中得到应用。

其中,Wide&Deep结构模型中,Deep部分通常包括一个多层前馈神经网络,主要作用是对诸如类别、ID等传统机器学习模型较难处理的稀疏特征进行编码。稀疏特征的编码结果与结构化特征中稠密的数值类型特征进行拼接,最后通过Wide部分的传统模型(如逻辑回归)进行融合。

与此同时,完整的预测系统除了核心的算法模块外,还需要数据集成、处理模块、存储模块等,以满足实际应用中服务响应速度、数据回流、模型迭代等需求。

以用户与保险公司的交互,目标事件为投诉事件为例,随着保险业的快速发展,用户对保险服务的要求也越来越高,服务过程中产生不满即可能会引发用户的投诉行为,其中也不乏恶意投诉的用户。因此,投诉量大、投诉处理难度高等趋势越来越明显。为降低案件处理流转时效长的问题,相关技术中会对投诉事件发生的可能性/概率进行预测。但是,相关技术的缺点主要存在于两个方面:

其一,相关技术难以覆盖用户整个交互生命周期。由于用户与保险公司的交互流程是多变的,每一次不同类型的交互行为和结果都可能影响到用户的投诉风险。针对于此,相关风险评估系统技术中,预测模型通常会针对单一环节进行建模、预测,覆盖多个环节需要进行多次的模型开发,容易导致通常情况下系统仅能关注所谓的“关键”交互环节,而忽略一些“弱”交互事件。例如,部分相关技术中,仅会对在先发生的投诉事件进行学习和分析。因此,系统响应的及时性受限,而响应及时性往往是在类似风险事件中会对最终结果产生重要影响的因素。

其二,相关技术难以综合整个交互链路的数据。关注单一节点的预测模型较为难以综合利用完整交互链路的数据。预测模型对于交互事件数据的加工,通常只能构建所谓最近性、频繁性、金额/数量等相关的RFM(Recency、Frequency、Monetary,最近一次消费、消费频率、消费金额)特征,预测模型的表达学习能力受限。有鉴于此,由于每一环节预测模型的输入与其他环节预测模型的输入不同,即均为异构的、独立训练的,训练数据的覆盖范围各不相同,无法充分利用交互链路整体的数据提升预测模型的准确率。

本申请还可以应用于金融保险业务场景,通过机器学习、深度学习等计算机技术,结合用户交互行为数据以及历史的客户风险标签,在用户与金融机构交互的全生命周期中各环节,及时对用户的行为(即目标事件)进行评估/预警。进一步地,本申请能够协助金融机构尽早干预用户行为,降低金融机构的风险水平,提高用户的使用体验以及满意程度。

本申请旨在将投诉风险等目标事件的识别能力前置,在与用户的交互过程中,收集用户各维度的内外部数据标签、动态变化因素等。例如,对理赔客户进行实时投诉风险评级,对不同投诉风险等级的客户结合客观情况采取不同的应对策略/理赔策略,进而能够降低投诉数量,识别恶意投诉客户,并尽可能妥善解决理赔纠纷。换言之,基于本申请预测发生目标事件的预测结果,能够根据不同的风险等级优化配置金融机构的风险管理投入,有利于提高风险管理水平和用户满意度。

本申请提供的目标事件的预测方法,可以应用于如图1所示的应用环境中,图1是本申请目标事件的预测方法一实施例的应用环境示意图。

终端102通过网络与服务器104通过网络进行通信。

终端102向服务器104发送进行发生目标事件的预测指令。服务器104响应于接收到预测指令,执行目标事件的预测方法进行预测,并将目标事件的预测结果反馈至终端102。

其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种目标事件的预测方法,图2是本申请目标事件的预测方法一实施例的流程示意图。以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

S201:获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列。

在本实施例中,交互事件为用户与商家/平台之间的交互,例如曝光、点击、留资、转化、留存、购买、投诉等均可作为交互事件。其中,若干个交互事件的类型可以不同。举例而言,同时获取的多个交互事件,可以同时包括点击事件、留资事件等。

可选地,获取目标用户的多个交互事件时,各交互事件按照发生时间排列,以有利于结合交互事件发生顺序的信息对用户行为进行分析。

行为序列中可以包含用户自与平台之间发生交互事件后的全部交互事件,也就是说,所获取的若干个交互事件为行为序列的一部分。亦或是,由所获取的若干个交互事件构成行为序列。

目标用户为需要预测发生目标事件的预测结果的指定用户。可选地,目标用户可以仅是一位用户。

获取目标用户的若干交互事件,结合自然语言处理技术的思路,将交互事件视作构成行为序列的成分,从而能够根据交互事件对目标用户的行为进行分析,以实现对目标事件的发生可能性进行预测得到预测结果。

与此同时,获取目标用户的若干个交互事件可以是独立于业务环节存在的,有利于提高预测的实时性以及覆盖率,同时降低对业务环节数据处理以及响应速度等的影响。

S202:分别对交互事件进行编码,形成事件特征向量。

在本实施例中,对各交互事件分别进行编码,形成分别对应各交互事件的各事件特征向量,以便于结合各个交互事件对用户行为进行分析。

S203:对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

在本实施例中,对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量。这意味着,序列特征向量能够包含目标用户各交互事件的信息,且与需要预测的目标事件相关,故将序列特征向量作为目标用户的隐状态。

隐状态为利用模型/系统预测得到的,能够用于表示目标用户的状态。隐状态为预测得到的目标用户可能处于的状态,而非目标用户的真实状态,因此将该状态命名为隐状态。

S204:融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

在本实施例中,为提高预测结果的准确率和可靠性,本实施例在目标用户的隐状态的基础上,进一步结合目标用户的静态属性,以拓宽得到预测结果过程数据的宽度。

如是,将目标用户的隐状态以及静态属性进行融合,扩大可用数据范围,获取目标用户发生目标事件的预测结果,所获取的预测结果能够覆盖目标用户的交互链路,同时结合更多用户的关联信息,有利于显著提高预测结果的可靠性。

可选地,预测结果可以是以概率的形式表现目标事件发生可能性;亦或是,可以以输出可能会发生目标事件/可能不会发生目标事件的形式表现目标事件发生可能性;亦或是,可以预设多个目标事件发生可能性等级,预测结果为其中一个等级。预测结果还可以通过其他方式表示目标事件发生的可能性,在此就不再赘述。

其中,静态属性为目标用户自身关联的属性;静态属性包括目标用户的画像信息、关联关系信息、交易/单据信息中的至少一者。例如性别、年龄等用户画像信息,诸如关联业务员、亲属等关联关系信息、诸如保单、订单等与公司/平台之间的交易/单据信息等,在此就不再举例赘述。

可选地,目标事件的数量可以为一个或多个,在此不做限定。也就是说,目标事件的预测方法中,可以利用目标用户的隐状态以及静态属性预测不同目标事件的发生可能性。

上述目标事件的预测方法中,将目标用户的交互事件视作用户的行为序列。基于目标用户的行为序列,对各交互事件进行特征提取以及序列化处理得到序列特征向量,将序列特征向量作为目标用户隐状态,隐状态表示预测得到的目标用户状态,即隐状态能够覆盖目标用户的交互链路。结合目标用户的静态属性以及隐状态获取发生目标事件的预测结果,扩宽获取预测结果的可用数据,并在隐状态能够覆盖目标用户的交互链路的基础上,有效降低单一环节数据不足或不平衡的风险,有利于提高目标事件预测的可靠性。同时,本实施例可以独立于业务环节存在的,有利于在提高预测的实时性以及覆盖率的同时降低对业务环节的影响。

可见,本申请则结合自然语言处理技术的思路。自然语言处理(NaturalLanguageProcessing,NLP)是一门融语言学、计算机科学、数学于一体的科学,自然语言处理的研究涉及自然语言,即人们日常使用的语言。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。

在基于深度学习技术的自然语言处理模型中,一般处理步骤包括以下两步:

首先,基本数据单元是一个自然语言符号(token),例如中文是一个汉字,英文是一个单词。需要对基本数据单元进行编码形成token对应的向量。

其次,通过深度序列模型利用向量化数据对目标任务进行训练,得到可以提取整个橘子甚至篇章信息的模型。其中,深度序列模型可以是RNN(RecurrentNeural Network,循环神经网络)、LSTM(LongShort-TermMemory,长短期记忆模型)、注意力模型等。

具体地,在本申请中,对每一个用户而言,将一次与保险公司的交互事件(登录、浏览、在线咨询、来电、购买、理赔等)视为一个“汉字”,用户整个的交互序列即行为序列视为一个“句子”。通过对目标用户的交互事件进行适当编码,利用诸如深度序列模型等序列模型对目标用户的行为序列进行建模,得到用户整个交互序列与目标事件相关的特征向量,从而可以通过后续的静态模型进行融合,提高事件预测模型进行预测的准确率,进而提高事件预测系统的可靠性。

在一个实施例中,如图3和图4所示,提供了又一种目标事件的预测方法,图3是本申请目标事件的预测方法另一实施例的流程示意图,图4是图3所示目标事件的预测方法另一视角的流程示意图,包括以下步骤:

S301:获取目标用户的若干个交互事件。

在本实施例中,获取目标用户的若干个交互事件。其中,交互事件用于构成目标用户的行为序列。目标用户为用户之一。

可选地,可以通过预计算地形式得到各个用户的隐状态,在需要获取目标用户发生目标事件的概率时,可以直接调用目标用户的隐状态,即在线可以仅进行增量调用,以提高交互应用(如电话进线、在线咨询等)的实时性要求。也就是说,本实施例可以在不显著提升工程代价的前提下提升及时性。

进一步地,可以周期性地和/或触发性地获取目标用户的若干交互事件。也就是说,可以周期性地获取目标用户的若干交互事件;亦或是,可以触发性地获取目标用户的交互事件;亦或是,可以周期性和触发性相结合地获取目标用户的交互事件,在此就不再赘述。

具体地,周期性是指,以预设时长为间隔周期性地获取预设时长内所发生的交互事件。其中,预设时长可以是以日、小时、分钟为单位,具体预设时长的设置可以结合实际计算力和需求决定,在此不做限定。

触发性是指响应于发生新的交互事件,获取用户的该交互事件。换言之,当用户有新的时间发生时,调起事件预测模型对用户的隐状态进行更新,即更新序列特征向量。

S302:分别对交互事件进行编码,形成事件特征向量。

在本实施例中,对各交互事件分别进行编码,分别形成对应各交互事件的事件特征向量。可选地,可以根据各交互事件的发生顺序,依次对各交互事件进行编码,以进一步提高预测结果的可靠性。

举例而言,在用户行为序列中,用户先浏览页面而后下单所包含的信息,与用户先下单而后再浏览页面所包含的信息可能存在不同。

具体地,对一交互事件进行编码形成事件特征向量可以是:

将交互事件拆分为两个部分,其一为交互事件的位置信息,其二为交互事件的属性信息。

对交互事件的位置信息进行编码形成第一子向量,对交互事件的属性信息进行编码形成第二子向量。拼接第一子向量和第二子向量,形成属于当前交互事件的事件特征向量。

其中,交互事件的位置信息为,基于交互事件的发生时间决定的交互事件于行为序列的位置,例如时间戳等。

属性信息包括交互事件的类型、时长、结果中的至少一者。

交互事件的位置信息和属性信息分开进行编码,能够降低位置信息与属性信息对彼此的干扰。容易理解的,由于各事件的发生时间不同,因此发生于不同时刻的同类交互事件的位置信息必然不同,但是属性信息是相似甚至相同的,将二者分开进行编码能够彼此保留位置信息的差异性以及彼此属性信息之间的关联性和相似性。

拼接第一子向量和第二子向量得到的事件特征向量,事件特征向量的作用为提取交互事件的信息,进一步令目标用户的隐状态贴近于目标用户的真实状态,从而有利于提高发生目标事件的预测结果的准确率和可靠性。

S303:对事件特征向量进行特征提取,得到行为特征向量。

在本实施例中,基于各交互事件的发生顺序,依次对各事件特征向量结合在先交互事件的信息进行特征提取,得到为特征向量。换言之,可以基于位置信息依次各交互事件的事件特征向量进行特征提取,提取事件特征向量所包含的信息,得到属于各交互事件的行为特征向量,以有利于基于行为特征向量对用户的行为习惯进行分析。

也就是说,第一子向量中包含交互事件的位置信息,第二子向量包含交互事件的属性信息,由第一子向量和第二子向量拼接形成的事件特征向量中,同时包含交互事件的位置信息和属性信息。事件特征向量具有分别显著的位置特征以及属性特征,因此,利用事件特征向量进行特征提取得到的行为特征向量,有利于提高预测结果的准确性。

可选地,在对事件特征向量进行特征提取时,可以结合其他事件特征向量的信息,以丰富行为特征向量的表达。

S304:对行为特征向量进行序列化处理,形成作为目标用户隐状态的序列特征向量。

在本实施例中,对行为特征向量进行序列化处理为,利用行为特征向量对在先形成的序列特征向量进行递归调用,形成作为目标用户隐状态的序列特征向量。也就是说,可以新得到的行为特征向量更新序列特征向量,即更新目标用户的隐状态。

当然,若步骤S301中为首次获取目标用户的交互事件,则可以当前形成的行为特征向量即可作为序列特征向量,并作为目标用户的隐状态。在下次得到行为特征向量时,调用在先交互事件形成的序列特征向量进行递归,形成作为目标用户隐状态的新的序列特征向量。

如是,经过对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态,用于表示目标用户的状态。序列特征向量中包含行为序列的信息以及与目标事件相关联的信息。

S305:获取目标用户的静态属性特征向量。

在本实施例中,对目标用户的静态属性进行特征变换,形成目标用户的静态属性特征向量,以提高目标用户静态属性的丰富度。

其中,静态属性为不属于用户交互事件的结构化信息。静态属性可以包括目标用户的画像信息、关联关系信息、交易/单据信息中的至少一者。

可选地,对静态属性进行特征变换的变换方式可以是机器学习特征加工方法,例如量化、标准化、分箱、缺失值处理、聚合等,在此不做限定。

S306:融合序列特征向量和静态属性特征向量,得到发生目标事件的预测结果。

在本实施例中,融合目标用户的隐状态以及静态属性可以是,对序列特征向量与目标用户的静态属性特征向量进行融合处理,得到发生目标事件的预测结果。

如是,预测结果结合了目标用户的隐状态以及静态属性二者的信息。其中,隐状态为对目标用户整个交互事件形成的行为序列进行建模,所得到的用户行为序列与目标事件相关的特征向量,通过与静态属性进行融合。也就是说,序列特征向量可以作为深度部分,同时利用静态属性特征向量作为宽度部分,能够有效提高预测结果的准确性,从而提高事件预测模型以及事件预测系统的可靠性。

综上,本实施例中目标事件的预测方法,可以通过预计算的形式将一部分预测计算提前离线完成。例如将预测用户隐状态部分进行预计算,隐状态可以被存储在数据库或缓存中通过用户的ID进行检索。如是,在线可以仅进行增量调用,降低计算代价大对及时性的影响。当业务系统需要调用事件预测系统评分时,可以通过用户ID可以获得目标用户最新的隐状态,然后与最新的静态属性进行拼接,直接调用融合模型即可得到评分,有效缩减了实时预测的时间。并且,本实施例能够充分利用事件预测模型/事件预测系统的学习能力和表达能力。

应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

举例而言,步骤S301-步骤S304为获取目标用户隐状态的过程,步骤S305为获取用户静态属性的过程。这意味着,步骤S301-步骤S304与步骤S305可以是同时进行的,也可以是先后进行的。亦或是,步骤S301-步骤S304为预计算步骤,分别计算各用户的隐状态,响应于接收到获取预测结果的指令,执行步骤S305获取目标用户的静态属性,以及调用目标用户的隐状态,而后将目标用户的隐状态以及静态属性二者融合,以输出目标用户发生目标事件的预测结果。

在一个实施例中,如图5所示,提供了一种事件预测系统,图5是本申请事件预测系统一实施例的结构示意图。

事件预测系统包括事件预测模型51以及融合模型52。

事件预测模型51用于获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列;分别对交互事件进行编码,形成事件特征向量;对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

融合模型52与事件预测模型51连接,用于融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

可选地,融合模型52融合静态属性以及隐状态,即可以是一种能够融合结构化数据特征和深度序列特征的机器学习模型。例如,融合模型52可以是广义线性模型(诸如LR等)、树模型(诸如决策树、随机森林、GBDT等)、SVM/FM以及神经网络模型等,融合模型52的具体选择可以根据实际数据和环境进行选择,在此不做限定。其中,当选中神经网络模型作为融合模型52是,可以选用浅层神经网络模型,浅层神经网络模型的输出作为预测的最终结果,即发生目标事件的预测结果。

进一步地,融合模型52的数量可以为多个,分别用于输出发生不同目标事件的预测结果,丰富事件预测系统的功能性。

可见,本实施例中可以通过一个统一的事件预测系统,基于最新的交互数据对事件预测系统进行调用,甚至可以在任意时刻进行调用。本实施例中的事件预测系统覆盖用户的完整交互链路,有利于及时响应调用。榆次同时,事件预测模型能够基于所有用户的数据进行统一训练,有利于有效降低单一环节数据不足或不平衡的风险。并且,统一的事件预测模型/系统能够充分利用尽可能多的用户行为数据进行训练,提升事件预测模型/系统的准确率,从而有效改善事件预测模型/系统的可靠性。

在一个实施例中,如图6所示,提供了一种事件预测模型,图6是本申请事件预测模型一实施例的结构示意图。

事件预测模型包括编码模块61、序列模型62以及静态模型63。

编码模块61用于对所获取的若干个目标用户交互事件分别进行编码,形成事件特征向量。其中,交互事件用于构成目标用户的行为序列。

序列模型62用于对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

静态模型63用于获取目标用户的静态属性。其中,静态属性特征向量用于与隐状态融合,获取发生目标事件的预测结果。

可选地,序列模型62可以是深度序列模型62等。例如,LSTM、GRU、注意力网络等,具体选用可以实际的数据、环境要求进行选择,在此不做限定。

进一步地,编码模块61包括第一子编码模块和第二子编码模块,分别用于对目标事件的位置信息和属性信息进行编码。

其中,第一子编码模块可以将位置信息转化为预设长度的向量,以有利于简化数据处理的复杂度。可选地,第一子编码模块可以是正弦变换模块、全连接可训练的神经网络模块等。

第二子编码模块可以是全连接神经网络等。全连接神经网络的权重可以在模型训练过程中训练得到。

本实施例中事件预测模型与Wide&Deep模型相似,但是本实施例中的事件预测模型并不同于Wide&Deep模型。本实施例中,将用户行为的数据采用了序列模型62进行编码,即事件特征向量利用序列模型62进行特征提取以及实现递归调用。可选地,序列模型62可以是深度序列模型62等。

其中,事件预测模型可以基于用户历史的画像数据、行为数据以及对应的目标事件数据进行训练。具体训练方法以及超参数配置可根据实际应用进行调整。举例而言,事件预测模型的训练过程中,深度部分和宽度部分可以分开训练,在宽度部分进行融合;即输出隐状态和静态属性的部分分开训练,在静态属性部分进行融合。也可以深度部分和宽度部分进行统一端到端训练,例如当宽度部分也采用神经网络模型时。

关于事件预测系统和事件预测模型的具体限定可以参见上文中对于目标事件的预测方法的限定,在此不再赘述。上述事件预测系统和事件预测模型中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,如图7所示,提供了一种事件预测系统,图7是图6所示事件预测模型所形成的事件预测系统一实施例的结构示意图。

用户的交互事件输入编码模块进行编码,得到事件特征向量。其中,编码模块可以包括第一子编码模块和第二子编码模块,分别用于对位置信息和属性信息进行编码。事件特征向量输入序列模型,得到用于表征用户行为的序列特征向量。

用户的静态属性输入静态模型,以得到用于表征用户自身属性的静态属性特征向量。

将静态属性特征向量和序列特征向量输入至融合模型,以计算得到该融合模型对应目标事件的发生可能性,即预测结果。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示,图8是本申请计算机设备一实施例的结构示意图。

该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标事件的预测方法相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标事件的预测方法。

本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

S201:获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列。

S202:分别对交互事件进行编码,形成事件特征向量。

S203:对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

S204:融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

S301:获取目标用户的若干个交互事件。

在本实施例中,获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列。

以预设时长为间隔周期性地获取预设时长内所发生的交互事件;和/或,响应于发生新的交互事件,获取目标用户的交互事件。

S302:分别对交互事件进行编码,形成事件特征向量。

在本实施例中,对一交互事件进行编码形成事件特征向量可以是,对交互事件的位置信息进行编码形成第一子向量,对交互事件的属性信息进行编码形成第二子向量;拼接第一子向量和第二子向量,形成属于当前交互事件的事件特征向量。

其中,交互事件的位置信息为,基于交互事件的发生时间决定的交互事件于行为序列的位置。

属性信息包括交互事件的类型、时长、结果中的至少一者。

S303:对事件特征向量进行特征提取,得到行为特征向量。

在本实施例中,基于各交互事件的发生顺序,依次对各事件特征向量结合在先交互事件的信息进行特征提取,得到行为特征向量。

S304:对行为特征向量进行序列化处理,形成作为目标用户隐状态的序列特征向量。

在本实施例中,行为特征向量对在先形成的序列特征向量进行递归调用,形成作为目标用户隐状态的序列特征向量。

对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

S305:获取目标用户的静态属性特征向量。

在本实施例中,对目标用户的静态属性进行特征变换,形成目标用户的静态属性特征向量。

S306:融合序列特征向量和静态属性特征向量,得到发生目标事件的预测结果。

在本实施例中,对序列特征向量与目标用户的静态属性特征向量进行融合处理,得到发生目标事件的预测结果。

如是,可以融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果,提高预测结果的可靠性。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

S201:获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列。

S202:分别对交互事件进行编码,形成事件特征向量。

S203:对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

S204:融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

S301:获取目标用户的若干个交互事件。

在本实施例中,获取目标用户的若干个交互事件,其中,交互事件用于构成目标用户的行为序列。

以预设时长为间隔周期性地获取预设时长内所发生的交互事件;和/或,响应于发生新的交互事件,获取目标用户的交互事件。

S302:分别对交互事件进行编码,形成事件特征向量。

在本实施例中,对一交互事件进行编码形成事件特征向量可以是,对交互事件的位置信息进行编码形成第一子向量,对交互事件的属性信息进行编码形成第二子向量;拼接第一子向量和第二子向量,形成属于当前交互事件的事件特征向量。

其中,交互事件的位置信息为,基于交互事件的发生时间决定的交互事件于行为序列的位置。

属性信息包括交互事件的类型、时长、结果中的至少一者。

S303:对事件特征向量进行特征提取,得到行为特征向量。

在本实施例中,基于各交互事件的发生顺序,依次对各事件特征向量结合在先交互事件的信息进行特征提取,得到行为特征向量。

S304:对行为特征向量进行序列化处理,形成作为目标用户隐状态的序列特征向量。

在本实施例中,行为特征向量对在先形成的序列特征向量进行递归调用,形成作为目标用户隐状态的序列特征向量。

对各事件特征向量进行特征提取以及序列化处理,形成行为序列的序列特征向量,序列特征向量作为目标用户的隐状态。

S305:获取目标用户的静态属性特征向量。

在本实施例中,对目标用户的静态属性进行特征变换,形成目标用户的静态属性特征向量。

S306:融合序列特征向量和静态属性特征向量,得到发生目标事件的预测结果。

在本实施例中,对序列特征向量与目标用户的静态属性特征向量进行融合处理,得到发生目标事件的预测结果。

如是,可以融合目标用户的隐状态以及静态属性,获取发生目标事件的预测结果,提高预测结果的可靠性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 电量预测模型训练方法、电量预测方法、智能设备及系统
  • 事件追踪与变化阶段划分方法、系统及相关设备
  • 一种产量预测模型的训练方法、系统及相关设备
  • 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质
技术分类

06120116107000