掌桥专利:专业的专利平台
掌桥专利
首页

数据推荐方法、数据推荐装置、电子设备及可读存储介质

文献发布时间:2023-06-19 12:24:27


数据推荐方法、数据推荐装置、电子设备及可读存储介质

技术领域

本公开涉及大数据技术领域,尤其涉及推荐领域。

背景技术

互联网的出现和普及给用户带来了大量的信息,满足了用户对信息的需求。但还是可能存在用户面对大量信息时,难以从中获得自己感兴趣的信息的问题。

为此,可以根据用户的兴趣特点和行为习惯等向用户推荐感兴趣的信息的推荐系统应运而生。例如,用于推荐广告的推荐系统,该推荐系统会向用户推荐适合的广告。但在推荐过程中,可能存在推荐结果不符合预期的情况。

发明内容

本公开提供了一种数据推荐方法、数据推荐装置、电子设备及可读存储介质。

根据本公开的一方面,提供了一种数据推荐方法,包括:响应于针对异常推荐的请求,对上述请求进行解析,得到特征数据和与上述特征数据对应的第一预测推荐结果,其中,上述特征数据包括多个特征维度数据;确定与上述多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据;利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个上述替换特征数据对应的第二预测推荐结果,其中,上述多个替换特征数据是基于上述特征数据和上述多个替换特征维度数据得到的;以及,根据上述第一预测推荐结果和上述第二预测推荐结果,从上述多个特征维度数据中确定被认为导致上述异常推荐的目标特征维度数据。

根据本公开的另一方面,提供了一种特征推荐装置,包括:解析模块,用于响应于针对异常推荐的请求,对上述请求进行解析,得到特征数据和与上述特征数据对应的第一预测推荐结果,其中,上述特征数据包括多个特征维度数据;第一确定模块,用于确定与上述多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据;获得模块,用于利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个上述替换特征数据对应的第二预测推荐结果,其中,上述多个替换特征数据是基于上述特征数据和上述多个替换特征维度数据得到的;以及,第二确定模块,用于根据上述第一预测推荐结果和上述第二预测推荐结果,从上述多个特征维度数据中确定被认为导致上述异常推荐的目标特征维度数据。

根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如上所述的方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行如上所述的方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如上所述的方法。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1示意性示出了根据本公开实施例的可以应用数据推荐方法及装置的示例性系统架构;

图2示意性示出了根据本公开实施例的数据推荐方法的流程图;

图3示意性示出了根据本公开实施例的确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据的流程图;

图4示意性示出了根据本公开实施例的根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据的流程图;

图5示意性示出了根据本公开实施例的数据推荐过程的示意图;

图6示意性示出了根据本公开实施例的数据推荐装置的框图;以及

图7示出了根据本公开实施例的可以适用于数据推荐方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

在推荐系统中,可以利用训练样本对深度神经网络模型进行训练得到的推荐模型来实现推荐。由于深度神经网络模型具有较为强大的泛化能力,因此,在模型参数确定的情况下,便可以利用不断更新训练样本来对模型进行更新的方式实现推荐模型具有较好的预测效果。

在实现本公开构思的过程中,发现存在推荐结果不符合预期的情况,上述情况将影响用户的使用体验,并可能造成资源的浪费。为了有效保证用户的使用体验,减少资源的浪费,可以通过提高推荐模型的预测准确性的方式来实现。为了提高推荐模型的预测准确性,可以对导致不符合预期的推荐结果的原因进行分析,以基于分析出的原因对推荐模型进行改进。

可以利用如下方式对导致不符合预期的推荐结果的原因进行分析,即,分别随机替换每个明文字段的取值,利用离线推荐模型处理替换后的明文字段,得到与替换后的明文字段对应的预测推荐结果,并将与替换后的明文字段对应的预测推荐结果和与原明文字段对应的预测推荐结果进行比较,根据比较结果确定被认为导致不符合预期的推荐结果的目标明文字段。每个明文字段可以理解能够直观理解的与推荐相关的用户数据。

在实现本公开构思的过程中,发现由于推荐模型的特征维度数据的利用方式较为复杂,例如,多个明文字段对应一个特征维度数据或一个明文字段对应多个特征维度数据,因此,利用明文字段替换的方式难以实现较为准确的确定导致不符合预期的推荐结果的原因。此外,由于推荐系统实际利用的是在线推荐模型而不是离线推荐模型,离线推荐模型和在线推荐模型本身便存在不一致的情况,例如,某些会对离线推荐模型产生较大影响的参数可能并不会对在线推荐模型产生较大影响。因此,利用离线推荐模型难以较为准确的确定导致不符合预期的推荐结果的原因。

为此,提出一种根据利用在线推荐模型处理特征级别的数据得到的预测推荐结果来实现确定导致不符合预期的推荐结果的原因的方案。即,本公开实施例提供了一种数据推荐方法、数据推荐装置、电子设备、存储有计算机指令的非瞬时计算机可读存储介质及计算机程序产品。该数据推荐方法包括:响应于针对异常推荐的请求,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果,其中,特征数据包括多个特征维度数据,确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据,利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果,其中,多个替换特征数据是基于特征数据和多个替换特征维度数据得到的,并根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

图1示意性示出了根据本公开实施例的可以应用数据推荐方法及装置的示例性系统架构100。

需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用数据推荐方法及装置的示例性系统架构100可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的数据推荐方法及装置。

如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。

需要说明的是,本公开实施例所提供的数据推荐方法一般可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的数据推荐装置也可以设置于终端设备101、102、或103中。

或者,本公开实施例所提供的数据推荐方法一般也可以由服务器105执行。相应地,本公开实施例所提供的数据推荐装置一般可以设置于服务器105中。本公开实施例所提供的数据推荐方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据推荐装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。

例如,服务器105响应于针对异常推荐的请求,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果,确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据,利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果,并根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群对请求进行分析,并最终实现确定被认为导致异常推荐的目标特征维度数据。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的数据推荐方法200的流程图。

如图2所示,该方法包括操作S210~S240。

在操作S210,响应于针对异常推荐的请求,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果,其中,特征数据包括多个特征维度数据。

在操作S220,确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

在操作S230,利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果,其中,多个替换特征数据是基于特征数据和多个替换特征维度数据得到的。

在操作S240,根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,异常推荐可以指推荐结果不符合预期的推荐,即,推荐结果和预期推荐结果不一致的推荐。特征数据可以是对与推荐相关的用户数据进行特征提取后得到的数据。特征数据可以包括至少两个特征维度数据,即,特征数据的维度可以包括至少两个,每个维度的特征数据可以称为特征维度数据。每个特征维度数据可以具有与该特征维度数据对应的一个或多个替换特征维度数据。特征维度数据和与该特征维度数据对应的替换特征维度数据的区别在于取值的不同,即,特征维度数据和与该特征维度数据对应的替换特征维度数据表征同一特征维度,所不同的是取值。

根据本公开的实施例,针对每个特征维度数据,可以根据与该特征维度数据对应的特征数据和替换特征维度数据,得到与该特征维度数据对应的特征数据所对应的替换特征数据。

根据本公开的实施例,与特征数据对应的第一预测推荐结果可以是利用在线推荐模型对特征数据进行处理得到的,即,第一预测推荐结果是利用在线推荐模型得到的预测推荐结果。

根据本公开的实施例,利用在线推荐模型处理特征数据得到第一预测推荐结果的原因在于:在推荐系统中,投入成本的用户会比较在意转化效果,但由于转化数据较少,在线推荐模型的泛化能力不足以完全承担,因此,为了解决上述问题,可以利用反馈系数对利用在线推荐模型得到的预测推荐结果进行校准,由此,预测推荐结果可能是利用反馈系数对原预测推荐结果校准后得到的。反馈系数可以理解为是根据后验的与转化效果相关的数据确定的。

而由于确定导致不符合预期的推荐结果的原因需要对利用在线推荐模型得到的预测推荐结果进行分析,如果预测推荐结果不是利用在线推荐模型得到的预测推荐结果而是对利用在线推荐模型得到的预测推荐结果进行了校准后的预测推荐结果,则可能由于增加了其他因素而导致确定出的导致不符合预期的推荐结果的原因与实际情况不符。因此,为了尽量确保确定出的导致不符合预期的推荐结果的原因较为准确,可以使得与特征数据对应的第一预测推荐结果是利用在线推荐模型对特征数据进行处理得到的而不是对利用在线推荐模型得到的第一预测推荐结果进行了校准后的预测推荐结果。

根据本公开的实施例,在线推荐模型可以理解为是推荐系统实际利用的推荐模型。在线推荐模型可以用于向用户进行对象推荐。在线推荐模型可以是利用训练样本对深度神经网络模型进行训练得到的。

根据本公开的实施例,在检测到异常推荐的情况下,可以生成针对异常推荐的请求,该请求可以包括特征数据和与特征数据对应的第一预测推荐结果。生成针对异常推荐的请求可以包括:从目标文件中获取与异常推荐相关的数据,将与异常推荐相关的数据加载至内存,对与异常推荐相关的数据进行处理,得到具有目标格式的针对异常推荐的请求,目标格式可以包括Proto Buffer。在获取到针对异常推荐的请求的情况下,可以响应于该请求,对该请求进行解析,以得到特征数据和与特征数据对应的第一预测推荐结果。可以将上述获取针对异常推荐的请求理解为由在线请求模块来实现的。用于生成并发送针对异常推荐的请求的模块可以通过远程过程调用将针对异常推荐的请求发送给在线请求模块。

根据本公开的实施例,由于在线请求模块较难以实现接收特征级别的请求,因此,可以对在线请求模块进行改进,使得其能够支持接收特征级别的请求。在本公开的实施例中,用于执行接收针对异常推荐的请求的在线请求模块是能够接收特征级别的请求的在线请求模块。

根据本公开的实施例,为了尽量确保确定出的导致不符合预期的推荐结果的原因较为准确,需要尽量确保在线请求模块与在线推荐模型的一致性,为了尽量确保在线请求模块与在线推荐模型的一致性,可以对在线请求模块和在线推荐模型的代码进行同源管理。

此外,还可以利用开关模块来控制是否启动能够接收特征级别的请求的在线请求模块,即,如果开关模块的开关状态处于开启状态,则可以说明启动了能够接收特征级别的请求的在线请求模块。如果开关模型的开关状态处于关闭状态,则可以说明关闭了能够接收特征级别的请求的在线请求模块开关模块可以包括开启状态和关闭状态的开关模块来使用开关控制模型模块是否可以接收特征级别的请求。

根据本公开的实施例,在对请求进行解析,得到特征数据之后,可以确定与特征数据所包括的每个特征维度数据对应的一个或多个替换维度特征数据,并可以根据特征数据和与每个特征维度数据对应的每个替换特征维度数据,确定每个替换特征数据,即,多个替换特征数据中的每个替换特征数据是基于特征数据和与每个特征维度数据对应的每个替换特征维度数据得到的。也即,针对与特征数据对应的每个特征维度数据,针对与该特征维度数据对应的每个替换特征维度数据,将该替换特征维度数据替换该特征数据中的该特征维度数据,并与该特征数据中除该特征维度数据以外的其他特征维度数据结合作为与该特征数据对应的一个替换特征数据。

根据本公开的实施例,根据确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据,可以包括:利用随机替换方法确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

备选地,确定与历史在线推荐模型对应的训练样本,对与历史在线推荐模型对应的训练样本进行处理,得到与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

备选地,确定与在线推荐模型对应的训练样本,对与在线推荐模型对应的训练样本进行处理,得到与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

根据本公开的实施例,上述所述的在线推荐模型可以理解为是产生异常推荐的在线推荐模型。可以根据实际业务需求对在线推荐模型进行更新,由此,可以产生多个版本的在线推荐模型,历史利用过的在线推荐模型可以称为历史在线推荐模型。

根据本公开的实施例,利用随机替换方法确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据,可以包括:针对多个特征维度数据中的每个特征维度数据,确定与该特征维度数据对应的各个取值,随机从取值集中选取一个或多个取值作为与该特征维度数据对应的一个替换特征维度数据。

根据本公开的实施例,对与历史在线推荐模型对应的训练样本进行处理,得到与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据,可以包括:对与历史在线推荐模型对应的训练样本进行处理,得到每个特征维度数据在历史训练样本中出现的取值,对各个取值进行处理,得到与每个特征维度数据对应的每个替换特征维度数据。对各个取值进行处理,得到与每个特征维度数据对应的每个替换特征维度数据,可以包括:对各个取值进行组合,得到一个或多个组合值,将每个组合值作为与每个特征维度数据对应的每个替换特征维度数据。备选地,将每个取值作为与每个特征维度数据对应的每个替换特征维度数据。历史训练样本可以理解为是与历史在线推荐模型对应的训练样本。

根据本公开的实施例,在获得与特征数据对应的各个替换特征数据之后,可以利用在线推荐模型分别处理每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果,即,可以将每个替换特征数据输入在线推荐模型,得到与每个替换特征数据对应的第二预测推荐结果。由于是利用在线推荐模型处理替换特征数据,在线推荐模型是推荐系统实际利用的,因此,可以有效确保预测推荐结果的准确性。

根据本公开的实施例,在获得与特征数据对应的第一预测推荐结果和与每个替换特征数据对应的第二预测推荐结果之后,可以将第一预测推荐结果分别与多个第二预测推荐结果中的每个第二预测推荐结果进行比较,得到比较结果,根据比较结果,从多个特征维度数据中确定目标特征维度数据。目标特征维度数据可以理解为是被认为导致异常推荐的特征维度数据。目标特征维度数据可以包括一个或多个。

根据本公开的实施例,将第一预测推荐结果与多个第二预测推荐结果中的每个第二预测推荐结果进行比较,得到比较结果可以包括:根据与每个替换特征维度数据集所包括的每个替换特征数据对应的第二预测推荐结果,确定与每个替换特征数据集对应的预测推荐结果。将第一预测推荐结果与每个替换特征数据集对应的预测推荐结果进行比较,得到比较结果。

根据本公开的实施例,根据与每个替换特征维度数据集所包括的每个替换特征数据对应的第二预测推荐结果,确定与每个替换特征数据集对应的预测推荐结果可以包括:确定最值,最值是与每个替换特征数据集所包括的各个替换特征数据对应的预测推荐结果的最值,最值包括最大值或最小值。将最值确定为与每个替换特征数据集对应的预测推荐结果。备选地,确定平均值,其中,平均值是与每个替换特征数据集所包括的各个替换特征数据对应的预测推荐结果的平均值。将平均值确定为与每个替换特征数据集对应的预测推荐结果。

根据本公开的实施例,由于确定出了导致异常推荐的目标特征维度数据,因此,可以认为目标特征维度数据即是需要推荐的数据,以便根据目标特征维度数据,确定在线推荐模型可以优化的方向,进而有效降低出现推荐结果不符合预期的概率。

需要说明的是,在本公开实施例的技术方案中,所涉及的特征数据和替换特征维度数据的获取、存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。

根据本公开的实施例,通过响应于针对异常推荐的请求,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果,确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据,利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果,并根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。由于替换特征数据基于特征数据和与每个特征维度数据对应的每个替换特征维度数据得到的,因此,实现了特征级别的识别。在此基础上,由于利用的是在线推荐模型处理替换特征数据得到与替换特征数据对应的第二预测推荐结果,在线推荐模型是推荐系统实际利用的,因此,可以有效确保预测推荐结果的准确性,进而能够有效确保根据与特征数据对应的第一预测推荐结果和每个第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据是较为准确的,因而,至少部分地克服了难以较为准确的确定导致不符合预期的推荐结果的原因的技术问题,从而可以根据目标特征维度数据,确定在线推荐模型可以优化的方向,降低了出现推荐结果不符合预期的概率。

根据本公开的实施例,上述数据推荐方法还可以包括如下操作。

在检测到第一预测推荐结果满足预设条件的情况下,生成针对异常推荐的请求,其中,预设条件包括以下之一:第一预测推荐结果大于或等于第一阈值。第一预测推荐结果小于或等于第二阈值,其中,第二阈值小于或等于第一阈值。第一预测推荐结果与历史推荐结果之间的第一差值大于或等于第一差值阈值。

根据本公开的实施例,预设条件可以用于作为确定推荐是否是异常推荐的依据。第一阈值、第二阈值和第一差值阈值的数值可以根据实际业务需求进行配置,在此不作限定。

根据本公开的实施例,在获得与特征数据对应的第一预测推荐结果之后,可以确定第一预测推荐结果是否满足预测条件,如果确定第一预测推荐结果满足预设条件,则可以说明产生第一预测推荐结果的推荐是异常推荐。如果确定第一预测推荐结果不满足预设条件,则可以说明产生第一预测推荐结果的推荐是非异常推荐。如果确定产生第一预测推荐结果的推荐是异常推荐,则可以生成针对异常推荐的请求。

根据本公开的实施例,在检测到第一预测推荐结果满足预设条件的情况下,生成针对异常推荐的请求,可以包括如下操作。

在检测到第一预测推荐结果满足预设条件的情况下,在预设时间段内生成针对异常推荐的请求。

根据本公开的实施例,在针对在线推荐系统的情况下,对确定导致不符合预期的推荐结果的原因的效率有着较高的要求。为了提高确定导致不符合预期的推荐结果的原因的效率,可以使得在检测到第一预测推荐结果满足预设条件的情况下,较为及时生成针对异常推荐的请求,以便能够较为及时地对导致异常推荐的原因进行分析。例如,可以在预设时间段内生成针对异常推荐的请求。预设时间段的数值可以根据实际业务需求进行配置,在此不作限定。

根据本公开的实施例,通过在检测到第一预测推荐结果满足预设条件的情况下,在预设时间段内生成针对异常推荐的请求,实现了能够较为及时地对导致异常推荐的原因进行分析,以便能向用户提供符合预期的推荐,提高用户的使用体验。

根据本公开的实施例,响应于针对异常推荐的请求,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果,可以包括如下操作。

在接收到请求的预期解析时间段内,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果。

根据本公开的实施例,为了提高确定导致不符合预期的推荐结果的原因的效率,可以使得在对请求进行解析是在接收到请求的预期解析时间段内完成的,以便能够较为及时对导致异常推荐的原因进行分析。

根据本公开的实施例,利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到第二预测推荐结果是通过多线程实现的。

根据本公开的实施例,为了提高确定导致不符合预期的推荐结果的原因的效率,可以利用多线程实现,即,多个替换特征数据可以被至少两个线程处理。此外,不同线程可以部署于同一电子设备或不同电子设备。

根据本公开的实施例,请求还包括在线模型版本标识。

操作S230可以包括如下操作。

利用与在线模型版本标识对应的在线推荐模型分别处理多个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果。

根据本公开的实施例,由于可以根据实际业务需求对在线推荐模型进行更新,因此,可能存在多个版本的在线推荐模型,由此,可能存在当前正在利用的在线推荐模型与导致推荐结果不符合预期的在线推荐模型不一致的情况。而为了尽量确保确定出的导致不符合预期的推荐结果的原因较为准确,需要利用导致推荐结果不符合预期的在线推荐模型来处理多个替换特征数据中的每个替换特征数据。

为了实现能够利用导致推荐结果不符合预期的在线推荐模型来处理多个替换特征数据中的每个替换特征数据,可以将每个版本的在线推荐模型进行存储,以便后续利用。可以用在线模型版本标识来表征在线推荐模型。在此基础上,生成针对异常推荐的请求还可以包括在线模型版本标识。请求中所包括的在线模型版本标识可以是产生异常推荐的在线推荐模型的在线模型版本标识。

根据本公开的实施例,可以根据在线模型版本标识,确定与在线模型版本标识对应的在线推荐模型,即,确定产生异常推荐的在线推荐模型,利用确定产生异常推荐的在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果。

下面参考图3~图5,结合具体实施例对图2所示的方法做进一步说明。

图3示意性示出了根据本公开实施例的确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据300的流程图。

如图3所示,该方法包括操作S321~S322。

在操作S321,确定与在线推荐模型对应的训练样本。

在操作S322,对与在线推荐模型对应的训练样本进行处理,得到与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

根据本公开的实施例,与在线推荐模型对应的训练样本可以理解为是用于训练得到产生异常推荐的在线推荐模型的训练样本。

根据本公开的实施例,对与在线推荐模型对应的训练样本进行处理,得到每个特征维度数据在训练样本中出现的取值,对各个取值进行处理,得到与每个特征维度数据对应的每个替换特征维度数据。对各个取值进行处理,得到与每个特征维度数据对应的每个替换特征维度数据,可以包括:对各个取值进行组合,得到一个或多个组合值,将每个组合值作为与每个特征维度数据对应的每个替换特征维度数据。备选地,将每个取值作为与每个特征维度数据对应的每个替换特征维度数据。

根据本公开的实施例,由于利用的是用于训练在线推荐模型的训练样本来得到与每个特征维度数据对应的一个或多个替换特征维度数据,因此,使得得到的替换特征维度数据是有意义、完整且具有时效性的,由此,能够为尽量确保确定出的导致不符合预期的推荐结果的原因提供较高质量的数据支持。

根据本公开的实施例,为了提高确定导致不符合预期的推荐结果的原因的效率,可以预先生成替换特征维度数据,并将替换特征数据存储于缓存中。

图4示意性示出了根据本公开实施例的根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据400的流程图。

如图4所示,该方法包括操作S441~S442。

在操作S441,根据与每个替换特征维度数据集所包括的每个替换特征数据对应的第二预测推荐结果,确定与每个替换特征数据集对应的第三预测推荐结果,其中,每个特征维度数据对应一个替换特征维度数据集。

在操作S442,根据第一预测推荐结果和每个第三预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,针对每个特征维度数据,可以确定与该特征维度数据对应的一个替换特征维度数据集,每个替换特征维度数据集可以包括一个或多个替换特征维度数据。

根据本公开的实施例,可以将第一预测结果分别与每个第三预测结果进行比较,得到比较结果,根据比较结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,操作S441可以包括如下操作。

确定平均值,其中,平均值是与每个替换特征数据集所包括的各个替换特征数据对应的预测推荐结果的平均值。将平均值确定为与每个替换特征数据集对应的第三预测推荐结果。

根据本公开的实施例,针对每个替换特征数据集,将与该替换特征集对应的各个预测推荐结果进行相加,得到和值,确定和值与该替换特征数据集包括的替换特征数据的数量的比值,该比值即为平均值。将平均值确定为与该替换特征数据集对应的第三预测推荐结果。

根据本公开的实施例,根据第一预测推荐结果和每个第三预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据,可以包括如下操作。

确定第一预测推荐结果与每个第三预测推荐结果之间的第二差值。根据多个第二差值,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,可以确定第一预测推荐结果与每个第三预测推荐结果之间的第二差值,得到多个第二差值。根据多个第二差值,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据,可以包括:可以根据第二差值阈值和多个第二差值,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。备选地,对多个第二差值进行排序,得到排序结果,并根据排序结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,根据多个第二差值,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据,可以包括如下操作。

针对每个特征维度数据,在确定与特征维度数据对应的第二差值大于或等于第二差值阈值的情况下,将特征维度数据确定为被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,第二差值阈值可以用于作为从多个特征维度数据中确定目标特征维度数据的依据之一。第二差值阈值的取值可以根据实际业务需求进行配置,在此不作限定。

根据本公开的实施例,根据多个第二差值,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据,可以包括如下操作。

对多个第二差值进行排序,得到排序结果。根据排序结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,对多个第二差值进行排序,得到排序结果,并根据排序结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。排序可以包括按照第二差值由小到大的顺序进行排序或按照第二差值由大到小的顺序进行排序。

图5示意性示出了根据本公开实施例的数据推荐过程500的示意图。

如图5所示,在检测到第一预测推荐结果503满足预设条件的情况下,生成针对异常推荐的请求501。响应于针对异常推荐的请求501,对异常推荐的请求501进行解析,得到特征数据502和与特征数据502对应的第一预测推荐结果503。特征数据503可以包括多个特征维度数据。

确定与每个特征维度数据对应的一个或多个替换特征维度数据。根据特征数据和与每个特征维度数据对应的每个替换特征维度数据,确定每个替换特征数据。根据与每个特征维度数据对应的一个或多个替换特征数据,得到与每个特征维度数据对应的替换特征数据集504。

利用在线推荐模型处理每个替换特征数据集504所包括的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果505。

将第一预测推荐结果503和每个第二预测推荐结果505进行比较,得到比较结果,根据比较结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据507。

图6示意性示出了根据本公开实施例的数据推荐装置600的框图。

如图6所示,数据推荐装置600可以包括解析模块610、第一确定模块620、获得模块630和第二确定模块640。

解析模块610,用于响应于针对异常推荐的请求,对请求进行解析,得到特征数据和与特征数据对应的第一预测推荐结果,其中,特征数据包括多个特征维度数据。

第一确定模块620,用于确定与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

获得模块630,用于利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果,其中,多个替换特征数据是基于特征数据和多个替换特征维度数据得到的。

第二确定模块640,用于根据第一预测推荐结果和第二预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,第一确定模块620可以包括第一确定子模块和第二处理子模块。

第一确定子模块,用于确定与在线推荐模型对应的训练样本。

第一处理子模块,用于对与在线推荐模型对应的训练样本进行处理,得到与多个特征维度数据中的每个特征维度数据对应的一个或多个替换特征维度数据。

根据本公开的实施例,上述数据推荐装置600还可以包括生成模块。

生成模块,用于在检测到第一预测推荐结果满足预设条件的情况下,生成针对异常推荐的请求,其中,预设条件包括以下之一:预测推荐结果大于或等于第一阈值。第一预测推荐结果小于或等于第二阈值,其中第二阈值小于或等于第一阈值。第一预测推荐结果与历史推荐结果之间的第一差值大于或等于第一差值阈值。

根据本公开的实施例,生成模块可以包括生成子模块。

生成子模块,用于在检测到第一预测推荐结果满足预设条件的情况下,在预设时间段内生成针对异常推荐的请求。

根据本公开的实施例,请求还包括在线模型版本标识。

获得模块630可以包括获得子模块。

获得子模块,用于利用与在线模型版本标识对应的在线推荐模型分别处理多个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果。

根据本公开的实施例,利用在线推荐模型分别处理多个替换特征数据中的每个替换特征数据,得到与每个替换特征数据对应的第二预测推荐结果是通过多线程实现的。

根据本公开的实施例,第二确定模块640可以包括第二确定子模块和第三确定子模块。

第二确定子模块,用于根据与每个替换特征维度数据集所包括的每个替换特征数据对应的第二预测推荐结果,确定与每个替换特征数据集对应的第三预测推荐结果,其中,每个特征维度数据对应一个替换特征维度数据集。

第三确定子模块,用于根据第一预测推荐结果和每个第三预测推荐结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,第二确定子模块可以包括第一确定单元和第二确定单元。

第一确定单元,用于确定平均值,其中,平均值是与每个替换特征数据集所包括的各个替换特征数据对应的预测推荐结果的平均值。

第二确定单元,用于将平均值确定为与每个替换特征数据集对应的第三预测推荐结果。

根据本公开的实施例,第三确定子模块可以包括第三确定单元和第四确定单元。

第三确定单元,用于确定第一预测推荐结果与每个第三预测推荐结果之间的第二差值。

第四确定单元,用于根据多个第二差值,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,第四确定单元可以包括第一确定子单元。

第一确定子单元,用于针对每个特征维度数据,在确定与特征维度数据对应的第二差值大于或等于第二差值阈值的情况下,将特征维度数据确定为被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,第四确定单元可以包括排序子单元和第二确定子单元。

排序子单元,用于对多个第二差值进行排序,得到排序结果。

第二确定子单元,用于根据排序结果,从多个特征维度数据中确定被认为导致异常推荐的目标特征维度数据。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。

根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。

根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。

图7示出了根据本公开实施例的可以适用于数据推荐方法的电子设备700的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如数据推荐方法。例如,在一些实施例中,数据推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的数据推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行XXX方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 数据推荐方法、数据推荐装置、电子设备及可读存储介质
  • 数据处理、推荐方法及装置、电子设备和可读存储介质
技术分类

06120113283257