掌桥专利:专业的专利平台
掌桥专利
首页

内容处理系统、方法、装置、设备及介质

文献发布时间:2023-06-19 11:02:01


内容处理系统、方法、装置、设备及介质

技术领域

本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供一种内容处理系统、方法、装置、设备及介质。

背景技术

随着计算机技术的不断发展,逐渐出现了各种内容处理平台,这些内容处理平台可以为用户提供相应的内容服务,例如为用户推荐文章、为用户推荐视频等。

目前,大多内容处理平台是会借助模型实现内容服务处理任务。在使用模型之前,大多需要对模型进行离线训练,即提前根据相应的样本数据训练模型,获得已训练的模型之后,直接将已训练的模型应用于内容处理平台,以实现内容服务处理任务。但这种方式无法保证在模型训练阶段所使用的样本数据和模型使用阶段中所使用的输入数据具有相同的处理逻辑,进而导致模型的使用效果不佳,降低了模型输出的内容处理结果的准确性。

发明内容

本申请实施例提供一种内容处理系统、方法、装置、设备及介质,用于提高内容处理结果的准确性。

一方面,本申请一实施例提供了一种内容处理系统,包括计算层、存储层和服务层,其中:

所述计算层,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;

所述存储层,用于存储所述各种物料和所述各种特征;

所述服务层,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。

一方面,本申请一实施例提供了一种内容处理方法,包括:

对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;

存储所述各种物料和所述各种特征;

根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。

在一种可能的实施例中,所述根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,包括:

从预存的配置信息中,确定与每一内容服务任务对应的特征种类,其中,所述配置信息包括每一内容服务任务所需的特征种类;

根据每一内容服务任务对应的特征种类,获取对应的目标实时特征。

在一种可能的实施例中,所述配置信息还包括每一内容服务任务所需的物料的种类;所述根据每一内容服务任务对应的特征种类,获取对应的目标实时特征,包括:

根据每一内容服务任务对应的特征种类,从所述各种特征中获取对应的目标实时特征;

若确定所述各种特征中不存在与每一内容处理任务对应的实时特征,则根据每一内容服务任务所需的物料的种类,从所述存储层中获取对应的目标物料;

对所述目标物料进行特征工程处理,获得目标实时特征。

在一种可能的实施例中,所述对所述目标物料进行特征工程处理,获得目标实时特征之后,所述方法还包括:存储所述目标实时特征。

在一种可能的实施例中,所述对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,包括:

调用与所述内容数据和用户数据中每种数据对应的物料计算包,对相应的数据进行物料抽取,获得各种物料;

所述对所述各种物料分别进行相应的特征工程处理,获得各种特征,包括:

调用与所述各种物料中每种物料对应的特征算子包,对相应的物料进行特征工程处理,获得各种特征。

在一种可能的实施例中,所述调用与所述内容数据和用户数据中每种数据对应的物料计算包,对相应的数据进行物料抽取,获得各种物料,包括:

根据所述内容数据对应的物料计算包,对所述内容数据进行物料抽取,获得内容物料;以及,根据所述用户数据对应的物料计算包,对所述用户数据进行物料抽取,获得用户物料;

所述调用与所述各种物料中每种物料对应的特征算子包,对相应的物料进行特征工程处理,获得各种特征,包括:

根据所述内容物料对应的特征算子包,对所述内容物料进行特征工程处理,获得内容特征;以及,根据所述用户物料对应的特征算子包,对所述用户物料进行特征工程处理,获得用户特征。

在一种可能的实施例中,所述方法还包括:

从消息队列中获取更新后的物料计算包,并加载所述更新后的物料计算包;

从消息队列中获取更新后的特征算子包,并加载所述更新后的特征算子包。

在一种可能的实施例中,所述方法还包括:

从预存的已训练的至少一种模型中,确定处理每一内容处理任务所需的目标模型。

在一种可能的实施例中,所述方法还包括:将所述各种特征中的各种样本特征加入消息队列,以使训练设备执行如下操作:

获取所述各种样本特征,并根据训练至少一种模型中每种模型所需的特征种类,获取相应的样本特征,以及根据获取的样本特征,对相应的模型进行训练,获得已训练的至少一种模型;

从所述训练设备获得所述已训练的至少一种模型。

一方面,本申请一实施例提供了一种内容处理装置,包括:

物料处理模块,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料;

特征处理模块,用于对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;

存储模块,用于存储所述各种物料和所述各种特征;

内容处理模块,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。

一方面,本申请一实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一种方法的步骤。

一方面,本申请一实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法的步骤。

一方面,本申请一实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现上述任一种方法的步骤。

本申请实施例中的内容处理系统、方法、装置、设备及介质,通过对内容数据以及用户数据分别进行物料抽取,获得各种物料,并对各种物料进行处理获得各种特征,在模型的训练阶段,使用各种特征中的样本特征进行训练,在使用模型的阶段,使用各种特征中的实时特征输入模型,以获得内容处理结果,如此一来,保证了模型使用和训练阶段中的数据处理逻辑的一致性,提升模型的使用效果,进而提高内容处理结果的准确性。且,该内容处理系统可以对内容处理过程中产生的各种物料以及各种特征进行分类存储,以便于后续或其它组件使用这些物料以及特征。且,部署一内容处理系统,可以实现多种内容处理服务,降低系统部署的成本。且,可以随时对物料处理逻辑以及特征处理逻辑等进行更新,提高了整个内容处理系统的灵活性。

附图说明

通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:

图1为本申请实施例提供的内容处理方法的应用场景示意图;

图2为本申请实施例提供的内容处理系统的结构示意图一;

图3为本申请实施例提供的内容处理系统的结构示例图二;

图4为本申请实施例提供的样本特征的获取过程示例图;

图5为本申请实施例提供的内容处理方法的流程示意图;

图6为本申请实施例提供的内容处理装置的结构示意图;

图7为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道,本申请的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。

为了方便理解,下面对本申请实施例中涉及的名词进行解释:

1、人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

2、机器学习:是人工智能领域的一个分支,是关注于从数据中自动分析获得规律,并利用规律对未知数据进行预测的方法。

3、深度学习模型:机器学习常用到的一类人工智能模型,常用的深度学习模型包括:卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(RecurrentNeural Network,RNN)、长短期记忆网络(Long Short-Term Memory,LSTM)、深度神经网络(Deep Neural Network,DNN)、深度置信网(Deep Belief Nets,DBNs)等神经网络。数据在神经网络中的传播有两种方式,一种是沿着输入到输出的路径,被称为前向传播(Forwardpropagation),另一种是从输出返回到输入,被称为反向传播(Backpropagation)。在正向传播过程中,输入信息通过神经网络逐层处理并传向输出层,通过损失函数描述输出值与期望之间的误差,转入反向传播,逐层求出损失函数对各神经元的权重的偏导数,构成损失函数对权值向量的权重梯度数据,作为更新权重参数的依据,在不断更新权重参数的过程中完成神经网络的训练。

4、内容:包括但不限于视频或图文内容等,视频例如短视频,图文内容例如文章。

5、特征工程:通常待分析的数据中每条记录包含一个或多个属性信息,例如描述用户的年龄、性别等,其中可能存在部分属性信息(如数据类型为字符串的性别)不能直接应用于机器学习算法,需要经过转换成为数值特征,以及有时为了更准确地表征待分析数据,训练出更好的模型,特征本身也需要经过一定的转换和/或组合成为新的特征,这个过程称为特征工程。

6、物料:是指用于进行特征工程时的原始输入数据。在本申请实施例中物料按照数据描述的对象可以分为用户物料和内容物料,用户物料是与用户相关的数据,例如用户静态属性数据、用户历史行为数据和用户实时行为数据等。而内容物料是内容相关的数据,例如系统曝光的内容和用户操作过的内容等。对物料进行特征工程处理后,获得特征。根据产生特征的时间段不同,可以将特征划分为实时特征与样本特征,样本特征用于训练或更新模型,而实时特征作为模型的输入,以获得当前的内容处理结果。

7、Kafka:一种分布式消息队列系统,是构造跨越多个机器的分布式计算服务的核心模块。

8、Redis:一种分布式的基于内存的键值存储系统,相当于分布式字典,可以用于快速的数据查询。

9、用户画像:又可以称为人物画像,用于描述各类用户数据的变量集合。个性化推荐、广告系统、内容推荐等都是可以基于用户画像实施的应用。当想要选择某部分用户群体做精细化运营时,可以利用用户画像筛选出特定的群体。用户画像具体可以与用户的基本属性、用户的实时行为和历史行为等各方面因素相关。基本属性例如包括用户的年龄、性别等,用户的实时行为和历史行为例如包括用户对文章进行的点击操作、转发操作等。

10、物料计算包:描述对数据进行计算的方式,一个物料计算包可以包括一个或多个计算逻辑,每个计算逻辑可以用于对相应的数据进行处理,以获得相应的物料,或者计算物料的中间结果等。

11、特征算子包:描述对物料进行计算的方式,一个特征算子包括可以包括一个或多个算子,每个算子可以用于对相应的物料进行处理,以获得相应的特征,或者计算特征的中间结果等。

12、Maven工具:是一个软件项目管理及自动构建工具,可以对Java项目进行构建、依赖管理。Maven工具也可被用于构建和管理各种项目,例如C#,Ruby,Scala和其他语言编写的项目。

如前文论述的内容,内容处理平台使用的模型需要依托于大量的样本数据进行训练才能进行使用。在相关技术中通常是提前收集大量样本数据,根据样本数据训练模型,再通过内容处理平台通过收集实时数据,将实时数据输入模型,以获得内容处理结果。但相关技术中无法保证样本数据与实时数据的处理逻辑的一致性,进而影响模型的使用效果,降低模型输出的内容处理结果的准确性。另外,在相关技术中,收集样本数据与实时数据通常相隔时间较长,即样本数据与实时数据之间的时间差较长,容易导致特征穿越,也会影响模型的使用效果。

有鉴于此,本申请实施例提供一种内容服务处理系统,该系统中将服务、计算和存储进行分层,计算层用于对内容数据以及用户数据进行物料抽取,获得各种物料,并对各种物料分别进行相应的特征工程处理,以获得各种特征,存储层用于存储各种物料和各种特征,而服务层具体用于借助模型,获得内容处理结果,服务层所使用的模型,在其训练阶段,采用各种特征中的样本特征进行训练,在服务层模型使用阶段,是将各种特征中的实时特征输入模型,以获得模型输出的内容处理结果,如此一来,保证了样本特征与实时特征均采用了相同的处理逻辑,从而保证线上和线下的数据处理逻辑的一致性,提升模型的使用效果,进而提高了内容处理结果的准确性。

在介绍了本申请的基本原理之后,下面具体介绍本申请的各种非限制性实施方式。

参考图1,为本申请实施例提供的内容处理方法的应用场景示意图。在图1所示的应用场景中包括终端设备110和第一服务器120。其中,终端设备110和第一服务器120之间可通过无线通信网络或有线通信网络连接,终端设备110包括但不限于桌面计算机、移动电话、移动电脑、平板电脑、媒体播放器、智能可穿戴设备、智能电视、车载设备、个人数字助理(personal digital assistant,PDA)等电子设备。第一服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

第一服务器120用于提供内容服务,例如可以是内容发布、内容推荐等服务。终端设备110中安装有客户端,用户可通过客户端获取第一服务器120提供的内容服务,或者用户也可以通过终端设备110内的浏览器访问内容网站,以获取第一服务器120提供的内容服务。例如,任一用户可通过客户端向内容平台对应的第一服务器120上传内容,以通过内容平台发布创作的内容,这样其他用户可观看到该用户发布的内容。

第一服务器120对用户上传的内容进行分析和识别,并基于内容分析识别结果确定出相关内容,第一服务器120基于其他用户的历史查看内容,确定历史查看内容对应的相关内容,并从获得的相关内容中确定出推荐给用户的内容,并将这些内容发送到用户的终端设备。

在一种可能的应用场景中,该应用场景中还可以包括第二服务器130,第二服务器130用于从第一服务器120获得相应的样本数据,并训练模型,获得已训练的模型,进而将已训练的模型发送给第一服务器120,使得第一服务器120能够根据该已训练的模型,实现前文相应的内容服务。第二服务器130的具体实现形式可以参照前文论述的第一服务器120的实现形式,此处不再赘述。

下面结合图1的应用场景,来描述根据本申请示例性实施方式的内容处理方法。需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。

参考图2,为本申请实施例提供的一种内容处理系统的结构示意图,该内容处理系统包括服务层210、计算层220和存储层230。该内容处理系统具体例如可以搭建在图1中的第一服务器120中,第一服务器120的具体实现可以参照前文论述内容,此处不再赘述。

其中,计算层220用于对获得的内容数据和用户数据分别进行物料抽取,获得各种物料,以及对各种物料分别进行相应的特征工程处理,获得各种特征。

本申请实施例中的计算层220可以通过抽取共有的逻辑,对不同时间段的原始数据进行处理,得到物料,以及对物料进行处理,从而保证实时模型推理和后台训练物料、特征处理的一致性。

计算层220具体可以将物料处理涉及的共有逻辑处理成物料计算包,将特征处理共有逻辑处理成特征算子包,通过物料计算包对数据进行处理,通过特征算子包对物料进行特征工程处理,即可以保证处理逻辑的一致性,后续如果改变处理逻辑,只需变更相应的物料计算包或特征算子包即可,降低因代码改动的难度,以及避免因改动代码造成的处理过程不一致的情况。

具体而言,物料获取过程包括获取数据,数据具体包括用户属性、内容数据、用户实时行为数据以及用户的历史行为数据等,对数据进行物料抽取处理,以获得物料。其中计算层220可以从Hadoop FLINK订阅用户在客户端上的行为日志流,以获得用户实时行为数据。具体计算层220可以调用物料计算包,以实现对这些数据进行物料抽取处理,从而获得物料。为了提高处理效率,计算层220可以将物料抽取逻辑封装成物料计算包,将物料计算包存储在物料计算库222中,计算层220在抽取物料时,从物料计算库222调用相应的物料计算包即可。

例如,计算层220通过Hadoop FLINK订阅用户在客户端上的行为日志流,行为日志流包括用户实时行为日志,用户实时行为包括用户点击行为、反馈行为(例如收藏、跟帖、点赞、分享、不喜欢等操作行为)、登录行为和刷新行为等。计算层220对日志流进行解析获取用户标识,通过用户标识获取用户静态信息,对用户各个属性填充,包括性别、年龄、平台、网络等基础信息,计算层220可以根据当前时间段之前的日志流获取用户的历史行为数据。计算层220在获得各种数据之后,可以将各种数据封装成结构体,以获得物料数据。需要说明的是,日志流中包含了用户的各种行为数据,而当前时间段的日志流提取出的行为数据可以视为实时行为数据,根据当前时间段之前的日志流提取出的行为数据可以视为历史行为数据。

特征处理主要包括对物料进行特征工程处理,以获得特征。同理,计算层220可以调用特征算子包,对物料进行特征工程处理,以获得特征。其中,一个特征算子包包括一个或多个算子,不同的算子可以用于对不同的物料或者相同的物料分别进行处理,以获得相应的特征。

例如定义特征B=op1(A),或者B=op2(A,C)。这里op1和op2分别表示不同的算子,op1和op2可以属于一个特征算子包,算子可以理解为对物料进行处理的一种方式,例如求特征最大值max、特征最小值min、特征交叉cross等操作,这里不做限定。A和C表示原始输入,算子op1对A进行处理之后,获得特征B,算子op2对A和C进行处理之后,获得特征B。

例如,开发人员使用maven工具将相应的一个或多个特征算子编译成jar包,并存储到特征算子库221中,计算层220需要使用时,直接从特征算子库221中调用即可。特征算子库221例如可以为maven仓库。

作为一种实施例,物料的形式可以是矩阵或者序列等,特征的形式可以是矩阵、向量或单个数值等,具体不做限定。

在本申请实施例中,将用于计算物料的物料计算包均存储在物料计算库222中,以及将用于计算特征的特征算子包均存储至特征算子库221中,使得线上所使用的数据和离线所使用的数据对应的计算逻辑均分别依赖于特征算子库221和物料计算库222,以保证数据处理逻辑的一致性,进而保证在线上推荐引擎、特征仓库更新、离线训练样本特征构造中均使用相同的处理逻辑,保证数据计算逻辑的一致性。

作为一种实施例,针对不同的物料,其涉及的物料计算包可能是不同的,因此计算层220需要根据当前所需的物料种类,进而确定需要调用的物料计算包。而对于同一种物料,对应采用的物料计算包是相同的,进而保证该物料处理过程的一致性。同理,针对不同物料处理涉及的特征算子包可能是不同的,但是针对不同时间段的同一种物料处理所对应的特征算子包是相同的,从而满足了处理不同物料的需求,以及保证了同种特征的处理逻辑的一致性。

例如,计算层220可以根据日志流中的实时数据,获得用户数据和内容数据,调用相应的物料计算包,对内容数据进行物料抽取,获得内容物料,以及调用相应的物料计算包,对用户数据进行物料抽取,获得用户物料。计算层220可以调用特征算子包对用户物料进行特征工程处理,获得用户特征,以及可以调用相应的特征算子包对内容物料进行处理,获得内容特征。

作为一种实施例,计算层220计算各种物料和各种特征中涉及的计算逻辑可以通过hadoop、Hadoop flink和hive等平台实现。

作为一种实施例,计算层220除了获得内容特征和用户特征之外,还可以获得基础特征。

具体地,计算层220可以是对用户物料和内容物料进行抽取获得基础物料,进而对基础物料进行特征工程处理,获得基础特征。其中,基础物料可以是抽取用户物料中的部分物料与内容物料中的部分物料组合生成的,基础特征可以是向量形式的。

作为一种实施例,用户特征、物料特征以及基础特征是根据特征描述的对象进行划分的,在本申请实施例中还可以将各种特征按照时间划分为实时特征和样本特征,根据当前时间段内的物料生成的特征则视为实时特征,根据当前时间段之前的物料生成的特征则视为样本特征。当前时间段的取值可以是根据需求进行设置的。实时特征与样本特征均分别包括用户特征、物料特征以及基础特征等。应当说明的是,实时特征和样本特征是相对概念,例如实时特征经过一段时间之后,可以更新为样本特征。

对应地,计算层220包括离线计算框架223和在线计算框架224,离线计算框架223可以用于获取计算样本特征所需的物料,以及还可以用于计算训练模型时所需的样本特征等,在线计算框架224可以用于获取计算实时特征所需的物料,以及还用于计算使用模型时所需的实时特征。

在具体实施时,离线计算框架223可以从物料计算库222中调用物料计算包,从而获得计算样本特征所需的物料,还可以从特征算子库221中调用特征算子包,从而计算相应的样本特征。同理,在线计算框架224可以从物料计算库222中调用物料计算包,从而计算实时特征所需的物料,还可以从特征算子库221中调用特征算子包,从而计算相应的实时特征。

其中,存储层230用于从计算层220获取各种物料和各种特征,并将各种物料和各种特征进行存储。

在具体实施时,为了便于查找,存储层230可以将各种物料与各种特征分类存储,各种物料存储至物料仓库,将各种特征存储至特征仓库。

参照图2所示,物料仓库可以具体划分为用于存储用户物料的用户物料仓库231、用于存储内容物料的内容物料仓库233和用于存储基础物料的基础物料仓库235等。特征仓库也可以具体划分为用于存储用户特征的用户特征仓库232、用于存储内容特征的内容特征仓库234和用于存储基础特征的基础特征仓库236等。其中,存储层230可以使用hive、redis、myrocks和hdfs等平台实现。

其中,服务层210用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将目标实时特征输入已训练的目标模型,获得内容处理结果,其中,已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。

服务层210具体可以包括多个服务,不同的服务用于处理不同的内容处理任务,例如服务层210可以包括用户服务211、内容服务212、基础服务213和日志服务214等。本申请实施例中的内容处理系统的服务层210可以基于spring boot实现,并通过dubbo对推荐引擎提供统一调用接口。推荐引擎可以基于该dubbo接口调用服务层210的相应服务。

其中,用户服务211可以用于对用户物料和用户特征进行管理,包括获取和监控管理。用户服务211可以用于封装对物料和特征的获取接口。用户服务211同时提供对外监控功能,便于开发人员观测物料、特征分布,包括各种操作行为次数的最小值、最大点击量、均值和覆盖率等。例如用户服务可以调用存储层230中的用户物料或用户特征返回,进一步还可以设定时长,如果超过预设时长,则确定获取失败。

内容服务212实现与用户服务不同。内容服务212涉及内容物料、内容特征更新和获取。内容服务212也对外提供监控功能,包括内容的分布、内容最大点击量、内容最小点击量、覆盖率等。例如当内容为文档时,内容服务212可以通过订阅kafka topic获取当前流量下的文档标识(ID),对每一个文档id从存储装置中获取相应的特征,并写入存储层230中。内容服务212对外提供获取接口,当接收请求时根据结果依次从存储层230获取相应的物料以及特征等。如图3所示,内容服务212可以将没有获取到物料的内容标识发送到kafka消息队列,计算层220可以针对该内容标识进行特征更新,并写入存储层230中。

基础服务213用于基础物料和基础特征的更新和获取等,基础服务213也对外提供监控功能。另外,日志服务214可以用于将离线需要的物料进行持久化存储等,以及还可以用于将产生的日志流写入消息队列,以便于计算层220获取相应的数据等。

在具体实施时,服务层210可以接收客户端发送的内容处理请求,以确定相应的内容处理任务。服务层210调用相应的实时特征,将实时特征输入相应的已训练的模型,获得内容处理结果。

作为一种实施例,服务层210涉及的处理逻辑可以通过hadoop、Hadoop flink和hive等平台实现。

下面结合图3,对本申请实施例中的内容处理系统处理内容处理任务的过程进行示例介绍。

作为一种实施例,如图3所示,该内容处理系统还可以包括推荐引擎380,推荐引擎380用于直接响应于用户的请求,当接收到用户发出相应请求时,推荐引擎可以向服务层210发送相应的请求,服务层210可以根据推荐引擎380发送的请求,从而确定相应的内容处理任务。

对于实时内容处理任务来说,服务层210在确定内容处理任务之后,可以确定处理该内容处理任务所需的特征种类,从而获得目标实时特征。例如服务层210可以从配置信息中,确定处理该实时内容处理任务所需的特征种类,该配置信息包括处理各个内容处理任务所需的特征,该配置信息还可以包括处理各个内容处理任务所需的目标物料,该配置信息还可以包括处理各个内容处理任务所需特征对应的物料计算包和特征算子包。该配置信息可以直接存储在服务层210中,或者如图3所示,该内容处理系统还可以包括配置中心310,配置信息可以存储在内容处理系统中的配置中心310。

服务层210在确定所需特征种类之后,可以从存储层230获取相应的实时特征作为目标实时特征。如图3所示,服务层210具体可以从特征redis中获取相应的目标实时特征。

但有些情况下,计算层220有可能没有及时地处理物料,导致存储层230没有相应的实时特征,那么服务层210可以通过计算层220的在线计算框架224调用该实时内容处理任务需要的物料计算包,先对相应的数据进行物料处理,获得与该内容处理任务对应的目标物料,并进一步通过计算层220的在线计算框架224调用需要的特征算子包,对相应的物料进行处理,获得目标实时特征。

进一步地,服务层210还可以通过在线计算框架224指示计算层220将获得的目标实时特征和对应的目标物料发送给存储层230,以便于存储层230能够存储该目标实时特征和目标物料。如图3所示,可以将实时特征写入存储层230中的特征redis,将目标物料写入物料redis中。

作为一种实施例,如图3所示,服务层210还可以包括点击率预测(Predict Click-Through Rate,PCTR)服务215,PCTR服务215用于预测用户可能点击的广告等内容。在一个实施例中,PCTR服务215与服务层的其它服务联合进行推荐的广告等内容的展示。

作为一种实施例,如图3所示,该内容处理系统还可以包括监控中心330,该监控中心330可以实时监控内容处理系统部分的各个部分,以避免内容处理系统异常。

为了提高计算层220的处理效率,请参照图3所示的内容处理系统的结构示意图,该计算层220可以具体包括特征任务(361,363)和物料任务362。这里的任务可以理解为服务层210用于调用在线计算框架224或离线计算框架223,以实现某个服务所需的任务组件。

其中,特征任务(361,363)用于获得各种特征,继续如图3所示,该特征任务(361,363)可以包括样本特征任务361和实时特征任务363,样本特征任务361具体用于获得样本特征,实时特征任务363具体用于获得实时特征。物料任务362用于获得各种物料。其中,具体获得各种特征、各种物料的方式可以参照前文论述的内容,此处不再赘述。

在具体实施时,物料任务362可以调用相应物料计算包,对数据进行处理,获得相应的物料。同理,特征任务可以调用相应特征算子包,对物料进行处理,获得相应的特征,例如样本特征任务361可以调用相应的特征算子包,对物料进行处理,获得样本特征,实时特征任务363可以调用相应的特征算子包,对物料进行处理,获得实时特征。

在实际实施时,在线计算框架224和离线计算框架223基于样本特征任务、实时特征任务和物料任务分开处理相关任务,从而提高计算层220的并发程度,提升内容处理系统的效率。

作为一种实施例,继续参照图3,计算层220可以从Hadoop flink 340获取相应的数据,以对数据进行处理,从而获得各种物料以及各种特征等。

作为一种实施例,计算层220还可以对各种物料以及各种特征进行更新。各种物料的更新频率可以是不同的,各种特征的更新频率也可以是不同的。

下面以内容物料为文档物料为例,对物料更新以及特征更新进行示例介绍:

文档物料包括文档的静态信息、文档对应的动态信息,例如在信息流推荐场景,文档物料也可以有不同的更新频率,动态点击情况是秒级,静态属性是天级别更新等。在对文档物料进行更新之后,计算层220对更新后的文档物料进行处理,从而获得更新后的文档特征,从而实现对文档特征的更新。

作为一种实施例,用户物料也可以有具有不同的更新时间周期,有天级别、小时级别、分钟级别等粒度。例如静态属性是天级别更新,用户行为是小时级更新,动态物料按照刷新数和会话(session)控制有分钟级和小时级更新频率,同理对用户物料更新之后,也可以根据更新后的用户物料,计算对应的用户特征,实现对用户特征的更新。

作为一种实施例,可以按照相同更新频率,对用户物料以及文档物料进行更新,以便于根据更新后的文档物料和用户物料,进而获得基础物料,进一步根据基础物料,以获得基础特征,实现基础特征的更新。

进一步地,由于特征种类较多,为了便于后续处理和查找,还可以根据不同的更新频率存储各个特征,具体例如将各个特征区分为静态特征、小时级特征和实时特征。

除了更新各种特征之外,计算层220还可以对特征算子包和物料计算包进行更新,从而实现对处理物料和特征的计算逻辑进行更新。

计算层220可以获取更新后的特征算子包,存储更新后的特征算子包,具体可以将更新后的特征算子包写入特征算子库221中。计算层220还可以获取更新后的物料计算包,存储更新后的物料计算包,将更新后的物料计算包写入物料计算库222中。计算层220具体可以从消息队列中获取更新后的特征算子包与物料计算包,消息队列中更新后的特征算子包可以是开发者发布的。

例如,开发人员可以将更新后的物料计算包使用maven工具编译成jar包,进而将编译后的jar包发布到消息队列,从而使得计算层220可以将获取到的jar包存储到物料计算库222中,物料计算库222例如可以通过maven仓库实现。计算层220可以解析该jar包,从而获得更新后的物料计算包。

同理,开发人员可以将更新后的特征算子包使用maven工具编译成jar包,进而将编译后的jar包发布到消息队列,从而使得计算层220可以将获取到的jar包存储到特征算子库221中,特征算子库221例如可以通过maven仓库实现。计算层220可以解析该jar包,从而获得更新后的特征算子包。

为了便于更新特征算子包,计算层220可以获取特征配置文件,解析特征配置文件,从而获得更新后的特征算子包,以实现对特征算子包的更新。其中,该特征配置文件用于描述特征生成方式。同理,计算层220可以获取物料配置文件,解析物料配置文件,从而获得更新后的物料计算包,以实现对物料计算包的更新。其中,物料配置文件用于描述物料的生成方式,具体可以是描述更新后的物料计算包。

特征配置文件和物料配置文件可以是根据算法开发人员的需求进行配置生成的。特征配置文件描述了指定输入物料和参数、特征算子包和指定输出特征。物料配置文件描述了指定输入数据和参数、物料计算包和指定输出物料等。计算层220可以将特征配置文件和物料配置文件以关系型数据库形式进行存储和管理,后续可以通过更新或新增特征配置文件,以增加生成特征的灵活性,也可以通过更新或新增物料配置文件,以增加生成物料的灵活性,这样在保证线上使用的数据与线下使用的数据涉及的处理逻辑一致性的基础上,还能很大程度上增大灵活性,提升算法开发人员的特征工程迭代效率。

例如,计算层220可以从消息队列获取更新后的特征配置文件,并根据特征配置文件,加载特征算子jar包,执行特征工程计算,以生成特征,并将特征以键值形式存储至存储层230中的特征仓库中,例如按照“环境:特征配置名:用户id:特征”格式组合成键(key),完成对特征的更新。

作为一种实施例,继续参照图3,计算层220中的样本特征任务在处理获得样本特征之后,可以将样本特征写入存储层230中的hdfs 371;计算层220中的实时特征任务在获得实时特征之后,可以将实时特征写入存储层230中的特征redis 372,以供服务层210使用等;计算层220中的物料任务在获得各种物料之后,可以将各种物料写入存储层230中的物料redis 373。图3只是对存储层230的具体实现方式进行示例,实际上并不限于此。

服务层210获得目标实时特征之后,可以将目标实时特征输入已训练的目标模型中,获得已训练的目标模型的输出,从而获得内容处理结果。这其中涉及到服务层210具体如何获得目标模型,下面进行示例介绍:

服务层210可以是根据各种特征中的样本特征进行训练,从而获得已训练的模型。或者,服务层210可以从训练设备获得已训练的模型,训练设备例如可以通过前文中的第二服务器130实现。当服务层210从训练设备获得已训练的模型时,涉及到训练设备如何获取样本特征,下面进行示例介绍:

计算层220在获得各种特征和各种物料之后,可以将各种特征中的样本特征加入消息队列,以便于训练设备可以从消息队列中获得样本特征,进而对相应的模型进行训练。

下面结合图4所示的样本特征的获取过程示例图,对获取样本特征的过程进行介绍:

计算层220对曝光日志和点击日志进行日志联合,并从联合后的日志中获取相应的用户数据和内容数据,将这些用户数据和内容数据写入redis缓存中,进而根据这些数据,获得相应的各种特征。

为了便于训练设备使用,不同种类的样本特征会具有相应的标签,在计算层220将样本特征加入消息队列时,可以一并将样本特征的标签加入该消息队列,消息队列例如可以是如图3所示的kafka消息队列350,这样便于后续训练设备根据标签筛选自身所需的样本特征。其中,标签例如根据用户的不同行为设置的,也就是说,用户的不同行为对应设置一种标签,具体例如点击、点赞、收藏、跟帖、转发、分享等标签。另外,还可以以用户针对内容进行不同行为所产生的不同结果设置相应的标签,例如点击时长、访问时长、收藏数量、转发数量和分享次数等。

由于样本特征的数据量较大,因此在本申请实施例中,计算层220可以对样本特征进行过滤,以控制样本特征的数据量。

例如,配置中心310存储有各种模型对应的样本数据过滤规则,计算层220可以调用相应的过滤规则,对样本特征进行过滤,例如根据用户ID的哈希值筛选相应的样本特征,或者根据一种或多种标签进行过滤,获得相应的样本特征。

进一步地,计算层220还可以对样本特征进行采样,获得更具有代表性的样本特征。样本特征采样与过滤不同,采样样本特征可以突出业务需求,计算层220可以根据多种采样逻辑进行采样,例如正样本采样、文章类型采样和用户活跃度采样等。

在计算层220获得样本特征之后,可以根据相应的需求生成对应格式的数据,将样本特征发送至消息队列,从而使得训练设备可以获取样本特征,并根据样本特征进行模型训练。训练设备在后续获得样本特征之后,可以使用在线优化算法(Follow TheRegularized Leader,FTRL)对模型进行更新。

同理,在训练设备获得已训练的模型之后,可以将已训练的模型写入消息队列中,以便于服务层210可以从消息队列中获得已训练的模型。消息队列例如是kafka消息队列等。

进一步地,服务层210获得的已训练的模型可能有多个,不同的模型可能适用于对不同的内容处理任务进行处理,因此服务层210在获得多个已训练的模型之后,可以从多个已训练的模型中确定出处理当前的内容处理任务所需的模型作为目标模型。具体每个内容处理任务与模型之间的对应关系可以存储在配置中心310,或者可以存储在服务层210中。

本申请实施例中的内容处理系统能够将服务、存储、计算进行剥离,设计了一种合理的架构,具体提出一种基于服务、计算、存储分离的内容处理系统架构,该内容处理系统能够将特征运算与线上实时服务进行拆分,并保持模型训练过程和在线使用过程中的计算逻辑的统一,还提供了特征算子包和物料计算包等以保证物料处理过程中的统一性,避免特征穿越等机器学习问题,提升了利用模型处理内容服务的准确性。

且,模型训练和模型使用过程均依赖原始数据,具体包括用户在客户端内一段时间产生的历史行为数据、用户各个维度画像、用户在客户端内实时外部信息数据、文档在客户端内动态信息等。而本申请实施例中的内容处理系统可以对原始数据分别进行相应的物料抽取处理,从而满足不同过程中的数据需求,以提升系统的处理效率。进一步地,对物料进行特征工程处理涉及大量计算,以及涉及各种类型的变换处理,包括交叉、阈值划分、值域非线性变换等,而在多个应用场景下,有些计算过程是不变可共用的,因此本申请实施例中的内容处理系统可以抽取共有的计算逻辑形成特征算子包和物料计算包,减少了冗余计算,针对这些计算逻辑的优化,能够提升内容处理过程的效率,在业务开发中使用该内容处理系统,从而提高生产效率,促进算法迭代,提升业务处理效果。另外,还可以周期性或不定时地对物料或特征进行更新,以满足不同时间段的内容处理需求。

且,本申请实施例中还可以将计算、存储、服务进行拆分,提升各个部分的处理灵活性。另外,物料以及特征均可以根据算法开发人员的需求而新增、变更。能够生成多种物料以及多种特征,以满足不同模型的需求,进而可以满足不同内容处理任务的需求。

本申请实施例中的内容处理系统还可以支持动态测试,例如开发者可以随时通过该内容处理系统,以请求相应的内容服务,从而对内容处理系统进行整体测试,在另一个实施例中,开发者可以通过相应的接口访问内容处理系统中任意层相应的数据,并可以针对不同物料、不同的特征处理方式进行实验,进而提升问题排查效率,在实际应用中有很好的灵活性和高效性。

基于与内容处理系统相同的发明构思,本申请实施例提供一种内容处理方法,该内容处理方法可以应用于前文论述的内容处理系统,例如可以通过前文中的第一服务器执行。请参照图5所示的内容处理方法的流程图,该方法包括:

S501,对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对各种物料分别进行相应的特征工程处理,获得各种特征。

其中,各种特征均分别包括实时特征和样本特征,实时特征是根据当前时间段的物料生成的,样本特征是根据所述当前时间段之前的物料生成的。

S501可以由计算层执行,具体实施方式可以参照前文论述的内容,此处不再赘述。

S502,存储各种物料和各种特征。

S502可以由存储层执行,具体实施方式可以参照前文论述的内容,此处不再赘述。

S503,根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将目标实时特征输入已训练的目标模型,获得内容处理结果。

其中,已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。

S503可以是服务层实现的,具体实施方式可以参照前文论述的内容,此处不再赘述。

在上述任一实施方式的基础上,S501具体包括:根据内容数据对应的物料计算包,对内容数据进行物料抽取,获得内容物料;以及,根据用户数据对应的物料计算包,对用户数据进行物料抽取,获得用户物料;

根据内容物料对应的特征算子包,对内容物料进行特征工程处理,获得内容特征;以及,根据用户物料对应的特征算子包,对用户物料进行特征工程处理,获得用户特征。

进一步地,该内容处理方法还包括:从消息队列中获取更新后的物料计算包,并加载更新后的物料计算包,以及从消息队列中获取更新后的特征算子包,并加载更新后的特征算子包。

在上述任一实施方式的基础上,在执行S503之前,该内容处理方法还包括:从预存的已训练的至少一种模型中,确定处理每一内容处理任务所需的目标模型。

作为一种实施例,将各种特征中的样本特征加入消息队列,以使得训练设备可以获取各种样本特征,并根据训练至少一种训练中每种模型所需的特征种类,获得相应的样本特征,并根据获得的样本特征,对模型进行训练,获得已训练的至少一种模型,并从训练设备获得已训练的至少一种模型。

在上述任一实施方式的基础上,S503具体包括:从预存的配置信息中,确定与每一内容服务任务对应的特征种类,其中,配置信息包括每一内容服务任务所需的特征种类,以及根据每一内容服务任务对应的特征种类,获取对应的目标实时特征。

进一步地,配置信息还包括每一内容服务任务所需的物料的种类,S503具体包括:根据每一内容服务任务对应的特征种类,从存储层获取对应的目标实时特征;若确定存储层中不存在与每一内容处理任务对应的实时特征,则根据每一内容服务任务所需的物料的种类,从存储层中获取对应的目标物料;对目标物料进行特征工程处理,获得目标实时特征。

进一步地,当根据相应的目标物料实时计算得到目标实时特征时,该内容处理方法还包括存储该目标实时特征。

上述内容处理方法可在内容处理系统的基础上实现,其进一步的实施方式可参考内容处理系统的实施方式,不再赘述。

基于与上述内容处理方法相同的发明构思,本申请实施例还提供了一种内容处理装置,该内容处理装置可以用于实现前文论述的内容处理系统的功能,请参照图6,该内容处理装置包括:

计算处理模块601,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料;以及,对各种物料分别进行相应的特征工程处理,获得各种特征,其中,各种特征均分别包括实时特征和样本特征,实时特征是根据当前时间段的物料生成的,样本特征是根据当前时间段之前的物料生成的;

存储模块602,用于存储各种物料和各种特征;

内容处理模块603,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将目标实时特征输入已训练的目标模型,获得内容处理结果,其中,已训练的目标模型是根据与目标实时特征对应种类相同的目标样本特征进行训练得到的。

在一种可能的实施例中,内容处理模块603具体用于:

根据每一内容服务任务对应的特征种类,从存储层获取对应的目标实时特征;

若确定存储层中不存在与每一内容处理任务对应的实时特征,则根据每一内容服务任务所需的物料的种类,从存储层中获取对应的目标物料;

对目标物料进行特征工程处理,获得目标实时特征。

在一种可能的实施例中,存储模块602还用于:

从服务层获取目标实时特征,并存储目标实时特征。

在一种可能的实施例中,计算处理模块601具体用于:

调用与内容数据和用户数据中每种数据对应的物料计算包,对相应的数据进行物料抽取,获得各种物料;

调用与各种物料中每种物料对应的特征算子包,对相应的物料进行特征工程处理,获得各种特征。

在一种可能的实施例中,计算处理模块601具体用于:

根据内容数据对应的物料计算包,对内容数据进行物料抽取,获得内容物料;以及,根据用户数据对应的物料计算包,对用户数据进行物料抽取,获得用户物料;

根据内容物料对应的特征算子包,对内容物料进行特征工程处理,获得内容特征;以及,根据用户物料对应的特征算子包,对用户物料进行特征工程处理,获得用户特征。

在一种可能的实施例中,计算处理模块601还用于:

从消息队列中获取更新后的物料计算包,并加载更新后的物料计算包;

从消息队列中获取更新后的特征算子包,并加载更新后的特征算子包。

在一种可能的实施例中,内容处理模块603还用于:

从消息队列中获取更新后的物料计算包,并加载更新后的物料计算包;

从消息队列中获取更新后的特征算子包,并加载更新后的特征算子包。

在一种可能的实施例中,内容处理模块603还用于:

从预存的已训练的至少一种模型中,确定处理每一内容处理任务所需的目标模型。

在一种可能的实施例中,计算处理模块601还用于将各种特征中的各种样本特征加入消息队列,以使训练设备执行如下操作:

获取各种样本特征,并根据训练至少一种模型中每种模型所需的特征种类,获取相应的样本特征,以及根据获取的样本特征,对相应的模型进行训练,获得已训练的至少一种模型;

从训练设备获得已训练的至少一种模型。

作为一种实施例,计算处理模块601可以设置在前文论述的计算层中,存储模块602可以设置在前文论述的存储层中,内容处理模块603可以设置在前文论述的服务层中。

应当说明的是,图6所示的装置可以用于实现前文论述的任一的内容处理方法,此处不再赘述。

基于与上述内容处理方法相同的发明构思,本申请实施例还提供一种电子设备,该电子设备具体可以为单个物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器等。

如图7所示,该电子设备可以包括至少一个处理器701和至少一个存储器702。其中,存储器702存储有程序代码,当程序代码被处理器701执行时,使得处理器701执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的内容处理方法中的各种步骤。例如,处理器701可以执行如图5中所示的S501、对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对各种物料分别进行相应的特征工程处理,获得各种特征;S502、存储各种物料和各种特征;S503、根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将目标实时特征输入已训练的目标模型,获得内容处理结果。

处理器701可以是通用处理器,例如中央处理器(CPU)、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

存储器702作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器702还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。

作为一种实施例,图7中的电子设备可以实现前文论述的内容处理系统的功能,还可以用于实现前文论述的内容处理装置的功能。

本申请实施例提供了一种计算机可读存储介质,用于储存上述电子设备所用的计算机程序指令,其包含用于执行本申请任一示例性实施方式中的内容处理方法的程序。

上述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD)等。

在一些可能的实施方式中,本申请的各个方面还可以实现为一种计算机程序产品,其包括程序代码,当该计算机程序产品在服务器设备上运行时,该计算机程序产品用于使所述服务器设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的内容处理方法中的步骤,例如,服务器设备可以执行如图5中所示的S501、对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对各种物料分别进行相应的特征工程处理,获得各种特征;S502、存储各种物料和各种特征;S503、根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将目标实时特征输入已训练的目标模型,获得内容处理结果。

所述计算机程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

根据本申请的实施方式的用于内容处理方法的计算机程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在服务器设备上运行。然而,本申请的程序产品不限于此,在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本申请的精神和原理,但是应该理解,本申请并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本申请旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

相关技术
  • 内容处理系统、方法、装置、设备及介质
  • 回放设备、内容选择方法、内容分配系统、信息处理设备、内容传送方法、以及存储介质
技术分类

06120112774520