掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置及计算机可读存储介质

文献发布时间:2023-06-19 16:03:19



技术领域

本发明涉及数据处理领域,具体而言,涉及一种数据处理方法、装置及计算机可读存储介质。

背景技术

相关技术中,视图数据通常也可以称为视图特征数据,可以通过视图数据分析解决分类问题。例如,可以通过视图特征数据解决不同视觉特征类型下的分类问题,可以通过视图特征数据解决用户在不同行为特征类型下的分类问题,等等。相关技术中的基于视图特征数据进行分类的方法虽然能够解决分类问题,但相关技术中的基于视图特征数据进行分类的方法的鲁棒性差、扩展性差,且泛化性差。即,在相关技术中,存在对目标对象进行分类时,存在鲁棒性低的问题。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种数据处理方法、装置及计算机可读存储介质,以至少解决相关技术中对目标图像进行分类时,存在鲁棒性的技术问题。

根据本发明实施例的一个方面,提供了一种数据处理方法,包括:获取目标图像在第一数据源中的数据;基于所述第一数据源中的数据,提取所述目标图像的多个第一目标特征;分别基于所述多个第一目标特征,确定所述目标图像属于预定类型的多个第一初始概率;基于所述多个第一初始概率,确定所述目标图像属于所述预定类型的第一目标概率,并基于所述第一目标概率确定所述目标图像的分类结果。

可选地,所述基于所述第一目标概率确定所述目标图像的分类结果,包括:判断所述第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于所述第一目标概率确定所述目标图像的分类结果。

可选地,所述方法还包括:在判断结果为否的情况下,基于所述第一数据源中的数据,提取所述目标图像的其它特征,并基于所述其它特征确定所述目标图像属于所述预定类型的其它概率,其中,所述其它特征为基于所述第一数据源中的数据提取的特征中,除所述多个第一目标特征之外的特征;基于所述第一目标概率和所述其它概率,确定所述目标图像的分类结果。

可选地,所述基于所述第一目标概率和所述其它概率,确定所述目标图像的分类结果,包括:基于所述第一目标概率和所述其它概率,确定所述目标图像属于所述预定类型的融合概率;基于所述融合概率和预定概率阈值,确定所述目标图像的分类结果。

可选地,所述基于所述多个第一初始概率,确定所述目标图像属于所述预定类型的第一目标概率,包括:基于所述多个第一初始概率,采用贝叶斯法则以及所述多个第一初始概率间相互独立的条件,确定所述目标图像属于所述预定类型的第一目标概率。

可选地,所述方法还包括:在判断结果为否的情况下,获取所述目标图像属于所述预定类型的第二目标概率,其中,所述第二目标概率为基于所述目标图像在第二数据源中的数据获得的概率,所述第二数据源为与所述第一数据源不同的数据源;基于所述第一目标概率和所述第二目标概率,确定所述目标图像的分类结果。

可选地,所述基于所述第一目标概率确定所述目标图像的分类结果,包括:在所述预定类型为多个不同的类型的情况下,对所述多个不同的类型分别对应的第一目标概率进行比较;确定所述多个不同的类型分别对应的第一目标概率中最大概率对应的类型为所述目标图像所属的类型。

根据本发明实施例的一个方面,还提供了一种数据处理方法,包括:获取目标对象在第一数据源中的数据;基于所述第一数据源中的数据,提取所述目标对象的多个第一目标特征;分别基于所述多个第一目标特征,确定所述目标对象属于预定类型的多个第一初始概率;基于所述多个第一初始概率,确定所述目标对象属于所述预定类型的第一目标概率,并基于所述第一目标概率确定所述目标对象的分类结果。

可选地,所述基于所述第一目标概率确定所述目标对象的分类结果,包括:判断所述第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于所述第一目标概率确定所述目标对象的分类结果;在判断结果为否的情况下,基于所述第一数据源中的数据,提取所述目标对象的其它特征,并基于所述其它特征确定所述目标对象属于所述预定类型的其它概率,其中,所述其它特征为基于所述第一数据源中的数据提取的特征中,除所述多个第一目标特征之外的特征;基于所述第一目标概率和所述其它概率,确定所述目标对象的分类结果。

可选地,所述基于所述第一目标概率确定所述目标对象的分类结果,包括:判断所述第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于所述第一目标概率确定所述目标对象的分类结果;在判断结果为否的情况下,获取所述目标对象属于所述预定类型的第二目标概率,其中,所述第二目标概率为基于所述目标对象在第二数据源中的数据获得的概率,所述第二数据源为与所述第一数据源不同的数据源;基于所述第一目标概率和所述第二目标概率,确定所述目标对象的分类结果。

根据本发明实施例的另一方面,还提供了一种数据处理方法,包括:获取目标视频在第一数据源中的数据;基于所述第一数据源中的数据,提取所述目标视频的多个第一目标特征;分别基于所述多个第一目标特征,确定所述目标视频属于预定类型的多个第一初始概率,其中,所述预定类型包括与所述目标视频对应的视频类型,和/或,与所述目标视频对应的视频类型;基于所述多个第一初始概率,确定所述目标视频属于所述预定类型的第一目标概率,并基于所述第一目标概率确定所述目标视频的分类结果。

根据本发明实施例的另一方面,还提供了一种数据处理方法,包括:在交互界面上显示数据接收控件;响应于对所述数据接收控件的操作,获取目标图像在第一数据源中的数据;在所述交互界面上接收分类指令;响应于所述分类指令,在所述交互界面上显示所述目标图像的分类结果,其中,所述分类结果基于所述目标图像属于预定类型的第一目标概率确定,所述第一目标概率基于所述目标图像属于所述预定类型的多个第一初始概率确定,所述多个第一初始概率基于所述目标图像的多个第一目标特征确定,所述多个第一目标特征基于所述第一数据源中的数据提取得到。

根据本发明实施例的另一方面,还提供了一种数据处理方法,包括:获取虚拟现实VR设备或增强现实AR设备上展示的目标图像;获取所述目标图像在第一数据源中的数据;基于所述第一数据源中的数据,提取所述目标图像的多个第一目标特征;分别基于所述多个第一目标特征,确定所述目标图像属于预定类型的多个第一初始概率;基于所述多个第一初始概率,确定所述目标图像属于所述预定类型的第一目标概率,并基于所述第一目标概率确定所述目标图像的分类结果;驱动所述VR设备或所述AR设备将所述分类结果渲染到所述目标图像中。

根据本发明实施例的另一方面,还提供了一种数据处理装置,包括:获取模块,用于获取目标图像在第一数据源中的数据;提取模块,用于基于所述第一数据源中的数据,提取所述目标图像的多个第一目标特征;第一确定模块,用于分别基于所述多个第一目标特征,确定所述目标图像属于预定类型的多个第一初始概率;第二确定模块,用于基于所述多个第一初始概率,确定所述目标图像属于所述预定类型的第一目标概率,并基于所述第一目标概率确定所述目标图像的分类结果。

根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的数据处理方法。

根据本发明实施例的另一方面,还提供了一种计算机设备,包括:存储器和处理器,所述存储器存储有计算机程序;所述处理器,用于执行所述存储器中存储的计算机程序,所述计算机程序运行时使得所述处理器执行上述任意一项所述的数据处理方法。

在本可选实施例中,通过获取目标图像在第一数据源中的数据;基于第一数据源中的数据,提取目标图像的多个第一目标特征;分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果。方法不限于单一特征进行分类,而是通过提取多个第一目标特征,并获取分别与多个第一目标特征所对应的多个第一初始概率,根据多个第一初始概率获取目标图像的分类结果。基于多个分别与多个第一目标特征对应的第一初始概率确定第一目标概率,再基于第一目标概率进行目标图像分类,可以实现对第一目标概率的无损计算,提高了对目标图像分类的鲁棒性;另外在多个第一目标特征中的部分第一目标特征缺失或可用性差的情况下,基于与多个第一目标特征中除缺失或可用性差的第一目标特征外的其他第一目标特征所对应的第一目标概率,也可以获取目标图像属于预定类型的第一目标概率,进行实现目标图像的分类,提高了对目标图像分类的鲁棒性,解决了相关技术中对目标图像进行分类时,存在鲁棒性的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例一种用于实现数据处理方法的计算机终端的硬件结构框图;

图2是根据本发明实施例的一种可选的数据处理方法的流程图;

图3是根据本发明实施例的另一种可选的数据处理方法的流程图;

图4是根据本发明实施例的又一种可选的数据处理方法的流程图;

图5是根据本发明实施例的再一种可选的数据处理方法的流程图;

图6是根据本发明实施例的又一种可选的数据处理方法的流程图;

图7是根据本发明实施例的另一种可选的数据处理装置的框架图;

图8是根据本发明实施例的一种计算机设备的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:

后验概率,根据后加入的数据对以获取的先验概率进行修正,由此获取的更接近实际情况的概率。

联邦学习,又称联邦机器学习,可以在不同用户的原始数据对彼此保密的情况下,进行所需要的目标数据的交换。即,在原始数据本身不转移的前提下进行目标数据交换。

多视图数据,也称为多视图特征数据,包括多模态数据、多传感器数据、通过不同方法提取的数据特征,等等。

AR(Augmented Reality,增强现实)设备,可以使用虚拟场景对真实场景进行补充,或者对真实场景和虚拟场景进行交互。AR设备可以复原人类的视觉功能,比如自动识别跟踪物体并且对被跟踪物体周围的真实场景进行3D建模。

VR(Virtual Reality,虚拟现实)设备,可以使用接收的数据进行虚拟场景的构建,并将构建的虚拟场景转换为可以视觉感知的模型。

渲染,渲染的过程包括对图像进行重新优化的过程,可以对图像中的目标区域进行明显标识。

实施例1

根据本发明实施例,还提供了一种数据处理的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现数据处理方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个处理器(图中采用102a、102b,……,102n来示出,处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的数据处理方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的数据处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

在上述运行环境下,本申请提供了如图2所示的数据处理方法。图2是根据本发明实施例1的数据处理方法的流程图。参照图2所示,数据处理方法可包括如下步骤:

步骤S202,获取目标图像在第一数据源中的数据。

步骤S204,基于第一数据源中的数据,提取目标图像的多个第一目标特征。

步骤S206,分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率。

在一些可选实施例中,使用与第一目标特征对应的概率预测模型,获取与第一目标特征对应的第一初始概率。

在一些可选实施例中,使用与第一目标特征对应的分类模型,可以获取与第一目标特征对应的第一打分值;基于单调回归算法以及与第一目标特征对应的验证集,将第一打分值转换为对应的第一初始概率。

例如,在一个实施例中,第一目标特征为从目标图像中提取的像素特征,该像素特征用于判定目标图像中的场景为白天或者黑夜;将该第一目标特征输入训练好的分类模型中,获取目标图像中的场景为白天的打分值。获取一组已进行场景为白天或黑夜的信息标注的验证集图片,根据该组验证集图片和训练好的分类模型,得到与验证集图片对应的打分值,根据该组验证集图片中的场景标注信息,可以获取验证集图片中的场景属于白天的概率。基于验证集图片对应的打分值和场景属于白天的概率,可以获取打分值和场景属于白天的概率的对应关系,基于该对应关系和目标图像中的场景为白天的打分值,可以获取目标图像中的场景属于白天的第一初始概率。

步骤S208,基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果。

在一个可选实施例中,通过对多个第一初始概率进行融合,获取目标图像属于预定类型的第一目标概率。在另一个可选实施例中,通过对多个第一初始概率中的部分初始概率进行融合,获取目标图像属于预定类型的第一目标概率。在又一个可选实施例中,确定多个第一初始概率中的一个初始概率为第一目标概率。

在一些可选实施例中,第一数据源可以为单独的一个数据源或数据系统,也可以为包括多个子数据源或子数据系统的数据源集合。第一数据源中的多个子数据源或子数据系统的种类可以有多种,例如,可以是具有不同功能的应用平台,也可以是预存储有多组数据的多个子数据库,等等。例如,第一数据源可以包括直播应用平台、电商平台,等等。根据由多个子数据源或子数据系统组成的第一数据源中的数据获取多个第一目标特征,获取的多个第一目标特征的种类多,基于多种第一目标特征获取对应的多个第一初始概率,再基于与多种第一目标特征对应的第一初始概率获取第一目标概率,得到的第一目标概率的可用性高,由此确定的目标图像的分类结果准确度高。

在本可选实施例中,通过获取目标图像在第一数据源中的数据;基于第一数据源中的数据,提取目标图像的多个第一目标特征;分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果。方法不限于单一特征进行分类,而是通过提取多个第一目标特征,并获取分别与多个第一目标特征所对应的多个第一初始概率,根据多个第一初始概率获取目标图像的分类结果。基于多个分别与多个第一目标特征对应的第一初始概率确定第一目标概率,再基于第一目标概率进行目标图像分类,可以实现对第一目标概率的无损计算,提高了对目标图像分类的鲁棒性;另外在多个第一目标特征中的部分第一目标特征缺失或可用性差的情况下,基于与多个第一目标特征中除缺失或可用性差的第一目标特征外的其他第一目标特征所对应的第一目标概率,也可以获取目标图像属于预定类型的第一目标概率,进行实现目标图像的分类,提高了对目标图像分类的鲁棒性。通过上述实施例,解决了相关技术中对目标图像进行分类时,存在鲁棒性的技术问题。

在一些可选实施例中,目标图像的种类可以有多种,用于进行目标图像分类的第一数据源中的数据以及从对应第一数据源中的数据中提取的第一目标特征也可以有多种。

例如,在一个应用场景中,目标图像为对预定区域进行拍摄所得到的图像,需要判断预定区域的自然环境对应的天气为阴天或晴天:第一数据源中的数据可以是通过拍摄装置采集的图片,自第一数据源中的数据提取的第一目标特征可以包括图片的像素特征、纹理特征、形状特征,等等。通过图片的像素特征、纹理特征和形状特征,判定预定区域的自然环境对应的天气为阴天或晴天。在该应用场景中,第一数据源中的数据还可以是通过传感器采集数据,自第一数据源中的数据提取的第一目标特征可以包括湿度特征、温度特征、光照特征,等等。通过湿度特征、温度特征、光照特征,判定预定区域的自然环境对应的天气为阴天或晴天。

在一些可选实施例中,基于第一目标概率确定目标图像的分类结果的方法,可包括如下步骤:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标图像的分类结果。

在本可选实施例中,因为第一目标概率是基于多个第一初始概率得到的,所以第一目标概率的精确度和准确度高,基于第一目标概率进行目标图像分类,分类结果的准确度高。另外,通过第一目标概率和预定概率阈值来进行目标图像的分类,可以根据用户需要设定预定概率阈值,例如,在对分类结果的准确度要求比较高的情况下,可以将预定概率阈值设置的比较大,在对分类结果的准确度要求比较低的情况下,可以将预定概率阈值设置的比较小。根据预定概率阈值和第一目标概率确定目标图像的分类结果,提高了分类结果的准确度。

在本可选实施例中,预定概率阈值可以是一个概率区间,也可以是预定的一个概率值。需要明白的是,在预定概率阈值是一个概率区间的情况下,可以将这个概率区间定义为概率模糊区间。第一目标概率超过概率模糊区间,是指第一目标概率没有落入概率模糊区间的范围,即第一目标概率大于概率模糊区间中的最大值,或者小于概率模糊区间中的最小值。例如,在一个实施例中,第一目标概率的值为0.1,概率模糊区间为[0.2,0.8],在这种情况下,第一目标概率小于概率模糊区间中的最小值0.2,因此,可以认为,第一目标概率超过预定概率阈值。

在一些可选实施例中,基于第一目标概率确定目标图像的分类结果的方法,可包括如下步骤:判断第一目标概率是否超过预定概率阈值;在判断结果为否的情况下,基于第一数据源中的数据,提取目标图像的其它特征,并基于其它特征确定目标图像属于预定类型的其它概率,其中,其它特征为基于第一数据源中的数据提取的特征中,除多个第一目标特征之外的特征;基于第一目标概率和其它概率,确定目标图像的分类结果。其中,预定概率阈值可以是一个概率区间,可以将这个概率区间定义为概率模糊区间。在第一目标概率没有超过概率模糊区间时,认为第一目标概率的可用性差,在这种情况下,获取目标图像的其他特征,并基于其他特征确定对应的其他概率,根据第一目标概率和其他概率确定目标图像的分类结果,用于对目标图像进行分类的最终概率值符合超过预定概率阈值的条件,实现了在基于相同数据源中的数据的特征,提高分类结果的准确度的效果。可以根据用户需要设定预定概率阈值,例如,在对分类结果的准确度要求比较高的情况下,可以将预定概率阈值设置的比较大,在对分类结果的准确度要求比较低的情况下,可以将预定概率阈值设置的比较小。根据预定概率阈值和第一目标概率确定目标图像的分类结果,提高了分类结果的准确度。

需要明白的是,第一目标概率没有超过概率模糊区间,是指第一目标概率落入了概率模糊区间的范围,而非只指第一目标概率小于概率模糊区间中的最大值。例如,在一个实施例中,第一目标概率的值为0.3,概率模糊区间为[0.2,0.8],可以认为第一目标概率未超过预定概率阈值。在另一个实施例中,第一目标概率的值为0.1,概率模糊区间为[0.2,0.8],虽然第一目标概率小于概率模糊区间中的最大值,但仍认为第一目标概率超过了预定概率阈值。

在一些可选实施例中,获取目标图像在第一数据源中的数据,基于第一数据源中的数据,提取目标图像的多个第一目标特征,分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率,基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率。其中,基于第一目标概率和其它概率,确定目标图像的分类结果的方法,可包括如下步骤:基于第一目标概率和其它概率,确定目标图像属于预定类型的融合概率;基于融合概率和预定概率阈值,确定目标图像的分类结果。根据第一数据源中的数据获取多个第一目标特征,根据多个第一目标特征的多个第一初始概率计算第一目标概率,在第一目标概率未超过预定概率阈值的情况下,认为第一目标概率的可用性差,通过根据第一目标概率和其他概率获取融合概率,相当于对可用性差的第一目标概率进行修正,并根据修正后的融合概率确定目标图像的分类结果,由此达到了依据相同的数据源中数据的特征,提高分类结果的准确度和鲁棒性的效果。

在一些可选实施例中,获取目标图像在第一数据源中的数据,基于第一数据源中的数据,提取目标图像的多个第一目标特征,分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率,基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率。其中,基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率的方法有多种,在一个实施例中,方法可包括如下步骤:基于多个第一初始概率,采用贝叶斯法则以及多个第一初始概率间相互独立的条件,确定目标图像属于预定类型的第一目标概率。在本可选实施例中,采用贝叶斯法则以及多个第一初始概率间相互独立的条件独立约束条件,可以获取与多个第一初始概率对应的第一目标概率,方法简单,计算结果准确度和精确度高。在相关技术中,在用于进行目标图像分类的部分数据缺失的情况下,无法计算出用于进行目标图像分类的对应概率,而通过基于前述的条件独立约束条件计算第一目标概率,则在多个第一目标特征中的部分第一目标特征缺失或不可用,导致与该部分第一目标特征对应的第一初始概率缺失或不可用时,仍然可以基于贝叶斯法则计算得到第一目标概率,解决了在相关技术中,在部分数据缺失时无法对目标图像进行分类的问题,提高了对目标图像分类的鲁棒性。

在一些可选实施例中,基于第一目标概率确定目标图像的分类结果,包括:判断第一目标概率是否超过预定概率阈值:在判断结果为否的情况下,获取目标图像属于预定类型的第二目标概率,其中,第二目标概率为基于目标图像在第二数据源中的数据获得的概率,第二数据源为与第一数据源不同的数据源;基于第一目标概率和第二目标概率,确定目标图像的分类结果。在一些可选实施例中,第二数据源可以有多个,与多个第二数据源对应的第二目标概率也可以有多个。

在本可选实施例中,在第一目标概率未超过预定概率阈值的情况下,根据基于第二数据源中的数据获取的第二目标概率和基于第一数据源中的数据获取的第一目标概率数据确定目标图像的分类结果,相当于使用第二目标概率对可用性差的第一目标概率数据进行修正,根据修正结果确定目标图像的分类结果,达到了依据不同数据源中数据的特征,提高分类结果的准确度和鲁棒性的效果。另外,通过基于不同数据源中的数据获取的第一目标概率数据和第二目标概率数据进行目标图像分类的方法还适用于联邦学习的场景中。例如,在基于第一数据源中的数据获取的第一目标概率的可用性差,而其他数据源中的原始数据属于不对外公开的保密数据的情况下,可以不获取其他数据源中的原始数据,而是直接获取与其他数据源对应的第二目标概率,基于第一目标概率和第二目标概率对目标图像进行分类。由此,提高了分类结果的准确度和鲁棒性,不仅解决了其他应用场景中分类的准确度和鲁棒性差的问题,还解决了在联邦学习场景中分类的准确度和鲁棒性差的问题。

在一些可选实施例中,基于第一目标概率确定目标图像的分类结果,包括:在预定类型为多个不同的类型的情况下,对多个不同的类型分别对应的第一目标概率进行比较;确定多个不同的类型分别对应的第一目标概率中最大概率对应的类型为目标图像所属的类型。根据不同类型分别对应的第一目标概率的对比结果确定目标图像所属的类型,可以定量的确定比对结果,根据定量的比对结果确定目标图像所属的类型,对目标图像进行分类的分类结果的准确度高。

图3是根据本发明实施例的另一种可选的数据处理方法的流程图。参照图3所示,数据处理方法可包括如下步骤:

步骤S302,获取目标对象在第一数据源中的数据。

步骤S304,基于第一数据源中的数据,提取目标对象的多个第一目标特征。

步骤S306,分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率。

步骤S308,基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

在一个可选实施例中,通过对多个第一初始概率进行融合,获取目标对象属于预定类型的第一目标概率。在另一个可选实施例中,通过对多个第一初始概率中的部分初始概率进行融合,获取目标对象属于预定类型的第一目标概率。在又一个可选实施例中,确定多个第一初始概率中的一个初始概率为第一目标概率。

在一些可选实施例中,第一数据源可以为单独的一个数据源或数据系统,也可以为包括多个子数据源或子数据系统的数据源集合。第一数据源中的多个子数据源或子数据系统的种类可以有多种,例如,可以是具有不同功能的应用平台,也可以是预存储有多组数据的多个子数据库,等等。例如,第一数据源可以包括直播应用平台、电商平台,等等。根据由多个子数据源或子数据系统组成的第一数据源中的数据获取多个第一目标特征,获取的多个第一目标特征的种类多,基于多种第一目标特征获取对应的多个第一初始概率,再基于与多种第一目标特征对应的第一初始概率获取第一目标概率,得到的第一目标概率的可用性高,由此确定的目标对象的分类结果准确度高。

在本可选实施例中,通过获取目标对象在第一数据源中的数据;基于第一数据源中的数据,提取目标对象的多个第一目标特征;分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。方法不限于单一特征进行分类,而是通过提取多个第一目标特征,并获取分别与多个第一目标特征所对应的多个第一初始概率,根据多个第一初始概率获取目标对象的分类结果。基于多个分别与多个第一目标特征对应的第一初始概率确定第一目标概率,再基于第一目标概率进行目标对象分类,可以实现对第一目标概率的无损计算,提高了对目标对象分类的鲁棒性;另外在多个第一目标特征中的部分第一目标特征缺失或可用性差的情况下,基于与多个第一目标特征中除缺失或可用性差的第一目标特征外的其他第一目标特征所对应的第一目标概率,也可以获取目标对象属于预定类型的第一目标概率,进行实现目标对象的分类,提高了对目标对象分类的鲁棒性。通过上述实施例,解决了相关技术中对目标图像进行分类时,存在鲁棒性的技术问题。

在一些可选实施例中,目标对象的种类可以有多种,用于进行目标对象分类的第一数据源中的数据以及从对应第一数据源中的数据中提取的第一目标特征也可以有多种。

在另一个应用场景中,目标对象为视频,需要判定视频属于餐饮推荐类的视频、风景推荐类的视频或者游戏推荐类的视频:第一数据源中的数据可以是视频中的文字数据和语音数据,自第一数据源的数据中提取的特征可以包括自文字数据中提取的关键字词和自语音数据中提取的关键字词,通过文字数据中提取的关键字词和语音数据中提取的关键字词,判定视频属于餐饮推荐类的视频、风景推荐类的视频或者游戏推荐类的视频。

在一些可选实施例中,基于第一目标概率确定目标对象的分类结果的方法,可包括如下步骤:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标对象的分类结果。

在本可选实施例中,因为第一目标概率是基于多个第一初始概率得到的,所以第一目标概率的精确度和准确度高,基于第一目标概率进行目标对象分类,分类结果的准确度高。另外,通过第一目标概率和预定概率阈值来进行目标对象的分类,可以根据用户需要设定预定概率阈值,例如,在对分类结果的准确度要求比较高的情况下,可以将预定概率阈值设置的比较大,在对分类结果的准确度要求比较低的情况下,可以将预定概率阈值设置的比较小。根据预定概率阈值和第一目标概率确定目标对象的分类结果,提高了分类结果的准确度。

在本可选实施例中,预定概率阈值可以是一个概率区间,也可以是预定的一个概率值。需要明白的是,在预定概率阈值是一个概率区间的情况下,可以将这个概率区间定义为概率模糊区间。第一目标概率超过概率模糊区间,是指第一目标概率没有落入概率模糊区间的范围,即第一目标概率大于概率模糊区间中的最大值,或者小于概率模糊区间中的最小值。例如,在一个实施例中,第一目标概率的值为0.1,概率模糊区间为[0.2,0.8],在这种情况下,第一目标概率小于概率模糊区间中的最小值0.2,因此,可以认为,第一目标概率超过预定概率阈值。

在一些可选实施例中,基于第一目标概率确定目标对象的分类结果的方法,可包括如下步骤:判断第一目标概率是否超过预定概率阈值;在判断结果为否的情况下,基于第一数据源中的数据,提取目标对象的其它特征,并基于其它特征确定目标对象属于预定类型的其它概率,其中,其它特征为基于第一数据源中的数据提取的特征中,除多个第一目标特征之外的特征;基于第一目标概率和其它概率,确定目标对象的分类结果。其中,预定概率阈值可以是一个概率区间,可以将这个概率区间定义为概率模糊区间。在第一目标概率没有超过概率模糊区间时,认为第一目标概率的可用性差,在这种情况下,获取目标对象的其他特征,并基于其他特征确定对应的其他概率,根据第一目标概率和其他概率确定目标对象的分类结果,用于对目标对象进行分类的最终概率值符合超过预定概率阈值的条件,实现了在基于相同数据源中的数据的特征,提高分类结果的准确度的效果。可以根据用户需要设定预定概率阈值,例如,在对分类结果的准确度要求比较高的情况下,可以将预定概率阈值设置的比较大,在对分类结果的准确度要求比较低的情况下,可以将预定概率阈值设置的比较小。根据预定概率阈值和第一目标概率确定目标对象的分类结果,提高了分类结果的准确度。

需要明白的是,第一目标概率没有超过概率模糊区间,是指第一目标概率落入了概率模糊区间的范围,而非只指第一目标概率小于概率模糊区间中的最大值。例如,在一个实施例中,第一目标概率的值为0.3,概率模糊区间为[0.2,0.8],可以认为第一目标概率未超过预定概率阈值。在另一个实施例中,第一目标概率的值为0.1,概率模糊区间为[0.2,0.8],虽然第一目标概率小于概率模糊区间中的最大值,但仍认为第一目标概率超过了预定概率阈值。

在一些可选实施例中,获取目标对象在第一数据源中的数据,基于第一数据源中的数据,提取目标对象的多个第一目标特征,分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率,基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率。其中,基于第一目标概率和其它概率,确定目标对象的分类结果的方法,可包括如下步骤:基于第一目标概率和其它概率,确定目标对象属于预定类型的融合概率;基于融合概率和预定概率阈值,确定目标对象的分类结果。根据第一数据源中的数据获取多个第一目标特征,根据多个第一目标特征的多个第一初始概率计算第一目标概率,在第一目标概率未超过预定概率阈值的情况下,认为第一目标概率的可用性差,通过根据第一目标概率和其他概率获取融合概率,相当于对可用性差的第一目标概率进行修正,并根据修正后的融合概率确定目标对象的分类结果,由此达到了依据相同的数据源中数据的特征,提高分类结果的准确度和鲁棒性的效果。

在一些可选实施例中,获取目标对象在第一数据源中的数据,基于第一数据源中的数据,提取目标对象的多个第一目标特征,分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率,基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率。其中,基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率的方法有多种,在一个实施例中,方法可包括如下步骤:基于多个第一初始概率,采用贝叶斯法则以及多个第一初始概率间相互独立的条件,确定目标对象属于预定类型的第一目标概率。在本可选实施例中,采用贝叶斯法则以及多个第一初始概率间相互独立的条件独立约束条件,可以获取与多个第一初始概率对应的第一目标概率,方法简单,计算结果准确度和精确度高。在相关技术中,在用于进行目标对象分类的部分数据缺失的情况下,无法计算出用于进行目标对象分类的对应概率,而通过基于前述的条件独立约束条件计算第一目标概率,则在多个第一目标特征中的部分第一目标特征缺失或不可用,导致与该部分第一目标特征对应的第一初始概率缺失或不可用时,仍然可以基于贝叶斯法则计算得到第一目标概率,解决了在相关技术中,在部分数据缺失时无法对目标对象进行分类的问题,提高了对目标对象分类的鲁棒性。

在一些可选实施例中,基于第一目标概率确定目标对象的分类结果,包括:判断第一目标概率是否超过预定概率阈值:在判断结果为否的情况下,获取目标对象属于预定类型的第二目标概率,其中,第二目标概率为基于目标对象在第二数据源中的数据获得的概率,第二数据源为与第一数据源不同的数据源;基于第一目标概率和第二目标概率,确定目标对象的分类结果。在一些可选实施例中,第二数据源可以有多个,与多个第二数据源对应的第二目标概率也可以有多个。

在本可选实施例中,在第一目标概率未超过预定概率阈值的情况下,根据基于第二数据源中的数据获取的第二目标概率和基于第一数据源中的数据获取的第一目标概率数据确定目标对象的分类结果,相当于使用第二目标概率对可用性差的第一目标概率数据进行修正,根据修正结果确定目标对象的分类结果,达到了依据不同数据源中数据的特征,提高分类结果的准确度和鲁棒性的效果。另外,通过基于不同数据源中的数据获取的第一目标概率数据和第二目标概率数据进行目标对象分类的方法还适用于联邦学习的场景中。例如,在基于第一数据源中的数据获取的第一目标概率的可用性差,而其他数据源中的原始数据属于不对外公开的保密数据的情况下,可以不获取其他数据源中的原始数据,而是直接获取与其他数据源对应的第二目标概率,基于第一目标概率和第二目标概率对目标对象进行分类。由此,提高了分类结果的准确度和鲁棒性,不仅解决了其他应用场景中分类的准确度和鲁棒性差的问题,还解决了在联邦学习场景中分类的准确度和鲁棒性差的问题。

在一些可选实施例中,基于第一目标概率确定目标对象的分类结果,包括:在预定类型为多个不同的类型的情况下,对多个不同的类型分别对应的第一目标概率进行比较;确定多个不同的类型分别对应的第一目标概率中最大概率对应的类型为目标对象所属的类型。根据不同类型分别对应的第一目标概率的对比结果确定目标对象所属的类型,可以定量的确定比对结果,根据定量的比对结果确定目标对象所属的类型,对目标对象进行分类的分类结果的准确度高。

图4是根据本发明实施例的又一种可选的数据处理方法的流程图,参照图4所示,数据处理方法可包括如下步骤:

步骤S402,获取目标视频在第一数据源中的数据。

步骤S404,基于第一数据源中的数据,提取目标视频的多个第一目标特征。

步骤S406,分别基于多个第一目标特征,确定目标视频属于预定类型的多个第一初始概率,其中,预定类型包括与目标视频对应的视频类型。

步骤S408,基于多个第一初始概率,确定目标视频属于预定类型的第一目标概率,并基于第一目标概率确定目标视频的分类结果。

在本可选实施例中,通过获取目标视频在第一数据源中的数据;基于第一数据源中的数据,提取目标视频的多个第一目标特征;分别基于多个第一目标特征,确定目标视频属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标视频属于预定类型的第一目标概率,并基于第一目标概率确定目标视频的分类结果。方法不限于单一特征进行分类,而是通过提取多个第一目标特征,并获取分别与多个第一目标特征所对应的多个第一初始概率,根据多个第一初始概率获取目标视频的分类结果。基于多个分别与多个第一目标特征对应的第一初始概率确定第一目标概率,再基于第一目标概率进行目标视频分类,可以实现对第一目标概率的无损计算,提高了对目标视频分类的鲁棒性;另外在多个第一目标特征中的部分第一目标特征缺失或可用性差的情况下,基于与多个第一目标特征中除缺失或可用性差的第一目标特征外的其他第一目标特征所对应的第一目标概率,也可以获取目标视频属于预定类型的第一目标概率,进行实现目标视频的分类,提高了对目标视频分类的鲁棒性。另外,本可选实施例提供的方法适用于对目标视频进行分类的场景中,可以解决对相关技术中,无法对目标视频进行高鲁棒性和高准确性的分类的问题。

图5是根据本发明实施例的再一种可选的数据处理方法的流程图,参照图5所示,数据处理方法可包括如下步骤:

步骤S502,在交互界面上显示数据接收控件。

步骤S504,响应于对数据接收控件的操作,获取目标图像在第一数据源中的数据。

步骤S506,在交互界面上接收分类指令。

步骤S508,响应于分类指令,在交互界面上显示目标图像的分类结果,其中,分类结果基于目标图像属于预定类型的第一目标概率确定,第一目标概率基于目标图像属于预定类型的多个第一初始概率确定,多个第一初始概率基于目标图像的多个第一目标特征确定,多个第一目标特征基于第一数据源中的数据提取得到。

在本可选实施例中,通过在交互界面上显示数据接收控件,可使用户根据数据接收控件进行对应的操作,并响应对应的操作获取分类结果,将分类结果显示在交互界面上,使用户直观的得到分类结果,提高了用户体验。另外,分类结果时根据第一目标概率确定的,第一目标概率是基于目标图像属于预定类型的多个第一初始概率确定,多个第一初始概率基于目标图像的多个第一目标特征确定,多个第一目标特征基于第一数据源中的数据提取得到。获取分类结果的方法不限于单一特征进行分类,而是通过提取多个第一目标特征,并获取分别与多个第一目标特征所对应的多个第一初始概率,根据多个第一初始概率获取目标图像的分类结果。基于多个分别与多个第一目标特征对应的第一初始概率确定第一目标概率,再基于第一目标概率进行目标图像分类,可以实现对第一目标概率的无损计算,提高了对目标图像分类的鲁棒性;另外在多个第一目标特征中的部分第一目标特征缺失或可用性差的情况下,基于与多个第一目标特征中除缺失或可用性差的第一目标特征外的其他第一目标特征所对应的第一目标概率,也可以获取目标图像属于预定类型的第一目标概率,进行实现目标图像的分类,提高了对目标图像分类的鲁棒性。通过本发明实施例,解决了在相关技术中对目标图像进行分类时,存在鲁棒性低的技术问题。

图6是根据本发明实施例的又一种可选的数据处理方法的流程图,参照图6所示,数据处理方法可包括如下步骤:

步骤S602,获取虚拟现实VR设备或增强现实AR设备上展示的目标图像。

步骤S604,获取目标图像在第一数据源中的数据。

步骤S606,基于第一数据源中的数据,提取目标图像的多个第一目标特征。

步骤S608,分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;

步骤S610,基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果。

步骤S612,驱动VR设备或AR设备将分类结果渲染到目标图像中。

在本可选实施例中,通过VR设备或AR设备展示目标图像,可以使用户直观获取目标图像,提高了用户体验。并获取目标图像在第一数据源中的数据,基于第一数据源中的数据,提取目标图像的多个第一目标特征。分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果,方法不限于单一特征进行分类,而是通过提取多个第一目标特征,并获取分别与多个第一目标特征所对应的多个第一初始概率,根据多个第一初始概率获取目标图像的分类结果。基于多个分别与多个第一目标特征对应的第一初始概率确定第一目标概率,再基于第一目标概率进行目标图像分类,可以实现对第一目标概率的无损计算,提高了对目标图像分类的鲁棒性;另外在多个第一目标特征中的部分第一目标特征缺失或可用性差的情况下,基于与多个第一目标特征中除缺失或可用性差的第一目标特征外的其他第一目标特征所对应的第一目标概率,也可以获取目标图像属于预定类型的第一目标概率,进行实现目标图像的分类,提高了对目标图像分类的鲁棒性。通过本发明实施例,解决了在相关技术中对目标图像进行分类时,存在鲁棒性低的技术问题。

另外,VR设备或AR设备将分类结果渲染到目标图像中,可以对分类结果进行明显标识,使用户能够更为容易的关注到对目标图像的分类结果,由此,对分类结果进行渲染后,可以有效提高用户观看体验。例如,在一个对目标图像中出现的动物进行分类的应用场景中,可以通过VR设备或AR设备显示目标图像,并将分类结果渲染到目标图像中,由此,用户可以根据VR设备或AR设备直观获取目标图像中对各动物的分类结果,提高了用户体验。

基于上述实施例及可选实施例,提供了一种可选实施方式,下面具体说明。

相关技术中,通过将多视图数据拼接在一起训练单一模型的方法进行分类,这种方法存在如下缺陷:随着输入维度的增加,需要超线性的增加用于训练模型的样本的数量,需要对输入数据进行逐样本对齐,否则会因视图缺失而导致分类效果差,模型的复杂度随着输入维度的增加而线性增加,不同视图适用的分类模型不同,这导致训练单一模型的难度增加,使得训练得到的单一模型的可用性差,最终导致分类结果准确性和鲁棒性差。相关技术中,还将各视图数据的分类结果作为输入,通过训练好的融合分类器得到分类结果,在使用这种方法进行分类时,需要对输入数据逐样本对齐,否则会因视图数据缺失而导致分类结果差,可能由于融合分类器的选型或训练方式导致分类结果相对于预期的准确多视图后验分类分布有偏差。在相关技术中,还通过对各视图数据的分类结果取加权平均,或者取最大值、最小值的方法确定最终的分类结果,但这种方法容易受弱视图分类器的干扰,也容易受到噪音数据的干扰。即,相关技术中的视图分类方法存在分类结果准确度差和鲁棒性差的问题。

鉴于此,在本公开实施方式中,提供了一种数据处理方法,以解决相关技术中的视图分类方法存在分类结果准确度差和鲁棒性差的问题。

本公开实施方式提供的数据处理方法适用于多种场景,例如,适用于不同视觉特征下的分类问题,用户不同行为特征下的点击率预估问题,视频的分类问题,以及在联邦学习场景下的安全多边形分类器融合问题,等等。需要明白的是,多视图分类是指在对象存在多特征或多模态的数据描述时,对该对象集合进行分类识别。例如,在图像分类中,可以自图像中提取像素特征、颜色特征、纹理特征、形状特征;在点击率估计中,可以自点击率数据中提取行为特征、社交网络特征,等等;在视频分类中,可以自视频中提取文本模态特征和视觉模态特征,等等。

在下面的详细说明中,以对图片分类的应用场景为例进行说明。

需要明白的是,贝叶斯公式可用于描述两个条件概率之间的关系。将两个条件分别标记为A和B,则基于贝叶斯公式获取的两个概率之间的关系

其中,

在条件独立假设约束下,假设视图X和视图Y之间的给定类别标签Z条件独立,则在 视图Y属于类别标签Z的情况下,视图X属于类别标签Z的概率

下面对条件独立假设下,在两视图情况下,基于贝叶斯法则获取的融合概率进行说明,融合概率

其中,

其中,

在上述公式中,

下面对条件独立假设下,在三视图情况下,基于贝叶斯法则获取的融合概率进行说明,融合概率

在上述公式中,

下面对条件独立假设下,在

在上述公式中,

下面以对图片分类的应用场景为例,以自图片中提取的特征包括像素特征、纹理特征、形状特征为例进行说明。在该场景中,需要根据图片的分类结果,确认图片中的自然环境属于阴天、晴天或者雨天。在该实施例中,图片相当于前述实施例中的第一数据源中的数据;像素特征、纹理特征、形状特征相当于前述实施例中的第一目标特征,三种特征也即本可选实施方式中的三种视图;自然环境属于阴天、晴天或者雨天为前述实施例中的多个预定类型。对图片进行分类的方法包括如下步骤:

将像素特征输入训练好的第一预测模型中,得到图片中的自然环境属于阴天的概率

将纹理特征输入训练好的第二预测模型中,得到图片中的自然环境属于阴天的概率

将形状特征输入训练好的第三预测模型中,得到图片中的自然环境属于阴天的概率

分别将根据像素特征得到的图片中的自然环境属于阴天的概率

基于相同的方法,获取图片中的自然环境属于晴天的概率

对比图片中的自然环境属于阴天的概率

在一些实施例中,适用于不同目标特征的模型可能不同,比如,适用于某些目标特征的机器模型输出的结果并非概率属性的结果,而是打分值或者其他类型的值。在这种情况下,需要根据单调回归算法将不属于概率的值转换为对应的概率值,然后基于转换后的概率值进行多个目标特征对应的概率值的融合,进而获取融合后的概率值。对于通过对应机器模型输出的预测结果类别与真实发生的期望概率不等的情况下,可以用过加注分类标签的验证集将输出的预测结果校准至真实归属于对应类别的概率值。

在一些实施例中,可以先获取基于一个特征获取的一组概率,如果该组概率值均出于概率模糊区间,则再选择一个特征,根据新添加的特征对应的概率和添加特征之前的概率获取融合概率,根据融合概率进行图片分类。如果新添加一个特征后获取的融合概率依旧落在概率模糊区间内,则继续添加特征对应的概率,直至获取符合用户需求的确信结果。由此,可以降低计算量,并且能满足用户对分类结果准确度的要求。

在一些实施例中,在联邦学习环境下,存在多个原始数据对彼此保密的平台,在这种情况下,可以直接获取各平台的各视图的独立预测概率,根据各独立的预测概率获取融合概率,进而实现对目标对象的分类。在这种应用场景中,各平台对应于不同的数据源,各独立的预测概率相当于前述实施例中的第一目标概率和第二目标概率。由此,既能满足对数据保密的要求,又能高鲁棒性且高准确度的获取分类结果。

在本可选实施方式中,相对于相关技术中将多视图数据拼接在一起训练单一模型并进行分类的方法,通过采取独立模型获取分别与多个特征对应的概率,基于与多个特征对应的概率获取融合概率,并基于融合概率进行分类。与各特征对应的概率之间相互独立,因此不需要大量的训练样本和复杂的单一训练模型即可准确获取融合概率,进而实现高准确度和高鲁棒性的分类。

在本可选实施方式中,相对于相关技术中将各视图的分类结果作为输入训练一个融合分类器的分类方法,实现了无损计算对应的概率,通过用户需要设定概率模糊区间,根据概率模糊区间确定用于进行概率融合的视图数量,并由此获取可用性高的概率,基于可用性高的概率进行分类,提高了分类的准确度。

在本可选实施方式中,相对于相关技术中将各视图的分类结果取(加权)平均/最大/最小并进行分类的方法,通过改变进行概率融合的视图数据,进行获取对先验概率进行修正的后验概率,基于后验概率进行分类,降低了弱视图和噪声数据对分类结果的影响,提高了分类的鲁棒性。

即,在本可选实施方式中,通过概率融合实现无损计算多视图预测概率分布下的融合后验概率;方法支持任意视图数据缺失下的多视图分类,并在线上场景可以根据用户设定的置信度动态调整视图计算数量,节约了计算资源;另外,方法适用于多保密视图数据要求下的联邦学习场景。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的数据处理方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。

实施例2

根据本发明实施例,还提供了一种用于实施上述数据处理方法的装置,图7是根据本发明实施例的另一种可选的数据处理装置的框架图,如图7所示,该装置包括:获取模块702、提取模块704、第一确定模块706和第二确定模块708。下面分别说明。

获取模块702,用于获取目标对象在第一数据源中的数据;提取模块704,连接于上述获取模块702,用于基于第一数据源中的数据,提取目标对象的多个第一目标特征;第一确定模块706,连接于上述提取模块704,用于分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;第二确定模块708,连接于上述第一确定模块706,用于基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

此处需要说明的是,上述获取模块702、提取模块704、第一确定模块706和第二确定模块708对应于实施例1中的步骤S202至步骤S208,几个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

实施例3

本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。

可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:获取目标图像在第一数据源中的数据;基于第一数据源中的数据,提取目标图像的多个第一目标特征;分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:基于第一目标概率确定目标图像的分类结果,包括:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标图像的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:在判断结果为否的情况下,基于第一数据源中的数据,提取目标图像的其它特征,并基于其它特征确定目标图像属于预定类型的其它概率,其中,其它特征为基于第一数据源中的数据提取的特征中,除多个第一目标特征之外的特征;基于第一目标概率和其它概率,确定目标图像的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:基于第一目标概率和其它概率,确定目标图像的分类结果,包括:基于第一目标概率和其它概率,确定目标图像属于预定类型的融合概率;基于融合概率和预定概率阈值,确定目标图像的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,包括:基于多个第一初始概率,采用贝叶斯法则以及多个第一初始概率间相互独立的条件,确定目标图像属于预定类型的第一目标概率。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:在判断结果为否的情况下,获取目标图像属于预定类型的第二目标概率,其中,第二目标概率为基于目标图像在第二数据源中的数据获得的概率,第二数据源为与第一数据源不同的数据源;基于第一目标概率和第二目标概率,确定目标图像的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:基于第一目标概率确定目标图像的分类结果,包括:在预定类型为多个不同的类型的情况下,对多个不同的类型分别对应的第一目标概率进行比较;确定多个不同的类型分别对应的第一目标概率中最大概率对应的类型为目标图像所属的类型。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:获取目标对象在第一数据源中的数据;基于第一数据源中的数据,提取目标对象的多个第一目标特征;分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标对象的分类结果;在判断结果为否的情况下,基于第一数据源中的数据,提取目标对象的其它特征,并基于其它特征确定目标对象属于预定类型的其它概率,其中,其它特征为基于第一数据源中的数据提取的特征中,除多个第一目标特征之外的特征;基于第一目标概率和其它概率,确定目标对象的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标对象的分类结果;在判断结果为否的情况下,获取目标对象属于预定类型的第二目标概率,其中,第二目标概率为基于目标对象在第二数据源中的数据获得的概率,第二数据源为与第一数据源不同的数据源;基于第一目标概率和第二目标概率,确定目标对象的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:获取目标视频在第一数据源中的数据;基于第一数据源中的数据,提取目标视频的多个第一目标特征;分别基于多个第一目标特征,确定目标视频属于预定类型的多个第一初始概率,其中,预定类型包括与目标图像对应的图像类型,和/或,与目标视频对应的视频类型;基于多个第一初始概率,确定目标视频属于预定类型的第一目标概率,并基于第一目标概率确定目标视频的分类结果。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:在交互界面上显示数据接收控件;响应于对数据接收控件的操作,获取目标对象在第一数据源中的数据;在交互界面上接收分类指令;响应于分类指令,在交互界面上显示目标对象的分类结果,其中,分类结果基于目标对象属于预定类型的第一目标概率确定,第一目标概率基于目标对象属于预定类型的多个第一初始概率确定,多个第一初始概率基于目标对象的多个第一目标特征确定,多个第一目标特征基于第一数据源中的数据提取得到。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:获取虚拟现实VR设备或增强现实AR设备上展示的目标图像;获取目标图像在第一数据源中的数据;基于第一数据源中的数据,提取目标图像的多个第一目标特征;分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果;驱动VR设备或AR设备将分类结果渲染到目标图像中。

可选地,在本实施例中,上述计算机终端可以执行应用程序的数据处理方法中以下步骤的程序代码:获取模块,用于获取目标对象在第一数据源中的数据;提取模块,用于基于第一数据源中的数据,提取目标对象的多个第一目标特征;第一确定模块,用于分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;第二确定模块,用于基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

可选地,图8是根据本发明实施例的一种计算机设备的结构框图。如图8所示,该计算机终端可以包括:一个或多个(图中仅示出一个)处理器802、存储器804等。

其中,存储器804可用于存储软件程序以及模块,如本发明实施例中的数据处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器802可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取目标对象在第一数据源中的数据;基于第一数据源中的数据,提取目标对象的多个第一目标特征;分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:基于目标抓拍图像获取目标对象的目标特征,包括:基于第一目标概率确定目标对象的分类结果,包括:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:基于目标特征,获取目标对象的历史抓拍图像,包括:在判断结果为否的情况下,基于第一数据源中的数据,提取目标对象的其它特征,并基于其它特征确定目标对象属于预定类型的其它概率,其中,其它特征为基于第一数据源中的数据提取的特征中,除多个第一目标特征之外的特征;基于第一目标概率和其它概率,确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:从多个候选抓拍图像中筛选出目标对象的历史抓拍图像,包括:基于第一目标概率和其它概率,确定目标对象属于预定类型的融合概率;基于融合概率和预定概率阈值,确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:基于目标抓拍图像和历史抓拍图像确定目标对象的事件图像,包括:基于多个第一初始概率,采用贝叶斯法则以及多个第一初始概率间相互独立的条件,确定目标对象属于预定类型的第一目标概率。

可选的,上述处理器802还可以执行如下步骤的程序代码:在判断结果为否的情况下,获取目标对象属于预定类型的第二目标概率,其中,第二目标概率为基于目标对象在第二数据源中的数据获得的概率,第二数据源为与第一数据源不同的数据源;基于第一目标概率和第二目标概率,确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:在预定类型为多个不同的类型的情况下,对多个不同的类型分别对应的第一目标概率进行比较;确定多个不同的类型分别对应的第一目标概率中最大概率对应的类型为目标对象所属的类型。

可选的,上述处理器802还可以执行如下步骤的程序代码:获取目标对象在第一数据源中的数据;基于第一数据源中的数据,提取目标对象的多个第一目标特征;分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标对象的分类结果;在判断结果为否的情况下,基于第一数据源中的数据,提取目标对象的其它特征,并基于其它特征确定目标对象属于预定类型的其它概率,其中,其它特征为基于第一数据源中的数据提取的特征中,除多个第一目标特征之外的特征;基于第一目标概率和其它概率,确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:判断第一目标概率是否超过预定概率阈值;在判断结果为是的情况下,基于第一目标概率确定目标对象的分类结果;在判断结果为否的情况下,获取目标对象属于预定类型的第二目标概率,其中,第二目标概率为基于目标对象在第二数据源中的数据获得的概率,第二数据源为与第一数据源不同的数据源;基于第一目标概率和第二目标概率,确定目标对象的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:获取目标视频在第一数据源中的数据;基于第一数据源中的数据,提取目标视频的多个第一目标特征;分别基于多个第一目标特征,确定目标视频属于预定类型的多个第一初始概率,其中,预定类型包括与目标图像对应的图像类型,和/或,与目标视频对应的视频类型;基于多个第一初始概率,确定目标视频属于预定类型的第一目标概率,并基于第一目标概率确定目标视频的分类结果。

可选的,上述处理器802还可以执行如下步骤的程序代码:在交互界面上显示数据接收控件;响应于对数据接收控件的操作,获取目标对象在第一数据源中的数据;在交互界面上接收分类指令;响应于分类指令,在交互界面上显示目标对象的分类结果,其中,分类结果基于目标对象属于预定类型的第一目标概率确定,第一目标概率基于目标对象属于预定类型的多个第一初始概率确定,多个第一初始概率基于目标对象的多个第一目标特征确定,多个第一目标特征基于第一数据源中的数据提取得到。

可选的,上述处理器802还可以执行如下步骤的程序代码:获取虚拟现实VR设备或增强现实AR设备上展示的目标图像;获取目标图像在第一数据源中的数据;基于第一数据源中的数据,提取目标图像的多个第一目标特征;分别基于多个第一目标特征,确定目标图像属于预定类型的多个第一初始概率;基于多个第一初始概率,确定目标图像属于预定类型的第一目标概率,并基于第一目标概率确定目标图像的分类结果;驱动VR设备或AR设备将分类结果渲染到目标图像中。

可选的,上述处理器802还可以执行如下步骤的程序代码:获取模块,用于获取目标对象在第一数据源中的数据;提取模块,用于基于第一数据源中的数据,提取目标对象的多个第一目标特征;第一确定模块,用于分别基于多个第一目标特征,确定目标对象属于预定类型的多个第一初始概率;第二确定模块,用于基于多个第一初始概率,确定目标对象属于预定类型的第一目标概率,并基于第一目标概率确定目标对象的分类结果。

本领域普通技术人员可以理解,图所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如,计算机终端还可包括比图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图8所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,计算机可读存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。

本发明的实施例还提供了一种计算机可读存储介质。可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例1所提供的数据处理方法所执行的程序代码。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • PET 数据处理方法、PET 数据处理装置、计算机可读的存储介质、以及数据处理方法
  • 一种基于分组的数据库处理方法、装置、计算机装置及计算机可读存储介质
技术分类

06120114688633