掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本公开的实施例涉及计算机视觉技术领域,具体涉及视频分类方法、装置、电子设备和存储介质。

背景技术

随着互联网的发展,各类视频应用得到广泛使用。为了对视频进行各种分类,比如对视频是否符合公共发布要求进行审核的视频分类,对于视频内容属于例如体育、娱乐、美食、服装等中的哪个类别进行分类。

目前视频分类中常见的方法是基于卷积神经网络(Convolutional NeuralNetworks,CNN)技术实现的。

发明内容

本公开的实施例提出了视频分类方法、装置、电子设备和存储介质。

第一方面,本公开的实施例提供了一种视频分类方法,该方法包括:

从待分类视频的视频帧图像中确定待识别图像;

将所述待识别图像输入预先训练的分类模型,得到所述待识别图像对应的图像类别,其中,所述分类模型用于表征图像和图像对应的图像类别之间的对应关系,所得到的图像类别属于至少两个预设图像类别,所述分类模型为群等变三维卷积神经网络分类模型;

基于所述待识别图像对应的图像类别确定所述待分类视频的视频类别。

在一些可选的实施方式中,所述分类模型是通过如下训练步骤预先训练得到的:

获取训练样本集合,其中,训练样本包括训练样本图像和用于表征该训练样本图像所属图像类别的样本标注信息;

将所述训练样本集合中的训练样本图像输入初始群等变三维卷积神经网络分类模型得到相应的图像类别,基于所得到的图像类别与该训练样本中样本标注信息之间的差异调整所述初始群等变三维卷积神经网络分类模型的模型参数,直到满足预设训练结束条件;

将所述初始群等变三维卷积神经网络分类模型确定为所述分类模型。

在一些可选的实施方式中,所述预设训练结束条件包括以下至少一项:

用测试样本集合测试所述初始群等变三维卷积神经网络分类模型的准确率大于预设准确率阈值,所述测试样本包括测试样本图像和用于表征该测试样本图像所属图像类别的样本标注信息;

所得到的图像类别与该训练样本中样本标注信息之间的差异小于预设差异阈值;

调整所述初始群等变三维卷积神经网络分类模型的模型参数的次数大于等于预设调参次数阈值。

在一些可选的实施方式中,所述群等变三维卷积神经网络分类模型是平移等变且旋转等变的。

在一些可选的实施方式中,所述群等变三维卷积神经网络分类模型包括群等变三维卷积神经网络和分类器,所述群等变三维卷积神经网络中卷积操作定义如下:

其中,f为输入的特征图像,★表示互相关操作,t是平移参数,s是旋转参数,ψ为卷积函数,ψ

在一些可选的实施方式中,所述训练样本集合的训练样本中训练样本图像包括所呈现的图像对象相对训练样本图像正向放置的正向样本图像和/或所呈现的图像对象相对训练样本图像旋转放置的非正向样本图像。

在一些可选的实施方式中,所述分类器为线性分类器。

第二方面,本公开的实施例提供了一种视频分类装置,该装置包括:图像确定单元,被配置成从待分类视频的视频帧图像中确定待识别图像;分类单元,被配置成将所述待识别图像输入预先训练的分类模型,得到所述待识别图像对应的图像类别,其中,所述分类模型用于表征图像和图像对应的图像类别之间的对应关系,所得到的图像类别属于至少两个预设图像类别,所述分类模型为群等变三维卷积神经网络分类模型;视频类别确定单元,被配置成基于所述待识别图像对应的图像类别确定所述待分类视频的视频类别。

在一些可选的实施方式中,所述分类模型是通过如下训练步骤预先训练得到的:

获取训练样本集合,其中,训练样本包括训练样本图像和用于表征该训练样本图像所属图像类别的样本标注信息;

将所述训练样本集合中的训练样本图像输入初始群等变三维卷积神经网络分类模型得到相应的图像类别,基于所得到的图像类别与该训练样本中样本标注信息之间的差异调整所述初始群等变三维卷积神经网络分类模型的模型参数,直到满足预设训练结束条件;

将所述初始群等变三维卷积神经网络分类模型确定为所述分类模型。

在一些可选的实施方式中,所述预设训练结束条件包括以下至少一项:

用测试样本集合测试所述初始群等变三维卷积神经网络分类模型的准确率大于预设准确率阈值,所述测试样本包括测试样本图像和用于表征该测试样本图像所属图像类别的样本标注信息;

所得到的图像类别与该训练样本中样本标注信息之间的差异小于预设差异阈值;

调整所述初始群等变三维卷积神经网络分类模型的模型参数的次数大于等于预设调参次数阈值。

在一些可选的实施方式中,所述群等变三维卷积神经网络分类模型是平移等变且旋转等变的。

在一些可选的实施方式中,所述群等变三维卷积神经网络分类模型包括群等变三维卷积神经网络和分类器,所述群等变三维卷积神经网络中卷积操作定义如下:

其中,f为输入的特征图像,★表示互相关操作,t是平移参数,s是旋转参数,ψ为卷积函数,ψ

在一些可选的实施方式中,所述训练样本集合的训练样本中训练样本图像包括所呈现的图像对象相对训练样本图像正向放置的正向样本图像和/或所呈现的图像对象相对训练样本图像旋转放置的非正向样本图像。

在一些可选的实施方式中,所述分类器为线性分类器。

第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面,本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。

现行的基于卷积神经网络实现视频分类中,由于摄像机不一定总是竖直摆放,它可能偏转某个角度。此外,即使摄像机竖直摆放,场景中的物体也不一定处在竖直位置。因此,在原始视频数据上训练的CNN鲁棒性较差,对于这些具有旋转变换的视频往往不具有很好的泛化性能,进而导致视频分类准确率较低。

为了在视频分类过程中实现对于图像对象正向放置和旋转放置的的视频均可正常进行视频分类,本公开的实施例提供的视频分类方法、装置、电子设备和存储介质,通过利用群等变三维卷积神经网络分类模型,首先从待分类视频的视频帧图像中确定待识别图像,而后将待识别图像输入预先训练的分类模型,得到与待识别图像对应的图像类别,其中,分类模型用于表征图像和图像对应的图像类别之间的对应关系,所得到的图像类别属于至少两个预设图像类别,且分类模型为群等变三维卷积神经网络分类模型,最后基于与待识别图像对应的图像类别确定待分类视频的视频类别。由于群等变三维卷积神经网络分类模型的旋转等变特点,可以实现视频分类过程中对摄像机是否竖直摆放以及视频中对象是否竖直摆放不敏感,提高视频分类鲁棒性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图仅用于示出具体实施方式的目的,而并不认为是对本发明的限制。在附图中:

图1是本公开的一个实施例可以应用于其中的示例性系统架构图;

图2是根据本公开的视频分类方法的一个实施例的流程图;

图3是根据本公开的训练步骤的一个实施例的流程图;

图4是根据本公开的视频分类装置的一个实施例的结构示意图;

图5是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出了可以应用本公开的视频分类方法、装置、电子设备和存储介质的实施例的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频点播类应用、视频编辑类应用、视频拍摄类应用、短视频社交类应用、网络会议类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有视频采集设备(例如摄像头)、手写板和显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts GroupAudio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的终端设备中。其可以实现成多个软件或软件模块(例如用来提供视频录制、编辑、播放服务),也可以实现成单个软件或软件模块。在此不做具体限定。

在一些情况下,本公开所提供的视频分类方法可以由终端设备101、102、103执行,相应地,视频分类装置可以设置于终端设备101、102、103中。这时,系统架构100也可以不包括服务器105。

在一些情况下,本公开所提供的视频分类方法可以由终端设备101、102、103和服务器105共同执行,例如,“从待分类视频的视频帧图像中确定待识别图像”的步骤可以由终端设备101、102、103执行,“将待识别图像输入预先训练的分类模型,得到与待识别图像对应的图像类别”等步骤可以由服务器105执行。本公开对此不做限定。相应地,视频分类装置也可以分别设置于终端设备101、102、103和服务器105中。

在一些情况下,本公开所提供的视频分类方法可以由服务器105执行,相应地,视频分类装置也可以设置于服务器105中,这时,系统架构100也可以不包括终端设备101、102、103。

需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,其示出了根据本公开的视频分类方法的一个实施例的流程200,该视频分类方法包括以下步骤:

步骤201,从待分类视频的视频帧图像中确定待识别图像。

在本实施例中,视频分类方法的执行主体(例如图1所示的服务器105)可以本地或者远程地从与上述执行主体网络连接的其他电子设备(例如,图1所示的终端设备101、102、103)获取待分类视频,再采用各种实现方式从待分类视频的视频帧图像中确定待识别图像。

这里,待分类视频可以是短视频(一般是在互联网新媒体上传播的时长在5分钟以内的视频)或者常规视频,本公开对此不做具体限定。

作为示例,待识别图像可以是从待分类视频的视频帧图像中随机选取的。又例如,待识别图像也可以是待分类视频的视频帧图像中的中位数视频帧图像。或者,待识别图像也可以是待分类视频的首帧视频图像或者最后一帧视频图像。

需要说明的是,待识别图像可以是待分类视频中的一帧图像,也可以是待分类视频中的至少两帧图像,本公开对此不做具体限定。

步骤202,将待识别图像输入预先训练的分类模型,得到与待识别图像对应的图像类别。

在本实施例中,上述执行主体可以将步骤201中所确定的待识别图像输入预先训练的分类模型,得到与待识别图像对应的图像类别。

需要说明的是,当待识别图像为待分类视频中的一帧图像时,可以将该一帧图像输入预先训练的分类模型,得到一个图像类别,作为与待识别图像对应的图像类别。当待识别图像为待分类视频中的至少两帧图像时,可以将每帧图像分别输入预先训练的分类模型,分别得到一个图像类别,并将所得到的各图像类别作为与待识别图像对应的图像类别。

这里,分类模型用于表征图像和图像对应的图像类别之间的对应关系。且,这里图像对应的图像类别属于至少两个预设图像类别。比如,至少两个预设图像类别可以是“不符合要求类别”和“符合要求类别”。又比如,至少两个预设图像类别可以是“体育赛事类别”、“美食类别”、“服装类别”、“自然风光类别”、“网络课程类别”等。

这里,分类模型可以为群等变三维卷积神经网络分类模型。即,分类模型可包括群等变三维卷积神经网络和分类器,其中,群等变三维卷积神经网络用于提取等变特征,而分类器用于基于所提取的等变特征进行分类。群等变三维卷积神经网络为具有群等变特性的三维卷积神经网络。这里,可以通过设计不同的等变群以实现提取不同的等变特征。例如,等变群可以是平移等变群,继而群等变三维卷积神经网络可以实现对于平移后的视频帧图像提取到等变或的不变特征。又例如,等变群可以是旋转等变群,继而群等变三维卷积神经网络可以实现对于旋转后的视频帧图像提取到等变或的不变特征。

步骤203,基于待识别图像对应的图像类别确定待分类视频的视频类别。

在本实施例中,上述执行主体可以采用各种实施方式,基于步骤202所得到的待识别图像对应的图像类别确定待分类视频的视频类别。

当待识别图像为一帧图像或至少两帧图像,且相应的待识别图像对应的图像类别仅为一个图像类别时,待分类视频的视频类别可以与待识别图像对应的图像类别相同或相应。例如,可以直接以待识别图像对应的图像类别作为待分类视频的视频类别。又例如,还可以根据预设的图像类别与视频类别之间的对应关系,将待识别图像的图像类别映射到的视频类别确定为待分类视频的视频类别。

当待识别图像为至少两帧图像,且相应的待识别图像对应的图像类别为至少两个图像类别时,待分类视频的视频类别也可以是待识别图像对应的所有图像类别或者所有图像类别相应的视频类别。或者待分类视频的视频类别也可以是多帧待识别图像对应的所有图像类别中占比最多的图像类别或者该占比最多的图像类别相应的视频类别。本公开对此不做具体限定。

本公开的上述实施例提供的视频分类方法,通过从待分类视频中确定待识别图像,以及将待识别图像输入分类模型得到图像类别,再根据所得到的图像类别确定待分类视频的视频类别,其可以实现包括但不限于以下技术效果:第一,通过将待识别图像输入模型,相对于对待分类视频本身进行处理,计算量减少,可以提高视频分类速度;第二,所输入的分类模型是基于群等变的三维卷积神经网络分类模型,其具有提取等变或不变特征的特性,可以提高分类模型的鲁棒性,进而更加适用于提高对角度旋转视频的分类准确度。

在一些可选的实施方式中,步骤202中所用到的分类模型可以是通过如图3所示的训练步骤300预先训练得到的,训练步骤300包括以下步骤:

这里,训练步骤300的执行主体可以与上述视频分类方法的执行主体相同。这样,训练步骤的执行主体可以在训练得到分类模型后,将分类模型的模型参数存储在上述执行主体本地,并在执行上述视频分类方法的过程中读取上述训练得到的分类模型的模型结构信息和模型参数信息。

这里,训练步骤的执行主体也可以与上述视频分类方法的执行主体不同。这样,训练步骤的执行主体可以在训练得到分类模型后,将分类模型的模型参数发送给上述视频分类方法的执行主体。这样,上述视频分类方法的执行主体可以在执行上述视频分类方法的过程中读取上述从训练步骤的执行主体接收到的分类模型的模型结构信息和模型参数信息。

步骤301,获取训练样本集合。

这里,训练样本可以包括训练样本图像和用于表征该训练样本图像所属图像类别的样本标注信息。

这里,训练样本图像可以是图像采集设备采集的各种图像,可以由人工对训练样本图像进行图像类别标注得到样本标注信息。

这里,训练样本图像也可以是摄像机采集的样本视频中的视频帧图像。相应地可以由人工对该样本视频所属视频类别进行标注,以及将样本视频的标注结果作为训练样本图像的样本标注信息,进而可以减少训练过程中所需人工数据标注的工作量。

在一些可选的实施方式中,训练样本集合的训练样本中训练样本图像包括所呈现的图像对象相对训练样本图像正向放置的正向样本图像和/或所呈现的图像对象相对训练样本图像旋转放置的非正向样本图像。即,不论训练样本中的训练样本图像对象相对训练样本图像是正向放置还是非正向放置均可以。在传统视频分类模型的训练样本的训练样本图像中,需要将样本图像经人工校正到正向后才能用作训练样本图像,因此该可选实施方式可以减少训练过程中人工校正工作量,减少人工成本和时间成本,加快训练速度。

步骤302,将训练样本集合中的训练样本图像输入初始群等变三维卷积神经网络分类模型得到相应的图像类别,基于所得到的图像类别与该训练样本中样本标注信息之间的差异调整初始群等变三维卷积神经网络分类模型的模型参数,直到满足预设训练结束条件。

这里,首先可以确定初始群等变三维卷积神经网络分类模型的模型结构。

其中,初始群等变三维卷积神经网络分类模型可以包括群等变三维卷积神经网络和分类器。其中,分类器可以根据实际需要采用相应的线性分类器或者非线性分类器,本公开对此不做具体限定。

而群等变三维卷积神经网络可以是具有群等变特点的三维卷积神经网络。这里,可以确定群等变卷积神经网络对应的等变群,还可以确定具体包括哪些层,比如包括哪些卷积层、池化层、全连接层,以及层与层之间的先后连接关系。如果包括卷积层,可以确定卷积层的卷积核的大小,卷积步长。如果包括池化层,可以确定池化方法等。例如,等变群可以是平移等变群,或者旋转等变群,也可以是平移和旋转等变群。

在一些可选的实施方式中,群等变三维卷积神经网络分类模型是平移等变且旋转等变的。

然后,可以初始化初始群等变三维卷积神经网络分类模型的模型参数。

最后,将训练样本集合中的训练样本图像输入初始群等变三维卷积神经网络分类模型得到相应的图像类别,基于所得到的图像类别与该训练样本中样本标注信息之间的差异调整初始群等变三维卷积神经网络分类模型的模型参数,直到满足预设训练结束条件。

在一些可选的实施方式中,预设训练结束条件可以包括以下至少一项:

第一,用测试样本集合测试初始群等变三维卷积神经网络分类模型的准确率大于预设准确率阈值。其中,测试样本包括测试样本图像和用于表征该测试样本图像所属图像类别的样本标注信息。

可选地,测试样本集合的测试样本中测试样本图像包括所呈现的图像对象相对测试样本图像正向放置的正向测试样本图像和/或所呈现的图像对象相对测试样本图像旋转放置的非正向测试样本图像。

第二,所得到的图像类别与该训练样本中样本标注信息之间的差异小于预设差异阈值。

第三,调整初始群等变三维卷积神经网络分类模型的模型参数的次数大于等于预设调参次数阈值。

在一些可选的实施方式中,群等变三维卷积神经网络中卷积操作可定义如下:

其中,f为输入的特征图像,★表示互相关操作,t是平移参数,s是旋转参数,ψ为卷积函数,ψ

对于群等变三维卷积神经网络分类模型的输入层X=Z

C

按照上述定义的群等变三维卷积神经网络是平移和旋转等变的,可以提取平移和旋转不变特征,提高分类模型的鲁棒性。

步骤303,将初始群等变三维卷积神经网络分类模型确定为分类模型。

进一步参考图4,作为对上述各图所示方法的实现,本公开提供了一种视频分类装置的一个实施例,该装置实施例与图4所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图4所示,本实施例的视频分类装置400可以包括:图像确定单元401、分类单元402和视频类别确定单元403。其中,图像确定单元401,被配置成从待分类视频的视频帧图像中确定待识别图像;分类单元402,被配置成将所述待识别图像输入预先训练的分类模型,得到所述待识别图像对应的图像类别,其中,所述分类模型用于表征图像和图像对应的图像类别之间的对应关系,所得到的图像类别属于至少两个预设图像类别,所述分类模型为群等变三维卷积神经网络分类模型;视频类别确定单元403,被配置成基于所述待识别图像对应的图像类别确定所述待分类视频的视频类别。

在本实施例中,视频分类装置400的图像确定单元401、分类单元402和视频类别确定单元403的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202和步骤203的相关说明,在此不再赘述。

在一些可选的实施方式中,所述分类模型可以是通过如下训练步骤预先训练得到的:

获取训练样本集合,其中,训练样本包括训练样本图像和用于表征该训练样本图像所属图像类别的样本标注信息;

将所述训练样本集合中的训练样本图像输入初始群等变三维卷积神经网络分类模型得到相应的图像类别,基于所得到的图像类别与该训练样本中样本标注信息之间的差异调整所述初始群等变三维卷积神经网络分类模型的模型参数,直到满足预设训练结束条件;

将所述初始群等变三维卷积神经网络分类模型确定为所述分类模型。

在一些可选的实施方式中,所述预设训练结束条件可以包括以下至少一项:

用测试样本集合测试所述初始群等变三维卷积神经网络分类模型的准确率大于预设准确率阈值,所述测试样本包括测试样本图像和用于表征该测试样本图像所属图像类别的样本标注信息;

所得到的图像类别与该训练样本中样本标注信息之间的差异可以小于预设差异阈值;

调整所述初始群等变三维卷积神经网络分类模型的模型参数的次数可以大于等于预设调参次数阈值。

在一些可选的实施方式中,所述群等变三维卷积神经网络分类模型可以是平移等变且旋转等变的。

在一些可选的实施方式中,所述群等变三维卷积神经网络分类模型可以包括群等变三维卷积神经网络和分类器,所述群等变三维卷积神经网络中卷积操作定义如下:

其中,f为输入的特征图像,★表示互相关操作,t是平移参数,s是旋转参数,ψ为卷积函数,ψ

在一些可选的实施方式中,所述训练样本集合的训练样本中训练样本图像可以包括所呈现的图像对象相对训练样本图像正向放置的正向样本图像和/或所呈现的图像对象相对训练样本图像旋转放置的非正向样本图像。

在一些可选的实施方式中,所述分类器可以为线性分类器。

需要说明的是,本公开的实施例提供的视频分类装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的说明,在此不再赘述。

下面参考图5,其示出了适于用来实现本公开的电子设备的计算机系统500的结构示意图。图5示出的计算机系统500仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。

如图5所示,计算机系统500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有计算机系统500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许计算机系统500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备的计算机系统500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的实施例的方法中限定的上述功能。

需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备实现如图2所示的实施例及其可选实施方式示出的视频分类方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,视频类别确定单元还可以被描述为“基于待识别图像对应的图像类别确定待分类视频的视频类别的单元”。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

相关技术
  • 视频分类方法、视频分类装置、存储介质与电子设备
  • 一种视频分类方法、视频分类装置、电子设备及存储介质
技术分类

06120112985052