掌桥专利:专业的专利平台
掌桥专利
首页

基于轻量级分类器的分类方法、装置、电子设备及介质

文献发布时间:2023-06-19 19:27:02


基于轻量级分类器的分类方法、装置、电子设备及介质

技术领域

本申请涉及雷达目标识别技术领域,特别涉及一种基于轻量级分类器的分类方法、装置、电子设备及介质。

背景技术

基于雷达的人类动态姿势识别是一种使用雷达作为前端传感器、配套以雷达信号处理和识别技术以实现对于特定人类动态姿势的分类的新型人机交互方式,其工作流程大致包括向动态姿势发射雷达信号、接收雷达回波信号、信号处理、特征提取和分类等步骤。由于具有不依赖光照、低隐私泄露和无需接触等特点,基于雷达的人类动态姿势识别在一些特殊的设备和应用场景(如可穿戴设备、智能驾驶舱控制和虚拟/增强现实等)中,相较于基于鼠标、键盘、触摸屏等的传统交互方式更加自然和高效。

一种典型的用于人类动态姿势识别的雷达信号体制以及配套的信号处理和特征提取方法为:发射信号采用相参脉冲信号(Coherent Pulse Train);采用单通道或多通道的接收器接收回波信号;各通道的回波信号首先经过模数转换器(A/D Converter)转换为数字信号,进而通过I/Q解调得到基带信号,然后采用滑窗技术将该基带信号划分为若干帧,将每帧信号排列成二维矩阵的形式,并沿慢时间轴逐行做快速傅里叶变换(FastFourier Transform,FFT)得到距离-多普勒图;在每帧RDM(Range-Doppler Map,RDM)上提取诸如散射中心速度、距离、总能量等特征组成帧级特征向量,进而在既得帧级特征的基础上提取诸如平均值、最大值、最小值、标准差等统计特征,最后将所有帧级特征与统计特征拼接得到用于输入至分类器的特征向量。

用于基于雷达的人类动态姿势识别的分类算法主要面临以下三方面的技术挑战:(1)基于雷达的人类动态姿势样本采集及标注成本高,可用有标签样本数量有限,导致分类模型(如一些基于深度神经网络的复杂模型)容易过拟合;(2)不同人所演示的动态姿势在时间-空间维度上有显著的差异性,导致分类算法在面对新用户(即其动态姿势样本未用于训练的用户)时识别性能变差;(3)对于部署在轻量化平台上的系统,要求识别算法具有较小的模型尺寸和较低的计算复杂度。目前已有的用于基于雷达的人类动态姿势识别算法方案以离线监督式算法为主,例如随机森林(Random Forest,RF)、卷积神经网络(Convolutional Neural Network,CNN)长短时记忆(Long Short-Term Memory,LSTM)等;此类算法只能在预先采集好的有标签样本集上进行训练,由于可用样本集的容量往往较小,且通常情况下无法预先采集到用户的动态姿势样本,此类算法在实际使用过程中面对未知用户时无法保证识别性能。

针对上述问题,一种可能的解决方案是使用系统在工作过程中陆续采集的来自用户的无标签动态姿势样本在线地对分类器的结构或参数进行调整,以使其适应用户独特的动态姿势特点、提高面向该用户的个性化识别性能。

相关技术中,提出了一种伴随伪标签集中存取机制的基于极端随机森林的在线半监督学习分类器及其分类方法,该方案为每一定义的动态姿势类别分别设置两个二分类极端随机森林——参考子森林和增量子森林,其中在增量子森林的训练过程中,首先使用在离线条件下预先训练好的同组的参考子森林为新到达的无标签样本预测二元伪标签,之后根据参考子森林给出的概率对该伪标签样本进行筛选,若通过筛选,则将该伪标签样本存入特征缓存器模块,同时将其索引信息存入增量子森林,进而对增量子森林中满足特定条件的决策树进行增量分裂。

然而,该相关技术中,无标签样本流的利用效率较低,增量训练阶段的计算复杂度较高,并且触发增量训练的时刻和用户演示姿势的时刻耦合,为计算设备的资源分配造成困难。

发明内容

本申请提供一种基于轻量级分类器的分类方法、装置、电子设备及介质,解决离线采集训练样本成本高的问题以及离线监督式机器学习算法在未提供过训练样本的用户上的泛化性能低的问题,同时该算法具有较低的复杂度,可部署在轻量化平台上。

本申请第一方面实施例提供一种基于轻量级分类器的分类方法,包括以下步骤:获取待预测动态姿势样本;将所述待预测动态姿势样本输入至轻量级分类器,得到所述待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,所述轻量级分类器由离线样本集和/或在线输入的无标签样本训练得到;融合所述第一概率向量和第二概率向量得到目标概率向量,并根据所述目标概率向量选择概率最高的类别作为所述待预测动态姿势样本的标签。

可选地,在将所述待预测动态姿势样本输入至所述轻量级分类器之前,还包括:获取所述离线样本集,其中,所述离线样本集包括基于雷达的人类动态姿势样本集;确定待训练轻量级分类器,其中,所述待训练轻量级分类器包括基于决策树集成模型的参考模块、基于决策树集成模型的增量模块和具有预设采样机制的样本缓存模块;基于预设的训练算法,利用所述基于雷达的人类动态姿势样本集对所述参考模块中各二分类决策树集成模型进行预训练,得到初始轻量级分类器。

可选地,上述的基于轻量级分类器的分类方法,还包括:利用所述在线输入的无标签样本对所述增量模块、所述参考模块和所述样本缓存模块进行在线训练,得到所述轻量级分类器。

可选地,所述利用所述在线输入的无标签样本对所述增量模块、所述参考模块和所述样本缓存模块进行在线训练,包括:判断是否存在新到达无标签样本;如果存在所述新到达无标签样本,则通过所述参考模块为所述新到达无标签样本赋予伪标签,得到新伪标签样本,并根据所述新伪标签样本和所有历史伪标签样本得到伪标签预测结果;基于所述伪标签预测结果,更新所述参考模块中决策树的投票权重,并将所述新伪标签样本和所述新伪标签样本的索引信息存入所述样本缓存模块。

可选地,在判断是否存在所述新到达无标签样本之后,还包括:如果不存在所述新到达无标签样本,则判断所述样本缓存模块是否接收到采样命令,并在接收到所述采样命令时,指定所述增量模块中任一批次作为当前训练批次,并从所述样本缓存模块中根据所述预设的采样机制采样出多个伪标签样本和每个伪标签样本的索引信息输出至所述增量模块;对每个输入至所述增量模块的伪标签样本,沿所述当前训练批次中各决策树的决策路径找到各决策叶节点,将所述每个输入至所述增量模块的伪标签样本的索引信息存储至对应的索引池并更新伪标签计数器,并根据更新后的所述伪标签计数结果计算各决策叶节点的预设分裂准则;对于所述预设分裂准则数值大于预设分裂阈值的任一决策叶节点,依据所述任一决策叶节点索引池中所存储的索引信息,从所述样本缓存模块中取出对应的伪标签样本组成迷你训练集,并基于预设的决策树训练算法,在所述迷你训练集上对所述任一决策叶节点进行增量分裂。

可选地,在所述迷你训练集上对所述任一决策叶节点进行增量分裂之后,还包括:判断是否接收到暂停命令;若接收到所述暂停命令,则结束所述增量模块的增量训练阶段流程,否则,重新判断是否存在所述新到达无标签样本。

本申请第二方面实施例提供一种基于轻量级分类器的分类装置,包括:第一获取模块,用于获取待预测动态姿势样本;第二获取模块,用于将所述待预测动态姿势样本输入至轻量级分类器,得到所述待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,所述轻量级分类器由离线样本集和/或在线输入的无标签样本训练得到;分类模块,用于融合所述第一概率向量和第二概率向量得到目标概率向量,并根据所述目标概率向量选择概率最高的类别作为所述待预测动态姿势样本的标签。

可选地,在将所述待预测动态姿势样本输入至所述轻量级分类器之前,所述第二获取模块,还包括:确定待训练轻量级分类器,其中,所述待训练轻量级分类器包括基于决策树集成模型的参考模块、基于决策树集成模型的增量模块和具有预设采样机制的样本缓存模块;基于预设的训练算法,利用所述基于雷达的人类动态姿势样本集对所述参考模块中各二分类决策树集成模型进行预训练,得到初始轻量级分类器。

可选地,上述的基于轻量级分类器的分类装置,还包括:在线训练模块,用于利用所述在线输入的无标签样本对所述增量模块、所述参考模块和所述样本缓存模块进行在线训练,得到所述轻量级分类器。

可选地,所述在线训练模块,还用于:判断是否存在新到达无标签样本;如果存在所述新到达无标签样本,则通过所述参考模块为所述新到达无标签样本赋予伪标签,得到新伪标签样本,并根据所述新伪标签样本和所有历史伪标签样本得到伪标签预测结果;基于所述伪标签预测结果,更新所述参考模块中决策树的投票权重,并将所述新伪标签样本和所述新伪标签样本的索引信息存入所述样本缓存模块;

可选地,在判断是否存在所述新到达无标签样本之后,所述在线训练模块,还用于:如果不存在所述新到达无标签样本,则判断所述样本缓存模块是否接收到采样命令,并在接收到所述采样命令时,指定所述增量模块中任一批次作为当前训练批次,并从所述样本缓存模块中根据所述预设的采样机制采样出多个伪标签样本和每个伪标签样本的索引信息输出至所述增量模块;对每个输入至所述增量模块的伪标签样本,沿所述当前训练批次中各决策树的决策路径找到各决策叶节点,将所述每个输入至所述增量模块的伪标签样本的索引信息存储至对应的索引池并更新伪标签计数器,并根据更新后的所述伪标签计数结果计算各决策叶节点的预设分裂准则;对于所述预设分裂准则数值大于预设分裂阈值的任一决策叶节点,依据所述任一决策叶节点索引池中所存储的索引信息,从所述样本缓存模块中取出对应的伪标签样本组成迷你训练集,并基于预设的决策树训练算法,在所述迷你训练集上对所述任一决策叶节点进行增量分裂。

可选地,在所述迷你训练集上对所述任一决策叶节点进行增量分裂之后,所述在线训练模块,还用于:判断是否接收到暂停命令;若接收到所述暂停命令,则结束所述增量模块的增量训练阶段流程,否则,重新判断是否存在所述新到达无标签样本。

本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于轻量级分类器的分类方法。

本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的基于轻量级分类器的分类方法。

本申请通过将待预测动态姿势样本输入至轻量级分类器,得到待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,并融合得到目标概率向量,根据目标概率向量选择概率最高的类别作为待预测动态姿势样本的标签。由此,解决离线采集训练样本成本高的问题以及离线监督式机器学习算法在未提供过训练样本的用户上的泛化性能低的问题,同时该算法具有较低的复杂度,可部署在轻量化平台上。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本申请实施例提供的一种基于轻量级分类器的分类方法的流程图;

图2为根据本申请一个实施的预定义的8种动态手势;

图3为根据本申请一个实施的基于雷达的动态手势识别系统的工作流程的示意图;

图4为根据本申请一个实施的轻量级分类器的结构示意图;

图5为根据本申请一个实施的增量训练阶段流程示意图;

图6为根据本申请实施例的基于轻量级分类器的分类装置的方框示意图;

图7为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的基于轻量级分类器的分类方法、装置、电子设备及介质。针对上述背景技术中心提到的离线采集训练样本成本高的问题以及离线监督式机器学习算法在未提供过训练样本的用户上的泛化性能低的问题,本申请提供了一种基于轻量级分类器的分类方法,在该方法中,通过将待预测动态姿势样本输入至轻量级分类器,得到待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,并融合得到目标概率向量,根据目标概率向量选择概率最高的类别作为待预测动态姿势样本的标签。由此,解决离线采集训练样本成本高的问题以及离线监督式机器学习算法在未提供过训练样本的用户上的泛化性能低的问题,同时该算法具有较低的复杂度,可部署在轻量化平台上。

具体而言,图1为本申请实施例所提供的一种基于轻量级分类器的分类方法的流程图。

如图1所示,该基于轻量级分类器的分类方法包括以下步骤:

在步骤S101中,获取待预测动态姿势样本。

具体地,本申请实施例定义了8种待预测动态姿势,如图2所示,从手势1至手势8分别命名为“左划”、“右划”、“后撤”、“前探”、“张开”、“闭合”、“招手”和“滑动”。

其中,本申请实施例共有7位志愿者参与动态手势采集,其中每人在每类动态手势上共采集了100个样本,每个样本的采集时长为1秒。对该数据集进行划分以进行后续的训练和测试:将数据集分为7折,其中每折中包含一个离线训练集、一个增量训练集和一个测试集;每折指定一位不同的志愿者作为用户,离线训练集中包含6位非志愿者的全部有标签样本,增量训练集中包含来自用户的共400个样本(在8个手势类别上各有50个样本),这些样本的标签被剔除以模拟真实场景下系统采集无标签样本的情景,而测试集包含来自用户的剩余400个有标签样本。

在步骤S102中,将待预测动态姿势样本输入至轻量级分类器,得到待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,轻量级分类器由离线样本集和/或在线输入的无标签样本训练得到。

可选地,在一些实施例中,在将待预测动态姿势样本输入至轻量级分类器之前,还包括:获取离线样本集,其中,离线样本集包括基于雷达的人类动态姿势样本集;确定待训练轻量级分类器,其中,待训练轻量级分类器包括基于决策树集成模型的参考模块、基于决策树集成模型的增量模块和具有预设采样机制的样本缓存模块;基于预设的训练算法,利用基于雷达的人类动态姿势样本集对参考模块中各二分类决策树集成模型进行预训练,得到初始轻量级分类器。

可选地,在一些实施例中,上述的基于轻量级分类器的分类方法,还包括:利用在线输入的无标签样本对增量模块、参考模块和样本缓存模块进行在线训练,得到轻量级分类器。

其中,本申请实施例所采用的基于雷达的动态手势识别系统的工作流程如图3所示,采用40kHz的超声波雷达,发射信号体制为相参脉冲串,共有一个发射器和三个接收器,接收到三通道的回波信号后,首先对信号进行带通滤波以抑制混叠,接着通过数-模转换将其转化为数字信号,随之进行I/Q解调、降采样和FFT得到RDM流,对RDM流逐帧提取包括散射中心速度、位置、能量等帧级特征,进而在所得帧级特征的基础上提取包括平均值、最大值、最小值、标准差等统计特征,最终将帧级特征和统计特征进行拼接得到1080维的特征向量,用于输入至轻量级分类器,用于分类或增量训练。

其中,参考模块由多个二分类决策树集成模型组成,其中每一预定义的人类动态姿势类别均对应参考模块中的一个二分类决策树集成模型,参考模块中的决策树具有可变的投票权重;增量模块由多个二分类决策树集成模型组成,其中每一预定义的人类动态姿势类别均对应所述增量模块中的一个二分类决策树集成模型,增量模块依照训练时的先后顺序不同分为若干批次,每一批次中包含若干决策树,增量模块中决策树的每个叶子节点均包含一个索引池和一个伪标签计数器,索引池具有固定容量和特定的替换机制,用于暂存部分伪标签样本的索引,伪标签计数器对索引池规定的所有被索引样本的伪标签进行计数;样本缓存模块具有固定容量和预设的替换机制,用于暂存部分伪标签样本及其索引信息,样本缓存模块具有预设的采样机制,用于选择部分暂存的伪标签样本及其索引信息在系统指定的时刻输出至增量模块。

具体地,待训练轻量级分类器的结构如图4所示,待训练轻量级分类器由参考模块、增量模块和样本缓存模块组成。参考模块由8个二分类随机森林分类器组成,每个二分类随机森林分类器包含20棵决策树。增量模块由8个二分类随机森林分类器组成,每个二分类随机森林分类器包含50棵决策树;增量模块被分为5个批次,分别称为批次0、批次1、批次2、批次3和批次4,其中每个批次包含来自所有二分类随机森林分类器的各10棵决策树,各批次内包含的决策树彼此不交叠;增量模块中决策树叶子节点的索引池的容量设置为20,替换策略设置为随机替换。样本缓存模块由8个子缓存模块组成,其中每个子缓存模块存储一类伪标签样本,每个子缓存模块的容量为10,其替换策略为随机替换;样本缓存模块的采样策略为Max-Gini采样,具体地,Max-Gini采样方法指:当指定第i类手势为正类手势、非第i类手势为负类手势时,系统首先生成一个从0到1均匀分布的随机值,若该值大于0.5,则从第i个子缓存模块中随机抽取一个伪标签样本,否则随机选取一个非第i个的子缓存模块,从中随机抽取一个伪标签样本。

可选地,在一些实施例中,利用在线输入的无标签样本对增量模块、参考模块和样本缓存模块进行在线训练,包括:判断是否存在新到达无标签样本;如果存在新到达无标签样本,则通过参考模块为新到达无标签样本赋予伪标签,得到新伪标签样本,并根据新伪标签样本和所有历史伪标签样本得到伪标签预测结果;基于伪标签预测结果,更新参考模块中决策树的投票权重,并将新伪标签样本和新伪标签样本的索引信息存入样本缓存模块。

其中,参考模块为新到达无标签样本赋予伪标签中,首先,由参考模块中各二分类决策树集成模型给出待预测样本从属于各预定义动态姿势类别的概率,接着,选择对应概率最高的动态姿势类别作为该样本的伪标签。其中,概率的计算方法为:计算二分类决策树集成模型中正票数的加权和与所有票数的加权和的比值。

本申请实施例对上述分类器进行训练,具体地,在各折内分别先后进行离线训练和增量训练。在离线训练阶段,调用预设的训练算法(例如,随机森林训练算法、极端随机森林算法等)逐一完成对参考模块中各二分类随机森林分类器的训练。在训练第i类手势对应的二分类随机森林分类器时,首先对离线训练集进行标签二元化,即将所有第i类手势样本置为正例,将所有非第i类手势样本置为负例,在完成离线训练后,将参考模块中所有决策树的投票权重均初始化为1。在在线训练阶段,顺序输入增量训练集中的无标签样本,按照下述流程对分类器进行训练和调整:

具体地,如图5所示,若有新的无标签样本x到达,参考模块为新到达无标签样本x赋予伪标签

/>

其中,

接着,令

进一步,基于历史上的(包括本次的)伪标签预测结果,更新参考模块中决策树的投票权重,其方法为:

其中,

并将该伪标签样本及其索引信息存入样本缓存模块,将该伪标签样本及其索引信息存入第

可选地,在一些实施例中,在判断是否存在新到达无标签样本之后,还包括:如果不存在新到达无标签样本,则判断样本缓存模块是否接收到采样命令,并在接收到采样命令时,指定增量模块中任一批次作为当前训练批次,并从样本缓存模块中根据预设的采样机制采样出多个伪标签样本和每个伪标签样本的索引信息输出至增量模块;对每个输入至增量模块的伪标签样本,沿当前训练批次中各决策树的决策路径找到各决策叶节点,将每个输入至增量模块的伪标签样本的索引信息存储至对应的索引池并更新伪标签计数器,并根据更新后的伪标签计数结果计算各决策叶节点的预设分裂准则;对于预设分裂准则数值大于预设分裂阈值的任一决策叶节点,依据任一决策叶节点索引池中所存储的索引信息,从样本缓存模块中取出对应的伪标签样本组成迷你训练集,并基于预设的决策树训练算法,在迷你训练集上对任一决策叶节点进行增量分裂。其中,采样指由放回的采样。增量模块中的一个批次包含若干决策树,对批次进行初始化指将批次内的决策树进行一定程度的剪枝,例如只保留批次内决策树的根节点。其中,任一批次可以为按照预设规则确定的批次,也可以是随机确定的批次,在此不做具体限定。

应当理解的是,如果不存在新到达无标签样本,向增量模块中当前训练批次的累计输出样本数达到120,则切换至下一训练批次,且将该批次中的决策树均重置为根节点,则从样本缓存模块中根据Max-Gini采样机制向增量模块中每一个二分类随机森林分类器顺序输出20个伪标签样本及其索引信息,对于每一个输入至增量模块的伪标签样本,沿当前训练批次中各决策树的决策路径找到各决策叶节点,将其索引存入对应的索引池并更新伪标签计数器,若索引池容量已满,则采用预设的替换机制使用新到达的索引替换掉索引池中的某个既存项,根据更新后的伪标签计数结果计算各决策叶节点的预设分裂准则(例如基尼系数、信息熵等),对于基尼系数大于0.18(即预设分裂阈值)的每一决策叶节点,依据其索引池中所存储的索引,从样本缓存模块中取出对应的伪标签样本组成迷你训练集,进而调用预设的决策树训练算法,在迷你训练集上对决策叶节点进行增量分裂,即递归地生长决策叶节点的子孙节点。其中,从样本缓存模块中取出伪标签样本时不改变样本缓存模块中的既存项;对决策叶节点进行增量分裂是指将该叶节点作为根节点递归地生长其子孙节点,同时保持该节点与父节点的连接关系不变。

可选地,在一些实施例中,在迷你训练集上对任一决策叶节点进行增量分裂之后,还包括:判断是否接收到暂停命令;若接收到暂停命令,则结束增量模块的增量训练阶段流程,否则,重新判断是否存在新到达无标签样本。

可以理解的是,若系统给出暂停命令,则退出增量模块的增量训练阶段流程,否则重新判断是否存在新到达无标签样本。

在步骤S103中,融合第一概率向量和第二概率向量得到目标概率向量,并根据目标概率向量选择概率最高的类别作为待预测动态姿势样本的标签。

上述分类器的推理方法为:给定待预测标签的动态手势样本x,首先,由参考模块和增量模块分别给出x从属于各手势类别的第一概率向量和第二概率向量:

其中,

接着,对参考模块和增量模块给出的第一概率向量和第二概率向量进行线性加权得到目标概率向量:

最后,选择加权后概率最高的手势类别作为待预测动态姿势样本的标签:

在各折内分别对按照上述方法训练的分类器进行测试,具体地,结果如下表1所示:

表1

由上表可见分类器在各折内的测试性能经过在线训练后得到了显著提升,证明了分类器及其训练和推理方法在基于雷达的动态手势识别领域中利用在线采集的用户无标签样本改善面向用户的个性化识别性能的有效性。

在存储开销上,上述分类器在完成离线训练和增量训练后模型尺寸仅有0.5MB;在计算开销上,在一款搭载Intel i7-11800H CPU和16GB DDR4内存的笔记本电脑上,上述分类器进行一次推理的平均时间约为12ms,上述增量训练运行的平均时间约为15.2s,考虑到增量训练过程中共有400个无标签样本顺序输入,可知平均每个样本的处理时间仅约为38ms。由此可见,本申请实施例的分类器及其配套的训练和推理方法具有较低的存储开销和计算开销,适宜部署在轻量化的计算平台上。

本申请实施例相较于此前类似方案具有如下改进:

在分类器结构上:

(1)为参考模块中的决策树引入了可配置的投票权重;

(2)将增量模块分为在训练顺序上相互区别的若干批次;

在分类器的训练流程上:

(1)删除了对伪标签样本的筛选机制;

(2)增设了参考模块的投票权重自调整机制;

(3)改变了伪标签的预测机制:规定新到达的无标签样本由参考模块整体给出伪标签用以指示该样本属于预定义的动态姿势类别中的具体某一类别;

(4)改变了伪标签样本的流动机制:规定伪标签样本在被赋予伪标签后直接被存入样本缓存模块,后续在系统指定的时刻通过预设的采样机制将索引信息输出至增量模块;

(5)增设了增量模块的分批循环步进式的训练方式:规定将增量模块分为在训练顺序上相互区别的若干批次,从样本缓存模块中采样出的伪标签样本及其索引信息仅输出至系统当前指定的训练批次,而当系统切换训练批次时,首先对切换至的批次进行初始化。

本发明较前类似方案具有如下若干优势:

a)提高了无标签样本流的利用效率;

b)进一步提高了面向用户的个性化分类性能;

c)使增量模块中决策树发生增量分裂的时刻能够与用户演示动态姿势的时刻解耦,方便系统根据可供调配的计算资源的丰富程度情况选择进行增量分裂的时刻;

d)通过引入对增量模块分批循环步进式的训练方法,解决了增量模块中决策树的不可逆生长和用户姿势特点发生改变之间的矛盾,同时进一步降低了增

量训练阶段的计算复杂度。

综上,本申请实施例的有益效果如下所示:

(1)能够使用系统工作过程中在线采集的无标签动态姿势样本改善面向用户的个性化识别性能,解决了传统的离线监督式算法在面对新用户时性能下降的问题;

(2)扩充了可用于训练的样本集规模,降低了对于预先采集的基于雷达的动态姿势数据集的规模要求,从而节约了人力成本;

(3)算法具有较低的存储开销和计算复杂度,对轻量化的计算平台更加友好。

根据本申请实施例提出的基于轻量级分类器的分类方法,通过将待预测动态姿势样本输入至轻量级分类器,得到待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,并融合得到目标概率向量,根据目标概率向量选择概率最高的类别作为待预测动态姿势样本的标签。由此,解决离线采集训练样本成本高的问题以及离线监督式机器学习算法在未提供过训练样本的用户上的泛化性能低的问题,同时该算法具有较低的复杂度,可部署在轻量化平台上。

其次参照附图描述根据本申请实施例提出的基于轻量级分类器的分类装置。

图6是本申请实施例的基于轻量级分类器的分类装置的方框示意图。

如图6所示,该基于轻量级分类器的分类装置10包括:第一获取模块100、第二获取模块200和分类模块300。

其中,第一获取模块100,用于获取待预测动态姿势样本;第二获取模块200,用于将待预测动态姿势样本输入至轻量级分类器,得到待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,轻量级分类器由离线样本集和/或在线输入的无标签样本训练得到;分类模块300,用于融合第一概率向量和第二概率向量得到目标概率向量,并根据目标概率向量选择概率最高的类别作为待预测动态姿势样本的标签。

可选地,在一些实施例中,在将待预测动态姿势样本输入至轻量级分类器之前,第二获取模块200,还用于:确定待训练轻量级分类器,其中,待训练轻量级分类器包括基于决策树集成模型的参考模块、基于决策树集成模型的增量模块和具有预设采样机制的样本缓存模块;基于预设的训练算法,利用基于雷达的人类动态姿势样本集对参考模块中各二分类决策树集成模型进行预训练,得到初始轻量级分类器。

可选地,在一些实施例中,上述的基于轻量级分类器的分类装置10,还包括:在线训练模块,用于利用在线输入的无标签样本对增量模块、参考模块和样本缓存模块进行在线训练,得到轻量级分类器。

可选地,在一些实施例中,在线训练模块,还用于:判断是否存在新到达无标签样本;如果存在新到达无标签样本,则通过参考模块为新到达无标签样本赋予伪标签,得到新伪标签样本,并根据新伪标签样本和所有历史伪标签样本得到伪标签预测结果;基于伪标签预测结果,更新参考模块中决策树的投票权重,并将新伪标签样本和新伪标签样本的索引信息存入样本缓存模块。

可选地,在一些实施例中,在判断是否存在新到达无标签样本之后,在线训练模块,还用于:如果不存在新到达无标签样本,则判断样本缓存模块是否接收到采样命令,并在接收到采样命令时,指定增量模块中任一批次作为当前训练批次,并从样本缓存模块中根据预设的采样机制采样出多个伪标签样本和每个伪标签样本的索引信息输出至增量模块;对每个输入至增量模块的伪标签样本,沿当前训练批次中各决策树的决策路径找到各决策叶节点,将每个输入至增量模块的伪标签样本的索引信息存储至对应的索引池并更新伪标签计数器,并根据更新后的伪标签计数结果计算各决策叶节点的预设分裂准则;对于预设分裂准则数值大于预设分裂阈值的任一决策叶节点,依据任一决策叶节点索引池中所存储的索引信息,从样本缓存模块中取出对应的伪标签样本组成迷你训练集,并基于预设的决策树训练算法,在迷你训练集上对任一决策叶节点进行增量分裂。

可选地,在一些实施例中,在迷你训练集上对任一决策叶节点进行增量分裂之后,在线训练模块,还用于:判断是否接收到暂停命令;若接收到暂停命令,则结束增量模块的增量训练阶段流程,否则,重新判断是否存在新到达无标签样本。

需要说明的是,前述对基于轻量级分类器的分类方法实施例的解释说明也适用于该实施例的基于轻量级分类器的分类装置,此处不再赘述。

根据本申请实施例提出的基于轻量级分类器的分类装置,通过将待预测动态姿势样本输入至轻量级分类器,得到待预测动态姿势样本从属于各预设动态姿势类别的第一概率向量和第二概率向量,并融合得到目标概率向量,根据目标概率向量选择概率最高的类别作为待预测动态姿势样本的标签。由此,解决离线采集训练样本成本高的问题以及离线监督式机器学习算法在未提供过训练样本的用户上的泛化性能低的问题,同时该算法具有较低的复杂度,可部署在轻量化平台上。

图7为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:

存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。

处理器702执行程序时实现上述实施例中提供的基于轻量级分类器的分类方法。

进一步地,电子设备还包括:

通信接口703,用于存储器701和处理器702之间的通信。

存储器701,用于存放可在处理器702上运行的计算机程序。

存储器701可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

如果存储器701、处理器702和通信接口703独立实现,则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储器701、处理器702及通信接口703,集成在一块芯片上实现,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。

处理器702可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。

本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于轻量级分类器的分类方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 分类器训练方法、装置、电子设备及计算机可读介质
  • 基于聚类的分类方法、装置、存储介质和电子设备
  • 视频分类方法、装置、电子设备及计算机可读存储介质
  • 分类模型的处理方法、装置、电子设备及存储介质
  • 图像分类方法、装置、电子设备及存储介质
  • 基于基分类器的数据分类方法及装置、介质和电子设备
  • 基于二分类模型的多分类方法、装置、电子设备及介质
技术分类

06120115918689