掌桥专利:专业的专利平台
掌桥专利
首页

基于机器视觉的蛋糕烘焙生产控制方法及其系统

文献发布时间:2023-06-19 18:30:43


基于机器视觉的蛋糕烘焙生产控制方法及其系统

技术领域

本申请涉及智能控制领域,且更为具体地,涉及一种基于机器视觉的蛋糕烘焙生产控制方法及其系统。

背景技术

烘焙食品不仅营养丰富,更具有其他食品难以比拟的加工优势。小麦粉特有的面筋成分,使得烘焙食品不但可以加工成花样繁多、风格各异的许多形式,而且由于其面团的加工操作性、蒸烤胀发性、成品保藏性和食用方便性等特点,使它成为人类进人工业化时代以来,最有影响的工业化主食品。

在蛋糕烘焙生产过程中,最关键的环节是对烘烤温度的设定与调整。烘烤的温度对所烤蛋糕质量影响很大,烘烤温度太低,烤出的蛋糕顶部会下陷,内部较粗糙;烤制温度太高,则蛋糕顶部隆起,中央部分容易裂开,四边向里收缩,糕体较硬。

因此,期待一种优化的蛋糕烘焙生产控制方案。

发明内容

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于区块链的外币兑换方法及其系统,其通过基于对用户提交的外币兑换需求的理解和使用区块链网络查询的各个银行网点的兑换信息,根据两者之间的匹配度来确定最适配于用户需求的银行网点,以提高用户体验。

根据本申请的一个方面,提供了一种基于机器视觉的蛋糕烘焙生产控制方法,其包括:

获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频;

从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧;

将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图;

计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图;

将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量;

将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量;

计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;以及

将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧,包括:以预定采样频率从所述蛋糕烘烤监控视频提取所述多个蛋糕烘烤监控关键帧。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图,包括:从所述第一卷积神经网络模型的浅层提取浅层特征图;从所述第一卷积神经网络模型的深层提取深层特征图;以及,融合所述浅层特征图和所述深层特征图以得到所述烘烤监控特征图;其中,所述深层与所述浅层之间的比值大于等于5且小于等于10。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述浅层为所述第一卷积神经网络模型的第二层至第六层。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图,包括:计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的按位置差值以得到所述多个差分特征图。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量,包括:将所述多个差分特征图排列为三维特征张量后通过所述使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征图;以及,对所述烘烤状态变化特征图的沿通道维度的各个特征矩阵进行全局均值池化处理以得到所述烘烤状态变化特征向量。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量,包括:将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第一卷积层以得到第一邻域尺度烘烤温度特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第二卷积层以得到第二邻域尺度烘烤温度特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,将所述第一邻域尺度烘烤温度特征向量和所述第二邻域尺度烘烤温度特征向量进行级联以得到所述多尺度烘烤温度特征向量。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵,包括:以如下公式计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;

其中,所述公式为:

其中

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述将所述分类特征矩阵通过分类器以得到分类结果,包括:对所述分类特征矩阵进行高维数据流形优化以得到优化分类特征矩阵;将所述优化分类特征矩阵输入所述分类器以得到所述分类结果。

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述对所述分类特征矩阵进行高维数据流形优化以得到优化分类特征矩阵,包括:以如下公式对所述分类特征矩阵进行高维数据流形优化以得到优化分类特征矩阵;

其中,所述公式为:

其中

在上述基于机器视觉的蛋糕烘焙生产控制方法中,所述将所述优化分类特征矩阵输入所述分类器以得到所述分类结果,包括:使用所述分类器以如下公式对所述优化分类特征矩阵进行处理以获得分类结果,其中,所述公式为:

根据本申请的另一方面,提供了一种基于机器视觉的蛋糕烘焙生产控制系统,其包括:

数据与视频采集模块,用于获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频;

关键帧提取模块,用于从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧;

第一卷积模块,用于将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图;

差分模块,用于计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图;

第二卷积模块,用于将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量;

多尺度特征提取模块,用于将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量;

响应性估计模块,用于计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;以及

分类结果生成模块,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于机器视觉的蛋糕烘焙生产控制方法。

根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于机器视觉的蛋糕烘焙生产控制方法。

与现有技术相比,本申请提供的一种基于机器视觉的蛋糕烘焙生产控制方法及其系统,其通过基于深度学习的机器视觉技术,基于被烘焙对象的实时状态进行烘焙温度的自适应调整,以提高烘焙对象与烘焙温度之间的适配性,进而提高蛋糕烘焙质量和各批次烘焙蛋糕之间的一致性。

附图说明

通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法的应用场景图;

图2为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法的流程图;

图3为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法的架构示意图;

图4为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法中第一卷积神经网络编码过程的流程图;

图5为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法中第二卷积神经网络编码过程的流程图;

图6为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法中多尺度特征提取过程的流程图;

图7为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制系统的框图;

图8为根据本申请实施例的电子设备的框图。

具体实施方式

下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。

场景概述

如背景技术中所言,在蛋糕烘焙生产过程中,最关键的环节是对烘烤温度的设定与调整。烘烤的温度对所烤蛋糕质量影响很大,烘烤温度太低,烤出的蛋糕顶部会下陷,内部较粗糙;烤制温度太高,则蛋糕顶部隆起,中央部分容易裂开,四边向里收缩,糕体较硬。因此,期待一种优化的蛋糕烘焙生产控制方案。

相应地,在现有的蛋糕烘焙生产控制方案中,温度是以默认程序来控制,也就是,基于默认温度控制策略来配置烘烤温度值,但是因各批次的蛋糕原材料之间存在差异、烘焙前的预处理质量也略有不同,因此,默认温度控制策略无法确保蛋糕烘焙质量。

因此,在本申请的技术方案中,本申请的申请人尝试构建一种蛋糕烘焙生产温度自适应控制方案,其能够基于被烘焙对象的实时状态进行烘焙温度的自适应调整,以提高烘焙对象与烘焙温度之间的适配性,进而提高蛋糕烘焙质量和各批次烘焙蛋糕之间的一致性。

具体地,在本申请的技术方案中,首先由温度传感器采集预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集所述预定时间段的蛋糕烘烤监控视频。应可以理解,从蛋糕烘烤监控视频可以得到被烘焙蛋糕的实时表面状态特征以及实时表面状态特征的变化规律,这可以通过基于深度学习的深度神经网络作为特征提取器来实现。

并且,考虑到整个所述蛋糕烘烤监控视频中许多连续帧是重复的或者高度相似的,造成了信息冗余,增加后续模型计算量。针对这一问题,在特征提取前,先对所述蛋糕烘烤监控视频进行关键帧采样处理。在一个具体的示例中,以预定采样频率从所述蛋糕烘烤监控视频提取所述多个蛋糕烘烤监控关键帧,这里,预定采样频率并不是默认值,其可基于应用场景做自适应调整,对此,并不为本申请所局限。

在得到所述多个蛋糕烘烤监控关键帧,将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图。也就是,使用深度卷积神经网络模型作为特征提取器来进行烘焙蛋糕的表面状态特征提取。特别地,在本申请的技术方案中,考虑到在进行特征提取时,不仅要关注被烘焙对象的深层实质性特征变化,期待在此基础上,能够对蛋糕表面的颜色和纹理特征变化施予更高的关注度。基于此,在本申请的技术方案中,使用包含深浅特征融合模块的第一卷积神经网络模型作为特征提取器。

相较于标准的深度卷积神经网络模型,所述第一卷积神经网络模型在进行特征提取时,能够同时保留模型的浅层特征和深层特征,这里,所述模型的浅层特征集中于表现被烘焙对象的颜色、纹理、形状等,而模型的深层特征则表现被烘焙对象的深度实质性特征,比如,被烘焙对象的成熟度等。在申请一个具体的示例中,所述将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图,包括:从所述第一卷积神经网络模型的浅层提取浅层特征图;从所述第一卷积神经网络模型的深层提取深层特征图;以及,融合所述浅层特征图和所述深层特征图以得到所述烘烤监控特征图;其中,所述深层与所述浅层之间的比值大于等于5且小于等于10。更具体地,在该示例中,所述浅层为所述第一卷积神经网络模型的第二层至第六层。

在得到所述被烘焙对象在各个图像帧的实时表面状态特征后,计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图。也就是,以相邻图像帧的实时表面状态特征在高维特征空间之间的差分来表示被烘焙对象在时序空间中的特征分布变化模式。在一个具体的示例中,以每相邻两个烘烤监控特征图之间的按位置作差来得到所述差分特征图。

继而,将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量。这里相较于标准的深度卷积神经网络模型,所述第二卷积神经网络模型所使用的卷积核具有宽度维度、高度维度和通道维度,其中,在进行三维卷积编码的过程中,所述三维卷积核的通道维度对应于所述多个差分特征图的时间维度,因此,以所述使用三维卷积核的第二卷积神经网络模型对所述多个差分特征图进行三维卷积编码可得到被烘焙对象的在空间维度的特征在时序温度上的变化模式特征。

针对所述预定时间段内多个预定时间点的烘烤温度值,在本申请的技术方案中,将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量。也就是,先构造所述烘烤温度值的时序向量,进而以包含并行的多个一维卷积层的多尺度邻域特征提取模块对所述烘烤温度值的时序向量进行多尺度一维卷积编码以提取烘烤温度值在不同时间跨度内的温度变化模式特征。

进而,计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵。也就是,考虑到被烘焙对象的烘烤状态变化特征是因所述烘烤温度特征所引起,因此,两者在数据结构和空间中存在响应性关联,利用两者的数据隐含关联可基于所述烘烤状态变化特征向量来对所述多尺度烘烤温度特征向量的特征分布进行约束和优化以得到分类特征矩阵。进而,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小,这样,基于被烘焙对象的实时状态进行烘焙温度的自适应调整,以提高烘焙对象与烘焙温度之间的适配性,进而提高蛋糕烘焙质量和各批次烘焙蛋糕之间的一致性。

这里,由于所述烘烤状态变化特征向量具有所述多个关键帧的相邻关键帧的差分特征沿使用三维卷积核的第二卷积神经网络模型的通道维度分布,而所述多尺度烘烤温度特征向量具有沿时序方向的多尺度关联分布,且相邻关键帧的差分特征与预定时间点的烘烤温度值本身就在时序维度上不对齐,这就使得所述烘烤状态变化特征向量与所述多尺度烘烤温度特征向量之间存在特征分布的不一致,这样,计算其响应性估计所得到的分类特征矩阵也可能存在相对于整体分布的分布收敛异常,由此所述分类特征矩阵所代表的高维特征分布在转移到分类问题的目标域时可能存在归纳发散,影响训练速度和分类结果的准确性。

因此,在本申请的技术方案中,对所述分类特征矩阵进行面向类有界闭域的分布转移优化,具体为:

这里,针对所述分类特征矩阵的高维特征分布在转移到分类问题的目标域时可能存在的归纳发散,通过基于条件化分类的结构化信息约束来向着特征集合的有界闭域进行特征分布的收敛,以使得特征分布转移到目标域下的具有稳定的可结构化边界的范围内,这样,就提升了所述分类特征矩阵通过分类器的分类解的归纳迭代的稳定性,即,提高了模型的训练速度和分类结果的准确性。

基于此,本申请提出了一种基于机器视觉的蛋糕烘焙生产控制方法,其包括:获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频;从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧;将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图;计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图;将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量;将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量;计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;以及,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

图1为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法的应用场景图。如图1所示,在该应用场景中,通过温度传感器(例如,如图1中所示意的T)获取预定时间段内多个预定时间点的烘烤温度值,以及由摄像头(例如,如图1中所示意的C)获取所述预定时间段的蛋糕烘烤监控视频。接着,将上述信息输入至部署有用于基于机器视觉的蛋糕烘焙生产控制算法的服务器(例如,图1中的S)中,其中,所述服务器能够以所述基于机器视觉的蛋糕烘焙生产控制算法对上述输入的信息进行处理,以生成用于表示当前时间点的烘烤温度值应增大或应减小的分类结果。

在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图2为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法的流程图。如图2所示,根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法,包括步骤:S110,获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频;S120,从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧;S130,将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图;S140,计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图;S150,将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量;S160,将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量;S170,计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;以及,S180,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

图3为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法的架构示意图。如图3所示,在该网络结构中,首先,获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频;从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧;接着,将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图;并计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图;然后,将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量;同时,将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量;计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;进而,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

具体地,在步骤S110中,获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频,并从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧。考虑到在蛋糕烘焙的过程中,烘烤温度值对蛋糕烘焙质量的影响很大,烘烤温度太低,烤出的蛋糕顶部会下陷,内部较粗糙;烤制温度太高,则蛋糕顶部隆起,中央部分容易裂开,四边向里收缩,糕体较硬。因此,在本申请的技术方案中,基于被烘焙对象的实时状态进行烘焙温度的自适应调整,也就是,采用深度学习的深度神经网络来作为特征提取器对被烘焙对象的状态进行实时监控,得到被烘焙蛋糕的实时表面状态特征以及实时表面状态特征的变化规律,并根据提取出的特征进行烘焙温度的自适应调整,因此,在本申请的一个具体示例中,可通过温度传感器来获取预定时间段内多个预定时间点的烘烤温度值,以及由摄像头来获取所述预定时间段的蛋糕烘烤监控视频。

具体地,在步骤S120中,从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧。考虑到整个所述蛋糕烘烤监控视频中许多连续帧是重复的或者高度相似的,造成了信息冗余,增加后续模型计算量。针对这一问题,在特征提取前,先对所述蛋糕烘烤监控视频进行关键帧采样处理。在一个具体的示例中,以预定采样频率从所述蛋糕烘烤监控视频提取所述多个蛋糕烘烤监控关键帧,也就是,以预定采样频率从所述蛋糕烘烤监控视频提取多个图像帧,并将所述多个图像帧设定为所述多个蛋糕烘烤监控关键帧,这里,预定采样频率并不是默认值,其可基于应用场景做自适应调整,对此,并不为本申请所局限。

具体地,在步骤S130中,将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图。应可以理解,在得到所述多个蛋糕烘烤监控关键帧后,将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图。也就是,使用深度卷积神经网络模型作为特征提取器来进行烘焙蛋糕的表面状态特征提取。特别地,在本申请的技术方案中,考虑到在进行特征提取时,不仅要关注被烘焙对象的深层实质性特征变化,期待在此基础上,能够对蛋糕表面的颜色和纹理特征变化施予更高的关注度。基于此,在本申请的技术方案中,使用包含深浅特征融合模块的第一卷积神经网络模型作为特征提取器。相较于标准的深度卷积神经网络模型,所述第一卷积神经网络模型在进行特征提取时,能够同时保留模型的浅层特征和深层特征,这里,所述模型的浅层特征集中于表现被烘焙对象的颜色、纹理、形状等,而模型的深层特征则表现被烘焙对象的深度实质性特征,比如,被烘焙对象的成熟度等。

在申请一个具体的示例中,所述将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图,包括:从所述第一卷积神经网络模型的浅层提取浅层特征图;从所述第一卷积神经网络模型的深层提取深层特征图;以及,融合所述浅层特征图和所述深层特征图以得到所述烘烤监控特征图;其中,所述深层与所述浅层之间的比值大于等于5且小于等于10。更具体地,在该示例中,所述浅层为所述第一卷积神经网络模型的第二层至第六层。

在一个具体示例中,所述第一卷积神经网络包括相互级联的多个神经网络层,其中各个神经网络层包括卷积层、池化层和激活层。其中,在所述第一卷积神经网络的编码过程中,所述第一卷积神经网络的各层在层的正向传递过程中对输入数据使用所述卷积层进行基于卷积核的卷积处理、使用所述池化层对由所述卷积层输出的卷积特征图进行池化处理和使用所述激活层对由所述池化层输出的池化特征图进行激活处理,其中,第一卷积神经网络的第一层的输入数据为所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧。这里,所述第一卷积神经网络的各层都可以输出特征图。在本申请的技术方案中,从所述第一卷积神经网络的浅层(如m层)提取浅层特征图,所述第一卷积神经网络的深层(如n层)提取深层特征图。值得一提的是,这里,m的取值范围为2-6层,n大于m。应可以理解,所述卷积神经网络在其2到6层,提取的是被烘焙对象的颜色、纹理、形状等浅层特征,再往下,提取的是被烘焙对象的成熟度等深度实质性特征。这样,就可以分别提取出所述各个蛋糕烘烤监控关键帧的浅层特征和深层特征,以更好地利用所述被烘培对象的不同特征信息来进行准确地判断。所述模型的浅层特征集中于表现被烘焙对象的颜色、纹理、形状等,而模型的深层特征则表现被烘焙对象的深度实质性特征,比如,被烘焙对象的成熟度等。

然后,融合所述浅层特征图和所述深层特征图以得到所述烘烤监控特征图,可以包括:对于每一个关键帧,将提取到的所述浅层特征图和所述深层特征图进行按位置加和以得到对应的烘烤监控特征图,因此,将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型进行特征提取,可以得到多个烘烤监控特征图。因此,每个烘烤监控特征图可以用于表征被烘培对象在对应图像帧的实时表面状态特征,即不仅包含了颜色、纹理、形状等浅层特征,而且还包含了成熟度等深层特征。这样,被烘烤对象的实时表面状态特征可以用于在后续进行烘培控制时判断当前时间点的烘烤温度值应增大或应减小的决策准确度。

图4为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法中第一卷积神经网络编码过程的流程图。如图4所示,在所述第一卷积神经网络编码过程中,包括:S210,从所述第一卷积神经网络模型的浅层提取浅层特征图;S220,从所述第一卷积神经网络模型的深层提取深层特征图;以及,S230,融合所述浅层特征图和所述深层特征图以得到所述烘烤监控特征图;其中,所述深层与所述浅层之间的比值大于等于5且小于等于10。

具体地,在步骤S140中,计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图。应可以理解,在得到所述被烘焙对象在各个图像帧的实时表面状态特征后,计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图。也就是,以相邻图像帧的实时表面状态特征在高维特征空间之间的差分来表示被烘焙对象在时序空间中的特征分布变化模式。在一个具体的示例中,以每相邻两个烘烤监控特征图之间的按位置作差来得到所述差分特征图。

具体地,在步骤S150中,将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量。也就是,将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量。这里相较于标准的深度卷积神经网络模型,所述第二卷积神经网络模型所使用的卷积核具有宽度维度、高度维度和通道维度,其中,在进行三维卷积编码的过程中,所述三维卷积核的通道维度对应于所述多个差分特征图的时间维度,因此,以所述使用三维卷积核的第二卷积神经网络模型对所述多个差分特征图进行三维卷积编码可得到被烘焙对象的在空间维度的特征在时序温度上的变化模式特征。

图5为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法中第二卷积神经网络编码过程的流程图。如图5所示,在所述第二卷积神经网络编码过程中,包括:S310,将所述多个差分特征图排列为三维特征张量后通过所述使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征图;以及,S320,对所述烘烤状态变化特征图的沿通道维度的各个特征矩阵进行全局均值池化处理以得到所述烘烤状态变化特征向量。

在一个具体示例中,在步骤S310中,所述第二卷积神经网络的各层在层的正向传递中分别对输入数据进行:使用卷积模块以三维卷积核对输入数据进行三维卷积编码以得到卷积特征图;使用池化模块对所述卷积特征图进行池化处理以得到池化特征图;以及,使用激活模块对所述池化特征图的各个位置的特征值进行非线性激活以得到烘烤状态变化特征图;其中,所述第二卷积神经网络的第一层的输入为将所述多个差分特征图排列得到的三维特征张量,所述第二卷积神经网络的最后一层的输出为所述烘烤状态变化特征图。

具体地,所述第二卷积神经网络的第一卷积层的输入数据为所述三维特征张量,以及,所述第二卷积神经网络的各层在层的正向传递中分别对输入数据进行基于三维卷积核的卷积处理、基于特征矩阵的均值池化处理、基于非线性激活处理,以由所述第二卷积神经网络的最后一层输出所述烘烤状态变化特征图。在进行三维卷积编码的过程中,所述三维卷积核的通道维度对应于所述多个差分特征图的时间维度,因此,以所述使用三维卷积核的第二卷积神经网络模型对所述多个差分特征图进行三维卷积编码可得到被烘焙对象的在空间维度的特征在时序维度上的变化模式特征,即烘烤状态变化特征图。这样,被烘烤对象在时序维度上的烘烤状态变化特征可以用于在后续进行烘培控制时判断当前时间点的烘烤温度值应增大或应减小的决策准确度。

具体地,在步骤S160中,将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量。针对所述预定时间段内多个预定时间点的烘烤温度值,在本申请的技术方案中,将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量。也就是,先构造所述烘烤温度值的时序向量,进而以包含并行的多个一维卷积层的多尺度邻域特征提取模块对所述烘烤温度值的时序向量进行多尺度一维卷积编码以提取烘烤温度值在不同时间跨度内的温度变化模式特征。

图6为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法中多尺度特征提取过程的流程图。如图6所示,在所述多尺度特征提取过程中,包括:S410,将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第一卷积层以得到第一邻域尺度烘烤温度特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;S420,将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第二卷积层以得到第二邻域尺度烘烤温度特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,S430,将所述第一邻域尺度烘烤温度特征向量和所述第二邻域尺度烘烤温度特征向量进行级联以得到所述多尺度烘烤温度特征向量。其中,所述将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第一卷积层以得到第一邻域尺度烘烤温度特征向量,包括:使用所述多尺度邻域特征提取模块的第一卷积层以如下公式对所述烘烤温度输入向量进行一维卷积编码以得到第一邻域尺度烘烤温度特征向量;

其中,所述公式为:

其中,

其中,所述公式为:

其中,b为第二卷积核在

其中,所述公式为:

其中,

具体地,在步骤S170中,计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵。也就是,考虑到被烘焙对象的烘烤状态变化特征是因所述烘烤温度特征所引起,因此,两者在数据结构和空间中存在响应性关联,利用两者的数据隐含关联可基于所述烘烤状态变化特征向量来对所述多尺度烘烤温度特征向量的特征分布进行约束和优化以得到分类特征矩阵。

在本申请的一个具体示例中,所述计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵,包括:以如下公式计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;

其中,所述公式为:

其中

具体地,在步骤S180中,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

在本申请的一个具体示例中,所述将所述分类特征矩阵通过分类器以得到分类结果,包括:对所述分类特征矩阵进行高维数据流形优化以得到优化分类特征矩阵;以及,将所述优化分类特征矩阵输入所述分类器以得到所述分类结果。

特别地,由于所述烘烤状态变化特征向量具有所述多个关键帧的相邻关键帧的差分特征沿使用三维卷积核的第二卷积神经网络模型的通道维度分布,而所述多尺度烘烤温度特征向量具有沿时序方向的多尺度关联分布,且相邻关键帧的差分特征与预定时间点的烘烤温度值本身就在时序维度上不对齐,这就使得所述烘烤状态变化特征向量与所述多尺度烘烤温度特征向量之间存在特征分布的不一致,这样,计算其响应性估计所得到的分类特征矩阵也可能存在相对于整体分布的分布收敛异常,由此所述分类特征矩阵所代表的高维特征分布在转移到分类问题的目标域时可能存在归纳发散,影响训练速度和分类结果的准确性。因此,在本申请的技术方案中,对所述分类特征矩阵进行面向类有界闭域的分布转移优化,具体为:

其中

具体地,所述将所述优化分类特征矩阵输入所述分类器以得到所述分类结果,包括:将所述优化分类特征矩阵基于行向量或列向量展开为分类特征向量;使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

更具体地,使用所述分类器以如下公式对所述优化分类特征矩阵进行处理以获得分类结果,其中,所述公式为:

具体地,所述分类器包括多个全连接层和与所述多个全连接层最后一个全连接层级联的Softmax层。其中,在所述分类器的分类处理中,首先将所述所述优化分类特征矩阵投影为向量,例如,在一个具体的示例中,将所述优化分类特征矩阵沿着行向量或者列向量进行展开为分类特征向量;然后,使用所述分类器的多个全连接层对所述分类特征向量进行多次全连接编码以得到编码分类特征向量;进而,将所述编码分类特征向量输入所述分类器的Softmax层,即,使用所述Softmax分类函数对所述编码分类特征向量进行分类处理以得到所述编码分类特征向量归属于当前时间点的烘烤温度值应增大的第一概率值和所述编码分类特征向量归属于当前时间点的烘烤温度值应减小的第二概率值;继而,将所述第一概率值和所述第二概率值中较大者对应的标签确定为所述分类结果,即,如果第一概率值大于第二概率值,则所述分类结果为当前时间点的烘烤温度值应减小,如果第二概率值大于第一概率值,则所述分类结果为当前时间点的烘烤温度值应增大。

继而,可以基于所述分类结果来调整所述蛋糕烘焙设备的烘烤温度值。综上,根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制方法被阐明,其通过基于深度学习的机器视觉技术,基于被烘焙对象的实时状态进行烘焙温度的自适应调整,以提高烘焙对象与烘焙温度之间的适配性,进而提高蛋糕烘焙质量和各批次烘焙蛋糕之间的一致性。

示例性系统

图7为根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制系统的框图。如图7所示,根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制系统300,包括:数据与视频采集模块310;关键帧提取模块320;第一卷积模块330;差分模块340;第二卷积模块350;多尺度特征提取模块360;响应性估计模块370;以及,分类结果生成模块380。

其中,所述数据与视频采集模块310,用于获取由温度传感器采集的预定时间段内多个预定时间点的烘烤温度值以及由摄像头采集的所述预定时间段的蛋糕烘烤监控视频;所述关键帧提取模块320,用于从所述蛋糕烘烤监控视频提取多个蛋糕烘烤监控关键帧;所述第一卷积模块330,用于将所述多个蛋糕烘烤监控关键帧中各个蛋糕烘烤监控关键帧分别输入包含深浅特征融合模块的第一卷积神经网络模型以得到多个烘烤监控特征图;所述差分模块340,用于计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的差分以得到多个差分特征图;所述第二卷积模块350,用于将所述多个差分特征图通过使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征向量;所述多尺度特征提取模块360,用于将所述多个预定时间点的烘烤温度值排列为输入向量后通过多尺度邻域特征提取模块以得到多尺度烘烤温度特征向量;所述响应性估计模块370,用于计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;以及,所述分类结果生成模块380,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的烘烤温度值应增大或应减小。

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述关键帧提取模块320,包括:以预定采样频率从所述蛋糕烘烤监控视频提取所述多个蛋糕烘烤监控关键帧。

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述第一卷积模块330,包括:从所述第一卷积神经网络模型的浅层提取浅层特征图;从所述第一卷积神经网络模型的深层提取深层特征图;以及,融合所述浅层特征图和所述深层特征图以得到所述烘烤监控特征图;其中,所述浅层为所述第一卷积神经网络模型的第二层至第六层,所述深层与所述浅层之间的比值大于等于5且小于等于10。

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述差分模块340,包括:计算所述多个烘烤监控特征图中每相邻两个烘烤监控特征图之间的按位置差值以得到所述多个差分特征图。

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述第二卷积模块350,包括:将所述多个差分特征图排列为三维特征张量后通过所述使用三维卷积核的第二卷积神经网络模型以得到烘烤状态变化特征图;以及,对所述烘烤状态变化特征图的沿通道维度的各个特征矩阵进行全局均值池化处理以得到所述烘烤状态变化特征向量。

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述多尺度特征提取模块360,包括:将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第一卷积层以得到第一邻域尺度烘烤温度特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;将所述烘烤温度输入向量输入所述多尺度邻域特征提取模块的第二卷积层以得到第二邻域尺度烘烤温度特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,将所述第一邻域尺度烘烤温度特征向量和所述第二邻域尺度烘烤温度特征向量进行级联以得到所述多尺度烘烤温度特征向量。

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述响应性估计模块370,包括:以如下公式计算所述多尺度烘烤温度特征向量相对于所述烘烤状态变化特征向量的响应性估计以得到分类特征矩阵;

其中,所述公式为:

其中

在一个示例中,在上述基于机器视觉的蛋糕烘焙生产控制系统300中,所述分类结果生成模块380,包括:优化单元,用于对所述分类特征矩阵进行高维数据流形优化以得到优化分类特征矩阵;分类单元,用于将所述优化分类特征矩阵输入所述分类器以得到所述分类结果。其中,所述优化单元,包括:以如下公式对所述分类特征矩阵进行高维数据流形优化以得到优化分类特征矩阵;

其中,所述公式为:

其中

综上,根据本申请实施例的基于机器视觉的蛋糕烘焙生产控制系统300被阐明,其通过基于深度学习的机器视觉技术,基于被烘焙对象的实时状态进行烘焙温度的自适应调整,以提高烘焙对象与烘焙温度之间的适配性,进而提高蛋糕烘焙质量和各批次烘焙蛋糕之间的一致性。

示例性电子设备

下面,参考图8来描述根据本申请实施例的电子设备。

图8图示了根据本申请实施例的电子设备的框图。

如图8所示,电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于机器视觉的蛋糕烘焙生产控制方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如差分特征图等各种内容。

在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图8中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于机器视觉的蛋糕烘焙生产控制方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于机器视觉的蛋糕烘焙生产控制方法中的功能中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

相关技术
  • 一种基于机器视觉的工件冲压系统及其控制方法
  • 一种基于机器视觉的蛋糕无菌生产控制方法及系统
  • 一种基于机器视觉的蛋糕无菌生产控制方法及系统
技术分类

06120115593157