基于知识蒸馏的电气设备智能控制方法、装置及系统

文献发布时间：2024-04-18 19:53:33

技术领域

本申请适用于电气设备技术领域，尤其涉及一种基于知识蒸馏的电气设备智能控制方法、装置及系统。

背景技术

随着电力产业的发展，各种品类的电气设备被应用于生活、生产等场景中，由于电气设备的种类以及数量繁多，因此，需要使用一定数量的电气设备控制系统对所有的电气设备进行智能控制。目前，现有的电气设备智能控制方式为通过实时监测电气设备的电压、电流、环境等状态来及时调整对应的电气设备，从而提高用户的智能化体验，但是，一般情况下电气设备的调整策略是由出厂或者人工调节等预先设置的，在使用的过程中不能够跟随用户的需求进行定制或者改变，从而导致用户的体验较差，可见，目前电气设备智能控制方式的泛化性较差，导致使用具备局限性。因此，如何提高电气设备控制智能化，使得控制按照用户需求动态调节，以提高电气设备智能控制的泛化性成为亟需解决的问题。

发明内容

有鉴于此，本申请实施例提供了一种基于知识蒸馏的电气设备智能控制方法、装置及系统，以解决如何提高电气设备控制智能化，使得控制按照用户需求动态调节，以提高电气设备智能控制的泛化性的问题。

第一方面，本申请实施例提供一种基于知识蒸馏的电气设备智能控制方法，所述电气设备智能控制方法包括：

获取目标场景在当前时刻下所有电气设备的实时运行数据，以及对应每个电气设备的传感器采集的实时感知数据，将所述实时运行数据和所述实时感知数据输入预设的决策模型，输出下一时刻的实时决策数据；

获取所述预设的决策模型在训练时的训练数据集合，以及使用所述预设的决策模型对所述训练数据集合中每个训练数据进行决策的历史决策数据，其中，所述训练数据均包括所述目标场景在一历史时刻下所有电气设备的历史运行数据以及对应每个电气设备的传感器采集的历史感知数据；

针对任一电气设备，基于用户针对所述电气设备输入的约束条件生成约束损失函数，根据所述约束损失函数与所述预设的决策模型的原始损失函数，得到微调损失函数，使用所述微调损失函数更新对应所述电气设备的决策子模型的损失函数，得到更新的决策子模型，其中，所述决策子模型为基于所述预设的决策模型蒸馏学习得到；

从每个训练数据中确定对应所述电气设备的历史运行子数据以及对应所述电气设备的传感器采集的历史感知子数据，从所述历史决策数据中确定对应所述电气设备的历史决策子数据，使用所述历史运行子数据、所述历史感知子数据和所述历史决策子数据训练所述更新的决策子模型，得到训练好的决策子模型；

将所述实时运行数据中对应所述电气设备的实时运行子数据和所述实时感知数据中对应电气设备的实时感知子数据输入所述训练好的决策子模型，输出下一时刻的实时决策子数据；

若所述实时决策子数据与从所述实时决策数据中确定的对应所述电气设备的子数据不相同，则执行所述实时决策子数据以控制对应的电气设备。

第二方面，本申请实施例提供一种基于知识蒸馏的电气设备智能控制装置，所述电气设备智能控制装置包括：

决策数据确定模块，用于获取目标场景在当前时刻下所有电气设备的实时运行数据，以及对应每个电气设备的传感器采集的实时感知数据，将所述实时运行数据和所述实时感知数据输入预设的决策模型，输出下一时刻的实时决策数据；

训练数据获取模块，用于获取所述预设的决策模型在训练时的训练数据集合，以及使用所述预设的决策模型对所述训练数据集合中每个训练数据进行决策的历史决策数据，其中，所述训练数据均包括所述目标场景在一历史时刻下所有电气设备的历史运行数据以及对应每个电气设备的传感器采集的历史感知数据；

决策子模型确定模块，用于针对任一电气设备，基于用户针对所述电气设备输入的约束条件生成约束损失函数，根据所述约束损失函数与所述预设的决策模型的原始损失函数，得到微调损失函数，使用所述微调损失函数更新对应所述电气设备的决策子模型的损失函数，得到更新的决策子模型，其中，所述决策子模型为基于所述预设的决策模型蒸馏学习得到；

决策子模型训练模块，用于从每个训练数据中确定对应所述电气设备的历史运行子数据以及对应所述电气设备的传感器采集的历史感知子数据，从所述历史决策数据中确定对应所述电气设备的历史决策子数据，使用所述历史运行子数据、所述历史感知子数据和所述历史决策子数据训练所述更新的决策子模型，得到训练好的决策子模型；

决策子数据确定模块，用于将所述实时运行数据中对应所述电气设备的实时运行子数据和所述实时感知数据中对应电气设备的实时感知子数据输入所述训练好的决策子模型，输出下一时刻的实时决策子数据；

决策控制模块，用于若所述实时决策子数据与从所述实时决策数据中确定的对应所述电气设备的子数据不相同，则执行所述实时决策子数据以控制对应的电气设备。

第三方面，本申请实施例提供一种基于知识蒸馏的电气设备智能控制系统，所述电气设备智能控制系统连接目标场景下所有的电气设备和传感器，所述电气设备智能控制系统包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的电气设备智能控制方法。

本申请实施例与现有技术相比存在的有益效果是：本申请获取目标场景在当前时刻下所有电气设备的实时运行数据，以及对应每个电气设备的传感器采集的实时感知数据，使用预设的决策模型计算下一时刻的实时决策数据，基于预设的决策模型在训练时的训练数据集合，以及使用预设的决策模型对训练数据集合中每个训练数据进行决策的历史决策数据，基于用户针对任一电气设备输入的约束条件生成约束损失函数，根据约束损失函数与预设的决策模型的原始损失函数，得到微调损失函数，使用微调损失函数更新对应电气设备的决策子模型的损失函数，得到更新的决策子模型，从训练数据集合中确定对应的历史运行子数据和历史感知子数据，从历史决策数据中确定对应的历史决策子数据，使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型，将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据，若实时决策子数据与从实时决策数据中确定的对应电气设备的子数据相同，则执行实时决策子数据以控制对应的电气设备，否则生成告警，通过对用户输入的约束条件进行训练，使用训练好的决策子模型对实时数据进行再决策，并与原始的决策模型的决策结果进行比较，以得到准确地控制结果，使得控制按照用户需求动态调节，提高了电气设备智能控制的泛化性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一提供的一种基于知识蒸馏的电气设备智能控制方法的流程示意图；

图2是本申请实施例二提供的一种基于知识蒸馏的电气设备智能控制装置的结构示意图；

图3是本申请实施例三提供的一种基于知识蒸馏的电气设备智能控制系统的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

应理解，以下实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

为了说明本申请的技术方案，下面通过具体实施例来进行说明。

本申请的电气设备智能控制方法应用在多个电气设备的统筹控制场景中，场景可以包括智能楼宇、智能家居、智能工厂等场景，对场景内包含的所有电气设备的运行数据进行采集，例如，对于智能家居而言，电气设备可以包括空调、电风扇、灯光、窗帘、新风等。具体地，该电气设备智能控制方法由电气设备智能控制系统承接，该系统由包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personalcomputer，UMPC)、上网本、服务端计算机设备、个人数字助理(personal digitalassistant，PDA)等计算机设备构成。

参见图1，是本申请实施例一提供的一种基于知识蒸馏的电气设备智能控制方法的流程示意图，控制系统对应的计算设备连接场景中的所有的电气设备进行数据获取，另外，还连接场景中的传感器等采集设备，以采集场景中的环境数据。如图1所示，该基于知识蒸馏的电气设备智能控制方法可以包括以下步骤：

步骤S101，获取目标场景在当前时刻下所有电气设备的实时运行数据，以及对应每个电气设备的传感器采集的实时感知数据，将实时运行数据和实时感知数据输入预设的决策模型，输出下一时刻的实时决策数据。

本申请中，运行数据可以是指电气设备的设备标识m、状态标识n和状态参数k，为便于运算，可将运行数据表示为(m、n、k)，其中，状态参数k可以是一个高维的向量，表示为(k_1、k_2、…、k_q)，q根据具体的电气设备确定，例如，对于灯光设备，状态参数可以包括亮度、灯光颜色两个参数，则q为2，又如，对于空调设备，状态参数可以包括冷/热风、温度、扫风模式、环保模式四个参数，则q为4。

例如，对于灯光设备的运行数据而言，运行数据表示为(1、1、2、3)，第一个位置的1表示设备标识为1的设备，第二个位置的1表示设备处于开启状态(如0为关闭，1为开启)，第三个位置的2表示亮度这一状态状态参数为2，第四个位置的3表示灯光颜色这一状态参数为白光。

传感器用于获取目标场景的一些数据信息即感知数据，例如，温度传感器可以采集环境温度，亮度传感器可以采集环境亮度等。本申请中，电气设备与传感器关联，也即电气设备会有下属的传感器来获取感知数据。传感器对应的感知数据中包含与其关联的电气设备的标识，例如，空调设备与温度传感器关联，温度传感器的感知数据可以表示为(a、b、c)，a表示温度传感器的标识，b表示温度传感器的参数，c表示空调设备的标识。

需要说明的是，单个传感器可以与多个电气设备关联，例如，室内光照传感器与灯光设备和窗帘设备有关，此时，电器设备的标识也可以采用高维向量表示。当然，如果是将电气设备与关联的传感器的感知数据映射的情况，此时，感知数据中可以仅包括传感器的标识和传感器的参数。

为了提高数据处理的一致性，对所有设备数据的表示进行尺寸归一化，针对尺寸较小的运行数据，可以通过添加预设标志位来增加尺寸长度，例如，预设标志位为NULL，灯光设备的运行数据中状态参数数量为2个，若要与空调设备的运行数据(其中空调设备的状态参数数量为4个，如(2、1、1、26、0、0))的尺寸相同，则灯光设备的运行数据可以表示为(1、1、2、3，NULL、NULL)，此时与空调设备的运行数据的尺寸一致。当然，如果存在其他尺寸更长的电气设备，则以该最长尺寸增加预设标志位。另外，与运行数据的表示方式类似，感知数据也需要进行尺寸归一化，也采用添加预设标志位的方式实现。

在后续的运算中，可以以矩阵的形式体现数据，即将多个运行数据拼接为运行矩阵，且将多个感知数据拼接为感知矩阵，上述拼接的方式可以行拼接或者列拼接，行拼接可以是指一个电气设备的运行数据作为矩阵的一行，执行上下拼接，列拼接可以是指一个电气设备的运行数据作为矩阵的一列，执行左右拼接。

以运行矩阵和感知矩阵作为预设的决策模型的输入，该决策模型的输出决策矩阵，决策矩阵与运行矩阵的尺寸一致，包含每个电气设备的决策数据，决策矩阵内元素的物理含义与运行矩阵对应的物理含义相同，表征了可以使用决策矩阵内决策数据来控制对应的电气设备运行。

例如，在行拼接的前提下，灯光设备的运行数据为(1、1、3、2)，决策矩阵中灯光设备所处的行对应的决策数据为(1、1、2、2)，两者对比给出控制即为将亮度由3调节为2，其他不变。

步骤S102，获取预设的决策模型在训练时的训练数据集合，以及使用预设的决策模型对训练数据集合中每个训练数据进行决策的历史决策数据。

本申请中，上述预设的决策模型的训练需要大量的训练数据集合，训练数据集合中的样本是真实采集到的运行数据和感知数据，并由人工进行标签的标注，标签也即参考的决策数据。针对不同的目标场景，所需的预设决策模型可能有所差异，因此，在对预设的决策模型进行训练时，需要使用目标场景下采集的数据，也即是训练数据集合中训练数据均包括目标场景在一历史时刻下所有电气设备的历史运行数据以及对应每个电气设备的传感器采集的历史感知数据，在通过人工对历史运行数据和历史感知数据进行分析后，给出对应的决策数据也即是标签。由于训练的标注成本较大，一般由决策模型的提供方来完成，直接配置于目标场景内。训练过程采用决策模型输出的对应决策数据与对应的标签进行损失函数计算，损失函数采用均方误差损失函数。

步骤S103，针对任一电气设备，基于用户针对电气设备输入的约束条件生成约束损失函数，根据约束损失函数与预设的决策模型的原始损失函数，得到微调损失函数，使用微调损失函数更新对应电气设备的决策子模型的损失函数，得到更新的决策子模型。

本申请中，上述预设的决策模型为固定模型，与目标场景的用户的使用习惯不相关，基本没有用户的定制化过程，且标注的标签存在一定的主观性，因此，为了满足用户的私人化定时，提高对电气设备智能控制的泛化能力，此时可以获取用户针对任一个电气设备输入的约束条件。该约束条件可以是指针对电气设备在运行时的运行参数的限定，例如，针对灯光设备而言，限定亮度的阈值和开启时长，针对空调设备而言，可以限定空调的最低温度、最高温度和目标时间段的电量上限等。该约束条件为用户在本申请的计算机设备上进行操作输入的，也即在控制电气设备的过程中需要与用户进行交互。

根据用户提供的约束条件，对应生成相应的损失函数，此过程需要根据具体限制设置具体的损失函数。例如，若限制空调最高温度为26度，则损失函数可以表示为O

约束损失函数和预设的决策模型的原始损失函数共同构成微调损失函数，以此微调损失函数作为对应电气设备的决策子模型的损失函数，得到更新的决策子模型，即可实现定制化约束。该决策子模型即为对决策模型进行知识蒸馏的操作得到，且存储在计算机设备中，以备随时调用。知识蒸馏过程是将一个训练好的大模型的决策、分类等能力蒸馏给一个小模型，此时小模型学习到了大模型的相应能力，同时，再训练时也不用进行大量的数据输入，从而降低计算量。

针对其他的电气设备，也均对应有自身的决策子模型，也采用相同的处理方式，最终，增加了定制化的约束条件的电气设备均具备一个更新的决策子模型。

可选的是，根据约束损失函数与预设的决策模型的原始损失函数，得到微调损失函数包括：

将约束损失函数和预设的决策模型的原始损失函数相加，得到相加结果，确定相加结果为微调损失函数。

其中，以约束损失函数和原始损失函数的和作为微调损失函数，可以更好地体现增加约束效果。

步骤S104，从每个训练数据中确定对应电气设备的历史运行子数据以及对应电气设备的传感器采集的历史感知子数据，从历史决策数据中确定对应电气设备的历史决策子数据，使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型。

由于电气设备的决策子模型的输入为对应电气设备的运行数据、感知数据，输出为对应电气设备的决策数据，因此，在对决策子模型进行训练时无需训练数据集合，而只需要对应电气设备的数据即可。本申请在历史运行数据、历史感知数据中可以提取到对应每个电气设备的子数据，即历史运行子数据和历史感知子数据，同样地，在标签中也可以提取到对应每个电气设备的字标签。

可选的是，使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型包括：

将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果；

根据决策子结果与历史决策子数据，得到第一均方误差损失；

基于第一均方误差损失，调整决策子模型，得到调整后的决策子模型；

将调整后的决策子模型作为决策子模型，返回执行将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果的步骤，直至第一均方误差损失满足第一预设条件或者迭代次数达到第一预设次数。

其中，采用决策子结果和历史决策子数据使用上述微调损失函数来计算均方误差损失，来实现决策子模型的训练，有助于实现训练的快速收敛。

可选的是，在使用微调损失函数更新对应电气设备的决策子模型的损失函数，得到更新的决策子模型之后，还包括：

获取训练数据集合中每个训练数据对应的人工标注的数据标签，从数据标签中确定对应电气设备的数据子标签；

相应地，使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型包括：

使用历史运行子数据、历史感知子数据、历史决策子数据和数据子标签训练更新的决策子模型，得到训练好的决策子模型。

其中，除了采用历史运行子数据、历史感知子数据和历史决策子数据来训练决策子模型外，还可以利用决策模型训练时的标签来提高训练效果，具体为提取出数据标签中对应电气设备的数据子标签，将数据子标签与决策子结果进行损失计算，从而决策子结果与历史决策子数据构成的损失进行合成，以合成结果来调整决策子模型，从而条训练的效果。

可选的是，在将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果之后，还包括：

根据决策子结果和数据子标签，得到第二均方误差损失；

基于第一均方误差损失，调整决策子模型，得到调整后的决策子模型包括：

基于第一均方误差损失和第二均方误差损失的和，调整决策子模型，得到调整后的决策子模型；

将调整后的决策子模型作为决策子模型，返回执行将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果的步骤，直至第一均方误差损失和第二均方误差损失的和满足第二预设条件或者迭代次数达到第二预设次数。

其中，训练过程为基于第一均方误差损失和第二均方误差损失的和进行决策子模型的训练，使得训练的效果更好，有助于提高决策子模型的决策准确度。

步骤S105，将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据。

本申请中，从实时运行数据中提取出对应电气设备的子数据，使用训练好的决策子模型对子数据进行决策，得到实时决策子数据。

可选的是，在针对任一电气设备而言，得到训练好的决策子模型之后，还包括：

检测电气设备在目标时间段内是否出现手动调节的操作；

若检测到电气设备出现手动调节的操作，则统计操作发生前的运行数据作为原始运行数据，统计操作发生后的运行数据作为变更运行数据，将操作发生时对应电气设备的传感器采集的感知数据作为参考感知数据；

根据原始运行数据的个数和变更运行数据的个数的比值，计算样本扩增数量；

将变更运行数据与参考感知数据构成手动调节样本，复制手动调节样本使得复制数量达到样本扩增数量；

相应地，在使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型之后，还包括：

使用所有复制的手动调节样本对训练好的决策子模型进行再训练，得到微调好的决策子模型；

相应地，将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据包括：

将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入微调好的决策子模型，输出下一时刻的实时决策子数据。

其中，训练好的决策子模型可以在实际使用中运行，但此时仍存在一个问题，若用户未设置足够的定制化约束(例如，只设置了整体电量约束，未针对单一的电气设备进行约束)，或者用户的真实行为习惯并不符合初始设置的定制化约束(例如，定制化约束设置空调设备的最高设置为26度，但用户在自动设置后往往手动将其调节为27度)，会造成用户使用过程的不便利。

对此，可以根据日常的设备状态调整信息进行决策子模型的微调，具体地，针对任一个电气设备，统计目标时间段内发生手动变更前后的运行数据以及变更时的感知数据。例如，将目标时间段设置为每天的0-8时，9-16时，17-24时，在每天8点、16点和24点时进行微调，从而保证决策子模型的动态适应。

变更前的运行数据为原始运行数据，变更后的运行数据为变更运行数据，变更时的感知数据为参考感知数据，根据原始运行数据的个数和变更运行数据的个数的比值，计算样本扩增数量，将变更运行数据与参考感知数据构成手动调节样本，复制手动调节样本使得复制数量达到样本扩增数量。

其中，样本扩增数量可以是[α*X*β]、[]表示向下取整计算，α表示参考比值，X表示训练数据集合内训练数据的数量，β表示调整系数，β是超参数，可以自行设置，例如，设置为10/X。

此时，只针对单个决策子模型，其他决策子模型不进行训练数据的改变，也不进行微调。

可选的是，在将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据之后，包括：

将所有电气设备的下一时刻的实时决策子数据组合，形成组合数据；

根据组合数据和下一时刻的实时决策数据，计算第三均方误差损失，基于第三均方误差损失，更新预设的决策模型，得到更新好的决策模型。

其中，微调后的决策子模型学习到的用户习惯信息之后，还需要反馈至决策模型中，蒸馏方式与前述蒸馏方式一样，也是新增一个根据决策子模型的输出和决策模型的输出所计算的均方误差损失函数即可，但由决策子模型蒸馏至决策模型的过程需要触发条件，因为，决策模型的再训练成本较高。

步骤S106，若实时决策子数据与从实时决策数据中确定的对应电气设备的子数据不相同，则执行实时决策子数据以控制对应的电气设备。

本申请中，针对任一个电气设备，在实时决策子数据与从实时决策数据中确定的对应电气设备的子数据不相同时，执行实时决策子数据，并且记录不相同的次数，生成告警信息，并在告警信息超过预设条数时生成触发条件，触发决策模型的再训练。

在实时决策子数据与从实时决策数据中确定的对应电气设备的子数据相同时，执行从实时决策数据中确定的对应电气设备的子数据或者实时决策子数据，以控制对应的电气设备。

本申请实施例获取目标场景在当前时刻下所有电气设备的实时运行数据，以及对应每个电气设备的传感器采集的实时感知数据，使用预设的决策模型计算下一时刻的实时决策数据，基于预设的决策模型在训练时的训练数据集合，以及使用预设的决策模型对训练数据集合中每个训练数据进行决策的历史决策数据，基于用户针对任一电气设备输入的约束条件生成约束损失函数，根据约束损失函数与预设的决策模型的原始损失函数，得到微调损失函数，使用微调损失函数更新对应电气设备的决策子模型的损失函数，得到更新的决策子模型，从训练数据集合中确定对应的历史运行子数据和历史感知子数据，从历史决策数据中确定对应的历史决策子数据，使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型，将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据，若实时决策子数据与从实时决策数据中确定的对应电气设备的子数据相同，则执行实时决策子数据以控制对应的电气设备，否则生成告警，通过对用户输入的约束条件进行训练，使用训练好的决策子模型对实时数据进行再决策，并与原始的决策模型的决策结果进行比较，以得到准确地控制结果，使得控制按照用户需求动态调节，提高了电气设备智能控制的泛化性。

对应于上文实施例的基于知识蒸馏的电气设备智能控制方法，图2示出了本申请实施例二提供的基于知识蒸馏的电气设备智能控制装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参见图2，该电气设备智能控制装置包括：

决策数据确定模块21，用于获取目标场景在当前时刻下所有电气设备的实时运行数据，以及对应每个电气设备的传感器采集的实时感知数据，将实时运行数据和实时感知数据输入预设的决策模型，输出下一时刻的实时决策数据；

训练数据获取模块22，用于获取预设的决策模型在训练时的训练数据集合，以及使用预设的决策模型对训练数据集合中每个训练数据进行决策的历史决策数据，其中，训练数据均包括目标场景在一历史时刻下所有电气设备的历史运行数据以及对应每个电气设备的传感器采集的历史感知数据；

决策子模型确定模块23，用于针对任一电气设备，基于用户针对电气设备输入的约束条件生成约束损失函数，根据约束损失函数与预设的决策模型的原始损失函数，得到微调损失函数，使用微调损失函数更新对应电气设备的决策子模型的损失函数，得到更新的决策子模型，其中，决策子模型为基于预设的决策模型蒸馏学习得到；

决策子模型训练模块24，用于从每个训练数据中确定对应电气设备的历史运行子数据以及对应电气设备的传感器采集的历史感知子数据，从历史决策数据中确定对应电气设备的历史决策子数据，使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型；

决策子数据确定模块25，用于将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据；

决策控制模块26，用于若实时决策子数据与从实时决策数据中确定的对应电气设备的子数据不相同，则执行实时决策子数据以控制对应的电气设备。

可选的是，决策子模型确定模块25包括：

微调损失计算单元，用于将约束损失函数和预设的决策模型的原始损失函数相加，得到相加结果，确定相加结果为微调损失函数。

可选的是，决策子模型训练模块24包括：

决策子结果确定单元，用于将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果；

第一均方误差计算单元，用于根据决策子结果与历史决策子数据，得到第一均方误差损失；

决策子模型调整单元，用于基于第一均方误差损失，调整决策子模型，得到调整后的决策子模型；

第一返回执行单元，用于将调整后的决策子模型作为决策子模型，返回执行将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果的步骤，直至第一均方误差损失满足第一预设条件或者迭代次数达到第一预设次数。

可选的是，电气设备智能控制装置还包括：

子标签确定模块，用于在使用微调损失函数更新对应电气设备的决策子模型的损失函数，得到更新的决策子模型之后，获取训练数据集合中每个训练数据对应的人工标注的数据标签，从数据标签中确定对应电气设备的数据子标签；

相应地，决策子模型训练模块24包括：

决策子模型训练单元，用于使用历史运行子数据、历史感知子数据、历史决策子数据和数据子标签训练更新的决策子模型，得到训练好的决策子模型。

可选的是，决策子模型训练模块24还包括：

第二均方误差计算单元，用于在将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果之后，根据决策子结果和数据子标签，得到第二均方误差损失；

相应地，决策子模型调整单元包括：

决策子模型调整子单元，用于基于第一均方误差损失和第二均方误差损失的和，调整决策子模型，得到调整后的决策子模型；

第二返回执行单元，用于将调整后的决策子模型作为决策子模型，返回执行将历史运行子数据和历史感知子数据输入决策子模型，输出决策子结果的步骤，直至第一均方误差损失和第二均方误差损失的和满足第二预设条件或者迭代次数达到第二预设次数。

可选的是，电气设备智能控制装置还包括：

检测模块，用于在针对任一电气设备而言，得到训练好的决策子模型之后，检测电气设备在目标时间段内是否出现手动调节的操作；

统计模块，用于若检测到电气设备出现手动调节的操作，则统计操作发生前的运行数据作为原始运行数据，统计操作发生后的运行数据作为变更运行数据，将操作发生时对应电气设备的传感器采集的感知数据作为参考感知数据；

扩增计算模块，用于根据原始运行数据的个数和变更运行数据的个数的比值，计算样本扩增数量；

扩增模块，用于将变更运行数据与参考感知数据构成手动调节样本，复制手动调节样本使得复制数量达到样本扩增数量；

相应地，该电气设备智能控制装置还包括：

决策子模型微调模块，用于在使用历史运行子数据、历史感知子数据和历史决策子数据训练更新的决策子模型，得到训练好的决策子模型之后，使用所有复制的手动调节样本对训练好的决策子模型进行再训练，得到微调好的决策子模型；

相应地，决策子数据确定模块25包括：

决策子数据确定单元，用于将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入微调好的决策子模型，输出下一时刻的实时决策子数据。

可选的是，该电气设备智能控制装置包括：

组合数据确定模块，用于在将实时运行数据中对应电气设备的实时运行子数据和实时感知数据中对应电气设备的实时感知子数据输入训练好的决策子模型，输出下一时刻的实时决策子数据之后，将所有电气设备的下一时刻的实时决策子数据组合，形成组合数据；

决策模型更新模块，用于根据组合数据和下一时刻的实时决策数据，计算第三均方误差损失，基于第三均方误差损失，更新预设的决策模型，得到更新好的决策模型。

需要说明的是，上述模块之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

图3为本申请实施例三提供的一种基于知识蒸馏的电气设备智能控制系统的结构示意图。如图3所示，该实施例的电气设备智能控制系统包括：至少一个处理器(图3中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序，处理器执行计算机程序时实现上述任意各个基于知识蒸馏的电气设备智能控制方法实施例中的步骤。除此之外，该智能控制系统还包括目标场景中电气设备和传感器，以获取相应的数据。

该计算机设备可包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，图3仅仅是计算机设备的举例，并不构成对计算机设备的限定，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括网络接口、显示屏和输入装置等。

所称处理器可以是CPU，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器包括可读存储介质、内存储器等，其中，内存储器可以是计算机设备的内存，内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是计算机设备的硬盘，在另一些实施例中也可以是计算机设备的外部存储设备，例如，计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card，SMC)、安全数字(Secure Digital，SD)卡、闪存卡(Flash Card)等。进一步地，存储器还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等，该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述方法实施例的步骤。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

本申请实现上述实施例方法中的全部或部分流程，也可以通过一种计算机程序产品来完成，当计算机程序产品在计算机设备上运行时，使得计算机设备执行时实现可实现上述方法实施例中的步骤。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/计算机设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载