掌桥专利:专业的专利平台
掌桥专利
首页

一种基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法

文献发布时间:2024-04-18 19:58:21


一种基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法

技术领域

本发明提供一种基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法,属于机器学习算法技术领域。

背景技术

随着制冷系统在各行各业的广泛应用,制冷系统面临的能耗问题愈发凸显。由于制冷与设备散热、设备配置、机房环境,大气条件、货物属性相互关联,在运维制冷系统达到一定的成熟度后,如果单纯凭借硬件节能或者基于人工经验的简单调优,都已经无法满足能耗进一步降低的要求。

目前,现有的制冷系统能耗预测主要是回归模型,其回归分析的公式和该公式采用何种表达关系需要通过人们的经验进行认为假定,这就使得预测精度相对较低,在节能优化领域的使用受到限制,并且现有的制冷系统能耗预测模型通常仅考虑内部因素影响,如制冷系统压缩系统的排气压力和吸气压力,实际上制冷系统能耗还与外部温度环境关系密切,因此,建立一套以历史数据为基础的结合天气预报温度数据的能耗预测系统来预测制冷系统的能耗将有效提高预测精度。

发明内容

针对现有技术的不足,本发明旨在提供一种对数据集的需求少、预测精度高的基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法。

本发明采用如下技术方案:

一种基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法,包括如下步骤:

步骤1:获取制冷系统的各项原始数据,采用最大相关与最小冗余(mRMR)方法提取制冷系统能耗的关键特征,进行数据预处理;

步骤2:改进飞蛾扑火算法(MFO);

步骤3:结合历史天气预报温度协变量,基于改进的飞蛾扑火算法(IMFO)优化支持向量回归(SVR)参数(C,γ);

步骤4:将IMFO算法的最优解作为支持向量回归(SVR)参数(C,γ),得到能耗预测模型;

步骤5:基于制冷系统能耗的关键特征,将样本数据及其对应的天气预报温度数据输入训练好的SVR预测模型进行测试,输出测试结果,即制冷系统能耗预测结果。

优选的,步骤1中制冷系统共四个冷间,三台压缩机,原始数据是指每隔15分钟记录的压缩系统压力、冷间温度、本时间段内消耗的系统总电量以及开关明细等各类运行数据。

优选的,步骤1中,采用最大相关与最小冗余(mRMR)方法提取制冷系统能耗的关键特征的过程为:

互信息是两个随机变量之间相互依赖程度的度量,表示为I(X,Y):

式中,X,Y为随机变量,I为两个变量之间互信息计算函数,p为概率密度函数;

计算制冷系统能耗与所有影响因素之间以及影响因素互相之间的互信息:

式中,E为系统能耗,Z

最大相关计算原则:

式中,D(S,E)为最大相关计算值;S为目标特征集,|S|为集合S中特征数量;

最小冗余计算原则:

式中,N(S)为最小冗余计算值;

整合最大相关性与最小冗余:

mRMR=max(D(S,E)-N(S))。

本发明采用最大相关与最小冗余(mRMR)方法提取制冷系统能耗的关键特征,其好处在于:

1.提高特征选择的效果:mRMR方法能够同时考虑特征之间的相关性和冗余性,通过选择具有最大相关性和最小冗余性的特征,可以更准确地表示制冷系统能耗的关键特征。

2.减少特征维度:通过选择最相关的特征,mRMR方法可以减少特征的维度,从而降低了计算和存储的成本。

3.提高模型的解释性:mRMR方法选取的特征具有最大相关性,因此可以更好地解释制冷系统能耗的变化,提高了模型的解释性。

4.提高模型的泛化能力:mRMR方法选择的特征具有最小冗余性,可以减少特征之间的共线性,提高模型的泛化能力,降低过拟合的风险。

综上,mRMR方法能够提高特征选择的效果,减少特征维度,提高模型的解释性和泛化能力,从而提取制冷系统能耗的关键特征。

数据存储过程中,本发明不再使用传统的关系型数据库来存储制冷系统能耗数据,而是采用键值存储数据库Redis。使用这种数据库可以提供更高的性能和可扩展性,适用于大规模数据的存储和查询。Redis是一个基于内存的数据库系统,通过将数据存储在内存中,可以实现更快的读写速度和更低的延迟。此外,Redis还支持丰富的数据结构和功能,如哈希表、列表、集合等,使得存储和处理能耗数据更加灵活和高效。通过采用Redis作为存储解决方案,可以有效地管理和分析制冷系统的能耗数据,为能源管理和优化提供支持。

Redis中的哈希表对于存储制冷系统能耗数据具有结构化存储、快速访问、灵活的数据操作、字段级别的过期设置和嵌套结构等优点,更适合用于存储和处理制冷系统能耗数据。

优选的,步骤1中每个制冷系统采用一个独立的哈希表存储制冷系统能耗数据,哈希表的键采用制冷系统的唯一标识,例如使用制冷系统的ID作为键;

每个哈希表中的字段名用于表示数据的类型或指标名称,哈希表的字段值即为对应时间点的实际数值,其中,使用时间戳作为哈希表字段名的一部分,以便将数据与特定的时间点关联。

优选的,步骤1中数据预处理的过程为:

1.1、进行数据归一化处理:

式中,X为元素,min、max是指映射的最小值和最大值,X

1.2、缺失值填充,对每一列的缺失值,填充当列的中位数。

优选的,改进的飞蛾扑火算法(MFO),具体步骤如下:

飞蛾在进行火焰搜索时位置更新公式为:

S(M

式中,F

为改善每只飞蛾针对对应独一火焰进行搜索,容易陷入局部最优情况,引入非线性自适应权重:

式中,ω

改进后的飞蛾在进行火焰搜索时位置更新公式为:

S(M

优选的,步骤3中的优化步骤为:

3.1、在rp5.ru网站获取所需月份当地的天气数据,并与步骤1预处理后的制冷系统数据进行匹配;

3.2、基于改进的飞蛾扑火算法(IMFO)优化支持向量回归(SVR)参数(C,γ),具体为:

3.2.1、确定适应度函数;

适应度函数为平均绝对误差MAE:

式中,m为预测值个数,y

3.2.2、初始化改进的飞蛾扑火算法(IMFO)和支持向量回归(SVR)参数;

设置改进的飞蛾扑火算法最大迭代次数l

3.2.3、采用K折交叉验证方法,减少数据集需求,防止过拟合;

将经过步骤3.1处理后的数据分成5组(5-Fold),将每个子集数据分别做一次验证集,其余的4组子集数据作为训练集,这5个模型分别在验证集中根据适应度函数评估,通过加和平均得到适应值;

3.2.4、计算飞蛾适应度,飞蛾排序,并赋给火焰;

使用步骤3.2.1的适应度函数公式计算飞蛾适应度,升序对飞蛾进行排序,将适应度最小者的优秀的基因信息给火焰;

3.2.5、判断是否满足终止条件,即最大迭代次数,如果满足执行步骤3.2.7,否则执行步骤3.2.6进入下一代;

3.2.6、更新火焰数量,使用步骤2改进飞蛾扑火算法更新飞蛾火焰位置,计算飞蛾适应度,获得适应度最小的飞蛾位置即为当前空间最优飞蛾位置,火焰数量(flame_no)更新公式为:

式中,l为当前迭代次数,l

3.2.7、获得SVR最优参数(C,γ)。

优选的,改进飞蛾扑火算法法采用K折交叉验证方法,减少数据集需求,防止过拟合。

本发明未详尽之处,均可参见现有技术。

本发明的有益效果为:

本发明的方法在进行制冷系统能耗预测时,首先,通过采用键值存储数据库Redis存储数据,可以实现高效的数据存储和检索。Redis具有快速的响应速度和高并发性能,在处理大量数据时能够提供稳定可靠的性能。并且通过MRMR算法进行数据处理和特征选择,可以从众多的输入变量中选择出最相关的特征,减少了数据维度和噪声的影响。这有助于提高模型的准确性和可靠性,避免了对不相关或冗余特征的过度依赖,减少了模型训练和预测的计算负担。

其次,采用改进的飞蛾扑火算法优化的SVR模型,可以更好地拟合制冷系统的能耗数据。飞蛾扑火算法是一种基于自然界觅食行为的优化算法,它具有全局搜索能力和较快的收敛速度。通过对SVR模型参数的优化,可以提高模型的性能和预测精度,使其更好地适应实际制冷系统的能耗特征。

另外,将天气预报温度作为协变量引入能耗预测模型中,可以考虑到环境因素对制冷系统能耗的影响。天气预报温度作为一个外部变量,可以提供对未来时间段内的环境条件的估计,从而更准确地预测制冷系统的能耗;这有助于实现对能耗的合理规划和优化,提前调整制冷系统的运行策略,降低能耗峰值和节约能源成本。

综上所述,本发明能够提高制冷系统能耗预测的准确性和可靠性,优化能耗规划和控制策略,从而实现能源的有效利用和节约,减少对环境的负面影响。这对于制冷系统的运维管理和能源管理具有重要意义,并对建筑能耗管理和节能减排具有积极推动作用。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

图1为基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法的流程图。

具体实施方式

为了使本技术领域的人员更好的理解本说明书中的技术方案,下面结合本说明书实施中的附图,对本说明书实施例中的技术方案进行清楚、完整的描述,但不仅限于此,本发明未详尽说明的,均按本领域常规技术。

SVR的基本思想是给定一个输入样本x,通过合适的映射函数φ(x)将低维样本数据映射到高维空间,在高维空间做计算。在SVR中预测精度主要由惩罚参数C和核函数参数γ决定。所以本发明采用mRMR提取制冷系统能耗的关键特征,利用IMFO和协变量对SVR进行优化,并使用优化后的基于协变量的mRMR-IMFO-SVR进行制冷系统能耗的预测。

实施例1

一种基于协变量与mRMR-IMFO-SVR的制冷系统能耗预测方法,结合图1,包括如下步骤:

步骤1:获取制冷系统共四个冷间,三台压缩机,获取制冷系统的各项原始数据,即每隔15分钟记录的压缩系统压力、冷间温度、本时间段内消耗的系统总电量以及开关明细等各类运行数据,采用最大相关与最小冗余(mRMR)方法提取制冷系统能耗的关键特征,进行数据预处理;

采用最大相关与最小冗余(mRMR)方法提取制冷系统能耗的关键特征的过程为:

互信息是两个随机变量之间相互依赖程度的度量,表示为I(X,Y):

式中,X,Y为随机变量,I为两个变量之间互信息计算函数,p为概率密度函数;

计算制冷系统能耗与所有影响因素之间以及影响因素互相之间的互信息:

式中,E为系统能耗,Z

最大相关计算原则:

式中,D(S,E)为最大相关计算值;S为目标特征集,|S|为集合S中特征数量;

最小冗余计算原则:

式中,N(S)为最小冗余计算值;

整合最大相关性与最小冗余:

mRMR=max(D(S,E)-N(S))。

经mRMR方法提取制冷系统能耗的关键特征如表1:

表1:本实施例中制冷系统能耗的关键特征

本发明采用最大相关与最小冗余(mRMR)方法提取制冷系统能耗的关键特征,其好处在于:

1.提高特征选择的效果:mRMR方法能够同时考虑特征之间的相关性和冗余性,通过选择具有最大相关性和最小冗余性的特征,可以更准确地表示制冷系统能耗的关键特征。

2.减少特征维度:通过选择最相关的特征,mRMR方法可以减少特征的维度,从而降低了计算和存储的成本。

3.提高模型的解释性:mRMR方法选取的特征具有最大相关性,因此可以更好地解释制冷系统能耗的变化,提高了模型的解释性。

4.提高模型的泛化能力:mRMR方法选择的特征具有最小冗余性,可以减少特征之间的共线性,提高模型的泛化能力,降低过拟合的风险。

综上,mRMR方法能够提高特征选择的效果,减少特征维度,提高模型的解释性和泛化能力,从而提取制冷系统能耗的关键特征。

本发明不再使用传统的关系型数据库来存储制冷系统能耗数据,而是采用键值存储数据库Redis。使用这种数据库可以提供更高的性能和可扩展性,适用于大规模数据的存储和查询。Redis是一个基于内存的数据库系统,通过将数据存储在内存中,可以实现更快的读写速度和更低的延迟。此外,Redis还支持丰富的数据结构和功能,如哈希表、列表、集合等,使得存储和处理能耗数据更加灵活和高效。通过采用Redis作为存储解决方案,可以有效地管理和分析制冷系统的能耗数据,为能源管理和优化提供支持。

Redis中的哈希表对于存储制冷系统能耗数据具有结构化存储、快速访问、灵活的数据操作、字段级别的过期设置和嵌套结构等优点,更适合用于存储和处理制冷系统能耗数据。

优选的,步骤1中每个制冷系统采用一个独立的哈希表存储制冷系统能耗数据,哈希表的键采用制冷系统的唯一标识,例如使用制冷系统的ID作为键;

每个哈希表中的字段名用于表示数据的类型或指标名称,哈希表的字段值即为对应时间点的实际数值,

举例说明:

制冷系统表示为S=[SystemA,SystemB,SystemC,……,SystemN],对于每一个制冷系统为其创建其唯一ID命名的哈希表用于存储能耗数据,例如可以创建一个名为SystemA的哈希表,用于存储SystemA的能耗数据。哈希表的键采用SystemA的唯一ID,例如"001",字段名用于表示数据的类型或指标名称,在本实施例中可以使用Et为t时刻系统能耗,Evapt为t时刻蒸发系统蒸发压力,Sst为t时刻冷藏库供液总开关,Spt为t时刻压缩系统吸气压力,Dpt为t时刻压缩系统排气压力,Dtt为t时刻压缩系统排气温度,Cpt为t时刻冷凝系统冷凝压力,Cpst为t时刻冷凝系统冷凝水泵开关,Htlt为t时刻冷凝系统高压储液罐液位。哈希表的字段值为一个字典,其中包含时间戳和对应时间点的实际数值。例如:

HSET 001Evapt 3.03

HSET 001Sst 0

HSET 001Spt 3.03

以上命令将分别将SystemA的蒸发系统蒸发压力、冷藏库供液总开关和压缩系统吸气压力存储到以SystemA的唯一ID作为键的哈希表中。

使用时间戳作为哈希表字段名的一部分,以便将数据与特定的时间点关联。

举例说明:

对于蒸发系统蒸发压力数据,可采用"Evapt:Evaptstamp"的格式作为哈希表的字段名,其中"Evaptstamp"代表具体的时间戳。

哈希表的字段值即为对应时间戳的温度数值,使用以下命令可以将蒸发系统蒸发压力数据存储到哈希表中:

HSET 001Evapt:Evaptstamp 3.03

在这个命令中,使用"HSET"指令将SystemA的蒸发系统蒸发压力数据存储到以"Evapt:Evaptstamp"为字段名的哈希表中。"001"是哈希表的键,代表制冷系统的唯一标识。"Evapt:Evaptstamp"是字段名,其中"Evapt"表示蒸发系统蒸发压力数据的类型或指标名称,"Evaptstamp"表示具体的时间戳。字段值为3.03,即对应时间戳的蒸发压力数值。

步骤1中数据预处理的过程为:

1.1、进行数据归一化处理:

式中,X为元素,min、max是指映射的最小值和最大值,X

1.2、缺失值填充,对每一列的缺失值,填充当列的中位数。

步骤2:改进飞蛾扑火算法(MFO);

具体步骤如下:

飞蛾在进行火焰搜索时位置更新公式为:

S(M

式中,F

为改善每只飞蛾针对对应独一火焰进行搜索,容易陷入局部最优情况,引入非线性自适应权重:

式中,ω

改进后的飞蛾在进行火焰搜索时位置更新公式为:

S(M

步骤3:结合历史天气预报温度协变量,基于改进的飞蛾扑火算法(IMFO)优化支持向量回归(SVR)参数(C,γ);

3.1、在rp5.ru网站获取2022年6月至7月两个月的济南天气数据,并与步骤1预处理后的制冷系统数据进行匹配;

3.2、基于改进的飞蛾扑火算法(IMFO)优化支持向量回归(SVR)参数(C,γ),具体为:

3.2.1、确定适应度函数;

适应度函数为平均绝对误差MAE:

式中,m为预测值个数,y

3.2.2、初始化改进的飞蛾扑火算法(IMFO)和支持向量回归(SVR)参数;

设置改进的飞蛾扑火算法最大迭代次数l

表2:初始化的改进的飞蛾扑火算法和支持向量回归参数

3.2.3、采用K折交叉验证方法,减少数据集需求,防止过拟合;

将经过步骤3.1处理后的数据分成5组(5-Fold),将每个子集数据分别做一次验证集,其余的4组子集数据作为训练集,这5个模型分别在验证集中根据适应度函数评估,通过加和平均得到适应值;

3.2.4、计算飞蛾适应度,飞蛾排序,并赋给火焰;

使用步骤3.2.1的适应度函数公式计算飞蛾适应度,升序对飞蛾进行排序,将适应度最小者的优秀的基因信息给火焰;

3.2.5、判断是否满足终止条件,即最大迭代次数,如果满足执行步骤3.2.7,否则执行步骤3.2.6进入下一代;

3.2.6、更新火焰数量,使用步骤2改进飞蛾扑火算法更新飞蛾火焰位置,计算飞蛾适应度,获得适应度最小的飞蛾位置即为当前空间最优飞蛾位置,火焰数量(flame_no)更新公式为:

式中,l为当前迭代次数,l

3.2.7、获得SVR最优参数(C,γ)。

步骤4:将IMFO算法的最优解作为支持向量回归(SVR)参数(C,γ),得到能耗预测模型;

步骤5:基于制冷系统能耗的关键特征,将样本数据及其对应的天气预报温度数据输入训练好的SVR预测模型进行测试,输出测试结果,即制冷系统能耗预测结果。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 基于空调能耗敏感变量的跨建筑空调能耗预测方法及装置
  • 基于空调能耗敏感变量的跨建筑空调能耗预测方法及装置
技术分类

06120116485775