掌桥专利:专业的专利平台
掌桥专利
首页

基于模型的自适应性聚类数据处理方法、处理器

文献发布时间:2024-04-18 20:01:23


基于模型的自适应性聚类数据处理方法、处理器

技术领域

本申请涉及计算机技术领域,具体涉及一种基于模型的自适应性聚类数据处理方法、处理器及存储介质。

背景技术

近年来随着光伏、风电等可再生绿色能源技术的发展,能源系统中的可再生能源的比重逐年上升。但是可再生能源具有的波动性和不确定性,需要长时间尺度的模型来捕捉能源系统的特征。目前解决此问题的方法是对能源系统中的数据进行聚类,从而从中获取具有代表性的数据,并在这些具有代表性的数据上求解规划模型,从而获得能源系统配置的近似解。但是采用此方法对长时间尺度的规划模型进行求解时,使得此类规划模型无法求解或者难以求解,且最终结果误差较大。

发明内容

本申请实施例的目的是提供一种基于模型的自适应性聚类数据处理方法、处理器及存储介质,用以更好地捕捉能源系统的特征,提高模型求解的精确度。

为了实现上述目的,本申请第一方面提供一种基于模型的自适应性聚类数据处理,包括:

获取预设历史时间段内的能源数据;

对能源数据进行时间切片得到多个切片数据;

将切片数据输入至规划模型,以通过求解规划模型得到切片数据的特征空间;

利用聚类算法在切片数据的特征空间上进行特征聚类,以确定切片数据中的代表性切片数据;

将代表性切片数据再次输入至规划模型,以通过规划模型输出与代表性切片数据对应的决策变量。

在本申请实施例中,方法还包括:在将切片数据输入至规划模型之前,根据目标函数和约束条件建立规划模型,其中,目标函数是以可变运行成本和固定资产投资成本建立的;其中,可变运行成本包括火电的运行成本、火电启停的成本和储能的充放电成本,固定资产投资成本包括储能的能量容量成本、储能的功率容量成本、多种可再生能源的投资成本以及火电的投资成本;约束条件是指能量平衡、火电功率约束、火电机组的启停和储能系统的存储约束。

在本申请实施例中,方法还包括:目标函数的表达式如公式(1)所示:

OB=C

其中,C

在本申请实施例中,方法还包括:可变运行成本的计算公式如公式(2)所示:

/>

其中,

在本申请实施例中,方法还包括:固定资产投资成本的计算公式如公式(3)所示:

其中,

在本申请实施例中,方法还包括:能量平衡约束条件如公式(4)所示:

其中,A

火电功率约束条件的表达式如公式(5)所示:

其中,ξ

火电机组的启停约束条件包括:

其中,n

储能系统的存储约束条件包括:

其中,E

在本申请实施例中,根据目标函数和约束条件建立规划模型还包括:根据目标函数、约束条件以及决策变量建立规划模型,决策变量包括可变运行成本、固定资产投资成本以及可再生能源占比,其中,可再生能源占比与火电机组的发电量成负相关关系,可再生能源占比的调节如公式(6)所示:

其中,R是可再生能源发电量占总发电量的最小比例。

在本申请实施例中,方法还包括:代表性切片数据包括可再生能源、负荷数据、火力发电机组以及储能装置技术参数中的至少一者,决策变量包括光伏的装机容量、风电的装机容量、储能的能量装机容量和功率容量以及火电的装机容量中的至少一者。

本申请第二方面提供一种处理器,包括:被配置成执行上述任意一项的基于模型的自适应性聚类数据处理方法。

本申请第三方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器被配置成执行上述的基于模型的自适应性聚类数据处理方法。

通过上述技术方案,通过对能源数据进行时间切片处理,得到切片数据。在切片数据上运行规划模型,得到切片数据的特征空间。并利用聚类算法在切片数据的特征空间上进行聚类,得到代表性的切片数据。最后通过在代表性切片数据上再次运行规划模型,获得决策变量,能够更好地优化能源配置、降低规划模型的求解误差。

本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本申请实施例,但并不构成对本申请实施例的限制。在附图中:

图1示意性示出了根据本申请实施例的基于模型的自适应性聚类数据处理方法的流程示意图;

图2示意性示出了根据本申请实施例的基于模型的自适应性聚类数据处理方法的应用场景示意图。

具体实施方式

以下结合附图对本申请实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请实施例,并不用于限制本申请实施例。

需要说明,若本申请实施方式中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置、关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。

另外,若本申请实施方式中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施方式之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。

图1示意性示出了根据本申请实施例的基于模型的自适应性聚类数据处理方法的流程示意图。如图1所示,在本申请一个实施例中,提高了一种基于模型的自适应性聚类数据处理方法,包括:

步骤101,获取预设历史时间段内的能源数据。

步骤102,对能源数据进行时间切片得到多个切片数据。

步骤103,将切片数据输入至规划模型,以通过求解规划模型得到切片数据的特征空间。

步骤104,利用聚类算法在切片数据的特征空间上进行特征聚类,以确定切片数据中的代表性切片数据。

步骤105,将代表性切片数据再次输入至规划模型,以通过规划模型输出与代表性切片数据对应的决策变量。

具体而言,预设历史时间段可以是设计人员根据实际需要选择的历史时间段。能源数据可以包括一次能源数据和二次能源数据。其中,一次能源是指自然界现成存在的能源,如水能、风能、太阳能等。二次能源是指由一次能源直接或者二间接转化成其他种类和形式的能量资源,如电力、煤气、汽油等。设计人员可以根据设计需求选择一段历史时间内的能源数据,并对该能源数据进行时间切片处理。设计人员可以根据选择的历史时间段的长短,确定不同的划分时间。时间切片就是经过划分后的时序数据,相比于原历史时间段,时间切片是长度更短的数据片段。例如,当历史时间段选择为一年至十年时,可以采用周或者月来进行划分,时间切片就是每一周或者每一月。当历史时间段选择为一年以内时,可以采用天进行划分,时间切片就是每一天。

经过上述划分可以得到多个时间切片,每个时间切片都是一个数据片段。将切片数据输入到规划模型中,通过规划模型的处理可以得到多个输出数据,根据输入数据与输出数据之间的映射关系,可以得到切片数据的特征空间。在切片数据的特征空间上进行特征聚类,以确定切片数据中的代表性切片数据。也就是说,在每一个时间切片上运行规划模型,切片数据对应的特征可以从模型求解中获得,具有相似特征的时间切片可以被聚类算法聚成一类,并可以由一个代表性时间切片所表征,该代表性时间切片上的数据就是代表性切片数据。其中,聚类是指将物理或者抽象对象的集合分成由类似的对象组合的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。聚类算法可以是层次聚类、划分算法、模糊聚类以及局域密度聚类中的一种。在具体实施过程中,可以采用层次聚类算法在特征空间上进行特征聚类,使用该聚类方法可以使得误差降低。将聚类后的代表性切片数据再次输入至规划模型,可以得到与代表性切片数据对应的决策变量。

在一个实施例中,可以获取美国得克萨斯州七年来的能源数据,其中,能源可以是风电、光伏、负荷、火电等现有能源中的一种或者多种。根据历史时间段的长短可以选择天或者周或者月进行时间切片的划分。获取美国得克萨斯州七年的能源数据后,可以选择一周的时长作为时间切片的时序长度,以一周的时序长度对七年的能源数据进行时间切片,得到多个以一周为单位的时间切片,每个时间切片上包括多个能源数据。将进行时间切片处理得到的切片数据输入至规划模型。其中,规划模型包括决策变量、目标函数和约束条件。多个切片数据经过规划模型的处理可以得到多个输出数据,每一个输出数据可以是切片数据的数据特征。每一个输入的切片数据对应一个数据特征,可以构成特征空间。特征空间可以是风电的输入数据和输出数据、光伏的输入数据和输出数据、火电的输入数据和输出数据等。采用聚类算法,可以是层次聚类算法对特征空间中的能源数据进行特征聚类,可以得到代表性的能源数据。该能源数据在划分后的时间切片上,也就是切片数据中的代表性切片数据。代表性切片数据可以是光伏的发电量、风电的发电量、负荷数据、火力发电机组、储能装置的技术参数中的一者或者多者。将得到的代表性切片数据再次输入至规划模型,可以得到代表性切片数据对应的决策变量。

规划模型的目标函数可以是以可变运行成本和固定投资成本建立的。可变运行成本可以包含火力发电运行成本、电池发电运行成本等,固定资产投资成本可以包括电池功率投资成本、电池能量投资成本、光伏投资成本、风机投资成本、火电厂投资成本等。规划模型的决策变量可以包括上述的可变运行成本和固定投资成本,还可以包括可再生能源占比。其中,可再生能源占比是指如光伏、风电等可再生能源在整个能源系统中的占有量。在一个实施例中,可再生能源占比可以与火电机组的发电量成负相关关系,调节公式如公式(6)所示:

其中,R是可再生能源发电量占总发电量的最小比例。例如,在一个能源系统中,可以包含可再生能源、电池的储能和火电能源,可再生能源可以是光伏发电、风电发电。也就是说,随着可再生能源占比在能源系统中的不断提高,能源系统各种组份的容量也会随之发生变化。当可再生能源占比不断增加时,火电发点机组的装机容量会不断下降。具体表现在,光伏的装机容量稳健上升,风电的装机容量可以快速上升,以满足不断上升的系统对可再生能源的需求。同时,电池的储能设备的功率容量、电池的储能设备的能量容量也会随着风电装机容量的上升而增加,以满足系统内快速增长的充放电需求以及大规模的能量存储需求。

在一个实施例中,代表性切片数据可以包括可再生能源、负荷数据、火力发电机组以及储能装置技术参数中的至少一者。其中,可再生能源可以是光伏发电量、风电发电量。例如,可以以美国得克萨斯州为例,获取该地七年的能源数据,能源数据可以包括该地七年的风电、光伏以及负荷数据,分辨率可以是一小时。光伏数据可以是对每个地区的光伏进行平均化处理得到的,风电数据可以是可再生能源实验室的风电数据集,负荷数据可以是每个地区2007年到2013年间的真实负荷。以一周时长作为时间切片的时序长度,进行时间切片处理,每一个时间切片上包含多个数据点,可以得到多个切片数据。决策变量可以包括光伏的装机容量、风电的装机容量、储能的能量装机容量和功率容量以及火电的装机容量中的至少一者。装机容量是指发电厂实际安装的发电机组额定有功功率。例如,可以是火电厂或者水电站中所装有的全部汽轮或者水力发电机组额定有功功率。

在一个实施例中,规划模型是在切片数据输入至规划模型之前建立的,其中,规划模型包括决策变量、目标函数和约束条件。决策变量可以包括可变运行成本、固定资产投资成本和可再生能源占比。目标函数可以是以可变运行成本和固定资产投资成本建立的。约束条件可以是能量平衡、火电功率约束、火电机组的启停和储能系统的存储约束。可变运行成本可以包括火电的运行成本、火电的启停成本和储能的充放电成本。固定资产投资成本可以是储能的能量容量成本、功率容量成本、多种可再生能源的投资成本以及火电的投资成本。

在一个实施例中,规划模型的目标函数可以是以可变运行成本和固定投资成本建立的,目标函数的表达式如公式(1)所示:

OB=C

其中,C

在一个实施例中,目标函数的可变运行成本可以包括火电的运行成本、火电的启停成本和储能的充放电成本。可变运行成本是将储能系统每一时刻的充放电量与单位充放电成本进行乘积求和,且包括火电每一时刻的发电量与单位发电成本的乘积求和,以及火电机组启停的数量与单位启停成本的乘积求和。具体的可变运行成本的计算公式如公式(2)所示:

其中,

在一个实施例中,目标函数的固定资产投资成本可以包括储能的能量容量成本、功率容量成本、多种可再生能源的投资成本以及火电的投资成本。固定资产投资成本是对储能系统的能量容量与单位建造能量容量的成本、储能系统的功率容量与单位功率容量成本、每一种可再生能量的容量与单位容量投资成本以及每种火电容量与单位火电容量的投资成本的乘积进行求和计算。具体的固定资产投资成本的计算公式如公式(3)所示:

/>

其中,

在一个实施例中,能源平衡中的每一项输入和输出都需要是正项,可以以可再生能源的总容量乘以可用因子来代表可再生能源的功率输出。可用因子是指给定时刻可再生能源发电功率占装机容量的比重。能量平衡是指能源系统所有能量的流入和流出保持平衡,能量平衡约束条件如公式(4)所示:

其中,A

火电功率约束条件的表达式如公式(5)所示:

其中,ξ

火电机组的启停约束条件包括:

其中,n

储能系统的存储约束条件包括:

/>

其中,E

在一个实施例中,根据目标函数、约束条件以及决策变量建立规划模型,决策变量包括可变运行成本、固定资产投资成本以及可再生能源占比,其中,可再生能源占比与火电机组的发电量成负相关关系,可再生能源占比的调节如公式(6)所示:

其中,R是可再生能源发电量占总发电量的最小比例。

图2示意性示出了根据本申请实施例的基于模型的自适应性聚类数据处理方法的应用场景示意图。如图2所示,相比于传统的计算方法直接将规划时间尺度上的原始数据作为规划模型的输入数据,本申请的基于模型的自适应性聚类数据处理方法是先根据规划时间的尺度,选择合适的时序长度对规划时间尺度进行时间切片。传统的计算方法是对原始输入数据对应的输出结果直接进行聚类算法,得到代表性的数据。而本申请的基于模型的自适应性聚类数据处理方法是对规划模型输出的切片数据的特征进行提取,可以得到切片数据的特征空间。然后在特征空间上运行聚类算法,从而得到切片数据中的代表性切片数据。通过对历史时间段内的能源数据进行时间切片出力,可以将长时间尺度的能源数据进行切分,得到包含多个能源数据的切片数据。规划模型对切片数据进行处理后能后获得能源数据中的特征数据,同时通过规划模型也可以建立特征数据对应的特征空间,在特征空间上运行聚类算法,可以得到具有代表性的切片数据。规划模型再对代表性切片数据进行数据处理,能够得到上述特征数据对应的决策变量。且通过上述方法,规模模型的计算结果精准度更高。

本申请实施例提供了一种处理器,该处理器被配置成执行上述基于模型的自适应性聚类数据处理的方法。

本申请实施例还提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令被处理器执行时使得该处理器能够执行上述任意实施例中描述的基于模型的自适应性聚类数据处理的方法。

本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

相关技术
  • 一种全视场角固态激光雷达探测装置及障碍物探测方法
  • 基于超声波的障碍物探测装置以及清洁机器人
  • 基于超声波的盲区障碍物探测方法、装置、设备及介质
技术分类

06120116547595