掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及一种基于博弈均衡的实时需求响应建模方法,属于电力实时需求响应建模技术领域。

背景技术

通过需求响应使发电企业、供电商和电力用户互动竞争,可以提高电力市场的资源配置效率。利用电价激励进行引导电能消费是需求响应的一个重要特征,不仅考虑了系统调度人员的能量管理手段,同时也加强了用户的自主意识,提升自身利益。目前,需求响应的主要问题是如何获取最优电价策略,使得发电企业、供电商和电力用户三方受益。

发明内容

本发明要解决的技术问题是:提供一种基于博弈均衡的实时需求响应建模方法,通过构建含电力零售商、分布式能源公司与多元用户的三层需求响应框架结构,制定基于博弈均衡的实时需求响应和电价制定策略,使得供需双方进行互动博弈,获取需求响应的全局最优解,以解决现有技术中存在的技术问题。

本发明采取的技术方案为:一种基于博弈均衡的实时需求响应建模方法,该方法包括以下步骤:

步骤1、建立基于纳什-斯塔克尔伯格-纳什(Nash-Stackelberg-NashN-S-N)博弈均衡的需求响应框架模型;

步骤2、制定基于博弈均衡的实时需求响应和电价制定策略;

步骤3、根据步骤2中实时需求响应和电价制定策略,供需双方进行互动博弈,获取需求响应的最终解决方案。

步骤1中需求响应框架模型为含电力零售商、分布式能源公司与多元用户的三层需求响应框架结构。

需求响应框架模型的实现方法:售电商通过在日前市场,提前购买下一日的电量需求,并在当日内,根据用户需求以及自身的拥有的储能设备进行电量消耗;分布式发电公司通过计算自身的发电成本,以及用户的购买电量情况来调整自身的发电量参与市场交易在该纳什-斯塔克尔伯格-纳什博弈的互动需求响应框架中,零售商和分布式发电公司作为代理机构发布电价信息,随后用户根据该信息自行决定购电策略,该处Nash博弈是指在同一层级里,若多个售电商与分布式发电公司之间处于相同地位,其会产生各自的策略s

其中,U

同理,用户侧方面,不同的用户对于电价有不同的反应,而其反应策略会影响上层策略的制定,因此也属于Nash博弈,存在一个或多个均衡解,在层与层之间(这里有两层,上层是售电商,下层是用户),属于Stackelberg博弈范畴,上层售电商作为领导者(leader),下层用户作为跟随者(follower),跟随者在领导者给定策略(当前售电价)之后,制定自身的动作策略(当前购买电量),同时跟随者的动作策略做出后,会使领导者重新制定符合自身利益的策略(重新制定的售电价),最终达到一个均衡点,如式(2)和式(3):

其中,U

步骤2中实时需求响应和电价制定策略的制定方法包括:

供电侧的零售商和分布式发电公司的收入函数除了自身的收益外,还包括一项削峰填谷补贴,表达式如下:

式中,Pr

其中,接受的集成商电价集合P表述为:

式中,Pr

用户侧方面,则以自身的电费及用电舒适度、身体舒适度的指标来评价其效用,表达如下:

式中,U

式中,

步骤3中供需双方进行互动博弈获取需求响应的最终解决方案的方法包括:根据Stackelberg博弈理论,将售电商与分布式发电公司作为领导者,而将用户作为跟随着,在高级量测体系与通信接口满足的情况下,双方进行互动博弈,该过程是一个虚拟的电力交易过程。

互动博弈的具体步骤如下:

i)领导者先向跟随者提出其制定的策略方案:

博弈首先从领导者向跟随着提出其制定的策略方案,即是一系列的虚拟电价集合(VRPs)c=[c

ii)跟随者选择对于自身最优的响应策略:

当跟随者接受到领导者所提供的策略集合后,第i个跟随者将会从自己的策略集合Ω

式中,U

x

Ω

iii)领导者根据跟随者所确定的最优响应策略,优化其策略方案:

根据每个跟随者所提出的最优响应策略x

iv)重复进行步骤i)~iii),获取最终解决方案:

每次领导者通过步骤iii)所选择的优化策略方案,都将再次提供给跟随者们。

博弈所期望达到的共同收益点表现为Stackelberg均衡(SE);当达到Stackelberg均衡状态时,领导者能根据跟随者所提出的最优响应策略使其效用方程最大化,此相关的策略被称为领导者的均衡策略;同时,每个跟随者依据领导者的均衡策略选择最优响应策略使其效用方程最小化;该最优响应策略将组成每个跟随者的均衡策略,根据Stackelberg均衡理论,每一个参与者都不会脱离他们所对应的均衡策略。

对于单一领导者,N个跟随者的Stackelberg博弈当中的Stackelberg均衡定义如下:

对于与解决以下优化问题的所相关的策略集合,称为单一领导者,N个跟随者的Stackelberg博弈当中的Stackelberg均衡

x

本发明的有益效果:与现有技术相比,本发明提出一种基于博弈均衡的实时需求响应建模方法,首先通过构建含电力零售商、分布式能源公司与多元用户的三层需求响应框架结构,然后制定基于博弈均衡的实时需求响应和电价制定策略,最后通过供需双方进行互动博弈,获取需求响应的全局最优解。解决了现有技术针对需求响应无法获取最优电价的技术问题。

附图说明

图1为需求响应框架结构图;

图2为激励响应互动博弈求解图。

图3为竞争N-S-N模型图。

具体实施方式

下面结合附图及具体的实施例对本发明进行进一步介绍。

实施例1:如图1-图3所示,一种基于博弈均衡的实时需求响应建模方法,它包括:

步骤1、建立基于纳什-斯塔克尔伯格-纳什(Nash-Stackelberg-NashN-S-N)博弈均衡的需求响应框架模型;

步骤2、制定基于博弈均衡的实时需求响应和电价制定策略;

步骤3、供需双方进行互动博弈,获取需求响应的最终解决方案。

步骤1建立基于Nash-Stackelberg-Nash博弈均衡的需求响应框架模型,构建含电力零售商、分布式能源公司与多元用户的三层需求响应框架结构。

需求响应框架结构如图1所示,售电商通过在日前市场,提前购买下一日的电量需求,并在当日内,根据用户需求以及自身的拥有的储能设备进行电量消耗。而分布式发电公司,通过计算自身的发电成本,以及用户的购买电量情况来调整自身的发电量参与市场交易。随着售电商、分布式发电公司以及用户数量的增加,变量的维度将会剧增,导致“维数灾难”,一种有效的解放办法是利用强化学习与迁移学习,通过变量降维处理和预学习,可加快其智能化,提高求解速度等。解决的方法主要包括:Minmax-Q学习、Nash-Q学习、CEQ学习、集体智慧算法等,如图2所示。在该N-S-N博弈的互动需求响应框架中,零售商和分布式发电公司作为代理机构发布电价信息,随后用户根据该信息自行决定购电策略。该处Nash博弈是指在同一层级里,如多个售电商与分布式发电公司之间处于相同地位,其会产生各自的策略s

其中,U

同理,用户侧方面,不同的用户对于电价有不同的反应,而其反应策略会影响上层策略的制定,因此也属于Nash博弈,存在一个或多个均衡解。在层与层之间,属于Stackelberg博弈范畴,上层售电商作为领导者(leader),而下层用户作为跟随者(follower),跟随者在领导者给定策略之后,制定自身的动作策略,同时跟随者的动作策略做出后,会使领导者重新制定符合自身利益的策略,最终达到一个均衡点,如式(2)和式(3)。

其中,U

步骤2制定基于博弈均衡的实时需求响应和电价制定策略,包括:

为了达到需求响应的目的,供电侧的零售商和分布式发电公司的收入函数除了自身的收益外,还包括一项削峰填谷补贴,表达式如下:

式中,PrRetailer t表示售电商在t时刻的零售电价,p

其中,可接受的集成商电价集合P可表述为:

式中,Prmin t,Prmax t分别为电价的上下限,Prfav为电价平均值限制。在这个集合中,第一个不等式限制了集成商的售电价格在[Prmin t,Prmax t]区间内,并且为了降低集成商的市场力量,根据价格约定,第二个不等式被用来对售电价格序列的平均值施加上限。

用户侧方面,则以自身的电费及用电舒适度、身体舒适度等指标来评价其效用,可表达如下:

式中,U

式中,pmin i和pmax i分别为用户响应功率的上下限,Qd i为用户每日功率需求总量。

以上两层模型,可表示为N-S-N博弈,如图3所示。

步骤3供需双方进行互动博弈,获取需求响应的最终解决方案,包括:

根据Stackelberg博弈理论,此处可将售电商与分布式发电公司作为领导者,而将用户作为跟随着,在高级量测体系与通信接口满足的情况下,双方进行互动博弈,该过程是一个虚拟的电力交易过程,其具体博弈过程如下:

i)领导者先向跟随者提出其制定的策略方案:

博弈首先从领导者向跟随着提出其制定的策略方案,即是一系列的虚拟电价集合(VRPs)c=[c

ii)跟随者选择对于自身最优的响应策略:

当跟随者接受到领导者所提供的策略集合后,第i个跟随者将会从自己的策略集合Ω

iii)领导者根据跟随者所确定的最优响应策略,优化其策略方案:

根据每个跟随者所提出的最优响应策略x

iv)重复进行步骤i)~iii),获取最终解决方案:

每次领导者通过步骤iii)所选择的优化策略方案,都将再次提供向给跟随者们。

博弈所期望达到的共同收益点表现为Stackelberg均衡(SE)。当达到Stackelberg均衡状态时,领导者能根据跟随者所提出的最优响应策略使其效用方程最大化,此相关的策略被称为领导者的均衡策略。同时,每个跟随者可以依据领导者的均衡策略选择最优响应策略使其效用方程最小化。这样的最优响应策略将组成每个跟随者的均衡策略。根据Stackelberg均衡理论,每一个参与者都不会脱离他们所对应的均衡策略。对于单一领导者,N个跟随者的Stackelberg博弈当中的Stackelberg均衡定义如下:

对于与解决以下优化问题的所相关的策略集合,称为单一领导者,N个跟随者的Stackelberg博弈当中的Stackelberg均衡

x

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种基于博弈均衡的实时需求响应建模方法
  • 一种基于多维度响应特性的价格型需求响应建模方法
技术分类

06120112638026