掌桥专利:专业的专利平台
掌桥专利
首页

一种基于Lasso-logit模型的发电机组市场力滥用识别方法

文献发布时间:2023-06-19 09:54:18


一种基于Lasso-logit模型的发电机组市场力滥用识别方法

技术领域

本发明涉及电力市场的技术领域,尤其涉及一种基于Lasso-logit模型的发电机组市场力滥用识别方法。

背景技术

近年来,随着电力改革的推进,中国电力市场建设已取得了显著成果。第一批8个现货试点已陆续开展试运行;部分现货试点已经完成了单日、多日的试结算工作。然而,在推进过程中也暴露出一些问题,其中不乏有市场主体存在市场力滥用的行为,损害市场的竞争性和有效性,影响有限资源的优化配置,从而损害电力市场的效率。因此,识别市场主体滥用市场力的违规行为,可以有效防范市场力风险,维护市场的公平与效率,减少市场损失。

电力市场中的市场力滥用主要指市场参与主体利用市场力使电价持续偏高或频繁大幅度波动带来的风险,可存在于电能、备用容量、辅助服务等各种电力商品交易中,以及发电商、售电公司和电力用户等不同市场参与主体中。本发明重点分析的是电力现货市场中市场力滥用的发电机组。由于我国电力市场的发电侧发电企业的市场力大,法规意识相对薄弱,但国内电力市场建设还未采取缓解市场力的相关措施,因此对具有较强市场力的发电商进行识别和风险防范具有必要性。现阶段国内外针对市场力滥用的研究主要有市场力滥用指标体系的构建、市场力滥用的博弈论理论推导分析、综合评价等。随着电力现货市场的推进,电力市场海量数据表现出非均衡、高维等特征,市场力滥用呈现出形式多、防范难、监管难、影响大的特点,给市场相关监管机构带来了巨大的挑战。

因此,为了保证市场的公平竞争和健康发展,亟需一种可适用于电力市场中市场力滥用的识别方法,该方法可有效处理海量数据,并符合实际电力市场运行情况,同时避免出现维数灾难、运算量过大的问题,使得市场监管者可快速对发电机组的市场力滥用行为进行有效识别,并采取相应的抑制措施。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法存在的问题,提出了本发明。

因此,本发明目的是提供一种基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法。

为解决上述技术问题,本发明提供如下技术方案:一种基于Lasso-logit模型的发电机组市场力滥用识别方法,包括以下步骤:

S1、采集电力市场相关的基本信息、运营信息和年报信息等数据信息;

S2、根据S1获取的数据,从结构类指标、行为类指标及影响类指标三个方面构建发电机组市场力滥用识别指标体系;

S3、运用Lasso变量选择对发电机组市场力滥用识别指标体系进行指标筛选并进行共线性检验,剔除具有共线性或不相关的指标;

S4、根据筛选结果建立发电机组市场力滥用识别的Lasso-logit模型,并对模型指标进行显著性检验;

S5、根据构建的识别模型,对发电机组市场力滥用进行识别和分析,从而得到市场力滥用的发电机组集合;

S6、采用两类错误和ROC曲线对模型进行性能评估。

作为本发明所述基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的一种优选方案,其中:步骤S1中,所述基本信息包括发电企业所属发电集团、装机容量、机组台数、单机容量、市场份额、输配电价、交易规则、交易实施细则和电力市场适用的法律法规及相关规程规范;

所述运营信息包括机组运行情况、市场主体申报信息、中长期、现货电能量市场交易结果信息、中长期、运行日系统运行实际信息、市场主体交易结算信息、市场管理信息和运营总结信息;

所述年报信息包括企业财务健康状态、交易合同签订及履约情况、遵守调度纪律和市场规则的情况、是否存在被监管机构行政处罚或采取其他监管措施的情况、是否存在其他违反法律法规被政府部门或司法部门处理的情况。

作为本发明所述基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的一种优选方案,其中:步骤S2中,所述发电机组市场力滥用识别指标体系包含结构类指标、行为类指标及影响类指标,其中:

所述结构类指标包含市场份额和剩余供应指数;

所述行为类指标包含申报阶段和出清阶段,申报阶段包含加权平均报价、高价申报率、报价波动率及量价指数,出清阶段包含中标率、高价中标率、动态市场份额、序外容量指数、相对份额指数和边际机组达限率;

所述影响类指标包含市场出清价。

作为本发明所述基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的一种优选方案,其中:步骤S3具体包含以下流程:

S31、采用分层抽样方法构建样本集,避免数据的不均衡而造成模型识别误差;

S32、基于Lasso变量选择,采用交叉验证方法,获取多个不同惩罚系数下的均方误差,通过选取合适的惩罚系数,从而实现发电机组市场力滥用识别指标的筛选;

S33、进一步采用共线性检验验证指标间的共线性,为构建识别模型提供基础。

作为本发明所述基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的一种优选方案,其中:步骤S4具体包含以下流程:

S41、根据筛选结果和发电机组样本集,构建并估计发电机组市场力滥用识别的Lasso-logit模型;

S42、对模型指标进行显著性检验,判断模型中的指标是否能够对发电机组市场力滥用识别起到很好的解释作用。

作为本发明所述基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的一种优选方案,其中:步骤S5具体包含以下流程:

S51、根据Lasso-logit模型对电力现货市场中的发电机组进行市场力滥用识别分析;

S52、分析各指标对市场力滥用的边际贡献、影响及市场力滥用概率的影响,分析是否符合实际电力市场交易情况,并相应提出抑制措施。

作为本发明所述基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的一种优选方案,其中:步骤S6具体包含以下流程:

S61、基于两类错误,计算总体正确率、第I类错误、第II类错误的均值和标准差,验证模型的识别性能及稳定性;

S62、基于ROC曲线,并计算相应的AUC值,验证模型的有效性。

本发明的有益效果:

1、现有的博弈论理论推导方法,存在模型假定不符合实际电力市场运行情况、均衡点的多解性等问题,难以应用于实践。或者通过指标对发电机组市场力滥用进行综合评价,但指标选取和权重设置存在一定的主观性,且随着现货交易量越来越大,数据的典型大样本和高维特征使得传统综合评价方法计算量过大,效率较低。本发明基于以上问题,采用在其他领域风险识别中应用广泛的Logit模型,并结合Lasso变量选择,对市场力滥用进行识别,该发明不仅提高模型性能,有效识别滥用市场力的发电机组,而且节省大量人力物力。

2、本发明在借鉴国内外电力市场中发电机组交易行为监管指标的基础上,综合考虑发电机组交易行为的内在因素及市场环境的外在因素,从结构类指标、行为类指标及影响类指标三个方面构建发电机组市场力滥用识别指标体系,为电力市场中有效识别市场力滥用提供依据。

3、面对复杂的海量电力现货数据,Lasso变量选择能够从众多指标中筛选出对市场力滥用识别重要的指标,剔除具有共线性或不相关的指标,从而有效降低维度,有助于降低管理者的监管成本。

4、相对于其他机器学习的方法,本发明提出的方法,不仅可以给出模型解释,清晰表达各指标对识别结果的边际贡献,还可以通过抑制或者促进相应指标值,实现对发电机组市场力滥用行为的有效控制。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:

图1为本发明基于Lasso-logit模型的发电机组市场力滥用识别方法及建立方法的流程示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。

再其次,本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

实施例1

参阅图1,本发明的实施例,一种基于Lasso-logit模型的发电机组市场力滥用识别方法,具体包括以下步骤:

S1、采集电力市场相关的基本信息、运营信息和年报信息等数据信息;其中:

电力市场的基本信息包括发电企业所属发电集团、装机容量、机组台数、单机容量、市场份额、输配电价、交易规则、交易实施细则和电力市场适用的法律法规及相关规程规范;

电力市场的运营信息包括机组运行情况、市场主体申报信息、中长期、现货电能量市场交易结果信息、中长期、运行日系统运行实际信息、市场主体交易结算信息、市场管理信息和运营总结信息;

进一步的:

电力市场的年报信息包括企业财务健康状态、交易合同签订及履约情况、遵守调度纪律和市场规则的情况、是否存在被监管机构行政处罚或采取其他监管措施的情况、是否存在其他违反法律法规被政府部门或司法部门处理的情况。

S2、根据S1获取的数据,从结构类指标、行为类指标及影响类指标三个方面构建发电机组市场力滥用识别指标体系;参阅表1,发电机组市场力滥用识别指标体系包含结构类指标、行为类指标及影响类指标;

表1

其中,

预设结构类指标包含市场份额X1和剩余供应指数X2;市场份额X1反映发电机组的市场力大小;剩余供应指数X2反映发电机组在市场中的地位;

行为类指标包含申报阶段和出清阶段,申报阶段包含加权平均报价X3、高价申报率X4、报价波动率X5及量价指数X6,出清阶段包含中标率X7、高价中标率X8、动态市场份额X9、序外容量指数X10、相对份额指数X11和边际机组达限率X12;

申报阶段的加权平均报价X3反映发电机组的报价水平;高价申报率X4反映发电机组抬高报价的行为;报价波动率X5反映发电机组报价的变化情况;量价指数X6反映发电机组申报高价的行为;

出清阶段的中标率X7反映发电机组潜在的市场力大小;高价中标率X8反映发电机组抬高报价,且获得接近申报容量的情况;动态市场份额X9反映发电机组中标容量占总中标容量的程度;序外容量指数X10反映发电机组未能中标容量的水平;相对份额指数X11反映发电机组中标份额偏离市场份额的程度;边际机组达限率X12反映发电机组作为边际机组的次数;

影响类指标包含市场出清价X13。市场出清价X13反映市场的电价水平。

S3、运用Lasso变量选择对发电机组市场力滥用识别指标体系进行指标筛选并进行共线性检验,剔除具有共线性或不相关的指标;具体包括以下流程:

S31、采用分层抽样方法构建样本集,避免数据的不均衡而造成模型识别误差。本发明采用针对不均衡数据的分层抽样方法,分别从两种类别中不重复随机抽样相同样本数据作为模型构建的样本集,确保两种类别有相同的占比。

S32、基于Lasso变量选择,采用交叉验证方法,获取多个不同惩罚系数下的均方误差,通过选取合适的惩罚系数,从而实现发电机组市场力滥用识别指标的筛选。Lasso变量选择是通过构造惩罚函数,使一些指标的系数为0,从而实现变量选择的目的,可以用于解决回归分析中多重共线性的问题。Lasso变量选择的关键在于惩罚参数的选取,本发明采用交叉验证法确定惩罚参数。

定义交叉验证的统计量为:

其中,

上述交叉验证过程中使得C

S33、进一步采用共线性检验验证指标间的共线性,为构建识别模型提供基础。如果筛选出的指标共线性检验结果中容忍度<0.1或者方差膨胀因子>10,则表示指标间有共线性存在,剔除相应指标。

S4、根据筛选结果建立发电机组市场力滥用识别的Lasso-logit模型,并对模型指标进行显著性检验;具体包括以下流程:

S41、根据筛选结果和发电机组样本集,构建并估计发电机组市场力滥用识别的Lasso-logit模型;首先,结合Lasso变量选择所得的筛选指标,构建二分类Logit模型:

其中,P(y

然后,利用构建的发电机组样本集代入模型,对模型进行参数估计。

S42、对模型指标进行显著性检验,判断模型中的指标是否能够对发电机组市场力滥用识别起到很好的解释作用。采用Wald显著性检验对模型指标进行验证,Wald检验是在统计模型中测试解释变量重要性的一种检验,如果对于解释变量,Wald检验后表明它们是重要的,那么这些变量对应的参数则不为零,这些变量与因变量之间存在显著相关关系,本发明采用Wald检验对模型指标进行显著性检验,在5%的显著性水平下,如果指标的Wald检验统计量拒绝了原假设,证明模型中的指标与分类因变量之间存在显著线性关系,则能够对发电机组市场力滥用识别起到很好的解释作用。

S5、根据构建的识别模型,对发电机组市场力滥用进行识别和分析,从而得到市场力滥用的发电机组集合;具体包括以下流程:

S51、根据Lasso-logit模型对电力现货市场中的发电机组进行市场力滥用识别分析;将Lasso-logit模型应用于电力市场交易中,根据采集的数据计算相应的指标值并代入,设定模型概率P(y

S52、分析各指标对市场力滥用的边际贡献、影响及市场力滥用概率的影响,分析是否符合实际电力市场交易情况,并相应提出抑制措施。首先,根据模型中相应指标的系数估计值,分析指标系数为正,则指标值越大,发电机组越有可能市场力滥用;指标系数为负,则指标值越小,发电机组越有可能市场力滥用;分析指标系数越大,说明发电机组市场力滥用概率的边际贡献最大;指标系数越小,说明发电机组市场力滥用概率的边际贡献最小,即发电机组是否市场力滥用与该指标相关性最小;然后,通过分析单个指标与市场力滥用概率的关系进一步验证分析结果是否与实际电力市场一致。最后,根据分析结果,通过抑制或者促进相应指标值,实现对发电机组市场力滥用行为的有效控制。

S6、采用两类错误和ROC曲线对模型进行性能评估;具体包括以下流程:

S61、基于两类错误,计算总体正确率、第I类错误、第II类错误的均值和标准差,验证模型的识别性能及稳定性;两类错误来评估模型识别的准确性和可靠性。这两类错误是指:第I类错误是将滥用市场力发电机组识别为未滥用市场力发电机组,这样会增加市场的风险。第II类错误是将未滥用市场力发电机组识别为滥用市场力发电机组,这样会监管过度,不利于市场改革。这两类错误都是电力市场不能接受的。通过构建混淆矩阵计算总体正确率、第I类错误、第II类错误的均值和标准差,混淆矩阵如表2。

Lasso-logit模型的混淆矩阵

表2

对比普通Logit模型,利用构建的样本集,随机抽取其中75%为训练集,余下的为测试集,分别使用普通Logit模型和Lasso-logit模型运行100次,计算总体正确率、第I类错误、第II类错误的均值和标准差。总体正确率的均值越大,第I类错误、第II类错误的均值越小,模型性能越好;总体正确率、第I类错误、第II类错误的标准差越小,模型越稳定。

S62、基于ROC曲线,并计算相应的AUC值,验证模型的有效性。ROC曲线是常用的二分类模型评估标准,用于评价模型的分类性能。对于一个好的分类模型,它的ROC曲线应尽可能靠近图形的左上角。AUC值作为ROC曲线的补充,往往用数值表示ROC曲线的结果,其数值范围从0到1。通常AUC值越高的模型,分类精度越高,分类效果也越好。

综上所述,本发明的基于Lasso-logit模型的发电机组市场力滥用识别方法,通过构建发电机组市场力滥用识别指标体系,为发电机组市场力滥用识别提供依据;运用Lasso变量选择对发电机组市场力滥用识别指标体系进行指标筛选并进行共线性检验,有效降低维度和市场管理者的监管成本,避免维数灾难、运算量过大问题;根据筛选结果建立发电机组市场力滥用识别的Lasso-logit模型并进行显著性检验,对发电机组进行识别和分析,可有效得到市场力滥用的发电机组集合,实现电力市场的风险监管和防范。

重要的是,应注意,在多个不同示例性实施方案中示出的本申请的构造和布置仅是例示性的。尽管在此公开内容中仅详细描述了几个实施方案,但参阅此公开内容的人员应容易理解,在实质上不偏离该申请中所描述的主题的新颖教导和优点的前提下,许多改型是可能的(例如,各种元件的尺寸、尺度、结构、形状和比例、以及参数值(例如,温度、压力等)、安装布置、材料的使用、颜色、定向的变化等)。例如,示出为整体成形的元件可以由多个部分或元件构成,元件的位置可被倒置或以其它方式改变,并且分立元件的性质或数目或位置可被更改或改变。因此,所有这样的改型旨在被包含在本发明的范围内。可以根据替代的实施方案改变或重新排序任何过程或方法步骤的次序或顺序。在权利要求中,任何“装置加功能”的条款都旨在覆盖在本文中所描述的执行所述功能的结构,且不仅是结构等同而且还是等同结构。在不背离本发明的范围的前提下,可以在示例性实施方案的设计、运行状况和布置中做出其他替换、改型、改变和省略。因此,本发明不限制于特定的实施方案,而是扩展至仍落在所附的权利要求书的范围内的多种改型。

此外,为了提供示例性实施方案的简练描述,可以不描述实际实施方案的所有特征(即,与当前考虑的执行本发明的最佳模式不相关的那些特征,或于实现本发明不相关的那些特征)。

应理解的是,在任何实际实施方式的开发过程中,如在任何工程或设计项目中,可做出大量的具体实施方式决定。这样的开发努力可能是复杂的且耗时的,但对于那些得益于此公开内容的普通技术人员来说,不需要过多实验,所述开发努力将是一个设计、制造和生产的常规工作。

应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

相关技术
  • 一种基于Lasso-logit模型的发电机组市场力滥用识别方法
  • 一种发电机组市场力滥用判别方法
技术分类

06120112346109