掌桥专利:专业的专利平台
掌桥专利
首页

一种基于风电竞价的交易信息检索方法及装置

文献发布时间:2023-06-19 10:02:03


一种基于风电竞价的交易信息检索方法及装置

技术领域

本发明涉及风电竞价技术领域,尤其涉及一种基于风电竞价的交易信息检索方法及装置。

背景技术

在现有的电力市场环境下,开展策略性竞价是市场参与者的重要决策之一,各市场参与者需要向电力交易中心策略报价以达到自身价值最大化的目的。在电力撮合交易中,科学合理的竞价行为可以有效提高市场活力,优化资源的配置。

现有的风电竞价要获取交易对手和客户的信息方式比较单一,而且信息比较难以获取,只能通过线下沟通或者利用电网公开的一些信息来获取交易主体的基本信息,这种信息获取方式不仅效率低下,而且获取的消息还不够全面,不能有效为风电企业竞价提供足够的市场信息,所以,亟需对现有的信息获取方法进行改进。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

有鉴于此,本发明提出了一种基于风电竞价的交易信息检索方法及装置,旨在解决现有技术无法实现通过爬虫系统根据客户需求全面精确爬取客户需求信息的技术问题。

本发明的技术方案是这样实现的:

一方面,本发明提供了一种基于风电竞价的交易信息检索方法,所述基于风电竞价的交易信息检索方法包括以下步骤:

S1,获取用户信息需求,根据该信息需求获取对应网页信息;

S2,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;

S3,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;

S4,将信息数据表存入数据库中对数据库进行更新。

在以上技术方案的基础上,优选的,步骤S1中,获取用户信息需求,根据该信息需求获取对应网页信息,还包括以下步骤,获取用户信息需求,根据该信息需求搜索对应的网页信息,并向该网页信息对应的服务器发送请求,当收到服务器反馈时,获取该网页信息。

在以上技术方案的基础上,优选的,步骤S2中,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据,还包括以下步骤,通过正则表达式对该网页信息进行解析,获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL 信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果。

在以上技术方案的基础上,优选的,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果,还包括以下步骤,根据网页解析结果建立不同分类集合,根据该分类集合建立网页解析数据表,将该网页解析数据表存入数据库中,通过爬取的网页的解析结果建立新网页解析数据表,根据该新网页解析数据表对网页解析数据表进行更新。

在以上技术方案的基础上,优选的,步骤S3中,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表,还包括以下步骤,设定属性分类标准,所述分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立信息数据表。

在以上技术方案的基础上,优选的,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立新数据表,还包括以下步骤,结合信息数据表以及网页解析数据表对每个用户的需求进行分析,并建立用户画像模型,生成对应的信息检索建议。

在以上技术方案的基础上,优选的,步骤S4中,将信息数据表存入数据库中对数据库进行更新,还包括以下步骤,将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新。

更进一步优选的,所述基于风电竞价的交易信息检索装置包括:

获取模块,用于获取用户信息需求,根据该信息需求获取对应网页信息;

解析爬取模块,用于对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;

分类模块,用于设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;

更新模块,用于将信息数据表存入数据库中对数据库进行更新。

第二方面,所述基于风电竞价的交易信息检索方法还包括一种设备,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序配置为实现如上文所述的基于风电竞价的交易信息检索方法的步骤。

第三方面,所述基于风电竞价的交易信息检索方法还包括一种介质,所述介质为计算机介质,所述计算机介质上存储有基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序被处理器执行时实现如上文所述的基于风电竞价的交易信息检索方法的步骤。

本发明的一种基于风电竞价的交易信息检索方法相对于现有技术具有以下有益效果:

(1)通过对网页信息进行解析爬取,能够在现有的网页信息的基础上获取更多的网页信息,提高信息检索的精确度,提升用户获取信息的数量。

(2)通过设定属性分类标准,通过属性分类标准与用户信息需求结合,构建用户画像模型,能够为用户电力交易决策提供帮助,提升用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例方案涉及的硬件运行环境的设备的结构示意图;

图2为本发明基于风电竞价的交易信息检索方法第一实施例的流程示意图;

图3为本发明基于风电竞价的交易信息检索方法第一实施例的功能模块示意图。

具体实施方式

下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

如图1所示,该设备可以包括:处理器1001,例如中央处理器(Central ProcessingUnit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口 1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory, RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory, NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001 的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对设备的限定,在实际应用中设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于风电竞价的交易信息检索方法程序。

在图1所示的设备中,网络接口1004主要用于建立设备与存储基于风电竞价的交易信息检索方法系统中所需的所有数据的服务器的通信连接;用户接口 1003主要用于与用户进行数据交互;本发明基于风电竞价的交易信息检索方法设备中的处理器1001、存储器1005可以设置在基于风电竞价的交易信息检索方法设备中,所述基于风电竞价的交易信息检索方法设备通过处理器1001调用存储器1005中存储的基于风电竞价的交易信息检索方法程序,并执行本发明实施提供的基于风电竞价的交易信息检索方法。

结合图2,图2为本发明基于风电竞价的交易信息检索方法第一实施例的流程示意图。

本实施例中,所述基于风电竞价的交易信息检索方法包括以下步骤:

S10:获取用户信息需求,根据该信息需求获取对应网页信息。

应当理解的是,本系统实施例首先会获取用户信息需求,这个用户信息需求基本是对手的一些基本信息或者用户所处的技术领域,本实施例中以风电竞价为例,之后系统会搜索风电竞价对应的网页信息,然后向这些网页信息对应的服务器发送下载请求,只有当接收到服务器的反馈之后,系统才会根据反馈来对这些网页信息进行下载,通过这种方式,能够在搜索网页信息之前,对网页信息有一个精确定位,避免了搜索资源的浪费,提高了整个信息检索的效率。

S20:对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据。

应当理解的是,在获取到网页信息之后,系统会对网页信息进行解析,网页信息解析的方式有xpath语句,正则表达式或者css选择器,通过上述方式都可以从网页信息中获取对应的解析结果,本实施例中使用的是正则表达式获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息,通过正则表达式能够精确且快速获得对应的网页解析结果,能够提高整个信息检索的速度。

应当理解的是,在获取到URL信息之后,系统会根据URL信息爬取新的网页,然后从新的网页处获取新的网页信息,以此不断对检索的信息进行更新,不断提高信息检索的精确度,网络爬虫,是能够按照程序设计者所指定的要求,有序的自动获取指定网站上的有用信息的程序,本实施例中通过分布式文件系统和分布式并行计算框架的使用,提高爬虫的效率和准确度,使抓取过程更流畅。

应当理解的是,最后系统会根据获取到的网页解析结果生成不同的数据表,即根据网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息这些信息建立不用的数据集合,然后将各个集合统一起来形成一个表格,通过这样的方式,能够方便后续对信息的检索。

S30:设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表。

应当理解的是,为了更好方便用户信息检索,系统会设定属性分类标准,通过属性标准利用数据表生成对应的分类表,以此方便用户直观方便检索信息,分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息。

其中,基础信息包括:所属供电局、电压等级、地址、联系人、所属行业、主要产品以及实际产量等信息;价值信息包括:年度、月度成交量,交易均价,年度同比、环比以及各类交易类型的信息。能够自动甄别高电价用户,对高电价用户进行划分;行为信息包括:行业月度成交的量价信息,以及行业开工率和主要产品价格信息走势;行业信息包括:企业的欠费情况、信用情况以及履约情况评价;财务信息包括:近两年的资产负债率、流动比率、报酬利率以及上市公司财务信息查看网址。

应当理解的是,之后系统会获取用户基本信息,通过对用户基本信息即用户的基础属性和交易属性进行分析,识别出大用户的特性。然后基于上述建立的数据表和分类表,通过对大用户进行分析,逐步完善大用户的特性,构建大用户画像模型,为电力交易决策提供辅助支持。

S40:将信息数据表存入数据库中对数据库进行更新。

应当理解的是,最后系统会将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新,以此完成整个信息检索过程的不断更新,提高信息检索的精确度。

需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。

通过上述描述不难发现,本实施例通过获取用户信息需求,根据该信息需求获取对应网页信息;对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;将信息数据表存入数据库中对数据库进行更新。本实施例通过对获取到的网页信息进行解析,能够依次得到精准的用户需求数据,同时能够爬取更多相关信息,提高用户信息需求的精度,同时设定属性分类标准与用户信息需求结合,能够生成每个用户的画像模型,为用户电力交易决策提供辅助,提升用户体验。

此外,本发明实施例还提出一种基于风电竞价的交易信息检索装置。如图 3所示,该基于风电竞价的交易信息检索装置包括:获取模块10、解析爬取模块20、分类模块30以及更新模块40。

获取模块10,用于获取用户信息需求,根据该信息需求获取对应网页信息;

解析爬取模块20,用于对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;

分类模块30,用于设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;

更新模块40,用于将信息数据表存入数据库中对数据库进行更新。

此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。

另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于风电竞价的交易信息检索方法,此处不再赘述。

此外,本发明实施例还提出一种介质,所述介质为计算机介质,所述计算机介质上存储有基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序被处理器执行时实现如下操作:

S1,获取用户信息需求,根据该信息需求获取对应网页信息;

S2,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;

S3,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;

S4,将信息数据表存入数据库中对数据库进行更新。

进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:

获取用户信息需求,根据该信息需求搜索对应的网页信息,并向该网页信息对应的服务器发送请求,当收到服务器反馈时,获取该网页信息。

进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:

通过正则表达式对该网页信息进行解析,获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL 信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果。

进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:

根据网页解析结果建立不同分类集合,根据该分类集合建立网页解析数据表,将该网页解析数据表存入数据库中,通过爬取的网页的解析结果建立新网页解析数据表,根据该新网页解析数据表对网页解析数据表进行更新。

进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:

设定属性分类标准,所述分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立信息数据表。

进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:

结合信息数据表以及网页解析数据表对每个用户的需求进行分析,并建立用户画像模型,生成对应的信息检索建议。

进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:

将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新。

以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于风电竞价的交易信息检索方法及装置
  • 一种基于风电竞价的量价预测的方法及装置
技术分类

06120112389189