掌桥专利:专业的专利平台
掌桥专利
首页

数据预测方法及系统

文献发布时间:2024-05-31 01:29:11


数据预测方法及系统

技术领域

本发明涉及数据预测技术领域,具体地涉及一种数据预测方法、一种数据预测系统、一种机器可读存储介质及一种电子设备。

背景技术

发电厂(power plant)又称发电站,是将自然界蕴藏的各种一次能源转换为电能(二次能源)的工厂。随着发电厂的发展,需要对发电厂的运行数据进行实时预测,为用户提供决策支持。目前,对于发电厂的运行数据预测仅仅停留于人为整理预测阶段,缺乏客观性和准确性。

因此,如何对发电厂的运行数据进行实时、准确预测,帮助用户快速预测目标数据,提供决策支持是目前亟需解决的问题。

发明内容

本发明实施方式的目的是提供一种数据预测方法及系统,以至少解决上述的对发电厂的运行数据的预测缺乏客观性和准确性的问题。

为了实现上述目的,本发明第一方面提供一种数据预测方法,包括:

根据预处理后的发电厂历史运行数据,确定各发电厂历史运行数据之间的关联关系;

基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置;

实时获取发电厂运行数据,将各发电厂运行数据基于对应的数据特征输入至知识图谱模型中的对应数据节点,以进行数据预测,得到数据预测结果。

可选的,上述数据节点包括多个子节点和多个父节点;

上述基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置,包括:

基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,确定各子节点对应的数据特征;其中,各发电厂历史运行数据的数据特征与各子节点对应的数据特征一一对应;

基于待预测数据和发电厂历史运行数据,进行预测规则配置,并将预测规则嵌入至知识图谱模型中的对应父节点;

基于预测规则,建立各子节点与对应父节点的连接。

可选的,上述预测规则包括机器学习算法和数学模型;

上述基于待预测数据和发电厂历史运行数据,进行预测规则配置,包括:

确定待预测数据与发电厂历史运行数据之间的逻辑关系;

基于待预测数据与发电厂历史运行数据之间的逻辑关系,匹配对应父节点的机器学习算法和/或数学模型。

可选的,上述数据预测方法还包括:

基于发电厂DCS数据库、API接口和/或爬虫技术,获得发电厂历史运行数据。

可选的,上述发电厂历史运行数据的预处理过程包括:

去重处理、缺失值处理和/或异常值处理。

可选的,上述数据节点包括中心节点,用于展示数据预测结果;

数据预测结果的展示方式至少包括图表、表格和/或文字。

可选的,在基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置之后,该方法还包括:

将预处理后的发电厂历史运行数据作为输入,对配置完成的知识图谱模型进行测试;

基于测试结果,对知识图谱模型进行优化调试。

本发明第二方面提供一种数据预测系统,包括:

关联关系确定模块,用于根据预处理后的发电厂历史运行数据,确定各发电厂历史运行数据之间的关联关系;

数据节点配置模块,用于基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置;

数据预测模块,用于实时获取发电厂运行数据,将各发电厂运行数据基于对应的数据特征输入至知识图谱模型中的对应数据节点,以进行数据预测,得到数据预测结果。

在本发明第三方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得上述处理器被配置成执行上述的数据预测方法。

在本发明第四方面提供一种电子设备,电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现上述的数据预测方法。

通过上述技术方案,提供一种数据预测方法及系统对预处理后的发电厂历史运行数据进行分析,以确定各发电厂历史运行数据之间的关联关系。根据各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置。利用配置好的知识图谱模型对实时获取的发电厂运行数据进行数据预测,以得到目标预测数据的数据预测结果。该方法及系统实现了基于知识图谱的数据预测,通过发电厂历史运行数据构建知识图谱模型的数据节点,并利用配置好的知识图谱模型基于实时获取的发电厂运行数据进行数据预测。从而实现了对发电厂的运行数据进行实时、准确预测的目的,帮助用户快速预测目标数据,为用户提供了决策支持。

本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施方式的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施方式,但并不构成对本发明实施方式的限制。在附图中:

图1是本发明一种实施方式提供的一种数据预测方法的流程图;

图2是本发明一种实施方式提供的一种知识图谱模型的节点连接示意图;

图3是本发明一种实施方式提供的一种数据预测系统的框图;

图4是本发明优选实施方式提供的一种电子设备结构示意图。

附图标记说明

10-电子设备,100-处理器,101-存储器,102-计算机程序。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

图1是本发明一种实施方式提供的一种数据预测方法的流程图。如图1所示,本发明实施方式提供一种数据预测方法,包括:

S110:根据预处理后的发电厂历史运行数据,确定各发电厂历史运行数据之间的关联关系;

具体的,在各发电厂历史运行数据中包含了实体(如人物、地点、事件等),发电厂电力系统可能涉及到许多不同设备和环节(例如输电线、变电站等),则对发电厂已经发生的事件和运行数据(即发电厂历史运行数据)进行统计和分析,可以确定各发电厂历史运行数据之间的关联关系。

在本实施例的一些实施方式中,上述数据预测方法还包括:基于发电厂DCS数据库、API接口和/或爬虫技术,获得发电厂历史运行数据。

具体的,发电厂历史运行数据可以来源多个渠道,例如发电厂DCS数据库、API接口获取、爬虫技术(其中,爬虫技术可以从页面、文本、图像和音频等多个媒体数据中抽取)。数据收集的关键是确定数据源,获取数据的权限和合规性,并确保数据的完整性和准确性。从而整合来自不同数据源的信息(包括结构化数据、半结构化数据和非结构化数据),以构建一个统一的知识图谱体系。

需要说明的是,在该方法的知识图谱模型中,发电厂历史运行数据属于知识图谱数据(包括实体、关系和属性等信息)。知识图谱数据可以通过知识图谱构建工具、数据抽取工具或者手工标注等方式获取。

在本实施例的一些实施方式中,上述发电厂历史运行数据的预处理过程包括:去重处理、缺失值处理和/或异常值处理。

具体的,考虑到收集到的发电厂历史运行数据可能存在噪声、冗余和不一致的情况,需要进行数据清洗的预处理。数据清洗的过程包括去重、缺失值处理、异常值处理、标准化、规范化等操作,以确保发电厂历史运行数据的质量和准确性。

S120:基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置;

请参照图2,图2是本发明一种实施方式提供的一种知识图谱模型的节点连接示意图。在知识图谱模型中,各发电厂历史运行数据对应的实体的数据特征和各发电厂历史运行数据之间的关联关系可以用图的形式表示,实体是图中的节点,关联关系是节点之间的连线。通过图结构来表示各发电厂历史运行数据之间的实体、关联关系和属性,可以描述丰富的语义信息,例如实体之间的关联、属性的特征等。知识图谱的数据预测就是根据已有的知识图谱数据,预测新的实体属性、关系或者其他相关信息。

在本实施例的一些实施方式中,上述数据节点包括多个子节点和多个父节点;上述基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置,包括:

基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,确定各子节点对应的数据特征;其中,各发电厂历史运行数据的数据特征与各子节点对应的数据特征一一对应;

具体的,在知识图谱模型的构建过程中,需要根据各发电厂历史运行数据之间的关联关系,确定各发电厂历史运行数据对应的实体的数据特征所对应的子节点排布位置,以确定知识图谱模型的各子节点数据结构。并按照各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系将各发电厂历史运行数据连接到相应的子节点上,形成一个完整的知识图谱。

基于待预测数据和发电厂历史运行数据,进行预测规则配置,并将预测规则嵌入至知识图谱模型中的对应父节点;

其中,上述预测规则包括机器学习算法和数学模型;上述基于待预测数据和发电厂历史运行数据,进行预测规则配置,包括:确定待预测数据与发电厂历史运行数据之间的逻辑关系;基于待预测数据与发电厂历史运行数据之间的逻辑关系,匹配对应父节点的机器学习算法和/或数学模型。

具体的,根据预测需求(即待预测数据)和发电厂历史运行数据,分析发电厂历史运行数据与预测需求之间的计算逻辑,选择相应的数学模型、机器学习算法或其他计算方法,并将选择的机器学习算法、数学模型等预测规则配置到父节点中。

基于预测规则,建立各子节点与对应父节点的连接。

具体的,根据预测规则反映的计算逻辑关系,确定各父节点需要连接的子节点,从而将各子节点与对应父节点进行连接,完成对知识图谱模型的各数据节点的配置。

S130:实时获取发电厂运行数据,将各发电厂运行数据基于对应的数据特征输入至知识图谱模型中的对应数据节点,以进行数据预测,得到数据预测结果。

具体的,将各发电厂运行数据基于对应的数据特征输入至知识图谱模型中的对应数据节点,知识图谱模型将以发电厂历史运行数据为准,按照配置的数据节点之间的关联关系以及父节点中配置的机器学习算法、数学模型等预测规则对各发电厂运行数据进行综合分析,以得到目标预测数据(即待预测数据)的数据预测结果,从而实现了精准实时预测的目的。

上述实现过程中,该方法对预处理后的发电厂历史运行数据进行分析,以确定各发电厂历史运行数据之间的关联关系。根据各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置。利用配置好的知识图谱模型对实时获取的发电厂运行数据进行数据预测,以得到目标预测数据的数据预测结果。该方法实现了基于知识图谱的数据预测,通过发电厂历史运行数据构建知识图谱模型的数据节点,并利用配置好的知识图谱模型基于实时获取的发电厂运行数据进行数据预测。从而实现了对发电厂的运行数据进行实时、准确预测的目的,帮助用户快速预测目标数据,为用户提供了决策支持。

在本实施例的一些实施方式中,上述数据节点包括中心节点,用于展示数据预测结果;数据预测结果的展示方式至少包括图表、表格和/或文字。

具体的,设计中心节点的数据结构,通过中心节点以图表、表格或其他可视化形式将数据预测结果展示给用户,从而方便用户交互和查询。

在本实施例的一些实施方式中,在基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置之后,该方法还包括:将预处理后的发电厂历史运行数据作为输入,对配置完成的知识图谱模型进行测试;基于测试结果,对知识图谱模型进行优化调试。

具体的,利用预处理后的发电厂历史运行数据对配置完成的知识图谱模型进行测试和优化,以确保配置完成的知识图谱模型的准确性、稳定性和性能。

图3是本发明一种实施方式提供的一种数据预测系统的框图。如图3所示,本发明实施方式提供一种数据预测系统,包括:

关联关系确定模块,用于根据预处理后的发电厂历史运行数据,确定各发电厂历史运行数据之间的关联关系;

数据节点配置模块,用于基于各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置;

数据预测模块,用于实时获取发电厂运行数据,将各发电厂运行数据基于对应的数据特征输入至知识图谱模型中的对应数据节点,以进行数据预测,得到数据预测结果。

具体的,该系统对预处理后的发电厂历史运行数据进行分析,以确定各发电厂历史运行数据之间的关联关系。根据各发电厂历史运行数据的数据特征和各发电厂历史运行数据之间的关联关系,对知识图谱模型的各数据节点进行配置。利用配置好的知识图谱模型对实时获取的发电厂运行数据进行数据预测,以得到目标预测数据的数据预测结果。该系统实现了基于知识图谱的数据预测,通过发电厂历史运行数据构建知识图谱模型的数据节点,并利用配置好的知识图谱模型基于实时获取的发电厂运行数据进行数据预测。从而实现了对发电厂的运行数据进行实时、准确预测的目的,帮助用户快速预测目标数据,为用户提供了决策支持。

本发明实施方式还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器100执行时使得处理器100被配置成执行上述的数据预测方法。

机器可读存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

本发明实施方式还提供一种电子设备10,电子设备10包括存储器101、处理器100以及存储在存储器101中并可在处理器100上运行的计算机程序102,处理器100执行计算机程序102时实现上述的数据预测方法。

如图4所示是本发明一实施例提供的电子设备的示意图。如图4所示,该实施例的电子设备10包括:处理器100、存储器101以及存储在存储器101中并可在处理器100上运行的计算机程序102。处理器100执行计算机程序102时实现上述方法实施例中的步骤。或者,处理器100执行计算机程序102时实现上述装置实施例中各模块/单元的功能。

示例性的,计算机程序102可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器101中,并由处理器100执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序102在电子设备10中的执行过程。例如,计算机程序102可以被分割成关联关系确定模块、数据节点配置模块及数据预测模块。

电子设备10可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。电子设备10可包括,但不仅限于,处理器100、存储器101。本领域技术人员可以理解,图4仅仅是电子设备10的示例,并不构成对电子设备10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备还可以包括输入输出设备、网络接入设备、总线等。

处理器100可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器101可以是电子设备10的内部存储单元,例如电子设备10的硬盘或内存。存储器101也可以是电子设备10的外部存储设备,例如电子设备10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器101还可以既包括电子设备10的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及电子设备10所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序102产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序102产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序102产品的流程图和/或方框图来描述的。应理解可由计算机程序102指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序102指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器100以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器100执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序102指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器101中,使得存储在该计算机可读存储器101中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序102指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

相关技术
  • 车辆故障分析数据库及构建方法、故障预测方法、故障预测系统
  • 一种基于神经网络的经营数据预测方法、可读存储介质和预测系统
  • 区域对象信息预测方法和系统、楼盘价格预测方法和系统
  • 预测对象的轨迹数据的方法和系统及训练机器学习方法来预测对象的轨迹数据的方法和系统
  • 预测管理系统、预测管理方法、数据结构、预测管理装置及预测执行装置
技术分类

06120116626413