掌桥专利:专业的专利平台
掌桥专利
首页

一种基于模块化分解与匹配的发电机组参数名称匹配方法

文献发布时间:2023-06-19 12:07:15



技术领域

本发明属于电力领域,具体涉及一种基于模块化分解与匹配的发电机组参数名称匹配方法。

背景技术

电力行业是国民经济的基础能源产业,随着社会经济发展,各行业对电力的需求明显增强,对供电可靠性及电能质量的要求日益提高。近年来,随着我国电力行业的目标转为实现清洁能源的生产、开发、输送、消费,必须依靠智能化手段建设智能电网与智能电厂,不断提高其灵活性、安全性及防御能力。而智能化和信息化相辅相成,信息化是智能化的基础,也是智能化的结果。

时下,云计算、大数据、人工智能等创新技术正在掀起新的热潮,推动行业加速数字化转型。包括石油及天然气、火电、风电、水电以及核电在内的能源行业也不例外。能源行业的数字化转型面临的主要问题是保障企业信息化管理、生产,实现提质增效。数字化变革过程中,最重要的就是数字资产。如何处理好激增的数据量,是任何企业难以回避的问题。

而目前,发电侧企业的信息化也做了相当多的工作,如生产环节越来越自动化、智能化,各种控制系统的功能越来越强大,不但简化了工作人员的工作,还提高了发电效率;电厂各种类似SIS系统的信息化管理系统也提高了发电企业信息化管理程度。

但发电企业的各项信息化措施仅仅是在单个发电厂内部进行信息化的应用,如测试机组性能、各项报表之类,但是无法进行多家电厂之间各项信息的对比来发现设备、机组、管理、运行方面的问题,进而提升各项潜力,从而充分利用“信息”、“数据”的价值。仅仅是把信息抽象转化为电子的“数据”,而不挖掘“信息”、“数据”的价值,这就仅仅是信息化的低级阶段。阻碍信息化进一步“深化”的主要原因是电力发电侧因为各种原因,无法形成一套统一的信息化标准,统一的信息化标准首先就要求要建立一个统一的机组、设备、系统及参数的命名规则,从而将所有电厂信息放在一个统一的纬度进行横向、纵向对比,从而挖掘利用信息、数据的潜在价值,实现信息化的终极目标。

对于电力企业来说,价值最重要、数量最多的就是机组相关的信息。其中机组的运行数据信息可以直接反应出机组的性能,但是比较机组在不同运行状态下的性能好坏,以及同类型机组之间如何评价性能的高低就需要将机组运行状态下的各个参数试验值(测试值)进行综合的对比。但从大量的文档资料(包括报告、表格等待)中获得各种数据的值,并将其纳入到用一个框架下进行一一比较是一个耗费大量人工的工作。因此需要一种方法来自动识别参数、提取数据,并将数据整理为统一或标准的表格,方便读取与调用。

发明内容

本发明的目的在于提供一种基于模块化分解与匹配的发电机组参数名称匹配方法,解决了现有技术中存在的上述不足。

为了达到上述目的,本发明采用的技术方案是:

本发明提供的一种基于模块化分解与匹配的发电机组参数名称匹配方法,包括以下步骤:

步骤1,根据发电机组类型,制定统一标准参数名称表,该标准参数名称表包括发电机组常用的重要参数名称,且每个标准参数名称对应设置有一个标准计量单位;

步骤2,对统一标准参数名称表中的每个标准参数名称进行分解,得到每个标准参数名称对应的多个词元;

步骤3,根据属性建立多个词元模块,将步骤2中得到的每个标准参数名称对应的多个词元归类至对应的词元模块,得到多个归类有词元的词元模块;

步骤4,将得到的多个归类有词元的词元模块作为统一标准参数名称表匹配规则库;

步骤5,对步骤4中得到的统一标准参数名称表匹配规则库进行训练,得到训练好的统一标准参数名称表匹配规则库;

步骤6,利用训练好的统一标准参数名称表匹配规则库对现有的电厂试验数据进行处理,得到电厂试验标准数据表格。

优选地,步骤2中,对统一标准参数名称表中的每个标准参数名称进行分解,得到每个标准参数名称对应的多个词元,具体方法是:

利用词性对统一标准参数名称表中的每个标准参数名称进行分解,得到每个标准参数名称对应的多个词元。

优选地,步骤3中,所述属性包括设备、工质、物理量、位置、描述和特殊非属性。

优选地,步骤3中,多个词元模块分别为设备词元模块、工质词元模块、物理量词元模块、位置词元模块、描述词元模块和特殊非属性词元模块。

优选地,步骤4中,归类有词元的词元模块中还归类有匹配规则词元,所述匹配规则词元为根据行业术语获取与词元模块中词元含义相同或相近的词元。

优选地,步骤5中,对步骤4中得到的统一标准参数名称表匹配规则库进行训练,具体方法是:

利用获取得到的各个电厂命名的原始参数名称,结合人工标识错误匹配和相近语义词元,对步骤4中得到的统一标准参数名称表匹配规则库进行训练、更新,得到训练好的统一标准参数名称表匹配规则库。

优选地,步骤6中,利用训练好的统一标准参数名称表匹配规则库对现有的电厂试验数据进行处理,得到电厂试验标准数据表格,具体方法是:

将每个电厂试验的各个参数名称与统一标准参数名称表匹配规则库中标准参数名称进行匹配;

完成后,将试验数据中的每个参数计量单位与对应的标准计量单位进行对比,若试验数据中的参数计量单位等于标准计量单位一致,则将该参数的数据值与对应的标准参数名称进行关联;若试验数据中的参数计量单位与标准参数名称的标准计量单位不一致时,则将该参数的数据值进行换算,将换算后的参数值与对应的标准参数名称进行关联;最终输出得到电厂试验标准数据表格。

优选地,将每个电厂试验的各个参数名称与统一标准参数名称表匹配规则库中标准参数名称进行匹配,具体方法是:

将每个参数名称进行词元分解,得到多个词元;

将得到的每个词元遍历所有词元模块中的所有词元进行匹配。

一种基于模块化分解与匹配的发电机组参数名称匹配系统,该系统能够运行所述的一种基于模块化分解与匹配的发电机组参数名称匹配方法,包括表格制定单元、数据分解单元、词元模块建立单元、规则库单元、数据训练单元和据表格制定单元,其中:

表格制定单元用于根据发电机组类型,制定统一标准参数名称表,该标准参数名称表包括发电机组常用的重要参数名称,且每个标准参数名称对应设置有一个标准计量单位;

数据分解单元用于对统一标准参数名称表中的每个标准参数名称进行分解,得到每个标准参数名称对应的多个词元;

词元模块建立单元用于根据属性建立多个词元模块,将得到的每个标准参数名称对应的多个词元归类至对应的词元模块,得到多个归类有词元的词元模块;

规则库单元用于将得到的多个归类有词元的词元模块作为统一标准参数名称表匹配规则库;

数据训练单元用于对中得到的统一标准参数名称表匹配规则库进行训练,得到训练好的统一标准参数名称表匹配规则库;

数据表格制定单元利用训练好的统一标准参数名称表匹配规则库对现有的电厂试验数据进行处理,得到电厂试验标准数据表格。

与现有技术相比,本发明的有益效果是:

本发明充分考虑发电行业试验参数名称命名的专业性、特殊性和使用习惯性特点,将所有的同一个参数名称进行统一规范命名(即标准参数名称),然后将标准参数名称通过模块化方式进行分解,形成匹配规则库。同时将试验(或测试)数据进行细致分类,然后通过匹配规则算法对每个测试数据进行匹配提取,最终生产各类标准数据表格,便于后期对数据价值的挖掘。其具有如下优点:

第一:通过参数名称的统一规范命名及参数单位统一标准化,可以将同类系统发电机组的所有参数纳入到一个统一的信息规范中来,便于进一步的信息、数据参照及对比;

第二:模块化分解及匹配方式具有非常高的扩展性和通用性,可以根据需要随时进行匹配规则的更新、修改与扩展,并且该方式还可以利用在其它行业或其它使用场景中;

第三:人为进行模块化分解标准参数名称,可以充分考虑到参数名称在电力生产中所代表的含义及其他信息,保证匹配词元的准确性和必要性,进而保证的参数名称匹配的正确性;

第四:通过对试验(测试)数据进行细致分类,可以建立一种数据对比机制和方式,从而实发电机组间横向、纵向来对比和评价,进而挖掘一些潜在的规律和特性。

进一步的,利用模块化分解和匹配方法,建立统一规范标准参数名称表的匹配规则库,通过人工标注错误匹配和算法“自我”学习相近语义“词元”,增加、修改匹配“词元”,进而定期更新匹配规则库,提高参数匹配正确性。

进一步的,详细分类机组试验数据,细化到电厂、机组、试验类型、试验编号及试验工况层次,制定各类试验工况标准数据表格,便于数据的整理与分类。

进一步的,通过匹配规则库,提取数据,然后根据单位转换规则,将试验(测试)数据转换为标准单位下标准数据,并填写到试验工况标准数据表格对应项内。

进一步的,识别、匹配和提取各种发电机组试验(测试)数据,生产规范的试验工况标准数据表格文件,为发电机组实现横向、纵向的性能对比提供数据支撑,从而挖掘潜在规律和特性,实现数据的真正“价值”。

附图说明

图1为分解标准参数名称和生产匹配规则库方法图。

图2为数据类型分类与试验类型标准数据表格。

图3为数据参数名匹配流程图。

图4为数据提取流程图。

具体实施方式

本发明所述的一种基于模块化分解与匹配的发电机组参数名称匹配方法,如下图所示,包括创建参数名称匹配规则库,标注数据信息和试验标准数据表格、参数名称匹配训练及规则库完善、数据提取,各部分具体如下。

如图1至图4所示,本发明提供的一种基于模块化分解与匹配的发电机组参数名称匹配方法,包括以下步骤:

步骤1,根据不同的发电机组类型,分别制定统一标准参数名称表,该统一标准参数名称表将作为统一信息平台参数表单;同时,该同类型发电机组的相关参数信息一一映射至该个统一标准参数名称表中,并为每个标准参数名称的数据值对应设置有一个标准计量单位;

步骤2,按照汉语词语文法语序特点以及词语的词性对统一标准参数名称表中的每个标准参数名称进行分解,得到每个标准参数名称对应的多个词元,“词元”就是匹配过程中的最基本的词语,可以是一个字,也可以是一个多字的词语,比如“功率”、“压力”、“前”、“入”等;

按照属性建立得到多个词元模块;多个词元模块分别为设备词元模块、工质词元模块、物理量词元模块、位置词元模块、描述词元模块和特殊非属性词元模块。

将每个标准参数名称对应的多个词元归类至对应的词元模块中。

步骤3,根据行业术语获取与词元模块中词元含义相同或相近的词元,并作为该词元模块的匹配规则词元;

步骤4,将步骤3中得到的词元模块的匹配规则词元,以及步骤2中得到的多个词元模块进行组合,构成得到该统一标准参数名称的匹配规则,形成该统一标准参数名称的匹配规则库;

匹配规则具体是:

需要匹配的词语与词元匹配成功是指需要匹配的词语包含词元,否则为匹配失败;需要匹配的词语与某一个统一标准参数名称匹配是指需要匹配的词语与该统一标准参数名称在电力行业中是同一个含义------即同一个事物的不同描述,否则为不匹配;

将待匹配的词语遍历所有词元模块中的所有词元进行匹配。

步骤5,利用各个电厂命名的原始参数名称对步骤4中得到的统一标准参数名称表匹配规则库进行训练,通过人工标识错误匹配和相近语义“词元”更新,不断更新、修正匹配规则库,从而提高参数名称匹配的正确性,得到训练好的统一标准参数名称表匹配规则库;

步骤6,利用训练好的统一标准参数名称表匹配规则库对现有的电厂试验数据进行处理,得到电厂试验标准数据表格,具体地:

将每个电厂试验的试验数据中的各个参数名称与统一标准参数名称表匹配规则库中标准参数名称进行匹配,

之后将试验数据中的每个参数计量单位与对应的标准计量单位进行对比,若试验数据中的参数计量单位等于标准计量单位一致,则将该参数的数据值与对应的标准参数名称进行关联;若试验数据中的参数计量单位与标准参数名称的标准计量单位不一致时,则将该参数的数据值进行换算,将换算后的参数值与对应的标准参数名称进行关联;最终输出得到电厂试验标准数据表格。

实施例

本算法实例使用VC语言,在VS2010编译环境下进行开发。

本发明提供的一种基于模块化分解与匹配的发电机组参数名称匹配方法,包括以下步骤:

步骤1,创建参数名称匹配规则库。

首先制定统一的标准参数名称,该标准参数名称,将能够被所有专业人员所识别,并在此基础上制定出所有发电机组常用的所有重要参数的标准参数名称,形成标准参数名称库。

针对标准参数名称库中的每个标准参数名称选择确定一个标准计量单位,作为该标准参数名称试验数据值的计量单位。

利用模块化方法,即按照设备、工质、物理量、位置、描述和特殊非属性分类模块分解标准参数名称,根据分解的“词元”,选出必要“词元”,利用必要“词元”的组合作为标准参数名称的匹配规则。

最终,利用标准参数名称库中所有标准参数名称的匹配规则组成标准参数名称匹配规则库。

步骤2,标准数据信息和创建试验标准数据表格

分析数据来源,通过试验数据的电厂、机组、试验编号、试验类型和试验工况等信息分类标注数据,并根据试验类型,制定标准数据表格。标准数据表格是针对某类试验类型的专用数据表格,其中包含试验电厂、试验机组、试验编号和试验工况等基础信息项,另外还包括该类试验的重要参数项。参数项是根据试验类型的特点和试验关注的对象,从标准参数名称库中选择各种标准参数名称组成。这些标准参数项可以很好地反映试验所需要的信息。每种类型机组的每种试验都只要一个统一的标准数据表格,这样就能实现同一机组或不同机组间横向、纵向性能对比。

步骤3,参数名称匹配训练及规则库完善

在已有标准参数名称库和标准参数名称匹配规则库的基础上,选取数据中的各个参数名称(也成为原始参数名称)依据匹配规则库进行匹配。一旦匹配成功,就代表原始参数名称与某一个匹配的标准参数名称为同一参数;否则人工进行识别标准。人工识别标注的方法是,先人工判断未能匹配的原始参数名称所代表的参数是否属于标准参数名称库所代表的范畴,如果不属于,则工作结束;如果属于,找到与原始参数名称代表同一参数的标准参数名称,利用模块化方法分解原始参数名称,加入到该标准参数名称对应词元模块中,作为相近“词元”,并更新匹配规则。同时,通过相近“词元”更新所有具有相同词元的匹配规则,最终更新完善整个匹配规则库。

步骤4,数据提取

加载需要提取的数据(包括表格、报告等文档),顺序选择数据,并识别数据的相关信息,确定该数据需要填入那种标准数据表格中,然后找出数据的参数名称(即数据原始名称),利用匹配规则库去匹配标准数据表格中的参数项,匹配成功的标准参数名称就是要将试验数据要填写的参数项,然后比较原始参数名称的数据单位和标准参数名称的标准单位,如果单位相同,就将数据直接填写在标准参数名称的数值项内;如果单位不同,根据单位换算方法将原始数据转换后填写在标准参数名称的数值项内。如果匹配不成功,则选择下一个数据重复以上过程,最终实现所有数据的提取。

本发明所述的方法,可以简单、方便地在统一标准参数名称库的基础上,利用模块分解方式,创建匹配规则库,实现参数名称与标准参数名称的匹配。该方法通过模块化方式将标准参数名称为各个“词元”,通过选择出的必要“词元”组成标准参数名称的匹配规则,将所有的匹配规则构建为匹配规则库。通过以上方法实现参数名称的匹配,并依据匹配规则的训练和完善,提高匹配的正确性;

本发明所述的方法,可以标识分类数据,从而根据试验类型制定标准数据表格,并通过匹配规则库匹配提取数据,最终将数据填写入标准数据表格,为下一步的数据分析提供便利的数据。

本发明已经应用于发电机组数据信息提取系统中,系统使用了本发明中的参数名称匹配方法和数据提取方法,可以从大量的数据表格中根据数据分类提取数据,并以标准数据表格文件方式输出,为数据信息平台的数据搜集工作提供的巨大的便利。

相关技术
  • 一种基于模块化分解与匹配的发电机组参数名称匹配方法
  • 一种基于模糊匹配的新闻主体名称提取方法
技术分类

06120113176300