掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及电网调度操作管理技术领域,尤其涉及一种命令票系统校核方法、设备及存储介质。

背景技术

电网规模迅速扩大之后,先进的继电保护及安全控制装置大量投入运行,电网调度操作管理工作益繁杂,调度操作安全问题日益凸现,电网调度操作票的正确与否直接关系到电网的运行安全。调度操作自动化过程中,需要对调度命令票执行前进行“双校核”以确保调度指令票的合规性和安全性。

目前调度指令由人工在调度操作票系统编制时需查阅调度配网OMS系统中的设备检修工作申请票,并依据智能电网调度控制系统所提供的电网运行实时状态确定操作任务,再根据调度术语、设备编号、电网操作规则等信息编制具有严格逻辑关系且正确、规范的调度指令,由于调度员的专业素养、技术水平和疲劳程度,均可影响调度指令的正确性和规范性,进而威胁电网和现场作业人员人身安全。

发明内容

本发明目的在于,提供一种命令票系统校核方法、设备及存储介质,采用命令票文本解析技术,获取命令票文本内容的结构化数据,实现对命令票中描述设备、动作、事项的结构化翻译与描述,提高命令票校核的精准性。

为实现上述目的,本发明实施例提供一种命令票系统校核方法,包括:

采用命令票文本解析获取命令票文本内容,所述命令票文本解析包括,首先构建调度专业命令票细分领域的专业基础文本词库,然后采用专业分词技术训练所述专业基础文本词库形成可识别的命令票专业短语,最后进行词性分析与标注研究;

根据所述命令票文本内容进行分类和提取,获取命令票结构化数据;

根据所述结构化数据分别与预设的自动化主站系统和配网OMS系统信息的结构化数据进行比对校核,获取比对校核结果。

优选地,所述采用命令票文本解析获取命令票文本内容,所述命令票文本解析包括,首先构建调度专业命令票细分领域的专业基础文本词库,然后采用专业分词技术训练所述专业基础文本词库形成可识别的命令票专业短语,最后进行词性分析与标注研究,包括:

根据通用词库以及调度命令票历史记录,采用人工标注和自动切词算法实现词库的扩展,构建调度专业命令票细分领域的专业基础文本词库。

优选地,所述采用命令票文本解析获取命令票文本内容,所述命令票文本解析包括,首先构建调度专业命令票细分领域的专业基础文本词库,然后采用专业分词技术训练所述专业基础文本词库形成可识别的命令票专业短语,最后进行词性分析与标注研究,还包括:

根据融合词典分词、统计分词以及深度学习分词方法构建命令票文本的自动分词复合模型,将命令票文本内容输入所述自动分词复合模型进行训练,获取专业词、短语和长短句的识别和拆分结果。

优选地,所述采用命令票文本解析获取命令票文本内容,所述命令票文本解析包括,首先构建调度专业命令票细分领域的专业基础文本词库,然后采用专业分词技术训练所述专业基础文本词库形成可识别的命令票专业短语,最后进行词性分析与标注研究,还包括:

采用无监督学习与深度学习算法,根据所述识别和拆分结果构建词性标注融合模型,获取命令票文本内容。

优选地,所述根据所述命令票文本内容进行分类和提取,获取命令票结构化数据,包括:

根据所述命令票文本内容提取文本特征,根据所述文本特征构建分类模型,所述分类模型根据预设的命令票文本内容自动分配类别标签,获取命令票分类文本内容。

优选地,所述根据所述命令票文本内容进行分类和提取,获取命令票结构化数据,包括:

根据所述命令票分类文本内容构建文本信息智能抽取模型,采用所述文本信息智能抽取模型对所述命令票分类文本内容进行关键信息抽取,获取文本信息,其中,所述关键信息包括命令票中的设备编码、操作类型和设备状态。

优选地,所述根据所述命令票文本内容进行分类和提取,获取命令票结构化数据,包括:

所述文本信息智能抽取模型采用信息归并、冗余消除和冲突消解对所述文本信息进行规范化处理,获取命令票结构化数据。

优选地,所述根据所述命令票文本内容进行分类和提取,获取命令票结构化数据,包括:

根据文本信息进行局部的信息抽取,选取最大熵模型作为分类器,获取条件概率模型如下:

其中,x

本发明还提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的命令票系统校核方法。

本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一实施例所述的命令票系统校核方法。

本发明采用命令票文本解析的技术方案,提升文件解析模型的准确性与有效性,并将获取的命令票文本内容进行分类和抽取,实现命令票中设备状态信息与自动化主站系统和配网OMS系统中设备状态结构化数据的自动校核研判,提高命令票校核的精准性。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明某一实施例提供的命令票系统校核方法的流程示意图;

图2是本发明另一实施例提供的分词方法的流程示意图;

图3是本发明又一实施例提供的语义获取的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。

应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

请参阅图1,本发明实施例提供一种命令票系统校核方法,包括:

S101、采用命令票文本解析获取命令票文本内容,所述命令票文本解析包括,首先构建调度专业命令票细分领域的专业基础文本词库,然后采用专业分词技术训练所述专业基础文本词库形成可识别的命令票专业短语,最后进行词性分析与标注研究。

具体的,在命令票由主站WEB端自动传递到配网OMS系统时,命令票的操作构成与传递内容,是一个非结构化的文本数据,而命令票的“双校核”,无论是跟调度自动化主站设备运行状态的校核,还是跟配网OMS系统中的对应设备历史运行数据的校核,都需要基于设备对象的结构化数据开展比对确认。因此,命令票文本解析技术的应用,成为调度命令票执行自动化的关键技术。文本解析指文本内容的精准识别与解析,其目的是通过文本解析,实现对命令票中描述设备、动作、事项的结构化翻译与描述,以下是具体实施步骤:

步骤一,构建调度专业命令票细分领域的专业基础文本词库。

具体的,根据通用词库以及调度命令票历史记录,采用人工标注和自动切词算法实现词库的扩展,构建调度专业命令票细分领域的专业基础文本词库。

步骤二,采用专业分词技术训练所述专业基础文本词库形成可识别的命令票专业短语。

请参阅图2,具体的,根据融合词典分词、统计分词以及深度学习分词方法构建命令票文本的自动分词复合模型,将命令票文本内容输入自动分词复合模型进行训练,获取专业词、短语和长短句的识别和拆分结果。

具体操作过程如下:

人工操作命令进行标记,标记集合为:{B,E,M,S},其中,B为一个词的开始,E为一个词的结束,M为一个词的中间,S为单字成词,为方便理解,举例说明:你S现B在E应B该E去S幼B儿M园E了S。

采用以上四类标签为命令票内容做好标记后,就可以开始用统计的方法构建一个HMM,隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来做进一步的分析,例如模式识别。本实施例构建一个2-gram(bigram)语言模型,也即一个1阶HMM,每个字符的标签分类只受前一个字符分类的影响,求解HMM的状态转移矩阵A以及混合矩阵B,其中:

A

B

式中,C={B,E,M,S},O={字符集合},Count代表频率。其中,在计算B

B

设定初始向量P

请参阅图2,中文分词包括基于词典的方法、基于统计的方法以及基于尝试学习的方法,其中,基于词典的方法包括基于匹配判断的方法、最大匹配法以及全切分路径选择,基于统计的方法包括基于序列标注的方法、BMS表示法(达观数据位是企业大数据服务商)以及HMM、CRF模型,基于尝试学习的方法包括词向量预训练和CRF+BiLSTM网络。将HMM模型提取好的句子特征作为双向的输入,将正向LSTM的隐层输出h

式中,S

步骤三,进行词性分析与标注研究。

具体的,采用无监督学习与深度学习算法,根据所述识别和拆分结果构建词性标注融合模型,获取命令票文本内容,实现命令票文本的精准标注,为后面步骤中更高层次的文本处理与分析提供数据资料。

以上本发明采用的文本解析技术,是一种结合深度学习算法的高级分词模型,通过以词向量作为初始输入,在准确刻画词语之间的相似度信息的同时,可进一步提升词性标注结果。传统词性标注方法的特征抽取过程主要是将固定上下文窗口的词进行人工组合,而深度学习方法能够自动利用非线性激活函数完成这一目标。本研究预结合循环神经网络,如双向LSTM,则抽取到的信息不再受到固定窗口的约束,而是可以考虑到整个句子,在本发明技术研究过程中,将采用先进分词技术与调度命令票海量数据相结构,逐步实证与词汇标注的方式,螺旋式提升文件解析模型的准确性与有效性。

S102、根据所述命令票文本内容进行分类和提取,获取命令票结构化数据。

请参阅图3,具体的,基于步骤S101获取的结果,运用机器学习与深度学习等算法构建命令票多系统校核研判模型,对命令票结构化内容进行分类与信息提取,实现命令票中设备状态信息与自动化主站系统和配网OMS系统中设备状态结构化数据的自动校核研判。

首先,根据命令票文本内容提取文本特征,并进行特征的转换与降维,根据文本特征构建分类模型,分类模型根据预设的命令票文本内容自动分配类别标签,获取命令票分类文本内容。

其次,语义获取分为三个部分,分别为命名实体识别包括实体边界识别和实体分类,关系抽取包括关系检测和关系分类,事件抽取包括事件类型识别和事件元素填充,这三个部分根据规则编制以及机器学习进行语义获取。根据命令票分类文本内容构建文本信息智能抽取模型,采用文本信息智能抽取模型对命令票分类文本内容进行关键信息抽取,获取文本信息,其中,关键信息包括命令票中的设备编码、操作类型和设备状态,文本信息智能抽取模型采用信息归并、冗余消除和冲突消解对所述文本信息进行规范化处理,获取命令票结构化数据。

其中,构建文本信息智能抽取模型包括:

文本信息抽取包括学习阶段和抽取阶段,在学习阶段,有一些带有标注的数据集,并且样本中包含文字单元和标注单元,如下所示:

式中,x部分为文字单元,y部分为标注单元,由于仅需对文本信息{B,E,M}部分进行局部的信息抽取,假设不同的标注之间具有一阶马尔可夫性,根据文本信息进行局部的信息抽取,选取最大熵模型作为分类器,获取条件概率模型如下:

其中,x

S103、根据所述结构化数据分别与预设的自动化主站系统和配网OMS系统信息的结构化数据进行比对校核,获取比对校核结果。

具体的,根据命令票内容分类与提取的结构化数据与自动化主站系统和配网OMS系统信息进行比对校核实证并且对错误信息进行修正。

本发明为解决调度操作自动化过程中,对调度命令票执行前的“双校核”,提供技术支撑,所谓的命令票“双校核”,第一校核是指命令票中描述的设备操作与调度自动化主站中的设备当前运行信息是否相匹配进行校核,同时,要跟配网OMS系统记录的历史命令票中记录的设备操作信息进行系统级校核。目前两个系统级校核主要通过人工识别命令票内容,并通过人工登录两个应用系统进行手工比对确认,效率低下且工作质量不高。本发明通过文本挖掘技术的应用,可实现对非结构化数据的快速分析挖掘,并与关键系统的结构化数据进行智能比对,实现调度操作过程由人工方式向机器自动执行的转变。能够适应电网中各类接线方式、运行方式下的各种操作要求,做到快速、正确校验,从而大大提高调度员工作效率,降低劳动强度;解决了调度指令编制完全依赖人工的问题,并通过调度指令安全校核技术全面提升电网安全管控水平,并且能够自动校核操作票的操作序列,极大的减少了人工操作的工作量,提高了运行人员的工作效率和电网运行的智能化水平,极大的提升了电网的安全运行水平。

本发明提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任意一个实施例中的命令票系统校核方法。

处理器用于控制该计算机终端设备的整体操作,以完成上述的命令票系统校核方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。

在一示例性实施例中,计算机终端设备可以被一个或多个应用专用集成电路(Application Specific 1ntegrated Circuit,简称AS1C)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的命令票系统校核方法,并达到如上述方法一致的技术效果。

在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任意一个实施例中的命令票系统校核方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成上述的命令票系统校核方法,并达到如上述方法一致的技术效果。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

相关技术
  • 一种命令票系统校核方法、设备及存储介质
  • 一种防止自动抢票方法及系统、设备和存储介质
技术分类

06120112965768