掌桥专利:专业的专利平台
掌桥专利
首页

基于混合文本分类模型的电网作业告警方法及装置

文献发布时间:2023-06-19 10:05:17


基于混合文本分类模型的电网作业告警方法及装置

技术领域

本发明属于文本分类领域,尤其涉及一种基于混合文本分类模型的电网作业告警方法及装置。

背景技术

在电网运行过程中,运维人员在对电网进行作业时会产生大量的数据信息,这些数据信息主要分为结构化数据和非结构化数据两类,结构化数据为电压等级、是否停电等与时序相关的数据,能够直接转换为数字信息进行风险评估,非结构化为工作日志等包含作业内容的文本信息,需要对文本信息进行语义分析后才能进行风险评估。

通常电网公司采用卷积神经网络(Convolutional Neural Networks,CNN)模型进行语义分析,由于自然语言包含很多语法和语义,会导致前后文本间可能存在复杂的上下文关联,然而常规的CNN模型存在保留历史文本信息不足的问题,容易发生缺少上下文关联信息而导致语义分析准确度不高的问题。

发明内容

为了解决现有技术中存在的缺点和不足,本发明提出了一种基于混合文本分类模型的电网作业告警方法,包括:

基于电网作业过程中产生的文本信息,获取文本信息的原始特征矩阵;

将原始特征矩阵同时输入到预先训练的CNN模型和LSTM模型中,基于CNN模型和LSTM模型的输出结果得到文本信息属于各个风险类别的概率值,在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的;

基于概率值和风险类别的预设权重计算电网作业的风险值,若风险值高于预设风险阈值,则发出电网作业告警。

可选的,所述基于电网作业过程中产生的文本信息,获取文本信息的原始特征矩阵,包括:

获取电网作业过程中产生的文本信息,提出文本信息中的关键词,通过词嵌入技术将关键词转换为词向量,由词向量组成原始特征矩阵。

可选的,所述将原始特征矩阵同时输入到预先训练的CNN模型和LSTM模型中,基于CNN模型和LSTM模型的输出结果得到文本信息属于各个风险类别的概率值,包括:

将原始特征矩阵X

通过CNN模型的卷积层中对W

通过CNN模型的池化层降低W

获取LSTM模型的输出矩阵H,基于merge函数对H和W

根据W

具体的,所述在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的,包括:

将原始特征矩阵X

其中,若X

若X

具体的,所述基于预设的padding参数将O

将卷积层中第t-1层的padding参数设置为SAME模式;

基于公式一调整O

λ

具体的,所述根据W

基于公式二计算原始特征矩阵对应的文本信息x属于风险类别j的概率值P(j||x

其中,风险类别j为人为设定的类别编号,x

可选的,所述CNN模型的卷积层的激活函数为RELU函数。

可选的,所述基于概率值和风险类别的预设权重计算电网作业的风险值,若风险值高于预设风险阈值,则发出电网作业告警,包括:

获取风险类别j的预设权重μ

将所有风险类别的乘积结果相加,得到电网作业的风险值;

将风险值与预设风险阈值进行比较,当风险值高于预设风险阈值时,获取最高的概率值对应的风险类别,发出提示该风险类别的告警信号。

本发明还基于同样的思路提出了一种基于混合文本分类模型的电网作业告警装置,包括:

原始特征单元:用于基于电网作业过程中产生的文本信息,获取文本信息的原始特征矩阵;

文本分类单元:用于将原始特征矩阵同时输入到预先训练的CNN模型和LSTM模型中,基于CNN模型和LSTM模型的输出结果得到文本信息属于各个风险类别的概率值,在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的;

风险告警单元:用于基于概率值和风险类别的预设权重计算电网作业的风险值,若风险值高于预设风险阈值,则发出电网作业告警。

可选的,所述文本分类单元具体用于:

将原始特征矩阵X

通过CNN模型的卷积层中对W

通过CNN模型的池化层降低W

获取LSTM模型的输出矩阵H,基于merge函数对H和W

根据W

本发明提供的技术方案带来的有益效果是:

由CNN模型和LSTM模型组成的混合文本分类模型,通过LSTM模型弥补CNN模型在保留上下文关联语义能力上的不足。同时,对CNN模型的卷积层进行了改进,每一层的输入矩阵是根据原始特征矩阵与上一层的输出结果得到的,实现了在每一层的输入都重新引入了原始特征矩阵中所包含的特征数据,减少了CNN模型的层与层之间特征传递时的特征丢失问题,有效保留了文本信息中的上下文关联语义,提高了文本分类的准确率,进而实现精准及时的发出电网作业告警,降低了电网作业的风险。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提出的基于混合文本分类模型的电网作业告警方法的流程示意图;

图2为混合文本分类模型的结构框图;

图3为本发明提出的基于混合文本分类模型的电网作业告警装置的结构框图。

具体实施方式

为使本发明的结构和优点更加清楚,下面将结合附图对本发明的结构作进一步地描述。

实施例一

如图1所示,本发明提出了一种基于混合文本分类模型的电网作业告警方法,包括:

S1:基于电网作业过程中产生的文本信息,获取文本信息的原始特征矩阵。

获取电网作业过程中产生的文本信息,提出文本信息中的关键词,通过词嵌入技术将关键词转换为词向量,由词向量组成原始特征矩阵。在本实施例中,通过读取作业人员填写的作业日志中的文本内容,获取上述文本信息。

所述词嵌入技术是一种将文本中的词转换成数字向量的方法,为了使用标准机器学习算法来对它们进行分析,就需要把这些被转换成数字的向量以数字形式作为输入。当文本中的单词由词向量表示时,每个单词都被随机初始化为一个固定长度的向量,此时,文本中的第t个单词就被表示为x

词嵌入过程就是把一个维数为所有词数量的高维空间嵌入到一个维数低得多的连续向量空间中,便于通过CNN模型和LSTM模型对文本信息进行分类。

S2:将原始特征矩阵同时输入到预先训练的CNN模型和LSTM模型中,基于CNN模型和LSTM模型的输出结果得到文本信息属于各个风险类别的概率值,在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的。

如图2所示,将文本信息输入混合文本分类模型,所述混合分类模型包括由CNN模型和LSTM模型组成,其中CNN模型包括卷积层和池化层。CNN模型的卷积层有3层,第1层的输入矩阵为词嵌入处理后的原始特征矩阵,第1层的输出矩阵与原始特征矩阵通过Concat指令进行拼接,将拼接后的矩阵输入第2层,第2层的输出矩阵与原始特征矩阵通过Concat指令进行拼接,将拼接后的矩阵输入第3层,第3层的输出矩阵与原始特征矩阵通过Concat指令进行拼接,将拼接后的矩阵与LSTM模型的输出结果在融合层中融合。再将融合层的输出矩阵输入全连接层,通过Dropout技术防止过拟合,提高模型的泛化能力。最后通过Softmax函数得到分类结果输出。

上述文本信息分类的具体过程如下:

步骤一:将原始特征矩阵X

步骤二:获取LSTM模型的输出矩阵H,通过CNN模型的卷积层中对W

步骤三:通过CNN模型的池化层降低W

步骤四:基于merge函数对H和W

步骤五:根据W

在步骤二中,由于常规的CNN模型的层与层之间特征传递时容易发生特征丢失问题,在本实施例中设置了3个卷积层,在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的,具体包括:

将原始特征矩阵X

其中,若X

若X

padding即可以在进行卷积操作前,对原矩阵进行边界填充,也就是在矩阵的边界上填充一些值,以增加矩阵的大小,通常都用“0”来进行填充。padding参数有两种模式,分别为SAME和VALID。

当padding为SAME时,输入矩阵和输出矩阵的维度大小关系为:

λ

通过将padding的模式设置为SAME,表示在对输入矩阵进行卷积之前对输入矩阵使用填充,卷积操作时将会在输入矩阵对应维度的每一边均匀地填充一定的行或列的0向量,实现输入矩阵和输出矩阵的维度相同,此时的滑动步长s=1。

基于公式一调整O

在本实施例中,CNN模型中卷积层的激活函数为RELU函数,卷积层的输出矩阵

在步骤五中。所述根据W

基于公式二计算原始特征矩阵对应的文本信息x属于风险类别j的概率值P(j||x

其中,风险类别j为人为设定的类别编号,x

S3:基于概率值和风险类别的预设权重计算电网作业的风险值,若风险值高于预设风险阈值,则发出电网作业告警。

获取风险类别j的预设权重μ

(1)作业内容:例如对电网设备实施违规作业内容;

(2)作业机具:例如作业现场是否使用吊机等大型施工机械进行;

(3)作业人员:例如作业人员的工作年限不足、违规记录;

(4)作业环境:例如作业时间过长、作业现场天气不达标。

基于实际作业需求,为风险类别分配权重,越容易造成电网作业事故的风险类别,其权重越大。

随后基于S2中输出的P(j||x

将所有风险类别的乘积结果相加,得到电网作业的风险值;将风险值与预设风险阈值进行比较,当风险值高于预设风险阈值时,获取最高的风险值对应的风险类别,发出提示该风险类别的告警信号。

在本实施例中有4个风险类别,通过S2得到4个分别对应不同风险类别的概率值与预设权重的乘积。将这4个乘积相加的总和作为风险值与预设风险阈值进行比较,当风险值高于预设风险阈值时,说明当前作业存在风险,进而找到最高的概率值对应的风险类别,即认为当前发生该风险类别的可能性最大,因此发出提示该风险类别的告警信号,例如在电网管理系统中弹出提示该风险类别的对话框。

通过结合风险类别的预设权重,能够更科学的对作业风险进行评估,通过发出包含风险类别信息的告警信号,便于电网管理层及时针对风险类别了解可能发生风险的原因,从而快速对电网作业进行调整响应,尽快降低电网作业发生风险的可能性。

实施例二

如图3所示,本发明提出了一种基于混合文本分类模型的电网作业告警装置4,包括:

原始特征单元41:用于基于电网作业过程中产生的文本信息,获取文本信息的原始特征矩阵。具体用于:

获取电网作业过程中产生的文本信息,提出文本信息中的关键词,通过词嵌入技术将关键词转换为词向量,由词向量组成原始特征矩阵。在本实施例中,通过读取作业人员填写的作业日志中的文本内容,获取上述文本信息。

所述词嵌入技术是一种将文本中的词转换成数字向量的方法,为了使用标准机器学习算法来对它们进行分析,就需要把这些被转换成数字的向量以数字形式作为输入。当文本中的单词由词向量表示时,每个单词都被随机初始化为一个固定长度的向量,此时,文本中的第t个单词就被表示为x

词嵌入过程就是把一个维数为所有词数量的高维空间嵌入到一个维数低得多的连续向量空间中,便于通过CNN模型和LSTM模型对文本信息进行分类。

文本分类单元42:用于将原始特征矩阵同时输入到预先训练的CNN模型和LSTM模型中,基于CNN模型和LSTM模型的输出结果得到文本信息属于各个风险类别的概率值,在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的。

如图2所示,将文本信息输入混合文本分类模型,所述混合分类模型包括由CNN模型和LSTM模型组成,其中CNN模型包括卷积层和池化层。CNN模型的卷积层有3层,第1层的输入矩阵为词嵌入处理后的原始特征矩阵,第1层的输出矩阵与原始特征矩阵通过Concat指令进行拼接,将拼接后的矩阵输入第2层,第2层的输出矩阵与原始特征矩阵通过Concat指令进行拼接,将拼接后的矩阵输入第3层,第3层的输出矩阵与原始特征矩阵通过Concat指令进行拼接,将拼接后的矩阵与LSTM模型的输出结果在融合层中融合。再将融合层的输出矩阵输入全连接层,通过Dropout技术防止过拟合,提高模型的泛化能力。最后通过Softmax函数得到分类结果输出。

上述文本信息分类的具体过程如下:

步骤一:将原始特征矩阵X

步骤二:获取LSTM模型的输出矩阵H,通过CNN模型的卷积层中对W

步骤三:通过CNN模型的池化层降低W

步骤四:基于merge函数对H和W

步骤五:根据W

在步骤二中,由于常规的CNN模型的层与层之间特征传递时容易发生特征丢失问题,在本实施例中设置了3个卷积层,在CNN模型的卷积层中,每一层的输入矩阵是根据原始特征矩阵与上一层的输出矩阵得到的,具体包括:

将原始特征矩阵X

其中,若X

若X

padding即可以在进行卷积操作前,对原矩阵进行边界填充,也就是在矩阵的边界上填充一些值,以增加矩阵的大小,通常都用“0”来进行填充。padding参数有两种模式,分别为SAME和VALID。

当padding为SAME时,输入矩阵和输出矩阵的维度大小关系为:

λ

通过将padding的模式设置为SAME,表示在对输入矩阵进行卷积之前对输入矩阵使用填充,卷积操作时将会在输入矩阵对应维度的每一边均匀地填充一定的行或列的0向量,实现输入矩阵和输出矩阵的维度相同,此时的滑动步长s=1。

基于公式一调整O

在本实施例中,CNN模型中卷积层的激活函数为RELU函数,卷积层的输出矩阵

在步骤五中。所述根据W

基于公式二计算原始特征矩阵对应的文本信息x属于风险类别j的概率值P(j||x

其中,风险类别j为人为设定的类别编号,x

风险告警单元43:用于基于概率值和风险类别的预设权重计算电网作业的风险值,若风险值高于预设风险阈值,则发出电网作业告警。具体用于:

获取风险类别j的预设类别权重μ

(5)作业内容:例如对电网设备实施违规作业内容;

(6)作业机具:例如作业现场是否使用吊机等大型施工机械进行;

(7)作业人员:例如作业人员的工作年限不足、违规记录;

(8)作业环境:例如作业时间过长、作业现场天气不达标。

基于实际作业需求,为风险类别分配权重,越容易造成电网作业事故的风险类别,其权重越大。

随后基于文本分类单元42中输出的P(j||x

将所有风险类别的乘积结果相加,得到电网作业的风险值;将风险值与预设风险阈值进行比较,当风险值高于预设风险阈值时,获取最高的风险值对应的风险类别,发出提示该风险类别的告警信号。

在本实施例中有4个风险类别,通过文本分类单元42得到4个分别对应不同风险类别的概率值与预设权重的乘积。将这4个乘积相加的总和作为风险值与预设风险阈值进行比较,当风险值高于预设风险阈值时,说明当前作业存在风险,进而找到最高的概率值对应的风险类别,即认为当前发生该风险类别的可能性最大,因此发出提示该风险类别的告警信号,例如在电网管理系统中弹出提示该风险类别的对话框。

通过结合风险类别的预设权重,能够更科学的对作业风险进行评估,通过发出包含风险类别信息的告警信号,便于电网管理层及时针对风险类别了解可能发生风险的原因,从而快速对电网作业进行调整响应,尽快降低电网作业发生风险的可能性。

上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。

以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 基于混合文本分类模型的电网作业告警方法及装置
  • 基于深度学习混合模型的文本分类方法和装置
技术分类

06120112410002