掌桥专利:专业的专利平台
掌桥专利
首页

一种对可变情报板内容进行安全防护的方法

文献发布时间:2023-06-19 18:34:06


一种对可变情报板内容进行安全防护的方法

技术领域

本发明属于信息分析领域,尤其涉及一种对可变情报板内容进行安全防护的方法。

背景技术

可变情报板是高速公路及相关场所向公众发布信息的重要渠道,现有可变情报板系统对发布内容无任何安全措施,各厂商的通信协议以明文传输为主,在信息的编码、传输、交换、处理等环节无信息安全措施。从而一旦被人利用播放不良信息或者虚假信息,这就可能会对驾驶员造成误导,影响交通秩序,带来不良社会秩序。从而需要一种对可变情报板内容进行安全防护的方法来满足使用需要。

发明内容

本发明的目的是,提供一种对可变情报板内容进行安全防护的方法,能够有效保证可变情报板信息播放的正确性。

为实现该目的,提供了一种对可变情报板内容进行安全防护的方法,本方法包括以下处理步骤,

步骤1:在有文本内容输入时,对输入的文本内容通过正则表达式进行字符串模式匹配关键字库,匹配成功则允许进行播报,反之进行步骤2操作;

步骤2:没有匹配到关键字库中的文本内容,则通过DNN模型对输入的文本内容进行判断,然后进行正例、负例类别分类,若为正例则允许进行播报,若为负例则不允许播报并且进行警报处理;

步骤3:判断得出的正例、负例均更新到关键字库,动态更新关键字库。

优选地,在步骤2中,进行正例、负例类别分类时,若无法判断则将输入的文本内容发送给管理人员进行核对处理,通过管理人员进行正例、负例分类,若为正例则允许进行播报,若为负例则不允许播报。

优选地,所述关键字库包括关键字的内容、正则表达式、关键字类型、使用计数、最近使用时间、存储空间配额、同步状态标志;所述关键字库在出厂时进行初始化,取应用领域最近至少两年来所发布的历史数据记录,经过去除重复和纠正已知错误后形成初始的关键字库。

优选地,所述关键字库达到存储上限时,按照LFU进行循环利用。

优选地,所述DNN模型设置有用于生成句嵌入向量的生成网络和与生成网络连接用于判断输入句嵌入向量的真伪的判别网络,所述DNN模型中包括以下处理步骤,

步骤51:通过生成网络生成真实使用样本的真句嵌入向量和非使用样本的伪句嵌入向量,然后将真句嵌入向量和伪句嵌入向量分别依次输入到判别网络进行判断,在判别网络进行判断的过程中,生成网络的参数保持不变,只调整判别网络的参数,使判别网络的判别准确率不断提高,直到达到设定值或者收敛为止;

步骤52:通过用于不断降低判别网络判别准确度的目标函数,不断提升生成网络生成的句嵌入向量接近真实样本分布的程度,在该过程中,固定判别网络的参数,通过目标函数,只调整生成网络的参数,直到达到设定值或者收敛为止;

步骤53:交替进行步骤51和步骤52,使生成网络和判别网络在对抗中得到准确率共同提升,直到生成网络生成的伪句嵌入向量与真句嵌入向量输入到判别网络,判别网络无法区分是真句嵌入向量还是伪句嵌入向量时,则认为生成网络的准确率达到设定值,满足实际使用的要求,此时停止交替进行步骤51和步骤52,然后通过生成网络生成设定数量的句嵌入向量并且求平均,得到目标类型的类别中心;

步骤54:在数据输入时,计算通过该数据生成的句嵌入向量与类别中心的距离,超过设定正例阈值则判定为正例,低于设定负例阈值则判定为负例,介于正例阈值和负例阈值则为无法判断。

优选地,在步骤51中,所述判别网络通过分别计算真句嵌入向量和伪句嵌入向量分布的负对数似然,计算的过程为,对于输入的每个嵌入向量即真句嵌入向量或伪句嵌入向量均记为x=(x

然后使用梯度反向传播方法设置判别网络的权重参数和偏置参数,使权重参数和偏置参数朝向减小负对数似然的方向调整,从而使判别网络的判别准确率达到设定值。

优选地,使用梯度反向传播方法设置的公式为w

优选地,在步骤52中,所述目标函数计算公式如下,

其中,

优选地,在数据输入时,所述生成网络根据输入数据x在隐藏向量空间采样一个对应高斯噪声z并且映射为高维文本表示特征G(z),然后通过判别网络计算获得距离进行判断,其计算公式如下:

其中,

优选地,所述隐藏向量空间取设定维度高斯噪声空间。

本发明与现有技术相比,其有益效果在于:

在本发明中关键字库与DNN模型的配合,能够高效快速的对输入文本进行判定,保证可变情报板信息播放的正确性的同时保证流畅性。在本发明中生成网络根据输入数x在隐藏向量空间采样一个对应高斯噪声z,使得在判断过程中减少外部的干扰,提高判断的准确性。在本发明中判别网络计算获得距离进行判断的公式即能够计算判断输入数据的异常值,在训练时,还能够用于使网络学会正样本特征,提高系统判断的准确性。

附图说明

图1为本发明结构框图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。

如图1所示,本发明提供了一种对可变情报板内容进行安全防护的方法,本方法包括以下处理步骤,

步骤1:在有文本内容输入时,对输入的文本内容通过正则表达式进行字符串模式匹配关键字库,匹配成功则允许进行播报,反之进行步骤2操作;

步骤2:没有匹配到关键字库中的文本内容,则通过DNN模型对输入的文本内容进行判断,然后进行正例、负例类别分类,若为正例则允许进行播报,若为负例则不允许播报并且进行警报处理;

步骤3:判断得出的正例、负例均更新到关键字库,动态更新关键字库。

在步骤2中,进行正例、负例类别分类时,若无法判断则将输入的文本内容发送给管理人员进行核对处理,通过管理人员进行正例、负例分类,若为正例则允许进行播报,若为负例则不允许播报。

关键字库包括关键字的内容、正则表达式、关键字类型、使用计数、最近使用时间、存储空间配额、同步状态标志;关键字库在出厂时进行初始化,取应用领域最近至少两年来所发布的历史数据记录,经过去除重复和纠正已知错误后形成初始的关键字库。关键字库根据交通使用位置可以根据近三年播报的信息数据进行处理。关键字库达到存储上限时,按照LFU进行循环利用。关键字库可根据需要清空或恢复出厂设置,重新积累关键字。

DNN模型设置有用于生成句嵌入向量的生成网络和与生成网络连接用于判断输入句嵌入向量的真伪的判别网络,DNN模型中包括以下处理步骤,

步骤51:通过生成网络生成真实使用样本的真句嵌入向量和非使用样本的伪句嵌入向量,然后将真句嵌入向量和伪句嵌入向量分别依次输入到判别网络进行判断,在判别网络进行判断的过程中,生成网络的参数保持不变,只调整判别网络的参数,使判别网络的判别准确率不断提高,直到达到设定值或者收敛为止;

步骤52:通过用于不断降低判别网络判别准确度的目标函数,不断提升生成网络生成的句嵌入向量接近真实样本分布的程度,在该过程中,固定判别网络的参数,通过目标函数,只调整生成网络的参数,直到达到设定值或者收敛为止;

步骤53:交替进行步骤51和步骤52,使生成网络和判别网络在对抗中得到准确率共同提升,直到生成网络生成的伪句嵌入向量与真句嵌入向量输入到判别网络,判别网络无法区分是真句嵌入向量还是伪句嵌入向量时,则认为生成网络的准确率达到设定值,满足实际使用的要求,此时停止交替进行步骤51和步骤52,然后通过生成网络生成设定数量的句嵌入向量并且求平均,得到目标类型的类别中心;其中,生成网络可以生成150个句嵌入向量,以便提高准确性;

步骤54:在数据输入时,计算通过该数据生成的句嵌入向量与类别中心的距离,超过设定正例阈值则判定为正例,低于设定负例阈值则判定为负例,介于正例阈值和负例阈值则为无法判断。

在步骤51中,判别网络通过分别计算真句嵌入向量和伪句嵌入向量分布的负对数似然,计算的过程为,对于输入的每个嵌入向量即真句嵌入向量或伪句嵌入向量均记为x=(x

然后使用梯度反向传播方法设置判别网络的权重参数和偏置参数,使权重参数和偏置参数朝向减小负对数似然的方向调整,从而使判别网络的判别准确率达到设定值。使用梯度反向传播方法设置的公式为w

在本实施例中,在步骤2中,根据对抗网络的原理,朝向降低判别网络准确度的方向更新生成网络的参数,使生成网络映射得到的伪句嵌入向量逐步接近真实样本的分布,从而使得生成网络生成句子的准确率得到提。

在步骤52中,目标函数计算公式如下,

其中,

在本实施例中,生成网络G和判别网络D是未知网络,其网络参数正是我们需要寻找的优化参数,以达到我们需要的准确率;D(x)是判别网络D的输出,当给定输入x时,其输出D(x)便是已知的;G(z)是生成网络对采样自隐藏空间的z所生成的伪向量,当z确定时,G(z)向量便唯一确定;x~P

首先,生成网络G和判别网络D随机初始化参数,例如采用均值为0,方差为1的高斯随机函数初始化各个参数。此时的生成网络G和判别网络D没有任何有用的生成和判别能力,因为它们是随机的。

其次,我们先固定生成网络G的参数,在隐空间采样得到低维向量z,设z=(z

再次,通过上述同样的过程得到X

如此循环往复,便是

最终,生成网络G的生成能力提高到设定值,生成的伪句嵌入向量几乎可以以假乱真,判别网络D则无法判别其真伪,这时将生成网络G和判别网络D投入使用。

在数据输入时,生成网络根据输入数据x在隐藏向量空间采样一个对应高斯噪声z并且映射为高维文本表示特征G(z),然后通过判别网络计算获得距离进行判断,其计算公式如下:

其中,

在本实施例中,f(x)表示判别网络输出最后一层logit特征,通过logit而不是最后输出结果来计算差值,是因为logit特征比直接采用输出效果更好。

在本实施例中,对于每一条输入数据x,需要判断其是否为异常,也就是需要判断该输入数据与训练阶段使用的真句子的分布是否一致。因此,从隐藏向量空间采样一个高斯噪声z,通过生成网络将其映射为高维文本表示特征G(z),我们预期生成的句嵌入向量表示特征与真句子嵌入向量的表示特征相接近。我们固定生成网络和判别网络,使用梯度反向传播方法更新隐藏向量空间的高斯噪声z,尽量减少这两个句嵌入向量之间的差异。通过这种方式,我们在隐藏向量空间中实现搜索,使得隐藏向量空间中的高斯噪声z最能代表输入数据x,实现隐藏向量空间采样。

在本实施例中,在可变情报板进行使用时,首先进行数据初始化,将关键字库根据使用位置的真实交通语句数据情况,进行初始化。DNN模型根据使用位置的真实交通语句数据,进行训练,形成满足使用准确度的生成网络和判别网,在使用过程中进行动态更新关键字库,从而通过不断使用能够保证并且不断提升可变情报板信息播放的正确性。

以上仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

技术分类

06120115616389