掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据和云计算的网络安全校验方法及系统

文献发布时间:2023-06-19 12:24:27


基于大数据和云计算的网络安全校验方法及系统

技术领域

本申请涉及网络技术领域,具体而言,涉及一种基于大数据和云计算的网络安全校验方法及系统。

背景技术

随着计算机技术和网络技术的发展,对于数据的应用范围也在不断的扩展。但是,经发明人研究发现,在数据的使用过程中,若数据已经被篡改,将导致数据应用的可靠性较低的问题。

发明内容

有鉴于此,本申请的目的在于提供一种基于大数据和云计算的网络安全校验方法及系统,以改善现有技术中存在的数据应用可靠性较低的问题。

为实现上述目的,本申请实施例采用如下技术方案:

一种基于大数据和云计算的网络安全校验方法,应用于基于大数据和云计算的网络安全校验设备,该网络安全校验方法包括:

判断是否接收到连接的安全校验请求设备发送的安全校验请求信息,其中,该安全校验请求设备用于基于连接的数据请求设备获取目标网络数据的数据请求信息,向所述网络安全校验设备发送该安全校验请求信息;

若判定接收到所述安全校验请求信息,则基于该安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据;

对所述目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,并在该目标网络数据已经被篡改时,向所述安全校验请求设备发送数据篡改通知信息,其中,所述安全校验请求设备用于在接收到该数据篡改通知信息时,对所述数据请求设备发送的获取所述目标网络数据的请求信息执行丢弃操作。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述判断是否接收到连接的安全校验请求设备发送的安全校验请求信息的步骤,包括:

在接收到连接的安全校验请求设备发送的安全校验请求信息之后,对该安全校验请求设备进行设备验证处理,得到对应的设备验证结果;

判断所述设备验证结果是否为所述安全校验请求设备通过所述设备验证处理,并在所述设备验证结果为所述安全校验请求设备通过所述设备验证处理时,判断在预设时长内是否有接收到所述安全校验请求设备发送的历史安全校验请求信息;

若在所述预设时长内有接收到所述历史安全校验请求信息,则判定未收到所述安全校验请求信息;

若在所述预设时长内未接收到所述历史安全校验请求信息,则判定接收到所述安全校验请求信息。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述在接收到连接的安全校验请求设备发送的安全校验请求信息之后,对该安全校验请求设备进行设备验证处理,得到对应的设备验证结果的步骤,包括:

在接收到连接的安全校验请求设备发送的安全校验请求信息之后,对该安全校验请求信息进行解析处理,得到对应的解析结果;

基于所述解析结果中包括的所述安全校验请求设备的设备标识信息和预设的设备标识信息集合,对所述安全校验请求设备进行设备验证处理,得到对应的设备验证结果,其中,若所述设备标识信息属于所述设备标识信息集合,则确定所述安全校验请求设备通过所述设备验证处理,若所述设备标识信息不属于所述设备标识信息集合,则确定所述安全校验请求设备未通过所述设备验证处理。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述若判定接收到所述安全校验请求信息,则基于该安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据的步骤,包括:

若判定接收到所述安全校验请求信息,则获取该安全校验请求信息中携带的数据标识信息;

基于所述数据标识信息和预先建立的标识-数据对应关系,在存储的网络数据中确定待校验的目标网络数据,其中,该标识-数据对应关系基于对所述网络数据中的各部分网络数据进行数据标识配置操作生成。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述对所述目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改的步骤,包括:

获取所述目标网络数据的当前数据量,得到目标数据量信息,其中,所述目标数据量信息用于表征所述目标网络数据占用的存储空间的大小;

基于所述目标数据量信息和预设的数据量阈值信息确定对所述目标网络数据执行的校验操作的类型,得到目标类型信息,其中,与所述数据量阈值信息具有不同大小关系的目标数据量信息对应的目标类型信息不同;

对所述目标网络数据执行所述目标类型信息对应的目标校验操作,以确定该目标网络数据是否已经被篡改。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述对所述目标网络数据执行所述目标类型信息对应的目标校验操作,以确定该目标网络数据是否已经被篡改的步骤,包括:

若所述目标类型信息对应的目标校验操为第一目标校验操作,则获取在存储所述目标网络数据时生成的标准数据量信息,其中,所述第一目标校验操作对应的目标类型信息用于表征所述目标数据量信息小于或等于所述数据量阈值信息;

将所述目标数据量信息与所述标准数据量信息进行大小比较处理,得到对应的比较结果;

若所述比较结果为所述目标数据量信息与所述标准数据量信息不同,则确定所述目标网络数据被篡改;

若所述比较结果为所述目标数据量信息与所述标准数据量信息相同,则对所述目标网络数据进行遍历处理,以确定该目标网络数据是否被篡改。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述对所述目标网络数据执行所述目标类型信息对应的目标校验操作,以确定该目标网络数据是否已经被篡改的步骤,包括:

若所述目标类型信息对应的目标校验操为第二目标校验操作,则将所述目标网络数据进行分割处理,得到对应的多个目标网络数据片段,其中,所述第二目标校验操作对应的目标类型信息用于表征所述目标数据量信息大于所述数据量阈值信息;

确定所述多个目标网络数据片段中每一个目标网络数据片段被篡改的概率,得到对应的多个目标概率信息;

基于所述多个目标概率信息的大小关系在所述多个目标网络数据片段中,确定出至少一个第一目标网络数据片段;

对所述至少一个第一目标网络数据片段中的每一个所述第一目标网络数据片段进行遍历处理,以确定每一个所述第一目标网络数据片段是否被篡改,并在存在一个被篡改的所述第一目标网络数据片段时,确定所述目标网络数据已经被篡改。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述确定所述多个目标网络数据片段中每一个目标网络数据片段被篡改的概率,得到对应的多个目标概率信息的步骤,包括:

针对所述多个目标网络数据片段中的每一个所述目标网络数据片段,计算该目标网络数据片段与每一个其它目标网络数据片段之间的数据关联度,并基于该数据关联度对每一个其它目标网络数据片段进行排序,得到该目标网络数据片段对应的网络数据片段序列;

针对每一个所述目标网络数据片段,计算该目标网络数据片段对应的网络数据片段序列与每一个其它目标网络数据片段对应的网络数据片段序列之间的序列相关度信息;

针对每一个所述目标网络数据片段,计算该目标网络数据片段对应的多个所述序列相关度信息的均值,得到对应的相关度均值信息;

基于每一个所述目标网络数据片段对应的相关度均值信息,确定每一个所述目标网络数据片段被篡改的概率,得到对应的多个目标概率信息。

在一种可能的实施例中,在上述基于大数据和云计算的网络安全校验方法中,所述针对每一个所述目标网络数据片段,计算该目标网络数据片段对应的网络数据片段序列与每一个其它目标网络数据片段对应的网络数据片段序列之间的序列相关度信息的步骤,包括:

将多个所述网络数据片段序列中的每两个网络数据片段序列作为一个片段序列组合,并针对每一个所述片段序列组合包括的第一网络数据片段序列和第二网络数据片段序列执行目标操作,其中,该目标操作包括:

基于所述第一网络数据片段序列中每一个网络数据片段对应的数据标签信息,得到对应的第一数据标签序列,并基于所述第二网络数据片段序列中每一个网络数据片段对应的数据标签信息,得到对应的第二数据标签序列,其中,所述数据标签信息用于表征在目标数据库中与所述目标网络数据片段具有相同数据内容的数据所占的比例,该目标数据库中包括多条在历史上被篡改的数据;

将所述第一数据标签序列和所述第二数据标签序列进行对比,得到对应的数据标签序列,其中,所述数据标签序列用于表征所述第一数据标签序列和所述第二数据标签序列之间对应位置的数据标签信息是否相同;

对所述数据标签序列进行解析,得到该数据标签序列对应的数据标签特征信息,其中,所述数据标签特征信息用于表征所述第一数据标签序列和所述第二数据标签序列之间的第一序列相关度信息;

基于所述第一网络数据片段序列中每一个目标网络数据片段对应的数据标识信息,得到对应的第一数据标识序列,并基于所述第二网络数据片段序列中每一个目标网络数据片段对应的数据标识信息,得到对应的第二数据标识序列,其中,所述数据标识信息用于表征所述目标网络数据片段的重要程度;

将所述第一数据标识序列和所述第二数据标识序列进行对比,得到对应的数据标识序列,其中,所述数据标识序列用于表征所述第一数据标识序列和所述第二数据标识序列之间对应位置的数据标识信息是否相同;

对所述数据标识序列进行解析,得到该数据标识序列对应的数据标识特征信息,其中,所述数据标识特征信息用于表征所述第一数据标识序列和所述第二数据标识序列之间的第二序列相关度信息;

基于所述第一序列相关度信息和所述第二序列相关度信息,得到所述第一网络数据片段序列和所述第二网络数据片段序列的序列相关度信息。

本申请还提供一种基于大数据和云计算的网络安全校验系统,包括安全校验请求设备和基于大数据和云计算的网络安全校验设备,其中,该基于大数据和云计算的网络安全校验设备用于执行上述的基于大数据和云计算的网络安全校验方法。

本申请提供的基于大数据和云计算的网络安全校验方法及系统,安全校验请求设备在获取到数据请求设备获取目标网络数据的数据请求信息之后,先向网络安全校验设备发送安全校验请求信息,使得网络安全校验设备可以基于安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据,并对目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,如此,可以在该目标网络数据已经被篡改时向安全校验请求设备发送数据篡改通知信息,从而使得安全校验请求设备不会请求获取目标网络数据。基于此,可以避免因数据请求设备在获取到被篡改的数据之后加以利用而导致数据应用可靠性较低的问题。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

图1为本申请实施例提供的基于大数据和云计算的网络安全校验设备的结构框图。

图2为本申请实施例提供的基于大数据和云计算的网络安全校验方法包括的各步骤的流程示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1所示,本申请实施例提供了一种基于大数据和云计算的网络安全校验系统。其中,该网络安全校验系统包括安全校验请求设备和基于大数据和云计算的网络安全校验设备。

其中,所述网络安全校验设备可以包括存储器和处理器。

详细地,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本申请实施例(如后文所述)提供的基于大数据和云计算的网络安全校验方法。

所述基于大数据和云计算的网络安全校验设备可以用于:

判断是否接收到连接的安全校验请求设备发送的安全校验请求信息,其中,该安全校验请求设备用于基于连接的数据请求设备获取目标网络数据的数据请求信息,向所述网络安全校验设备发送该安全校验请求信息;

若判定接收到所述安全校验请求信息,则基于该安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据;

对所述目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,并在该目标网络数据已经被篡改时,向所述安全校验请求设备发送数据篡改通知信息,其中,所述安全校验请求设备用于在接收到该数据篡改通知信息时,对所述数据请求设备发送的获取所述目标网络数据的请求信息执行丢弃操作。

可选地,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。

所述处理器可以是一种通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

并且,图1所示的结构仅为示意,所述基于大数据和云计算的网络安全校验设备还可包括比图1中所示更多或者更少的组件,或具有与图1所示不同的配置,例如,可以包括用于与其它设备进行信息交互的通信单元。

其中,在一种可以替代的示例中,所述基于大数据和云计算的网络安全校验设备可以是一种具备数据处理能力的服务器。

结合图2,本申请实施例还提供一种基于大数据和云计算的网络安全校验方法,可应用于上述基于大数据和云计算的网络安全校验设备。其中,该基于大数据和云计算的网络安全校验方法有关的流程所定义的方法步骤,可以由所述基于大数据和云计算的网络安全校验设备实现。

下面将对图2所示的具体流程,进行详细阐述。

步骤S110,判断是否接收到连接的安全校验请求设备发送的安全校验请求信息。

在本实施例中,所述网络安全校验设备可以先判断是否接收到连接的安全校验请求设备(可以是一种服务器)发送的安全校验请求信息。其中,该安全校验请求设备用于基于连接的数据请求设备(可以是一种终端设备)获取目标网络数据的数据请求信息,向所述网络安全校验设备发送该安全校验请求信息。也就是说,所述数据请求设备在需要获取目标网络数据时,需要先向所述安全校验请求设备发送数据请求信息,该安全校验请求设备基于该数据请求信息向所述网络安全校验设备发送安全校验请求信息。

并且,在判定接收到所述安全校验请求信息之后,可以执行步骤S120。

步骤S120,基于所述安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据。

在本实施例中,在基于步骤S110判定接收到所述安全校验请求信息之后,所述网络安全校验设备可以基于所述安全校验请求信息中携带的数据标识信息,在存储的网络数据中确定待校验的目标网络数据。

其中,所述目标网络数据为存储的网络数据中的部分数据。

步骤S130,对所述目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,并在该目标网络数据已经被篡改时,向所述安全校验请求设备发送数据篡改通知信息。

在本实施例中,在基于步骤S120确定所述目标网络数据之后,所述网络安全校验设备可以对该目标网络数据执行预设的校验操作,如此,可以确定该目标网络数据是否已经被篡改。然后,在确定该目标网络数据已经被篡改时,可以向所述安全校验请求设备发送对应的数据篡改通知信息,使得该安全校验请求设备可以对所述数据请求设备发送的用于获取所述目标网络数据的请求信息执行丢弃操作,即不会请求获取该目标网络数据,使得不会将被篡改的目标网络数据发送给所述数据请求设备。

也就是说,若确定所述目标网络数据没有被篡改,所述安全校验请求设备可以请求获取所述目标网络数据,然后,将该目标网络数据发送给所述数据请求设备,使得该数据请求设备可以利用该目标网络数据。

基于上述方法,由于安全校验请求设备在获取到数据请求设备获取目标网络数据的数据请求信息之后,先向网络安全校验设备发送安全校验请求信息,使得网络安全校验设备可以基于该安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据,并对目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,如此,可以在该目标网络数据已经被篡改时向安全校验请求设备发送数据篡改通知信息,从而使得安全校验请求设备不会请求获取被篡改的目标网络数据。基于此,可以避免因数据请求设备在获取到被篡改的数据之后加以利用而导致数据应用可靠性较低的问题。

第一方面,对于步骤S110需要说明的是,判断是否获取到所述安全校验请求信息的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,步骤S110可以包括以下步骤:

首先,在接收到连接的安全校验请求设备发送的安全校验请求信息之后,对该安全校验请求设备进行设备验证处理,得到对应的设备验证结果;

其次,判断所述设备验证结果是否为所述安全校验请求设备通过所述设备验证处理,并在所述设备验证结果为所述安全校验请求设备通过所述设备验证处理时,判断在预设时长内是否有接收到所述安全校验请求设备发送的历史安全校验请求信息;

然后,若在所述预设时长内有接收到所述历史安全校验请求信息,则判定未收到所述安全校验请求信息;

最后,若在所述预设时长内未接收到所述历史安全校验请求信息,则判定接收到所述安全校验请求信息。

在上述示例中,通过设备验证处理和基于预设时长进行的判断,可以使得数据校验的安全性更高,并且可以避免短时间内重复请求校验而导致资源浪费的问题。其中,所述预设时长可以用户根据实际应用场景进行的配置操作生成,且在对安全性要求较高时,该预设时长可以较大,在对计算资源浪费的要求较高时,该预设时长可以较小。

可选地,在上述示例中,对所述安全校验请求设备进行设备验证处理的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,所述网络安全校验设备可以先向所述安全校验请求设备发送一确认信息,然后,接收该安全校验请求设备基于该确认信息返回的响应信息,再基于该确认信息和预设规则确定该响应信息是否正确,如此,若该响应信息不正确,可以认为未通过设备验证处理;若该响应信息正确,可以认为通过设备验证处理。

又例如,在另一种可以替代的示例中,为了提高验证处理的效率,可以基于以下步骤对所述安全校验请求设备进行设备验证处理:

首先,在接收到连接的安全校验请求设备发送的安全校验请求信息之后,对该安全校验请求信息进行解析处理,得到对应的解析结果(例如,可以获取所述安全校验请求信息中的特定字段的信息,得到所述安全校验请求设备的设备标识信息,如设备指纹或IP地址等);

其次,基于所述解析结果中包括的所述安全校验请求设备的设备标识信息和预设的设备标识信息集合,对所述安全校验请求设备进行设备验证处理,得到对应的设备验证结果,其中,若所述设备标识信息属于所述设备标识信息集合,则确定所述安全校验请求设备通过所述设备验证处理,若所述设备标识信息不属于所述设备标识信息集合,则确定所述安全校验请求设备未通过所述设备验证处理。

也就是说,所述设备标识信息集合可以是一种设备白名单,使得属于该设备白名单的安全校验请求设备可以通过设备验证处理。

第二方面,对于步骤S120需要说明的是,在所述网络数据中确定带校验的目标网络数据的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,为了提高确定所述目标网络数据的效率,步骤S120可以包括以下步骤:

首先,若判定接收到所述安全校验请求信息,则获取该安全校验请求信息中携带的数据标识信息;

其次,基于所述数据标识信息和预先建立的标识-数据对应关系,在存储的网络数据中确定待校验的目标网络数据,其中,该标识-数据对应关系基于对所述网络数据中的各部分网络数据进行数据标识配置操作生成。

也就是说,可以预先将所述网络数据中的各部分数据进行标识处理,如编号等,然后,在执行上述步骤时,可以基于该标识处理的结果确定对应的目标网络数据。

可选地,在上述示例中,基于所述数据标识信息确定所述目标网络数据的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,可以基于以下步骤以在存储的网络数据中确定所述目标网络数据:

首先,基于预先建立的标识-数据地址对应关系,确定所述数据标识信息对应的数据存储地址信息,其中,所述标识-数据地址对应关系作为所述标识数据对应关系,所述数据存储地址信息用于表征所述目标网络数据的存储位置;

其次,在存储的网络数据中,确定所述数据存储地址信息对应的部分网络数据,并将该部分网络数据确定为待校验的目标网络数据。

也就是说,在上述示例中,可以基于数据的存储地址确定对应的目标网络数据,如此,可以充分提高进行确定的效率。

第三方面,对于步骤S130需要说明的是,执行预设的所述检验操作以确定所述目标网络数据是否已经被篡改的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,在考虑校验结果的准确性的基础上,进一步考虑校验的效率和资源消耗等问题,步骤S130可以包括以下步骤:

首先,获取所述目标网络数据的当前数据量,得到目标数据量信息,其中,所述目标数据量信息用于表征所述目标网络数据占用的存储空间的大小;其次,基于所述目标数据量信息和预设的数据量阈值信息确定对所述目标网络数据执行的校验操作的类型,得到目标类型信息,其中,与所述数据量阈值信息具有不同大小关系的目标数据量信息对应的目标类型信息不同(可以理解的是,所述数据量阈值信息可以基于用户根据实际应用场景进行的配置操作生成,例如,在对校验结果的准确性要求较高时,所述数据量阈值信息可以较大,在对校验的效率要求较高时,所述数据量阈值信息可以较小);

然后,对所述目标网络数据执行所述目标类型信息对应的目标校验操作,以确定该目标网络数据是否已经被篡改。

可选地,在上述示例中,执行所述目标校验操作的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,可以基于以下步骤以对所述目标网络数据执行所述目标类型信息对应的目标校验操作:

首先,若所述目标类型信息对应的目标校验操为第一目标校验操作,则获取在存储所述目标网络数据时生成的标准数据量信息(即获取所述目标网络数据在存储时的数据量,使得该数据量可以代表该目标网络数据未被篡改时的数据量),其中,所述第一目标校验操作对应的目标类型信息用于表征所述目标数据量信息小于或等于所述数据量阈值信息;

其次,将所述目标数据量信息与所述标准数据量信息进行大小比较处理,得到对应的比较结果;

然后,若所述比较结果为所述目标数据量信息与所述标准数据量信息不同,则确定所述目标网络数据被篡改;

最后,若所述比较结果为所述目标数据量信息与所述标准数据量信息相同,则对所述目标网络数据进行遍历处理,以确定该目标网络数据是否被篡改(例如,将所述目标网络数据中的每一行数据与所述目标网络数据对应的备份数据中对应的每一行数据进行对比,如此,可以确定该目标网络数据是否被篡改,如存在不同的行数据,则确定数据被篡改)。

又例如,在另一种可以替代的示例中,可以基于以下步骤以对所述目标网络数据执行所述目标类型信息对应的目标校验操作:

首先,若所述目标类型信息对应的目标校验操为第二目标校验操作,则将所述目标网络数据进行分割处理,得到对应的多个目标网络数据片段(可以理解的是,分割处理的方式可以包括但不限于,等数据量大小分割,或按照对所述目标网络数据中各个部分进行内容识别的结果进行分割,使得得到的每一个目标网络数据片段表征的内容较为完整,例如,可以将用户的工作经历信息和教育经历信息分割为两个不同的目标网络数据片段),其中,所述第二目标校验操作对应的目标类型信息用于表征所述目标数据量信息大于所述数据量阈值信息;

其次,确定所述多个目标网络数据片段中每一个目标网络数据片段被篡改的概率(即可能被篡改的概率),得到对应的多个目标概率信息;

然后,基于所述多个目标概率信息的大小关系在所述多个目标网络数据片段中,确定出至少一个第一目标网络数据片段(例如,既可以是将最大的一个或多个目标概率信息对应的目标网络数据片段确定为第一目标网络数据片段,也可以将大于概率阈值的每一个目标网络数据片段确定为第一目标网络数据片段);

最后,对所述至少一个第一目标网络数据片段中的每一个所述第一目标网络数据片段进行遍历处理(如将所述第一目标网络数据片段中的每一行数据与所述目标网络数据对应的备份数据中对应的每一行数据进行对比,以确定每一行数据是否被篡改,如不同,则表示已经被篡改),以确定每一个所述第一目标网络数据片段是否被篡改,并在存在一个被篡改的所述第一目标网络数据片段时,确定所述目标网络数据已经被篡改。

可以理解的是,在上述示例中,确定所述多个目标网络数据片段中每一个目标网络数据片段被篡改的概率的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,为了使得在即便没有准确确定出数据是否被篡改的基础上,也能保障数据应用的可靠性,可以基于以下步骤以确定每一个所述目标网络数据片段被篡改的概率:

首先,针对所述多个目标网络数据片段中的每一个所述目标网络数据片段,计算该目标网络数据片段与每一个其它目标网络数据片段之间的数据关联度(该数据关联度可以是指数据的相似程度,该数据的相似程度可以基于现有的数据相似性计算方法计算得到,或者该数据关联度可以是指表征的内容的相似度,如工作经历和教育经历之间的相似度大于工作经历和身份信息之间的相似度),并基于该数据关联度对每一个其它目标网络数据片段进行排序,得到该目标网络数据片段对应的网络数据片段序列;

其次,针对每一个所述目标网络数据片段,计算该目标网络数据片段对应的网络数据片段序列与每一个其它目标网络数据片段对应的网络数据片段序列之间的序列相关度信息;

然后,针对每一个所述目标网络数据片段,计算该目标网络数据片段对应的多个所述序列相关度信息的均值,得到对应的相关度均值信息;

最后,基于每一个所述目标网络数据片段对应的相关度均值信息,确定每一个所述目标网络数据片段被篡改的概率,得到对应的多个目标概率信息(例如,可以先计算所有的目标网络数据片段对应的相关度均值信息的和值,再针对每一个所述目标网络数据片段,将该目标网络数据片段对应的相关度均值信息除以该和值,得到该目标网络数据片段对应的概率)。

可以理解的是,在上述示例中,计算所述网络数据片段序列之间的所述序列相关度信息的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,可以基于以下步骤以计算所述网络数据片段序列之间的所述序列相关度信息:

首先,将多个所述网络数据片段序列中的每两个网络数据片段序列作为一个片段序列组合;其次,针对每一个所述片段序列组合包括的第一网络数据片段序列和第二网络数据片段序列,对该第一网络数据片段序列和该第二网络数据片段序列执行目标操作,以得到该第一网络数据片段序列和该第二网络数据片段序列之间的序列相关度信息。

其中,所述目标操作包括:

第一步,基于所述第一网络数据片段序列中每一个网络数据片段对应的数据标签信息,得到对应的第一数据标签序列,并基于所述第二网络数据片段序列中每一个网络数据片段对应的数据标签信息,得到对应的第二数据标签序列,其中,所述数据标签信息用于表征在目标数据库中与所述目标网络数据片段具有相同数据内容的数据所占的比例,该目标数据库中包括多条在历史上被篡改的数据(例如,若历史上被篡改的数据有1000条,其中,这1000条数据中有10条数据与所述目标网络数据片段之间具有相同的数据内容,如此,对应的比例可以为1%);

第二步,将所述第一数据标签序列和所述第二数据标签序列进行对比,得到对应的数据标签序列,其中,所述数据标签序列用于表征所述第一数据标签序列和所述第二数据标签序列之间对应位置的数据标签信息是否相同(例如,若对应位置的数据标签信息相同,可以赋值为第一数值,若对应位置的数据标签信息不同,可以赋值为第二数值,如此,若所述第一数据标签序列和所述第二数据标签序列完全相同,则所述数据标签序列中的值都为所述第一数值;若所述第一数据标签序列和所述第二数据标签序列完全不同,则所述数据标签序列中的值都为所述第二数值;在其它情况下,所述数据标签序列可以由所述第一数值和所述第二数值构成);

第三步,对所述数据标签序列进行解析,得到该数据标签序列对应的数据标签特征信息,其中,所述数据标签特征信息用于表征所述第一数据标签序列和所述第二数据标签序列之间的第一序列相关度信息(例如,可以计算所述数据标签序列中所述第一数值的数量占比,并将该数量占比确定为所述数据标签特征信息);

第四步,基于所述第一网络数据片段序列中每一个目标网络数据片段对应的数据标识信息,得到对应的第一数据标识序列,并基于所述第二网络数据片段序列中每一个目标网络数据片段对应的数据标识信息,得到对应的第二数据标识序列,其中,所述数据标识信息用于表征所述目标网络数据片段的重要程度(可以理解的是,该重要程度可以基于用户进行的操作生成,或者,在对所述目标数据片段进行内容识别之后,基于识别结果和预先建立的内容-重要程度对应关系确定);

第五步,将所述第一数据标识序列和所述第二数据标识序列进行对比,得到对应的数据标识序列,其中,所述数据标识序列用于表征所述第一数据标识序列和所述第二数据标识序列之间对应位置的数据标识信息是否相同(如前所述,在此不再一一赘述);

第六步,对所述数据标识序列进行解析,得到该数据标识序列对应的数据标识特征信息,其中,所述数据标识特征信息用于表征所述第一数据标识序列和所述第二数据标识序列之间的第二序列相关度信息(如前所述,在此不再一一赘述);

第七步,基于所述第一序列相关度信息和所述第二序列相关度信息,得到所述第一网络数据片段序列和所述第二网络数据片段序列的序列相关度信息(例如,可以将所述第一序列相关度信息和所述第二序列相关度信息的均值作为所述序列相关度信息,或者,可以将所述第一序列相关度信息和所述第二序列相关度信息进行加权计算,其中,考虑到所述数据标签信息与历史上被篡改的数据相关,在侧重于准确计算被篡改的概率信息时,该第一序列相关度信息的权重系数可以大于所述第二序列相关度信息的权重系数;反之,若基于其它需求,该第一序列相关度信息的权重系数可以小于所述第二序列相关度信息的权重系数)。

又例如,在另一种可以替代的示例中,可以基于以下步骤以计算所述网络数据片段序列之间的所述序列相关度信息:

首先,将多个所述网络数据片段序列中的每两个网络数据片段序列作为一个片段序列组合;其次,针对每一个所述片段序列组合,基于该片段序列组合包括的第一网络数据片段序列和第二网络数据片段序列执行目标操作,以得到该第一网络数据片段序列和该第二网络数据片段序列之间的序列相关度信息。

其中,所述目标操作包括:

第一步,依次将所述第一网络数据片段序列中的每一个所述目标网络数据片段确定为当前遍历网络数据片段;

第二步,将所述当前遍历网络数据片段与所述第二网络数据片段序列中对应位置的目标网络数据片段进行比对(例如,若所述当前遍历网络数据片段为所述第一网络数据片段序列中的第一个目标网络数据片段,则将该第一个目标网络数据片段与所述第二网络数据片段序列中国的第一个目标网络数据片段进行比较),以确定所述第二网络数据片段序列中对应位置的目标网络数据片段与所述当前遍历网络数据片段表征的数据内容是否相同(如都是表征身份信息,如姓名和身份证);

第三步,统计与所述第二网络数据片段序列中对应位置的目标网络数据片段之间表征的数据内容相同的当前遍历网络数据的数量,得到第一数量,并基于该第一数量得到对应的第一比值(例如,计算所述第一数量与所述第一网络数据片段序列中目标网络数据片段的数量得到该第一比值);

第四步,依次将所述第一网络数据片段序列中的每连续的N个目标网络数据片段确定为当前遍历网络数据连续片段(例如,将连续的每2个目标网络数据片段确定为当前遍历网络数据连续片段、将连续的每3个目标网络数据片段确定为当前遍历网络数据连续片段、将连续的每4个目标网络数据片段确定为当前遍历网络数据连续片段、......、将连续的每N个目标网络数据片段确定为当前遍历网络数据连续片段),其中,N包括大于或等于2且小于或等于第一数量的每一个值,该第一数量为所述第一网络片段序列中目标网络数据片段的数量;

第五步,将所述当前遍历网络数据连续片段与所述第二网络数据片段序列中数量相同的每一组连续的目标网络数据片段进行比对(例如,针对第一网络数据片段序列中连续的2个目标网络数据片段,将该2个目标网络数据片段与所述第二网络数据片段序列中每连续的2个目标网络数据片段进行对比),以确定所述第二网络数据片段序列中对应数量的目标网络数据片段与所述当前遍历网络数据连续片段表征的数据内容是否相同;

第六步,统计与所述第二网络数据片段序列中对应数量的目标网络数据片段之间表征的数据内容相同的当前遍历网络数据连续片段的数量,得到第二数量,并基于该第二数量得到对应的第二比值(例如,表征的数据内容相同的当前遍历网络数据连续片段的数量为第二数量,表征的数据内容不同的当前遍历网络数据连续片段的数量为第三数量,则当前遍历网络数据连续片段的数量为第二数量和第三数量的和值,如此,可以将该第二数量和该和值的比值作为所述第二比值);

第七步,基于所述第一比值和所述第二比值进行加权计算,得到所述第一网络数据片段序列和所述第二网络数据片段序列之间的序列相关度信息,其中,所述第二比值对应的权重系数大于所述第一比值对应的权重系数,不同当前遍历网络数据连续片段对应的第二比值的权重系数不同,且与包括的目标网络数据片段的数量具有正相关关系(也就是说,一个当前遍历网络数据连续片段包括的目标网络数据片段的数量越多,则对应的权重系数越大)。

再例如,在另一种可以替代的示例中,可以基于以下步骤以计算所述网络数据片段序列之间的所述序列相关度信息:

首先,将多个所述网络数据片段序列中的每两个网络数据片段序列作为一个片段序列组合;其次,并针对每一个所述片段序列组合包括的第一网络数据片段序列和第二网络数据片段序列执行目标操作,以得到该第一网络数据片段序列和该第二网络数据片段序列之间的序列相关度信息。

其中,所述目标操作包括:

第一步,获取所述片段序列组合包括的每一个网络数据片段序列的第一标签信息采样序列和第二标签信息采样序列(即获取所述第一网络数据片段序列的第一标签信息采样序列和第二标签信息采样序列,并获取所述第二网络数据片段序列的第一标签信息采样序列和第二标签信息采样序列),并获取所述第一网络数据片段序列和所述第二网络数据片段序列的融合网络数据片段序列(例如,可以获取所述第一网络数据片段序列和所述第二网络数据片段序列中的目标网络数据片段的并集,然后,计算该并集中每一个目标网络数据片段在所述第一网络数据片段序列和所述第二网络数据片段序列中具有的数据关联度的均值,再基于该均值对该并集中的每一个目标网络数据片段进行排序,得到该融合网络数据片段序列)的第三标签信息采样序列和第四标签信息采样序列,其中,所述第一标签信息采样序列和所述第三标签信息采样序列基于所述目标网络数据片段在第一维度的特征信息形成,所述第二标签信息采样序列和所述第四标签信息采样序列基于所述目标网络数据片段在第二维度的特征信息形成,所述第一维度的特征信息用于表征在目标数据库中与所述目标网络数据片段具有相同数据内容的数据所占的比例(如前所述),该目标数据库中包括多条在历史上被篡改的数据,且所述第二维度的特征信息用于表征所述目标网络数据片段的重要程度(如前所述);

第二步,根据每一个所述网络数据片段序列的第一标签信息采样序列和所述融合网络数据片段序列的第三标签信息采样序列,计算所述网络数据片段序列的特征变化信息和特征关联系数,其中,所述特征变化信息用于表征所述网络数据片段序列的特征变化情况;

第三步,根据每一个所述网络数据片段序列的第二标签信息采样序列和所述融合网络数据片段序列的第四标签信息采样序列,计算所述网络数据片段序列的特征权重系数;

第四步,基于预先确定的权重系数,对每一个所述网络数据片段序列的特征变化信息、特征关联系数和特征权重系数进行加权计算,得到所述网络数据片段序列与所述融合网络数据片段序列之间的序列相关度(可以理解的是,所述权重系数可以基于用户根据实际应用场景进行的配置操作生成,其具体数值不受限制,只要满足所述特征变化信息、所述特征关联系数和所述特征权重系数的权重系数之和为1即可);

第五步,计算所述片段序列组合包括的每一个网络数据片段序列与所述融合网络数据片段序列之间的序列相关度的乘积,得到所述片段序列组合包括的第一网络数据片段序列和第二网络数据片段序列之间的序列相关度信息(例如,将所述第一网络数据片段序列与所述融合网络数据片段序列之间的序列相关度乘以所述第二网络数据片段序列与所述融合网络数据片段序列之间的序列相关度,得到所述第一网络数据片段序列和所述第二网络数据片段序列之间的序列相关度信息)。

可以理解的是,在上述示例中,计算所述网络数据片段序列的特征变化信息和特征关联系数的具体方式不受限制,可以根据实际需求选择。

例如,在一种可以替代的示例中,可以基于以下步骤以计算所述网络数据片段序列的特征变化信息和特征关联系数:

首先,根据每一个所述网络数据片段序列的第一标签信息采样序列,计算每一个所述网络数据片段序列的特征变化信息;其次,根据每一个所述网络数据片段序列的第一标签信息采样序列与所述融合网络数据片段序列的第三标签信息采样序列,计算所述网络数据片段序列的特征关联系数。

可以理解的是,在上述示例中,计算每一个所述网络数据片段序列的特征变化信息的具体方式不受限制,可以根据实际需求选择。

例如,在一种可以替代的示例中,可以基于以下步骤以计算每一个所述网络数据片段序列的特征变化信息:

首先,根据所述网络数据片段序列的第一标签信息采样序列,得到所述网络数据片段序列的异常子序列,其中,所述异常子序列为所述第一标签信息采样序列中在第一维度的特征信息小于预设值(该预设值可以基于所述目标数据库中具有不同数据内容各数据所占的比例的均值确定)的连续子序列,所述异常子序列中在第一维度的特征信息的数量大于或等于预设阈值(该预设阈值可以基于用户根据实际应用场景进行的配置操作生成);其次,计算所述异常子序列中各特征信息与特征标准阈值之差的和值,其中,所述特征标准阈值为第一预设值(该第一预设值可以基于用户根据实际应用场景进行的配置操作生成)或所述网络数据片段序列的第一标签信息采样序列的特征信息的均值;然后,将所述和值的绝对值,确定为所述网络数据片段序列的特征变化信息。

可以理解的是,在上述示例中,计算所述网络数据片段序列的特征关联系数的具体方式不受限制,可以根据实际需求选择。

例如,在一种可以替代的示例中,可以基于以下步骤以计算所述网络数据片段序列的特征关联系数:

首先,计算所述网络数据片段序列的第一标签信息采样序列的标准差,并计算所述融合网络数据片段序列的第三标签信息采样序列的标准差(即计算采样序列中各特征信息的标准差);

其次,计算所述网络数据片段序列的第一标签信息采样序列与所述融合网络数据片段序列的第三标签信息采样序列的协方差;

然后,根据所述第一标签信息采样序列的标准差、所述第三标签信息采样序列的标准差和所述第一标签信息采样序列与所述第三标签信息采样序列的协方差,计算所述网络数据片段序列的特征关联系数(例如,可以计算两个标准差和该协方差的均值,得到该特征关联系数)。

可以理解的是,在上述示例中,计算所述网络数据片段序列的特征权重系数的具体方式不受限制,可以根据实际应用需求进行选择。

例如,在一种可以替代的示例中,可以基于以下步骤以计算所述网络数据片段序列的特征权重系数:

首先,计算所述网络数据片段序列的第二标签信息采样序列中的各特征信息与所述融合网络数据片段序列的第四标签信息采样序列中的各特征信息值的比值(可以理解的是,所述第二标签信息采样序列和所述第四标签信息采样序列包括的特征信息的数量相同,其在前述的示例中,所述第一标签信息采样序列和所述第三标签信息采样序列包括的特征信息的数量相同,如此,可以将第二标签信息采样序列中的各特征信息与第四标签信息采样序列中对应位置特征信息的比值),得到多个特征比值;

其次,计算所述各多个特征比值的均值,并将该均值确定为所述网络数据片段序列的特征权重系数。

本申请实施例还提供一种基于大数据的数据请求处理方法,其中,该数据请求处理方法可以包括:

判断是否接收到连接的数据请求设备发送的数据请求信息;

若接收到所述数据请求信息,则基于该数据请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据;

对所述目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,并在该目标网络数据已经被篡改时,向所述数据请求设备发送数据篡改通知信息,或者,在该目标网络数据未被篡改时,向所述数据请求设备发送该目标网络数据。

可以理解的是,在上述示例中,对所述目标网络数据执行预设的校验操作以确定该目标网络数据是否已经被篡改的具体方式不受限制,例如,可以执行上述的步骤S130。

本申请实施例还提供一种基于大数据和云计算的数据处理方法,其中,该数据处理方法可以包括:

判断是否接收到连接的数据请求设备发送的数据请求信息;

若接收到所述数据请求信息,则基于该数据请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据;

对所述目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,并在该目标网络数据已经被篡改时,向所述数据请求设备发送请求确认信息;

判断是否接收到所述数据请求设备发送的请求确认回复信息,并在接收到该请求确认回复信息之后,将恢复后的目标网络数据发送给所述数据请求设备,其中,该数据请求设备用于在接收到所述请求确认信息,且确定所述目标网络数据恢复之后需要获取该目标网络数据之后,生成并发送所述请求确认回复信息。

可以理解的是,在上述示例中,对所述目标网络数据执行预设的校验操作以确定该目标网络数据是否已经被篡改的具体方式不受限制,例如,可以执行上述的步骤S130。

综上所述,本申请提供的基于大数据和云计算的网络安全校验方法及系统,安全校验请求设备在获取到数据请求设备获取目标网络数据的数据请求信息之后,先向网络安全校验设备发送安全校验请求信息,使得网络安全校验设备可以基于该安全校验请求信息中携带的数据标识信息在存储的网络数据中确定待校验的目标网络数据,并对目标网络数据执行预设的校验操作,以确定该目标网络数据是否已经被篡改,如此,可以在该目标网络数据已经被篡改时向安全校验请求设备发送数据篡改通知信息,从而使得安全校验请求设备不会请求获取目标网络数据。基于此,可以避免因数据请求设备在获取到被篡改的数据之后加以利用而导致数据应用可靠性较低的问题,使得具有较高的实用价值。

在本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 基于大数据和云计算的网络安全校验方法及系统
  • 基于网络安全大数据的安全防护配置方法及网络安全系统
技术分类

06120113281402