基于多源异构数据的融合分析方法、系统、设备及介质

文献发布时间：2023-06-19 11:29:13

技术领域

本发明涉及软件技术领域，具体涉及一种基于多源异构数据的融合分析方法、系统、设备及介质。

背景技术

目前公共安全行业的各单位、各厂商都是基于单一种类信息数据对信息进行处理识别，比如基于视频图像数据的车辆信息分析系统、基于人脸相机数据的人脸信息分析系统，只能对单一数据源运用视频图像算法进行结构化和图像分析，而无法用其他数据做交叉验证和多重确认，各类数据存在孤岛现象，无法发挥数据融合的应用价值。

发明内容

针对现有技术中的缺陷，本发明实施例提供一种基于多源异构数据的融合分析方法、系统、设备及介质，对多源异构数据进行融合分析，可以将异构数据进行融合分析得到数据间的关联关系，让所有的数据互联互通，发挥数据融合的价值。

第一方面，本发明实施例提供的一种基于多源异构数据的融合分析方法，包括以下步骤：

获取视频流数据、图像数据、人员和车辆基础数据、电子围栏和网络围栏采集的数据；

对视频流数据、图像数据以及人员和车辆基础数据采用融合识别算法进行解析，得到解析结果；

对解析结果、图像数据、人员和车辆基础数据以及电子围栏和网络围栏采集的数据进行大数据下的融合分析与实时计算，得到实时计算结果；

存储实时计算结果；

对历史数据进行离线计算，得到离线计算结果；

将实时计算结果与离线计算结果进行融合分析得到数据关联关系。

第二方面，本发明实施例提供的一种基于多源异构数据的融合分析系统，包括：数据获取模块、融合解析模块、实时计算模块、大数据存储模块、离线计算模块和分析模块，其中，

所述数据获取模块用于获取视频流数据、图像数据、人员和车辆基础数据、电子围栏和网络围栏采集的数据；

所述融合解析模块用于对视频流数据、图像数据以及人员和车辆基础数据采用融合识别算法分别进行解析，得到解析结果；

所述实时计算模块用于对解析结果、图像数据、人员和车辆基础数据以及电子围栏和网络围栏采集的数据进行大数据下的融合分析与实时计算，得到实时计算结果；

所述大数据存储模块用于存储计算结果；

所述离线计算模块用于对历史数据进行离线计算，得到离线计算结果；

所述分析模块用于根据实时计算结果和离线计算结果进行融合分析出数据关联关系。

第三方面，本发明实施例提供的一种智能设备，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述实施例描述的方法。

第四方面，本发明实施例提供的计算机可读存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述实施例描述的方法。

本发明的有益效果：

本发明实施例提供的一种基于多源异构数据的融合分析方法、系统、设备及介质，对多源异构数据进行融合分析得到数据间的关联关系，让所有的数据互联互通，发挥数据融合的价值。对视频流数据、图像数据采用融合识别算法可以一次定位图像或视频中出现的全部目标并进行目标识别，无需多次输入模型，全部目标定位和目标识别一次即可完成，识别速度快，纯并行化实现识别过程，改变了传统的算法识别逻辑，也业界同类算法相比性能更快。实时计算和离线计算都是融合大数据分析算法，基于图像视频的结构化数据本身做了适配和优化，并积累了安防场景中的大量数据，分析效率更高和分析结果更可靠。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1示出了本发明第一实施例所提供的一种基于多源异构数据的融合分析方法的流程图；

图2示出了本发明第二实施例所提供的一种基于多源异构数据的融合分析系统的结构框图；

图3示出了本发明第三实施例所提供的一种智能设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

如图1所示，示出了本发明第一实施例提供了一种基于多源异构数据的融合分析方法的流程图，适用于基于多源异构数据的融合分析系统，包括以下步骤：

S1:获取视频流数据、图像数据、人员和车辆基础数据、电子围栏和网络围栏采集的数据。

具体地，系统可以同时接入电子警察抓拍图像数据、抓拍卡口图像抓拍数据、人脸相机抓拍数据、视频相机抓拍数据、电子围栏数据、网络围栏数据、人员基础信息数据、车辆基础数据等多个维度的数据。电子围栏采集的数据和网络围栏采集的数据是结构化文本数据，包括采集到的手机的位置、手机的 Imsi/Imei编号、手机的Mac等信息。电子围栏采集的数据和网络围栏采集的数据经过数据清洗后接入系统。

S2:对视频流数据、图像数据以及人员和车辆基础数据采用融合识别算法进行解析，得到解析结果。

具体地，对视频流数据采用融合识别算法进行解析的具体方法包括：

对视频流数据进行解码、目标跟踪、选取最优帧处理得到视频图像；

对视频图像进行预处理得到预处理后的视频图像；

对预处理后的视频图像采用深度卷积神经网络进行目标定位、目标识别和特征提取，分别得到目标框、目标属性和特征值。

对图像数据采用融合识别算法进行解析的具体方法包括：

对图像数据进行预处理得到预处理后的图像；

对预处理后的图像采用深度卷积神经网络进行目标定位、目标识别和特征提取，分别得到目标框、目标属性和特征值。

其中，预处理包括纠偏、降噪和图像变换。

对视频流数据、图像数据采用融合识别算法可以一次定位图像或视频中出现的全部目标并进行目标识别，无需多次输入模型，全部目标定位和目标识别一次即可完成，纯并行化实现识别过程，改变了传统的算法识别逻辑，也业界同类算法相比性能更快。

S3:对解析结果、图像数据、人员和车辆基础数据以及电子围栏和网络围栏采集的数据进行大数据下的融合分析与实时计算，得到实时计算结果。

S4:存储实时计算结果。

S5:对历史数据进行离线计算，得到离线计算结果。

S6:将实时计算结果与离线计算结果进行融合分析得到数据关联关系。

实时计算采用flink技术，离线计算采用spark技术。实时计算和离线计算用到的:map，filter，groupby，window，foreach，reduce都属于算子，就是对数据的转换。实时计算和离线计算都是融合大数据分析算法，基于图像视频的结构化数据本身做了适配和优化，并积累了安防场景中的大量数据，所以分析效率更高，分析结果更可靠。

对于人脸相机视频或视频相机视频流数据，融合算法支持Rtsp/Rtmp(实时流传输协议)等主流的流媒体协议接入，并对视频进行解码、目标跟踪、选取最优帧等算法处理，最后经过融合识别算法解析出图像的车辆、两轮车、三轮车、行人以及其中所有的人脸子目标，然后进行融合大数据实时计算和存储。

卡口图像数据：来源于前端卡口的抓拍图片，经过融合识别算法解析出图像中的车辆、两轮车、三轮车、行人以及其中的人脸子目标，然后进行融合大数据实时计算和存储。

车辆基础数据和人员基础数据：车辆基础数据库和人员基础数据库分别保存有车辆基础数据和人员基础数据，在车辆基础数据库和人员基础数据库分别带有车辆的登记信息，人员的身份信息等基本信息，接入消息平台后会经过融合识别算法进行特征提取，然后进行融合大数据实时计算处理和存储。

电子围栏和网络围栏：这类数据结构化文本数据，包括采集到手机的位置、手机的Imsi(国际移动用户识别码)/Imei(国际移动设备识别码)、手机的 Mac(局域网地址)等信息，这些信息经过数据清洗后进入消息系统，然后进行融合大数据实时计算处理和存储。

根据上述数据源进行大数据融合分析与实施计算，可以挖掘出多种关联关系数据：车辆-手机关系、车辆-人脸关系、人体-两轮车-三轮车确定身份、人脸-手机关系。

车辆-手机关系：经过融合大数据技术的分析，将车辆轨迹和手机轨迹进行拟合，可以得到驾驶或乘坐车辆的人员，会使用哪些手机。

车辆-人脸关系：融合识别算法会同时解析出车辆相关信息数据以及其中主驾驶、副驾驶人员，通过车辆信息可以搜索到对应哪些人脸信息，然后将人脸特征和静态人脸基础信息库比对，可以知道这些车被哪些人员驾驶或乘坐过；同时按照人员可以搜索出人脸，从而知道这个人乘坐或驾驶过哪些车辆；将该人员驾驶的车辆和静态车辆库比对，可以得知这个人是否驾驶自己的车辆，同时得到自己的车辆是否被其他人驾驶过，最终得到同车辆驾驶人的线索。

人体-两轮车-三轮车确定身份：通过对特定人员模糊的人体特征检索，可以搜索到包含清晰人脸的人体目标，然后通过人脸特征和静态人脸库比对，可以查询到该人体对应的人员身份；同样也可以确定两轮车，三轮车的驾驶人身份。

人脸-手机关系：通过图像、视频中车中人脸、行人人脸、两轮车人脸、三轮车人脸以及所有目标的时空轨迹，和手机轨迹进行拟合，综合分析可以得出人脸和手机的关系，然后将人脸特征和静态人脸库比对，可以确定手机对应的人员身份线索。

根据上述关系数据进行全维度数据的融合：通过人脸特征搜索作为桥梁，将所有的人脸进行算法聚类并和静态人员库关联出身份，每个聚类包含了这个人以往的所有时空点行为，然后基于上述数据的积累，将时空点映射到：行人、两轮车、三轮车、车辆，从而可以获取到这个人在每个点采用的出行方式，同时和历史的关联手机进一步融合，可以建立用户画像，将人员-车-手机完整的串起来。

根据上述关系数据进行时空回溯：对于犯罪事件，可以对犯罪前后周围出现的行人、车辆、两轮车、三轮车提取完整的目标特征以及人脸特征，并同时和手机设备相互关联，分析出特定人员员特征集合，并和静态车辆库、静态人员库进行特征比对，得出嫌疑车辆信息、特定人员身份信息，减小搜索范围，同时结合实时的卡口图像和视频流解析融合分析技术对符合嫌疑特征的目标进行告警，可以有效提供破案的线索和效率。

本方面实施例提供的一种基于多源异构数据的融合分析方法，对多源异构数据进行融合分析得到数据间的关联关系，让所有的数据互联互通，发挥数据融合的价值。对视频流数据、图像数据采用融合识别算法可以一次定位图像或视频中出现的全部目标并进行目标识别，无需多次输入模型，全部目标定位和目标识别一次即可完成，纯并行化实现识别过程，改变了传统的算法识别逻辑，也业界同类算法相比性能更快。实时计算和离线计算都是融合大数据分析算法，基于图像视频的结构化数据本身做了适配和优化，并积累了安防场景中的大量数据，所以分析效率更高、分析结果也更可靠。

在上述的第一实施例中，提供了一种基于基于多源异构数据的融合分析方法，与之相对应的，本申请还提供一种基于多源异构数据的融合分析系统。请参考图2，其为本发明第二实施例提供的基于多源异构数据的融合分析系统的结构框图。由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

如图2所示，示出了本发明第二实施例提供的一种基于多源异构数据的融合分析系统的结构框图，该系统包括：数据获取模块、融合解析模块、实时计算模块、大数据存储模块、离线计算模块和分析模块，其中，所述数据获取模块用于获取视频流数据、图像数据、人员和车辆基础数据、电子围栏和网络围栏采集的数据；所述融合解析模块用于对视频流数据、图像数据以及人员和车辆基础数据采用融合识别算法分别进行解析，得到解析结果；所述实时计算模块用于对解析结果、图像数据、人员和车辆基础数据以及电子围栏和网络围栏采集的数据进行大数据下的融合分析与实时计算，得到实时计算结果；所述大数据存储模块用于存储计算结果；所述离线计算模块用于对历史数据进行离线计算，得到离线计算结果；所述分析模块用于根据实时计算结果和离线计算结果进行融合分析出数据关联关系。

该系统中的融合解析模块包括视频流分析单元，所述视频流分析单元对视频流数据进行解码、目标跟踪、选取最优帧处理得到视频图像，对视频图像进行预处理得到预处理后的视频图像，对预处理后的视频图像采用深度卷积神经网络进行目标定位、目标识别和特征提取，分别得到目标框、目标属性和特征值。该系统中的融合解析模块包括图像分析单元，所述图像分析单元对图像数据进行预处理得到预处理后的图像，对预处理后的图像采用深度卷积神经网络进行目标定位、目标识别和特征提取，分别得到目标框、目标属性和特征值。预处理包括纠偏、降噪和图像变换。

本方面实施例提供的一种基于多源异构数据的融合分析系统，对多源异构数据进行融合分析，让所有的数据互联互通，发挥数据融合的价值。对视频流数据、图像数据采用融合识别算法可以一次定位图像或视频中出现的全部目标并进行目标识别，无需多次输入模型，全部目标定位和目标识别一次即可完成，纯并行化实现识别过程，改变了传统的算法识别逻辑，也业界同类算法相比性能更快。实时计算和离线计算都是融合大数据分析算法，基于图像视频的结构化数据本身做了适配和优化，并积累了安防场景中的大量数据，所以分析效率更高，分析结果更可靠。

如图3所示，示出了在本发明第三实施例提供的一种智能设备结构框图，该设备包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述实施例描述的方法。

应当理解，在本发明实施例中，所称处理器可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器 (DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等，输出设备可以包括显示器(LCD等)、扬声器等。

该存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如，存储器还可以存储设备类型的信息。

具体实现中，本发明实施例中所描述的处理器、输入设备、输出设备可执行本发明实施例提供的方法实施例所描述的实现方式，也可执行本发明实施例所描述的系统实施例的实现方式，在此不再赘述。

在本发明还提供一种计算机可读存储介质的实施例，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述实施例描述的方法。

所述计算机可读存储介质可以是前述实施例所述的终端的内部存储单元，例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备，例如所述终端上配备的插接式硬盘，智能存储卡(Smart Media Card, SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)等。进一步地，所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的终端和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露终端和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：曾智颖;赵明明;孙亚妮;李凡平;石柱国;
专利申请人：北京以萨技术股份有限公司;青岛以萨数据技术有限公司;

上一篇：液压制动系统、用于操作液压制动系统的方法及控制单元
下一篇：带有集成光元件的不透明外透镜