掌桥专利:专业的专利平台
掌桥专利
首页

一种目标区域数据分析方法、系统及电子设备

文献发布时间:2023-06-19 19:28:50


一种目标区域数据分析方法、系统及电子设备

技术领域

本发明涉及的是数据分析领域,特别涉及一种目标区域数据分析方法、系统及电子设备。

背景技术

随着新时代的要求,新形势下对目标楼栋、社区、区域的管理成为大部分管理部门的新选择。此举把对人员流动、经济发展的影响控制在最小范围,同时也对相关目标区域的精细化管理提出新的挑战。

目前相关单位使用的各类信息平台普遍存在数据壁垒,不同部门间接入了不同数据且未打通,数据有重复、未清洗、时效不足等问题,形成了很多信息孤岛。在区域目标期间时间紧,任务重,需要在短时间内整合各个部门的数据,同时筛选出有效数据进行分析。现有技术中,如何在短时间内从不同部门多个维度的繁杂数据中提取有用信息助力精准施策的问题亟待解决。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种目标区域数据分析方法、系统及电子设备。

为了解决上述技术问题,本申请实施例公开了如下技术方案:

一种目标区域数据分析方法,包括:

S100.采用基于卡方检验的方法,对未检测人员关键属性进行判断;

S200.采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;

S300.基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;

S400.根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。

进一步的,S100的具体方法包括:

S101.将不同平台的数据经过ETL操作导入至大数据集群;

S102.建设数据仓库,根据业务需求将其分为来源库、原始库、资源库和应用库四层结构;

S103.将户籍、一标三实、人脸采集数据合并去重后过滤掉殡葬火化人员作为目标区域内实有人口数据;

S104.结合专家经验和未检测人员相关维度属性,推测未检测人员为孕产妇、年老行动不便人员或婴幼儿;

S105.筛选出具有上述相关属性的人员,将相关属性数据分别与未检测人员数据联立处理,判断相关属性人员是否对检测有影响;

S106.获取目标区域内具有关键属性的人员信息并推送给对应工作人员。

进一步的,将相关属性数据分别与未检测人员数据联立处理,具体包括:选用卡方检验评价该属性与是否检测间的关系,首先假设该属性对未检测有影响,选择四格表卡方检验,求出实际的观测值;所用的算法公式为:

其中A代表实际观测值,T代表理论推断值,先假设样本的实际观测值与理论值之间没有显著性差异,如果假设检验成立,A和T的值不会相差过大;最后得出的χ

进一步的,S200的具体方法包括:

S201.小区出入口的摄像头在感知到人员、车辆出入时会即时抓拍人脸信息,同时将信息回传至服务器;

S202.服务器上的人脸信息处理进程在接收到人脸信息时会将其加入队列,然后异步加载人脸信息至数据库;

S203.通过AI智能识别人脸信息,获取对应人员的身份证号、姓名信息;

S204.统计相关人员每周车辆、骑行、步行进出平均次数以及小区周边核酸检测点近一个月核酸检测次数;

S205.利用KMEANS算法将各个字段的数据分为高、中、低三类,过滤出确定属于或不属于该小区人员的信息,新增是否属于该区域字段,得到训练样本;

S206.根据贝叶斯定理计算P(x

S207.根据拉普拉斯定理对概率进行平滑处理;

S208.筛选出尚不明确是否属于该区域的人员信息,利用极大似然估计计算出属于该区域的概率P1和不属于该区域的概率P2,若P1>P2则表明该人员属于该区域;

S209.将待补充的人员信息与实有人口表信息合并,生成完整的区域实有人口信息表,帮助目标区域精细化管理。

进一步的,贝叶斯定理公式为:

P(c)是类先验概率,P(x|c)是类标记c的似然概率,d代表X中总共有多少样本。

进一步的,S300的具体方法包括:

S301.获取确诊人员的身份证号、姓名信息;

S302.根据确诊人员行程信息与现有人、地、事、物、组织数据融合形成知识图谱,不同的维度的数据聚合在同一知识图谱中,图谱节点间指向是相互的;

S303.将确诊人员节点的初始值设为10,其余节点的初始值设为1,计算各个节点的RANK值;以确诊人员的RANK最低值为目标关注线,获取RANK值高于目标关注线的非确诊人员和场所信息作为目标关注对象;

S304.将目标关注对象发送给一线工作人员,助力目标人员的管控和目标区域的消杀工作。

进一步的,计算每个节点的RANK值,所用算法公式为:

其中,i和j分别代表某个节点i和除i外的任意一个节点,N代表图谱中节点总数,L(j)代表节点j有多少个指向节点,q代表阻尼系数,确诊人员节点的初始值为10,其他节点初始值为1,最终每个节点的Rank值由其指向节点个数及指向节点的值决定。

本发明还公开了一种目标区域数据分析系统,包括:照相采集模块、大数据组件模块、数据计算模块、知识图谱模块、消息发送模块;其中:

照相采集模块,提供了一组包含摄像头的智能硬件设备,当其感知到有人员经过时,会主动抓拍人脸信息,并利用网卡将信息回传至服务器;

大数据组件模块,能为PB级别数据提供高效的数据计算、存储和传输服务,组件采用分布式集群,多节点设备,能够保证在某地机器全部宕机的情况下数据不丢失,具有极高的容灾能力;

数据计算模块,基于SPARK计算引擎提供基于内存的高效计算服务,同时提供了丰富的机器学习算子;提供的异步队列能短时间内处理大量信息,同时能够设置调度任务合理利用服务器资源;

知识图谱模块,选用开源分布式图数据库NebulaGraph,提供了网页查询功能和丰富的API,能够高效、快速地生成知识图谱和处理多层级的数据;

消息发送模块,能够基于网卡,给手机推送邮件或短信,同时具备批量发送的能力。

本发明还公开了一种电子设备,包括:

存储器,用于存储可由处理器执行的指令;

处理器,配置为执行所述指令以实现一种目标区域数据分析方法。

本发明实施例提供的上述技术方案的有益效果至少包括:

本发明公开的一种目标区域数据分析方法,包括:采用基于卡方检验的方法,对未检测人员关键属性进行判断;采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。本发明能够快速整合不同部门的数据,打破数据孤岛,同时利用高科技手段填补实有人口数据中的漏报、漏登人员,减轻基层工作人员负担,帮助政府部门有的放矢,精准管理。对于目标区域内相关人员未检测原因进行排查,助力应检尽检,进一步降低疫情传播风险,对有困难的人员能够精准帮扶。在排查密接人员和目标区域后,能够将有限的人力资源放在最紧迫,最需要的地方,使得短时间内集中力量攻坚成为可能,为尽早消灭疫情打下基础。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例1中,一种目标区域数据分析方法的流程图;

图2为本发明实施例1中,基于区域摄像头采集数据判断相关人员是否属于该区域的流程图;

图3示为本发明实施例1中,基于确诊人员和知识图谱技术,获取密接人员和目标区域的流程图;

图4示为本发明实施例1中,基于确诊人员根据人、地、事、物、组织关系生成的知识图谱的流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

为了解决现有技术中存在的问题,本发明实施例提供一种目标区域数据分析方法、系统及电子设备。

实施例1

本实施例公开了一种目标区域数据分析方法,如图1,包括:

S100.采用基于卡方检验的方法,对未检测人员关键属性进行判断;具体的,如图2,本实施S100的具体方法包括:

S101.将不同平台的数据经过ETL操作导入至大数据集群;

S102.建设数据仓库,根据业务需求将其分为来源库、原始库、资源库和应用库四层结构;

S103.将户籍、一标三实、人脸采集数据合并去重后过滤掉殡葬火化人员作为目标区域内实有人口数据;

S104.结合专家经验和未检测人员相关维度属性,推测未检测人员为孕产妇、年老行动不便人员或婴幼儿;

S105.筛选出具有上述相关属性的人员,将相关属性数据分别与未检测人员数据联立处理,判断相关属性人员是否对检测有影响;

S106.获取目标区域内具有关键属性的人员信息并推送给对应工作人员。

在一些优选实施例中,将相关属性数据分别与未检测人员数据联立处理,具体包括:选用卡方检验评价该属性与是否检测间的关系,首先假设该属性对未检测有影响,选择四格表卡方检验,求出实际的观测值;所用的算法公式为:

其中A代表实际观测值,T代表理论推断值,先假设样本的实际观测值与理论值之间没有显著性差异,如果假设检验成立,A和T的值不会相差过大;最后得出的χ

以婴幼儿属性为例,首先假设婴幼儿对是否检测有影响,设为H0,同理,无影响设为H1。为了判断婴幼儿与未检测两者之间相互独立还是相关,选择四格卡方检验。先统计婴幼儿实际的已检测和未检测人员数值,再根据全体人员已检测和未检测的人数,得到核酸检测率,进而获取婴幼儿人群未检测的理论值。利用卡方检验公式计算P值,由于仅有检测和未检测两种情况,若P值算得小于

S200.采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;如图3,在本实施例的S200的具体方法包括:

S201.小区出入口的摄像头在感知到人员、车辆出入时会即时抓拍人脸信息,同时将信息回传至服务器;

S202.服务器上的人脸信息处理进程在接收到人脸信息时会将其加入队列,然后异步加载人脸信息至数据库;

S203.通过AI智能识别人脸信息,获取对应人员的身份证号、姓名信息;

S204.统计相关人员每周车辆、骑行、步行进出平均次数以及小区周边核酸检测点近一个月核酸检测次数;

S205.利用KMEANS算法将各个字段的数据分为高、中、低三类,过滤出确定属于或不属于该小区人员的信息,新增是否属于该区域字段,得到训练样本;

S206.根据贝叶斯定理计算P(x

S207.根据拉普拉斯定理对概率进行平滑处理;

S208.筛选出尚不明确是否属于该区域的人员信息,利用极大似然估计计算出属于该区域的概率P1和不属于该区域的概率P2,若P1>P2则表明该人员属于该区域;

S209.将待补充的人员信息与实有人口表信息合并,生成完整的区域实有人口信息表,帮助目标区域精细化管理。

具体的,在判断进出小区人员是否属于封控区域实施例中,利用小区出入口的智能摄像头,采集过往人员的人脸和车牌信息至数据库,然后与户籍库中的人脸进行对比获取出入人员的身份证号码等信息,以每周车辆、骑行、步行进出平均次数以及小区周边核酸检测点近一个月核酸检测次数为特征值,结合已有的小区人员信息表,根据朴素的贝叶斯分类器判断不在小区人员信息表内且被人脸采集的人员是否属于封控小区内人员。其中特征值根据KMEANS聚类算法分为高频,中频,低频三类,在得到概率后使用拉普拉斯算法修正,所用的算法公式为:

P(c|x)为朴素的贝叶斯分类器,P(c)是类先验概率,P(x|c)是类标记c的似然概率,d代表X中总共有多少样本。

对于给定的数据集,按照数据间的距离远近划分为K个簇(C

如果让簇内的点尽量紧凑,簇间的距离尽量更远,就能得到最小化平方误差E。

Dc表示训练集D中的第C类组成的集合,其中

S300.基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;如图4,在本实施例的S300的具体方法包括:

S301.获取确诊人员的身份证号、姓名信息;

S302.根据确诊人员行程信息与现有人、地、事、物、组织数据融合形成知识图谱,不同的维度的数据聚合在同一知识图谱中,图谱节点间指向是相互的;

S303.将确诊人员节点的初始值设为10,其余节点的初始值设为1,计算各个节点的RANK值;以确诊人员的RANK最低值为目标关注线,获取RANK值高于目标关注线的非确诊人员和场所信息作为目标关注对象;

S304.将目标关注对象发送给一线工作人员,助力目标人员的管控和目标区域的消杀工作。

其中,计算每个节点的RANK值,所用算法公式为:

其中,i和j分别代表某个节点i和除i外的任意一个节点,N代表图谱中节点总数,L(j)代表节点j有多少个指向节点,q代表阻尼系数,确诊人员节点的初始值为10,其他节点初始值为1,最终每个节点的Rank值由其指向节点个数及指向节点的值决定。

S400.根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。

本实施例还公开了一种目标区域数据分析系统,包括:照相采集模块、大数据组件模块、数据计算模块、知识图谱模块、消息发送模块;其中:

照相采集模块,提供了一组包含摄像头的智能硬件设备,当其感知到有人员经过时,会主动抓拍人脸信息,并利用网卡将信息回传至服务器;

大数据组件模块,能为PB级别数据提供高效的数据计算、存储和传输服务,组件采用分布式集群,多节点设备,能够保证在某地机器全部宕机的情况下数据不丢失,具有极高的容灾能力;

数据计算模块,基于SPARK计算引擎提供基于内存的高效计算服务,同时提供了丰富的机器学习算子;提供的异步队列能短时间内处理大量信息,同时能够设置调度任务合理利用服务器资源;

知识图谱模块,选用开源分布式图数据库NebulaGraph,提供了网页查询功能和丰富的API,能够高效、快速地生成知识图谱和处理多层级的数据;

消息发送模块,能够基于网卡,给手机推送邮件或短信,同时具备批量发送的能力。

本实施例公开的一种目标区域数据分析方法,包括:采用基于卡方检验的方法,对未检测人员关键属性进行判断;采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。本发明能够快速整合不同部门的数据,打破数据孤岛,同时利用高科技手段填补实有人口数据中的漏报、漏登人员,减轻基层工作人员负担,帮助政府部门有的放矢,精准管理。对于目标区域内相关人员未检测原因进行排查,助力应检尽检,进一步降低疫情传播风险,对有困难的人员能够精准帮扶。在排查密接人员和目标区域后,能够将有限的人力资源放在最紧迫,最需要的地方,使得短时间内集中力量攻坚成为可能,为尽早消灭疫情打下基础。

实施例2

本实施例还公开了一种电子设备,包括:存储器,用于存储可由处理器执行的指令;处理器,配置为执行所述指令以实现如实施例1所述的一种目标区域数据分析方法、系统及电子设备。

应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。

在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。

本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。

结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。

对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。

上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

相关技术
  • 关系型数据库数据分析能力扩展方法、系统及电子设备
  • 一种用于目标区域异常事件监控的方法及系统
  • 一种基于无线信号的室内目标活动区域识别方法及系统
  • 一种基于区域发展目标的招商政策分析优化方法及系统
  • 一种摄像区域目标的确定方法、装置及系统
  • 目标区域最优影像选择方法及系统、存储介质、电子设备
  • 目标区域最优影像选择方法及系统、存储介质、电子设备
技术分类

06120115921772