掌桥专利:专业的专利平台
掌桥专利
首页

一种生物气溶胶用智能监测方法及系统

文献发布时间:2024-04-18 19:58:21


一种生物气溶胶用智能监测方法及系统

技术领域

本发明涉及数据处理技术领域,具体涉及一种生物气溶胶用智能监测方法及系统。

背景技术

生物气溶胶是悬浮在空气中的微小生物颗粒,包括细菌、真菌、病毒等,生物气溶胶的存在可以影响室内空气质量,特别是在目标环境下,不仅可以影响人类健康,还可能对动物和植物造成损害。通过监测生物气溶胶的颗粒数量,可以用于环境监测,并且对部分微生物的存在和分布分析有助于获得生态系统和生物多样性的信息,以及追踪疾病的传播途径和范围,并及时采取措施来控制传染病的传播。

在常规的生物气溶胶的智能监测中使用k-means聚类算法通过获取标准数据类簇的检测空间进行异常监测的,但是由于生物气溶胶在空气中受温度、湿度和风向的影响导致对生物气溶胶监测到的数据使用k-means聚类算法获取到的标准数据类簇的检测空间不准确,因此需要对其进行修正处理。

发明内容

本发明提供一种生物气溶胶用智能监测方法及系统,以解决现有的问题。

本发明的一种生物气溶胶用智能监测方法及系统采用如下技术方案:

本发明一个实施例提供了一种生物气溶胶用智能监测方法,该方法包括以下步骤:

采集生物气溶胶的实时监测数据;

对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,根据标准化后的监测数据构建监测空间,对标准化后的监测数据进行聚类得到类簇;

根据实时监测数据和监测空间得到每个数据点的时序聚类权重,根据类簇中的数据和监测空间得到每个数据点在每个类簇中的分布聚类权重,根据每个数据点的时序聚类权重和每个数据点在每个类簇中的分布聚类权重得到每个数据点到聚类中心点的第二聚类距离;

根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,根据异常监测参数进行对生物气溶胶的实时监测数据进行监测分析。

进一步地,所述根据标准化后的监测数据构建监测空间,包括的具体步骤如下:

实时监测数据包括每个时刻每种颗粒物的浓度和大小分布;

以颗粒物的浓度为横轴,以颗粒物的大小分布为纵轴建立坐标系获取生物气溶胶的监测空间。

进一步地,所述对标准化后的监测数据进行聚类得到类簇,包括的具体步骤如下:

使用PCA算法对标准化后的监测数据进行降维得到降维后的每个时刻的主成分颗粒物;

对每个时刻中的所有主成分颗粒物数据点进行聚类,得到类簇;其中,对每个时刻的数据聚成K个类簇,K为预设阈值。

进一步地,所述每个数据点的时序聚类权重的具体获取步骤如下:

每个数据点的时序聚类权重的公式为:

式中,c

进一步地,相邻时刻的数据点在监测空间中包含的数据点的个数,包括的具体步骤如下:

相邻时刻的数据点在监测空间中包含的数据点的个数为:对相邻时刻的数据点在横向和纵向进行延伸,获取相邻时刻的数据点延伸后相交的两个点,记为标记点,根据相邻时刻的两个数据点和两个标记点构成一个平面区间,将该平面区间中的数据点记为相邻时刻的数据点在监测空间中包含的数据点,统计平面区间中的数据点个数即可得到相邻时刻的数据点在监测空间中包含的数据点的个数。

进一步地,所述每个数据点在每个类簇中的分布聚类权重的具体获取步骤如下:

每个数据点聚类在每个类簇中的分布聚类权重的公式为:

式中,X

进一步地,所述每个数据点到聚类中心点的第二聚类距离,包括的具体步骤如下:

每个数据点到聚类中心的第二聚类距离的公式为:

式中,ω

进一步地,所述根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,包括的具体步骤如下:

依据每个数据点到聚类中心点的第二聚类距离通过k-means算法对所有实时监测数据分别对每个时刻内的数据点进行聚类,得到每个时刻的K个类簇;选取包含数据点个数最多的一个类簇作为标准数据簇,获取标准数据簇中的聚类中心点和所有数据点到聚类中心点的平均距离作为异常监测参数。

进一步地,所述根据异常监测参数进行对采集的生物气溶胶监测数据进行监测分析,包括的具体步骤如下:

以异常监测参数中标准数据簇的聚类中心点为圆心,以异常监测参数中的所有数据点到聚类中心点的平均距离为半径获取异常监测区域,根据异常监测区域去判断每次不同类型颗粒物在每个时刻获取到的数据点是否为正常数据,当数据点在异常监测区域,则判定获取到的数据为正常数据,当数据点不在异常监测区域,则判定获取到的数据异常数据。

本发明还提供了一种生物气溶胶用智能监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项步骤。

本发明的技术方案的有益效果是:本发明通过对生物气溶胶的实时监测数据在空间维度和时间度上的分析,得到每个数据点在空间维度的分布聚类权重和时间维度的时序聚类权重,提高了数据在进行聚类时的实际复杂性;在根据每个数据点的分布聚类权重和时序聚类权重对每个数据点到聚类中心点的距离进行修正,得到每个数据点到聚类中心的第二聚类距离,提高了实时监测数据在进行监测的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一种生物气溶胶用智能监测方法的步骤流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种生物气溶胶用智能监测方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种生物气溶胶用智能监测方法及系统的具体方案。

请参阅图1,其示出了本发明一个实施例提供的一种生物气溶胶用智能监测方法的步骤流程图,该方法包括以下步骤:

步骤S001:采集生物气溶胶的实时监测数据。

需要说明的是,本实施例主要通过历史的生物气溶胶数据获得每种类型颗粒的正常分布,根据正常分布构建异常检测模型,因此首先需要采集构建模型的数据基础。为了分析每种类型颗粒物的在空气中的含量与监测的差异大小,本实施例需要采集空气中每种类型颗粒物的浓度和大小分布,以此来进行分析。

具体地,本实施例采用空气采样器持续采集空气中每种类型颗粒物的浓度和大小分布,以5分钟为时间间隔进行采集,即每5分钟获取每种类型颗粒物的浓度和大小分布,获取24小时内的所有数据,将24小时内监测到的所有数据记为生物气溶胶的实时监测数据。其中,此处说的颗粒物的大小分布表示粒径分布大小,即颗粒物直径的大小情况;其获取粒径分布大小还需要结合粒子计算器来获取。

至此,得到生物气溶胶的实时监测数据,和每个时刻每种类型颗粒物的浓度和大小分布。

步骤S002:对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,根据标准化后的监测数据构建监测空间,对标准化后的监测数据进行聚类得到类簇。

需要说明的是,由于不同类型的颗粒产生的数据量不同,在构建异常检测模型时需要以每个时刻的主成分颗粒分析,结合PCA算法获得每个时刻的主成分颗粒,降低数据的处理难度;在降低数据量后,使用每个时刻的数据构建检测空间,根据空间内数据的分布特征以及在时序的分布特征,获得每个时刻数据的聚类权重,根据聚类权重结合k-means算法获得异常检测模型。

进一步需要说明的是,为了消除不同因素之间由于单位的不同导致出现的误差,使不同来源和类型的数据能够进行有效的比较、分析和整合,本实施例需要对所有的数据进行标准化。

具体地,对生物气溶胶的实时监测数据进行标准化获得标准化后的监测数据,得到标准化后的监测数据;其中标准归一化的方法使用线性归一化方法。

需要说明的是,为了简化数据,使其更易于处理和分析,同时提取出数据的主要特征,帮助提高计算效率、改善模型性能,并且提供更好的可视化和解释能力,本实施例通过降维的方式减小数据量,提高运算速率。

具体地,使用PCA算法对标准化后的数据进行降维得到降维后的每个时刻的主成分颗粒物,其中,每个时刻的主成分颗粒物是相同的。

以颗粒物的浓度为横轴,以颗粒物的大小分布为纵轴建立坐标系获取生物气溶胶的监测空间。

预设一个阈值K,其中本实施例以K=5为例进行叙述,本实施例不进行具体限定,其中K可根据具体实施情况而定。对每个时刻中的所有数据点进行聚类,得到类簇。其中,对每个时刻的数据聚成K个类簇。

步骤S003:根据实时监测数据和监测空间得到每个数据点的时序聚类权重,根据类簇中的数据和监测空间得到每个数据点在每个类簇中的分布聚类权重,根据每个数据点的时序聚类权重和每个数据点在每个类簇中的分布聚类权重得到每个数据点到聚类中心点的第二聚类距离。

需要说明的是,主成分颗粒物数据能代表所有颗粒分布数据的主要特征,若采集的监测数据为正常的,那么所有主成分颗粒物数据在应分布位于一个特定的范围之内,因此可以使用k-means算法对数据空间内的主成分颗粒物数据点聚类,获得标准数据簇。但在k-means算法聚类过程中,由于k-means算法所求为全局最优解,使得聚类结果的所有簇的数据含量近似,而标准数据簇需要包含绝大部分正常数据用于构建异常检测模型,造成聚类结果相较于标准数据簇的数据量减小,异常检测模型无法包含绝大多数正常数据。因此,本实施例根据每个主成分颗粒物数据点在时序和分布的特征上获得聚类权重来进行修正。其中,标准数据簇就是包含数据量更多的一个类簇。

(1)获取每个数据点的时序聚类权重。

进一步需要说明的是,若采集的同一种类型颗粒物在相邻时刻的两个数据点均为正常数据,那么映射到监测空间后,相邻数据点的距离近似或相邻时刻数据点的空间距离之间所包含的数据量较多,那么越可能说明这两个数据点所处的位置处于标准数据簇中,则该数据点越需要聚簇到标准数据簇中。

具体地,获取同一种类型颗粒物在相邻时刻对应的数据点在监测空间中包含的数据点的个数,表示为c

其中,相邻时刻的数据点在监测空间中包含的数据点的个数为:对相邻时刻的数据点在横向和纵向进行延伸,获取相邻时刻的数据点延伸后相交的两个点,记为标记点,根据相邻时刻的两个数据点和两个标记点构成一个平面区间,将该平面区间中的数据点记为相邻时刻的数据点在监测空间中包含的数据点,统计平面区间中的数据点个数即可得到相邻时刻的数据点在监测空间中包含的数据点的个数。

再获取同一种类型颗粒物在相邻时刻对应的数据点在监测空间中的欧式距离。其中,每个主成分颗粒物就是同一种类型颗粒物。

根据相邻时刻在监测空间中包含的数据点的个数和相邻时刻对应的数据点在监测空间中的欧式距离得到每种主成分颗粒物在每个时刻的数据点的时序聚类权重,用公式表示为:

式中,c

其中,max{c

至此,得到每个主成分颗粒物在每个时刻的数据点的时序聚类权重。

(2)获取每个数据点聚类在每个类簇中的分布聚类权重。

需要说明的是,在进行k-means算法聚类时,当一个数据点越趋近于聚类中心点,即数据点的分布越靠近聚类中心点,表示数据点越是所属类簇中的数据点,则在进行聚类时给数据点给予的权重应该更大;又由于横轴和纵轴上都存在差异的,所以对于每个类簇中的数据点分别以横轴和纵轴进行分析,获取水平方向和竖直方向的偏度,来得到数据点给予的分布聚类权重。

具体地,根据每个数据点与类簇中心点之间在监测空间中包含的数据点的个数和水平方向和竖直方向的偏度得到每个数据点在分布特征上的分布聚类权重,用公式表示为:

式中,X

其中,

至此,得到每个主成分颗粒物在每个时刻的数据点聚类在每个类簇中的分布聚类权重。

(3)根据每个数据点在时序特征上的时序聚类权重和分布聚类权重得到每个数据点到聚类中心的第二聚类距离。

需要说明的是,通过在时序特征和分布特征上的分析,为了对每个数据点在聚类时更加的准确,则根据每个数据点的分布聚类权重和时序聚类权重,对每个数据点到每个聚类中心的距离加上权重,获得修正后的聚类距离。

具体地,根据每个数据点的时序聚类权重和每个数据点的分布聚类权重对每个数据点到聚类中心点的距离进行修正得到修正后每个数据点到聚类中心点的第二聚类距离,用公式表示为:

式中,ω

其中,当

至此,得到每个数据点到聚类中心点的第二聚类距离。

步骤S004:根据每个数据点到聚类中心点的第二聚类距离进行聚类得到异常监测参数,根据异常监测参数进行对采集的生物气溶胶监测数据进行监测分析。

通过k-means算法对24小时内的所有实时监测数据分别对每个时刻内的数据点进行聚类,在聚类时根据每个数据点到聚类中心点的第二聚类距离进行聚类,得到每个时刻的K个类簇。选取包含数据点个数最多的一个类簇作为标准数据簇,获取标准数据簇中的聚类中心点和所有数据点到聚类中心点的平均距离作为异常监测参数。

以异常监测参数中的聚类中心点为圆心,以异常监测参数中的所有数据点到聚类中心点的平均距离为半径获取异常监测区域,根据异常监测区域去判断每次不同类型颗粒物在每个时刻获取到的数据点是否为正常数据,当数据点在异常监测区域,则判定获取到的数据为正常数据,当数据点不在异常监测区域,则判定获取到的数据异常数据。

本实施例提供了一种生物气溶胶用智能监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现步骤S001至步骤S004。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于物联网的牲畜生理指标智能监测系统及监测方法
  • 一种基于mems传感器的基坑智能监测方法及监测系统
  • 一种智能水位监测系统及易积水区域的监测方法
  • 一种风力发电机联轴器对中状态智能监测系统及方法
  • 一种智能脱轨器状态监测系统及其组网通信方法
  • 基于ATP生物化学发光的生物气溶胶在线监测系统及方法
  • 基于悬浮光镊的纳米颗粒消光截面原位测量方法及装置
技术分类

06120116482159