掌桥专利:专业的专利平台
掌桥专利
首页

基于多尺度洛伦兹的近红外吸收峰识别方法、系统、介质

文献发布时间:2024-04-18 20:01:55


基于多尺度洛伦兹的近红外吸收峰识别方法、系统、介质

技术领域

本发明涉及近红外光谱分析技术领域,具体涉及基于多尺度洛伦兹的近红外吸收峰识别方法、系统、介质。

背景技术

利用红外光谱对物质分子进行分析和鉴定,是通过将一束不同波长的红外射线照射到物质的分子上,其中某些特定波长的红外射线会被吸收,形成该分子的红外吸收光谱。每种分子都有由其组成和结构决定的、独有的红外吸收光谱。据此,便可以对分子进行结构分析和鉴定。近红外光谱具有无损、信息丰富、无需样品制备等优点,在食品、生物、制药、材料、半导体、环境监测等众多领域得到了广泛的应用。由于近红外吸收谱峰中包含大量物质的信息,因此谱峰识别是光谱定性分析中的关键步骤。目前,现有技术中对于谱峰识别问题已经提出了多种方法。

现有的谱峰识别方法大致可分为三类:

第一类是基于峰模型的方法,通过对信号数据进行峰模型拟合,常见的峰模型包括高斯模型、洛伦兹模型等,可以准确地获得包括峰宽度和面积在内的峰信息。但是,在复杂样品分析情况下,近红外吸收峰的形状可能会发生变化,因此无法令人满意地建模。目前假定的峰谱模型是高斯或者洛伦兹模型,但是实际观测中光谱曲线线形并不是这两种模型。

第二类是基于导数的方法,利用信号的一阶或二阶导数信息来寻找峰值。其中,一阶导数的极值点对应于信号的峰值位置,而二阶导数的零交叉点通常表示峰值的转折点。但是,信号的一阶和二阶导数的方法对光谱曲线的噪声水平敏感,要求数据光滑连续,所以对数据去噪、曲线平滑的要求很高,需要人工干涉。

第三类是连续小波变换法识别谱峰,也是目前使用较多的方法。该方法通过在小波系数矩阵中搜索谱峰引起的局部极大值所形成的脊线来识别谱峰。但是,需要确定脊线长度阈值及脊线信噪比阈值;另外,连续小波变换尺度的增量步长对于近红外峰检测来说可能太大,导致当前小波尺度下的两个重叠近红外峰在连续尺度中合并为单个峰,并增加了准确定位峰的最大位置的难度,这些问题的存在使得该方法不够稳健,不易使用,谱峰识别准确率、峰位定位准确度不高。

发明内容

本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的目的在于提出一种基于多尺度洛伦兹的近红外吸收峰识别方法、系统、介质,通过提高对近红外吸收谱峰最大位置和峰宽的定位准确度,以使得脊线更易于提取,谱峰的识别准确性更高,难度更低,运用更具稳健性。

为达到上述目的,本发明第一方面实施例提出了一种基于多尺度洛伦兹的近红外吸收峰识别方法,包括:

基于信号吸光度序列构造不同尺度的洛伦兹序列;

依据所述洛伦兹序列对所述信号吸光度序列进行滑动卷积,获取不同尺度对应的平滑序列;

依据所述平滑序列,获取局部极大值点序列;

依据预设算子对所述信号吸光度序列进行滑动卷积,获取平滑后信号吸光度序列;

依据所述局部极大值点序列以及所述平滑后信号吸光度序列,计算所述局部极大值点序列中各局部极大值点的信噪比阈值,获取各局部极大值点对应不同尺度的信噪比阈值;

在各平滑序列中,分别以各局部极大值点为中心,宽度为两倍对应尺度长度划定区间范围,并分别以区间范围内所包含的奇数点和偶数点构建对应的奇数序列和偶数序列;

依据各区间范围对应的奇数序列和偶数序列,计算各局部极大值点对应区间的采样一致性;

依据所述信噪比阈值以及所述采样一致性,对所述局部极大值点序列进行筛选;

依据筛选后的局部极大值点序列,提取峰值。

根据本发明实施例的基于多尺度洛伦兹的近红外吸收峰识别方法,据其获得的脊线比基于小波分析的脊线更容易提取;所提取得到的峰值准确性更高;更易于在近红外峰谱识别中应用,且鲁棒性更强,更具稳健性。

另外,根据本发明上述实施例提出的基于多尺度洛伦兹的近红外吸收峰识别方法,还可以具有如下附加的技术特征:

所述依据所述信噪比阈值以及所述采样一致性,对所述局部极大值点序列进行筛选,包括:

筛除所述局部极大值点序列中对应信噪比阈值小于第一阈值的局部极大值点;

筛除所述局部极大值点序列中对应区间的采样一致性小于第二阈值的局部极大值点;

筛除所述局部极大值点序列中对应信噪比阈值与对应区间的采样一致性的乘积小于第三阈值的局部极大值点。

可选地,所述近红外吸收峰识别方法还包括:

采集无光源下的光谱数据,获取本底信号i

采集获取标准准反射白板下的白板光谱数据I

依据所述本底信号i

可选地,所述基于信号吸光度序列构造不同尺度的洛伦兹序列,包括:

构造不同尺度的洛伦兹序列

其中,c为强度系数,

可选地,所述依据所述洛伦兹序列对所述信号吸光度序列进行滑动卷积,获取不同尺度对应的平滑序列,包括:

依次使用不同尺度系数的洛伦兹序列L对所述信号吸光度序列A进行滑动卷积,获取不同尺度对应的平滑序列

可选地,所述依据所述平滑序列,获取局部极大值点序列,包括:

若所述平滑序列

获取由所述平滑序列

可选地,所述依据所述局部极大值点序列以及所述平滑后信号吸光度序列,计算所述局部极大值点序列中各局部极大值点的信噪比阈值,获取各局部极大值点对应不同尺度的信噪比阈值,包括:

对所述平滑后信号吸光度序列中的元素做升序排列后,获取预设分位数q对应的元素Sq;

计算各局部极大值点对应不同尺度的信噪比阈值

其中,k为局部极大值序列

可选地,所述采样一致性的计算公式为:

其中,

为达到上述目的,本发明第二方面实施例提出了一种基于多尺度洛伦兹的近红外吸收峰识别系统,包括光谱仪和计算机可读存储介质;所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被光谱仪的处理器执行时,实现上述基于多尺度洛伦兹的近红外吸收峰识别方法。

为达到上述目的,本发明第三方面实施例提出了计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,能够实现上述基于多尺度洛伦兹的近红外吸收峰识别方法。

附图说明

图1为本发明实施例提出的一种基于多尺度洛伦兹的近红外吸收峰识别方法的流程示意图一;

图2为本发明实施例所述的洛伦兹序列示例图;

图3本发明实施例提出的一种基于多尺度洛伦兹的近红外吸收峰识别方法的流程示意图二;

图4为本发明实施例所述的基线校正后的信号吸光度序列A示例图;

图5为本发明实施例所述的不同尺度对应的平滑序列示例图;

图6为本发明实施例中提取的各个脊线位置示例图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

本发明以小波分析为核心思想提出一种基于多尺度洛伦兹的近红外吸收峰识别方法,能够对近红外吸收谱峰的最大位置和峰宽进行准确估计。在本发明实施例中,选择洛伦兹函数与原始光谱信号进行滑动卷积,峰值在各种平滑窗口宽度下显示为局部极大值;在原始信号中,局部极大值包括仪器噪声导致的伪峰和真实峰值;如果局部极大值确实是有意义的峰值的位置,那么当采用具有大平滑窗口数据的平滑策略时,它也应该是局部最大点;相反,当使用大的平滑窗口时,伪峰对应的局部极大值将消失。因此,如果平滑窗口宽度逐渐增加后所获得的局部极大值越指向真实峰值,仪器噪声导致的峰值的脊线将仅存在于狭窄的平滑窗口中。也就是说,真实峰值将出现在较长的窗口宽度序列中,即对应较长的脊线长度,并且,该脊线相较于基于小波分析的脊线更容易提取,因为同一峰值的局部极大值的位置在连续窗口之间非常接近。因此,使用本发明实施例获取的局部极大值的数量将随着窗口的增加而减少,同时仪器噪声产生的局部极大值将被过滤;另外,所获得的局部极大值优于小波分析,因为在大的小波尺度中可以保留大量的局部极大值。

为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

请参阅图1和图2。图1为本发明实施例提出的一种基于多尺度洛伦兹的近红外吸收峰识别方法的流程示意图一。如图1所示,本发明实施例所述的基于多尺度洛伦兹的近红外吸收峰识别方法,可以包括以下步骤S10至S90。

在步骤S10:基于信号吸光度序列构造不同尺度的洛伦兹序列。

其中,所述信号吸光度序列对应原始信号。构造得到的所述洛伦兹序列如图2所示。

在此,通过构造不同尺度的洛伦兹序列,以对应不同尺度的峰宽,峰宽等于洛伦兹尺度的2倍。

在步骤S20:依据所述洛伦兹序列对所述信号吸光度序列进行滑动卷积,获取不同尺度对应的平滑序列。

在此,通过对洛伦兹序列进行滑动卷积,能够对洛伦兹序列中的关键特征进行高效、准确地提取,将有助于后续的数据处理,提高处理结果的准确性。

在步骤S30:依据所述平滑序列,获取局部极大值点序列。

在本实施例中,所述局部极大值点序列基于原始信号提取得到,同时包含了噪声导致的伪峰以及真实峰值。

在步骤S40:依据预设算子对所述信号吸光度序列进行滑动卷积,获取平滑后信号吸光度序列。

在此,通过使用预设的算子对原始信号进行滑动卷积,以计算原始吸光度信号的噪音水平。

优选预设的算子为[1,-2,1],其等价于二阶差分,可以起到高通滤波的效果,也就是说,处理后剩下的是高频噪音,然后就可以评估出原始信号的噪音水平。

在步骤S50:依据所述局部极大值点序列以及所述平滑后信号吸光度序列,计算所述局部极大值点序列中各局部极大值点的信噪比阈值,获取各局部极大值点对应不同尺度的信噪比阈值。

在此,该信噪比阈值的物理意义是峰区域的面积与峰宽的比值,体现的是峰的突出程度。

在步骤S60:在各平滑序列中,分别以各局部极大值点为中心,宽度为两倍对应尺度长度划定区间范围,并分别以区间范围内所包含的奇数点和偶数点构建对应的奇数序列和偶数序列。

其中,所述的奇数点和偶数点指的是序列号为奇数或者偶数。

在此,以平滑序列对应的尺度长度两倍的宽度划定区间,因为洛伦兹尺度的两倍对应着该尺度的峰宽;而通过将区间内的数据按照序号进行交错拆分,以便后续进行区间采样一致性评估,保证评估结果的准确性。

在步骤S70:依据各区间范围对应的奇数序列和偶数序列,计算各局部极大值点对应区间的采样一致性。

在此,基于各区间的采样一致性计算来评估每个拉曼峰的形状,进而作为真伪峰判别依据之一。

在步骤S80:依据所述信噪比阈值以及所述采样一致性,对所述局部极大值点序列进行筛选。

在此,同时结合采样一致性以及信噪比阈值来综合确认局部极大值对应峰值的真伪性,将使得最后筛选得到的局部极大值点序列的精准度更高。

在步骤S90:依据筛选后的局部极大值点序列,提取峰值。

可以理解,基于更具准确性的局部极大值点而提取的峰值,其对应真实有意义的峰值位置,即所提取的峰值更准确;同时,基于本实施例获取的局部极大值点序列所进行的脊线提取,相较于小波分析方式而言将更易于提取。

请参阅图2至图4,本发明实施例基于图1实施例做进一步扩展,提供一种基于多尺度洛伦兹的近红外吸收峰识别方法。

如图3所示,本发明实施例所述的一种基于多尺度洛伦兹平滑的近红外吸收峰识别方法,具体包括以下步骤:

STEP1:采集无光源下的光谱数据,获取本底信号i0;采集获取标准准反射白板下的白板光谱数据Iw以及样本近红外反射光谱数据I0;依据所述本底信号i0、所述白板光谱数据Iw以及所述样本近红外反射光谱数据I0计算信号吸光度,获取信号吸光度序列A。

作为一具体实例,可以通过先关闭光源,采集得到光谱数据i0作为光谱仪的本底信号;之后开灯预热30分钟后分别采集标准反射白板Iw和样本近红外反射光谱I0。其中,标准白板反射率为95%。最后执行计算吸光度A操作,计算公式为:

优选还将对吸光度序列A进行基线校正。经过基线校正后的信号吸光度序列A如图4所示。

STEP2:构造不同尺度的洛伦兹序列L。

具体而言,构造方式如下:

式中c为强度系数,可以是任何正数,优选为100,以方便计算;

为信号吸光度序列中信号的序列号,x∈[1,2,3,…,98,99,100],/>

作为一具体示例,以尺度系数为2为例,得到洛伦兹序列L(

据此构造得到的不同尺度的洛伦兹序列如图2所示。

STEP3:依次使用不同尺度系数的洛伦兹序列L对信号A做滑动卷积,得到不同尺度对应的平滑序列

其中,

,*表示卷积。

作为一具体示例,不同尺度对应的平滑序列

STEP4:找到各个尺度对应的平滑序列

具体而言,所述局部极大值的获取方法为:

若所述平滑序列

STEP5:对信号A和预设算子[1,-2,1]做滑动卷积,得到平滑后信号吸光度序列S,并对所述平滑后信号吸光度序列S中的元素做升序排列后,获取预设分位数q对应的元素Sq。

具体而言,

优选分位数q取90%,比如平滑后信号吸光度序列S中的元素做升序排列后为[1,2,3,4,5,6,7,8,9,10],则S0.9为9。

STEP6:计算各局部极大值点对应不同尺度的信噪比阈值ASNR。

具体而言,对于平滑序列

其中,k为局部极大值序列

STEP7:通过区间采样一致性来评估每个近红外吸收峰的形状。

具体而言,将平滑序列

其中,

STEP8:对局部极大值k进行筛选,k∈

具体而言,筛选规则为:

a.

b.

c.

如果满足以上a、b、c三条中的任何一条,则在局部极大值序列

STEP9:依据经过筛选后的局部极大值序列

作为一具体示例,提取得到的各个脊线位置如图6所示中标三角的位置,即各个波峰的位置。

本发明的实施例基于上述实施例,还提供基于多尺度洛伦兹的近红外吸收峰识别系统,包括光谱仪和计算机可读存储介质;所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被光谱仪的处理器执行时,实现上述任一实施例所述的基于多尺度洛伦兹平滑的近红外吸收峰识别方法。具体的方法步骤在此不进行复述,详情请参阅上述实施例的记载。

本发明的实施例基于上述实施例,还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,能够实现上述任一实施例所述的基于多尺度洛伦兹的近红外吸收峰识别方法。具体的方法步骤在此不进行复述,详情请参阅上述实施例的记载。

本实施例区别于现有的三大类寻峰算法在近红外峰谱识别应用中存在不够稳健、不易使用、谱峰识别准确率、峰位定位准确度不高等问题。本发明提供的基于多尺度洛伦兹平滑的近红外吸收峰识别方案,据其获得的脊线比基于小波分析的脊线更容易提取;所提取得到的峰值准确性更高;更易于在近红外峰谱识别中应用,且鲁棒性更强,更具稳健性。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征 “上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术分类

06120116575973