掌桥专利:专业的专利平台
掌桥专利
首页

光谱装置和方法

文献发布时间:2023-06-19 11:11:32


光谱装置和方法

技术领域

本发明涉及一种光谱装置以及方法。本发明在拉曼光谱法中尤其有用,尽管本发明也可以用于其他形式的光谱法,例如,窄线光致发光、荧光、阴极发光、UV可见光(UVVis)、核磁共振(NMR)、中红外光(mid-IR)或近红外光(NIR)。

背景技术

拉曼效应是样品对光的非弹性散射。在拉曼光谱法中,样品被单色激光照射,并且之后散射光被例如单色仪中的色散设备(诸如衍射光栅)色散,以生成被称为拉曼光谱的光谱。拉曼光谱由诸如电荷耦合器件(CCD)等检测器检测以生成光谱数据。拉曼光谱装置的示例从美国专利号5,442,438和5,510,894中得知,这些美国专利通过引用并入本文。

不同的化合物具有不同特性的拉曼光谱。因此,拉曼效应可以用于分析样品中存在的化合物。

光谱数据包括拉曼光谱以及噪声。噪声的存在会影响对拉曼信号的分析。例如,如果该分析包括确定信号内峰下方的区域,则噪声的存在会使得难以识别合适的基线(根据该基线确定该区域)。图1是包含拉曼光谱峰和噪声的光谱数据的示例。如可以看到的,噪声的存在使光谱峰变得模糊。

Savitzky-Golay滤波器是数字滤波器,该滤波器可以应用于一组数字数据点以对数据进行平滑处理,即在不使信号发生很大失真的情况下提高信噪比。然而,这样的平滑处理技术不适合用于具有尖锐峰的光谱信号,因为Savitzky-Golay平滑处理往往会去除尖锐的光谱峰以及不想要的噪声。

发明内容

根据本发明的第一方面,提供了一种对由光谱仪记录的光谱数据进行平滑处理的方法,该方法包括:将多条样条曲线相继拟合到该光谱数据,每条样条曲线具有不同数量的节点,其中,在每条样条曲线中,除端点节点之外的每个节点的节点位置都是基于这些样条曲线中之前拟合的具有较少节点的样条曲线的点与该光谱数据的拟合度来确定的;以及基于模型选择标准来选择这些样条曲线之一作为该光谱数据的平滑数据曲线。

以这种方式,基于光谱数据的局部信息内容来调整节点之间的间距,从而将尖锐的光谱峰保留在平滑数据曲线中,而将同等尖锐的噪声去除。

本文所使用的术语“样条曲线”指的是由一个或多个多项式分段定义的函数。每个多项式在被称为节点的两个点之间延伸。该多条样条曲线中的每条样条曲线中的节点总数量可以在2(即,只有两个端点节点)至N/K之间,其中,N是光谱数据中数据点的总数量,并且K是允许的最小节点分隔、单位为点。通常,K大于1并且优选地在2至10之间。端点节点是位于样条曲线两端的节点,所有多项式都在这些端点节点之间拟合。

节点位置可以对应于这些样条曲线中之前拟合的样条曲线的拟合不佳的点的位置,如使用拟合度所确定的。拟合不佳的点可以是具有不是所有点中的最佳拟合的拟合的点、属于50%最差拟合点之一、并且优选地10%最差拟合点之一的点、以及优选地是最差的拟合点,如由针对该节点的允许位置的拟合度所确定的。可以针对节点的位置规定一个或多个限制。例如,节点位置的允许位置可以是与先前拟合的样条曲线的节点相距超过预定数量(诸如1个、2个、3个或更多)的数据点的位置。这确保了存在最小节点分隔距离。

模型选择标准可以是随着样条曲线与光谱数据的拟合似然而增加、但是与用于以节点的形式添加参数的惩罚相平衡的度量,诸如贝叶斯信息标准或赤池信息标准。以这种方式,过度拟合得以减轻。

该多条样条曲线中的样条曲线可以具有2至N/K个节点,并且该方法包括确定该多条样条曲线中的哪条样条曲线导致模型选择标准的极值(对BIC和AIC而言是最小值)。

该方法可以包括将该多条样条曲线中的每一条样条曲线相继拟合到该光谱数据,从具有最少数量的节点的样条曲线开始,并且到具有最多数量的节点的样条曲线结束。每条相继拟合的样条曲线都可以比紧接在前的拟合到该光谱数据的样条曲线的再多(仅)一个节点。为每条相继拟合的样条曲线添加的节点的位置可以对应于该紧接在前的样条曲线的拟合不佳的点的位置。

替代性地,每条相继拟合的曲线可以相对于该紧接在前的拟合的样条曲线所使用的节点添加或减去随机数量的节点(尽管可以保留以下要求:节点的总数量量必须在2至N/K之间)。

拟合的样条曲线的每个点的拟合度可以是基于该点与该光谱数据中的对应点之间的差异(例如残差)。然而,应当理解,每个点的拟合度可以不是单独基于该点,而是可以基于拟合的样条曲线的其他点(诸如相邻的(或间接相邻的)点或所有先前的点))与该光谱数据中的对应点之间的残差。例如,节点位置可以通过将平滑处理算法(诸如Savitzky-Golay滤波器)应用于先前拟合的样条曲线的所有点的残差以生成残差平滑曲线来确定,其中,节点位置对应于该残差平滑曲线上的最大值的点。在替代性实施例中,每个点的拟合度可以根据沿着这些点不断前进时对该点的残差的累积和来确定。节点位置对应于该残差的累积和曲线上的最大值的点。将其他点的残差考虑在内可以用于降低节点位于峰顶的似然。将节点定位在峰顶或峰顶附近会导致该区域缺少平滑性。使用这样的拟合度,“最差”拟合点不可能是导致与光谱数据的最大残差的点,并且因此不可能是峰顶处的点。

该方法可以包括从对该平滑数据曲线的分析中识别出生成该光谱数据的样品的性质。该方法可以包括识别该样品中存在的一种或多种组分。该方法可以包括确定该平滑数据曲线的曲线下方的区域以识别该样品中的组分的性质(诸如浓度)。该方法可以包括基于从该平滑数据曲线中识别出的该样品的性质来生成该样品的图。

该方法可以包括例如在显示器上输出该平滑数据曲线作为代表该样品的光谱。例如,用户能够更容易地从该平滑数据曲线在视觉上识别出该样品中存在的一种或多种组分。

该方法可以包括基于该平滑数据曲线搜索组分光谱库。

该方法可以包括对该平滑数据曲线进行分析以识别该样品的性质,以及基于所识别的性质来控制过程和/或对该样品进行进一步处理。例如,该过程可以是制造过程。该样品可以是一个或多个所制造的产品的样品,并且所识别的性质可以用于确定所制造的产品是否满足所要求的规格。如果未满足所要求的规格,则可能需要调整过程,使得按照所要求的规格来制造产品。该样品可以是组织样品并且该过程可以是对提供该组织样品的患者的治疗。该方法可以用作检查程序(例如安全程序或质量控制程序)的一部分,该检查程序包括基于对该平滑数据曲线的分析而生成警报。

根据本发明的第二方面,提供了一种被布置用于执行本发明的第一方面的方法的处理器。

根据本发明的第三方面,提供了一种光谱仪系统,该光谱仪系统包括用于从样品获得光谱数据的光谱仪以及根据本发明的第二方面的处理器。

根据本发明的第四方面,提供了一种具有存储在其上的指令的数据载体,这些指令在被处理执行时使该处理执行本发明的第一方面的方法。

该数据载体可以是非瞬态数据载体,诸如易失性存储器(例如RAM)、非易失性存储器(例如ROM)、闪存和数据存储设备(诸如硬盘、光盘)、或者瞬态数据载体(诸如电子信号或光信号)。

附图说明

图1示出了由拉曼光谱仪记录的、包括拉曼光谱和噪声的光谱数据;

图2是示出了本发明的实施例的流程图;

图3示出了根据图1所示的光谱数据生成的平滑数据曲线;

图4a示出了样品的图,该图基于对由样品上的不同点生成的非平滑光谱数据的分析,并且图4b示出了对应的图,在这个图中,分析是对光谱数据的平滑数据曲线执行的;

图5示出了光谱数据与使用第一拟合度确定的平滑数据曲线的重叠情况,其中,示出了节点位置;以及

图6示出了光谱数据与使用第二拟合度确定的平滑数据曲线的重叠情况,其中,示出了节点位置。

具体实施方式

参照图2,本发明的实施例包括例如通过计算机接收101由光谱仪记录的光谱数据。光谱数据可以是由拉曼光谱仪生成的数据。图1展示了可以被接收的该类型的光谱数据,该光谱数据包括对每个波数(拉曼位移)的计数数量,这些计数是在该波数处收集的光的强度的测量值。该光谱数据包括光谱信息和噪声。该拉曼光谱仪可以是根据WO 2012/156667中所描述的,该专利通过引用并入本文。

计算机对光谱数据进行处理,以生成代表没有噪声的光谱数据的平滑数据曲线。生成平滑数据的方法包括将具有不同数量的节点的多条样条曲线相继拟合103到光谱数据。该多条样条曲线中的每条样条曲线具有范围从2至N/K变化的节点数量n,其中,N是光谱数据中的数据点的总数量,并且K是节点之间的最小分隔距离、单位为点。模型选择值是根据模型选择标准针对每条样条曲线进行计算104得出的。在该实施例中,模型选择值是使用以下给出的贝叶斯信息标准(BIC)计算出的BIC值:-

其中,

然后,返回108具有最低BIC值的样条曲线作为光谱数据的平滑数据曲线。

在该实施例中,该算法通过拟合103具有位于光谱数据的端点处的两个节点的第一样条曲线开始。计算104拟合的第一样条曲线的BIC值。如果节点的数量被确定105为小于N/K,则根据拟合度确定106第一样条曲线最差的拟合点。

在第一实施例中,每个点的拟合度是样条曲线上的该点与光谱数据中的对应点之间的残差。被视为额外节点的候选位置的点中具有最大残差的点被认为是最差的拟合点。然后,下一条样条曲线的额外节点的节点位置被指定为该最差的拟合点的波数位置。可以设置节点的最小分隔距离。因此,只有与现有节点的距离在最小阈值距离(数据点的数量)之外的点可以被视为额外节点的候选位置。最小分隔距离可以是可由用户选择的,但是通常该距离将大于0(使得这两个节点不会位于同一位置)。已经发现最小分隔距离为3是有效的,即K=3。

与第一样条曲线一样,将具有额外节点的下一条样条曲线拟合103到光谱数据,并且计算104该拟合的样条曲线的BIC。

然后,重复103到107的该循环,使得将具有不同数量的节点的另外的样条曲线拟合到光谱数据,并且计算BIC值,直到已经将具有N/K个节点的样条曲线拟合到光谱数据为止。

在步骤108中,将该多条样条曲线中具有最低BIC值的样条曲线输出作为光谱数据的平滑数据曲线。

该平滑数据曲线可以显示给用户和/或被用于分析生成该光谱数据的样品。使用平滑数据曲线进行分析并生成样品的表示可以产生对感兴趣信息的更清晰和/或更准确的表示。

图4a和图4b展示了根据由样品生成的相同拉曼光谱数据而生成的图201、202。光谱数据的图201、202叠加在样品的较大白光图像上。这些图表示样品上不同的点在989nm至1019nm之间的拉曼峰下方的区域。图1和图3展示了感兴趣的峰。图4a是根据原始光谱数据生成的图,而图4b是根据从光谱数据生成的平滑数据曲线而生成的图。如可以看到的,这两个图基本上是不相同的。为了确定拉曼峰,设置与背景辐射源相对应的基线。然而,信号中的噪声可能使该基线的位置产生不确定性。基线定位的不一致可能导致计算出的峰下方的区域的变化,并且因此产生该样品的非代表性绘图。通过对曲线进行平滑处理来去除噪声减轻了该问题,并且可以产生更能代表样品组分的绘图。

图5示出了光谱数据、根据上述实施例生成的平滑数据曲线、平滑数据曲线与光谱数据之间的残差、以及节点位置(被称为锚点)。如可以看到的,对于该示例,多个节点位于与光谱峰重合的位置。这会导致不自然的形状(诸如图5中所示的扭结)。为了减轻该问题,可以使用不同的拟合度来降低光谱峰的顶部被识别为节点位置的似然。例如,可以根据残差的平滑曲线(本文中称为“残差平滑曲线”)确定每个点的拟合度。这样的残差平滑曲线可以通过将平滑处理算法(诸如Savitzky-Golay滤波器)应用于先前拟合的样条曲线的所有点的残差来生成。额外节点的节点位置可以对应于残差平滑曲线上的最大值的点。

图6示出了光谱数据和根据度量生成的平滑数据曲线,其中,每个点的拟合度取决于其他点以及感兴趣点的残差。图6还示出了平滑数据曲线与光谱数据之间的残差,以及节点位置(被称为锚点)。如可以看到的,使用该替代性的拟合度可以使节点的位置远离光谱峰的顶部,并且因此使平滑数据曲线中的峰形更平滑。

应当理解,在不背离如本文所限定的本发明的情况下,可以对上述实施例进行修改和变更。

相关技术
  • 包括多个传感器的光谱学装置的校准方法和从至少两个经校准光谱学装置获得的光谱信息的传递方法
  • 光谱决定装置、光谱决定方法、光谱决定程序、照明系统、照明装置以及检查装置
技术分类

06120112831324