掌桥专利:专业的专利平台
掌桥专利
首页

飞行时间质谱分析

文献发布时间:2024-04-18 19:44:28


飞行时间质谱分析

技术领域

本发明涉及分析离子的方法,并且具体地涉及飞行时间质谱分析法(ToF-MS)和飞行时间(ToF)分析仪。

背景技术

飞行时间(ToF)质量分析仪利用了离子在静电场中的行进时间正比于离子的质荷比(m/z)的平方根的特性。离子从离子源喷射,加速到期望能量,并在行进指定距离后撞击到离子检测器上。由检测器生成的信号被记录,并且通常导致由具有相同质荷比(m/z)的离子生成的时间分辨峰。由于针对所有离子的行进距离基本上相同,因此离子的到达时间用于确定其质荷比(m/z),该质荷比稍后可用于标识。

ToF质量分析仪通常以大约100Hz和10kHz之间的速率记录谱,其中每个谱可能包含数百或数千个不同的离子峰。可期望实时分析这些谱,例如以便可基于分析结果设置后续扫描的参数。

拒信针对飞行时间质量分析的装置和方法仍有改进的余地。

发明内容

第一方面提供了一种分析由离子分析仪生成的数据的方法,该方法包括:

(i)接收由该离子分析仪生成的数据片段,其中该数据片段包括与第一到达时间范围相关联的数据;

(ii)对该数据片段应用滤波器,以产生该数据片段的经滤波版本,其中与该滤波器相关联的宽度被配置为取决于该离子分析仪针对该第一到达时间范围内的到达时间的预期离子到达时间分布的宽度;

(iii)标识该数据片段的该经滤波版本中的一个或多个离子峰;以及然后

(iv)确定该一个或多个所标识的离子峰中的每个离子峰的一个或多个特性。

实施方案提供了分析由离子分析仪,诸如飞行时间质量分析仪生成的数据的方法。离子分析仪可包括布置在离子路径端部处的离子检测器。离子包可被注入到离子路径中,于是离子可沿离子路径行进到检测器以进行检测。检测器可被配置为产生指示在检测器处接收的离子强度作为(到达)时间的函数的信号。该信号可被数字化以产生数字样本的集合,其中每个样本包括强度值并且与相应的到达时间相关联。信号和/或样本集合(以及与信号和/或样本集合相关联的到达时间)可跨越针对产生信号的特定离子包的到达时间范围中的大部分或全部。

在该方法中,通过(单独地)处理信号和/或集合被分成的一个或多个片段中的每个片段,来处理每个信号和/或样本集合(由于相应的离子包而生成)。例如,每个片段可包括关于离子包生成的(整个)样本集合的样本子集。每个片段可包括(连续的)样本集,其中针对该片段的样本的到达时间都在该片段的相应的到达时间范围内。针对一个或多个片段中的每个片段的每个到达时间范围可以是产生信号的特定离子包的(整个)到达时间范围的子范围。

在该方法中,通过对数据段应用滤波器来(单独地)处理每个数据片段。关于每个片段选择与滤波器相关联的宽度(诸如平滑核的宽度或小波的宽度),例如,使得该宽度对于信号和/或样本集合被分成的每个不同片段是不同的。具体地,该宽度被配置为取决于针对到达时间在与该片段相关联的到达时间范围内的离子的预期离子到达时间分布的宽度。预期到达时间分布的宽度通常取决于到达时间本身,并且因此与针对每个片段的滤波器相关联的宽度可取决于(例如,可正比于)与该片段相关联的到达时间范围,并且具体地可取决于(例如,可正比于)与该片段相关联的平均到达时间。

在片段已经以此方式滤波之后,该片段的经滤波版本用于标识该片段内的一个或多个离子峰,并且然后所标识的离子峰中的每个离子峰的一个或多个特性(例如,其质心、强度和/或面积等)是例如通过将合适的离子峰模型拟合到原始未滤波片段(和/或该片段的经滤波版本)来确定的。

如将在下文更详细描述的,在由离子检测器记录的单独离子峰的宽度可能小于针对特定离子种类的预期离子到达时间分布的宽度的情况下,使用宽度取决于针对该片段的预期离子到达时间分布的宽度的滤波器滤波每个片段是特别有利的。在检测器处的离子通量相对低的这些情况下,由于相同种类的单独离子以略微不同的到达时间到达检测器,这些到达时间在针对该种类的预期到达时间分布内,离子检测器可产生关于单个离子种类的多模态信号。信号中此类多模态峰的存在可能导致信号中多个不同离子峰的标识,其然后可能被错误地标识为属于多个不同离子种类。

在实施方案中,滤波器具有将由相同种类的离子产生的多模态信号平滑成单模态信号的效果,同时保留由不同种类的离子产生的任何多模态信号。这然后确保了数据片段的经滤波版本将(通常)仅包括关于每个离子种类的一个离子峰。这进而允许存在于特定离子包内的离子种类的经改进的标识和表征。

此外,如将在下文更详细描述的,该方法的各个步骤都是在计算上相对廉价的,并且可以高效的方式实施。这允许实时进行离子峰的标识和表征,即使是在以相对高的速率(>100Hz)产生谱的情况下,飞行时间质量分析仪通常也是如此。

因此,实施方案提供了一种分析由离子分析仪生成的数据的经改进方法,该经改进方法在准确地标识和表征离子峰方面特别稳健,并且可实时运行,即,与以高速率(>100Hz)的数据集合并行运行。

离子分析仪可以是任何合适的离子分析仪,诸如被配置为从离子的到达时间确定这些离子的质荷比(m/z)的飞行时间(ToF)质量分析仪,或被配置为从离子的到达时间确定这些离子的离子迁移率的离子迁移率分析仪。

在具体实施方案中,离子分析仪是多反射飞行时间(MR-ToF)分析仪,诸如例如美国专利号9,136,101中描述的类型的倾斜镜型多反射飞行时间质量分析仪,或例如英国专利号2,580,089中描述的类型的单聚焦透镜型多反射飞行时间质量分析仪。

离子分析仪可形成分析仪器的一部分。分析仪器可以是质谱仪、离子迁移率谱仪或两者的组合(例如包括离子迁移率分离器的质谱仪)。该仪器可包括离子源。离子可从离子源中的样品生成。离子可经由布置在离子源和分析仪之间的一个或多个离子光学设备从离子源传递到分析仪。

一个或多个离子光学设备可包括一个或多个离子导向器、一个或多个透镜、一个或多个栅极等的任何合适的布置。一个或多个离子光学设备可包括用于转移离子的一个或多个离子转移导向器,和/或用于质量选择离子的一个或多个质量选择器或滤波器,和/或用于冷却离子的一个或多个离子冷却离子导向器,和/或用于分裂或反应离子的一个或多个碰撞单元或反应单元等。一个或多个或每个离子导向器可包括RF离子导向器,诸如多极离子导向器(例如四极离子导向器、六极离子导向器等)、分段多极离子导向器、堆叠环形离子导向器等。

离子分析仪可包括布置在离子路径起点处的离子注入器和布置在离子路径终点处的离子检测器。离子分析仪可被配置为通过确定离子在检测器处的到达时间(即,离子从注入器行进并经由离子路径到达检测器所花费的时间)来分析离子。

离子注入器可以是任何合适的形式,诸如例如离子阱,或一个或多个(例如,正交的)加速电极。离子注入器可被配置为接收离子(经由一个或多个离子光学设备从离子源),并且可任选地被配置为积累离子包(例如,通过在积累时间段期间积累离子)。离子注入器可被配置为将(所接收的和/或所积累的)离子包注入离子路径(例如,通过沿离子路径加速离子包),于是包的离子可沿着离子路径行进到检测器。

检测器可以是任何合适的离子检测器,诸如一个或多个转换倍增电极,任选地然后一个或多个电子倍增器、一个或多个闪烁器和/或一个或多个光子倍增器等。检测器可被配置为检测在检测器处接收的离子,并且可被配置为产生指示在检测器处接收的离子强度作为(到达)时间的函数的信号。

每个信号都是由(单个)离子包产生的。多个此类离子包可被按顺序注入到离子路径中,并由检测器检测。因此,该方法可重复地包括:(i)将离子包注入到离子路径中,(ii)在检测器处检测离子包,以及(iii)针对离子包产生相应的信号。离子包可以任何期望的速率注入到离子路径中(并且可产生信号),诸如以大于大约100Hz并且小于大约10kHz的速率,例如大约200Hz。每个信号将具有与其相关联的相应的离子到达时间范围。

检测器可包括数字化器,诸如时间-数字转换器(TDC)或模数转换器(ADC),其可被配置为数字化每个信号,以产生数字样本的集合。数字化器可具有单个通道或多个通道,例如,来自检测器的信号在第一高增益通道和第二低增益通道之间拆分(以增加动态范围)。

数字样本的每个集合可从关于单个离子包的信号中产生。因此,该方法可重复地包括:(i)将离子包注入到离子路径中,(ii)检测离子包,(iii)产生针对离子包的相应的信号,以及(iv)数字化信号以产生针对离子包的相应的数字样本集合。可选地,每个数字样本集合可从关于多个离子包(即,多个离子注入)的信号中产生,由此多个信号和/或样本被组合(例如,求平均)。因此,该方法可包括重复步骤(i)至(iv)多次,并且组合(例如,求平均)数字样本以产生用于进一步分析的数字样本集合。

每个集合中的每个数字样本与相应的到达时间相关联,并且将包括指示由检测器在特定到达时间测量的离子强度的强度值。不同的到达时间指示相关联的物理化学特性的不同值,诸如质荷比(m/z)或离子迁移率。数字样本可呈包括强度值和到达时间值的形式被储存和处理,但是数字样本还可以呈包括强度值和相关联的物理化学特性值(例如,m/z)的形式被储存和处理。与每个样本集合相关联的到达时间可跨越针对相关信号的到达时间范围中的大部分或全部。

在实施方案中,每个信号和/或样本集合被分成一个或多个片段,例如多个片段。每个片段可包括关于离子包生成的信号的子集,例如关于离子包生成的数字样本的(整个)集合的数字样本的子集(或通过组合(例如求平均)来自多个离子包的信号产生的集合的数字样本的子集)。具体地,每个片段可包括信号的(非重叠的)连续部分(例如(连续的)数字样本集),其中针对该片段(的样本)的到达时间都在针对该片段的相应的到达时间范围内。

因此,每个数据片段可包括相应的数字样本集,其中该集中的每个样本与相应的到达时间相关联,并且其中与该集相关联的这些到达时间在相应的到达时间范围内。例如,信号可被分成包括第一数字样本集的第一片段,其中与该第一集相关联的这些到达时间在第一到达时间范围内,以及包括第二数字样本集的第二片段,其中与该第二集相关联的这些到达时间在第二不同到达时间范围内。任选地,该信号还可被分成一个或多个另外的片段,每个片段包括相应另外的数字样本集,其中与每个相应另外的集相关联的到达时间在相应另外的不同到达时间范围内。

针对信号和/或样本集合被分成的片段中的每个片段的每个到达时间范围可以是针对信号的(整体)到达时间范围的子范围。针对信号/集合被分成的多个片段的到达时间范围可以是非重叠的到达时间范围集,即针对片段中的每个片段的每个到达时间范围可以是整体到达时间范围的非重叠子范围。

可以任何合适的方式将信号分成多个片段。在数字化之前或在数字化之后,信号可被分成多个片段。在具体实施方案中,作为数字化过程的一部分,信号被分成多个片段,例如,数字样本呈片段的形式(即,数字样本集)从数字化器输出。

在一些实施方案中,信号和/或数字样本的集合可被分成尺寸相等、非重叠的相邻片段(即,以数据独立的方式)。

然而,在具体实施方案中,信号和/或数字样本的集合以数据依赖的方式被分成多个片段。具体地,当离子强度超过阈值时,可生成片段。例如,片段可在样本的强度超过第一阈值时开始,并且可在样本的强度下降到低于第二阈值时结束。第一阈值和第二阈值可相同或不同。在强度仅短暂下降到低于第二阈值的情况下,可继续该片段。例如,这可通过配置数字化器来实现,使得只有针对特定数量的样本,阈值保持低于第二阈值,片段才结束。片段还可以在样本强度超过第一阈值之前开始一定数量的样本和/或在信号下降到低于第二阈值之后结束一定数量的样本。

应当理解,通过以各种实施方案的方式将信号和/或数字样本的集合分成多个片段,片段内的一些或大多数样本将具有高于阈值的强度值。信号的其他区可以被丢弃。以此方式,可确保每个片段包括关于一个或多个离子峰的数据(并且无离子峰的信号的区被丢弃)。

在该方法中,通过对数据段应用滤波器来(单独地)处理每个数据片段。在实施方案中,在数字化之后,将滤波器应用于每个片段,即,将滤波器应用于每个数字样本集。

关于每个片段选择与滤波器(诸如平滑核或小波的宽度(例如FWHM))相关联的宽度δt(例如半最大值全宽度(FWHM)),例如,使得宽度δt对于信号被分成的每个不同片段是不同的。具体地,该宽度δt被配置为取决于针对到达时间在与该片段相关联的到达时间范围内的离子的预期离子到达时间分布的宽度。例如,可通过针对离子分析仪执行合适的校准来确定针对离子分析仪的预期离子到达时间分布。

预期到达时间分布的宽度可取决于到达时间本身,并且因此与针对每个片段的滤波器相关联的宽度δt可取决于与该片段相关联的到达时间范围,并且具体地可取决于与该片段相关联的平均到达时间T。依赖性可采取任何合适的形式,诸如例如线性(正比)依赖性(即δt∝T)或非线性依赖性。

在实施方案中,滤波器具有将由相同种类的离子产生的任何多模态离子峰平滑成单模态离子峰,同时保留由不同种类的离子产生的任何多模态离子峰的效果。这确保了数据片段的经滤波版本将(通常)仅包括关于每个离子种类的一个离子峰。

在实施方案中,滤波器利用平滑核。平滑核可采取任何合适的形式。在实施方案中,平滑核具有高斯的形式。可选地,平滑核可更接近地以针对仪器的预期到达时间分布(例如,其可从校准中确定)为模型。例如,平滑核可采取不对称高斯的形式,例如其中心的左右宽度不同。

在可选的实施方案中,滤波器是连续小波变换(CWT),即,其中小波的尺度可再次取决于(例如,可正比于)与片段相关联的到达时间范围,例如,与片段相关联的平均到达时间T。可使用任何合适的小波,诸如例如Marr小波。

在片段已经被滤波后,该片段的经滤波版本被用于标识该片段内的一个或多个离子峰。这可用任何合适的方式来完成。

在滤波器是平滑函数的情况下,该方法可包括标识经滤波信号中的一个或多个局部最小值,并且然后在所标识的最小值中的每个最小值的位置处(例如,如果最小值低于指定阈值)将片段分成一个或多个区间。在滤波器是连续小波变换(CWT)的情况下,该方法可包括标识经滤波信号中的一个或多个局部最大值,并且然后在所标识的最大值中的每个最大值(例如,如果最大值高于指定阈值)的位置处将片段分成一个或多个区间。通常,根据滤波器的性质,该方法可包括标识经滤波信号中的一个或多个局部最小值、过零点和/或局部最大值,并且然后在该所标识的最小值、过零点和/或最大值中的每一者的位置处将该片段分成一个或多个区间。只有当最小值或最大值超过(或低于)阈值时,才可在局部最小值或最大值处进行拆分。

该方法可包括基于每个区间内样本的最大强度来保留或丢弃该区间。例如,该方法可包括保留区间的样本的最大强度高于阈值的区间,并且丢弃区间的样本的最大强度低于阈值的区间。因此,该方法可包括仅保留最大样本强度高于阈值的那些区间(并丢弃任何其他区间)。

应当理解,这些步骤确保了,在此阶段,在片段中存在仅一个离子峰,该片段将仅剩余单个区间。在这种情况下,该方法可通过分析该区间中未滤波和/或经滤波数据来确定离子峰的一个或多个特性(例如质心、强度和/或面积等)来进行。这可通过将合适的(单个)峰模型拟合到区间的样本来完成。可使用任何合适的峰模型,诸如例如高斯或非对称高斯。

在针对片段剩余多个区间的情况下,该方法可通过逐个处理每个区间来继续。在实施方案中,计算每个区间的样本的强度的总和,并且然后根据针对每个区间的计算总和对区间进行排序,例如从最高到最低。

该方法可包括将(第一)单个峰模型拟合到具有最高总和的(第一)区间的样本。接下来,对于具有下一最高总和的(第二)区间,可使用第一峰模型修正该区间的样本(至少到第一峰模型与第二区间重叠的程度)。例如,从第一峰模型确定的强度值可分别从第二区间的样本中的一个或多个样本或每个样本的对应强度值中减去,例如以便针对第二区间产生经修正样本集。该方法可通过将(第二)单个峰模型拟合到第二区间的经修正样本来继续。

该过程可按从具有最高总和的区间到具有最低总和的区间的顺序,针对该片段的任何剩余区间继续,由此首先(a)使用已经针对该片段的其他区间确定的每个(和每一个)峰模型来修正每个区间的样本(至少到所讨论的峰模型与所讨论的区间重叠的程度)。这可包括从当前区间的样本中的一个或多个样本或每个样本的对应强度值中减去从现有峰模型确定的强度值,例如以便针对当前区间产生经修正样本集。该方法可然后包括(b)将(单个)峰模型拟合到当前区间的经修正样本。以此方式,可确定片段中多个离子峰中的每个离子峰的一个或多个特性(例如质心、强度和/或面积等)。再次,任何合适的(单个)峰模型可用于每个区间,诸如例如高斯或非对称高斯。

在另外的实施方案中,当已经针对片段的(保留)区间中的全部完成了上述过程时,可任选地重复峰模型拟合过程。这可通过使用针对片段中的其他区间产生的每个(和每一个)峰模型来修正第一区间的样本来完成。这可包括从第一区间的样本中的一个或多个样本或每个样本的对应强度值中减去从那些峰模型确定的强度值,例如以便针对第一区间产生经修正样本集。该方法可包括将经修正第一峰模型拟合到第一区间的经修正样本。然后,该方法可如上所述继续,但是其中使用经修正第一峰模型来代替第一峰模型,并且其中在每个步骤中,使用关于片段中的其他区间产生的(大多数当前的)峰模型中的全部来修正每个区间的样本。

因此,当已经通过将峰模型拟合到该多个剩余区间中的每个区间而产生峰模型集时,该方法可包括:(c)使用该集中除该第一峰模型之外的该峰模型来修正具有该最高总和的该区间的这些样本;(d)将第一经修正峰模型拟合到具有该最高总和的该区间的这些经修正样本,并用该峰模型集中的该第一经修正峰模型替换该第一峰模型;(e)使用该集中除该第二峰模型之外的这些峰模型来修正具有该第二最高总和的该区间的这些样本;以及(f)将第二经修正峰模型拟合到具有该第二最高总和的该区间的这些经修正样本,并用该峰模型集中的该第二经修正峰模型替换该第二峰模型。该方法还可任选地包括(g)针对该片段中除了具有该最高总和的该区间和具有该第二最高总和的该区间之外的任何剩余区间中的每个(和每一个)区间,执行以下步骤(h)和(i):使用该集中除了当前区间的该峰模型之外的这些峰模型来修正具有该下一最高总和的该区间的这些样本;以及(i)将峰模型拟合到该当前区间的这些经修正样本,并且用针对该峰模型集中该当前区间的该经修正峰模型替换针对该当前区间的该峰模型。

在实施方案中,该重复过程(即步骤(c)至(i))可根据需要重复一次或多次。例如,当模型参数已经达到期望精度时,或当已经达到所定义的最大重复次数时,可终止重复。

作为任选的最终步骤,该方法可包括例如使用多峰模型来执行全片段的(非线性)拟合。针对该拟合的初始值可来源于先前步骤中确定的单个离子峰模型。该步骤可以附加处理时间为代价增加各种确定特性的准确性。在一些实施方案中,不执行该步骤,因为已经发现无需该步骤可获得足够的准确性。

一旦针对该片段确定了一个或多个最终模型,该一个或多个峰模型可各自用于确定该片段中的每个离子峰的一个或多个特性,例如其质心、强度和/或面积。然后可根据需要使用每个离子峰的一个或多个特性。例如,可确定片段中每个离子的物理化学特性,诸如其质荷比和/或离子迁移率。

另外方面提供了一种存储计算机软件代码的非暂时性计算机可读存储介质,该计算机软件代码当在处理器上执行时,执行上述方法。

另外方面提供了一种用于分析仪器,诸如质量和/或离子迁移率谱仪的控制系统,该控制系统被配置为导致该分析仪器执行上述方法。

另外方面提供了一种分析仪器,该分析仪器包括离子分析仪和上述控制系统。

另外方面提供了一种分析仪器,该分析仪器包括:

离子分析仪;和

控制系统,该控制系统被配置为:

(i)接收由该离子分析仪生成的数据片段,其中该数据片段包括与第一到达时间范围相关联的数据;

(ii)对该数据片段应用滤波器,以产生该数据片段的经滤波版本,其中与该滤波器相关联的宽度被配置为取决于该离子分析仪针对该第一到达时间范围内的到达时间的预期离子到达时间分布的宽度;

(iii)标识该数据片段的该经滤波版本中的一个或多个离子峰;以及然后

(iv)确定该一个或多个所标识的离子峰中的每个离子峰的一个或多个特性。

这些方面和实施方案可并且在实施方案中确实包括本文所述的任选特征中的任何一个或多个特征或每个特征。

因此,例如,分析仪器可以是质量和/或离子迁移率谱仪。离子分析仪可以是飞行时间(ToF)质量分析仪,诸如多反射飞行时间(MR-ToF)分析仪。

附图说明

现在将参考附图更详细地描述各个实施方案,其中:

图1示意性示出了根据实施方案的分析仪器;

图2示意性地示出了根据实施方案的多反射飞行时间质量分析仪;

图3示意性地示出了根据实施方案在离子分析仪中检测离子的过程;

图4A示出了包括对应于两个不同离子种类的离子峰的数字化信号,并且图4B示出了包括对应于信号离子种类的离子峰的数字化信号;

图5示意性地示出了根据实施方案的方法;

图6示出了针对包括对应于两个不同离子种类的离子峰的信号的图5的方法;

图7示出了针对包括对应于单一离子种类的离子峰的信号的图5的方法;

图8示意性地示出了根据实施方案的方法;

图9示出了在根据使用图6的示例性数据的实施方案的方法的重复期间已估计的质心和峰面积的收敛;

图10示出了针对根据实施方案的方法的作为两个峰之间距离的函数的拆分成功率;

图11示出了针对根据实施方案的方法的作为两个峰之间的距离的函数的假阳性数量;

图12示出了针对根据实施方案的方法的作为两个峰之间距离的函数的拆分成功率;

图13示出了针对根据实施方案的方法的作为两个峰之间的距离的函数的假阳性数量;并且

图14示出了针对根据实施方案的方法的作为两个峰之间的距离的函数的准确性。

具体实施方式

图1示意性示出了可根据实施方案操作的分析仪器。分析仪器可以是质谱仪(其可任选地包括离子迁移率分离器)或离子迁移率谱仪。如图1所示,分析仪器包括离子源10、一个或多个离子转移台20和分析仪30。

离子源10被配置为从样品中生成离子。离子源10可以是任何合适的连续或脉冲离子源,诸如电喷雾电离(ESI)离子源、MALDI离子源、大气压电离(API)离子源、等离子体离子源、电子电离离子源、化学电离离子源等。在一些实施方案中,可提供和使用多于一个的离子源。离子可以是待分析的任何合适类型的离子,例如小有机分子和大有机分子、生物分子、DNA、RNA、蛋白质、肽、其片段等。

离子源10可任选地耦合到分离设备,诸如液相色谱分离设备或毛细管电泳分离设备(未示出),使得在离子源10中被电离的样品来自分离设备。

离子转移台20布置在离子源10的下游,并且可包括大气压接口和一个或多个离子导向器、透镜和/或其他离子光学设备,其被配置为使得由离子源10生成的离子中的一些离子或大多数离子可从离子源10转移到分析仪30。离子转移台20可包括任何合适数量和配置的离子光学设备,例如任选地包括以下各项中的任何一者或多者:一个或多个RF和/或多极离子导向器、用于冷却离子的一个或多个离子导向器、一个或多个质量选择性离子导向器等。

分析仪30被布置在离子转移台20的下游,并且被配置为从离子转移台20接收离子。分析仪被配置为分析离子,以便确定离子的物理化学特性,诸如它们的质荷比、质量、离子迁移率和/或碰撞截面(CCS)。为此,分析仪30被配置为使离子沿分析仪30内的离子路径传递,并测量离子沿离子路径传递所花费的时间(漂移时间)。因此,分析仪30可包括布置在离子路径端部处的离子检测器,其中分析仪被配置为记录离子到达检测器处的时间。该仪器可被配置为根据其测量到达时间来确定离子的物理化学特性。该仪器可被配置为产生被分析离子的谱,诸如质谱或离子迁移率谱。

在具体实施方案中,分析仪30是飞行时间(ToF)质量分析仪,例如被配置为通过使离子沿分析仪的漂移区内的离子路径传递来确定离子的质荷比(m/z),其中漂移区维持在高真空下(例如<1×10

在可选的实施方案中,分析仪30是离子迁移率分析仪,例如被配置为通过使离子沿分析仪的漂移区内的离子路径传递来确定离子的离子迁移率,其中在漂移区中提供缓冲气体。离子可被电场推动通过缓冲气体(或离子可被气流推动通过漂移区,其中电场被布置成与气流相对),并且可由布置在离子路径端部处的离子检测器检测。具有相对高迁移率的离子将在具有相对低迁移率的离子之前到达离子检测器。因此,离子可根据它们的离子迁移率分离,并且可以由它们的离子迁移率确定的到达时间到达离子检测器。到达检测器的每个离子或离子组可被检测器采样,并且来自检测器的信号可被数字化。处理器然后可确定指示离子或离子组的到达时间和/或离子迁移率的值。可收集和组合针对多个离子的数据,以生成到达时间谱和/或离子迁移率谱。

应当注意的是,图1仅是示意性的,并且分析仪器可并且在实施方案中确实包括任何数量的一个或多个附加部件。例如,在一些实施方案中,分析仪器包括用于分裂或反应离子的碰撞单元或反应单元,并且由分析仪30分析的离子可以是通过分裂或反应由离子源10生成的母离子而产生的片段离子或产物离子。

如图1还示出的,该仪器处于控制单元40的控制之下,诸如适当编程的计算机,其控制包括分析仪30的仪器的各种部件的操作。根据本文所述的实施方案,控制单元40还可接收和处理来自包括检测器的各种部件的数据。

图2示意性地示出了分析仪30的一个示例性实施方案的细节。在该实施方案中,分析仪30是多反射飞行时间(MR-ToF)质量分析仪。

如图2示出的,多反射飞行时间分析仪30包括一对离子镜31、32,该一对离子镜在第一方向X上间隔开并彼此面对。离子镜31、32在第一端部和第二端部之间沿正交漂移方向Y伸长。

可以呈离子阱形式的离子源(注入器)33布置在分析仪的一个端部(第一端部)处。离子源33可被布置和配置为从离子转移台20接收离子。在被注入到离子镜31、32中之间的空间之前,离子可在离子源33中积累。如图2示出的,离子可以相对小的注入角度或漂移方向速度从离子源33注入,产生之字形离子轨迹,由此镜31、32之间的不同振荡在空间上分离。

一个或多个透镜和/或偏转器可沿离子路径布置在离子源33和离子首先遇到的离子镜32之间。例如,如图2示出的,第一平面外透镜34、注入偏转器35和第二平面外透镜36可沿离子路径布置在离子源33和离子首先遇到的离子镜32之间。其他布置将是可能的。通常,一个或多个透镜和/或偏转器可被配置为适当地调节、聚焦和/或偏转离子束,即,使得导致其采用通过分析仪的期望轨迹。

分析仪还包括另一个偏转器37,其沿离子路径布置在离子镜31、32之间。如图2示出的,偏转器37可沿其第一离子镜反射后(在离子镜32中)和第二离子镜反射前(在另一离子镜31中)的离子路径,在离子镜31、32之间近似等距地布置。

分析仪还包括检测器38。检测器38可以是任何合适的离子检测器,其被配置为检测离子,并且例如记录与离子到达检测器相关联的强度和到达时间。合适的检测器包括例如一个或多个转换倍增电极,任选地然后一个或多个电子倍增器等。

为了分析离子,可将离子从离子源33注入到离子镜31、32之间的空间中,其方式为使得离子采用在X方向上在离子镜31、32之间具有多次反射的之字形离子路径,同时:(a)沿漂移方向Y朝离子镜31、32的相对(第二)端部漂移,(b)在离子镜31、32的第二端部附近反转漂移方向速度,并且然后(c)沿漂移方向Y漂移回偏转器37。然后可导致离子从偏转器37行进到检测器38以进行检测。

在图2的分析仪中,离子镜31、32均相对于X和/或漂移Y方向倾斜。相反,可以倾斜离子镜31、32中的仅一个离子镜,并且例如,离子镜31、32中的另一离子镜平行于漂移Y方向待布置。通常,离子镜在X方向上沿它们在漂移方向Y上的长度彼此相距一定距离非恒定。离子朝离子镜的第二端部的漂移方向速度受到由两个镜彼此之间的非恒定距离产生的电场的对抗,并且该电场导致离子在离子镜的第二端部附近反转它们的漂移方向速度,并且沿漂移方向朝偏转器37漂移回。

图2中描绘的分析仪还包括一对校正带状电极39。沿漂移长度行进的离子在每次穿过镜31、32时被轻微偏转,并且附加带状电极39被用于校正由镜之间的变化距离产生的飞行时间误差。例如,带状电极39可被电偏置,使得镜之间的离子振荡的周期沿整个漂移长度基本上恒定(尽管两个镜之间的非恒定距离)。离子最终发现自己被反射回漂移空间并聚焦在检测器38。

美国专利号9,136,101中给出了图2的倾斜镜型多反射飞行时间质量分析仪的另外细节。

应当注意的是,通常分析仪30可以是任何合适类型的飞行时间(ToF)质量分析仪(或实际上是离子迁移率分析仪)。例如,分析仪可以是单透镜型多反射飞行时间质量分析仪,例如如英国专利号2,580,089中所述。

通常,具有离子碰撞检测器的飞行时间(ToF)质量分析仪利用了离子在静电场中的行进时间正比于离子的质荷比(m/z)的平方根的特性。离子从离子源(例如,正交加速器或射频离子阱)同时喷射,加速到期望能量,并在行进指定距离后撞击到离子检测器上。

图3示意性地示出了由检测器检测离子包50的过程。如图3所示,检测器包括转换倍增电极51,然后是一个或多个电子倍增器台53。检测器还可或替代地包括一个或多个闪烁器和/或一个或多个光子倍增器等。在图3中描绘的实施方案中,导致离子50撞击在转换倍增电极51上,于是产生二次电子52。二次电子52然后被一个或多个电子倍增台53放大,以产生指示在转换倍增电极51处接收的离子50的强度作为时间的函数的信号。

所生成的信号由数据采集电子装置54(诸如数字化仪)记录,例如时间-数字转换器(TDC)或模数转换器(ADC)。如图3示出的,这导致由相同质荷比的离子生成的时间分辨峰55。因为针对离子50中的所有离子的行进距离基本上相同,所以离子到达时间用于确定离子的质荷比(m/z),该质荷比然后可用于离子标识。

ToF质量分析仪通常以大约100Hz和10kHz之间的速率记录信号,其中每个信号可能包含数百个不同的离子峰。每个信号对应于由注入器33喷射到分析仪中的相应的离子包50。可期望实时分析这些信号,例如以便可基于分析结果设置后续扫描的参数。

然而,由数据采集电子装置54记录的峰可具有复杂形状,并且源自不同离子种类的峰可重叠。因此,实施方案提供了一种从所记录信号中标识对应于不同质荷比的峰,并且然后对这些峰中的每个峰分配到达时间、强度和/或一个或多个其他属性的方法。

可标识峰拟合方法应该解决的两种边缘情况。这些如图4所示。

如图4A示出的,在第一边缘情况下,两个重叠峰是由具有类似质荷比的两种不同的离子生成的。重叠峰应该被解开,以单独地估计针对两个种类中的每个种类的到达时间和/或其他参数。

如图4B示出的,在第二边缘情况下,单一离子种类生成多模态峰,其中该峰不应被解释为由不同离子种类产生的信号(如在第一种情况下),而应被视为仅来自单一种类的信号。应当注意的是,如果对多个信号求平均,或如果信号中存在更多的离子,该峰的多模态结构将会消失。

该第二情况与多反射飞行时间(MR-ToF)分析仪特别相关。如上所述,在这些仪器中,使用离子镜31、32之间的多次反射来折叠离子轨迹,以实现长行进距离,并且因此实现长的飞行时间T。在这种情况下,针对宽度为ΔT的离子到达时间的相当宽的概率分布仍可导致非常高的分辨率,这正比于比率ΔT/T。

另一方面,最先进的离子检测器将入射离子转换成半最大值全宽度(FWHM)低于1ns的电压脉冲,这可能显著小于针对MR-ToF仪器的ΔT。在这种情况下,如果仅检测到某一种类的少数离子,则很可能会记录到多模态信号,诸如图4B中示出的信号。只有对许多此类信号进行求平均,才会出现与到达时间分布具有类似形状的单模态峰。然而,求平均是耗时的,并且只要有可能就可以省略,以实现给定样品的快速分析。类似地,更多数量的离子和更好的信噪比将减少遇到多模态峰的机会,但这并不总是能实现。

到达时间分布的宽度通常取决于到达时间本身。如果分析大的质荷比范围,这会导致极大不同宽度的峰。特别是对于大质荷比离子,可预期离子到达时间的宽的概率分布,导致仅由单一离子种类生成的多模态信号。

由于离子统计和噪声差,这些多模态峰可能来自单一种类的离子,并且此类峰的模式可容易地被误解为多个重叠峰。为了避免这种情况,平滑样条函数(例如,Chudinov,A.V.等人,“Interpolational and smoothing cubic spline for mass spectrometrydata analysis”,International Journal of Mass Spectrometry 396(2016):42-47),连续小波变换(例如,Du,Pan,Warren A.Kibbe和Simon M.Lin.“Improved peak detectionin mass spectrum by incorporating continuous wavelet transform-based patternmatching。”Bioinformatics 22.17(2006):2059-2065;和Lange,Eva等人“High-accuracypeak picking of proteomics data using wavelet techniques”。Biocomputing2006.2006.243-254),以及离散小波变换(例如,Coombes,Kevin R.等人“Improved peakdetection and quantification of mass spectrometry data acquired from surface-enhanced laser desorption and ionization by denoising spectra with theundecimated discrete wavelet transform。”Proteomics 5.16(2005):4107-4117)已经在现有技术中用于分离信号和噪声,并在不同尺度上搜索离子峰。然而,发明人已经发现,在不同尺度上执行滤波并在所有尺度上搜索峰可能非常耗时,并且因此不适合于以100Hz到10kHz的速率记录的谱的实时分析。

美国专利申请号US 2009/0072134使用输入数据的质量依赖性分箱,使得跨全质量范围的每个峰在箱的数量方面具有类似的FWHM。然而,这会导致信息在分箱过程中丢失。

因此,现有技术的方法或在许多不同的尺度上执行计算上昂贵的分析,或使用导致精度损失的分箱。

图5示出了根据各种实施方案的方法。该方法不需要不同尺度上的平滑技术,并且降低了将多模态峰错误地解释为不同离子种类的重叠峰的可能性。图5是示出根据各种实施方案的算法的主要步骤的流程图。

如图5示出的,在第一步骤60中,使用阈值将谱切割成不同片段。仅保留高于阈值的样本和一些相邻样本。该步骤可容易地在ADC 54的固件中实施。

在第二步骤61中,高斯滤波器被应用于每个片段的原始数据。如果平滑核的宽度与该片段中的到达时间分布的宽度相当,则滤波器通常会将多模态峰转换成单模态峰。这避免了多个峰的错误标识。

为了找到给定到达时间的离子的到达时间分布的正确宽度,对ToF分析仪执行校准。该先验知识使得算法能够在特定尺度上寻找峰,而不是像现有技术中那样在所有尺度上寻找峰,并且从而显著加速分析。

在一些实施方案中,已经发现假设线性依赖性就足够了。因此,平滑核的宽度δt可正比于当前片段中的平均到达时间T。这两者之间的因子可以称为“时间尺度因子”。在实施方案中,该因子可近似为1e

可使用稍微更复杂的模型,例如

一旦片段已经被滤波,就找到经滤波信号中的局部最小值,并且该片段在这些最小值的位置处被进一步分成多个区间。这由图6A示出。

应当理解,本质上,高斯滤波器是在峰位置处给出最大值而在峰位置之间给出最小值的模式匹配。为了进一步改进这一点,使用到达时间分布的模型作为平滑核是有益的。在实施方案中,到达时间分布可由不对称高斯函数很好地建模,在其中心的左侧和右侧具有不同的σ值,并且该模型可用作平滑核。

作为第二步骤61中高斯滤波器的可选方案,可应用连续小波变换(CWT),其中小波的尺度再次正比于当前片段中的平均到达时间。使用Marr小波(也称为墨西哥帽小波),获得信号的经滤波二阶导数。如果变换信号的局部最大值超过阈值,则其被假设为峰位置的第一估计。然后在这些估计峰位置之间进行拆分。使用CWT,可在两个峰之间没有局部最小值的情况下标识两个峰。

在第三步骤62和第四步骤63中,仅保留最大强度值超过给定阈值的区间,并且逐个处理剩余区间。

如果该片段中的信号仅来自单个离子种类,则此时应该仅留下单个区间,并且因此然后应该估计仅单个峰的参数。这种情况由图7示出。

如果剩余多个区间,则根据求和后的信号从最高到最低对其进行排序,并且然后算法按照如下方式逐一估计这些区间中的每个区间的峰的参数。

假设待估计区间k中的峰参数,其具有在飞行时间t

在第四步骤63中,使用剩余信号

1.重心的计算

2.计算累积总和

在此t

可选地,可使用估计峰中心处的信号。调整非对称峰的左σ

以类似的方式,可估计其他模型的参数。

应当注意的是,在实施方案中,片段的经滤波版本仅用于拆分峰,并且不用于拟合模型。相反,该模型拟合到原始的未经滤波的数据片段。这确保保留分辨率。

在获得针对每个峰的模型后,可任选地重复估计。对于这些附加重复,可使用全片段,而不仅是区间。然而,发现仅使用来自对应区间的数据就足够了。当参数达到期望精度时,或当达到所定义的最大重复次数时,可终止重复。该重复的结果在图6D中示出。

图8是示出了在剩余多个区间的情况下该方法的第三步骤62和第四步骤63的重复过程的细节的流程图。如图8所示,计算针对每个剩余区间的总信号(步骤70),并且按照从最高到最低的顺序根据它们的总信号对区间进行排序(步骤71)。该算法最初选择具有最高总信号的区间(步骤72),并使峰模型拟合到该区间(步骤73)。

接下来,确定当前区间是否是最后一个区间(步骤74)。如果不是这种情况,则选择具有下一最高总和的区间(步骤75)。然后,该算法对源自出现在当前区间中的片段的其他区间中的峰的信号量进行估计(步骤76),并从当前区间中的信号中减去该估计信号(步骤77)。该算法然后循环回到步骤73,通过将峰模型拟合到由步骤77产生的当前区间的经校正信号。

该过程通过逐个步进通过每个区间来循环,直到到达最后一个区间,此时步骤74将确定当前区间是最后一个区间。接下来,确定是否已经达到最大重复次数(步骤78)。在这种情况下,该过程结束(步骤79),并且当前峰模型集被输出和/或用于进一步分析。

另一方面,在尚未达到最大重复次数的情况下,从具有最高总信号的区间开始返回,重复整个过程(步骤80)。然而,在这种情况下,从图8中可看出,在步骤73中将峰模型拟合到经校正信号之前,第一区间经历步骤76和77(即,通过从当前区间的信号中减去源自出现在当前区间中的片段的其他区间中的峰的估计量的信号)。

尽管在图8描绘的实施方案中,重复在最大重复次数之后终止,但是还可利用更复杂的终止标准,例如基于针对从峰模型确定的参数(例如质心、强度和/或面积)的期望精度。

图9示出了在多次重复之后,针对来自图6的示例的估计ToF质心和峰面积的收敛。从图9中可看出,估计收敛通常仅需要几次重复,并且甚至初始估计对于许多应用来说已经足够接近。

返回到图5,可执行任选的最终步骤64,由此进行全片段到多峰模型的非线性拟合。非线性拟合的初始值从先前步骤63获得。该附加步骤64可能是耗时的,并且通常发现在先前步骤63之后模型中的原始数据之间的高度一致。因此,该最后的步骤64可仅在时间允许的情况下执行。所得最终模型在图6D中示出。

使用TMT样本的记录的数据以及允许任意调整峰属性(最重要的是两个峰之间的距离)的模拟峰来评估算法的性能。使用模拟数据,发现在~300μs的飞行时间和100,000的分辨率(对应于1.5ns的FWHM)下,针对适当的参数,仍可以可靠地区分平均包含10个离子且ToF差异为4ns的两个峰。这在图10中示出。拆分成功率被定义为被正确拆分成两个峰的片段的分数。使用CWT,在没有观察到峰之间的局部最小值的情况下,甚至可获得更低的值。

虽然真阳性率随着时间尺度因子的减少而增加,但图11示出,针对相同的数据,每扫描的假阳性平均数也会增加,尤其是在使用CWT时。

在图12和图13中,绘制了针对ToF~1000μs的两个峰的假阳性率。这清楚地示出,增加ToF并且由此峰宽会导致更多的假阳性。减少离子数量会进一步导致类似问题。应该找到假阳性和假阴性之间的良好平衡。为了组合这些目标,准确性被定义为

准确性在图14中示出。选择3e

应当注意的是,根据实施方案的算法的步骤中的所有步骤都可以非常高效的方式实施,并且在计算上不昂贵。如果排除非线性拟合的最后任选步骤64,则有可能证明在C++具体实施中对包含两个峰的片段的分析平均花费4μs。比4μs更快的具体实施是可能的。

在极端情况下,谱中可能存在约500个峰、1000个峰或更多个峰,通常同时记录在具有高增益的第一通道和具有低增益的第二通道中,以增加动态范围。因此,可能需要分析约1000个片段或更多个片段,这允许对输入数据进行在线分析。

应当理解的是,实施方案使用CWT或低通滤波器,其尺度取决于飞行时间或m/z,以将信号拆分成源自不同离子种类的峰。选择正确的尺度,以避免由于差离子统计数据而导致的多个种类的错误检测。

尽管已经参考各种实施方案描述了本发明,但是应当理解,在不脱离所附权利要求中阐述的本发明的范围的情况下,可进行各种改变。

相关技术
  • 热电离飞行时间质谱仪及热电离飞行时间质谱分析方法
  • 用于飞行时间质谱仪的离子源和飞行时间质谱分析方法
技术分类

06120116304673