掌桥专利:专业的专利平台
掌桥专利
首页

一种数据非依赖性采集质谱特征碎片的非靶标分析方法

文献发布时间:2024-04-18 20:02:18


一种数据非依赖性采集质谱特征碎片的非靶标分析方法

技术领域

本发明涉及化合物非靶标识别技术领域,具体涉及一种数据非依赖性采集质谱特征碎片的非靶标分析方法。

背景技术

液相色谱串联高分辨质谱技术被广泛应用于化合物(包括环境污染物、代谢物、药物、天然产物等)的识别和筛选,在环境、化工、医药、生命科学等领域有着广泛的应用。以高分辨质谱为基础的非靶标分析方法无需使用标准品,通过精确质量数和相应的碎片信息,能够对样品中的未知化合物进行结构解析,在蛋白质组学、代谢组学以及环境污染物筛查等领域具有广泛的应用,如公开号为CN106645538A的中国专利文献公开了利用超高效液相色谱-四级杆/静电场轨道肼高分辨率质谱技术鉴别洋槐蜜产地的方法,公开号为CN110646554A的中国专利文献公开了通过高效液相色谱质谱联用技术对胰腺癌诊断标志物进行筛选的方法。

在非靶标分析时,可同时采集前级离子(一级质谱)和碎片离子(二级质谱)的信息,以便于化合物分子式的确认和结构推断。目前,液相色谱串联高分辨质谱的数据采集模式主要分为数据依赖性采集(Data-dependent acquisition,DDA)和数据非依赖性采集(Data-independent acquisition,DIA)两种。其中DDA模式能够对选定的前级离子(通常为强度最高的几个离子或实验者指定的离子)进行二级碎裂,因此能够准确提供碎片离子所对应的前级离子信息。但DDA模式的缺点是只能采集到样本中丰度较高的部分前级离子的二级碎片,而损失了大部分前级离子的二级碎片信息。DIA模式通过对一定质量范围内的所有前级离子进行碎裂,能够获得该质量数范围内所有前级离子的二级碎片信息,但DIA的缺点是无法直接将二级碎片信息与前级离子建立一一对应的关系,需要依赖于后期解卷积、峰对齐等复杂的数据处理实现前级离子与二级碎片的匹配。

对于某一类含有相同分子结构或官能团的化合物,它们在质谱中往往存在相同的裂解规律,因此能够在二级质谱中产生相同的碎片离子,即特征碎片。特征碎片法是非靶标分析中常用的方法之一,利用特征碎片离子匹配与之对应的前级离子,再通过前级离子的精确质量和同位素分布特征获得化合物的分子式信息,能够实现具有相同特征碎片的某类化合物的非靶标筛查。在DDA模式下,特征碎片离子能够直接对应前级离子,无需复杂的数据处理过程,但该模式下会漏掉样本中丰度较低的组分信息。DIA模式可以无偏地采集样本中全组分的二级碎片信息,更适用于复杂基质样本的非靶标分析,但DIA模式无法直接获得特征碎片离子对应的前级离子。仪器厂商提供的质谱数据分析软件并没有单独的基于特征碎片的非靶标分析功能模块;一些商业软件(如Compound discoverer)以及开源质谱数据分析软件(如MS DIAL)虽然能够实现DIA数据中一级质谱与二级质谱离子之间的匹配,但这些软件需要对所有色谱峰进行解卷积和峰对齐等处理过程,不仅浪费计算资源,而且存在大量假阳性结果,增加了数据的复杂程度。目前对于DIA数据,基于特征碎片的非靶标分析仍是通过人工比对的方式进行:将特征碎片的色谱图与前级离子的色谱图进行比对,若两者的峰型一致则认为该前级离子为候选化合物。然而,由于前级离子数量众多,人工比对过程耗时长,效率低,且人为判断缺乏固定的标准,主观误差较大。

公开号为CN106290684A的中国专利文献公开了一种对非数据依赖型采集模式质谱数据的分析方法,该方法包括以下步骤:将多个分析样本中不存在的、重同位素标记的标准品混入被检样品中;利用气相或液相色谱与质谱连用分析样品;获得各DDA模式采集的数据中重同位素标记的标准品、被检样品中各成份的质谱信息,并制作相应的质谱数据库文件;搜索出各DIA模式采集的数据中重同位素标记的标准品的质谱信息;制作适用于每个DIA模式采集的数据文件分析的质谱数据库文件;利用质谱数据商业软件对该DIA数据进行搜索,获得该样品各组份的定性、定量结果。但是该方法需要提前采集DDA数据来制作数据库文件,且化合物的分析依赖于数据库,无法实现数据库以外化合物的非靶标分析。

因此,现有技术无法通过特征碎片来实现样品中某一类结构类似化合物的快速、准确的非靶标分析。

发明内容

本发明提供了一种数据非依赖性采集质谱特征碎片的非靶标分析方法,该方法能够通过质谱特征碎片实现化合物的非靶标分析,大大提高了化合物识别的效率和准确性,避免了繁琐、耗时的人工匹配和核对过程,为化合物的非靶标分析提供了有效的解决方案。

具体采用的技术方案如下:

一种数据非依赖性采集质谱特征碎片的非靶标分析方法,包括以下步骤:

步骤1:采用气相色谱-质谱法或液相色谱-质谱法分析样品,通过数据非依赖性采集模式,同时获得样品的一级质谱原始数据和二级质谱原始数据,采用数据转换软件将质谱原始数据转换为通用格式;

步骤2:在步骤1得到的通用格式的质谱数据中提取每个隔离窗口下的二级质谱数据,获得所有扫描点对应的时间信息,在质量误差允许范围内提取特征碎片离子在所有扫描点中的强度信息,绘制时间-强度曲线图;

步骤3:从步骤2得到的时间-强度曲线图中获得特征碎片离子色谱峰的保留时间RT和峰宽W信息,提取特征碎片离子在RT±W/2时间段内所有扫描点的强度信息I(I

步骤4:在步骤1得到的通用格式的质谱数据中提取一级质谱数据,提取步骤3中特征碎片离子RT处的全扫描数据,获得隔离窗口范围内全部前级离子的信息,在质量误差允许范围内提取每一个前级离子在RT±W/2时间段内扫描点的强度信息I’(I’

步骤5:采用相似度算法计算步骤4中每一个前级离子的强度与步骤3中特征碎片离子强度之间的相似度,根据相似度系数建立前级离子列表;

步骤6:获得步骤5的前级离子列表中每一个前级离子的保留时间,计算其与步骤3中特征碎片离子RT的偏差,根据保留时间偏差筛选前级离子;

步骤7:对于步骤6筛选出的前级离子,过滤同位素离子、加合离子和/或碎片离子,获得单同位素精确质量,推断化合物的分子式,实现化合物的非靶标分析。

优选的,步骤1中,二级质谱原始数据的获得方式包括碰撞诱导裂解或源内裂解。

所述的数据转换软件包括但不限于MSConvert、GNPS_Vendor_Conversion、X2XML或其他相同功能软件等,所述的通用格式为mzXML格式、mzML格式或mzData格式。

步骤2中,特征碎片离子为结构相似的化合物在二级质谱中产生的共有的一个或多个碎片离子,优选的,所述的质量误差允许范围为±5ppm;

质量误差的计算公式为:

优选的,步骤3中,为了准确判断特征碎片离子的色谱峰,RT±W/2时间段内所有扫描点的数量(n)≥5。

优选的,步骤4中,所述的质量误差允许范围为±5ppm,扫描点的数量与步骤3中扫描点数量相同。

步骤5中,所述的相似度算法为皮尔逊相关系数算法或余弦相似度算法;其中,皮尔逊相关系数r

其中,n为RT±W/2时间段内所有扫描点的数量,I

碎片离子和前级离子在第i个扫描点的强度,

余弦相似度cos的计算公式为:

其中,n为RT±W/2时间段内所有扫描点的数量,I

优选的,前级离子列表中前级离子的强度与步骤3中特征碎片离子强度之间的相似度满足皮尔逊相关系数r

步骤6中,前级离子的保留时间为强度最高的扫描点所对应的时间,筛选保留时间与步骤3中特征碎片离子RT的偏差<0.01min的前级离子。

本发明还提供了所述的数据非依赖性采集质谱特征碎片的非靶标分析方法在检测领域中的应用。

与现有技术相比,本发明的有益效果在于:

本发明根据化合物在二级质谱中产生的特征碎片离子,通过相似度算法,能够自动匹配对应的前级离子,大大提高了非靶标分析的效率和准确性,避免了繁琐、耗时的人工匹配和核对过程,为化合物的非靶标分析提供了有效的解决方案。

附图说明

图1为本发明方法的流程图;

图2为实施例1中特征碎片[Br]

图3为实施例1中特征碎片[Br]

图4为实施例2中特征碎片[C

图5为实施例2中特征碎片[C

具体实施方式

下面结合实施例与附图,进一步阐明本发明。应理解,这些实施例仅用于说明本发明,而不用于限制本发明的范围。下列实施例中未注明具体条件的操作方法,通常按照常规条件,或按照制造厂商所建议的条件。

实施例中方法的流程图如图1所示。

实施例1地表水样本中含Br化合物的非靶标分析

含Br化合物在二级质谱中能够产生[Br]

地表水样本通过固相萃取浓缩富集,采用液相色谱-高分辨质谱在DIA模式下采集样本的高分辨质谱原始数据(一级质谱原始数据和二级质谱原始数据),扫描参数如下:全扫描质量范围为150–1000m/z,分辨率设置为120000;二级扫描的隔离窗口为150–1000m/z,扫描范围为50–500m/z,分辨率设置为120000。将质谱原文件数据通过MSConvert软件转换为mzML格式,用Python的pymzML包读取mzML文件,提取二级质谱所有扫描点的时间信息,提取二级质谱所有扫描点中[Br]

对于RT=3.82min的色谱峰,在其峰宽3.74–3.89min内存在9个扫描点数(n=9),提取[Br]

式中,n=9,I

计算结果发现,在59个前级离子中,有14个离子的余弦相似度系数cos大于0.9,进一步建立前级离子列表并提取这14个离子的色谱保留时间,对比[Br]

采用同样的处理方法,对3.96min,4.38min,4.39min,4.64min处的色谱峰进行前级离子匹配(表1)。其中,3.96min处对应的前级离子为315.8280,根据同位素特征推测其分子式为C

表1[Br]

实施例2鱼类肝脏样本中全氟化合物的非靶标分析

全氟化合物含有相似的碳氟链骨架,在二级质谱中能够产生[C

鱼类肝脏样本采用乙腈提取,然后通过强阴离子交换固相萃取小柱净化。样本采用液相色谱-高分辨质谱分析,在DIA模式下采集样本的高分辨质谱数据(一级质谱原始数据和二级质谱原始数据),扫描参数如下:全扫描质量范围为150–900m/z,分辨率设置为120000;二级扫描的隔离窗口为150–900m/z,扫描范围为50–500m/z,分辨率设置为60000。将质谱原文件数据通过MSConvert软件转换为mzXML格式,用R的readMzXmlData包读取mzXML文件,提取二级质谱所有扫描点的时间信息,提取二级质谱所有扫描点中[C

对于RT=7.94min的色谱峰,在其峰宽7.84–8.04min内存在17个扫描点数(n=17),提取[C

式中,n=17,I

计算结果发现,在260个前级离子中,有7个离子的皮尔逊相关系数r

采用同样的处理方法,对8.33min,8.94min,9.39min,9.75min,10.07min处的峰进行前级离子匹配,如表2所示,其对应的前级离子分别为562.9563,612.9515,662.9488,712.9457,762.9433,根据同位素特征推测其分子式依次为C

表2[C

以上所述的实施例对本发明的技术方案进行了详细说明,应理解的是以上所述的仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充或类似方式替代等,均应包含在本发明的保护范围之内。

技术分类

06120116576546