掌桥专利:专业的专利平台
掌桥专利
首页

水中污染物的非靶向分析方法

文献发布时间:2024-04-18 19:58:26


水中污染物的非靶向分析方法

技术领域

本发明涉及一种水中污染物的非靶向分析方法。

背景技术

我国工业在近几十年的飞速发展过程中,生产、使用并排放了大量的有机合成化学品,这些有机化合物在被排放进入水体后成为了环境中有毒污染物的重要来源。目前,在河流、湖泊以及近海区域等多种水环境中已经被广泛地检出。除了已经收录在各种数据库或者化学品名录中的化合物,每年都会有近百种新的化学物质上市。这些化合物的排放对环境造成了比较严重的污染,因而需要对水环境中的有机污染物进行筛查、识别和监测。

而目前对于水环境中的污染物的分析方法,通常都是针对目标清单中的特定的污染物进行分析和识别。但是,真实环境中来源自不同地区、不同行业的污染物截然不同,实际上水环境中的污染物种类非常庞杂,而且还有未知的化合物存在,采用常规的分析方法来仅仅聚焦在有限的几类污染物显然无法满足环境管理的要求。

发明内容

本发明所解决的技术问题在于克服了现有技术中无法有效地对水中的多种污染物以及新的污染物和未知污染物进行分析、识别的缺陷,而提供了一种水中污染物的非靶向分析方法。本发明的方法提高了对水环境中已知的污染物以及未知的高风险污染物的检测和识别能力。

本申请提供一种水中污染物的非靶向分析方法,包括如下步骤:

步骤S1、获取多个待测水体样品的质谱数据,提取所述多个待测水体样品的质谱数据中的分子特征,所述分子特征包括一级质谱信息;

步骤S2、将所述待测水体样品的所述分子特征通过筛选方法得到筛选后的分子特征,所述筛选方法包括方式一和方式二:

所述方式一为,将所述待测水体样品的所述分子特征的一级质谱信息与污染物筛查清单进行比对,筛选得到与所述污染物筛查清单的一级质谱信息相匹配的所述分子特征;所述污染物筛查清单包括已知污染物的一级质谱信息;

所述方式二为,在未能与所述污染物筛查清单匹配的分子特征中,依据过滤原则,筛选出满足检测频率和峰强度高的分子特征;所述检测频率包括,所述分子特征在多个所述待测水体样品中的超过第一比例值的水样中被检出,所述第一比例值大于或等于50%;所述峰强度高为所述分子特征的峰强度超过10000;

步骤S3、对所述筛选后的分子特征进行识别,得到所述筛选后的分子特征对应的化合物结构信息,即识别出所述筛选后的分子特征对应的化合物;

步骤S4、根据环境风险排序方法筛选出具有高风险的化合物;

所述环境风险排序方法包括:获取所述步骤S3筛选后的化合物的GHS危害码,根据所述GHS危害码的危害等级分配不同数量级的危害分数。

本发明中,所述待测水体样品的样品数至少为两个。所述待测水体样品可为非强酸或强碱水体。

本发明中,第一比例值较佳地为70%、80%、90%或100%。

本发明中,所述峰强度高较佳地为所述分子特征的峰强度超过50000、80000、100000或150000。

本发明中,所述分子特征较佳地还包括二级质谱信息和保留时间信息。

本发明中,所述污染物筛查清单较佳地包括持久性有机污染物、内分泌干扰物和抗生素中的一种或多种。

本发明中,较佳地,所述污染物筛查清单的建立包括如下步骤:

K1、在资料库系统中检索与已知污染物相关的物质,得到清单A;

K2、依据筛选原则筛选出所述清单A的部分物质,得到所述污染物筛查清单;所述筛选原则包括:①筛选出分子量小于90Da和大于1000Da的物质;②筛选出只能由气相色谱仪串联质谱仪的检测精度准确检测到的物质;③筛选出无法或较难被电喷雾离子源电离的物质。

本发明中,较佳地,获取多个待测水体样品的质谱数据的步骤包括:采用超高效液相色谱仪串联高分辨率质谱仪对所述多个待测水体样品进行检测,

其中,更佳地,色谱条件为:

流动相为乙腈水溶液和乙酸铵,所述乙腈水溶液的浓度为40%~60%,例如为50%。所述浓度是指乙腈占所述乙腈水溶液的体积百分比;

所述流动相的流速为0.1-0.4mL·min

一级质谱采集范围为50-1300m/z;

二级质谱采集范围为50-1000m/z。

本发明中,较佳地,所述提取所述多个待测水体样品的质谱数据中的分子特征的步骤包括:采用算法对所述质谱数据进行分析,提取各个样品中的全部分子特征;较佳地,所述算法为解卷积算法。

本发明中,较佳地,所述对所述筛选后的分子特征进行识别的获得包括,通过采用质谱数据库和分子特征识别软件进行识别;所述质谱数据库较佳地包括已知污染物的质谱数据库、PubChem化合物质谱数据库,和由模拟计算得到的扩展质谱数据库中的一种或多种。

其中,更佳地,所述已知污染物的质谱数据库较佳地包括14个化合物的包含354440种结构式二级质谱数据库。

其中,更佳地,所述扩展质谱数据库包括基于已知化合物和常规生化反应并通过计算和模拟而得到所生成的新的化合物及其质谱数据,所述扩展质谱数据库较佳地包括643307种结构式。

其中,更佳地,所述PubChem化合物质谱数据库较佳地包括超过6000万种结构式。

本发明中,较佳地,步骤S3还包括,基于步骤S3得到的化合物结构信息构建分子网络,基于所述分子网络筛选出高频检出的碎片离子。

本发明中,较佳地,还包括步骤S6:购买所述筛选出的具有高风险的化合物所对应的标准化学品,对所述标准化学品进行质谱分析,将得到的所述标准化学品的质谱数据与步骤S5的对应高风险化合物的质谱数据进行验证。

其中,更佳地,所述验证的条件包括,所述具有高风险的化合物的质谱数据中的主要碎片离子和所述标准化学品样本的质谱数据中的主要碎片离子相似,以及,所述具有高风险的化合物和所述标准化学品样本的质谱数据中的保留时间差异小于第一时间长度,所述第一时间长度为0.05min、0.1min、0.15min、0.18min或0.2min。

本发明一优选实施方式中,所述水中污染物的非靶向分析方法包括以下步骤:

步骤S1、建立污染物筛查清单;所述污染物筛查清单的物质包括持久性有机污染物、内分泌干扰物和抗生素;

步骤S2、获取多个待测水体样品的质谱数据,提取所述多个待测水体样品的质谱数据中的分子特征,所述分子特征包括一级质谱信息、二级质谱信息和保留时间信息;

步骤S3、将所述多个待测水体样品的所述分子特征通过筛选方法得到筛选后的分子特征,所述筛选方法包括方式一和方式二:

所述方式一为,将所述待测水体样品的所述分子特征的一级质谱信息与污染物筛查清单进行比对,筛选得到与所述污染物筛查清单的一级质谱信息相匹配的所述分子特征;所述污染物筛查清单包括已知污染物的一级质谱信息;

所述方式二为,在未能与所述污染物筛查清单匹配的分子特征中,依据过滤原则,筛选出满足检测频率和峰强度高的分子特征;所述检测频率包括,所述分子特征在多个所述待测水体样品中的超过第一比例值的水样中被检出,所述第一比例值大于或等于50%;所述峰强度高为所述分子特征的峰强度超过10000;

步骤S4、使用质谱数据库对筛选后的分子特征进行识别,得到筛选后的分子特征对应的化合物结构信息,即识别出所述筛选后的分子特征对应的化合物;

步骤S5、基于步骤S4得到的化合物结构信息构建分子网络,基于所述分子网络筛选出高频检出的碎片离子;

步骤S6、根据环境风险排序方法筛选出具有高风险的化合物;所述环境风险排序方法包括:获取所述步骤S3筛选后的化合物的GHS危害码,根据所述GHS危害码的危害等级分配不同数量级的危害分数。

本发明的方法通过提取水样中的分子特征,并且基于包括模拟的质谱数据库的筛查用质谱数据库,识别出已知的污染物以及具有高检出频率的未知的化合物;并且通过在非靶向分析的基础上结合环境风险评估,从而提高了对未知的高风险污染物的识别准确度,并利用验证步骤进行确证,从而能够可靠地锁定危害性较强的污染物;同时,构造分子网络,能够快速梳理出高频检出的碎片离子,并对不同污染物之间的结构相似性进行分析,大大地提高了对于水环境中已知的污染物以及未知的高风险污染物的检测、识别能力。

在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。

本发明所用试剂和原料均市售可得。

本发明的技术方案具有如下有益效果:

1.本发明建立的污染物筛查清单涵盖范围广、包含数量多、更新频率快,全面整合了国际权威数据库中各方关注较多的污染物,尤其是新污染物。结构识别软件中嵌入了14个化合物的二级质谱数据库(包含354440种结构式),并且可以连接到由计算机模拟计算的扩展质谱数据库(包含643307种结构式)和PubChem化合物质谱数据库(包含超过6000万种结构式),为全面筛查污染物和识别未知化合物提供了海量数据资源。

2.本发明在非靶向分析的基础上结合了环境风险评估,提高了高风险污染物的识别准确度,即在分析结果中筛选出对于水环境可能产生不良影响的污染物,并通过重新测试对应的标准样对检测结果进行确证,提高了分析结果的准确性,从而能够锁定危害性较强的污染物。

3.本发明可以识别出污染物筛查清单之外的潜在污染物,这些未知污染物具有高检出频率或高浓度,对于水环境的影响程度未知,今后具有重要的研究意义。

4.本发明结合使用了分子网络技术,能够快速梳理出高频检出的碎片离子,并对不同污染物之间的结构相似性进行分析。

附图说明

图1是本发明实施例1的水中污染物的非靶向分析方法的流程图。

图2是本发明实施例1的构建的分子网络图。

图3是本发明实施例1的双酚A确证图。

图4是实施例1的1号未知化合物的测试质谱和模拟质谱数据图。

图5是实施例1的2号未知化合物的测试质谱和模拟质谱数据图。

图6是实施例1的3号未知化合物的实际质谱和模拟质谱数据图。

具体实施方式

下面将对发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

本实施例提供一种水中污染物的非靶向分析方法,其流程图如图1所示,包括如下步骤:

步骤S1:建立污染物筛查清单

污染物筛查清单主要包括持久性有机污染物、内分泌干扰物和抗生素三大类中的多种物质及对应物质的理化数据及质谱信息。在本实施例中,通过在NORMAN资料库系统中检索与上述污染物分类相关的物质,可分为:全氟和多氟烷基物质;持久性、迁移性和毒性物质;个人护理品;药物。共包含17929种。

但是,在此要考虑检测条件的情况,对于检测设备的精度不同,其所能检测到的物质的范围也不同,因而,在建立污染物筛查清单时,根据检测系统的实际性能和条件,将无法被检测到的物质从所述污染物筛查清单中删除,在本实施例中具体包括:①分子量小于90Da和大于1000Da的物质;②只能由气相色谱仪串联质谱仪的检测精度准确检测到的物质;③无法或较难被电喷雾离子源电离的物质。调整后的污染物清单中包含11759种物质及相关信息。当然,在其他的检测系统和条件下,对应地修改该限制条件。

步骤S2:获取多个待测水体样品的质谱数据,提取所述多个待测水体样品的质谱数据中的分子特征,所述分子特征包括一级质谱信息、二级质谱信息和保留时间信息;

步骤S21、收集五种不同精细化工及专用化学品生产过程中产生的污水样品(即待测水体样品)各1L,经0.22μm滤膜过滤后储存于4℃冰箱中备用。分别量取2mL污水样作为子样,2mL蒸馏水样作为背景样,以及5mL等量混合了1mL子样的混合样作为质控样。

步骤S22、使用超高效液相色谱仪串联高分辨率质谱仪对前述样品进行分析,进样顺序为每一针质控样后进五针子样(或背景样),进样量均为10μL,按照前述测试条件获取水样的质谱数据。

其中,质谱检测的检测条件为:

超高效液相色谱仪串联高分辨率质谱仪:6540Q-TOF/MS(AgilentLtd.);

流动相:乙腈与水(溶液A)+5mM乙酸铵(溶液B);

流速:0.3mLmin-1;

离子源:电喷雾离子源;

扫描模式:全离子扫描模式;

扫描速率:4spectras-1;

一级质谱采集范围:m/z 50—1300;

二级质谱采集范围:m/z 50—1000;

碰撞能量:0eV、20eV和40eV;

采集速率:4GHz;

四极杆飞行时间质谱仪运行条件如下表所示:

表1.四极杆飞行时间质谱仪运行条件

步骤S23:将前述得到的水样的质谱数据输入到软件MS-DIAL中,使用解卷积算法对质谱数据进行分析,提取各个样品中的全部分子特征;在此,优选地,采用从卷积的二级质谱中提取分子特征。扣除背景样中已经存在的分子特征。该分子特征包括一级质谱信息、二级质谱信息和保留时间信息。

其中,MS-DIAL的参数主要依据测试条件来进行设置,主要参数如下:

一级质谱质量偏差值:0.015Da;

二级质谱质量偏差值:0.025Da;

Sigma值(解卷积过程的质谱分辨率):0.5;

MS-DIAL的参数设置条件如表2所示。

表2.MS-DIAL的参数设置条件

通过配置MS-DIAL软件,从待测水体样品的质谱数据中提取出491个正极分子特征和127个负极分子特征。经过背景扣除后,正、负极分子特征数量分别减少至461个和86个。

步骤S3、将待测水体样品的分子特征通过筛选方法得到筛选后的分子特征,筛选方法包括方式一和方式二:

方式一、将待测水体样品的分子特征的一级质谱信息与污染物筛查清单进行比对,筛选得到与所述污染物筛查清单的一级质谱信息相匹配的所述分子特征;

在此,将分子式未能与污染物筛查清单相匹配的以及不满足检出要求的分子特征滤除,其中,检出要求包括该分子特征在所检测的多个水样中的超过第一比例值的水样中被检出以及该分子特征的峰强度超过第一强度;

具体地,将分子特征与污染物筛查清单中的已知污染物进行比对和匹配,如果该分子特征与污染物筛查清单中的已知污染物的分子式不同,则暂时将该分子特征滤除。在本实施例中,在461个正极分子特征、86个负极分子特征中,152个正极分子特征和44个负极分子特征可以与污染物筛查清单中物质的分子式匹配。

方式二、在未能与污染物筛查清单匹配的分子特征中,依据过滤原则,筛选出满足检测频率和峰强度高的分子特征;检测频率包括,所述分子特征在五个所待测水体样品中的超过第一比例值的水样中被检出,所述第一比例值为100%;所述峰强度高为所述分子特征的峰强度超过50000;

依据检出频率和峰强度的过滤原则,筛选出未知的2个正极分子特征(命名为1号未知化合物和2号未知化合物)和1个负极分子特征(命名为3号未知化合物)在所有待测水体样品中均有检出,将其纳入后续的识别流程。

步骤S4、使用质谱数据库对筛选后的分子特征进行识别,得到筛选后的分子特征对应的化合物结构信息,即识别出所述筛选后的分子特征对应的化合物;

其中,质谱数据库包括已知污染物的质谱数据库、PubChem化合物质谱数据库以及由模拟计算得到的扩展质谱数据库,其中扩展质谱数据库为基于已知化合物和常规生化反应并通过计算和模拟而得到所生成的新的化合物及其质谱数据。由此,为全面筛查污染物和识别未知化合物提供了海量数据资源。

而分子特征识别软件则采用MS-FINDER,其中MS-FINDER的主要参数如下:

一级质谱质量偏差:5ppm;

二级质谱质量偏差:10ppm;

识别方法、分子式检索和结构式检索步骤的参数设置如下表3所示。

表3.识别方法、分子式检索和结构式检索步骤的参数设置

经过识别,得到分子特征对应的化合物结构。

其中,对于步骤S3筛选出的三个未知的分子特征(1号未知化合物、2号未知化合物和3号未知化合物),依据数据库对其结构进行解析;具体采用MS-FINDER中配置的MINEs数据库对其结构进行解析。MINEs数据库作为质谱扩展库,能够基于已知的化合物和常规的生化反应生成新的化合物及其质谱数据。

对于1号未知化合物,该分子特征被初步识别为MINEs-62453,检索分数为5.5。如图4所示,图中的上半部分为测试该化合物所得质谱,下半部分为计算机模拟质谱,推测得到的结构式在图中左上方。

对于2号未知化合物,该分子特征被初步识别为MINEs-302336,检索分数为6.3。如图5所示,图中的上半部分为测试所得质谱,下半部分为计算机模拟质谱,推测得到的结构式在图中右上方。

对于3号未知化合物,该分子特征被初步识别为5-茚醇,检索分数为6.2。如图6所示,图中的上半部分为测试所得质谱,下半部分为计算机模拟质谱,推测结构式在图中右上方。

步骤S5、基于步骤S4得到的化合物结构信息构建分子网络,基于所述分子网络筛选出高频检出的碎片离子;

分子网络构建软件采用METGEM。METGEM的主要参数如下:

质谱质量偏差:0.02Da;

迭代次数:1000;

学习率:200;

Cosine最小值(各分子特征二级质谱的相似性):0.7。

经过METGEM软件处理,由正极分子特征构成的分子网络中形成了5个分子特征群组和40个单独的分子特征。构建的分子网络可参见图2,1号分子特征群组、2号分子特征群组和3号分子特征群组如图2所示。通过构建分子网络,能够快速梳理出高频检出的碎片离子,并对不同污染物之间的结构相似性进行分析。

步骤S6、根据环境风险排序方法筛选出具有高风险的化合物:

环境风险排序的具体实验步骤主要分为三步。首先导出识别结果中全部化合物的国际化合物标识(internationalchemicalidentifierkey,InChlKey),将这些InChlKey作为检索词条在PubChem数据库中对全部化合物进行检索以获取其GHS危害码,检索过程通过Python爬虫代码实现。然后,对检索结果中GHS危害码进行整理,并根据其对应的危害等级分配不同数量级的危害分数。V类危害等级对应的分数为10000,IV类对应的分数为1000,以此类推,I类对应的分数为1。最后将每个化合物的全部危害分数相加得到总危害分数。比如在某种化合物具有生殖细胞致突变性(对应的分数为1000)和急性毒性(对应的分数为10),则其总危害分数为1000+10=1010。

在本实施例中,由人工检查全部定性结果,并依据GHS标签制度筛选出具有高风险的化合物93个,部分识别结果如表4所示。

表4.非靶向分析结果

步骤S7、对得到的具有高风险的化合物进行确证。

购买具有高风险的化合物所对应的标准化学品,利用步骤S3的质谱分析对该标准化学品进行分析,并将得到的该标准化学品的质谱数据与通过步骤S4的非靶向分析识别出的对应高风险化合物的质谱数据进行比对,验证非靶向分析识别化合物的准确性。

其中,验证条件包括该化合物在待分析水样及标准化学品样本的质谱中的主要碎片离子相似,以及,该化合物在待分析水样及标准化学品样本的提取离子色谱中的保留时间差异小于第一时间长度。第一时间长度为0.05min。

在本实施例中,选取检测到的双酚A进行确证。如图3所示,该分子特征的平均分子量为227.1076,平均保留时间为5.37min,分子结构识别分数为7.5,被初步识别为双酚A,具有环境危害图形符号。使用超高效液相色谱仪串联高分辨率质谱仪对双酚A标准品进行测试后,在碰撞电压为0eV时获取了前体离子,在碰撞电压为20eV时获取的三个主要碎片离子分别为m/z227.1071、m/z59.0142和m/z133.0653。三个碎片离子峰在待测水体样品中均有检出,但峰强度有轻微差别。根据提取离子色谱图的结果显示,标准品与待测水体样品中分子特征的保留时间一致。综上,该分子特征被确证为双酚A。由此可知,采用实施例1的非靶向分析方法,能够准确地确定水体样品中的化合物。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 一种对地下水中重质非水相液体污染物密度调控的方法
  • 一种基于统计策略的沉积物中有机污染物非靶向分析方法及应用
  • 一种基于统计策略的沉积物中有机污染物非靶向分析方法及应用
技术分类

06120116494418