一种鉴定完整糖肽上N-连接糖链类型的方法
文献发布时间:2023-06-19 09:49:27
技术领域
本申请主要涉及一种鉴定糖蛋白上N-连接糖链类型的方法。
背景技术
糖基化是蛋白质最常见的翻译后修饰之一,包括N-连接和O-连接糖基化修饰。已知N-连接糖链广泛存在于各种生物中,具有重要的生物学意义,其主要修饰在氨基酸保守序列上,即N-X-S/T(其中X为除了脯氨酸之外的任意氨基酸)。N-连接糖链具有相似的核心结构,根据核心结构之外分支结构的不同将N-连接糖链分成三种不同的类型:高甘露糖型(High mannose)、复杂型(Complex)和杂合型(Hybrid)。高甘露糖指核心结构之外,仅包含甘露糖;复杂型糖指在核心结构之外的分支结构都以N-乙酰葡糖胺(HexNAc)开始延伸;杂合型糖指核心结构之外的分支分别以N-乙酰葡糖胺和甘露糖开始延伸。高甘露糖修饰的糖蛋白主要位于内质网和高尔基体上,辅助其他蛋白质在合成过程中的正确折叠。而杂合型和复杂型糖结构相对比较复杂,其中任何单糖的改变都可能会影响相应蛋白的生物学功能。而N-连接糖链类型的区分是对糖链结构判断的重要一环。同时,对N-连接糖链类型的区分有助于我们进一步深入研究其生物学功能。
质谱技术是规模化鉴定蛋白质糖基化修饰的重要手段,首先通过识别质谱谱图中的特征性的氧鎓离子鉴别完整糖肽谱图,然后采用数据库匹配或者从头测序的的方式,分别对糖肽中的多肽和糖链部分进行鉴定。目前已有多种规模化鉴定完整糖肽的软件,其中经典软件包括Byonic
因此,准确判断N-糖链的类型对于糖链结构的整体鉴定至关重要。
参考文献:
[1]Bern M,Kil YJ,Becker C.Byonic:advanced Peptide and proteinidentification software[J].Current Protocols in Bioinformatics 2012:13.20.11-13.20.14.
[2]Toghi Eshghi S,Shah P,Yang W,et al.GPQuest:A Spectral LibraryMatching Algorithm for Site-Specific Assignment of Tandem Mass Spectra toIntact N-glycopeptides[J].Analytical Chemistry 2015,87(10):5181-5188.
[3]Liu MQ,Zeng WF,Fang P,et al.pGlyco 2.0enables precision N-glycoproteomics with comprehensive quality control and one-step massspectrometry for intact glycopeptide identification[J].Nat Commun 2017,8(1):438.
发明内容
本申请的目的是解决现有技术鉴定完整糖肽上N-连接糖链类型可能存在错误判断的问题。
为了实现以上目的,本申请提出以下技术方案:
一种鉴定完整糖肽上N-连接糖链类型的方法,其特殊之处在于,包括如下步骤:
(1)获取串联质谱数据;
(2)对串联质谱数据进行预处理,得到不同能量碎裂条件下的二级质谱谱图,其中高能量碎裂条件下的二级质谱谱图包含多肽碎片信息,低能量碎裂条件下的二级质谱谱图包含糖链碎片信息,确定二级质谱谱图中所有谱峰的分子质量;
当然,也可以在更多种能量碎裂条件下生成二级质谱谱图来获得多肽碎片信息和糖链碎片信息,或者在一张二级质谱谱图同时能够体现多肽碎片信息和糖链碎片信息,这些具体处理方式也应视为步骤(2)的范畴;
(3)根据已知的多肽碎片信息数据库,确定高能量碎裂条件下的二级质谱谱图中的多肽分子质量和多肽的准确序列;
(4)基于多肽分子质量,在低能量碎裂条件下的二级质谱谱图中搜索相应的多肽+糖链(单糖或者多个单糖)的分子质量;
假设多肽+五糖核心结构即peptide+HexNAc*2+Hex*3的分子质量为m;根据分子质量确定多肽+五糖核心结构是否存在特定修饰(含核心岩藻糖或平分型糖修饰,或者二者皆有),假如存在特定修饰,则将m重新定义为peptide+HexNAc*2+Hex*3+特定修饰(的质量);
(5)通过判断低能量碎裂条件下的二级质谱谱图中是否存在m+Hex、m+Hex*2、m+HexNAc、m+HexNAc+Hex谱峰来判断糖链类型;
如果只存在m+Hex或m+Hex*2谱峰,即为高甘露糖型;
如果只存在m+HexNAc或m+HexNAc+Hex谱峰,即为复杂型;
如果既存在m+Hex或m+Hex*2又存在m+HexNAc或m+HexNAc+Hex谱峰,即为杂合型。
可选地,上述步骤(3)具体是,通过数据库匹配的方式或者从头测序(de novo)的方式鉴定二级质谱谱图中的多肽分子质量,进而得到多肽的准确序列。
可选地,上述步骤(5)具体包括下列子步骤:
(5a)计算m+HexNAc、m+HexNAc+Hex的质量,并与二级质谱谱图匹配,如果两个质量与谱图都不匹配,则待测糖链为高甘露糖型糖链,否则,执行步骤(5b);
(5b)计算m+Hex、m+Hex*2的质量,并与二级质谱谱图匹配,如果两个质量与谱图都不匹配,则待测糖链为复杂型糖链,否则,待测糖链为杂合型糖链。
可选地,上述步骤(4)中确定分子质量m的过程中,可对谱图中糖链核心结构的类型作相应区分,具体包括:
将peptide+HexNAc*2+Hex*3设为第一类核心结构(m);
若谱图中糖链核心结构包含核心岩藻糖修饰,则将peptide+HexNAc*2+Hex*3+Fucose设为第二类核心结构(m);
若谱图中糖链核心结构包含平分型糖修饰,则将peptide+HexNAc*2+Hex*3+HexNAc设为第三类核心结构(m);
若谱图中糖链核心结构既包含核心岩藻糖修饰又包含平分型糖修饰,则将peptide+HexNAc*2+Hex*3+Fucose+HexNAc设为第四类核心结构(m)。
可选地,当糖链中含平分型糖链时,步骤(5a)中匹配的质量由m+HexNAc,m+HexNAc+Hex替换为m+HexNAc*2,m+HexNAc*2+Hex。
基于以上方案,本申请还提供一种智能终端,包括处理器和存储器,所述存储器存储有程序,其特殊之处在于:所述程序被处理器加载运行时实现上述一种鉴定完整糖肽上N-连接糖链类型的方法的各个步骤。
基于以上方案,本申请还提供一种计算机可读存储介质,存储有计算机程序,其特殊之处在于:所述计算机程序被处理器加载运行时实现上述一种鉴定完整糖肽上N-连接糖链类型的方法的各个步骤。
相比现有技术,本申请具有以下有益效果:
本申请提出的鉴定完整糖肽上N-连接糖链类型的方法,基于多肽分子质量,在二级质谱谱图中搜索相应的多肽+糖链的分子质量;并通过确定糖链核心结构,根据核心结构之外的四个峰作为判断糖链类型的特征性离子,进行识别匹配来实现了对N-连接糖链类型的规模化的准确判断。
附图说明
图1为HexNAc2Hex5的可能结构。
图2为本申请的一个实施例的流程示意图;HexNAc:N-乙酰己糖胺;Hex:己糖。
图3为本申请的原理图。
图4为一张低能量碎裂条件下的二级质谱谱图及标记(鉴定结论为高甘露糖型)。
图5为一张低能量碎裂条件下的二级质谱谱图及标记(鉴定结论为杂合型)。
图6为一张低能量碎裂条件下的二级质谱谱图及标记(鉴定结论为复杂型)。
具体实施方式
以下结合附图以及实施例,对本申请作进一步详述。应当理解,这些实施例只用于更充分地解释说明本申请的特点,而并非对本申请权利要求的限制。
如图2所示,一种鉴定完整糖肽上N-连接糖链类型的方法,主要包括如下步骤:
(1)获取串联质谱数据;
(2)对串联质谱数据进行预处理,得到不同能量碎裂条件下的二级质谱谱图,其中高能量碎裂条件下的二级质谱谱图包含多肽碎片信息,低能量碎裂条件下的二级质谱谱图包含糖链碎片信息,确定两张二级质谱谱图中所有谱峰的分子质量;
这里,只采用了两种能量碎裂条件分别得到了两张二级质谱谱图;根据实际需要和技术条件,也可以在更多种能量碎裂条件下生成二级质谱谱图来获得多肽碎片信息和糖链碎片信息,或者在一张二级质谱谱图同时能够体现多肽碎片信息和糖链碎片信息,这些具体处理方式本质上都是获取足够全面的多肽碎片信息和糖链碎片信息(分子质量);
(3)根据已知的多肽碎片信息数据库,通过数据库匹配的方式或者从头测序(denovo)的方式鉴定高能量碎裂条件下的二级质谱谱图中的多肽分子质量,进而得到多肽的准确序列;
(4)基于多肽分子质量,在低能量碎裂条件下的二级质谱谱图中搜索相应的多肽+糖链的分子质量;其中,糖链可能是一个单糖,也可能是多个单糖,多个单糖的种类也可能不同;
例如,步骤(3)中得到某一个谱峰表征的多肽分子质量是1938.94Da,其准确序列为GYYNQSEAGSHTLQR,已知N-乙酰葡糖胺(HexNAc)的分子质量是204.09Da,我们在低能量碎裂条件下的二级质谱谱图找到某一谱峰恰好为1938.94+204.09(一价)或其二分之一(二价)、三分之一(三价)……的分子质量,即该谱峰对应的GYYNQSEAGSHTLQR+HexNAc;同理,可以确定该低能量碎裂条件下的二级质谱谱图中的其他多肽+糖链的分子质量;
假设多肽+五糖核心结构即peptide+HexNAc*2+Hex*3的分子质量为m;根据分子质量确定多肽+五糖核心结构是否存在特定修饰(含核心岩藻糖或平分型糖修饰,或者二者皆有),假如存在特定修饰,则将m重新定义为peptide+HexNAc*2+Hex*3+特定修饰;
在确定分子质量m的过程中,可对谱图中糖链核心结构的类型作相应区分,具体如下:
将peptide+HexNAc*2+Hex*3设为第一类核心结构(m);
若谱图中糖链核心结构包含核心岩藻糖修饰,则将peptide+HexNAc*2+Hex*3+Fucose设为第二类核心结构(m);
若谱图中糖链核心结构包含平分型糖修饰,则将peptide+HexNAc*2+Hex*3+HexNAc设为第三类核心结构(m);
若谱图中糖链核心结构既包含核心岩藻糖修饰又包含平分型糖修饰,则将peptide+HexNAc*2+Hex*3+Fucose+HexNAc设为第四类核心结构(m);
(5)通过判断低能量碎裂条件下的二级质谱谱图中是否存在m+Hex、m+Hex*2、m+HexNAc、m+HexNAc+Hex谱峰来判断糖链类型;
图3中主要标注了五种特征峰,每个峰依次代表糖链核心结构(m),核心结构+Hex,核心结构+HexNAc,核心结构+Hex+Hex,核心结构+Hex+HexNAc,核心结构之外的四个峰是判断糖链类型的特征性离子,本实施例就是通过对四个特征离子识别匹配来实现对糖链类型的规模化的准确判断;
如果只存在m+Hex或m+Hex*2谱峰,即为高甘露糖型;
如果只存在m+HexNAc或m+HexNAc+Hex谱峰,即为复杂型;
如果既存在m+Hex或m+Hex*2又存在m+HexNAc或m+HexNAc+Hex谱峰,即为杂合型;
具体可按照以下子步骤执行:
(5a)计算m+HexNAc、m+HexNAc+Hex的质量,并与二级质谱谱图匹配,如果两个质量与谱图都不匹配,则待测糖链为高甘露糖型糖链,否则,执行步骤(5b);
(5b)计算m+Hex、m+Hex*2的质量,并与二级质谱谱图匹配,如果两个质量与谱图都不匹配,则待测糖链为复杂型糖链,否则,待测糖链为杂合型糖链。
当糖链中含平分型糖链时,步骤(5a)中匹配的质量由m+HexNAc,m+HexNAc+Hex替换为m+HexNAc*2,m+HexNAc*2+Hex。
图4、图5、图6是不同糖肽样本或者同一糖肽混合样本中的一级质谱中的不同谱峰对应的低能量碎裂条件下的二级质谱谱图及标记。
图4所示图谱中只匹配到m+Hex,m+Hex*2的谱峰,并不存在m+HexNAc,m+HexNAc+Hex谱峰,所以判定此糖型是高甘露糖型,黑色框标记的是决定高甘露糖型的特征性离子。
图5所示图谱中不仅匹配到m+Hex的谱峰,而且还匹配到m+HexNAc,m+HexNAc+Hex谱峰,所以判定此糖型是杂合型糖型,黑色框标记的是决定杂合型糖的特征性离子。
图6所示图谱中只匹配到m+HexNAc,m+HexNAc+Hex谱峰,所以判定此糖型是复杂性糖型,黑色框标记的是决定复杂型糖的特征性离子。
另外,本申请的方案可以通过智能终端、计算机可读存储介质等形式实施或形成商业化产品,例如:
一种智能终端,包括处理器和存储器,所述存储器存储有程序,所述程序被处理器加载运行时实现上述一种鉴定完整糖肽上N-连接糖链类型的方法的各个步骤。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器加载运行时实现上述一种鉴定完整糖肽上N-连接糖链类型的方法的各个步骤。
- 一种鉴定完整糖肽上N-连接糖链类型的方法
- 一种鉴定完整糖肽上N-糖链分支结构的方法