掌桥专利:专业的专利平台
掌桥专利
首页

特发性肺纤维化病诊断标志物及其应用

文献发布时间:2023-06-19 18:30:43


特发性肺纤维化病诊断标志物及其应用

技术领域

本发明属于分子生物学技术领域,涉及特发性肺纤维化病诊断标志物及其应用。

背景技术

特发性肺纤维化(IPF)是一种预后不良的,以进行性肺纤维化为特征的肺部疾病,吸烟或吸烟史与IPF发病率之间存在较强的相关性,主要症状包括进行性劳力性呼吸困难和干咳。IPF发病机制亦未完全阐明,但有足够证据表明与免疫炎症及肺泡损伤有关。不同标本所显示的免疫炎症反应特征不尽一致,周围血所反映出的是免疫异常比较突出,而支气管肺泡灌洗液显示炎症反应为主,而肺局部组织的异常又有所不同。开发有效的与特发性肺纤维化病的标志物,对于特发性肺纤维化病的诊断和治疗具有重要意义。

CN112143720A公开了一种特发性肺纤维化疾病血液诊断标志物CBR1及其在制备诊断或预后工具中的应用,该工具是通过检测血液中的CBR1基因及其表达产物来实现检测特发性肺纤维化疾病的目的,通过蛋白组学筛选在特发性肺纤维化患者和正常人中存在差异表达的蛋白,后经QPCR和ELISA验证证明CBR1在mRNA和蛋白两个水平上均为特发性肺纤维化患者血液的含量比正常人的低。

同工型是由相同基因表达的mRNA或蛋白质变体。同工型mRNA可能在转录蛋白质的蛋白质编码能力、结构和功能方面有所不同,从而导致独特的生物学功能。同工型mRNA是在转录过程中通过选择性剪接(AS,也称为可变剪接)产生,此过程在大约95%的人类基因中发生。

综合上述,开发新型的特发性肺纤维化疾病标志物,扩充特发性肺纤维化疾病诊断标准,对于特发性肺纤维化病诊断领域具有重要意义。

发明内容

针对现有技术的不足和实际需求,本发明提供特发性肺纤维化病诊断标志物及其应用,本发明对特发性肺纤维化(IFP)肺组织进行第三代RNA单分子实时测序和第二代RNA测序,并通过FMLRC-HISAT2-IDP策略,高精度地识别了基因转录过程中的选择性剪接事件。结合肺组织转录组和蛋白质组的差异分析,发现转录本ENST00000529044的表达水平在IFP肺组织和正常肺组织中的表达水平存在显著差异,可准确表征特发性肺纤维化,因此,可作为有效的生物标志物,应用于检测特发性肺纤维化。

为达上述目的,本发明采用以下技术方案:

第一方面,本发明提供一种特发性肺纤维化病诊断标志物,所述标志物包括转录本ENST00000529044。

本发明使用FMLRC-HISAT2-IDP策略检测AS事件和同工型,使用SMRT-seq的单分子测序获得高精度的RNA序列,其精度通过第二代RNA测序获得的数据进一步校正。结合肺组织转录组和蛋白质组的差异分析,将TRIM29作为新的具有影响IPF潜力的候选基因。进一步研究发现TRIM29的转录本ENST00000529044的表达水平在IFP肺组织和正常肺组织中的表达水平存在显著差异,可准确表征特发性肺纤维化。

第二方面,本发明提供第一方面所述的特发性肺纤维化病诊断标志物在制备检测特发性肺纤维化病产品中应用。

第三方面,本发明提供一种检测特发性肺纤维化病的试剂盒,所述试剂盒包括检测第一方面所述的特发性肺纤维化病诊断标志物的表达水平的试剂。

优选地,所述试剂包括RNA转录组检测试剂。

第四方面,本发明提供第一方面所述的特发性肺纤维化病诊断标志物在以非疾病诊断目的的检测特发性肺纤维化中应用。

第五方面,本发明提供一种以非疾病诊断为目的的检测特发性肺纤维化的方法,所述方法包括:

对待测样本中转录本ENST00000529044进行检测,计算转录本ENST00000529044的表达水平,与正常样本中转录本ENST00000529044的表达水平比较,进行判断是否是特发性肺纤维化阳性。

本发明中,以非疾病诊断为目的的检测特发性肺纤维化的方法可应用于肺部特发性肺纤维化相关行为的基础研究中。

优选地,特发性肺纤维化阳性的判断标准为:待测样本中转录本ENST00000529044表达水平与正常样本中转录本ENST00000529044表达水平的比值>5。

优选地,所述待测样本包括肺组织样本、血液样本等。

优选地,所述以非疾病诊断为目的的检测特发性肺纤维化的方法包括以下步骤:

(1)提取待测样本中RNA;

(2)检测待测样本中转录本ENST00000529044,计算转录本ENST00000529044的表达水平,与正常样本中转录本ENST00000529044的表达水平比较,进行判断是否是特发性肺纤维化阳性。

第六方面,本发明提供一种检测特发性肺纤维化病的装置,所述装置包括检测单元和分析单元,所述检测单元用于执行包括:提取待测样本中RNA,检测待测样本中转录本ENST00000529044,计算转录本ENST00000529044的表达水平;所述分析单元用于执行包括:与正常样本中转录本ENST00000529044的表达水平比较,进行判断是否是特发性肺纤维化病阳性。

与现有技术相比,本发明具有以下有益效果:

本发明对特发性肺纤维化(IFP)肺组织进行单分子实时测序和第二代RNA测序,首次发现转录本ENST00000529044的表达水平在IFP肺组织和正常肺组织中的表达水平存在显著差异,可准确表征特发性肺纤维化,作为一类新的生物标志物,应用于检测肺部的特发性肺纤维化。

附图说明

图1A为三代单分子RNA测序技术检测到的基因和转录本的环形图;

图1B为三代单分子RNA测序技术检测到的可变剪接事件和同工型的韦恩氏图;

图1C为三代单分子RNA测序技术检测到发生不同频次可变剪接事件基因的环形图;

图1D为三代单分子RNA测序技术检测到的不同类型可变剪接事件的环形图;

图2A为存在显著差异剪接的基因的表达量-剪接水平MA图;

图2B为存在显著差异剪接的基因的剪接水平和显著性水平火山图;

图2C为存在显著差异剪接的基因的转录本表达量热图;

图2D为存在显著差异剪接的转录本的表达量-剪接水平MA图;

图2E为存在显著差异剪接的转录本的剪接水平-显著性水平火山图;

图2F为存在显著差异剪接的转录本的表达量热图;

图3A为第三代单分子RNA测序、二代RNA测序和蛋白组学实验分别检测到的基因数量韦恩氏图;

图3B为在二代RNA测序和蛋白组检测中具有差异表达的可变剪接基因图;

图3C为在二代RNA测序和蛋白组检测中具有显著差异表达的基因韦恩氏图;

图4为转录本ENST00000529044在健康人和IPF患者肺组织中表达水平差异图。

具体实施方式

为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。

实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。

本发明实施例中,使用FMLRC-HISAT2-IDP策略检测AS事件和亚型,使用SMRT-seq单分子RNA测序可以获得高精度的RNA序列,其读数通过第二代RNA测序的数据进一步校正。SMRT测序是第三代测序(3GS)技术,通过在零模波导中直接检测cDNA,它可以产生平均约15,000个碱基的RNA长序列。此外,通过整合转录组和蛋白质组数据,鉴定新的IPF相关基因,并探讨了其在IPF发病机制中的作用。

本发明实施例中研究方法如下所示。

1.研究对象资料

本发明经广东省广州医科大学第一附属医院伦理委员会批准(伦理号:2018-92)。IPF肺组织采集自广州医科大学第一附属医院接受肺移植的5名终末期IPF患者和3例肺供体的健康肺组织。从每位患者获得签署的知情同意书。所有IPF患者均按照其官方IPF临床实践指南建议的标准进行诊断:(1)排除其他已知的ILD原因;(2)高分辨率计算机断层扫描(HRCT)上存在UIP模式;(3)对于接受外科肺活检的患者,诊断是通过组织病理学模式和HRCT模式的存在来做出的。

2.样品采集与制备

收集参与者肺组织样品,液氮中保存备用。

3.SMRT-seq文库构建和第三代RNA测序

按照先前描述的方案(参见:Zheng,P.,S.Sun,J.Wang,Z.J.Cheng,K.C.Lei,M.Xue,T.Zhang,H.Huang,X.D.Zhang,and B.Sun.2022.'Integrative omics analysisidentifies biomarkers of idiopathic pulmonary fibrosis',Cell Mol Life Sci,79:66.)进行RNA提取和完整性检查。使用SMARTer PCR cDNA合成试剂盒(Clontech)合成第一链cDNA,并使用PrimeSTAR GXL DNA聚合酶(Clontech)通过PCR将单链cDNA扩增12~14个循环。使用SMRTbell

4.RNA-seq文库构建和第二代RNA测序

按照先前描述的方案(参见:Zheng,P.,S.Sun,J.Wang,Z.J.Cheng,K.C.Lei,M.Xue,T.Zhang,H.Huang,X.D.Zhang,and B.Sun.2022.'Integrative omics analysisidentifies biomarkers of idiopathic pulmonary fibrosis',Cell Mol Life Sci,79:66.)构建第二代RNA-seq文库。使用Illumina TruSeq RNA样品制备试剂盒(Illumina)制备cDNA文库。根据

5.检测可变剪接事件

为了获得更高的异构体检测灵敏度,我们采用FMLRC-HISAT2-IDP策略来获得高精度的单分子RNA序列。首先,通过IsoSeq工具(Pacific Biosciences,第3版)对SMRT长读数进行预处理,以获得循环共识序列(CCS)读数。然后对CCS读数进行细化和抛光以获得更高的序列准确性。使用FastQC软件来检查CCS读数的质量。其次,将相同样本的Illumina短读数与人类参考基因组(hg19)对齐,然后使用HISAT2(版本2.2.1)检测外显子连接。第三,CCS读数通过使用FMLRC(版本1.0.0)的高精度Illumina短读数校正。然后通过GMAP工具将校正的长读数与人类参考基因组hg38进行比对。最后,通过使用IDP工具对纠错的长读取和从短读取检测到的外显子连接进行综合分析,生成转录注释文件。

6.差异剪接分析

用于差异剪接分析的统计指标是剪接百分比(PSI),它是指每个AS事件产生的所有转录本中包含特定外显子的转录本的比率。PSI的计算公式如下:

其中分子是包含外显子的转录物的总表达水平,分母是所有转录物的总表达水平,表达水平由TPM表示。

首先,使用“genePredToGtf”工具将“genePred”格式的转录注释文件转换为“Gtf”格式。然后,从RNA-seq转录组计算每个样本中转录本的丰度(以TPM为单位)。最后,使用SUPPA根据默认参数设置基于转录注释和转录丰度计算PSI。SUPPA2计算的AS事件类型包括:跳过外显子(SE)、5’剪接位点变化(A5)、3’剪接位点变化(A3)、互斥外显子(MX)、内含子保留(RI)、可变第一外显子(AF)和可变最后外显子(AL)。

7.RNA-seq数据处理

使用Trimmomatic工具(版本0.36)修剪原始RNA序列以去除接头和低质量序列(参数设置:TRAILING:20、MINLEN:235和CROP:235),然后使用FastQC软件检查读取的数据质量。然后使用HISAT2将配对末端读数与人类参考基因组hg18对齐,并使用HTSeq工具(版本0.6.0)计算映射到每个基因的读数计数。整个样本的表达水平表示为TPM(每百万映射读数的外显子模型每千碱基转录本)。使用R软件包DEGseq,筛选调整后的p值<0.05和|log2(倍数变化)|>1的基因作为显著差异表达的基因。

8.蛋白质组学数据采集与分析。

按照先前描述的方法(参见:Zheng,P.,S.Sun,J.Wang,Z.J.Cheng,K.C.Lei,M.Xue,T.Zhang,H.Huang,X.D.Zhang,and B.Sun.2022.'Integrative omics analysisidentifies biomarkers of idiopathic pulmonary fibrosis',Cell Mol Life Sci,79:66.)获得和分析肺组织样品的蛋白质组学数据。为了生成数据相关采集(DDA),将样品合并为混合物,并通过高pH值分离与八个部分进行分级。然后,通过数据独立采集(DIA)单独处理样品以评估蛋白质组差异。将iRT试剂盒(Ki3002,Biognosys AG,瑞士)添加到所有样品中,以校准提取肽峰的保留时间。使用Spectronaut 13(Biognosys AG,Switzerland)对DIA数据集进行统计分析,包括数据标准化和相对蛋白质定量。在经Welch’s ANOVA检验后,通过调整p值<0.05和倍数变化>1.5的阈值选择差异表达的蛋白质。

9.免疫组织化学

按照先前面描述的方案(参见:Zheng,P.,S.Sun,J.Wang,Z.J.Cheng,K.C.Lei,M.Xue,T.Zhang,H.Huang,X.D.Zhang,and B.Sun.2022.'Integrative omics analysisidentifies biomarkers of idiopathic pulmonary fibrosis',Cell Mol Life Sci,79:66.)制备从IPF患者和健康供体收集的组织切片。切片加入一抗(兔抗人TRIM29,SantaCruz Biotechnology,Inc.),4℃湿盒孵育过夜。洗涤和振摇后,将组织切片与二抗(抗兔,武汉服务生物科技有限公司)在室温下孵育50分钟。组织用3,3’-二氨基联苯胺(DAB)显色溶液染色,细胞核用苏木精染色溶液复染。染色的载玻片由

实施例1

本实施例检测异构体和可变剪接事件。

使用FMLRC-HISAT2-IDP策略,我们检测到来自9,009个基因的13,382个转录本,其中包括1,0475个蛋白质编码转录本和2,887个非编码转录本。其中,6069个(67.4%)基因只有一个转录本,2940个(32.6%)基因转录两个或多个转录本(图1A)。这些转录变体来自相同亚型的AS或来自相同基因的不同亚型(图1B)。在检测到的基因和转录本中,在1,942个基因中鉴定了2776个可变剪接事件,其中,1506个基因(77.5%)有1个AS事件,241个基因(12.4%)有2个AS事件,195个基因(10%)有2个以上的AS事件(图1C)。在转录变体中检测到的2,776个AS事件中,最常见的AS类型是外显子跳跃(SE)(40%),其次是可变第一外显子(AF)和5’/3’剪接位点改变(A5,A3)(图1D)。这四种剪接方法占所有剪接事件的91.6%。

实施例2

本实施例进行差异剪接分析。

首先在基因水平上分析了两组之间的差异剪接(DS)。我们计算了每个样本的1,151个基因中检测到的1,427个可变剪接事件的PSI值。30个AS事件的PSI值在IPF组和对照组之间存在显着差异(p<0.05)。MA图和火山图(图2A和图2B)显示PSI差异、转录本丰度和p值的分布。与其他基因相比,显着的DS基因具有更高的PSI差异和转录本丰度。所有样本中重要DS基因的PSI聚类热图如图2C所示。

然后在亚型水平分析了两组之间的差异剪接。我们计算了来自每个样本的7,979个基因的9,903个同种型中AS事件的PSI值。来自226个基因的458种亚型的PSI值在IPF组和对照组之间存在显着差异(p<0.05)。MA图和火山图(图2D和图2E)显示PSI差异、转录本丰度和p值的分布。重要同工型PSI的聚类热图显示IFP和对照样本中的不同模式(图2F)。

实施例3

本实施例寻找和IPF相关的特异性同工型。

本实施例联合分析了从相同样本中检测到的AS事件、转录组和蛋白质组数据集,以确定与IPF发病机制相关的可能同种型。维恩图显示了在三个组学实验中检测到的基因(图3A)。SMRT和二代测序均检测到8,586个基因的表达。在SMRT测序和蛋白质组学中检测到2,882个基因,在所有三个组学中检测到2,859个基因。

然后我们鉴定了具有显着差异转录表达和蛋白质翻译的AS基因(图3B)。包括TRIM29在内的12检测到AS事件的基因在转录和翻译中具有显着的差异表达。TRIM29在IPF肺组织中具有显着不同的PSI,同时其转录和蛋白质翻译也具有显着的差异(图3C)。

为了进一步验证这些候选基因的表达,我们用公共数据库的91个IPF转录组数据对这12个基因的表达差异进行验证。结果表明,12个基因中有11个在IPF肺组织具有显着的差异表达(调整后的p值<0.05)。

在研究了这些候选基因的已知生物学功能后,选择TRIM29作为候选IPF相关基因进行进一步验证和功能研究。TRIM29(Tripartite MotifContaining 29)是一个蛋白质编译基因,它参与与核酸结合有关的同源或异源二聚体的形成。TRIM29通过IFNγ信号通路、造血干细胞分化和p53结合等途径调节与癌变和细胞分化相关的转录。虽然没有直接证据表明TRIM29与IPF相关,但它已经在与IPF具有相似特征的病理过程中显示出影响。TRIM29是各种癌症的独立预后指标,例如非小细胞肺癌,可促进癌症转移和上皮间质转化。

实施例4

本实施例分析TRIM29转录本ENST00000529044的表达特征。

为了评估TRIM29转录本ENST00000529044在IPF中的表达特征,本实施例分析了它的AS事件、RNA转录、蛋白质定量及其在肺细胞中的亚细胞表达。在转录阶段,IPF组ENST00000529044的表达水平显著升高(图4)。

PSI和丰度之间的相关性表明,对于ENST00000529044,PSI指数与转录本的TPM呈负相关。正常组织中的AF剪接可能会减少ENST00000529044的编码能力mRNA的产生,并最终导致无法检测到的蛋白质翻译。而在IPF患者的肺组织中,选择性剪接更有利于产生大量具有编码能力的mRNA。

综上所述,本发明对特发性肺纤维化(IFP)肺组织进行第三代单分子实时RNA测序和第二代RNA测序,首次发现转录本ENST00000529044的表达水平在IFP肺组织和正常肺组织中的表达水平存在显著差异,通过对血液等样本中的转录本ENST00000529044的测定,可能准确有效的检测特发性肺纤维化,相比常规的高分辨CT和组织活检,本发明方法有着方便快捷,减少病人创伤,提高依从性等优点。

申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

相关技术
  • 特发性肺纤维化疾病诊断标志物CCT6A及其在制备诊断或预后工具中的应用
  • 特发性肺纤维化疾病诊断标志物及其制备诊断或预后工具中的应用
技术分类

06120115598666