多肽芯片及其在艾滋病诊断产品制备中的应用
文献发布时间:2023-06-19 19:28:50
技术领域
本发明涉及艾滋病诊断领域,具体而言,涉及一种多肽芯片及其在艾滋病诊断产品制备中的应用。
背景技术
艾滋病(HIV)是一种由人类免疫缺陷病毒感染引起的传染性疾病,该病毒通过攻击CD4T细胞使人体丧失免疫功能。艾滋病潜伏期长、病死率高危害性极大。艾滋病病毒在人体内平均潜伏期为8-9年,期内可以无任何症状。尚无预防艾滋病的有效疫苗及根治HIV感染的有效药物。艾滋病病毒体外生存能力极差,主要通过体液传播。艾滋病检测是防治艾滋病的关键。
HIV检测主要包括抗HIV病毒抗体检测、病毒培养、核酸检测和抗原检测。一般初筛检测都是用HIV抗体检测方法,如酶联免疫法ELISA,化学发光法和胶体金快速法等。酶联免疫法ELISA是目前HIV检测普遍采用的方法。酶联免疫吸附剂测定法,简称酶联免疫法,或ELISA法。ELISA的基础是抗原或抗体的固相化及抗原或抗体的酶标记、ELISA中酶活性、产物的量与标本中受检物质的量直接相关,根据呈色的深浅进行定性或定量分析。ELISA包括加样、温育、洗涤、显色、酶标仪读数等几个步骤。ELISA是基于酶活性为基础的,测定中影响因素较多,样本采集保存、试剂储存使用、实验温度要求较高。此外,实验室的生物安全也十分重要,对检验人员的操作技术要求也较高。
而现有的多肽芯片包含大量多肽,制造成本、检测成本和数据分析成本高,难以对艾滋病进行较低成本的检测。且大量数据与艾滋病检测无关,影响检测结果的准确性。
发明内容
本发明的主要目的在于提供一种多肽芯片及其在艾滋病诊断产品制备中的应用,以解决现有技术中的艾滋病检测条件苛刻的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种多肽芯片,该多肽芯片上包括特征多肽,特征多肽包括SEQ ID NO:1~123所示的多肽;或SEQ ID NO:1~129所示的多肽;或SEQ ID NO:1~163所示的多肽;或SEQ ID NO:1~172所示的多肽;或SEQ ID NO:1~207所示的多肽。
为了实现上述目的,根据本发明的第二个方面,提供了一种特征多肽的筛选方法,该筛选方法包括:获取样本人群的患艾滋病情况和生物样品,利用上述多肽芯片对生物样品进行检测、成像、荧光强度检测,获得多肽芯片上的多肽的荧光信号强度信息,样本人群包括健康人群和艾滋病患者群;根据荧光信号强度信息,通过统计方法筛选在艾滋病患者和健康人中存在信号差异的显著差异多肽;利用样本人群的显著差异多肽的荧光信号强度信息和患艾滋病情况,通过机器学习训练的方法,构建预测模型;在预测模型中出现的多肽,即为特征多肽。
进一步地,生物样品包括血清或血浆;优选地,统计方法包括方差阈值筛选。
进一步地,机器学习训练的方法包括:将样本人群分为训练集和测试集,建立训练集或测试集的显著差异多肽的荧光信号强度信息和患艾滋病情况的映射关系,分别得到训练数据集或测试数据集;利用机器学习方法对训练数据集构建模型,并进行五折交叉验证,通过调整惩戒因子和方差阈值,构建在不同惩戒因子和方差阈值条件下的多种初步模型;利用测试数据集,分别对多种初步模型进行验证,计算每种初步模型的准确率和召回率;准确率和召回率均大于筛选阈值的模型即为预测模型;优选地,机器学习方法包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,准确率的筛选阈值为0.7,召回率的筛选阈值为0.85。
进一步地,构建多种初步模型时,计算每种初步模型的准确率,在保证准确率的条件下,通过调整惩戒因子和方差阈值,逐步提高每种初步模型的召回率。
为了实现上述目的,根据本发明的第三个方面,提供了一种艾滋病预测模型的构建方法,该构建方法包括:a)获取样本人群的患艾滋病情况和生物样品,利用上述多肽芯片对生物样品进行检测、成像、荧光信号强度检测,提取特征多肽的荧光信号强度信息,建立生物样品的数据集,数据集包括样本人群的患艾滋病情况与生物样品中的特征多肽的荧光信号强度信息的映射关系;b)利用数据集通过机器学习训练的方法,构建预测模型;样本人群包括健康人群和艾滋病患者群。
进一步地,使用机器学习训练之前,将数据集分为训练集和测试集,利用训练集构建分类模型,利用测试集验证模型效果;优选地,机器学习训练的方法包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,特征多肽包括SEQ IDNO:1~123所示的多肽,或包括SEQ ID NO:1~129所示的多肽;或包括SEQ ID NO:1~163所示的多肽;或包括SEQ ID NO:1~172所示的多肽;或包括SEQ ID NO:1~207所示的多肽;优选地,生物样品包括血清或血浆。
为了实现上述目的,根据本发明的第四个方面,提供了一种用于艾滋病诊断的电子装置,该电子装置包含诊断模型,诊断模型为利用上述构建方法构建而得,诊断模型是以多肽芯片对于待测样品的检测结果作为模型输入,输出诊断结果,检测结果包括利用多肽芯片对待测样品进行检测、提取特征多肽的荧光信号强度信息而得;优选地,生物样品包括血清或血浆;优选地,特征多肽包括SEQ ID NO:1~123所示的多肽,或包括SEQ ID NO:1~129所示的多肽;或包括SEQ ID NO:1~163所示的多肽;或包括SEQ ID NO:1~172所示的多肽;或包括SEQ ID NO:1~207所示的多肽。
为了实现上述目的,根据本发明的第五个方面,提供了一种计算机可读储存介质,该储存介质包括存储的程序,其中,在程序运行时,控制储存介质所在设备执行上述筛选方法、或构建方法。
为了实现上述目的,根据本发明的第六个方面,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述筛选方法、或构建方法。
为了实现上述目的,根据本发明的第七个方面,提供了一种特征多肽在制备诊断和/或治疗艾滋病的产品中的应用,其中,特征多肽包括包括SEQ ID NO:1~123所示的多肽;或SEQ ID NO:1~129所示的多肽;或SEQ ID NO:1~163所示的多肽;或SEQ ID NO:1~172所示的多肽;或SEQ ID NO:1~207所示的多肽。
进一步地,应用包括在制备诊断艾滋病产品、制备预测艾滋病治疗效果产品、或制备艾滋病靶向药物中的应用;优选地,上述诊断艾滋病产品包括多肽芯片。
应用本发明的技术方案,上述多肽芯片利用特征多肽,相较于现有的多肽芯片,多肽条数大大减少,利用该多肽芯片能够精准检测与艾滋病有关的特征多肽,检测成本低。相较于现有技术中的HIV抗体检测方法,对实验条件和检测人员的要求更低。上述多肽芯片能够大大扩展艾滋病检测的应用场景,实现利用多肽检测技术对样本HIV感染的有效检测。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例2的样本数据聚类分析图,其中灰点为患者,白点为正常人。
图2示出了根据本发明实施例2的训练集拟合混淆矩阵示意图;其中,0为健康人,1为患者,TN为真阴性,FN为假阴性,TP为真阳性,FP为假阳性。
图3示出了根据本发明实施例2的训练集模型的ROC曲线示意图。
图4示出了根据本发明实施例2的测试集拟合混淆矩阵示意图;其中,0为健康人,1为患者,TN为真阴性,FN为假阴性,TP为真阳性,FP为假阳性。
图5示出了根据本发明实施例2的所有126501个多肽进行T检验得到的p值绘制出的火山图,其中不连续的白点为SEQ ID NO:1~123的多肽。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,在现有技术中的艾滋病检测方法中,影响因素较多,且对样本采集保存、试剂储存使用、实验温度、生物安全、检测人员的操作技术等要求均较高。因而,在本申请中发明人尝试探究何种多肽组合能够用于制备诊断艾滋病的产品,通过从大量的实验数据中进行分析筛选,获得了能够用于制备诊断艾滋病的产品的特征多肽。因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种多肽芯片,该多肽芯片上包括特征多肽,特征多肽包括SEQ ID NO:1~123所示的多肽;或SEQ ID NO:1~129所示的多肽;或SEQ ID NO:1~163所示的多肽;或SEQ ID NO:1~172所示的多肽;或SEQ ID NO:1~207所示的多肽。
多肽芯片是将一系列多肽片段固定到载体上,用来检测相配对的未知蛋白的一种检测技术。该技术可以检测病毒感染后引起的血清免疫反应。已被用于进行抗体鉴定及验证、自身免疫疾病研究、肿瘤标志物研究、过敏原研究和传染性疾病研究等。该技术与其它抗体检测技术相比,具有高稳定性以及设计的灵活性。纯化学合成的多肽分子表面自身带有保护基,多肽芯片的有效期得以大大延长。室温条件下保存超过两年的多肽芯片仍具有完全的生物学活性。多肽芯片的设计灵活,高密度、高通量,芯片上的探针蛋白可以根据实际需求设计,可同时测得上万个蛋白-多肽的生化反应。
将由上述特征多肽组成的多肽设置在此种多肽芯片上,相较于现有的多肽芯片,设置的多肽条数大大减少(此处多肽芯片上可以是仅由上述多肽组合组成,也可以是在含有上述多肽组合的基础上,也含有少量其他的多肽,但整体上比现有用于筛选这些特征多肽的多肽芯片上的多肽数量少很多,比如少5000条、少6000条、少7000条、少8000条少、少9000条、少10000条、或者甚至少11000多条),大大减少与HIV感染无关的免疫信息,降低数据分析成本,降低多肽芯片的制备和检测成本,且同时具有现有技术中多肽芯片的高稳定性、高通量等优点,样本与多肽芯片的结合是基于蛋白质间相互作用,且荧光信号检测过程对温度不敏感、对实验环境要求更低。芯片可长期常温放置无需冷藏,多肽芯片实验流程可全自动化。不仅实验过程简单,降低实验员在操作过程中感染的风险的同时也将环境对结果的影响降到最低。利用此种多肽芯片,能够低成本、高效率的对待测者是否患有艾滋病进行检测。
在本申请第二种典型的实施方式中,提供了一种特征多肽的筛选方法,该筛选方法包括:获取样本人群的患艾滋病情况和生物样品,利用上述多肽芯片对生物样品进行检测、成像、荧光强度检测,获得多肽芯片上的多肽的荧光信号强度信息,样本人群包括健康人群和艾滋病患者群;根据荧光信号强度信息,通过统计方法筛选在艾滋病患者和健康人中存在信号差异的显著差异多肽;利用样本人群的显著差异多肽的荧光信号强度信息和患艾滋病情况,通过机器学习训练的方法,构建预测模型;在预测模型中出现的多肽,即为特征多肽。
在一种优选的实施例中,生物样品包括血清或血浆;优选地,统计方法包括方差阈值筛选。
在一种优选的实施例中,机器学习训练的方法包括:将样本人群分为训练集和测试集,建立训练集或测试集的显著差异多肽的荧光信号强度信息和患艾滋病情况的映射关系,分别得到训练数据集或测试数据集;利用机器学习方法对训练数据集构建模型,并进行五折交叉验证,通过调整惩戒因子和方差阈值,构建在不同惩戒因子和方差阈值条件下的多种初步模型;利用测试数据集,分别对多种初步模型进行验证,计算每种初步模型的准确率和召回率;准确率和召回率均大于筛选阈值的模型即为预测模型;优选地,机器学习方法包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,准确率的筛选阈值为0.7,召回率的筛选阈值为0.85。
对于准确率和召回率的阈值,可根据实际情况和需求进行灵活选择。在本申请中,筛选阈值优选为,准确率大于0.7,召回率大于0.85。
在一种优选的实施例中,构建多种初步模型时,计算每种初步模型的准确率,在保证准确率的条件下,通过调整惩戒因子和方差阈值,逐步提高每种初步模型的召回率。
在上述方法中,利用多肽芯片对样本人群(包括健康人和艾滋病患者)的生物样品进行检测,从而获得多肽芯片上的多肽的荧光信号强度信息。利用多肽芯片产生的数据,已知芯片上的大量多肽能够与生物样品中的抗体结合,因而能无偏地利用受试样本的免疫表征获取个体血清中的抗体谱。
基于HIV阳性个体在HIV感染后和正常未感染个体免疫系统会出现明显的差异,根据荧光信号强度信息,通过统计方法筛选在艾滋病患者和健康人中有差异的显著差异多肽。使用这些显著差异多肽进行建模,通过机器学习的方法识别相应特征。利用训练数据集的数据,通过不断训练和优化模型相应参数及所需显著差异多肽,构建合适的可用于预测样本HIV感染情况的模型。最后,通过另一批独立的测试数据集,对HIV感染情况进行预测,能够进一步验证模型的结果。在上述筛选方法中,使用机器学习的算法构建模型判断结果,能够确保检测结果的准确、可靠。
在本申请第三种典型的实施方式中,提供了一种艾滋病预测模型的构建方法,上述构建方法包括:a)获取样本人群的患艾滋病情况和生物样品,利用上述多肽芯片对生物样品进行检测、成像、荧光信号强度检测,提取特征多肽的荧光信号强度信息,建立生物样品的数据集,数据集包括样本人群的患艾滋病情况与生物样品中的特征多肽的荧光信号强度信息的映射关系;b)利用数据集通过机器学习训练的方法,构建预测模型;样本人群包括健康人群和艾滋病患者群。
在一种优选的实施例中,使用机器学习训练之前,将数据集分为训练集和测试集,利用训练集构建分类模型,利用测试集验证模型效果;优选地,机器学习训练的方法包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,特征多肽包括SEQ ID NO:1~123所示的多肽,或包括SEQ ID NO:1~129所示的多肽;或包括SEQ IDNO:1~163所示的多肽;或包括SEQ ID NO:1~172所示的多肽;或包括SEQ ID NO:1~207所示的多肽;优选地,生物样品包括血清或血浆。
在本申请第四种典型的实施方式中,提供了一种用于艾滋病诊断的电子装置,该电子装置包含诊断模型,诊断模型为利用上述构建方法构建而得,诊断模型是以多肽芯片对于待测样品的检测结果作为模型输入,输出诊断结果,检测结果包括利用多肽芯片对待测样品进行检测、提取特征多肽的荧光信号强度信息而得;优选地,生物样品包括血清或血浆;优选地,特征多肽包括SEQ ID NO:1~123所示的多肽,或包括SEQ ID NO:1~129所示的多肽;或包括SEQ ID NO:1~163所示的多肽;或包括SEQ ID NO:1~172所示的多肽;或包括SEQ ID NO:1~207所示的多肽。
上述预测模型为利用健康人群和艾滋病患者的特征多肽的荧光信号强度信息和患病情况的对应关系,训练计算机获得的预测模型。在健康人群和艾滋病患者的生物样品中存在差异抗体,差异抗体与多肽芯片上得特征多肽相结合,能够显示出不同的荧光信号强度信息,利用该模型能够通过处理受试者的特征多肽的荧光信号强度信息,输出是否患有艾滋病。上述电子装置中内置有预测模型,向该装置中输入受试者的特征多肽的荧光信号强度信息,电子装置即能够输出诊断的结果。
用于检测生物样品的荧光信号强度信息的装置为多肽芯片检测装置,可以包括荧光成像仪(如Melecular Device Image Xpress Micro-4)、芯片离心机(如Labnet C1303T-230V)、洗板机(如BioTek Instruments,405TSUVS)、振荡器(如96孔板轨道式振荡器,Thermo scientific,88880026)、混匀器(如恒温混匀器,Eppendorf Thermomixer C)。在实际使用中,检测装置可根据具体使用的需求进行灵活增加或减少。
在本申请第五种典型的实施方式中,提供了一种计算机可读储存介质,该储存介质包括存储的程序,其中,在程序运行时,控制储存介质所在设备执行上述筛选方法、或构建方法。
在本申请第六种典型的实施方式中,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述筛选方法、或构建方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加检测装置等硬件设备的方式来实现。基于这样的理解,本申请的技术方案中数据处理的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在储存介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分的方法。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
显然,本领域的技术人员应该明白,上述的本申请的部分模块或步骤可以在通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
在本申请第七种典型的实施方式中,提供了一种特征多肽在制备诊断和/或治疗艾滋病的产品中的应用,上述特征多肽包括包括SEQ ID NO:1~123所示的多肽;或SEQ IDNO:1~129所示的多肽;或SEQ ID NO:1~163所示的多肽;或SEQ ID NO:1~172所示的多肽;或SEQ ID NO:1~207所示的多肽。
利用上述特征多肽制备的用于诊断艾滋病的产品,能够通过与待测样品相结合,通过多肽与待测样品的免疫变化,判断个体HIV感染情况,实现利用多肽检测技术对样本HIV感染的有效检测。上述特征多肽为从现有多肽芯片中筛选获得的特征多肽,利用上述特征多肽即能够检测测试者是否患有艾滋病。相较于现有多肽芯片中成千上万种多肽,上述特征多肽中包含的多肽数量少,制备成本低,且能够降低检测产生的数据量和工作量。
在一种优选的实施例中,应用包括在制备诊断艾滋病产品、制备预测艾滋病治疗效果产品、或制备艾滋病靶向药物中的应用;优选地,诊断艾滋病产品包括多肽芯片。
多肽能够识别HIV感染的理论基础是其与HIV抗体有稳定结合能力,在疗效好的艾滋病人体内CD4 T细胞数量上升,能够刺激B细胞产生更高的HIV抗体滴度,并且这些抗体也能够结合多肽并提供更强的信号,因此上述特征多肽具有预测艾滋病治疗效果的应用。
HIV感染与正常样本在进行多肽芯片检测时,其实质是特征多肽会与HIV感染的样本发生免疫反应,从而与正常样本之间显示出荧光信号强度的差异,这些显示出信号差异的特征多肽因此能够应用于辅助疫苗或相关药物的开发。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1多肽芯片实验及数据产生过程
1.样本制备
本申请的训练集的样本来源为219例可用血液/血清样本,其中198例为HIV患者样本,21例样本为健康人样本。测试集的24例样本来源于谱元科技提供的20例HIV阳性、4例阴性样本。以上所有的HIV患者及健康对照均通过艾滋病检测的金标准ELISA/免疫印迹实验(westernblot,WB)判断。
1)样本上样
血清或者血浆样本用1%D-甘露醇(D-mannitol)溶液,于96孔深孔板中,经两次25倍稀释,得到625倍稀释的待测样本板备用。
2)芯片的水化和组装
将芯片置于芯片水化用具中,加入超纯水没过芯片,在轨道摇床上55±5rpm/min,水化20min。然后用异丙醇喷洒芯片表面后将芯片放入离心机离心干燥。干燥好的芯片按照实验设计的位置组装成分析盒(assay cassette)。
本申请实施例中所用多肽芯片为Health Tell公司V13芯片,该芯片上有24个重复的多肽阵列,每个阵列上分别有130000多种多肽,这130000种多肽是分别由5-13个无偏差的随机氨基酸组合形成的多肽序列。
3)样本与芯片孵育结合
将稀释好的样本按照90μL/孔加入组装好的芯片上,置于恒温振荡仪上振荡孵育1小时。
4)样本清洗
将assay cassette置于洗板机进行清洗。
5)荧光二抗孵育
用0.75%的酪蛋白(Casein)溶液配制2nM的荧光二抗溶液,按40μL/每孔加入到assay cassette中,置于恒温振荡仪上振荡孵育1小时。
6)二抗清洗
同步骤3)。
7)成像
将assay cassette中的芯片进行拆卸、清洗、干燥后组装进成像盒(imagingcassette),放入Molecular Device公司的ImageXpress micro4成像仪进行扫描成像。最终每个检测样本得到一张TIFF图片文件,即为原始数据。
2.数据提取
1)使用自己编写的MIAMI pipeline分别对每个样本产生的TIFF图片进行网格化(需要说明的是,现有技术的中的网格化处理软件
均可以完成对每个样本产生的TIFF图片进行网格化,比如HealthTell自带的网格化处理软件),然后提取特征(此处的特征指差异肽段)的荧光强度数值,输出1个GPR5数据文件和1个corner images文件。其中,GPR5文件包含了一个样本的所有信息和所有特征的荧光信号强度信息。
2)从所有样本的GPR5数据文件中提取特征的荧光信号强度信息,生成原始荧光强度(FG,foreground)数据矩阵。然后对每个样本的数据分别进行对数转换得到LFG(log-transferred foreground)数据矩阵、进行z-score的标准化处理获得NLFG(normalizedand log-transferred foreground)数据矩阵。该步骤还会生成一个样本芯片信息文件,该文件包括了样本阵列位置、所用芯片编号等信息。
3.质量控制
3.1单样本质控
1)过饱和分析
质控指标:单样本原始荧光强度数值(FG)超出成像仪检测上限的特征(即多肽片段)的比例。
质控标准:上述比例≤1%为合格。
质控不合格时的处理方法:调整曝光时间对该芯片重新进行扫描至该比例≤1%。
2)荧光信号分布分析
质控指标:针对单样本对数转化后的荧光强度信号(LFG)绘制频率密度图,分别判断空白对照、标准样品和待测样品分布是否正常。
质控标准:针对空白对照,确认信号呈窄脉宽高峰值分布,LFG分布峰值在3以内;针对标准样品和待测血清样品,确认信号总体呈正偏态分布,且峰值远大于空白对照。
质控不合格时的处理方法:若空白对照和标准品异常,则相应芯片内检测样品质控失败;若待测样品异常,则该样品需要确认样品质量,并考虑重新上样。
3)网格化定位准确性质控
质控指标:对阴性对照外的每个样本进行Mask Analysis分析获得的Adjusted RSquare和Root Mean Square(RMS)。
质控标准:Adjusted R Square≥0.3且RMS≥0.3为合格。
质控不合格时的处理方法:人工检查corner images的网格化情况,如果人工确认网格化不正确则该样本质控不通过,需重新检测。
4)离群值分析
质控指标:一张芯片(24个样本,除去阴性对照)上离群值所代表的特征所占比例≤2%的样本数量。
质控标准:上述样本数量不超过2个,则该芯片通过质控。
质控不合格时的处理方法:该芯片上所有样本需要重新进行实验。
5)质控多肽均值(coefficient of variation,CV)分析
质控指标:单样本内质控多肽信号强度的CV均值。
质控标准:上述CV均值≤1%为合格。
质控不合格时的处理方法:该样本需要重新进行实验。
3.2系统稳定性质控
对该批次检测的所有的标准品(每张芯片一个标准品,即1个标准品/24个样本)的信号强度进行相关性和CV值分析,进行系统稳定性的质控。
1)标准品相关性
质控指标:该批次检测的所有标准样品的信号强度的相关系数。
质控标准:上述相关系数≥0.8为合格。
质控不合格时的处理方法:该批样本需要重新进行实验检测。
2)标准样品CV均值
质控指标:该批次检测的所有标准样品的信号强度的CV均值。
质控标准:上述CV均值≤4%则合格。
质控不合格时的处理方法:该批样本需要重新进行实验检测。
4.数据预处理:
1)获取原始数据FG:
使用多肽芯片技术V13芯片依照以上标准流程进行样本检测,获得V13芯片126501个肽段的信号值,称每个肽段信号值为特征,其值域为0~65535,将原始数据称为FG(foreground)并存储于GPR5格式文件中。
2)进行数据校正:
从GPR5格式的数据矩阵中提取每个多肽的原始数据FG,因为原始荧光信号数据呈Log-Norm分布,所以将FG加上常数100后对其进行对数转换获得LFG(Log-FG),以提高同方差性,数据的测量精度与强度大致成正比;将每个Array的多肽信号LFG减去该Array的全部多肽的中位数,获得标准化后的数据NLFG。
实施例2
1.特征多肽筛选
本申请使用V13多肽芯片矫正后的NLFG数据(实验及数据预处理过程见实施例1),每个样本包含126051个特征(即126501个肽段的信号值)。
首先将219个训练集的数据使用Sklearn的PCA模块进行降维(n_components=2),所有训练集样本结果如图1(其中灰点为患者,白点为正常人)。绝大部分正常样本都能聚在一起,正常样本与HIV感染样本区分度较好,则认为该批数据可用于模型预测。由于原始数据的特征过多,需要对训练集进行特征工程,即只选取重要的特征进行建模预测。用训练集的219例样本,利用Python的sklearn库中feature selection的方差阈值(VarianceThreshold)筛选的方法做差异分析。方差阈值是一种过滤器,特征工程中的方差阈值筛选是一种过滤器法,设定一个阈值后,会移除那些在整个数据集中特征的方差小于该阈值的特征。基于生物学方面考虑,当某些特征数值落入范围基本一致时,即上下限变化不大时,可以考虑移去该特征,故选用方差阈值的特征工程方式。使用阈值VarianceThreshold(threshold=0.9*(1-0.9)),筛选出在艾滋病患者和正常样本差异分析结果中大于这个阈值的所有特征,该步骤初筛共选出832个多肽。后续步骤中,将会在这832个多肽中进行进一步的筛选。
本申请模型及特征多肽筛选程序开发环境是Jupyter Notebook Python 3.8.5,主要使用的包有:sklearn、numpy、pandas、seaborn和matplotlib。
2.训练模型
在筛选得到特征多肽后,为了能够得到最优的区分HIV感染阳性及正常样本的模型,需要使用机器学习的方法建模,并结合模型评估的结果调整相应参数对模型进行训练。建模使用的测试数据集中为219个测试样本初筛得到的823条多肽信号。
本发明建模方法使用sklearn库的SVM模块的SVC模型,即支持向量机的SVC函数中的线性核(SVC参数:(kernel=”linear”,probability=True,random_state=100,class_weight="balanced"))对特征多肽进行建模预测。为了防止过拟合,我们选用通过五折交叉验证对训练集进行模型训练。交叉验证法是在建模中常用到的一种手段,其中K折交叉验证是一种有效的减小模型过拟合的一种方式。用这种方法可以更好的验证模型是否真实有效,同时进行模型参数的调节,使模型在训练集中达到一个更好的效果后再在测试集上进行预测评估。将训练集数据分成5组,其中一个子集数据作为测试组,其余4个子集数据作为训练组。重复5次,每次均随机分出测试组和训练组。最终将得到的5次计算的模型测试准确率的均值作为这组(C)下模型的准确率。对于SVM模型,C为惩罚因子是最主要的参数,该值越大对错误的容忍度越小,可能发生过拟合,C太小会导致容错率过高,这样的模型就没有意义。同时通过调整方差阈值T来调整模型输入特征多肽的数目,计算不同特征条件下模型的准确性。选取调整C值:0.7-1和特征选择的阈值(用T表示,T=a*(1-a),下文中用T(a)表示,括号内数字表示a的取值)。T(0.8)~T(0.85)的范围内参数调整结果见表1和表2。在保证判断准确的条件下,通过调整C和T,逐渐提高模型在训练集上的预测指标数值,如准确率,召回值等。召回率和准确率是主要用来评估该模型的指标,其准确率变化如表1、表2所示,召回率变化如表3、表4所示。
精准率(precision):TP/(TP+FP),正确预测为正,占全部预测为正的比例。
召回率(recall):TP/(TP+FN),正确预测为正,占全部正样本的比例。
表1调整训练集参数T和C,准确率变化的结果
表2调整训练集参数T和C,准确率变化的结果
表3调整训练集参数T和C,召回率变化的结果
表4调整训练集参数T和C,召回率变化的结果
3.模型验证
使用训练集中相同模型及参数,对不同来源的验证数据集,进行分析验证该模型的实际表现情况。沿用上文训练集中选取特征的方差阈值T(0.8)~T(0.9)和拟合过训练集后同样参数(C:1-0.7)的SVC模型(SVC参数:kernel=”linear”,,probability=True,random_state=100,class_weight="balanced"),SVC函数的C值和特征阈值T,相应的准确率和召回率如下表5、表6、表7所示。
表5测试集参数T调整的结果-准确率
表6测试集参数T调整的结果-召回率
表7测试集参数T调整的结果-阈值确定
表7说明,当T的取值选择a大于0.85,直到0.9时,模型预测结果不理想。
由模型预测结果可知,在方差阈值T(a>0.85)后模型会出现过拟合。即训练集在相同情况下准确率指标的数值与测试集相比,测试集的指标低于训练集,即认为模型在该参数下在拟合训练集后泛化效果不好,即出现过拟合问题。因此方差阈值范围:T(a)应为a取值为0.82-0.85范围内为佳,SVC的C值应取0.7-0.9能得到更好的召回率和准确率。当T(a)中a取值分别为0.82、0.824、0.838、0.84、0.85的情况下,模型中用到的多肽分别如表10、表10+表11、表10+表11+表12、表10+表11+表12+表13、表10+表11+表12+表13+表14所示(注:“表10+表11”表示表10和表11中的全部多肽,其他类似表示方式意思也类似)综合训练集的训练结果和测试集的预测结果来看,当取阈值T(a=0.82),即Threshold=0.82×(1-0.82),C值取0.8(SVC参数=(C=0.8,kernel=”linear”,probability=True,random_state=100,class_weight="balanced"))时能在数据上获得最好的效果。该参数情况下,模型测试集中准确率达到83%,recall率达到94%,即94%的阳性样本能够被检测到。此时训练集模型拟合后得到的混淆矩阵如图2所示,ROC如图3所示,AUC数值为0.97。模型对测试集预测后得到的混淆矩阵如图4所示。模型在训练集上的F1、召回率、敏感性等如表8;在测试集上的混淆矩阵如图4,F1、敏感性、特异性等值如表9。
F1分数(F1 Score),是统计学中用来衡量二分类模型精确度的一种指标。一般取值范围在0-1之间,认为F1值越接近1,模型效果越好。
表8
表9
当阈值为Threshold=(0.82(1-0.82))时,模型中选取的123个特征多肽的编号和序列如表10所示,将这123个特征多肽在训练集的火山图上用白点标出,如图5所示。其中P.adj为校正后的P值,FDR为误报率。
表10
/>
/>
改变T的取值,将使得模型中纳入的多肽数量改变。当T=(0.824×(1-0.824))时,在前述123个肽段的基础上,模型会自动增加6个特征多肽(共129个)如表11。模型表现如表3所示。
表11
当T=(0.838×(1-0.838))时,在前述129个肽段(表10+表11)的基础上,模型会自动增加34个特征多肽(共163个)如表12。模型表现如表3所示。
表12
当T=(0.84×(1-0.84))时,在表10+表11+表12的163个多肽的基础上,额外增加的9个特征多肽(共172个)如表13。
表13
当T=(0.85×(1-0.85))时,在表10+表11+表12+表13的172个多肽的基础上,额外增加35个特征多肽(共207个)如表14。
表14
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本发明利用多肽芯片技术,使用已知的训练数据集筛选出可用于诊断HIV的显著差异多肽。通过机器学习方法从显著差异多肽中筛选出上述特征多肽,并建立了预测模型。对待测样本/测试集样本进行多肽芯片检测后,可获取相应特征多肽的信号值,将信号值输入训练好的模型,经过模型计算后得到每个样本相应HIV阳性/阴性的概率,根据对应概率和模型内的设定阈值,模型会输出样本最终判断的结果(阳性/阴性)。同时,本发明发现的能用于诊断HIV的特征肽段,还可用于设计/定制专门的多肽芯片。
本发明可以基于多肽芯片实验技术,对样本HIV病毒感染检测。相比较目前常用的艾滋病诊断方式酶联免疫法ELISA相比,样本与多肽芯片结合基于蛋白质间相互作用且荧光信号检测过程对温度不敏感、对实验环境要求更低。芯片可长期常温放置无需冷藏,多肽芯片实验流程可全自动化。不仅实验过程简单,降低实验员在操作过程中感染的风险的同时也将环境对结果的影响降到最低。且在判断HIV感染结果不是直接由显色反应的强弱判断,而是在读取特征多肽的荧光信号(即荧光信号强度信息)后,使用机器学习的算法构建模型、判断结果,确保检测结果的准确、可靠。多肽芯片检测技术从实验到结果输出均可实现全自动化,保证了检测结果的稳定性。每个芯片得到一张TIFF图片文件即为原始数据。原始数据在通过激光扫描系统和软件进行图像扫描、数据预处理、质控、分析及结果解释,整个实验及数据处理过程具有高通量、自动化、灵敏度高和多元分析等优点。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110>珠海碳云智能科技有限公司
<120>多肽芯片及其在艾滋病诊断产品制备中的应用
<130>PN175523SZTY
<160>207
<170>SIPOSequenceListing 1.0
<210>1
<211>6
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(6)
<223>多肽
<400>1
Gly Ala Pro Pro Asp Gly
1 5
<210>2
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>2
Ser Ser Ala Lys Lys Val Phe Ser Asp
1 5
<210>3
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>3
Asp Asp Phe Ser Asp Gly Ala Asn Lys Glu
1 5 10
<210>4
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>4
Lys Arg Arg Pro Trp Phe Ser His Ser Asp
1 5 10
<210>5
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>5
Ser Ala Pro Gly Lys Val Ser Asp Gly
1 5
<210>6
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>6
Gly Ser Pro Val Arg Val Leu Glu
1 5
<210>7
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>7
Ser Ser Arg Arg Phe Glu Asp Gly
1 5
<210>8
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>8
Ser Ser Pro Lys Arg Val Gly Phe Asp
1 5
<210>9
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>9
Pro Lys Lys Gln Val Pro Arg Glu Asp
1 5
<210>10
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>10
Leu Gly Ala Gly Gly Tyr Gly
1 5
<210>11
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>11
Ser Ser Arg Val Ser Ala Lys His Glu
1 5
<210>12
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>12
Asn Asn Ser Ser Tyr Asp Gly
1 5
<210>13
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>13
Ser Ser Lys Asp Trp Asn His Asp Gly
1 5
<210>14
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>14
Asn Gly Lys Leu Val Ser Leu Ser Gly
1 5
<210>15
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>15
Pro Pro Ala Trp Gly Ser Arg Gly
1 5
<210>16
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>16
Trp Arg His Asn Gln Lys Tyr Val Pro Val Glu
1 5 10
<210>17
<211>5
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(5)
<223>多肽
<400>17
Leu Leu Gln Pro Gly
1 5
<210>18
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>18
Leu Val Gln Pro Gln Phe Asp Gly
1 5
<210>19
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>19
Pro Pro Tyr Trp Asn Lys Asn Lys Pro Asp Gly
1 5 10
<210>20
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>20
Gly Ala Pro Asn Leu Glu Gly Arg Leu Asp
1 5 10
<210>21
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>21
Ser Ser Lys Gly Ala Glu Asp Gly
1 5
<210>22
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>22
Ser Ser Arg Val Arg His Glu
1 5
<210>23
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>23
Ser Ser Arg Ala Ser Asp Gly
1 5
<210>24
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>24
Arg Arg Val Phe Phe Arg Glu Asp
1 5
<210>25
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>25
Ser Ser Lys Trp Val Glu Asp
1 5
<210>26
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>26
Leu Arg Gln Pro Glu Asp Gly
1 5
<210>27
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>27
Asp Gly Val Lys Phe Ser Tyr Gln His Ser
1 5 10
<210>28
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>28
Lys Leu Leu Gly Ala Phe Asp Pro Arg His Asp
1 5 10
<210>29
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>29
Ser Ser Lys Ser Glu Asp Pro Lys Gly
1 5
<210>30
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>30
Ser Ala Arg Pro Arg His Tyr Ala Val Glu
1 5 10
<210>31
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>31
Tyr Asp Gly Glu Pro Leu Ser Tyr Asp Gly
1 5 10
<210>32
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>32
Ser Ser Arg His Ser Ser Glu Asp
1 5
<210>33
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>33
Gly Ser Pro Leu Leu Glu Asp
1 5
<210>34
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>34
Gly Ala Pro Ser His Glu Gly
1 5
<210>35
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>35
Ser Ser Lys Val Phe Glu Pro Tyr Gly
1 5
<210>36
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>36
Lys Leu Leu Asn Ser Gln His Ser Gly
1 5
<210>37
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>37
Lys Leu Leu Asn Ala Asn Gln Gly
1 5
<210>38
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>38
Asn Pro Val Glu Gly Ala Val Ser Ala Arg Asp
1 5 10
<210>39
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>39
Val Arg Ser Asp Gly Glu His Leu Ser
1 5
<210>40
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>40
Ser Ser Arg Asn Lys Leu Ser Asp
1 5
<210>41
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>41
Asn Val Asn Gln Tyr Asn Ser Asn Asp Gly
1 5 10
<210>42
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>42
Asn Tyr Val Asp His Val Leu Asn His Glu Gly
1 5 10
<210>43
<211>6
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(6)
<223>多肽
<400>43
Ser Ser Arg Arg Glu Asp
1 5
<210>44
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>44
Gly Ala Pro Arg Leu Ser Asp Ser Gly
1 5
<210>45
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>45
Ser Ala Lys Pro Phe Asp Pro Leu Ser
1 5
<210>46
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>46
Ser Ser Lys Phe Lys His Val Phe Asp
1 5
<210>47
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>47
Ser Ala Pro Val Arg Val Gly
1 5
<210>48
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>48
Gln Asp Val Lys Tyr Val Ser Glu
1 5
<210>49
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>49
Asn Lys Leu Val Ala Tyr Val Asp Gly
1 5
<210>50
<211>5
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(5)
<223>多肽
<400>50
Ser Ser Lys Ala Gly
1 5
<210>51
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>51
Ser Ser Lys Glu Asn Lys Leu Glu
1 5
<210>52
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>52
Ser Ser Lys Glu Gln Arg Ser Gly
1 5
<210>53
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>53
Ser Ala Lys Glu Asp Ala Phe Asp Pro Asp Gly
1 5 10
<210>54
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>54
Val Ala Gln Lys Gln Ser Pro Lys Leu Phe
1 5 10
<210>55
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>55
Ser Ala Lys Asp Phe Ser Gln Arg His Val
1 5 10
<210>56
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>56
Pro Pro Ala Trp His Arg Ala Gln Ser Gly
1 5 10
<210>57
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>57
Ser Ser Lys Arg His Gly Asp Gly
1 5
<210>58
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>58
Lys Leu Val Asn Ser Glu Trp Ser Glu
1 5
<210>59
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>59
Ser Ser Arg Pro Asn Gln Lys His Phe Ser
1 5 10
<210>60
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>60
Ser Ser Arg Ser Trp Ser Glu Gly
1 5
<210>61
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>61
Gly Ser Pro Leu Pro Glu Asp Gly
1 5
<210>62
<211>12
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(12)
<223>多肽
<400>62
Lys His Ala Ser Asp Asn Phe Glu Tyr His Ser Asp
1 5 10
<210>63
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>63
Ser Asp Phe Asp Gly Glu Pro Gln Arg Phe Gly
1 5 10
<210>64
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>64
Ser Ala Lys Asp Ser Tyr Lys His Phe Ser
1 5 10
<210>65
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>65
Ser Ser Arg Gly Phe Asp Gly
1 5
<210>66
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>66
Ser Ser Lys Gly Ser Glu Gly
1 5
<210>67
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>67
Gln Asp Tyr Asp Asp Pro Asp Gly
1 5
<210>68
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>68
Ala Glu Tyr Trp Lys Tyr Lys Lys Gly
1 5
<210>69
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>69
Val Lys Val Asp Asn Gln Leu Asn Phe Gly
1 5 10
<210>70
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>70
Gly Ala Pro Ala Gln Asp Arg Leu Gly
1 5
<210>71
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>71
Gly Ala Pro Tyr Gly Lys Leu Gly
1 5
<210>72
<211>5
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(5)
<223>多肽
<400>72
Ser Ser Lys Pro Gly
1 5
<210>73
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>73
Gly Ala Pro Ser Glu Asn Lys Val Asp
1 5
<210>74
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>74
Arg Ser Glu Ala Asp Tyr His Glu Tyr His Glu
1 5 10
<210>75
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>75
Gly Ala Pro Val His Phe Glu
1 5
<210>76
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>76
Gly Ala Val Leu Pro Leu Ala Asp Gly
1 5
<210>77
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>77
Ser Ser Lys Tyr Val Phe Glu Gly
1 5
<210>78
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>78
Ser Ser Lys Leu Gly Pro Glu Gly
1 5
<210>79
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>79
Tyr Asp Ser Ala Asp Gly Asp Gly
1 5
<210>80
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>80
Ser Ser Arg Phe Lys Val Asp Gly
1 5
<210>81
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>81
Leu Gly Lys Leu Leu Asp Ala Gln Gly
1 5
<210>82
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>82
Ser Ala Lys Ala Asp Phe Asp Gly
1 5
<210>83
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>83
Ala Ser Arg Pro Lys His Ser Asn Glu Asp
1 5 10
<210>84
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>84
Pro Pro Lys Trp Leu Arg Glu Gly
1 5
<210>85
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>85
Tyr Gln Lys Ser Val Pro Gln Glu Phe Gly
1 5 10
<210>86
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>86
Gly Ala Pro Arg Asn Gln Leu Asp Gly
1 5
<210>87
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>87
Ser Ser Arg Glu Tyr Glu Gly
1 5
<210>88
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>88
Ser Ala Lys Asn Val Glu Val Phe Gly
1 5
<210>89
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>89
Ser Ser Lys Asn His Val Phe Ser Glu
1 5
<210>90
<211>6
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(6)
<223>多肽
<400>90
Gly Ala Pro His Gln Gly
1 5
<210>91
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>91
Gly Ala Pro Leu Gln Val Leu Ser Asp
1 5
<210>92
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>92
Pro Pro Lys Trp Gly Trp Lys Asp
1 5
<210>93
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>93
Lys Gly Asn Asn Glu Lys Glu Asp
1 5
<210>94
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>94
Lys Asp Asn Tyr Phe Asp Gln Lys Val Ser
1 5 10
<210>95
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>95
Asn Asp Gly Asp Glu Gly Gly
1 5
<210>96
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>96
Val Lys Glu Ala Pro Ala Asn Phe Asp
1 5
<210>97
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>97
Asn Asn Ser His Arg Glu Gly
1 5
<210>98
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>98
Ser Ala Lys Ser Arg Val Phe Leu Asp
1 5
<210>99
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>99
Asn Asn Ser Ser Leu Glu Gly
1 5
<210>100
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>100
Gly Ala Pro Gln Asp Lys Arg Glu Asp
1 5
<210>101
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>101
Lys Leu Trp Gln Val Tyr Asn Glu Arg Ser Glu
1 5 10
<210>102
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>102
Ser Ala Lys Pro Leu Phe Glu Leu Gly
1 5
<210>103
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>103
Tyr Gln Lys Asp Arg Val Gly Asp Ala Val Glu
1 5 10
<210>104
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>104
Ser Pro Pro Arg Lys Leu Gly
1 5
<210>105
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>105
Gly Ala Pro Gly Ala Arg His Leu Gly
1 5
<210>106
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>106
Gly Ala Pro Pro Ala Trp Lys Ser Asp
1 5
<210>107
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>107
Ser Ser Arg Ser Gln Ser Asp Gly
1 5
<210>108
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>108
Gln Asn Glu Leu Asp Pro Gln Lys Asp
1 5
<210>109
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>109
Asp Val Lys Phe Phe Glu Asp Gly
1 5
<210>110
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>110
Ala Ser Ala Pro Lys Lys Leu Phe Ser
1 5
<210>111
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>111
Gly Ala Pro Ala Ser Glu Pro Asn Lys Asp
1 5 10
<210>112
<211>6
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(6)
<223>多肽
<400>112
Ser Ser Lys Asp Asp Gly
1 5
<210>113
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>113
Gly Ser Pro Val Pro Arg Val Phe Gly
1 5
<210>114
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>114
Asp Val Lys Phe Ala Arg His Phe Glu
1 5
<210>115
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>115
Ser Ser Lys Val Gln Asp Gly
1 5
<210>116
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>116
Asp Gln Val Lys Phe Val Glu Gly
1 5
<210>117
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>117
Gly Ala Pro Phe Ala Asn Gln Gly
1 5
<210>118
<211>6
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(6)
<223>多肽
<400>118
Gly Ala Pro His Lys Gly
1 5
<210>119
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>119
Gly Ala Pro Leu Leu Ser Gly
1 5
<210>120
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>120
Lys Ala Val Pro Leu Glu Ala Gly
1 5
<210>121
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>121
Ala Lys Gly Phe Pro Tyr Lys Trp Ser Gly
1 5 10
<210>122
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>122
Ser Ser Lys Trp Gln His Ser Asp Gly
1 5
<210>123
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>123
Ser Gln Lys Ser Phe Pro Val Phe Glu
1 5
<210>124
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>124
Ser Ser Arg Gly Glu Asp Gly
1 5
<210>125
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>125
Ser Ser Lys Ser Tyr Lys Phe Ser Gly
1 5
<210>126
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>126
Ala Asp Ser Ser Ala Lys Leu Ser Asp
1 5
<210>127
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>127
Val Ala Asp Val Ser Glu Tyr His Gly
1 5
<210>128
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>128
Ser Ala Lys Phe Ser Tyr Pro Ala Gly
1 5
<210>129
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>129
Gly Ser Pro Arg Pro Phe Glu Gly
1 5
<210>131
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>131
Lys Ala Glu Leu Gly Lys Arg Gly
1 5
<210>130
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>130
Ser Ser Val Pro Tyr Gln Lys Phe Glu
1 5
<210>132
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>132
Gly Ala Pro Asn Asp Pro His Ser Glu
1 5
<210>133
<211>12
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(12)
<223>多肽
<400>133
Lys Ser Asp Gly Ala Gln Tyr Asn Ala His Ser Gly
1 5 10
<210>134
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>134
Pro Val Pro Ala Glu Arg Leu Pro Val Gly
1 5 10
<210>135
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>135
Ser Ser Lys Arg Leu Ala Trp Arg Val Glu
1 5 10
<210>136
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>136
Ser Ser Lys His Gln His Val Ser Gly
1 5
<210>137
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>137
Lys Asp Arg Pro Gly Ala Arg Leu Phe
1 5
<210>138
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>138
Gly Arg Pro Val Pro Tyr Glu Gly
1 5
<210>139
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>139
Leu Ser His Gly Ala Ser Lys Phe Glu
1 5
<210>140
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>140
Ser Ala Arg Pro Phe Glu Ala His Asp
1 5
<210>141
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>141
Ser Ala Lys Ala Ser His Phe Glu
1 5
<210>142
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>142
Asn Asn Val Phe Lys Arg Ala Glu Asp
1 5
<210>143
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>143
Pro Val Pro Asn Asp Glu Gly Lys Ser Glu
1 5 10
<210>144
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>144
Ser Ala Lys His Phe Ser Gln Tyr Val Gly
1 5 10
<210>145
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>145
Gly Leu Gly Pro Lys Phe Val Glu Asp
1 5
<210>146
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>146
Pro Pro Arg Trp Ser Ser Glu
1 5
<210>147
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>147
Arg Asp Ser Arg Tyr Asn Val Gly
1 5
<210>148
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>148
Gly Ser Pro Pro Arg Phe Ser Gly
1 5
<210>149
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>149
Asn Asn Val Gln Lys Leu Gly Asn Glu Gly
1 5 10
<210>150
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>150
Glu Gln Phe Trp Lys His Gly Asn Arg Ser Gly
1 5 10
<210>151
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>151
Ser Ser Leu Pro Arg His Val Glu
1 5
<210>152
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>152
Ser Ser Lys Lys Phe Ser Gly
1 5
<210>153
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>153
Asn Asn Ser Ala Asn Asn His Glu Asp
1 5
<210>154
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>154
Glu Arg Arg Pro Phe Glu Asp Gly
1 5
<210>155
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>155
Lys Arg Asp Pro Asp Ser Ala Asn Phe Gly
1 5 10
<210>156
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>156
His Asn Ser Ser Gly Asp Gly
1 5
<210>157
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>157
Ala Asn Ser Ser Leu Asp Glu Gly
1 5
<210>158
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>158
Asn Asn Lys Pro Gln Arg Asp Phe Asp
1 5
<210>159
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>159
Gly Ser Pro Phe Lys His Gly
1 5
<210>160
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>160
Ser Ser Arg Leu Tyr Asn Arg His Glu
1 5
<210>161
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>161
Ser Asn Ser Ser Val Leu Ser Asp
1 5
<210>162
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>162
Gly Lys Val Gly Pro Arg His Arg Asp Gly
1 5 10
<210>163
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>163
Lys Gly Val Asn Asn Lys Phe Glu Asp
1 5
<210>164
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>164
Asn Asn Leu Val Pro Gln Lys Glu Asp
1 5
<210>165
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>165
Pro Pro Asn Trp Ser Ser Gly
1 5
<210>166
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>166
Asn Asp Ser Ser Asp Pro Arg Phe Ser Gly
1 5 10
<210>167
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>167
Asp Ser Asp Gly Glu Pro Phe Glu Asp
1 5
<210>168
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>168
Ser Arg Lys Asp Val Leu Phe Ser
1 5
<210>169
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>169
Gln Asp Phe Trp Lys Lys His Gly
1 5
<210>170
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>170
Glu Gly Gly His Leu Ser Arg Phe Glu
1 5
<210>171
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>171
Gly Ala Pro Lys Leu Asn Lys Phe Gly
1 5
<210>172
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<400>172
Trp Arg Lys Val Leu Glu Glu Pro Lys Gly
1 5 10
<210>173
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>173
Phe Val Lys Ala Glu Asp Gly
1 5
<210>174
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>174
Asn Asn Lys Gln Pro Gln Ser Glu Gly
1 5
<210>175
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>175
Gly Asn Pro Asp Gln His Ser Gly
1 5
<210>176
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>176
Asn Asn Gly Gly Asn Gln Lys Asp
1 5
<210>177
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>177
Ser Ala Arg Val Pro Glu Gly Asn Asp
1 5
<210>178
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>178
Asn Asn Asn Asn Lys Val Leu Glu Gly
1 5
<210>179
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>179
Gly Ser Pro Ser Pro Glu Asp Gly
1 5
<210>180
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>180
Ala Lys Pro Phe Arg Ala Lys Asp Gly
1 5
<210>181
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>181
Val His Glu His Gly Pro Lys Phe Ser Asp
1 5 10
<210>182
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>182
Gln Arg Asn His Val Ser Lys Lys Glu Asp
1 5 10
<210>183
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>183
Phe Lys Lys Pro Ser Glu Asp
1 5
<210>184
<211>12
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(12)
<223>多肽
<400>184
Asn Asn Lys Phe Glu Asp Pro Val Gln Lys Arg Gly
1 5 10
<210>185
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>185
Ser Asn Ser Ala Asp Asn Gln Val Phe Gly
1 5 10
<210>186
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>186
Ser Gln Phe Trp Lys Ser Glu Asn Gly
1 5
<210>187
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>187
Gly Arg Pro Leu Leu Ser Glu
1 5
<210>188
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>188
Asn Pro Pro Ser Trp Asn Lys Arg Glu
1 5
<210>189
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>189
Lys Tyr Asp Pro Asp Ala Asn Arg Glu
1 5
<210>190
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>190
Asn Asn Ala Ser Gly Pro Ser Asp
1 5
<210>191
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>191
Val Asp Leu Val Asn Ser Glu Gly
1 5
<210>192
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>192
Asn Asn Glu Gly Pro Gly Asn Lys Gly
1 5
<210>193
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>193
Ser Ser Pro Ser Lys Val Glu Gly
1 5
<210>194
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>194
Gly Val Pro Val Lys Arg Asp Gly
1 5
<210>195
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>195
Lys Leu Val Ser Val Lys Asp Gly
1 5
<210>196
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>196
Asn Asn Asn Gly Gln Lys Arg Leu Asp
1 5
<210>197
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>197
Gly Lys Pro Val Pro Trp Glu Gly
1 5
<210>198
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>198
Phe Ser Lys Gln Val Ser Pro Ser Asp
1 5
<210>199
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>199
Pro Val Pro Asp Phe Ala Lys Gly
1 5
<210>200
<211>7
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(7)
<223>多肽
<400>200
Ser Ala Lys Gln Asp Glu Gly
1 5
<210>201
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>201
Ala Ser Asp Tyr Tyr Glu Tyr Gln Gly
1 5
<210>202
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>202
Asn Asn Gly Ala Pro Tyr Lys Arg Ser Asp
1 5 10
<210>203
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>203
Ser Ala Lys Gly Arg Val Glu Asn Glu Asp
1 5 10
<210>204
<211>10
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(10)
<223>多肽
<400>204
Lys Leu Val Gly Leu Ser Gly Lys Glu Gly
1 5 10
<210>205
<211>9
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(9)
<223>多肽
<400>205
Ser Asn Lys Ala Val Pro Arg Phe Asp
1 5
<210>206
<211>11
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(11)
<223>多肽
<400>206
Ala Asp Glu Gly Pro Tyr Lys Pro Lys Phe Gly
1 5 10
<210>207
<211>8
<212>PRT
<213>人工序列(Artificial Sequence)
<220>
<221>VARIANT
<222>(1)..(8)
<223>多肽
<400>207
Pro Asn Lys Ser Val Pro Phe Glu
1 5
- 多肽芯片或试剂盒及其在诊断非小细胞肺癌中的应用
- 多肽芯片或试剂盒及其在诊断非小细胞肺癌中的应用