鉴定蛋白质或蛋白质组的存在和/或浓度和/或量的方法
文献发布时间:2024-04-18 19:58:30
技术领域
本发明涉及鉴定样本内一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量的方法。
背景技术
蛋白质是包含氨基酸序列的生物聚合物。蛋白质组学是对蛋白质的大规模研究。它允许蛋白质的鉴定和定量。在蛋白质组学领域,有多种已建立的方法来鉴定样本内蛋白质的存在与否。鉴定样本中是否存在亚蛋白质组或蛋白质组是有挑战性的,因为这涉及其所有蛋白质的顺序鉴定。一些蛋白质组学方法允许定量样本内蛋白质的浓度或量。
鉴定样本中蛋白质存在的最常用方法是质谱。质谱测量样本中存在的离子的质荷比。样本的质谱是离子信号与质荷比的函数图。光谱用于确定样本的同位素特征和粒子的质量,其用于提供化学化合物的化学身份或结构。然而,质谱是劳动密集型的并且不是固有定量的,因为不同的肽被电离并且以不同的效率被检测。为了克服这一点,使用了诸如同位素编码的亲和标记(ICAT)的方法,但这仅允许对鉴定的蛋白质的一部分进行定量。大多数定量质谱方法仅允许确定样本中蛋白质浓度或量的相对变化,而不是样本的绝对定量。质谱蛋白质组学的覆盖范围也是有限的,特别是对于高等有机体。分析整个蛋白质的“自顶向下”质谱蛋白质组学仅允许对10%的所研究蛋白质进行蛋白质鉴定,并且分析已被消化成片段的蛋白质的“自底向上”质谱蛋白质组学允许对8至25%的所研究蛋白质进行蛋白质鉴定。由于所获得的质谱的复杂性,混合物和复杂样本必须分离成其组分,例如通过二维凝胶电泳或高效液相色谱法(HPLC),然后可以用质谱顺序分析它们。
鉴定蛋白质存在的替代方法是使用蛋白质微阵列。蛋白质微阵列将蛋白质阵列或探针阵列固定在支持物表面上,并且特别适用于多重检测。将标记的探针或标记的蛋白质添加到阵列中,并且检测蛋白质与探针之间的结合相互作用。然而,蛋白质微阵列是劳动密集型的并且缺乏再现性和准确性。检测需要表面附近的结合事件,并且因此,结合事件以及由此检测的准确性可能受到该表面的影响。此外,通过该方法只能鉴定已经具有对应探针的蛋白质,诸如特异性抗体。
几种方法已经旨在经由蛋白质的物理参数特性鉴定蛋白质,例如Zhang等人,“微流体平台上自顶向下的蛋白质组学(Top-down proteomics on a microfluidicplatform)”(2019),电子打印1910.11861arXiv physics.bio-ph。在该微流体方法中,使用蛋白质的流体动力学半径(RH),其为它在溶液中的大小,与来自蛋白质内Trp/Lvs和Tyr/Lys残基的荧光信号的比率用于蛋白质鉴定。赖氨酸(Lys)残基是荧光标记的,并且色氨酸(Trp)和酪氨酸(Tyr)残基是未标记的。对7种已知的蛋白质进行4次测量,并且当第四次测量蛋白质获得的值与另外三次测量蛋白质获得的值匹配时,鉴定蛋白质。虽然显示在一组实验条件下测量的值是已知蛋白质的特性,因为测量的蛋白质基于这些值是彼此可区分的,但是对于目的蛋白质,不能预测这些值。不能预测R
替代地,现有技术包括新开发的蛋白质测序方法,诸如Swaminathan,J等人《自然生物技术(Nat Biotechnology)》36,1076-1082(2018)。稀疏荧光测序对单个肽片段分子进行经典的埃德曼(Edman)降解测序,该单个肽片段分子在其固定到表面上之前已经在特定氨基酸上被荧光标记,并且当荧光标记的氨基酸从肽N-末端顺序裂解时观察到荧光从表面消失的模式。荧光减少的模式揭示了被读取的肽中标记的氨基酸的位置,并且提供了稀疏的肽序列。基于蛋白酶裂解特异性、表面附接化学、标记化学和标记的氨基酸在目的蛋白质的预测肽片段内的位置的信息丰富的约束,可以预测目的蛋白质的这些稀疏肽序列。实际上,这种劳动密集型和数据密集型方法易于从各种来源出错,并且对于单个纯化的肽,大约40%的时间观察到正确的读数。未评价该方法的定量。该方法依赖于与色谱分离方法如HPLC和/或质谱联用,以在进行测序之前首先验证每个肽片段中的所有氨基酸,诸如所有赖氨酸和所有半胱氨酸氨基酸被定量荧光标记。尽管鉴定了双组分混合物中的肽片段,但这需要经由表面附接在表面的不同位置将肽片段在空间上彼此分离,使得对于每种肽可以观察到不同的荧光消失痕迹。与传统的埃德曼测序一样,该方法缓慢,一个埃德曼循环需要1小时,不适于分析N-末端修饰的肽,并且不适于读取长度大于30个氨基酸的肽片段。公认的是,由于依赖于埃德曼测序,该方法更适于鉴定短肽而不是长蛋白质分子。人类蛋白质组中蛋白质分子的平均长度为558个氨基酸。使用该方法不可能分析蛋白质或蛋白质组的混合物。
已认识到需要开发基于质谱的蛋白质鉴定的简单和通用的备选方案,其允许将整个蛋白质鉴定为目的蛋白质。公认需要一种表征复杂蛋白质混合物,例如疾病相关的蛋白质混合物的有效方法。非常需要快速和通用的诊断任何感染的方法。优选地,这些方法能够进行蛋白质定量。因此,需要更高效、成本有效和通用的方法来鉴定样本内目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
发明内容
本发明基于以下发现:标记和测量样本中的两种或更多种氨基酸类型可以鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。这基于测量的标记、氨基酸浓度或样本中每种标记的氨基酸类型的氨基酸数目。
已经发现每种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组具有基于每种浓度的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的标记值、氨基酸浓度或两种或更多种氨基酸类型的氨基酸数目的独特特征。
蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型中的每一种的标记值或氨基酸浓度的特征对于每种浓度的每种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组是独特的。蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型中的每一种的氨基酸数目的特征对于每种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组也是独特的。
因此,可以将样本的特征与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的特征进行比较,以鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型的已知标记值或氨基酸浓度的特征是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度的函数,并且对于每种浓度的每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组是独特的。因此,可以将样本中两种或更多种氨基酸类型的测量的标记或氨基酸浓度的值与样本中标记了目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或亚蛋白质组的相同两种或更多种氨基酸类型的已知标记值或氨基酸浓度进行比较,以提供样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量的阳性鉴定。目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型的氨基酸数目的特征对于每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组是独特的。因此,可以将样本中两种或更多种氨基酸类型中的每一种的氨基酸数目与样本中标记了目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的氨基酸数目进行比较,以提供样本中存在的阳性鉴定。
在一些实施例中,这种比较可以使用n维空间来可视化,其中维度的数目等于在本发明的方法中标记和测量的n种氨基酸类型的数目。例如,两种标记的氨基酸类型在2维空间中可视化,并且三种标记的氨基酸类型在3维空间中可视化。随着在样本中标记和测量每种附加的氨基酸类型,该维度空间增加。两种或更多种氨基酸类型的标记的氨基酸浓度或值在n维空间中呈一条线。两种或更多种氨基酸类型各自的氨基酸数目在n维空间中呈一个点。样本中标记的n种氨基酸类型有n种维度。
已经发现,为了鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量,仅需要测量两种或更多种氨基酸类型的标记、氨基酸浓度或氨基酸数目。标记和测量两种或更多种氨基酸类型对本发明的方法是必需的,因为当标记和测量两种或更多种氨基酸类型时,这为每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组提供了独特的特征。需要标记和测量两种氨基酸类型,因为如果仅标记和测量一种氨基酸类型,则所有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组将具有相同的参考线。当样本点与p个目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的p条线比较时,同时确定样本中每个目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度、存在和/或浓度和/或量的函数。在该溶液相方法中,通过将样本中鉴定的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度乘以样本中溶液的体积来简单地确定样本中所含蛋白质的量。测量样本中每种氨基酸类型的标记、氨基酸浓度或氨基酸数目不是必需的或有效的。
目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组和蛋白质组都具有两种或更多种氨基酸类型的已知标记值、氨基酸浓度或氨基酸数目的独特特征。不必知道或怀疑样本含有什么种类的分子(即蛋白质、肽、寡肽、多肽、蛋白质复合物、混合物、亚蛋白质组或蛋白质组)来确定样本中目的种类的成员的存在和/或浓度和/或量。例如,样本中标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),测量的色氨酸(W)标记用于确定样本中色氨酸(W)的浓度,并且测量的赖氨酸(K)标记用于确定样本中赖氨酸(K)的浓度。样本含有10.9μM W和27.9μM K。针对目的蛋白质鸡蛋清溶菌酶和目的蛋白质组HIV鉴定样本。鸡蛋清溶菌酶每个蛋白序列具有6个W和6个K氨基酸,并且HIV每个蛋白序列具有10.9个W氨基酸和27.9个K氨基酸。鉴定样本中不存在鸡蛋清溶菌酶,因为没有鸡蛋清溶菌酶的蛋白质浓度,这将导致测量样本的特征。然而,样本的特征(10.9μM W和27.9μM K)与1μM蛋白质浓度的HIV的特征(10.9W和27.9K)相同,并且因此鉴定了样本中1μM HIV的存在。
分别与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同氨基酸类型的已知标记值、氨基酸浓度或氨基酸数目相比,样本中每种标记的氨基酸类型的标记、氨基酸浓度或数目是重要的,而不是与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中氨基酸的顺序相比样本中氨基酸的顺序。用于肽和蛋白质鉴定的其它现有技术方法需要确定样本的肽或蛋白质序列内的氨基酸顺序。
标记样本中的两种或更多种氨基酸类型。氨基酸类型由R基团定义,即侧链。R基团是每种氨基酸类型特有的。一种氨基酸类型的R基团与所有其它氨基酸类型的R基团不同。例如,色氨酸(W)的R基团是吲哚基团。每个W氨基酸具有吲哚基团。因此,W氨基酸类型由吲哚R基团定义。在另一实例中,赖氨酸(K)的R基团是ε-伯氨基团。每个K氨基酸具有该ε-伯氨基基团。因此,K氨基酸类型由ε-伯氨基R基团定义。在另一实例中,酪氨酸(Y)的R基团是苯酚基团。每个Y氨基酸具有苯酚基团。因此,Y氨基酸类型由苯酚R基团定义。氨基酸类型W的R基团可区别于氨基酸类型K的R基团和氨基酸类型Y的R基团。因此,氨基酸类型W可区别于氨基酸类型K和氨基酸类型Y,因为在这些氨基酸类型之间R基团不同。所有的氨基酸类型通过其特定的R基团彼此区分。在一些实施例中,氨基酸类型独立于其它氨基酸类型被标记。在一些实施例中,被标记的是氨基酸类型的每个氨基酸的R基团。在一些实施例中,每个R基团(即每种氨基酸类型)具有独特的标记,并且因此每个R基团(即每种氨基酸类型)独立于其它R基团(即其它氨基酸类型)被标记。在一些实施例中,两种或更多种R基团(即两种或更多种氨基酸类型)用相同的标记标记,但每个标记的R基团(即每个标记的氨基酸类型)与另一个标记的R基团(即另一个标记的氨基酸类型)检测不同。在一些实施例中,每个标记靶向氨基酸类型。在一些实施例中,每个标记对氨基酸类型是特定的。
在一些实施例中,两种或更多种氨基酸类型选自丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(S)、硒代半胱氨酸(O)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)或合成氨基酸。在一些实施例中,氨基酸类型包含修饰的氨基酸和/或未修饰的氨基酸。在一些实施例中,氨基酸类型包含修饰的氨基酸。在一些实施例中,氨基酸类型包含未修饰的氨基酸。在一些实施例中,氨基酸类型包含修饰的和未修饰的氨基酸。在一些实施例中,当修饰的和未修饰的氨基酸类型的氨基酸都被标记时,修饰的氨基酸首先被转换为未修饰的氨基酸。
在一些实施例中,样本中的蛋白质用其荧光仅在与目的氨基酸类型反应后“开启”的分子荧光标记。因此,不需要从未反应的染料中分离标记的氨基酸,因为未反应的染料不是荧光的并且不提供信号。在肽或蛋白质鉴定的其它现有技术方法中,在肽或蛋白质鉴定可能发生之前需要从未反应的染料中分离标记的氨基酸。
测量该样本中每种标记的氨基酸类型的标记。例如,如果样本中标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则测量色氨酸(W)的标记,并且测量赖氨酸(K)的标记。
在一些实施例中,每种氨基酸类型的测量的标记用于计算样本中该标记的氨基酸类型的浓度和/或该标记的氨基酸类型的氨基酸数目。每种氨基酸类型的测量的标记可以与氨基酸类型的浓度、氨基酸类型的氨基酸数目和样本的浓度中的每一个线性相关。例如,如果样本中标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则测量色氨酸(W)的标记,并且测量赖氨酸(K)的标记。测量的色氨酸(W)标记用于计算样本中色氨酸(W)的氨基酸浓度和/或色氨酸(W)氨基酸的数目和/或样本的浓度。测量的色氨酸标记与色氨酸氨基酸浓度、色氨酸氨基酸数目和样本浓度中的每一个线性相关。测量的赖氨酸(K)标记用于计算赖氨酸(K)的氨基酸浓度,和/或赖氨酸(K)氨基酸数目,和/或样本浓度。测量的赖氨酸标记与赖氨酸浓度、赖氨酸氨基酸数目和样本的蛋白质浓度中的每一个线性相关。
在一些实施例中,使用校准曲线或标准将测量的标记(例如信号)的值转换为样本中标记的两种或更多种氨基酸类型中的每一种的氨基酸浓度。校准曲线或标准示出仪器的响应如何随分析物的已知浓度变化。标准或校准曲线提供了每种氨基酸类型的一种或多种已知氨基酸浓度的标记值。这种转换可以应用于样本或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组。例如,校准曲线揭示了对于氨基酸类型色氨酸(W),为了确定在10μM W的氨基酸浓度下目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的已知标记值,将该氨基酸浓度乘以100AU/uM,因为这是校准曲线的斜率。由校准曲线或标准指示的计算被称为校准函数或校准因子。如果值乘以或除以标量,则使用校准因子,并且如果执行附加步骤,则使用校准函数。例如,100AU/uM是校准因子。不需要在每次测量样本时计算校准曲线或标准,而是可以将这些曲线或标准供应给仅需要测量其样本中两种或更多种标记的氨基酸类型的标记(例如,信号)的用户,并且可以提供每种氨基酸类型的校准函数或因子。在该实施例中,样本的存在和/或浓度和/或量的阳性鉴定基于样本的每种标记的氨基酸类型的氨基酸浓度。样本中每种标记的氨基酸类型的测量的标记可以与样本中该氨基酸类型的浓度、样本中该氨基酸类型的每个蛋白质的氨基酸数目和/或样本的蛋白质浓度线性相关。
在一些实施例中,通过将每种标记的氨基酸类型的氨基酸浓度除以样本的摩尔蛋白质浓度来计算样本中每种标记的氨基酸类型的氨基酸数目。因此,必须知道样本的摩尔蛋白质浓度,以便使用样本中氨基酸数目的值。在该实施例中,样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在的阳性鉴定可以基于样本中每种标记的氨基酸类型的氨基酸数目。
如果将目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸浓度或n个氨基酸的已知标记值绘制为其浓度的函数,则这提供了n维空间中的线,由此可以使用该线的方程确定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度。在一些实施例中,该线起源于原点。在替代实施例中,该线包含对应于已知浓度范围内的浓度的氨基酸浓度或已知标记值。样本中标记的氨基酸类型的氨基酸浓度或测量的标记在n维空间中呈一个点。可以将样本的点与n维空间中的线进行比较,以鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
例如,如果存在4种目的蛋白质;蛋白质-A、蛋白质-B、蛋白质-C和蛋白质-D以2维空间表示,其中一维和二维分别是半胱氨酸(C)和色氨酸(W)的标记值。在样本中标记并且测量半胱氨酸(C)和色氨酸(W)氨基酸类型。图1将样本中标记为2维空间中的点的半胱氨酸(C)和色氨酸(W)氨基酸类型的测量的标记值相对于分别表示为4种目的蛋白质中每一种的2维空间中的线的半胱氨酸(C)和色氨酸(W)的已知标记值绘制。将半胱氨酸(C)和色氨酸(W)氨基酸类型的已知标记值绘制为目的蛋白质的蛋白质浓度的函数;蛋白质-A、蛋白质-B、蛋白质-C和蛋白质-D。对于四种目的蛋白质中的每一种,已知的标记值在2维空间中呈不同的线。
在一些实施例中,该线是参考线。在图1中,四种目的蛋白质中的每一种的参考线上的每个点对应于相应目的蛋白质的浓度。当目的蛋白质的蛋白质浓度增加时,由其参考线提供的每种氨基酸类型的已知标记值从其原点进一步移动。用阴影圆圈示出对应于1μM的每种目的蛋白质的浓度的点。测量样本中每个半胱氨酸(C)和色氨酸(W)氨基酸类型的标记值,并且用空心方块示出该点。在一些实施例中,计算样本点和每条参考线之间的最短距离。
在一些实施例中,样本点位于目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考线上。鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在,以及目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度是这样的浓度,对于该浓度,样本中标记的两种或更多种氨基酸类型中的每一种的标记或氨基酸浓度的测量值等同于样本中标记的相同的两种或更多种氨基酸类型中的每一种的标记或氨基酸浓度的已知值。
在其它实施例中,样本点不在参考线上,并且计算样本点和参考线之间的距离。在一些实施例中,该距离是连接样本点和参考线的向量或线段到参考线的长度。样本点最接近目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考线上的单个点,对应于单个浓度的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的n种氨基酸类型的标记的氨基酸浓度或已知值。
在一些实施例中,如果样本点与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考线上的该最近点之间的距离小于或等于误差容限,则在样本中鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在。在一些实施例中,误差容限是距离阈值。如果在样本中鉴定了目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在,则它以样本点最接近的参考线上的点的蛋白质浓度存在。
在图1中,样本点和对应于四种目的蛋白质的四条参考线之间的最短距离是样本点和蛋白质-B的参考线之间的距离。鉴定样本中目的蛋白质-B的蛋白质的存在。目的蛋白质-B的蛋白质的参考线上的每个点示出了目的蛋白-B的蛋白质的不同蛋白质浓度的半胱氨酸(C)和色氨酸(W)氨基酸类型的标记值。样本被鉴定为提供最小距离的蛋白质-B参考线上的点的蛋白质浓度。此处,样本的蛋白质浓度为0.5μM。因此,可以对样本中的目的蛋白质-B的蛋白质进行阳性鉴定,并且同时确定样本中0.5μM的目的蛋白质B的蛋白质的浓度。
在一些实施例中,如果样本的摩尔蛋白质浓度是已知的并且因此样本中的两种或更多种氨基酸类型的氨基酸数目的值是可用的,则将相同的对应两种氨基酸类型的氨基酸数目绘制在n维空间中,从而为每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组提供点。每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组仅有一个点。因此,可以将样本的点与每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的点进行比较,并且如果样本的点与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的点相同,则在样本中鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在。在一些实施例中,可以计算样本点与每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的点之间的距离,并且如果样本点与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的点之间的距离小于或等于误差容限,则在样本中鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在。
在一些实施例中,如果样本中每种标记的氨基酸类型的测量的标记和/或浓度和/或氨基酸数量与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或亚蛋白质组中的样本中标记的相同氨基酸类型的已知标记值和/或浓度和/或氨基酸数目相等或在其误差容限内,则可以对样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量进行阳性鉴定。例如,如果样本中色氨酸(W)氨基酸的氨基酸浓度和赖氨酸(K)氨基酸的氨基酸浓度与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的色氨酸(W)氨基酸的氨基酸浓度和赖氨酸(K)氨基酸的氨基酸浓度相等或在其误差容限内,则可以对样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量进行阳性鉴定。
在一些实施例中,计算样本中标记的两种或更多种氨基酸类型的标记、氨基酸浓度或氨基酸数目的测量值与为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组提供的两种或更多种氨基酸类型的标记、氨基酸浓度或氨基酸数目的已知值之间的最小距离,并且将该距离与误差容限进行比较。
在一些实施例中,为一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种提供的两种或更多种氨基酸类型的已知标记值、氨基酸浓度和/或氨基酸数目是参考。在一些实施例中,参考是从数据库获得的。替代地,可以计算参考。
必须将样本中每种标记的氨基酸类型的单元(即测量的标记、氨基酸浓度和/或氨基酸数目)与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组(例如参考)中相同氨基酸类型的相同单元(即已知的标记值、氨基酸浓度和/或氨基酸数目)进行比较。例如,如果在样本中确定了W和Y的氨基酸数目,则必须将其与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组(例如参考)中的W和Y的氨基酸数目进行比较,以便将样本的单元(氨基酸数目)与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同单元(氨基酸数目)进行比较。如果确定样本中W和Y的氨基酸浓度,则必须将其与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组(例如参考)中W和Y的氨基酸浓度进行比较,从而将样本的单元(氨基酸浓度)与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同单元(氨基酸浓度)进行比较。如果样本中W和Y的测量的标记不用于确定样本中W和Y的氨基酸浓度或氨基酸数目,则必须将样本中W和Y的测量的标记与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组(例如参考)的W和Y的已知标记值进行比较,使得样本的单元(测量的标记)与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同单元(已知标记值)进行比较。例如,将样本中W和Y的测量荧光强度与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组(例如参考)中W和Y的已知荧光强度进行比较。
在一些实施例中,如果对样本测量的单元(即测量的标记、氨基酸浓度和/或氨基酸数目)不同于目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的单元(即已知的标记值、氨基酸浓度和/或氨基酸数目),则将目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的单元转换为对样本测量的相同单元。在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的特定氨基酸类型的氨基酸数目乘以蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度,以提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种氨基酸类型的氨基酸浓度。例如,如果在样本中测量了W和Y的氨基酸浓度,则将一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的W和Y氨基酸的数目转换为每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的W和Y的对应氨基酸浓度。这允许样本的该单元与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同单元进行比较,即样本中W和Y的测量氨基酸浓度与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中W和Y的氨基酸浓度进行比较。
在一些实施例中,根据每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列和/或关于翻译后修饰的任何实验信息计算一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中对应氨基酸类型的已知标记值、氨基酸浓度和/或氨基酸数目。在一些实施例中,使用氨基酸序列和/或关于每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的翻译后修饰的任何实验信息来计算一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的样本中标记的每种氨基酸类型的氨基酸数目。例如,如果样本中标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则根据目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个蛋白质序列计算目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中色氨酸(W)氨基酸的数目和赖氨酸(K)氨基酸的数目。例如,如果样本中标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),并且样本中目的蛋白质是牛血清白蛋白,则根据牛血清白蛋白的氨基酸序列计算牛血清白蛋白氨基酸序列中色氨酸(W)和赖氨酸(K)氨基酸的数目为2W和59K。作为另一实例,如果经由本文所公开的方法已知目的蛋白质在赖氨酸(K)氨基酸上具有3个翻译后修饰,使得这些赖氨酸氨基酸不与标记反应,则将-3添加到该目的蛋白质的赖氨酸氨基酸数目中。
在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列是已知的(例如,从数据库获得)。在一些实施例中,使用本领域的标准技术(例如埃德曼降解或质谱)确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列。
在一些实施例中,使用本文所公开的方法确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种标记的氨基酸类型的氨基酸数目,即标记两种或更多种氨基酸类型、测量标记并且使用测量的标记确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种氨基酸类型的氨基酸数目,或含有每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中每种氨基酸类型的氨基酸浓度。以这种方式,可以确定其氨基酸序列未知或不完全已知的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
在一些实施例中,它是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型中的每一种的数目,而不是蛋白质序列中两种或更多种氨基酸类型中的每一种的顺序或蛋白质序列中两种或更多种氨基酸类型中的每一种的相对组成,其用于计算一种或多种浓度的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的这些氨基酸类型的对应氨基酸浓度和/或已知标记值。
已经发现,每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的标记或氨基酸浓度的已知值的独特特征可以根据每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度的共同参数用向量函数或参数方程组来提供。在一些实施例中,该向量函数或参数方程组描述并且用于计算本文所公开的参考线,使得参考线可以定量地与样本点比较以鉴定样本内一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。参数方程组将一组量描述为被称为参数的共同自变量的函数。参数方程组可以替代地表示为等效向量函数,其可以简化以后的计算。将样本中测量的两种或更多种标记的氨基酸类型的标记或氨基酸浓度的值与相同的两种或更多种氨基酸类型的标记或氨基酸浓度的已知值进行比较,该已知值作为每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的(未知)浓度的函数提供,允许鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组以及同时鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度和/或量。任选地,这可以通过创建描述任何目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的向量函数或参数方程组来实现。
在一些实施例中,参数方程组提供了在目的蛋白质、肽、寡肽、多肽或蛋白质复合物中对两种或更多种氨基酸类型测量的氨基酸浓度的特征。描述目的蛋白质、肽、寡肽、多肽或蛋白质复合物的参数方程的数目是样本中标记和测量的两种或更多种氨基酸类型的数目。参数方程描述了在目的蛋白质、肽、寡肽、多肽或蛋白质复合物的样本中标记和测量的两种或更多种氨基酸类型中的每一种的氨基酸浓度作为浓度t的函数。参数方程组1为:
其中p
替代地,参数方程组1可以被共同描述为描述相同参考线或参考曲线的向量函数。这些表示是可互换的。在该表示中,向量函数1为:
其中p
例如,存在2种目的蛋白质和1种目的蛋白质复合物。第一种目的蛋白质是BSA。在样本中标记并且测量K(a
鸡蛋清溶菌酶(LYZ)是第二种目的蛋白质。a
甲状腺素运载蛋白是目的蛋白质复合物。a
BSA的向量方程提供了n维空间(3维空间,因为在实验中标记和测量了3种类型的氨基酸)中BSA的参考线,LYZ的向量方程提供了n维空间中LYZ的参考线,以及TTR的向量方程提供了n维空间中TTR的参考线。这些向量方程和对应的参考线与样本点一起绘制在图2中。为了鉴定样本中这些目的蛋白质或蛋白质复合物中的一种的存在和/或浓度和/或量,计算并且比较样本点与为BSA、LYZ和TTR提供的参考线中的每一条之间的距离。
先前,没有可用于鉴定样本内整个蛋白质组或亚蛋白质组的方法。需要经由分离样本中包含蛋白质组或亚蛋白质组的蛋白质、肽、寡肽、多肽和蛋白质复合物,然后依次鉴定蛋白质组或亚蛋白质组中的每种蛋白质、肽、寡肽、多肽和蛋白质复合物来鉴定样本内的蛋白质组或亚蛋白质组。
已经发现,为了鉴定蛋白质组、亚蛋白质组或其它混合物并且确定蛋白质组、亚蛋白质组或其它混合物的浓度或量,不必分离样本内的蛋白质组、亚蛋白质组或其它蛋白质混合物。已经发现,为了鉴定和确定蛋白质组、亚蛋白质组或其它混合物的浓度或量,不必鉴定蛋白质组、亚蛋白质组或其它混合物中的每种蛋白质。相反,仅需对样本中所含的蛋白质组、亚蛋白质组或其它混合物的两种或更多种氨基酸类型的氨基酸浓度、标记值或氨基酸数目进行一次测量。
已经发现,样本内的蛋白质组或亚蛋白质组可以替代地被认为是平均蛋白质序列,其氨基酸数目是蛋白质组或亚蛋白质组中每种蛋白质、肽、寡肽、多肽或蛋白质复合物序列的氨基酸数目的加权平均值,并且其在样本中的浓度是包含蛋白质组或亚蛋白质组的所有蛋白质、肽、寡肽、多肽或蛋白质复合物的总摩尔蛋白质浓度。可以以这种方式鉴定和定量样本内的未分离的蛋白质组或亚蛋白质组,因为已经发现这些特征对于每种蛋白质组和亚蛋白质组是独特的。不计算该平均蛋白质序列内的氨基酸顺序,并且每个此类平均蛋白质序列内的两种或更多种氨基酸类型的氨基酸数目对于所有蛋白质组和亚蛋白质组是独特的。例如,每个平均蛋白质序列中两种或更多种氨基酸类型的氨基酸数目对于所有已知的细菌蛋白质组和所有已知的病毒蛋白质组是独特的(图3)。7581种已知的细菌参考蛋白质组和9377种已知的病毒参考蛋白质组证明了这一点。参考蛋白质组是完整的蛋白质组。因此,所有已知的细菌蛋白质组和所有已知的病毒蛋白质组具有不同的特征,使用本发明的方法可以容易地在样本内检测到该特征,而无需将包含蛋白质组的蛋白质、肽、寡肽、多肽或蛋白质复合物彼此分离。这是违反直觉的结果,因为尽管预期蛋白质组内的蛋白质、寡肽、多肽和蛋白质复合物的两种或更多种氨基酸类型的氨基酸数目将根据分布而变化,但预期每个蛋白质组的分布平均值将聚集在由生物功能决定的单个值周围。此外,蛋白质组中两种或更多种氨基酸类型的氨基酸的平均数不遵循趋势x=y=z,表明这种可变性不能由蛋白质、寡肽、多肽和蛋白质复合物序列在蛋白质组中的平均长度的差异来解释。
目前诊断感染诸如SARS-CoV-2感染的方法依赖于逆转录聚合酶链式反应(RT-PCR)来(通常定性)确定患者样本中的SARS-CoV-2RNA。然而,这些检验具有30%的假阴性率,这对患者护理、感染控制和建模具有显著的后果。
除了提供快速诊断任何感染的新方法外,本发明的方法还可以用于鉴定患者样本中疾病相关的目的亚蛋白质组的存在和/或浓度和/或量。例如,可以在唾液中鉴定和定量1型糖尿病的亚蛋白质组学特征。在一些实施例中,可以在血浆样本中鉴定和定量人卵巢癌、人胰腺癌、人前列腺癌或人结肠直肠癌的亚蛋白质组学特征。在一些实施例中,可以在尿样本中鉴定和定量人膀胱癌、人前列腺癌或人肾癌的亚蛋白质组学特征。
在一些实施例中,当一个或多个亚蛋白质组或蛋白质组是目的亚蛋白质组或蛋白质组时,则特定氨基酸类型的氨基酸数目是目的亚蛋白质组或蛋白质组中所有蛋白质中特定氨基酸类型的氨基酸的加权平均数。例如,如果样本中标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),并且样本中目的蛋白质组是SARS-CoV-2蛋白质组,则根据SARS-CoV-2蛋白质组的氨基酸序列计算SARS-CoV-2蛋白质组的所有蛋白质的平均氨基酸序列中色氨酸(W)的加权平均数和赖氨酸(K)氨基酸的加权平均数为11.3W和60.6K。
已经发现任何目的蛋白质组或亚蛋白质组可以通过参数方程组来描述。在一些实施例中,参数方程提供了对蛋白质组或亚蛋白质组中两种或更多种氨基酸类型测量的氨基酸浓度的特征。取决于浓度的共同参数的参数方程组是参数方程组2并且采取以下形式:
其中p
为目的蛋白质组或亚蛋白质组提供的氨基酸浓度的独特特征可以使用向量函数2等效地描述:
其中p
在一些实施例中,目的蛋白质组或亚蛋白质组中与样本中标记和测量的相同的两种或更多种氨基酸类型中的每一种的氨基酸平均数是与样本中标记和测量的相同的两种或更多种氨基酸类型中的每一种的氨基酸的加权平均数。在一些实施例中,加权平均值的权重由目的蛋白质组或亚蛋白质组中蛋白质序列总数内该蛋白质序列的比例提供。例如,每个蛋白质组的色氨酸(W)氨基酸的加权平均数等于每个蛋白质序列的色氨酸氨基酸的数目乘以包含目的蛋白质组或亚蛋白质组的所有蛋白质序列中该蛋白质序列的比例的线性组合,并且每个蛋白质组的赖氨酸(K)氨基酸的加权数目等于每个蛋白质序列的色氨酸氨基酸的数目乘以包含目的蛋白质组或亚蛋白质组的所有蛋白质序列中该蛋白质序列的比例的线性组合。
将对样本中两种或更多种标记的氨基酸类型测量的氨基酸浓度与对一种或多种目的蛋白质组或亚蛋白质组提供的相同的两种或更多种氨基酸类型的氨基酸浓度进行比较。这允许将样本鉴定为目的蛋白质组或亚蛋白质组中的一种,以及确定样本中存在的目的蛋白质组或亚蛋白质组的浓度或量。
在一些实施例中,两种或更多种氨基酸类型中的每一种的浓度是每种目的蛋白质、肽、寡肽、多肽或蛋白质复合物的标记的氨基酸类型的浓度。在一些实施例中,每种目的蛋白质组或亚蛋白质组的两种或更多种氨基酸类型中的每一种的浓度是在目的蛋白质组或亚蛋白质组中的蛋白质上标记的氨基酸类型的总浓度。这是因为氨基酸类型的浓度等于蛋白质组中每个序列的氨基酸平均数乘以蛋白质组的总蛋白质浓度。
通常,未知样本的摩尔蛋白质浓度是未知的,因为如果使用本领域的标准方法确定样本的吸收(A
在一些实施例中,样本的摩尔蛋白质浓度是已知的。使样本的已知摩尔蛋白质浓度为常数SC。因此,如果样本中存在目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p
其简化为n维空间中的点
这不再是参数方程组,因为它不是共同参数(自变量)的函数,因为变量t被替换为常数SC。在该实施例中,目的蛋白质的氨基酸浓度p
在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型中的每一种的氨基酸浓度用于用参数方程组确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型中的每一种的对应标记值。
这通过将校准函数或校准因子并入描述任何目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸浓度的参数方程中来实现,该校准函数或校准因子在每种氨基酸类型的测量的标记与每种氨基酸类型的氨基酸浓度之间转换。
在一些实施例中,参数方程经由参数方程组3将目的蛋白质、肽、寡肽、多肽或蛋白质复合物的标记值(例如标记的信号)的独特特征描述为其浓度t的函数:
其中p
构成参数方程组3的方程可以等效地共同描述为向量函数3:
其中p
在其它实施例中,描述任何浓度t下的目的蛋白质组或亚蛋白质组的标记值(例如标记的信号)的独特特征的参数方程是参数方程组4:
其中p
这个实施例中的参数方程组可以替代地使用向量函数4来共同地描述:
其中p
因此,已经发现,可以基于单独的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列,为任何目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组构建参数方程组或向量函数,描述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的标记值(例如信号)或氨基酸浓度的独特特征作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度的函数。例如,如果在样本中仅测量了W和Y的标记,并且未将其转换为样本中W和Y氨基酸类型的氨基酸浓度或数目,则将目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中W和Y氨基酸的数目转换为W和Y的对应已知标记值,作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的未知浓度的函数。这允许将样本中W和Y的测量的标记与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中W和Y的已知标记值进行比较,并且确定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。在一些实施例中,不需要对样本测量的信号进行计算。
发现每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考线或参考曲线的向量形式允许直接计算目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度,其提供与样本中标记和测量的对应两种或更多种氨基酸类型最接近(即,样本点与参考线之间的距离最小化)的两种或更多种氨基酸类型的标记的已知值或氨基酸浓度。
这是通过求参考线的方向与样本点和参考线上的任何点之间的向量的点积,将点积设置为等于0,并且求解参考线的浓度来实现的,该浓度提供了样本点与参考线之间的垂直线。点积是表示两个向量A和B之间的角度关系的标量值,即
在一些实施例中,如果样本点小于或等于多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的误差容限或距离阈值,则在样本中鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物。如果混合物中的组分占混合物的较大比例,则其特征对样本特征的影响将大于混合物中占较小比例的组分的特征。混合物中组分的比例也可使用本发明的方法获得。通过比较样本与鉴定为存在于样本中的每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组之间的距离来计算混合物中每种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的比例,其中较小距离指示混合物中该组分的较大比例。在一些实施例中,比较对于混合物的每个鉴定的组分,根据样本点到参考线计算的距离。发现混合物中每种组分的比例由混合物中各种鉴定的组分的归一化距离的倒数确定。计算所有鉴定的组分的最大距离,并且将其除以每个鉴定的组分的距离。在一些实施例中,通过用混合物内所有组分的逆归一化距离的总和除以其逆归一化距离来计算混合物内鉴定的组分的比例。
本发明的方法不需要为了鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量而确定氨基酸序列中氨基酸的顺序(即位置)。本发明的方法不需要为了鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量而确定样本中蛋白质内的氨基酸序列。
本发明的方法可以提供目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考,其使用本文所公开的式用代数方法描述。在参考中存在变量,该变量是蛋白质浓度。该参考提供了氨基酸浓度或荧光强度,其将用于测量目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的任何浓度。当鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组时,该特征使定量目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组成为可能。因此,本文所公开的方法提供了定量技术。
条款
代表性特征在以下条款中陈述,其独立于说明书的文本和/或附图中所公开的一个或多个特征或可以与说明书的文本和/或附图中所公开的一个或多个特征以任何组合来组合。
1a.一种鉴定样本内一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
1b.一种诊断样本中的细菌和/或病毒和/或寄生虫病的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的一种或多种目的细菌、病毒和/或寄生虫蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与一种或多种目的病毒、细菌和/或寄生虫蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较以鉴定所述样本中一种或多种目的细菌、病毒和/或寄生虫蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量来鉴定所述样本中的细菌和/或病毒和/或寄生虫病。
1c.一种鉴定样本中一种或多种细菌蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记、氨基酸浓度或氨基酸数目与一种或多种浓度的一种或多种目的细菌蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的已知标记值或氨基酸浓度,或所述一种或多种目的细菌蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的氨基酸数目进行比较来鉴定所述样本中一种或多种细菌蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
1d.一种鉴定样本中一种或多种病毒蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的一种或多种目的病毒蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述一种或多种目的病毒蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中一种或多种目的病毒蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
1e.一种鉴定样本中一种或多种寄生虫蛋白质、肽、寡肽、多肽、蛋白复合物、亚蛋白质组或蛋白质组的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的一种或多种目的寄生虫蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述一种或多种目的寄生虫蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中一种或多种目的寄生虫蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
1f.一种鉴定样本中一种或多种人蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的一种或多种目的人蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述一种或多种目的人蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中一种或多种目的人蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
1g.一种检测感染或鉴定宿主响应感染的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的与感染或宿主响应感染有关的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述与感染或宿主响应感染有关的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中与感染或宿主响应感染有关的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
1h.一种检测癌症的方法,所述方法包含:
a)标记所述样本内的两种或更多种氨基酸类型,其中氨基酸类型由氨基酸的R基团定义;
b)测量所述样本中每种标记的氨基酸类型的标记;
c)任选地根据测量的标记计算每种标记的氨基酸类型的氨基酸浓度;
d)任选地计算每种标记的氨基酸类型的氨基酸数目;以及
e)通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种浓度的与癌症有关的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述与癌症有关的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中与癌症有关的一种或多种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
2.根据条款1a至1h中任一项所述的方法,其中所述样本是体液样本。
3.根据条款2所述的方法,其中所述体液样本是全血样本、血清样本、血浆样本、唾液样本、痰样本、粪便样本、尿样本、精液样本、鼻拭子样本、鼻咽吸出物样本、咽拭子、下呼吸道样本、脑脊液(CSF)样本、母乳样本、性健康样本或组织样本或由病变产生的流体。
4.根据条款3所述的方法,其中所述性健康样本是尿道拭子、子宫颈拭子、阴道拭子或直肠拭子。
4a.根据条款2所述的方法,其中所述样本是血液样本或尿样本。
5.根据条款3所述的方法,其中所述下呼吸道样本是下呼吸道粘液吸出物样本。
6.根据条款3所述的方法,其中所述组织样本是组织的活组织检查。
7.根据条款6所述的方法,其中所述组织样本是固态肿瘤。
8.根据条款6所述的方法,其中所述组织是肉瘤、淋巴瘤、癌和黑素瘤。
9.根据条款1a至1h中任一项所述的方法,其中所述样本是兽医样本。
10.根据条款9所述的方法,其中所述兽医样本是猫样本、犬样本、牛样本、猪样本、马样本、驴样本、绵羊样本、山羊样本、鱼样本、蟹样本、海藻提取物(corraline)样本、龙虾肌碱(homarine)样本、贝壳(ostracine)样本、爬虫类动物样本、禽类样本、鸡精蛋白样本、吐绶鸡(meleagrine)样本、鸭样本、鹅样本、鹿样本、野兔样本、兔样本、夜光虫(noctilionine)样本、鼠样本、跳蚤(pulicine)样本、蜱螨样本、伊蚊样本、猴样本或鳞甲目样本。
11.根据条款1a至1h中任一项所述的方法,其中所述样本是土壤样本、环境样本、作物样本、食品样本、饮料样本或实验室样本。
12.根据条款11所述的方法,其中所述环境样本是水样本,诸如饮用水样本或废水样本;或疑似生物战的样本;或天体生物学样本。
13.根据条款11所述的方法,其中所述食品样本是功能性食品样本。
14.根据条款13所述的方法,其中所述功能性食品样本是婴儿配方食品样本或运动营养样本。
15.根据条款11所述的方法,其中所述食品样本是膳食补充剂样本。
16.根据条款11所述的方法,其中所述食品样本是发酵食品样本。
17.根据条款11所述的方法,其中所述食品样本是乳品样本、蛋样本、明胶样本、大豆样本、小麦样本、蔬菜样本、豆类样本、坚果样本或酿造的大豆产品样本。
18.根据条款11所述的方法,其中所述食品样本疑似含有过敏原或细菌或病毒或寄生虫。
19.根据条款18所述的方法,其中所述食品样本是肉样本,并且所述肉样本疑似含有大肠杆菌(Escherichia Coli)、沙n氏菌(Salmonela)、金黄色葡萄球菌(StaphylococcusAureus)、单核细胞增生李斯特菌(Listeria Monocytogenes)、小肠结肠炎耶尔森氏菌(Yersinia Enterocolitica)、肠炎沙n氏菌(Salmonella Enteritidis)、空肠弯曲杆菌(Campylobacter Jejuni)、产气荚膜梭菌(Clostridium perfringens)、产气荚膜梭菌(Clostridium perfringens)、诺如病毒(Norovirus)、刚地弓形虫(Toxoplasma gondii)、绦虫(tapeworm)、蛔虫(roundworm)或异尖线虫(anisakis)。
20.根据条款18所述的方法,其中所述过敏原是花生、谷蛋白、乳糖、贝类、鱼、芝麻籽、花粉、酪蛋白、脂质运载蛋白、c型溶菌酶、蛋白酶抑制剂、原肌球蛋白、小清蛋白,猫皮屑或狗皮屑。
21.根据条款11所述的方法,其中所述饮料样本是奶样本、水样本、果汁样本、开菲乳样本或红茶菌(kombucha)样本。
22.根据条款1a至1h中任一项所述的方法,其中所述样本是疫苗。
23.根据条款22所述的方法,其中所述样本是流感疫苗、SARS-CoV-2疫苗、6合1疫苗、肺炎球菌(Pneumococcal)疫苗、MenB疫苗、Hib/MenC疫苗、MMR疫苗、4合1学龄前加强疫苗、HPV疫苗、3合1青少年加强疫苗、破伤风疫苗、带状疱疹疫苗、BCG(TB)疫苗、B型肝炎疫苗或水痘疫苗。
24.根据条款1至23中任一项所述的方法,其中一种或多种目的蛋白质或肽选自由以下组成的组:α-突触核蛋白、溶菌酶、牛血清白蛋白、卵清蛋白、β-乳球蛋白、胰岛素、胰高血糖素、淀粉样蛋白β、血管紧张素转换酶2、血管紧张素转换酶、缓激肽、脊索蛋白样蛋白质1、肿瘤坏死因子β、骨调节蛋白前体、基质金属蛋白酶、多效生长因子、分泌粒蛋白-3、人生长激素、胰岛素样生长因子1、瘦蛋白、端粒酶、促甲状腺激素及其任何组合。
25.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质组是一种或多种人蛋白质组。
26.根据条款25所述的方法,其中所述一种或多种人蛋白质组选自由以下组成的组:人血浆蛋白质组、人眼蛋白质组、视网膜、心脏、骨骼肌、平滑肌、肾上腺、甲状旁腺、甲状腺、垂体、肺、骨髓、淋巴组织、肝、胆囊、睾丸、附睾、前列腺、精囊、输精管、脂肪组织、脑、唾液腺、食道、舌、胃、肠、胰腺、肾、膀胱、乳房、阴道、子宫颈、子宫内膜、输卵管、卵巢、胎盘、皮肤或血液蛋白质组、人代谢蛋白质组、人分泌蛋白质组、干细胞蛋白质组、红细胞蛋白质组、嗜中性粒细胞蛋白质组、嗜酸性粒细胞蛋白质组、嗜碱性粒细胞蛋白质组、单核细胞蛋白质组、淋巴细胞蛋白质组、神经元蛋白质组,神经胶质蛋白质组、骨骼肌蛋白质组、心肌蛋白质组、平滑肌蛋白质组、软骨细胞蛋白质组、成骨细胞蛋白质组、破骨细胞蛋白质组、骨细胞蛋白质组、骨内膜细胞蛋白质组、角化细胞蛋白质组、黑素细胞蛋白质组、梅克尔细胞蛋白质组、朗格汉斯细胞蛋白质组、内皮细胞蛋白质组、上皮细胞蛋白质组、白色脂肪细胞蛋白质组、褐色脂肪细胞蛋白质组、上呼吸道细胞蛋白质组、精细胞蛋白质组或卵细胞蛋白质组,及其任何组合。
27.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质组是一种或多种人癌亚蛋白质组和/或蛋白质组。
28.根据条款27所述的方法,其中一种或多种人癌蛋白质组和/或亚蛋白质组选自由以下组成的组:人胰腺癌蛋白质组、人神经胶质瘤蛋白质组、人头颈蛋白质组、人甲状腺蛋白质组、人肺蛋白质组、人肝蛋白质组、人睾丸蛋白质组、人前列腺蛋白质组、人胃蛋白质组、人结肠/直肠蛋白质组、人乳房蛋白质组、人子宫内膜蛋白质组、人卵巢蛋白质组、人子宫颈蛋白质组、人胰腺蛋白质组、人肾蛋白质组、人泌尿和膀胱蛋白质组、人黑素瘤蛋白质组、人I型糖尿病亚蛋白质组、人II型糖尿病亚蛋白质组、阿尔茨海默病亚蛋白质组、人帕金森氏病亚蛋白质组、人路易体痴呆亚蛋白质组、人痴呆亚蛋白质组、人代谢综合征亚蛋白质组、人肥胖亚蛋白质组、人心血管疾病亚蛋白质组、人唐氏综合征亚蛋白质组、人衰老亚蛋白质组、人细胞因子亚蛋白质组、人免疫亚蛋白质组、对细菌感染响应的人亚蛋白质组、对病毒感染响应的人亚蛋白质组、对冠状病毒感染响应的人亚蛋白质组、对SARS-CoV-2感染响应的人亚蛋白质组、对SARS-CoV-2感染响应的人亚蛋白质组,其包括IFN、IL-6、ILiRA、CCL2、CCL8CXCL2、CXCL8、CXCL9,和CXCL16及其任何组合。
28a.根据条款28所述的方法,其中一种或多种癌蛋白质组选自由以下组成的组:人卵巢癌蛋白质组、人胰腺癌蛋白质组、人结肠直肠癌蛋白质组、人膀胱癌蛋白质组、人前列腺癌蛋白质组、人肾癌蛋白质组。
28b.根据条款27所述的方法,其中在所述样本中检测到1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个人癌蛋白质组,所述人癌蛋白质组选自由以下组成的组:胰腺癌、结肠直肠癌、人神经胶质瘤、头颈癌、甲状腺癌、肺癌、肝癌、睾丸癌、前列腺癌、胃癌、结肠/直肠癌、乳腺癌、子宫内膜癌、卵巢癌、宫颈癌、肾脏癌、肾癌、淋巴瘤、膀胱癌、人黑素瘤、脑癌、子宫内膜癌、白血病、泌尿道上皮癌及其任何组合。
28c.根据条款27、28a或28b所述的方法,其中所述方法确定所述样本中一种或多种癌蛋白质组的量,并且癌症的量是指所述样本中所述癌症的阶段或等级。
28d.根据条款28c所述的方法,其中所述阶段是阶段I、阶段II、阶段III或阶段IV,或TNM分期系统,诸如T1、T2、T3、T4、N0、N1、N2、N3、M0或M1。
28e.根据条款28c所述的方法,其中所述等级是I级、II级或III级。
28f.根据条款27、28a或28b所述的方法,其中所述癌症的存在是指所述癌症在患者体内的位置。
29.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质组是一种或多种病毒蛋白质组。
30.根据条款29所述的方法,其中所述一种或多种病毒蛋白质组选自由以下组成的组:人乳头瘤病毒(HPV)蛋白质组、人免疫缺陷病毒(HIV)蛋白质组、正粘病毒科(Orthomyxoviridae)蛋白质组、爱泼斯坦巴尔(Epstein Barr)蛋白质组、埃博拉病毒(Ebolavirus)蛋白质组、狂犬病毒属(Rabies lyssavirus)蛋白质组、冠状病毒属(Coronovirus)蛋白质组、诺如病毒(Novovirus)蛋白质组、A型肝炎蛋白质组、B型肝炎蛋白质组、C型肝炎蛋白质组、E型肝炎蛋白质组、丁型肝炎蛋白质组、疱疹病毒蛋白质组、乳头瘤病毒蛋白质组、鼻病毒属蛋白质组、麻疹病毒蛋白质组、腮腺炎病毒蛋白质组、脊髓灰质炎病毒蛋白质组、狂犬病蛋白质组、轮状病毒蛋白质组、西尼罗病毒蛋白质组、黄热病病毒蛋白质组、寨卡病毒蛋白质组、有尾噬菌体目(Caudovirales)蛋白质组、线头病毒科(Nimaviridae)蛋白质组、核糖病毒域(Riboviria)蛋白质组、丝形病毒科(Inoviridae)蛋白质组、小纺锤形噬菌体科(Fuselloviridae)蛋白质组、疱疹病毒目(Herpesvirales)蛋白质组、非洲猪瘟病毒科(Asfarviridae)蛋白质组、双尾病毒科(Bicaudaviridae)蛋白质组、结核病蛋白质组、牛结核病蛋白质组及其任何组合。
31.根据条款30所述的方法,其中所述正粘病毒科蛋白质组是流感蛋白质组。
32.根据条款30所述的方法,其中所述流感蛋白质组是A型流感蛋白质组、A型流感亚型H1N1蛋白质组、B型流感蛋白质组、C型流感蛋白质组和/或D型流感蛋白质组,或其任何组合。
33.根据条款30所述的方法,其中所述冠状病毒蛋白质组是SARS-CoV-2蛋白质组、SARS-CoV蛋白质组,和/或MERS-CoV蛋白质组。
34.根据条款33所述的方法,其中所述冠状病毒蛋白质组是所述SARS-CoV-2蛋白质组及其任何突变。
35.根据条款1至34中任一项所述的方法,其中所述一种或多种目的蛋白质组是一种或多种细菌蛋白质组。
36.根据条款35所述的方法,其中所述一种或多种细菌蛋白质组选自由以下组成的组:大肠杆菌(Escherichia coli,E.coli)蛋白质组、铜绿假单胞菌(Pseudomonasaeruginosa,P.aeruginosa)蛋白质组、沙n氏菌蛋白质组、金黄色葡萄球菌蛋白质组、鲍氏不动杆菌(Acinetobacter baumannii)蛋白质组、脆弱拟杆菌(Bacteroides fragilis)蛋白质组、洋葱伯克霍尔德菌(Burkholderia cepacia)蛋白质组、艰难梭菌(Clostridiumdifficile)蛋白质组、索氏梭菌(Clostridium sordellii)蛋白质组、肠杆菌科(Enterobacteriaceae)蛋白质组、粪肠球菌(Enterococcus faecalis)蛋白质组、肺炎克雷伯氏菌(Klebsiella pneumoniae)蛋白质组、耐甲氧西林金黄色葡萄球菌(Methicillin-resistant Staphylococcus aureus)蛋白质组、摩氏摩根氏菌(Morganella morganii)蛋白质组、分枝杆菌(Mycobacterium)蛋白质组及其任何组合。
37.根据条款36所述的方法,其中所述分枝杆菌蛋白质组是结核分枝杆菌蛋白质组。
38.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质组是一种或多种寄生虫蛋白质组。
39.根据条款38所述的方法,其中所述一种或多种寄生虫蛋白质组选自由以下组成的组:疟原虫(Plasmodium)蛋白质组、刚地弓形虫蛋白质组、阴道毛滴虫(Trichomonasvaginalis)蛋白质组、十二指肠贾第虫(Giardia duodena1is)蛋白质组、隐孢子虫(Cryptosporidium)蛋白质组或其任何组合。
40.根据条款39所述的方法,其中所述疟原虫蛋白质组是恶性疟原虫(Plasmodiumfalciparum)蛋白质组、诺氏疟原虫(Plasmodium knowlesi)蛋白质组、三日疟原虫(Plasmodium ma1ariae)蛋白质组、卵形疟原虫(Plasmodium ovale)蛋白质组和/或间日疟原虫(Plasmodium vivax)蛋白质组。
41.根据条款1a、1b、1e至1h所述的方法,其中一种或多种目的亚蛋白质组是所述宿主响应寄生虫蛋白质组。
42.根据条款1a、1g或1h所述的方法,其中所述一种或多种目的蛋白质组是古细菌蛋白质组。
43.根据条款1至41中任一项所述的方法,其中所述一种或多种目的蛋白质组是一种或多种细菌蛋白质组、一种或多种病毒蛋白质组和/或一种或多种寄生虫蛋白质组及其任何组合的混合物。
44.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质组是致病性蛋白质组。
45.根据条款44所述的方法,其中所述致病性蛋白质组是细菌蛋白质组和/或病毒蛋白质组。
46.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质是朊病毒。
47.根据条款46所述的方法,其中所述朊病毒引起克雅氏病(CJD)。
48.根据条款1至23中任一项所述的方法,其中所述一种或多种目的蛋白质组是任何目的细菌科内的蛋白质组。
49.根据条款1至23中任一项所述的方法,其中所述一种或多种目的亚蛋白质组是所述宿主响应细菌蛋白质组。
50.根据条款1至23中任一项所述的方法,其中在所述样本中检测细菌蛋白质组和宿主响应亚蛋白质组的存在。
51.根据条款29所述的方法,其中所述一种或多种目的病毒蛋白质组是兽医病毒蛋白质组。
52.根据条款51所述的方法,其中所述兽医病毒蛋白质组是弹状病毒属(Rhabdoviruse)蛋白质组、口蹄疫病毒蛋白质组、瘟病毒属蛋白质组、动脉炎病毒属(Arteriviruses)蛋白质组、冠状病毒蛋白质组、凸隆病毒(Toroviruse)蛋白质组、流感蛋白质组、蓝舌病病毒或圆环病毒属蛋白质组及其任何组合。
53.根据条款52所述的方法,其中所述流感蛋白质组是禽流感蛋白质组或猪流感蛋白质组。
54.根据条款52所述的方法,其中环状病毒蛋白质组是疱疹病毒蛋白质组、非洲猪瘟病毒蛋白质组、逆转录病毒蛋白质组、黄病毒蛋白质组、副粘病毒蛋白质组或帕洛病毒(Parlovirus)蛋白质组。
55.根据条款1至54中任一项所述的方法,其中所述两种或更多种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V),或合成氨基酸,其N-末端和C-末端,及其任何组合。
56.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
57.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自由以下组成的组:精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)及其任何组合。
58.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
59.根据条款55所述的方法,其中在所述样本内标记的所述两种或更多种氨基酸类型选自由以下组成的组:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、脯氨酸(P)、天冬氨酸(D)、谷氨酸(E)、天冬酰胺(B)、谷氨酰胺(Q)、丝氨酸(S)或苏氨酸(T)及其任何组合。
60.根据条款55所述的方法,其中在所述样本内标记的所述两种或更多种氨基酸类型选自由以下组成的组:赖氨酸和色氨酸;半胱氨酸(C)和色氨酸(W);赖氨酸(K)和半胱氨酸(C);赖氨酸(K)和酪氨酸(Y);半胱氨酸(C)和酪氨酸(Y);色氨酸(W)和酪氨酸(Y);亮氨酸(L)和丝氨酸(S);亮氨酸(L)和赖氨酸(K);谷氨酸(E)和亮氨酸(L);甘氨酸(G)和亮氨酸(L);丙氨酸(A)和亮氨酸(L);天冬氨酸(D)和亮氨酸(L);亮氨酸(L)和丝氨酸(S);亮氨酸(L)和脯氨酸(P);亮氨酸(L)和缬氨酸(V);赖氨酸(K)和丝氨酸(S);谷氨酸(E)和亮氨酸(L);丙氨酸(A)和精氨酸(R);丙氨酸(A)和谷氨酸(E);丙氨酸(A)和甘氨酸(G);或丙氨酸(A)和异亮氨酸(I)。
61.根据条款55所述的方法,其中在所述样本内标记的所述两种或更多种氨基酸类型选自由以下组成的组:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、脯氨酸(P)、天冬氨酸(D)、谷氨酸(E)、天冬酰胺(B)和/或谷氨酰胺(Q)及其任何组合。
62.根据条款55所述的方法,其中在所述样本内标记的所述两种或更多种氨基酸类型选自由以下组成的组:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)和/或赖氨酸(K)及其任何组合。
63.根据条款55所述的方法,其中两种或更多种氨基酸选自:半胱氨酸(C)、精氨酸(R)、组氨酸(H)和/或天冬氨酸(D)及其任何组合。
64.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:半胱氨酸(C)、精氨酸(R)、组氨酸(H)和/或谷氨酸(E)及其任何组合。
65.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:半胱氨酸(C)、精氨酸(R)、组氨酸(H)和/或谷氨酰胺(Q)及其任何组合。
66.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:半胱氨酸(C)、精氨酸(R)、色氨酸(W)和/或天冬氨酸(D)及其任何组合。
67.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:赖氨酸(K)、精氨酸(R)、组氨酸(H)和/或天冬氨酸(D)及其任何组合。
68.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:赖氨酸(K)、色氨酸(W)、精氨酸(R)和/或谷氨酸(E)及其任何组合。
69.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和/或天冬氨酸(D)及其任何组合。
70.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和/或谷氨酸(E)及其任何组合。
71.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:脯氨酸(P)、半胱氨酸(C),精氨酸(R)和/或谷氨酸(E)及其任何组合。
72.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和/或天冬氨酸(D)及其任何组合。
73.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和/或天冬氨酸(D)及其任何组合。
74.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和/或谷氨酸(E)及其任何组合。
75.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:赖氨酸(K)、天冬酰胺(B)、色氨酸(W)和/或半胱氨酸(C)及其任何组合。
76.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、组氨酸(H)、脯氨酸(P)和/或天冬氨酸(D)及其任何组合。
77.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或天冬氨酸(D)及其任何组合。
78.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或谷氨酸(E)及其任何组合。
79.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或色氨酸(W)及其任何组合。
80.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或酪氨酸(Y)及其任何组合。
81.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、组氨酸(H)和/或色氨酸(W)及其任何组合。
82.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、组氨酸(H)和/或半胱氨酸(C)及其任何组合。
83.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、组氨酸(H)和/或酪氨酸(Y)及其任何组合。
84.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、半胱氨酸(C)、色氨酸(W)和/或酪氨酸(Y)及其任何组合。
85.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:精氨酸(R)、半胱氨酸(C)、色氨酸(W)和/或脯氨酸(P)及其任何组合。
86.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:色氨酸(W)、半胱氨酸(C)和/或赖氨酸(K)及其任何组合。
87.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:赖氨酸(K)、色氨酸(W)和/或酪氨酸(Y)及其任何组合。
88.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:色氨酸(W)、酪氨酸(Y)和/或半胱氨酸(C)及其任何组合。
89.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:色氨酸(W)、酪氨酸(Y)和/或赖氨酸(K)及其任何组合。
90.根据条款55所述的方法,其中所述两种或更多种氨基酸类型选自:半胱氨酸(C)、色氨酸(W)和/或酪氨酸(Y)及其任何组合。
91.根据条款1a至1h所述的方法,其中在样本内2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40种氨基酸类型被标记。
92.根据条款91所述的方法,其中2种氨基酸类型被标记。
93.根据条款92所述的方法,其中标记的2种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
94.根据条款92所述的方法,其中所述2种氨基酸类型是亮氨酸(L)和丝氨酸(S)。
95.根据条款92所述的方法,其中所述2种氨基酸类型是亮氨酸(L)和赖氨酸(K)。
96.根据条款92所述的方法,其中所述2种氨基酸类型是亮氨酸(L)和谷氨酸(E)。
97.根据条款92所述的方法,其中2种酸类型是甘氨酸(G)和亮氨酸(L)。
98.根据条款92所述的方法,其中所述2种氨基酸类型是丙氨酸(A)和亮氨酸(L)。
99.根据条款92所述的方法,其中所述2种氨基酸类型是天冬氨酸(D)和亮氨酸(L)。
100.根据条款92所述的方法,其中所述2种氨基酸类型是亮氨酸(L)和脯氨酸(P)。
101.根据条款92所述的方法,其中所述2种氨基酸类型是亮氨酸(L)和缬氨酸(V)。
102.根据条款92所述的方法,其中所述2种氨基酸类型是赖氨酸(K)和丝氨酸(S)。
103.根据条款92所述的方法,其中所述2种氨基酸类型是谷氨酸(E)和亮氨酸(L)。
104.根据条款92所述的方法,其中所述2种氨基酸类型是丙氨酸(A)和精氨酸(R)。
105.根据条款92所述的方法,其中2种氨基酸是丙氨酸(A)和谷氨酸(E)。
106.根据条款92所述的方法,其中所述2种氨基酸是丙氨酸(A)和甘氨酸(G)。
107.根据条款91所述的方法,其中3种氨基酸类型被标记。
108.根据条款107所述的方法,其中标记的3种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
109.根据条款107所述的方法,其中所述标记的3种氨基酸类型是色氨酸(W)、半胱氨酸(C)和酪氨酸(Y)。
110.根据条款107所述的方法,其中所述标记的3种氨基酸类型是半胱氨酸(C)、酪氨酸(Y)和赖氨酸(K)。
111.根据条款107所述的方法,其中所述3种氨基酸类型是色氨酸(W)、半胱氨酸(C)和赖氨酸(K)。
112.根据条款107所述的方法,其中所述3种氨基酸类型是赖氨酸(K)、色氨酸(W)和酪氨酸(Y)。
113.根据条款107所述的方法,其中所述3种氨基酸类型是色氨酸(W)、酪氨酸(Y)和半胱氨酸(C)。
114.根据条款107所述的方法,其中所述3种氨基酸类型是色氨酸(W)、酪氨酸(Y)和赖氨酸(K)。
115.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:半胱氨酸(C)、色氨酸(W)和酪氨酸(Y)。
116.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:天冬酰胺(R)、谷氨酸(E)和甘氨酸(G)。
117.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和丝氨酸(S)。
118.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:天冬酰胺(A)、谷氨酸(E)和亮氨酸(L)。
119.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、天冬氨酸(D)和亮氨酸(L)。
120.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和脯氨酸(P)。
121.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、谷氨酸(E)和亮氨酸(L)。
122.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:亮氨酸(L)、丝氨酸(S)和缬氨酸(S)。
123.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:谷氨酸(E)、异亮氨酸(I)和脯氨酸(P)。
124.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:谷氨酸(E)、甘氨酸(G)和缬氨酸(V)。
125.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:精氨酸(R)、丝氨酸(S)和缬氨酸(V)。
126.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和赖氨酸(K)。
127.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、精氨酸(R)和亮氨酸(L)。
128.根据条款107所述的方法,其中所述标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和缬氨酸(V)。
129.根据条款91所述的方法,其中4种氨基酸类型被标记。
130.根据条款129所述的方法,其中标记的4种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
131.根据条款129所述的方法,其中所述标记的4种氨基酸类型是色氨酸(W)、酪氨酸(Y)、赖氨酸(K)和半胱氨酸(C)。
132.根据条款129所述的方法,其中所述标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、组氨酸(H)和天冬氨酸(D)。
133.根据条款129所述的方法,其中所述标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、组氨酸(H)和谷氨酸(E)。
134.根据条款129所述的方法,其中所述标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、组氨酸(H)和谷氨酰胺(Q)。
135.根据条款129所述的方法,其中所述标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、色氨酸(W)和天冬氨酸(D)。
136.根据条款129所述的方法,其中所述标记的4种氨基酸类型是赖氨酸(K)、精氨酸(R)、组氨酸(H)和天冬氨酸(D)。
137.根据条款129所述的方法,其中所述标记的4种氨基酸类型是赖氨酸(K)、色氨酸(W)、精氨酸(R)和谷氨酸(E)。
138.根据条款129所述的方法,其中所述标记的4种氨基酸类型是酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和天冬氨酸(D)。
139.根据条款129所述的方法,其中所述标记的4种氨基酸类型是酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和谷氨酸(E)。
140.根据条款129所述的方法,其中所述标记的4种氨基酸类型是脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和谷氨酸(E)。
141.根据条款129所述的方法,其中所述标记的4种氨基酸类型是脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和天冬氨酸(D)。
142.根据条款129所述的方法,其中所述标记的4种氨基酸类型是半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和天冬氨酸(D)。
143.根据条款129所述的方法,其中所述标记的4种氨基酸类型是半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和谷氨酸(E)。
144.根据条款129所述的方法,其中所述标记的4种氨基酸类型是赖氨酸(K)、天冬酰胺(B)、色氨酸(W)和半胱氨酸(C)。
145.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、组氨酸(H)、脯氨酸(P)和天冬氨酸(D)。
146.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和天冬氨酸(D)。
147.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和谷氨酸(E)。
148.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和色氨酸(W)。
149.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和酪氨酸(Y)。
150.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、组氨酸(H)和色氨酸(W)。
151.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、组氨酸(H)和半胱氨酸(C)。
152.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、组氨酸(H)和酪氨酸(Y)。
153.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、半胱氨酸(C)、色氨酸(W)和酪氨酸(Y)。
154.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、半胱氨酸(C)、色氨酸(W)和脯氨酸(P)。
155.根据条款129所述的方法,其中所述标记的4种氨基酸类型是谷氨酰胺(Q)、亮氨酸(L)、赖氨酸(K)和缬氨酸(V)。
156.根据条款129所述的方法,其中所述标记的4种氨基酸类型是精氨酸(R)、异亮氨酸(I)、亮氨酸(L)和丝氨酸(S)。
157.根据条款129所述的方法,其中所述标记的4种氨基酸类型是丙氨酸(A)、天冬酰胺(N)、谷氨酸(E)和丝氨酸(S)。
158.根据条款91所述的方法,其中5种氨基酸类型被标记。
159.根据条款158所述的方法,其中标记的5种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
160.根据条款158所述的方法,其中所述标记的5种氨基酸类型是精氨酸(R)、谷氨酸(E)、赖氨酸(K)、丝氨酸和谷氨酰胺(Q)。
161.根据条款158所述的方法,其中所述标记的5种氨基酸类型是精氨酸(R)、天冬氨酸(D)、赖氨酸(K)、丝氨酸和谷氨酰胺(Q)。
162.根据条款158所述的方法,其中所述标记的5种氨基酸类型是精氨酸(R)、甘氨酸(G)、赖氨酸(K)、丝氨酸和谷氨酰胺(Q)。
163.根据条款158所述的方法,其中所述标记的5种氨基酸类型是丙氨酸(A)、天冬氨酸(D)、甘氨酸(G)、丝氨酸和精氨酸(R)。
164.根据条款158所述的方法,其中所述标记的5种氨基酸类型是吡咯赖氨酸(O)、天冬氨酸(D)、甘氨酸(G)、丝氨酸和精氨酸(R)。
165.根据条款158所述的方法,其中所述标记的5种氨基酸类型是吡咯赖氨酸(O)、天冬氨酸(D)、硒代半胱氨酸(U)、丝氨酸和精氨酸(R)。
166.根据条款158所述的方法,其中所述标记的5种氨基酸类型是吡咯赖氨酸(O)、天冬氨酸(D)、硒代半胱氨酸(U)、赖氨酸和精氨酸(R)。
167.根据前述条款中任一项所述的方法,其中两种或更多种标记的氨基酸类型中的每一种包含氨基酸类型的修饰的氨基酸和/或未修饰的氨基酸。
168.根据条款167所述的方法,其中氨基酸类型的所述修饰的氨基酸是所述氨基酸类型的翻译后修饰的氨基酸。
169.根据条款167或168所述的方法,其中4种氨基酸类型被标记并且所述4种氨基酸类型是半胱氨酸(C)、酪氨酸(Y)和赖氨酸(K)以及色氨酸(W),其中未修饰的半胱氨酸(CR)氨基酸以及修饰的和未修饰的半胱氨酸氨基酸都被标记。
170.根据条款167或168所述的方法,其中半胱氨酸的所述修饰的氨基酸是二硫化物键合的半胱氨酸(C
171.根据条款167或168所述的方法,其中精氨酸的所述修饰的氨基酸是N-糖基化精氨酸(Rg)氨基酸。
172.根据条款167或168所述的方法,其中所述天冬酰胺的所述修饰的氨基酸是N-糖基化天冬酰胺(Ng)氨基酸。
173.根据条款167或168所述的方法,其中赖氨酸的所述修饰的氨基酸是N6-(磷酸吡哆醛)赖氨酸(Kp)氨基酸。
174.根据条款167或168所述的方法,其中脯氨酸的所述修饰的氨基酸是4-羟基脯氨酸(Ph)氨基酸。
175.根据条款167或168所述的方法,其中丝氨酸的所述修饰的氨基酸是磷酸丝氨酸(Sp)氨基酸。
176.根据条款167或168所述的方法,其中苏氨酸的所述修饰的氨基酸是磷酸苏氨酸(Tp)氨基酸。
177.根据条款167或168所述的方法,其中丙氨酸的所述修饰的氨基酸是N-乙酰化丙氨酸(An)氨基酸。
178.根据条款167或168所述的方法,其中精氨酸的所述修饰的氨基酸是甲基化精氨酸(Rm)氨基酸。
179.根据条款167或168所述的方法,其中精氨酸的所述修饰的氨基酸是脱亚胺精氨酸(Ri)氨基酸。
180.根据条款167或168所述的方法,其中天冬酰胺的所述修饰的氨基酸是脱酰胺天冬酰胺(Qa)氨基酸。
181.根据条款167或168所述的方法,其中氨基酸类型的所述修饰的氨基酸是已经经由磷酸化、甲基化、乙酰化、酰胺化、脱酰胺、脱酰胺、吡咯烷酮羧酸形成、异构化、羟基化、硫酸化、黄素结合、半胱氨酸氧化、环化、亚硝基化、酰化、甲酰化、烷基化、精氨酰化、酰胺键形成、丁酰化、γ-羧化、糖基化、O-连接的糖基化、丙二酰化、羟基化、碘化、异肽键形成、核苷酸加成、N-乙酰化、N-肉豆蔻酰化、磷酸化、腺苷酰化、尿苷酰化(uridylylation)、丙酰化、焦谷氨酸形成、S-谷胱甘肽化、氧化、亚磺酰化、磺酰化、琥珀酰化、硫酸化、SUMO化、肉豆蔻酰化、棕榈酰化、异戊二烯化、异戊烯化、泛素化和glipyation及其任何组合进行翻译后修饰的氨基酸。
182.根据条款167或168所述的方法,其中氨基酸类型的修饰的和未修饰的氨基酸均被标记。
183.根据条款182所述的方法,其中氨基酸类型半胱氨酸(C)的所述修饰的和未修饰的氨基酸均被标记。
184.根据条款182所述的方法,其中氨基酸类型色氨酸(W)的所述修饰的和未修饰的氨基酸均被标记。
185.根据条款182所述的方法,其中氨基酸类型酪氨酸(Y)的所述修饰的和未修饰的氨基酸均被标记。
186.根据条款182所述的方法,其中氨基酸类型甘氨酸(G)的所述修饰的和未修饰的氨基酸均被标记。
187.根据条款182所述的方法,其中氨基酸类型组氨酸(H)的所述修饰的和未修饰的氨基酸均被标记。
188.根据条款182所述的方法,其中氨基酸类型甲硫氨酸(M)的所述修饰的和未修饰的氨基酸均被标记。
189.根据条款1a至1h所述的方法,其中至少一种氨基酸类型是选自以下的合成氨基酸类型:含有以下官能团的氨基酸类型:叠氮化物、炔烃、烯烃、环辛炔、二烯、酰基、碘、硼酸、双吖丙啶、环辛烯、环氧化物、环丙烷、磺酸、亚磺酸、生物素、肟、硝酮、降冰片烯、四氮烯、四唑、四环烷、贫电子π体系、富电子π体系、卤素、NHS酯、马来酰亚胺、肼、腙和/或重氮基及其任何组合。
190.根据前述条款中任一项所述的方法,其中每种氨基酸类型的所有或一定比例的所述氨基酸被标记。
191.根据条款190所述的方法,其中每种氨基酸类型的所有氨基酸被标记。
192.根据条款190所述的方法,其中至少所有第一氨基酸类型被标记,并且至少一定比例的第二氨基酸类型被标记。
193.根据条款190所述的方法,其中在所述样本中三种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二和第三氨基酸类型的一定比例的所述氨基酸被标记。
194.根据条款190所述的方法,其中在所述样本中三种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三氨基酸类型的一定比例的所述氨基酸被标记。
195.根据条款190所述的方法,其中在所述样本中四种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二、第三和第四氨基酸类型的一定比例的所述氨基酸被标记。
196.根据条款190所述的方法,其中在所述样本中四种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三和第四氨基酸类型的一定比例的所述氨基酸被标记。
197.根据条款190所述的方法,其中在所述样本中四种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,并且第四氨基酸类型的一定比例的所述氨基酸被标记。
198.根据条款190所述的方法,其中在所述样本中五种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二、第三、第四和第五氨基酸类型的一定比例的所述氨基酸被标记。
199.根据条款190所述的方法,其中在所述样本中五种氨基酸类型被标记,其中第一、第二、第三和第四氨基酸类型的所有所述氨基酸被标记,并且第五氨基酸类型的一定比例的所述氨基酸被标记。
200.根据条款190所述的方法,其中在所述样本中五种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三、第四和第五氨基酸类型的一定比例的所述氨基酸被标记。
201.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,以及第四和第五氨基酸类型的一定比例的所述氨基酸,其中所述第一、第二和第三氨基酸类型的所述未修饰的氨基酸被标记并且所述第四和第五氨基酸类型的所述修饰的氨基酸被标记。
202.根据条款190所述的方法,当从属于条款167或168时,其中至少所有第一氨基酸类型被标记,并且至少一定比例的第二氨基酸类型被标记,其中所述第一氨基酸类型的所述未修饰的氨基酸被标记并且所述第二氨基酸类型的所述修饰的氨基酸被标记。
203.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中三种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二和第三氨基酸类型的一定比例的所述氨基酸被标记,其中第一氨基酸类型的所述未修饰的氨基酸被标记并且所述第二和第三氨基酸类型的所述修饰的氨基酸被标记。
204.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中三种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一和第二氨基酸类型的所述未修饰的氨基酸被标记并且所述第三氨基酸类型的所述修饰的氨基酸被标记。
205.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中四种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二、第三和第四氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一氨基酸类型的所述未修饰的氨基酸被标记并且所述第二、第三和第四氨基酸类型的所述修饰的氨基酸被标记。
206.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中四种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三和第四氨基酸类型的一定比例的所述氨基酸被标记,其中第一和第二氨基酸类型的所述未修饰的氨基酸被标记并且所述第三和第四氨基酸类型的所述修饰的氨基酸被标记。
207.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中四种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,并且第四氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二和第三氨基酸类型的所述未修饰的氨基酸被标记并且所述第四氨基酸类型的所述修饰的氨基酸被标记。
208.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二、第三、第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中第一氨基酸类型的所述未修饰的氨基酸被标记并且所述第二、第三、第四和第五氨基酸类型的所述修饰的氨基酸被标记。
209.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二、第三和第四氨基酸类型的所有所述氨基酸被标记,并且第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二、第三和第四氨基酸类型的所述未修饰的氨基酸被标记并且所述第五氨基酸类型的所述修饰的氨基酸被标记。
210.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三、第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一和第二氨基酸类型的所述未修饰的氨基酸被标记并且所述第三、第四和第五氨基酸类型的所述修饰的氨基酸被标记。
211.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,并且第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二和第三氨基酸类型的所述未修饰的氨基酸被标记并且所述第四和第五氨基酸类型的所述修饰的氨基酸被标记。
212.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,并且第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二和第三氨基酸类型的所述未修饰的氨基酸被标记并且所述第四和第五氨基酸类型的所述修饰的氨基酸被标记。
213.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的一定比例的所述氨基酸被标记,并且第四和第五氨基酸类型的所有所述氨基酸被标记,其中所述第一、第二和第三氨基酸类型的所述修饰的氨基酸被标记并且所述第四和第五氨基酸类型的所述未修饰的氨基酸被标记。
214.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中三种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二和第三氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一氨基酸类型的所述修饰的氨基酸被标记并且所述第二和第三氨基酸类型的所述未修饰的氨基酸被标记。
215.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中三种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一和第二氨基酸类型的所述修饰的氨基酸被标记并且所述第三氨基酸类型的所述未修饰的氨基酸被标记。
216.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中四种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二、第三和第四氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一和第二氨基酸类型的所述修饰的氨基酸被标记并且所述第三和第四氨基酸类型的所述未修饰的氨基酸被标记。
217.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中四种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三和第四氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一和第二氨基酸类型的所述修饰的氨基酸被标记并且所述第三和第四氨基酸类型的所述未修饰的氨基酸被标记。
218.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中四种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,并且第四氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二和第三氨基酸类型的所述修饰的氨基酸被标记并且所述第四氨基酸类型的所述未修饰的氨基酸被标记。
219.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一氨基酸类型的所有所述氨基酸被标记,并且第二、第三、第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一氨基酸类型的所述修饰的氨基酸被标记并且所述第二、第三、第四和第五氨基酸类型的所述未修饰的氨基酸被标记。
220.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二、第三和第四氨基酸类型的所有所述氨基酸被标记,并且第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二、第三和第四氨基酸类型的所述修饰的氨基酸被标记并且所述第五氨基酸类型的所述未修饰的氨基酸被标记。
221.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一和第二氨基酸类型的所有所述氨基酸被标记,并且第三、第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一和第二氨基酸类型的所述修饰的氨基酸被标记并且所述第三、第四和第五氨基酸类型的所述未修饰的氨基酸被标记。
222.根据条款190所述的方法,当从属于条款167或168时,其中在所述样本中五种氨基酸类型被标记,其中第一、第二和第三氨基酸类型的所有所述氨基酸被标记,并且第四和第五氨基酸类型的一定比例的所述氨基酸被标记,其中所述第一、第二和第三氨基酸类型的所述修饰的氨基酸被标记并且所述第四和第五氨基酸类型的所述未修饰的氨基酸被标记。
223.根据条款190所述的方法,当从属于条款167或168时,其中至少第一氨基酸类型的所有所述修饰的氨基酸被标记,并且至少第二氨基酸类型的一定比例的所述未修饰的氨基酸被标记。
224.根据条款1a至1h所述的方法,其中步骤e)包含通过将所述样本中每种标记的氨基酸类型的所述测量的标记和/或氨基酸浓度与一种或多种蛋白质浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度进行比较,或将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的相同的两种或更多种氨基酸类型的已知氨基酸数目进行比较来鉴定所述样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
225.根据条款1a至1h或条款224所述的方法,其中指示与在所述样本中已标记的所述氨基酸类型相同的两种或更多种氨基酸类型的所述已知标记值,和/或氨基酸浓度,和/或氨基酸数目的信息是参考以鉴定每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度。
226.根据条款225所述的方法,其中所述参考提供了与一种或多种蛋白质浓度的每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述样本中已标记的所述氨基酸类型相同的两种或更多种氨基酸类型的所述标记的所述已知值或氨基酸浓度,或其中所述参考提供了与在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述样本中已标记的所述氨基酸类型相同的两种或更多种氨基酸类型的所述氨基酸数目。
227.根据条款226所述的方法,其中所述参考提供了与在作为蛋白质浓度的函数下在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述样本中已标记的所述氨基酸类型相同的两种或更多种氨基酸类型的所述标记的所述已知值或氨基酸浓度,或其中,其中所述参考提供了与在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述样本中已标记的所述氨基酸类型相同的两种或更多种氨基酸类型的所述氨基酸数目。
228.根据条款225至227中任一项所述的方法,其中所述参考提供了每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考线或参考曲线。
229.根据条款228所述的方法,其中每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述参考线或参考曲线由连续的点组成,所述连续的点各自提供每种浓度的所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述已知标记值或氨基酸浓度。
230.根据条款229所述的方法,其中每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述参考线或参考曲线由连续的点组成,所述连续的点各自提供每种蛋白质浓度的所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述已知标记值或氨基酸浓度。
231.根据条款229或230所述的方法,其中所述参考线或参考曲线是使用浓度或蛋白质浓度的共同参数来参数化描述的。
232.根据条款229或230所述的方法,其中所述参考线或参考曲线使用浓度或蛋白质浓度的共同自变量以向量格式描述。
233.根据条款232所述的方法,其中所述参考线或参考曲线是向量。
234.根据条款228至233所述的方法,其中所述样本中标记的两种或更多种氨基酸类型的所述标记的测量值、氨基酸浓度或氨基酸数目提供了所述参考线或参考曲线上的点。
235.根据条款234所述的方法,其中计算样本点与所述参考或参考向量之间的最短距离。
236.根据条款235所述的方法,其中所述样本点与所述参考向量之间的所述最短距离是所述样本点与所述参考向量之间的垂直距离。
237.根据条款223、234或235所述的方法,其中确定从所述样本点到所述参考线的所述向量。
238.根据条款233、234、235或237所述的方法,其中确定从所述样本点到所述参考线的所述向量与所述参考线的方向之间的点积(-),并且从所述样本点到所述参考向量的所述垂直距离是所述样本点与所述参考向量上的特定点之间的距离,对于所述特定点,所述点积(-)等于0。
239.根据条款237所述的方法,其中求解方程以提供所述浓度或所述蛋白质浓度,所述浓度或所述蛋白质浓度鉴定所述参考线上的所述特定点,对于所述特定点,所述样本点与所述参考线之间的所述向量是垂直的。
240.根据条款239所述的方法,其中提供所述垂直距离的所述参考线上的所述特定点是通过将所鉴定的浓度或蛋白质浓度值输入到所述参考线的向量函数中来计算。
241.根据条款236和240所述的方法,其中计算所述样本点与提供所述垂直距离的所述参考线上的这个点之间的距离。
242.根据条款1a至1h和241所述的方法,其中将这个垂直距离与误差容限进行比较。
243.根据条款242所述的方法,其中如果所述样本点与其参考线之间的所述垂直距离小于或等于误差容限,则鉴定所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述存在和/或浓度和/或量,并且其中所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述浓度或蛋白质浓度是提供这个垂直距离的所述浓度或蛋白质浓度。
244.根据条款190或192至223中任一项所述的方法,其中氨基酸类型的一定比例的所述氨基酸被标记,并且其中所述比例是标记的氨基酸类型的所述氨基酸的约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%。
245.根据条款167或168所述的方法,其中氨基酸类型的所述修饰的氨基酸被标记为与氨基酸类型的所述未修饰的氨基酸不同。
246.根据条款182所述的方法,其中氨基酸类型的所述未修饰的氨基酸被标记为与所述修饰的和未修饰的氨基酸的总数不同。
247.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过首先将它们转换为所述氨基酸类型的未修饰的氨基酸来标记的。
248.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过首先通过化学转变将它们转换为氨基酸类型的未修饰的氨基酸来标记的。
249.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过首先通过化学反应将它们转换为氨基酸类型的未修饰的氨基酸来标记的。
250.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过首先通过还原步骤将它们转换为氨基酸类型的未修饰的氨基酸来标记的。
251.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过首先通过PTM裂解步骤将它们转换为氨基酸类型的未修饰的氨基酸来标记的。
252.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过首先通过水解步骤将它们转换为氨基酸类型的未修饰的氨基酸来标记的。
253.根据条款245或246所述的方法,其中氨基酸类型的所述修饰的氨基酸是通过使用酶首先将它们转换为氨基酸类型的未修饰的氨基酸来标记的。
254.根据条款253所述的方法,其中在标记步骤之前将所述酶从所述样本中去除。
255.根据条款246所述的方法,其中半胱氨酸(C
256.根据前述条款中任一项所述的方法,其中所述氨基酸类型中的每一种的标记对所述氨基酸类型是特异性的。
257.根据前述条款中任一项所述的方法,其中氨基酸类型的所述氨基酸的R基团被标记。
258.根据条款257所述的方法,其中氨基酸类型的所述修饰的和/或未修饰的氨基酸的所述R基团被标记。
259.根据条款258所述的方法,其中针对未修饰的A氨基酸标记的所述R基团是甲基。
260.根据条款258所述的方法,其中针对未修饰的R氨基酸标记的所述R基团是脂肪族胍基基团。
261.根据条款260所述的方法,其中所述脂肪族胍基基团是部分伯胺特性和/或相等的伯胺特性。
262.根据条款258所述的方法,其中针对修饰的R氨基酸(Rg)标记的所述R基团是键合至胍基胺的碳水化合物糖苷。
263.根据条款258所述的方法,其中针对修饰的R氨基酸(Rm)标记的所述R基团是甲基化的胍基胺。
264.根据条款258所述的方法,其中针对修饰的R氨基酸(Rc)标记的所述R基团是瓜氨酸。
265.根据条款258所述的方法,其中针对修饰的A氨基酸(Aa)标记的所述R基团是在N-末端的N-乙酰化的丙氨酸。
266.根据条款258所述的方法,其中针对未修饰的N氨基酸标记的所述R基团是β-甲酰胺。
267.根据条款258所述的方法,其中针对修饰的N氨基酸(Ng)标记的所述R基团是键合至β-甲酰胺胺的碳水化合物糖苷。
268.根据条款258所述的方法,其中针对修饰的N氨基酸(Nd)标记的所述R基团是羧酸(天冬氨酸D或异天冬氨酸isoD)。
269.根据条款258所述的方法,其中针对修饰的D氨基酸(Di)标记的所述R基团是羧酸(异天冬氨酸)。
270.根据条款258所述的方法,其中针对修饰的和未修饰的C氨基酸标记的所述R基团是还原的硫醇。
271.根据条款258所述的方法,其中针对未修饰的C氨基酸(C
272.根据条款258所述的方法,其中针对修饰的C氨基酸(C
273.根据条款258所述的方法,其中针对修饰的C氨基酸(Cfe)标记的所述R基团是次磺酸。
274.根据条款258所述的方法,其中针对修饰的C氨基酸(Cfu)标记的所述R基团是磺酸。
275.根据条款258所述的方法,其中针对修饰的C氨基酸(Cp)标记的所述R基团是棕榈酰化的硫醇。
276.根据条款258所述的方法,其中针对修饰的C氨基酸(Cn)标记的所述R基团是在N-末端处的N-乙酰化的半胱氨酸。
277.根据条款258所述的方法,其中针对修饰的C氨基酸(Cno)标记的所述R基团是S-亚硝基硫醇。
278.根据条款258所述的方法,其中针对修饰的E氨基酸(Ep)标记的所述R基团是焦谷氨酸。
279.根据条款258所述的方法,其中针对修饰的E氨基酸(Ep)标记的所述R基团是在N-末端处的焦谷氨酸。
280.根据条款258所述的方法,其中针对修饰的E氨基酸(Ec)标记的所述R基团是γ-二羧酸。
281.根据条款258所述的方法,其中针对修饰的E氨基酸(Ec)标记的所述R基团是γ-二羧酸。
282.根据条款258所述的方法,其中针对修饰的Q氨基酸(Qp)标记的所述R基团是在N-末端处的焦谷氨酸。
283.根据条款258所述的方法,其中针对修饰的Q氨基酸(Qe)标记的所述R基团是γ-羧酸。
284.根据条款258所述的方法,其中针对修饰的Q氨基酸(Qip)标记的所述R基团是具有K氨基酸的异肽键。
285.根据条款258所述的方法,其中针对修饰的G氨基酸(Gm)标记的所述R基团是在N-末端处的N-肉豆蔻酰基。
286.根据条款258所述的方法,其中针对修饰的G氨基酸标记的所述R基团是在N-末端处的N-乙酰基。
287.根据条款258所述的方法,其中针对修饰的H氨基酸(Hp)标记的所述R基团是磷酸咪唑。
288.根据条款258所述的方法,其中针对修饰的K氨基酸(Ka)标记的所述R基团是具有乙酰基取代基的ε-仲氨基基团。
289.根据条款258所述的方法,其中针对修饰的K氨基酸(Ku)标记的所述R基团是具有泛素取代基的ε-仲氨基基团。
290.根据条款258所述的方法,其中针对修饰的K氨基酸(Ks)标记的所述R基团是ε-仲氨基基团SUMO基取代基。
291.根据条款258所述的方法,其中针对修饰的K氨基酸(Km)标记的所述R基团是具有甲基取代基的ε-仲氨基基团。
292.根据条款258所述的方法,其中针对修饰的K氨基酸(Ki)标记的所述R基团是具有键合至谷氨酰胺的异肽键的ε-仲氨基基团。
293.根据条款258所述的方法,其中针对修饰的K氨基酸(Kh)标记的所述R基团是具有羟基取代基的ε-仲氨基基团。
294.根据条款258所述的方法,其中针对修饰的M氨基酸(Ma)标记的所述R基团是在N-末端处的N-乙酰基。
295.根据条款258所述的方法,其中针对修饰的M氨基酸(Mu)标记的所述R基团是硫酯连接的泛素。
296.根据条款258所述的方法,其中针对修饰的M氨基酸(Msx)标记的所述R基团是亚砜。
297.根据条款258所述的方法,其中针对修饰的M氨基酸(Mso)标记的所述R基团是砜。
298.根据条款258所述的方法,其中针对修饰的P氨基酸(Ph)标记的所述R基团是羟基吡咯烷。
299.根据条款258所述的方法,其中针对修饰的S氨基酸(Sp)标记的所述R基团是羟甲基磷酸酯。
300.根据条款258所述的方法,其中针对修饰的S氨基酸(Sg)标记的所述R基团是羟甲基糖苷。
301.根据条款258所述的方法,其中针对修饰的S氨基酸(Sn)标记的所述R基团是在N-末端处的N-乙酰基。
302.根据条款258所述的方法,其中针对修饰的T氨基酸(Tp)标记的所述R基团是羟基磷酸酯。
303.根据条款258所述的方法,其中针对修饰的T氨基酸(Tg)标记的所述R基团是羟基糖苷。
304.根据条款258所述的方法,其中针对修饰的T氨基酸(Tn)标记的所述R基团是在N-末端处的N-乙酰基。
305.根据条款258所述的方法,其中针对修饰的W氨基酸(Wmo)标记的所述R基团是吲哚醇(indoleol)(单羟基吲哚)。
306.根据条款258所述的方法,其中针对修饰的W氨基酸(Wdo)标记的所述R基团是吲哚二醇(二羟基吲哚)。
307.根据条款258所述的方法,其中针对修饰的W氨基酸(Wk)标记的所述R基团是犬尿氨酸。
308.根据条款258所述的方法,其中针对修饰的Y氨基酸(Ys)标记的所述R基团是硫酸苯酯。
309.根据条款258所述的方法,其中针对修饰的Y氨基酸(Yp)标记的所述R基团是磷酸苯酯。
310.根据条款258所述的方法,其中针对修饰的V氨基酸(Vn)标记的所述R基团是在N-末端处的N-乙酰基。
311.根据条款258所述的方法,其中针对未修饰的E氨基酸标记的所述R基团是γ-羧酸。
312.根据条款258所述的方法,其中针对未修饰的Q氨基酸标记的所述R基团是γ-甲酰胺。
313.根据条款258所述的方法,其中针对未修饰的G氨基酸标记的所述R基团是氢作为取代基的α碳。
314.根据条款258所述的方法,其中针对未修饰的H氨基酸标记的所述R基团是咪唑。
315.根据条款258所述的方法,其中针对未修饰的I氨基酸标记的所述R基团是仲丁基。
316.根据条款258所述的方法,其中针对未修饰的L氨基酸标记的所述R基团是异丁基。
317.根据条款258所述的方法,其中针对未修饰的K氨基酸标记的所述R基团是ε-伯氨基基团。
318.根据条款258所述的方法,其中针对修饰的K氨基酸标记的所述R基团是磷酸吡哆醛醛亚胺(Pyridoxyal phosphate aldimine)。
319.根据条款258所述的方法,其中针对未修饰的M氨基酸标记的所述R基团是S-甲基硫醚。
320.根据条款258所述的方法,其中针对未修饰的F氨基酸标记的所述R基团是苄基。
321.根据条款258所述的方法,其中针对未修饰的P氨基酸标记的所述R基团是吡咯烷。
322.根据条款258所述的方法,其中针对修饰的P氨基酸(Ph4)标记的所述R基团是4-羟基吡咯烷。
323.根据条款258所述的方法,其中针对S的未修饰的氨基酸标记的所述R基团是羟甲基。
324.根据条款258所述的方法,其中针对修饰的S氨基酸(Sp)标记的所述R基团是磷酸甲酯。
325.根据条款258所述的方法,其中针对未修饰的T氨基酸标记的所述R基团是羟基。
326.根据条款258所述的方法,其中针对修饰的T氨基酸(Tp)标记的所述R基团是磷酸酯。
327.根据条款258所述的方法,其中针对未修饰的W氨基酸标记的所述R基团是吲哚。
328.根据条款258所述的方法,其中针对未修饰的Y氨基酸标记的所述R基团是苯酚。
329.根据条款258所述的方法,其中针对修饰的Y氨基酸(Yp)标记的所述R基团是磷酸苯酚(Phosphophenol)。
330.根据条款258所述的方法,其中针对未修饰的V氨基酸标记的所述R基团是异丙基。
331.根据条款258所述的方法,其中吡咯赖氨酸(O)的所述R基团是吡咯(N,2,3-三甲基-3,4-二氢-2H-吡咯-2-甲酰胺)。
332.根据条款258所述的方法,其中硒代半胱氨酸(U)的所述R基团是乙硒醇。
333.根据条款258所述的方法,其中修饰的和未修饰的W氨基酸的所述R基团是吲哚基团,其中单氧化的(修饰的)W氨基酸的所述R基团是羟基吲哚基团,并且二氧化的(修饰的)W氨基酸的所述R基团是二羟基吲哚基团。
334.根据条款258所述的方法,其中未修饰的K氨基酸的所述R基团是ε-伯氨基基团,其中乙酰化的(修饰的)K的所述R基团是乙酰化的ε-仲氨基,泛素化的(修饰的)K的所述R基团是泛素化的ε-仲氨基,SUMO化的(修饰的)K的所述R基团是SUMO化的ε-仲氨基,甲基化(修饰的)K的所述R基团是甲基化的(烷基化的)ε-仲氨基。
335.根据条款258所述的方法,其中修饰和未修饰的Y氨基酸的所述R基团是苯酚基团,其中硫酸化的(修饰的)Y氨基酸的所述R基团是硫酸苯酚基团,并且磷酸化的(修饰的)Y氨基酸的所述R基团是磷酸苯酚基团。
336.根据条款257至335中任一项所述的方法,其中每种氨基酸类型的所述R基团的所述标记对所述氨基酸类型是特异性的。
337.根据条款257至335中任一项所述的方法,其中每种未修饰的氨基酸类型的所述R基团的所述标记对于所述未修饰的氨基酸类型是特异性的。
338.根据条款257至335中任一项所述的方法,其中每种修饰的氨基酸类型的所述R基团的所述标记对所述氨基酸类型是特异性的。
339.根据条款257至335中任一项所述的方法,其中用相同取代基标记修饰的氨基酸类型的R基团是特异于所述R基团的取代基。
340.根据条款336所述的方法,其中标记含有磷酸基的R基团对于含有磷酸基的R基团是特异性的,从而允许检测所有磷酸化的氨基酸类型。
341.根据条款336所述的方法,其中标记含有糖苷的R基团对于含有糖苷的R基团是特异性的并且包含用TT/n-Bu4NN3或Ph3P:2,3-二氯-5,6-二氰基苯醌(DDQ):n-Bu4NN3选择性转换为叠氮化物,随后与F1-DIBO反应。
342.根据条款336所述的方法,其中标记含有脂肪酸的R基团对于含有脂肪酸的R基团是特异的,其包含用偶极3-甲氧基色酮标记,从而允许检测所有脂化氨基酸类型。
343.根据条款336所述的方法,其中标记含有磷酸基的R基团包含用羰二咪唑活化以提供离去基团,随后与半胱氨酸BODIPY染料反应,并且对于含有磷酸基的R基团是特异的,从而允许检测用磷酸基修饰的所有氨基酸类型。
344.根据前述条款中任一项所述的方法,其中在所述样本中所述氨基酸类型的标记反应期间或之前,使亚蛋白质组内的任何肽、寡肽、多肽、蛋白质、蛋白质复合物或蛋白质组内的任何肽、寡肽、多肽、蛋白质或蛋白质复合物变性。
345.根据条款344所述的方法,其中在使用有机溶剂对所述样本中的所述氨基酸类型进行所述标记反应期间或之前,使亚蛋白质组内的任何肽、寡肽、多肽、蛋白质、蛋白质复合物或蛋白质组内的任何肽、寡肽、多肽、蛋白质或蛋白质复合物变性。
346.根据条款344所述的方法,其中在使用表面活性剂对所述样本中的所述氨基酸类型进行所述标记反应期间或之前,使亚蛋白质组内的任何肽、寡肽、多肽、蛋白质、蛋白质复合物或蛋白质组内的任何肽、寡肽、多肽、蛋白质或蛋白质复合物变性。
347.根据条款344所述的方法,其中在使用还原剂对所述样本中的所述氨基酸类型进行所述标记反应期间或之前,使亚蛋白质组内的任何肽、寡肽、多肽、蛋白质、蛋白质复合物或蛋白质组内的任何肽、寡肽、多肽、蛋白质或蛋白质复合物变性。
348.根据条款344所述的方法,其中在使用高或低pH条件对所述样本中的所述氨基酸类型进行所述标记反应期间或之前,使亚蛋白质组内的任何肽、寡肽、多肽、蛋白质、蛋白质复合物或蛋白质组内的任何肽、寡肽、多肽、蛋白质或蛋白质复合物变性。
349.根据条款344所述的方法,其中在使用有机溶剂、表面活性剂、还原剂或者高或低pH条件的任何组合对所述样本中的所述氨基酸类型进行所述标记反应期间或之前,使亚蛋白质组内的任何肽、寡肽、多肽、蛋白质、蛋白质复合物或蛋白质组内的任何肽、寡肽、多肽、蛋白质或蛋白质复合物变性。
350.根据条款1a至1h或2至256中任一项所述的方法,其中两种或更多种氨基酸类型用相同标记来标记,并且针对每种氨基酸类型独立地鉴定所述标记。
351.根据条款350所述的方法,其中用于检测所述标记的参数是不同的。
352.根据条款350所述的方法,其中所述标记反应是不同的。
353.根据条款350所述的方法,其中在与所述标记反应之前,一种氨基酸类型在与另一种氨基酸类型不同的条件下转换为反应性形式。
354.根据条款353所述的方法,其中在所述标记反应期间使用不同的催化剂。
355.根据条款353所述的方法,其中不同波长的光用于催化所述标记反应。
356.根据条款353所述的方法,其中在氨基酸类型上进行不同的化学反应以在与所述标记反应之前引入反应性基团。
357.根据条款349所述的方法,其中使用不同的反应时间。在实施例中,当一种氨基酸类型与所述标记的反应比另一种氨基酸类型更快。
358.根据条款350或351所述的方法,其中将针对一种氨基酸类型的所述测量的标记与针对第二种氨基酸类型的所述标记解卷积。
359.根据条款358所述的方法,其中使用仅含有所述标记的氨基酸类型中的一种的氨基酸的解卷积标准,将一种氨基酸类型的所述测量的标记与第二种氨基酸类型的所述标记解卷积。
360.根据条款358或359所述的方法,其中所述氨基酸类型色氨酸(W)和酪氨酸(Y)用相同的标记来标记,并且W氨基酸的所述测量的标记与Y氨基酸的所述标记解卷积。
361.根据条款358或359所述的方法,其中所述氨基酸类型色氨酸(W)和酪氨酸(Y)用相同的标记来标记,并且使用分开的激发波长,将W氨基酸的所述测量的标记与W和Y氨基酸的所述测量的标记分开检测。
362.根据条款358或359所述的方法,其中所述氨基酸类型色氨酸(W)和酪氨酸(Y)用相同的标记来标记,并且使用仅含有W氨基酸的解卷积标准计算在标记W和Y氨基酸两者的激发波长下W氨基酸的所述测量的标记,并且将其从W和Y氨基酸两者的标记的总值中减去以单独显示Y氨基酸的所述标记的值。
363.根据前述条款中任一项所述的方法,其中在整个样本中标记两种或更多种氨基酸类型。
364.根据条款1至363中任一项所述的方法,其中将所述样本分离成多个级分并且在每个级分中进行不同的标记反应,所述标记反应特异性地标记所述氨基酸类型的两种或更多种。
365.根据条款364所述的方法,其中所述级分具有相等体积。
366.根据条款364或365所述的方法,其中4种氨基酸类型被标记并且所述样本在标记之前被分离成两个级分,其中两种氨基酸类型在一个级分中被标记并且两种其它氨基酸类型在第二个级分中被标记。
367.根据条款366所述的方法,其中所述4种氨基酸类型W、K、Y和C被标记,并且在标记之前将所述样本分离成两个级分,其中在一个级分中标记W和K氨基酸,并且在第二个级分中标记Y和C。
368.根据条款366所述的方法,其中所述4种氨基酸类型W、K、Y和C被标记,并且在标记之前将所述样本分离成三个级分,其中在一个级分中标记W和Y氨基酸,并且在单独的级分中标记C和K氨基酸。
369.根据条款364或365所述的方法,其中4种氨基酸类型被标记并且在标记之前将所述样本分离成4个级分,其中在每个级分中标记一种氨基酸类型。
370.根据条款369所述的方法,其中所述氨基酸类型W、K、Y和C被标记并且在标记之前将所述样本分离成4个级分,其中在第一个级分中标记W,在第二个级分中标记K,在第三个级分中标记C,在第四个级分中标记Y。
371.根据条款364或365所述的方法,其中级分的数目等于所述样本中标记的氨基酸类型的数目。
372.根据条款364或365所述的方法,其中每个级分含有所有氨基酸类型,因为所述氨基酸类型包含在未经消化或水解的完整蛋白质或肽链上。
373.根据条款364或365所述的方法,其中所述级分的数目不等于所述样本中所述标记的氨基酸类型的数目,并且每级分标记多于一种氨基酸类型。
374.根据条款364或365所述的方法,其中两种或更多种氨基酸类型具有相同的标记并且它们在不同的级分中被标记。
375.根据前述条款中任一项所述的方法,其中所述标记反应在本体中而不是在微流体装置中进行。
376.根据前述条款中任一项所述的方法,其中所述样本的所述标记和/或所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组的所述已知标记值提供信号。
377.根据前述条款中任一项所述的方法,其中所述样本的所述标记是荧光团。
378.根据前述条款中任一项所述的方法,其中所述样本的所述标记是荧光团的反应性衍生物。
379.根据条款377或378所述的方法,其中所述样本的所述标记是荧光标记。
380.根据条款379所述的方法,其中所述荧光标记是荧光探针。
381.根据条款380所述的方法,其中所述荧光标记是荧光标签。
382.根据条款380所述的方法,其中所述荧光标记是荧光蛋白。
383.根据条款380所述的方法,其中所述荧光标记是荧光染料。
384.根据条款380所述的方法,其中所述荧光标记包括对氨基酸类型特异的反应性基团。
385.根据条款380所述的方法,其中所述荧光标记包括靶向氨基酸类型的反应性基团。
386.根据条款380所述的方法,其中所述荧光标记包括对氨基酸类型的所述R基团特异的反应性基团。
387.根据条款380所述的方法,其中所述荧光标记包括靶向氨基酸类型的所述R基团的反应性基团。
388.根据条款380所述的方法,其中所述荧光标记包括对所述蛋白质的N或C末端特异的反应性基团。
389.根据条款380所述的方法,其中所述荧光标记包括靶向所述蛋白质的所述N或C末端的反应性基团。
390.根据条款380所述的方法,其中所述荧光标记包括量子点。
391.根据前述条款中任一项所述的方法,其中所述样本的所述标记包括纳米颗粒。
392.根据条款379至390所述的方法,其中所述荧光标记包括荧光团。
393.根据条款392所述的方法,其中所述荧光团选自由以下组成的组:羟基香豆素、氨基香豆素、甲氧基香豆素、瀑布蓝(Cascade Blue)、太平洋蓝、太平洋橙、荧光黄、NBD、R-藻红蛋白(PE)、PE-Cy5共轭物、PE-Cy7共轭物、红613、PerCP、TruRed、FluorX、氟硼二吡咯-FL(BODIPY-FL)、G-染料100、G-染料200、G-染料300、G-染料400、Cy2、Cy3、Cy3B、Cy3.5、Cy5、Cy5.5、Cy7、TRITC、X-罗丹明(X-Rhodamine)、丽丝胺罗丹明B、德克萨斯红、别藻蓝蛋白(APC)、APC-Cy7共轭物、DAPI、赫斯特(Hoechst)33258、SYTOX蓝、色霉素A3、光神霉素、YOYO-1、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rhol2、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO Rho13、ATTO 594、ATTO 610、ATTO Rho14、ATTO 633、ATTO647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740、亮紫421、亮紫510、亮紫570、亮紫605、亮紫650、亮紫711、亮紫750、亮紫785、TM-BDP、KFL-1、KFL-2、KFL-3、KFL-4、超亮(Super Bright)436、超亮600、超亮645、超亮702、超亮780、Alexa Flour 350、Alexa Flour 405、Alexa Flour 488、AlexaFlour 532、Alexa Flour 546、Alexa Flour 555、Alexa Flour 568、Alexa Flour 594、Alexa Flour 647、Alexa Flour 680、Alexa Flour 850、香豆素、太平洋绿、俄勒冈绿(Oregon Green)、荧光素(FITC)、PE-青色素7、PerCP-青色素5.5、四甲基罗丹明(Tetramethylrhodamine,TRITC)、eFlour 450、eFlour506、eFlour660、PE-eFlour 610、PerCP-eFlour 710、APC-eFlour 780、超亮436、超亮600、超亮645、超亮702、超亮780、DAPI、SYTOX绿、SYTO 9、TO-PRO-3、Qdot 525、Qdot 565、Qdot 605、Qdot 655、Qdot 705、Qdot800、R-藻红素(R-PE)、CFP、GFP(emGFP)、RFP(tagRFP)、VioBlue、VioGreen、VioBright 515、Vio 515、VioBright FITC、PE、PE-Vio 615、PerCP、PerCP-Vio 700、PE-Vio 770、APC、APC-Vio 770、1,8-萘酰亚胺、吖啶橙、SYTOX绿、TOTO-1、TO-PRO-1、TO-PRO:青色素单体、噻唑橙、CyTRAK橙、碘化丙啶(PI)、LDS 751、7-AAD、SYTOX橙、TOTO-3、TO-PRO-3、DRAQ5、DRAQ7、Indo-1、Fluo-3、Fluo-4、DCFH、DHR或SNARF。
394.根据条款379至390中任一项所述的方法,其中所述荧光标记包括荧光蛋白。
395.根据条款394所述的方法,其中所述荧光蛋白是GFP(Y66H突变)、GFP(Y66F突变)、EBFP、EBFP2、蓝铜矿、GFPuv、T-天蓝色、蔚蓝色、mCFP、mTurquoise2、ECFP、CyPet、GFP(Y66W突变)、mKeima-红、TagCFP、AmCyan1、mTFP1、GFP(S65A突变)、Midoriishi青色、野生型GFP、GFP(S65C突变)、TurboGFP、TagGFP、GFP(S65L突变)、翠绿色、GFP(S65T突变)、EGFP、Azami绿、ZsGreen1、TagYFP、EYFP、Topaz、Venus、mCitrine、YPet、TurboYFP、ZsYellow1、Kusabira橙、亮橘色(mOrange)、别藻蓝素(APC)、mKO、TurboRFP、tdTomato、TagRFP、DsRed单体、DsRed2(“RFP”)、mStrawberry、TurboFP602、AsRed2、mRFP1、J-红、R-藻红蛋白(RPE)、B-藻红蛋白(BPE)、mCherry、HcRed1、Katusha、P3、多甲藻素叶绿素(PerCP)、mKate(TagFP635)、TurboFP635、mPlum或mRaspberry。
396.根据前述条款中任一项所述的方法,其中所述标记包括对氨基酸类型特异的反应性基团。
397.根据条款396所述的方法,其中所述标记包括对氨基酸类型的所述R基团特异的反应性基团。
398.根据条款377至391或392至395所述的方法,其中所述荧光标记包括对在标记步骤之前或期间对氨基酸类型进行的化学修饰特异的反应性基团。
399.根据条款398所述的方法,其中所述荧光标记包括在所述标记步骤之前或期间对氨基酸类型的所述R基团进行化学修饰特异的反应性基团。
400.根据条款398所述的方法,其中所述荧光标记包括对在所述标记步骤之前或期间对与氨基酸类型的R基团邻近的蛋白质主链进行的化学修饰是特异的反应性基团。
401.根据条款396至400所述的方法,其中所述反应性基团选自由以下组成的组:NHS-酯、马来酰亚胺、炔烃、叠氮化物、溴化物、氯化物、氟化物、碘化物、芳基溴化物、芳基氯化物、芳基氟化物、芳基碘化物、二烯、亲二烯体、烯烃、四嗪、环辛炔、生物素、链霉抗生物素蛋白、异硫氰酸酯、活性酯、磺酰氯、二醛、碘乙酰胺、乙二胺、氨基吖啶酮、酰肼、羧基或烷氧基胺。
402.根据条款379所述的方法,其中所述荧光标记是荧光染料。
403.根据条款402所述的方法,其中所述荧光染料是荧光染料、非荧光染料、在与氨基酸类型具有反应性时变成发荧光的分子,和/或将固有荧光氨基酸类型的荧光转移到光谱的可见区域中的分子。
404.根据条款402所述的方法,其中所述荧光染料是荧光染料、非荧光染料、在与氨基酸类型的所述R基团具有反应性时变成发荧光的分子,和/或将固有荧光氨基酸类型的所述R基团的荧光转移到所述光谱的所述可见区域中的分子。
405.根据条款403所述的方法,其中所述荧光染料、在与氨基类型具有反应性时变成发荧光的分子,或将固有荧光氨基酸类型的所述荧光转移到所述光谱的所述可见区域中的分子选自由以下组成的组:4-氟-7-氨磺酰基苯并呋喃(ABD-F)、2,2,2-三氯乙醇(TCE)和/或邻苯二甲醛(OPA),或其混合物。
406.根据条款403所述的方法,其中荧光染料、在与氨基类型具有反应性时变成发荧光的分子,或将固有荧光氨基酸类型的所述荧光转移到所述光谱的所述可见区域中的分子是卤代化合物。
407.根据条款406所述的方法,其中所述卤代化合物选自由以下组成的组:三氯乙酸、三氯甲烷、三氟乙醇、三氟乙酸、三氟甲烷、三溴乙醇、三溴乙酸、三溴甲烷、三碘乙醇、三碘乙酸或三碘甲烷。
408.根据条款407所述的方法,其中用三氯乙酸、三氯甲烷、三氟乙醇、三氟乙酸、三氟甲烷、三溴乙醇、三溴乙酸、三溴甲烷、三碘乙醇、三碘乙酸或三碘甲烷标记氨基酸类型色氨酸(W)和/或酪氨酸(Y)。
409.根据前述条款中任一项所述的方法,其中每种氨基酸类型的所述R基团被标记。
410.根据条款409所述的方法,其中标记的氨基酸类型的所述R基团是氨基酸类型的所述修饰的和/或未修饰的氨基酸的所述R基团。
411.根据条款410所述的方法,其中未修饰的A氨基酸的所述R基团经由钯催化的C(sp
412.根据条款410所述的方法,其中用多巴色素标记未修饰的R氨基酸的所述R基团。
413.根据条款410所述的方法,其中用4-氨基-3-甲酰基苯基硝酸酯标记未修饰的N氨基酸的所述R基团。
414.根据条款410所述的方法,其中用4-(二乙氨基)-2-(吡啶-2-基甲氧基)苯甲醛附加的氟硼二吡咯(BODIPY)基探针标记未修饰的D氨基酸的所述R基团。
415.根据条款410所述的方法,其中在用三(2-羧乙基)膦(TCEP)还原氧化的硫醇之后,用4-氨基磺酰基-7-氟-2,1,3-苯并二唑(ABD-F)标记修饰的和未修饰的C氨基酸的所述R基团。
416.根据条款410所述的方法,其中用4-氨基磺酰基-7-氟-2,1,3-苯并二唑(ABD-F)或邻马来酰亚胺氟硼二吡咯或(Z)-2-(6-(乙基((3-(三氟甲基)苯基)硒基)氨基)-3-(乙基亚氨基)-2,7-二甲基-3H-氧杂蒽-9-基)苯甲酸乙酯标记未修饰的C氨基酸(C
417.根据条款410所述的方法,其中用4-(二乙氨基)-2-(吡啶-2-基甲氧基)苯甲醛附加的氟硼二吡咯基探针标记未修饰的E氨基酸的所述R基团。
418.根据条款410所述的方法,其中用4-氨基-3-甲酰基苯基硝酸酯标记未修饰的Q氨基酸的所述R基团。
419.根据条款410所述的方法,其中经由经由在CuBr(1μM)和10μM的tBuOOH的DCM的存在下与H-炔基-Phe反应在羰基的α位进行C-H键官能化,随后与3-叠氮基-7-甲氧基-2H-色烯-2-酮进行CuAAc来标记未修饰的G氨基酸的所述R基团。
420.根据条款410所述的方法,其中用2-丁基-6-(4-((6-(((2-乙氧基乙基)氨基)甲基)吡啶-2-基)甲基)哌嗪-1-基)-1H-苯并[de]异喹啉-1,3(2H)-二酮-Cu
421.根据条款410所述的方法,其中用用于异亮氨酸的δ-C-H官能化的蓝光介导的霍夫曼-洛夫勒-弗赖塔格(Hoffman-Loffler-Freytag)反应标记未修饰的I氨基酸的所述R基团,随后与由蓝色LED催化的乙酸次溴酸酐反应以引入Br基团,随后通过SN
422.根据条款410所述的方法,其中用用于异亮氨酸的δ-C-H官能化的蓝光介导的霍夫曼-洛夫勒-弗赖塔格反应标记未修饰的L氨基酸的所述R基团,随后与由蓝色LED催化的乙酸次溴酸酐反应以引入Br基团,随后通过SN2与KN3反应以引入叠氮基团,然后与4-((7-乙炔基-2-氧代-2H-色烯-4-基)甲氧基)-4-氧代丁酸进行CuAAc。
423.根据条款410所述的方法,其中在β-巯基乙醇(BME)的存在下用邻苯二甲醛(OPA)标记未修饰的K氨基酸的所述R基团。
424.根据条款410所述的方法,其中用与携带甲硫氨酸选择性碘盐的炔进行反应,随后与CalFlour染料进行点击化学来标记未修饰的M氨基酸的所述R基团。
425.根据条款410所述的方法,其中经由与(溴乙炔基)三异丙基硅烷、1μM Pd(OAc)
426.根据条款410所述的方法,其中用两亲性偶极席夫碱Zn
427.根据条款410所述的方法,其中经由用TT/n-Bu
428.根据条款410所述的方法,其中经由用TT/n-Bu4NN3或Ph3P:2,3-二氯-5,6-二氰基苯醌(DDQ):n-Bu
429.根据条款410所述的方法,其中在Rh
430.根据条款410所述的方法,其中用三氯乙醇(TCE)标记修饰的W氨基酸的所述R基团。
431.根据条款410所述的方法,其中用三氯乙醇(TCE),或使用[RhCl(PPh
432.根据条款410所述的方法,其中经由使用[Ru(bpy)
433.根据条款410所述的方法,其中经由与氮杂邻苯二甲酰亚胺进行狄尔斯阿尔德反应标记未修饰的O氨基酸的所述R基团。
434.根据条款410所述的方法,其中在pH 7下用ABD-F标记未修饰的U氨基酸的所述R基团。
435.根据条款410所述的方法,其中用BO-IMI标记修饰的S氨基酸的所述R基团。
436.根据条款410所述的方法,其中用BO-IMI标记苏氨酸的修饰的T氨基酸的所述R基团。
437.根据条款410所述的方法,其中用BO-IMI标记修饰的Y氨基酸的所述R基团。
438.根据条款410所述的方法,其中用邻马来酰亚胺氟硼二吡咯标记修饰的R氨基酸。
439.根据条款410所述的方法,其中用具有炔取代基的硼酸甲苯磺酰基探针标记所述修饰的N氨基酸,所述硼酸甲苯磺酰基探针随后与CalFlour染料反应。
440.根据条款410所述的方法,其中用9-芴甲基氯甲酸酯标记所述修饰的K氨基酸。
441.根据条款379所述的方法,其中所述荧光标记是荧光蛋白或共轭抗体。
442.根据条款441所述的方法,其中所述荧光蛋白选自由以下组成的组:smURFP、GFP、EGFP、蔚蓝色、mTurquoise、TagBFP、mCherry、亮橘色、柠檬色、Dronpa、dsRed、eqFP611、Dendra、EosFP、IrisFP、TagRFP、FbFP。
443.根据条款441所述的方法,其中所述共轭抗体是翻译后修饰的单克隆抗体。
444.根据条款443所述的方法,其中所述翻译后修饰的单克隆抗体检测磷酸丝氨酸、磷酸苏氨酸、磷酸酪氨酸、磷酸化、赖氨酸甲基化、精氨酸甲基化、赖氨酸乙酰化、精氨酸乙酰化、酰胺化、吡咯烷酮羧酸形成、异构化、脯氨酸羟基化、赖氨酸羟基化、硫酸化、黄素结合、半胱氨酸氧化、亚硝基化、赖氨酸酰化、半胱氨酸酰化、N-末端酰化、赖氨酸甲酰化、赖氨酸烷基化、半胱氨酸烷基化、精氨酰化、酰胺键形成、丁酰化、γ-羧化、精氨酸糖基化、天冬酰胺糖基化、半胱氨酸糖基化、羟赖氨酸糖基化、丝氨酸糖基化、苏氨酸糖基化、酪氨酸糖基化、色氨酸糖基化、丙二酰化、脯氨酸羟基化、赖氨酸羟基化、酪氨酸碘化、核苷酸加成、磷酸化、腺苷酰化、尿苷酰化、丙酰化、焦谷氨酸形成、S-谷胱甘肽化、半胱氨酸亚磺酰化、半胱氨酸磺酰化、赖氨酸琥珀酰化、酪氨酸硫酸化、肉豆蔻酰化、棕榈酰化、异戊二烯化、异戊烯化或glipyation。
445.根据条款1至376所述的方法,其中所述标记是串联质谱标签。
446.根据条款445所述的方法,其中所述串联质谱标签选自由以下组成的组:TMTzero、TMTduplex、TMTsimplex、TMT 10-plex、TMTpro和TMTpro Zero。
447.根据条款1至376所述的方法,其中所述标记是同位素标记。
448.根据条款447所述的方法,其中所述同位素标记是非放射性同位素。
449.根据条款449所述的方法,其中所述非放射性同位素标记选自:2H、13C和/或15N。
450.根据条款350所述的方法,其中检测到的所述信号是化学发光信号或生物化学发光信号。
451.根据条款450所述的方法,其中化学发光标记是N-(4-氨基丁基)-N-乙基-异氨基苯二酰肼(ABEI)大环内酯。
452.根据条款377至451中任一项所述的方法,其中荧光标记、同位素标记、串联质谱标记和/或化学发光标记的组合用于标记两种或更多种氨基酸类型。
453.根据条款358所述的方法,其中氨基酸类型丝氨酸和苏氨酸的所述测量的标记彼此解卷积。
454.根据条款358所述的方法,其中氨基酸类型天冬酰胺和谷氨酰胺的所述测量的标记彼此解卷积。
455.根据条款358所述的方法,其中氨基酸类型谷氨酸和天冬氨酸的所述测量的标记彼此解卷积。
456.根据条款358所述的方法,其中氨基酸类型亮氨酸和异亮氨酸的所述测量的标记彼此解卷积。
457.根据前述条款中任一项所述的方法,其中所述样本在标记之前或在所述标记反应期间变性。
458.根据条款376所述的方法,其中测量所述标记的所述信号。
459.根据前述条款中任一项所述的方法,其中所述测量的标记是背景校正的。
459a.根据条款459所述的方法,其中所述样本的自体荧光被去除。
460.根据条款447至449所述的方法,其中所述同位素标记通过NMR和/或质谱测量。
461.根据条款445至446所述的方法,其中所述串联质谱标签通过质谱测量。
462.根据条款379至395或398至442所述的方法,其中所述荧光标记通过荧光显微法测量。
463.根据条款379至395或398至442所述的方法,其中所述荧光标记通过荧光计测量。
464.根据条款379至395或398至442所述的方法,其中所述荧光标记通过荧光板读取器测量。
465.根据条款379至395或398至442所述的方法,其中所述荧光标记经由平行或串联进行和/或读取若干荧光反应的仪器测量。
466.根据条款462所述的方法,其中用荧光标记来标记所述氨基酸类型Y,并且在约250nm至约380nm的激发波长和约370nm至约500nm的发射波长下测量所述荧光标记。
467.根据条款462所述的方法,其中用荧光标记标记所述氨基酸类型W并且在约270nm至约380nm的激发波长和约430nm至约600nm的发射波长下测量所述荧光标记。
468.根据条款462所述的方法,其中用荧光标记标记所述氨基酸类型K并且在约320nm至约415nm的激发波长和约400nm至约500nm的发射波长下测量所述荧光标记。
469.根据条款462所述的方法,其中用荧光标记标记所述氨基酸类型C并且在约330nm至约400nm的激发波长和约430nm至约580nm的发射波长下测量所述荧光标记。
470.根据条款462所述的方法,其中根据提供的所述激发波长和所述发射波长范围,对于在所述样本中标记的每种氨基酸类型的每个荧光标记,所述激发波长与所述发射波长分开约10nm至约20nm。
471.根据前述条款中任一项所述的方法,其中根据所述测量的标记计算每种标记的氨基酸类型的所述氨基酸浓度,并且使用校准曲线或标准根据所述测量的标记计算所述氨基酸浓度,所述校准曲线或标准在所述样本的所述测量的标记与所述样本中所述氨基酸类型的所述氨基酸浓度之间转换。
472.根据条款471所述的方法,其中根据一种或多种蛋白质或氨基酸的一种或多种已知氨基酸浓度的所述测量的标记计算所述校准曲线或标准。
473.根据条款471所述的方法,其中根据所述测量的标记计算每种标记的氨基酸类型的所述氨基酸浓度,并且使用校准曲线根据所述测量的标记计算所述氨基酸浓度,所述校准曲线在所述样本的所述测量的标记与所述样本中所述氨基酸类型的所述氨基酸浓度之间转换。
474.根据条款471所述的方法,其中根据所述测量的标记计算每种标记的氨基酸类型的所述氨基酸浓度,并且使用标准根据所述测量的标记计算所述氨基酸浓度,所述标准在所述样本的所述测量的标记与所述样本中所述氨基酸类型的所述氨基酸浓度之间转换。
475.根据条款473所述的方法,其中根据一种或多种蛋白质或氨基酸的多于一种已知氨基酸浓度的所述测量的标记计算所述校准曲线。
476.根据条款474所述的方法,其中根据一种蛋白质或氨基酸的一种已知氨基酸浓度的所述测量的标记计算所述标准。
477.根据条款471、474或476所述的方法,其中多于一个标准产生校准曲线。
478.根据条款471、472、473或476中任一项所述的方法,其中所述校准曲线是非线性的。
478a.根据条款478所述的方法,其中所述非线性拟合是多项式拟合。
478b.根据条款478所述的方法,其中所述非线性拟合是幂律拟合。
478c.根据条款478所述的方法,其中所述非线性拟合是指数拟合。
478d.根据条款478所述的方法,其中所述非线性拟合是S形拟合。
479.根据条款471、472、473或476中任一项所述的方法,其中所述校准曲线是线性的。
480.根据条款471、472、473或475中任一项所述的方法,其中对于所述校准曲线计算在所述测量的标记与所述氨基酸浓度之间转换的最佳拟合。
481.根据条款480所述的方法,其中对于所述校准曲线计算在所述测量的标记与所述氨基酸浓度之间转换的所述最佳拟合是线性拟合。
482.根据条款481所述的方法,其中使用线性回归计算最佳拟合线。
483.根据条款471、472、473或475所述的方法,其中使用非线性回归计算最佳拟合。
484.根据条款481所述的方法,其中所述标记是荧光标记并且使用方程5计算与所述校准曲线的所述最佳拟合线:
标记值
其中标记值
485.根据条款483所述的方法,其中使用所述校准曲线的倒数确定所述样本的每种标记的氨基酸类型的所述氨基酸浓度,其为方程6:
其中A.A.浓度
486.根据条款481所述的方法,其中所述标记是荧光标记,并且所述标记是背景校正的,并且使用方程7计算所述校准曲线的所述最佳拟合线:
标记值
其中标记值
487.根据条款485所述的方法,其中使用校准函数的倒数确定所述样本的每种标记的氨基酸类型的所述氨基酸浓度,其为方程8:
其中A.A.浓度
488.根据条款484或486中任一项所述的方法,其中对于氨基酸类型n,所述最佳拟合线的所述斜率m
489.根据条款485或487中任一项所述的方法,其中氨基酸类型n的所述校准因子的倒数
490.根据条款488或489所述的方法,其中使用来自一种标准的一种氨基酸浓度的数据确定所述样本中每种标记的氨基酸类型的所述校准因子。
491.根据条款490所述的方法,其中所述标准是蛋白质或氨基酸。
492.根据条款490所述的方法,其中氨基酸类型n的所述校准因子的所述倒数通过以下确定:
493.根据前述条款中任一项所述的方法,其中计算所述样本中每种标记的氨基酸类型的所述氨基酸数目,并且通过将所述氨基酸浓度除以所述样本的总摩尔蛋白质浓度来计算所述样本中每种标记的氨基酸类型的所述氨基酸数目。
494.根据条款493所述的方法,其中针对目的蛋白质组、亚蛋白质组或复杂混合物的存在鉴定所述样本,并且每种标记的氨基酸类型的所述氨基酸数目是目的蛋白质组、亚蛋白质组或复杂混合物的所有蛋白质中每种标记的氨基酸类型的氨基酸的平均数。
495.根据条款494所述的方法,其中所述氨基酸的平均数是目的蛋白质组、亚蛋白质组或混合物的所有所述蛋白质中每个标记的氨基酸的氨基酸的加权平均数,通过蛋白质组、亚蛋白质组或蛋白质混合物的每种蛋白质的比例加权。
496.根据条款494或495所述的方法,其中每种氨基酸类型的氨基酸的所述加权平均数是使用方程11确定的:
其中w
497.根据条款496所述的方法,其中
498.根据条款496或497所述的方法,其中q
499.根据条款498所述的方法,其中所述目的蛋白质组或亚蛋白质组中的目的i的表达水平由公开可获得的数据确定,包括质谱或免疫测定。
500.根据条款499所述的方法,其中所述公开可获得的数据是公用数据库,诸如人类蛋白质图谱(Human Protein Atlas)、人类肽图谱(Human Peptide Atlas)和/或ProteomeXchange。
501.根据条款496或497中任一项所述的方法,其中q是所述目的蛋白质组或亚蛋白质组内含有的所有蛋白质(蛋白质i至c)的总预测表达水平,其各自使用公开可获得的蛋白质表达数据进行评估。
502.根据条款501所述的方法,其中q是所述目的蛋白质组或亚蛋白质组的总蛋白质浓度。
503.根据条款502所述的方法,其中q是使用本领域中的标准方法计算的所述目的蛋白质组或亚蛋白质组的总蛋白质浓度。
504.根据条款501和502所述的方法,其中q
505.根据条款504所述的方法,其中q
506.根据条款496所述的方法,其中q
506a.根据条款496所述的方法,其中
其中int
506b.根据条款506a所述的方法,其中q
其中int
506c.根据条款506a或506b所述的方法,其中q=∑int
其中∑int
506d.根据条款506b所述的方法,其中
其中int是质谱数据库提供的样本内单个蛋白质的强度或丰度,并且mr是质谱数据库或提供蛋白质的分子量和氨基酸序列的数据库提供的样本内的单个蛋白质的分子量。
506e.根据条款506d所述的方法,其中int是归一化强度、原始强度、归一化丰度或原始丰度。
506f.根据条款506a至506e中任一项所述的方法,其中int使用无标记定量(LFQ)计算。
506g.根据条款506a至506d中任一项所述的方法,其中所述质谱数据库是Proteome Xchange数据库。
506h.根据条款506a至506g中任一项所述的方法,其中提供蛋白质的分子量和氨基酸序列的数据库是UniProt数据库。
506i.根据条款506a至506c中任一项所述的方法,其中
平均(∑int
其中∑摩尔蛋白质浓度是由摩尔浓度值的数据库提供的目的蛋白质组、亚蛋白质组或样本类型中的所有蛋白质的摩尔蛋白质浓度的总和,并且其中平均(∑int
506j.根据条款506i所述的方法,其中根据人类肽图谱数据库计算所述摩尔浓度值。
506k.根据条款506i所述的方法,其中使用基于免疫测定的技术诸如ELISA测定来计算所述数据库中每种蛋白质的摩尔蛋白质浓度值,或其中使用基于免疫测定的技术诸如ELISA测定来计算所述数据库中每种蛋白质的质量蛋白质浓度值,并且使用每种蛋白质的分子量数据库诸如从UniProt数据库获得的分子量数据库将所述质量蛋白质浓度值转变为摩尔蛋白质浓度值。
5061.据条款506i所述的方法,其中使用基于适体的技术诸如Somascan测定来计算所述数据库中每种蛋白质的摩尔蛋白质浓度值,或其中使用基于免疫测定的技术诸如ELISA测定来计算所述数据库中每种蛋白质的质量蛋白质浓度值,并且使用每种蛋白质的分子量数据库诸如从UniProt数据库获得的分子量数据库将所述质量蛋白质浓度值转变为摩尔蛋白质浓度值。
506m.根据条款506i至506l中任一项所述的方法,其中a是针对给定的样本集通过计算下式来计算的:
506n.根据条款506m所述的方法,其中平均(∑int
506o.根据条款496所述的方法,其中
其中int是质谱数据库提供的样本内单个蛋白质的强度,∑int是根据质谱数据库计算的样本内所有单个蛋白质的所述强度的总和,并且MSIF
506p.根据条款506o所述的方法,其中q
其中int是质谱数据库提供的样本内单个蛋白质的所述强度。
506q.根据条款506o或506p所述的方法,其中q=∑int
其中∑int是根据质谱数据库计算的样本内所有单个蛋白质的所述强度的总和。
506r.根据条款506o至506q中任一项所述的方法,其中int是归一化强度、原始强度、归一化丰度或原始丰度。
506s.根据条款506o至506r中任一项所述的方法,其中int使用无标记定量(LFQ)计算。
506t.根据条款506o和506p所述的方法,其中所述质谱数据库是ProteomeXchange数据库。
506u.根据条款506n所述的方法,其中
平均(∑int)=a∑质量蛋白质浓度
其中∑质量蛋白质浓度是由质量浓度值的数据库提供的目的蛋白质组、亚蛋白质组或样本类型中的所有蛋白质的质量蛋白质浓度的总和,并且其中平均(∑int)是所述数据库内的所有样本的∑int值的平均值。
506v.根据条款506u所述的方法,其中根据人类肽图谱数据库计算所述质量蛋白质浓度值。
506w.根据条款506t至506v中任一项所述的方法,其中使用基于免疫测定的技术诸如ELISA测定计算所述数据库中每种蛋白质的所述质量蛋白质浓度值。
506x.根据条款506t至506v中任一项所述的方法,其中使用基于适体的技术诸如Somascan测定计算所述数据库中每种蛋白质的所述质量蛋白质浓度值。
506y.根据条款506u至506x中任一项所述的方法,其中a是针对给定的样本集通过计算下式来计算的:
506z.根据条款506y所述的方法,其中平均(∑int)是所述数据库中所有样本的∑int值的平均值。
507.根据条款496所述的方法,其中目的蛋白质组是病毒,并且q
508.根据条款507所述的方法,其中冠状病毒纤突蛋白的数目根据冠状病毒病毒衣壳的模型计算。
509.根据条款495所述的方法,其中每种氨基酸类型的氨基酸的加权平均数用方程12确定:
其中w
510.根据条款509所述的方法,其中所述目的蛋白质组或亚蛋白质组内的所有蛋白质被认为在所述目的蛋白质组或亚蛋白质组内具有等效表达或比例,因此所述目的蛋白质组或亚蛋白质组内的每种目的蛋白质的权重相等。
511.根据条款496或509所述的方法,其中对于所述目的蛋白质组或亚蛋白质组中的所有蛋白质i至c进行线性组合。
512.根据条款494所述的方法,其中每种氨基酸类型的氨基酸的加权平均数使用方程6确定:
其中w
513.根据条款512所述的方法,其中在492至502中使用的任何所述方法用于计算
514.根据条款495所述的方法,其中每种氨基酸类型的氨基酸的加权平均数用方程12确定:
其中w
515.根据条款494、509和514所述的方法,其中蛋白质的复杂混合物是具有多于5、6、7、8、9或10种蛋白质的混合物。
516.根据条款494、509和514所述的方法,其中蛋白质组、亚蛋白质组或蛋白质组混合物的每种蛋白质的分数、比例或组成通过将所述蛋白质的表达水平的分数与蛋白质或蛋白质组混合物内的所有蛋白质的表达水平进行比较来确定。
517.根据前述条款中任一项所述的方法,其中一种或多种蛋白质浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度根据所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的所述氨基酸序列计算。
518.根据条款517所述的方法,其中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的所述氨基酸序列提供每种氨基酸类型的氨基酸数目。
519.根据条款518的方法,其中所述氨基酸数目包括氨基酸序列内氨基酸类型的未修饰氨基酸的数目,其中所述氨基酸类型的未修饰氨基酸的数目是所述氨基酸序列内所述氨基酸类型的出现的数目减去所述氨基酸类型的翻译后修饰的数目。
520.根据前述条款中任一项所述的方法,其中当计算目的蛋白质、肽、寡肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列内或包含在其内的两种或更多种氨基酸类型中的每一种的所述氨基酸数目时,通过考虑翻译后修饰(PTM)来调节目的蛋白质中每种氨基酸类型的所述氨基酸数目,所述翻译后修饰以使得其与用于氨基酸标记的所述标记化学不反应的方式影响氨基酸类型。
521.根据条款520所述的方法,其中当计算目的蛋白质、肽、寡肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列内或包含在其内的两种或更多种氨基酸类型中的每一种的所述氨基酸数目时,通过考虑翻译后修饰(PTM)来调节目的蛋白质中每种氨基酸类型的所述氨基酸数目,所述翻译后修饰以使得其与用于氨基酸标记的所述标记化学不反应的方式影响定义氨基酸类型的R基团。
522.根据条款519至521所述的方法,其中关于翻译后修饰的信息能够基于实验结果获得,或使用预测获得。
523.根据条款519至522所述的方法,其中应用表4中提供的规则。
524.根据条款523所述的方法,其中如果将-1添加到氨基酸序列内的氨基酸类型的数目中,则使用本文所公开的标记化学在所述样本内标记所述氨基酸类型的未修饰的氨基酸。
525.根据条款523所述的方法,其中如果将0添加到氨基酸序列内的氨基酸类型的数目中,则使用本文所公开的所述标记化学在所述样本内标记所有所述氨基酸类型(未修饰的和修饰的氨基酸两者)。
526.根据前述条款中任一项所述的方法,其中如果在所述标记反应之前或期间在所述样本内将氨基酸类型的修饰的氨基酸转换为氨基酸类型的未修饰的氨基酸,则不应用根据条款523所述的规则。
527.根据条款495所述的方法,其中使用公开可获得的全蛋白质组PTM统计来计算目的蛋白质组或亚蛋白质组的两种或更多种氨基酸类型中的每一种的氨基酸的加权平均数。
528.根据条款495所述的方法,其中通过使用公开可获得的全蛋白质组翻译后修饰统计来计算目的蛋白质组或亚蛋白质组的未修饰的或修饰的氨基酸的数目。
529.根据条款528所述的方法,其中过滤全蛋白质组翻译后修饰统计以提供对原核生物、真核生物和包括人的哺乳动物特异的翻译后修饰频率。
530.根据条款529所述的方法,其中将病毒视为不经历翻译后修饰,因为它们不含有编码进行翻译后修饰的酶的基因。
531.根据条款530所述的方法,其中将病毒视为经历翻译后修饰或翻译后修饰的子集,所述翻译后修饰或翻译后修饰的子集是由于病毒劫持其宿主细胞的蛋白质翻译机制而在其宿主内的蛋白质经历的。
532.根据条款528至531所述的方法,其中为了预测氨基酸类型的未修饰的氨基酸的数目,或预测氨基酸类型的修饰的氨基酸的数目,然后通过将影响所述氨基酸类型的所有翻译后修饰进行求和并除以Swiss Prot数据库中所述氨基酸类型中氨基酸的总数来确定所述氨基酸类型的修饰频率,其中影响氨基酸类型的所述翻译后修饰在条款523中提供。
533.根据条款532所述的方法,其中提供了每种氨基酸类型的修饰因子,所述修饰因子可以根据有机体的种类而不同。
534.根据前述条款中任一项所述的方法,其中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度从指示与具有一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度和/或氨基酸数目的信息中鉴定。
535.根据条款534所述的方法,其中从数据库获得将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息。
536.根据条款535所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个蛋白质序列。
537.根据条款534、535或536所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括关于每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个蛋白质序列的翻译后修饰的信息。
538.根据条款534至537中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的标识符。
539.根据条款534至538中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的名称。
540.根据条款534至539中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的谱系。
541.根据条款534至540中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的分类群。
542.根据条款534至541中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括目的样本类型内每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的已知蛋白质浓度范围。
543.根据条款534至542中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括目的组织类型内每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的已知蛋白质浓度范围。
544.根据条款534至543中任一项所述的方法,其中从数据库获得的将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息包括目的样本类型内每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的已知蛋白质表达数据。
545.根据条款534至544中任一项所述的方法,其中将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或蛋白质浓度相关的信息是参考。
545a.根据条款545所述的方法,其中将两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目与每种目的蛋白质组或亚蛋白质组的身份和/或蛋白质浓度相关的信息作为单一参考提供。
546.根据条款1a至1h所述的方法,其中相同的两种或更多种氨基酸类型的所述已知标记值和/或氨基酸浓度与在一种或多种蛋白质浓度的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的所述样本中已标记的所述氨基酸类型相同,和/或由所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述氨基酸序列确定与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的所述样本中已标记的所述氨基酸类型相同的两种或更多种氨基酸类型的氨基酸数目。
547.根据条款546所述的方法,其中所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的所述氨基酸序列使用蛋白质测序来确定。
548.根据前述条款中任一项所述的方法,其中从数据库获得所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目。
549.前述条款中任一项的方法,其中所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目是参考。
550.根据前述条款中任一项所述的方法,其中每个参考提供了每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度作为取决于蛋白质浓度的共同参数的参数方程组或向量值函数,或其中每个参考提供了每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述氨基酸数目。
551.根据前述条款中任一项所述的方法,其中一种或多种蛋白质浓度的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度是所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述蛋白质浓度的函数。
552.根据条款551所述的方法,其中一种或多种蛋白质浓度的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度是所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述总摩尔蛋白质浓度的函数。
553.根据条款551所述的方法,其中一种或多种蛋白质浓度的一种或多种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度是所述目的亚蛋白质组或蛋白质组中的肽、寡肽、多肽、蛋白质或蛋白质复合物浓度的函数或所述总蛋白质浓度的函数。
554.根据条款551所述的方法,其中一种或多种蛋白质浓度的一种或多种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度是所述目的亚蛋白质组或蛋白质组中的总摩尔肽、寡肽、多肽、蛋白质或蛋白质复合物浓度的函数或所述总摩尔蛋白质浓度的函数。
555.根据条款551所述的方法,其中每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度作为取决于蛋白质浓度的共同参数的向量值函数提供。
556.根据条款551所述的方法,其中每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度作为取决于蛋白质浓度的共同参数的向量函数提供。
557.根据条款551所述的方法,其中每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度作为取决于所述目的亚蛋白质组或蛋白质组中总摩尔蛋白质、肽、寡肽、多肽、蛋白质复合物或总摩尔蛋白质浓度的所述共同参数的向量函数提供。
558.根据条款555至557所述的方法,其中提供每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述氨基酸浓度的所述向量的方向是每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种氨基酸类型的氨基酸数目或加权平均数。
559.根据条款558所述的方法,其中提供每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述氨基酸浓度的所述向量的所述方向是每种蛋白质、肽、寡肽、多肽、蛋白质复合物中每种氨基酸类型的氨基酸数目或加权平均数。
560.根据条款555至559所述的方法,其中如果所述样本中所有氨基酸类型的所述标记的值经背景校正,则所述向量在原点处开始,或如果所述样本中每种/任何氨基酸类型的所述标记的所述值未经背景校正,则所述向量在提供所述样本中标记和测量的n种氨基酸类型中的每一种的所述背景值的点(n-元组)处开始。
561.根据条款555至559所述的方法,其中所述向量由能够从已知或计算的蛋白质表达数据获得的蛋白质浓度的下限和上限界定。
562.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数是向量函数1并且采取以下形式:
根据其中p
563.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
根据其中p
564.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
其中p
565.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数是向量函数2并且采取以下形式:
根据其中p
566.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
其中p
567.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数是向量函数3并且采取以下形式:
其中p
568.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
其中p
569.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数是向量函数4并且采取以下形式:
其中p
570.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
/>
其中p
571.根据条款557所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
其中p
572.根据条款546所述的方法,其中使用参数方程组根据所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列计算一种或多种蛋白质浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度。
573.根据条款572所述的方法,其中所述参数方程组由能够从已知或计算的蛋白质表达数据获得的蛋白质浓度的下限和上限界定。
574.根据条款572或573中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的所述参数方程组是参数方程组1并且采取以下形式:
根据其中p
575.根据条款572或573中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的参数方程组采取以下形式:
其中p
576.根据条款572或573中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的所述参数方程组是参数方程组2并且采取以下形式:
根据其中p
577.根据条款572或573中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的参数方程组采取以下形式:
其中p
578.根据条款572或573中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的所述参数方程组是参数方程组3并且采取以下形式:
其中p
579.根据条款572或573中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的参数方程组采取以下形式:
其中p
580.根据条款550中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
其中p
581.根据条款550中任一项所述的方法,其中取决于蛋白质浓度的所述共同参数的所述向量函数采取以下形式:
其中p
582.根据条款572所述的方法,其中使用参数方程1或3或向量函数1或3的组根据所述一种或多种蛋白质、肽、寡肽、多肽或蛋白质复合物的所述氨基酸序列计算一种或多种蛋白质、肽、寡肽、多肽或蛋白质复合物中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度。
583.根据条款572所述的方法,其中使用参数方程2或4或向量函数2或4的组根据所述一种或多种目的蛋白质组或亚蛋白质组的所述氨基酸序列计算一种或多种目的蛋白质组或亚蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度。
584.根据条款549所述的方法,其中从数据库获得所述参考。
585.根据前述条款中任一项所述的方法,其中步骤e)包含当所述样本中每种标记的氨基酸类型的所述测量的标记、氨基酸浓度和/或氨基酸数目与所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中所述样本中已标记的相同的两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目的误差容限相同或者小于或等于所述误差容限时,鉴定所述样本中所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。
586.根据条款585所述的方法,其中所述误差容限包括用户特定的公差值,或是所述样本的所述标记的氨基酸类型的所述测量的标记、氨基酸浓度或数目与所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目之间的最小距离的顺序统计量,其中k阶统计量是第k个最小值。
587.根据条款585所述的方法,其中所述误差容限是所述样本的所述标记的氨基酸类型的所述测量的标记、氨基酸浓度或数目与所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目之间的距离阈值。
588.根据条款587所述的方法,其中所述样本的所述标记的氨基酸类型的所述测量的标记、氨基酸浓度或数目与每种目的蛋白质、肽、寡肽、多肽、蛋白质复合体、亚蛋白质组或蛋白质组中相同氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目之间的距离是欧几里德距离(Euclidian distance)测量值。
589.根据条款585所述的方法,其中所述误差容限是所述样本的所述标记的氨基酸类型的所述测量的标记、氨基酸浓度或数目与所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目之间的最小距离。
590.根据条款588所述的方法,其中使用方程17计算欧几里德距离测量值:
其中S
591.根据条款585所述的方法,其中所述误差容限包括用户特定的公差值乘以针对所述样本测量的两种或更多种氨基酸类型的所述标记值、氨基酸浓度或氨基酸数目。
592.根据条款585所述的方法,其中所述误差容限包括用户特定的公差值乘以针对所述样本所测量的两种或更多种氨基酸类型的所述标记值、氨基酸浓度或氨基酸数目的平方的总和的平方根。
593.根据条款585所述的方法,其中所述误差容限是由用户输入的公差值提供的,所述公差值乘以所述样本值的平方的平方根,反映所述距离计算。这由方程8提供:
其中ε是误差容限,
594.根据条款593所述的方法,其中所述用户指定的公差值
595.根据条款585所述的方法,其中如果怀疑所述样本含有k种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,则所述误差容限是对所有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组计算k
596.根据条款585所述的方法,其中如果怀疑所述样本含有k种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,则将所述距离分类,并且所述误差容限为k最小距离。
597.根据前述条款中任一项所述的方法,其中步骤e)包含将所述样本中每种标记的氨基酸类型的所述测量的标记与一种或多种蛋白质浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述已知标记值进行比较,其中在一种或多种蛋白质浓度下所述一种或多种目的蛋白质、肽、寡肽,多肽,蛋白质复合物、亚蛋白质组或蛋白质组的所述两种或更多种氨基酸类型的所述已知标记值是根据使用向量函数或参数方程组的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述一个或多个氨基酸序列和/或关于翻译后修饰的实验信息计算的。
598.根据前述条款中任一项所述的方法,其中步骤e)包含将所述样本中每种标记的氨基酸类型的所述氨基酸浓度与一种或多种蛋白质浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述氨基酸浓度进行比较,其中在一种或多种蛋白质浓度下所述一种或多种目的蛋白质、肽、寡肽,多肽,蛋白质复合物、亚蛋白质组或蛋白质组的所述两种或更多种氨基酸类型的所述氨基酸浓度是根据使用向量函数或参数方程组的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述一个或多个氨基酸序列和/或关于翻译后修饰的实验信息计算的。
599.前述条款中任一项的方法,其中步骤e)包含将所述样本中每种标记的氨基酸类型的所述氨基酸数目与所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的两种或更多种氨基酸类型的所述氨基酸数目进行比较,其中所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述两种或更多种氨基酸类型的所述氨基酸数目是根据所述一个或多个目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述一个或多个氨基酸序列和/或关于翻译后修饰的实验信息计算的。
600.根据前述条款中任一项所述的方法,其中步骤e)包含使用n维空间将所述样本中每种标记的氨基酸类型的所述测量的标记、氨基酸浓度或氨基酸数目与一种或多种蛋白质浓度的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度,或所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的氨基酸数目进行比较。
601.根据前述条款中任一项所述的方法,其中步骤e)包含使用n维空间的将所述样本中每种标记的氨基酸类型的所述测量的标记、氨基酸浓度和/或氨基酸数目与作为蛋白质浓度的函数的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度,或所述一种或多种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或目的蛋白质组中相同的两种或更多种氨基酸类型的氨基酸数目进行比较,其中作为蛋白质浓度的函数的所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度提供n维空间中的线或曲线,其能够任选地由生物样本中的已知蛋白质表达水平界定,并且所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述氨基酸数目提供n维空间中的点。
602.根据条款601所述的方法,其中在所述样本中标记2个氨基酸,并且所述n维空间是2维空间。
603.根据条款601所述的方法,其中在所述样本中标记3个氨基酸,并且所述n维空间是3维空间。
604.根据条款601所述的方法,其中在所述样本中标记4个氨基酸,并且所述n维空间是4维空间。
605.根据条款601所述的方法,其中在所述样本中标记5个氨基酸,并且所述n维空间是5维空间。
606.根据条款601所述的方法,其中在所述样本中标记6个氨基酸,并且所述n维空间是6维空间。
607.根据条款601所述的方法,其中在所述样本中标记7个氨基酸,并且所述n维空间是7维空间。
608.根据条款601所述的方法,其中在所述样本中标记8个氨基酸,并且所述n维空间是8维空间。
609.根据条款601所述的方法,其中在所述样本中标记9个氨基酸,并且所述n维空间是9维空间。
610.根据条款601所述的方法,其中在所述样本中标记10个氨基酸,并且所述n维空间是10维空间。
611.根据条款601所述的方法,其中在所述样本中标记11个氨基酸,并且所述n维空间是11维空间。
612.根据条款601所述的方法,其中在所述样本中标记12个氨基酸,并且所述n维空间是12维空间。
613.根据条款601所述的方法,其中在所述样本中标记13个氨基酸,并且所述n维空间是13维空间。
614.根据条款601所述的方法,其中在所述样本中标记14个氨基酸,并且所述n维空间是14维空间。
615.根据条款601所述的方法,其中在所述样本中标记15个氨基酸,并且所述n维空间是15维空间。
616.根据条款601所述的方法,其中在所述样本中标记16个氨基酸,并且所述n维空间是16维空间。
617.根据条款601所述的方法,其中在所述样本中标记17个氨基酸,并且所述n维空间是17维空间。
618.根据条款601所述的方法,其中在所述样本中标记18个氨基酸,并且所述n维空间是18维空间。
619.根据条款601所述的方法,其中在所述样本中标记19个氨基酸,并且所述n维空间是19维空间。
620.根据条款601所述的方法,其中在所述样本中标记20个氨基酸,并且所述n维空间是20维空间。
621.根据条款601所述的方法,其中在所述样本中标记21个氨基酸,并且所述n维空间是21维空间。
622.根据条款601所述的方法,其中在所述样本中标记22个氨基酸,并且所述n维空间是22维空间。
623.根据条款601所述的方法,其中在所述样本中标记23个氨基酸,并且所述n维空间是23维空间。
624.根据条款601所述的方法,其中在所述样本中标记24个氨基酸,并且所述n维空间是24维空间。
625.根据条款601所述的方法,其中在所述样本中标记25个氨基酸,并且所述n维空间是25维空间。
626.根据条款601所述的方法,其中在所述样本中标记26个氨基酸,并且所述n维空间是26维空间。
627.根据条款601所述的方法,其中在所述样本中标记27个氨基酸,并且所述n维空间是27维空间。
628.根据条款601所述的方法,其中在所述样本中标记28个氨基酸,并且所述n维空间是28维空间。
629.根据条款601所述的方法,其中在所述样本中标记29个氨基酸,并且所述n维空间是29维空间。
630.根据条款601所述的方法,其中在所述样本中标记30个氨基酸,并且所述n维空间是30维空间。
631.根据条款601所述的方法,其中在所述样本中标记31个氨基酸,并且所述n维空间是31维空间。
632.根据条款601所述的方法,其中在所述样本中标记32个氨基酸,并且所述n维空间是32维空间。
633.根据条款601所述的方法,其中在所述样本中标记33个氨基酸,并且所述n维空间是33维空间。
634.根据条款601所述的方法,其中在所述样本中标记34个氨基酸,并且所述n维空间是34维空间。
635.根据条款601所述的方法,其中在所述样本中标记35个氨基酸,并且所述n维空间是35维空间。
636.根据条款601所述的方法,其中在所述样本中标记36个氨基酸,并且所述n维空间是36维空间。
637.根据条款601所述的方法,其中在所述样本中标记37个氨基酸,并且所述n维空间是37维空间。
638.根据条款601所述的方法,其中在所述样本中标记38个氨基酸,并且所述n维空间是38维空间。
639.根据条款601所述的方法,其中在所述样本中标记39个氨基酸,并且所述n维空间是39维空间。
640.根据条款601所述的方法,其中在所述样本中标记40个氨基酸,并且所述n维空间是40维空间。
641.根据条款585所述的方法,其中如果存在单个蛋白质浓度的值,则在所述样本中鉴定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,对于所述单个蛋白质浓度的值,在所述样本中测量的两种或更多种氨基酸类型的所述标记或氨基酸浓度的值等于或者小于或等于由一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考函数提供的两种或更多种氨基酸类型的所述标记的已知值或氨基酸浓度的误差容限。
642.根据条款585所述的方法,其中在所述样本中鉴定的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的蛋白质浓度是在所述样本中测量的两种或更多种氨基酸类型的所述标记或氨基酸浓度的值等于或者小于或等于由所述样本中鉴定的所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述参考函数提供的两种或更多种氨基酸类型的所述标记的已知值或氨基酸浓度的误差容限的所述蛋白质浓度。
643.根据条款642所述的方法,其中在所述样本中鉴定的所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的蛋白质量是在所述样本中鉴定的所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述蛋白质浓度乘以所述样本的体积。
644.根据前述条款中任一项所述的方法,其中如果存在单个蛋白质浓度的值,则在所述样本中鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在,其中对于所述单个蛋白质浓度的值,对所述样本测量的两种或更多种氨基酸类型的所述氨基酸浓度等于通过其参考向量函数或参数方程组为所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组提供的相同的两种或更多种对应氨基酸类型的氨基酸浓度。
645.根据条款228所述的方法,其中如果存在蛋白质浓度t的单一解,则所述样本点在参考线上,并且t的所述解是样本中鉴定的所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的蛋白质浓度。
646.根据条款585所述的方法,其中如果存在单一的蛋白质浓度值,则在所述样本中鉴定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,对于所述单一的蛋白质浓度值,在所述样本中测量的两种或更多种氨基酸类型的所述标记或氨基酸浓度的值小于或等于由一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考函数提供的两种或更多种氨基酸类型的所述标记的已知值或氨基酸浓度的误差容限。
647.根据条款234所述的方法,其中计算在所述样本中测量的两种或更多种氨基酸类型的所述标记或氨基酸浓度的值与由一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述参考函数提供的两种或更多种氨基酸类型的所述标记的已知值或氨基酸浓度之间的距离。
648.根据条款647所述的方法,其中通过在所述参考线上找到点来计算在所述样本中测量的两种或更多种氨基酸类型的所述标记或氨基酸浓度的值与由一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的所述参考函数提供的两种或更多种氨基酸类型的所述标记的已知值或氨基酸浓度之间的最小距离,对于所述点,样本点与参考线之间的距离是垂直的。
649.根据条款648所述的方法,其中通过提供所述样本点与所述参考线之间的向量的通用向量方程,获取所述向量与所述参考线的方向向量的点积,将所述点积设置为等于0,并且求解蛋白质浓度t,这是产生与所述样本点的距离垂直的点的参考线的蛋白质浓度,以求所述参考线上的所述样本点与所述参考线之间的距离垂直的点。
650.根据条款649所述的方法,其中计算在所述参考线上所述蛋白质浓度下每种氨基酸类型的所述氨基酸浓度或所述标记的值,并且计算所述点与所述样本点之间的距离并且与所述误差容限进行比较。
651.根据条款650所述的方法,其中如果所述距离小于或等于所述误差容限,则所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组以所述距离垂直的所述蛋白质浓度包含在所述样本中。
652.根据条款647所述的方法,其中如果在所述样本中鉴定了多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,则在所述样本中鉴定了目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物,并且所述混合物内的每种组分的相对组成与针对所述样本测量的值与针对所述混合物的每种鉴定的组分提供的值之间的距离成反比。
653.根据条款652所述的方法,其中所述混合物内的每种组分的所述相对组成通过将所述样本与每种组分之间的距离与所述样本与任何组分之间的最大距离逆归一化来确定。
654.根据条款653所述的方法,其中将每个组分的逆归一化距离除以所有组分的所述逆归一化距离的总和以提供所述混合物内每种组分的所述相对组成。
655.根据条款652所述的方法,其中将所述混合物内每种组分的所述相对组成乘以鉴定每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组时的蛋白质浓度,以提供所述混合物内每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度。
656.根据前述条款中任一项所述的方法,其中目的亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目是基于基于所述目的蛋白质组或亚蛋白质组内含有的所有氨基酸序列的每种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目的加权平均值。
657.根据前述条款中任一项所述的方法,其中目的亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述氨基酸数目是所述目的蛋白质组或亚蛋白质组内含有的所有氨基酸序列中每种氨基酸类型的所述氨基酸数目的加权平均值。
658.根据条款656所述的方法,其中使用所述目的蛋白质组或亚蛋白质组内含有的所有氨基酸序列的每种氨基酸类型的氨基酸的加权平均数计算目的亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值或氨基酸浓度。
659.根据前述条款中任一项所述的方法,其中步骤e)包含从所述样本中去除任何目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,其中每种氨基酸类型的所述测量的标记、氨基酸浓度或数目是指目的复制的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组。
660.根据前述条款中任一项所述的方法,其中步骤e)包含当所述样本中每种标记的氨基酸类型的所述测量的标记、氨基酸浓度或氨基酸数目与所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目的误差容限相同或者小于或等于所述误差容限时,并且当所鉴定的浓度在基于目的样本类型中所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的已知浓度水平的蛋白质浓度界限(c
661.根据条款233至238所述的方法,其中当经由所述样本点与所述向量上对应于目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的任何点之间的向量与对应于所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的所述向量的方向之间的点积,求所述样本点与所述向量上对应于目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的任何点之间的最小距离时,仅考虑对应于所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的所述向量的方向。
662.根据条款564、566、568所述的方法,其中当计算所述点积时,对应于所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的所述向量被视为无界限,或仅在所述原点处有界限。
663.根据条款1a至1h所述的方法,其中在所述样本中三种氨基酸类型被标记,并且将所述样本中三种标记的氨基酸类型中的每一种的所述测量的标记、氨基酸浓度或氨基酸数目与不超过200个目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相同的三种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目进行比较。
664.根据条款1a至1h中任一项所述的方法,其中在所述样本中三种氨基酸类型被标记,并且将所述样本中所述三种标记的氨基酸类型中的每一种的所述测量的标记、氨基酸浓度或氨基酸数目与不超过9000个目的蛋白质组或亚蛋白质组的相同的三种氨基酸类型的所述已知标记值、氨基酸浓度或氨基酸数目进行比较。
665.根据前述条款中任一项所述的方法,其中所述目的蛋白质组或亚蛋白质组具有少于4000个蛋白质。
666.根据前述条款中任一项所述的方法,其中不对所述样本进行测序以经由所述样本中所述氨基酸的顺序鉴定所述目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组。
667.根据前述条款中任一项所述的方法,其中所述样本不需要分离成单个蛋白质组分以鉴定所述样本中目的蛋白质组、亚蛋白质组或蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的存在和/或浓度和/或量。
668.根据条款1至350中任一项所述的方法,步骤a)包含在标记之前从所述样本中分离所述蛋白质组分。
669.根据条款668所述的方法,其中使用离心、过滤、电泳或色谱法分离所述蛋白质组分。
670.根据条款669所述的方法,其中色谱法分离涉及HPLC。
671.根据前述条款中任一项所述的方法,其中所述方法在本体中进行。
672.根据前述条款中任一项所述的方法,其中步骤d)和e)在分类器中进行。
673.根据条款472或475中任一项所述的方法,其中在所述样本中标记的氨基酸类型的氨基酸比例与在用于产生校准曲线的任何/所有蛋白质和/或氨基酸中标记的所述氨基酸比例相同。
674.根据条款472或476中任一项所述的方法,其中在所述样本中标记的氨基酸类型的氨基酸比例与用作标准的任何蛋白质中标记的所述氨基酸比例相同。
675.根据条款472或476中任一项所述的方法,其中在所述样本中标记的氨基酸类型的氨基酸比例与用作标准的任何氨基酸中标记的所述氨基酸比例相同。
676.根据条款472和475中任一项所述的方法,其中在所述样本中标记的氨基酸类型的+/-5%的氨基酸比例与在用于产生校准曲线的任何/所有蛋白质和/或氨基酸中标记的所述氨基酸比例相同。
677.根据条款472和476中任一项所述的方法,其中在所述样本中标记的氨基酸类型的+/-5%的氨基酸比例与用作标准的任何蛋白质中标记的所述氨基酸比例相同。
678.根据条款472和476中任一项所述的方法,其中在所述样本中标记的氨基酸类型的+/-5%的氨基酸比例与用作标准的任何氨基酸中标记的所述氨基酸比例相同。
679.根据条款472和475中任一项所述的方法,其中在所述样本中标记的氨基酸类型的+/-10%的氨基酸比例与在用于产生校准曲线的任何/所有蛋白质和/或氨基酸中标记的所述氨基酸比例相同。
680.根据条款472和476中任一项所述的方法,其中在所述样本中标记的氨基酸类型的+/-10%的氨基酸比例与用作标准的任何蛋白质中标记的所述氨基酸比例相同。
681.根据条款472和476中任一项所述的方法,其中在所述样本中标记的氨基酸类型的+/-10%的氨基酸比例与用作标准的任何氨基酸中标记的所述氨基酸比例相同。
682.根据条款225或545所述的方法,其中将所述样本中两种或更多种氨基酸类型的所述氨基酸浓度与所述一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述氨基酸浓度进行比较,其中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的所述氨基酸浓度是实验参考。
683.根据条款682所述的方法,其中在所述样本中标记的氨基酸类型的氨基酸比例与在用于产生校准曲线和任何实验参考的任何/所有蛋白质和/或氨基酸中标记的所述氨基酸比例相同。
684.根据条款682所述的方法,其中在所述样本中标记的氨基酸类型的氨基酸比例与在用作标准和任何实验参考的任何蛋白质中标记的所述氨基酸比例相同。
685.根据条款682所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的氨基酸比例与在用作标准的任何氨基酸中标记的所述氨基酸比例相同。
686.根据条款682所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的+/-5%的氨基酸比例与在用于产生校准曲线的任何/所有蛋白质和/或氨基酸中标记的所述氨基酸比例相同。
687.根据条款682中任一项所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的+/-5%的氨基酸比例与用作标准的任何蛋白质中标记的所述氨基酸比例相同。
688.根据条款682所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的+/-5%的氨基酸比例与在用作标准的任何氨基酸中标记的所述氨基酸比例相同。
689.根据条款682所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的+/-10%的氨基酸比例与在用于产生校准曲线的任何/所有蛋白质和/或氨基酸中标记的所述氨基酸比例相同。
690.根据条款682所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的+/10%的氨基酸比例与在用作标准的任何蛋白质中标记的所述氨基酸比例相同。
691.根据条款682所述的方法,其中在所述样本和任何实验参考中标记的氨基酸类型的+/-10%的氨基酸比例与在用作标准的任何氨基酸中标记的所述氨基酸比例相同。
692.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例。
693.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例为+/-5%。
694.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例为+/-5%。
695.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例为+/-5%。
696.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例为+/-10%。
697.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例为+/-10%。
698.根据条款682所述的方法,其中在所述样本和任何实验参考中标记氨基酸类型的相同的氨基酸比例为+/-10%。
699.根据条款1c所述的方法,其中所述细菌蛋白质组是沙n氏菌和/或大肠杆菌。
700.根据条款1d所述的方法,其中所述目的病毒蛋白质组是SARS-CoV-2蛋白质组。
701.根据条款1d所述的方法,其中所述目的病毒蛋白质组是动物源性病毒蛋白质组。
702.根据条款1d所述的方法,其中所述目的病毒蛋白质组是HIV蛋白质组。
703.根据条款1f所述的方法,其中所述目的人蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组用于癌症的早期检测。
704.根据条款1g所述的方法,其中所述感染是动物源性感染。
附图说明
下面将参考附图描述本发明的实施例,其中:
图1示出了绘示针对目的蛋白质-A、目的蛋白质-B、目的蛋白质-C和目的蛋白质-D计算的独特特征如何作为每种目的蛋白质的蛋白质浓度的函数而变化的示意图。为每种目的蛋白质提供参考向量,并且参考向量上的每个点对应于目的蛋白质的独特蛋白质浓度(例如1μM,实心圆)。计算从样本点(空心正方形)到每个参考线的最短距离,鉴定样本中目的蛋白质-B的存在;样本中目的蛋白质-B的浓度是提供最短距离(例如0.5μM)的目的蛋白质-B的蛋白质浓度。
图2示出了n维空间中的参考线。参数方程组1提供下列BSA、LYZ和TTR的参考线。样本点用空心圆示出。本发明的方法包括基于样本点与每条参考线之间距离的比较,确定样本中目的蛋白质/蛋白质复合物的存在和/或浓度和/或量。
图3示出了致病性蛋白质组的独特特征。(a)分析的所有7581种细菌参考蛋白质组具有细菌参考蛋白质组中所有蛋白质的已知标记值、氨基酸浓度或氨基酸平均数的独特特征。(b)示出每个平均蛋白质序列内两种或更多种氨基酸类型的氨基酸数目的平均数的广泛分布的缩放图像。(c)所分析的所有9377种病毒参考蛋白质组具有病毒参考蛋白质组中所有蛋白质的已知标记值、氨基酸浓度或氨基酸平均数的独特特征。(d)所分析的所有16958种细菌和病毒参考蛋白质组具有细菌或病毒参考蛋白质组中所有蛋白质的已知标记值、氨基酸浓度或氨基酸平均数的独特特征。这使得能够在不分离的情况下鉴定样本中的完整蛋白质组。
图4示出了根据本福特定律(Benford′s law)对数集中前导数位的概率分布的分析,其示出了人血浆蛋白质组中的氨基酸类型遵循预期分布。
图5示出了根据本福特定律对数集中前导数位的概率分布的分析,其示出了病毒蛋白质组中蛋白质、肽、寡肽、多肽和蛋白质亚基的氨基酸平均数偏离预期分布,表明该数据集中相对于人蛋白质组的变异性增加。
图6示出了根据本福特定律对数集中前导数位的概率分布的分析,其示出了细菌蛋白质组中蛋白质、肽、寡肽、多肽和蛋白质亚基的氨基酸平均数偏离预期分布,表明该数据集中相对于人蛋白质组的变异性增加。
图7示出了与仅鉴定蛋白质序列内的氨基酸数目相比,鉴定人蛋白质组中蛋白质序列内的氨基酸顺序是无效的。鉴定蛋白质序列内两种类型氨基酸的顺序不增加鉴定蛋白质序列内一种类型氨基酸的顺序的附加信息。
图8示出了将参考线约束在人血浆蛋白质组内已知蛋白质浓度范围的效果展示。(a)人血浆蛋白质组内所有3263种蛋白质、肽、寡肽、多肽和蛋白质复合物的参考线。(b)人血浆蛋白质组内所有3263种蛋白质、肽、寡肽、多肽和蛋白质复合物的有界参考线,其中参考线以人血浆蛋白质组内这些蛋白质、肽、寡肽、多肽和蛋白质复合物的已知浓度范围为界限。
图9示出了参考事件,其涉及与已知的蛋白质浓度界限相比,可经由本发明的方法获得的有和没有蛋白质浓度信息的氨基酸类型的各种组合(C和W、K和W、K和Y、K和S、K和P、L和S、L和K、E和L、G和L、C K和W、C K和Y、L K和S、E G和K、E G和S、R E P和T,和Q L K和V)的人血浆蛋白质组中定量的多于一种目的蛋白质。
图10示出了当标记和比较两种氨基酸类型时,在不对蛋白质浓度或其它分类施加任何界限或约束的情况下,所有参考是可区分的,并且独特地映射到所考虑的大多数临床相关蛋白质组和亚蛋白质组(SARS-CoV-2、HIV、爱泼斯坦-巴尔、神经胶质瘤)内的目的蛋白质,并且不对应于临床相关蛋白质组和亚蛋白质组内的多种目的蛋白质。
图11示出了将两种氨基酸类型的所有组合提供的信息内容与(a)人血浆蛋白质组和(b)人唾液蛋白质组内蛋白质序列的参考的独特性进行比较。
图12示出了所有参考细菌蛋白质组(7581种参考蛋白质组)在其蛋白质组中蛋白质的两种氨基酸类型内具有氨基酸的平均数,这与所有其它蛋白质组中蛋白质的两种氨基酸类型内的所有其它氨基酸的平均数不同。
图13示出了为了仅标记目的蛋白质组内两种氨基酸类型,细菌和病毒蛋白质组根据它们的谱系聚集在一起。这里提供了K和W氨基酸类型的标记,示出了在以下顺序中的聚类:棒状杆菌科(Corynebacteriaceae)、军团菌目(Legionellales)、芽孢杆菌目(Bacillales)、链霉菌科(Streptomycetaceae)和支原体科(Mycoplasmataceae)。
图14描述了对未知蛋白质混合物的处理。混合物的身份是未知的,并且混合物的蛋白质浓度是未知的。
图15示出了不能仅基于蛋白质序列预测流体动力学半径,因为现有技术的缩放方法仍然需要知道蛋白质是折叠还是未折叠的,并且没有考虑部分内在无序。
图16示出了(a)色氨酸(W)、(b)酪氨酸(Y)、(c)还原的半胱氨酸(C
图17示出了患者样本与(a)C和K、(b)C和W,和(C)K和W SARS-CoV-2和A型流感参考线的比较。
图18示出了从以任意单位(AU)计的K氨基酸类型K F.I.的背景校正的荧光强度转换为以μM计的K氨基酸类型[K]的氨基酸浓度的校准曲线。非线性回归揭示了对于R
图19示出了从以任意单位(AU)计的C氨基酸类型C F.I.的背景校正的荧光强度转换为以μM计的C氨基酸类型[C]的氨基酸浓度的校准曲线。非线性回归揭示了对于R
图20示出了从以任意单位(AU)计的W氨基酸类型W F.I.的背景校正的荧光强度转换为以μM计的W氨基酸类型[W]的氨基酸浓度的校准曲线。非线性回归揭示了对于R
图21示出了当在N维空间(4维空间)中绘制每个用实验方法测量的患者PPP样本的三个技术复制品上的平均测量的氨基酸浓度时,数据在N维空间中呈现的线如本发明的概念所预测的。通过绘制穿过数据集的线来绘示概念线。为了计算定义目的PPP蛋白质组的参考线的实际位置和方程,定义目的PPP蛋白质组的向量函数的K、C、W和Y分量在下面的图中用实验方法计算。
图22示出了实验参考线的K分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型K的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图23示出了实验参考线的C分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型C的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图24示出了实验参考线的W分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型W的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图25示出了实验参考线的Y分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型Y的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图26示出了实验参考线的K分量的系数(方向)是如何针对目的PPP_50和PRP_50亚蛋白质组计算的。将测量的氨基酸类型K的以μM计的氨基酸摩尔浓度相对于测量的每种目的亚蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图27示出了实验参考线的C分量的系数(方向)是如何针对目的PPP_50和PRP_50亚蛋白质组计算的。将测量的氨基酸类型C的以μM计的氨基酸摩尔浓度相对于测量的每种目的亚蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图28示出了实验参考线的W分量的系数(方向)是如何针对目的PPP_50和PRP_50亚蛋白质组计算的。将测量的氨基酸类型W的以μM计的氨基酸摩尔浓度相对于测量的每种目的亚蛋白质组的以μg/mL计的总蛋白质浓度绘制,并且进行线性回归。约束线性回归穿过原点。在后续8个图中,解释了实验参考线的分量的系数(方向)是如何基于共同的摩尔参数,而不是质量、蛋白质浓度。
图29示出了实验参考线的K分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型K的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图30示出了实验参考线的C分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型C的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图31示出了实验参考线的W分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型W的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图32示出了实验参考线的Y分量的系数(方向)是如何针对目的PPP和PRP蛋白质组计算的。将测量的氨基酸类型Y的以μM计的氨基酸摩尔浓度相对于测量的每种目的蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图33示出了实验参考线的K分量的系数(方向)是如何针对目的PPP_50和PRP_50亚蛋白质组计算的。将测量的氨基酸类型K的以μM计的氨基酸摩尔浓度相对于测量的每种目的亚蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图34示出了实验参考线的C分量的系数(方向)是如何针对目的PPP_50和PRP_50亚蛋白质组计算的。将测量的氨基酸类型C的以μM计的氨基酸摩尔浓度相对于测量的每种目的亚蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图35示出了实验参考线的W分量的系数(方向)是如何针对目的PPP_50和PRP_50亚蛋白质组计算的。将测量的氨基酸类型W的以μM计的氨基酸摩尔浓度相对于测量的每种目的亚蛋白质组的以μM计的总蛋白质摩尔浓度绘制,并且进行线性回归。约束线性回归穿过原点。
图36示出了在每个患者样本的三个技术复制品(星形)和理论参考线(实线)上测量的平均氨基酸浓度。用实验方法测量的数据集与预测的参考线之间密切一致绘示了本文所公开的方法的稳健性,其中任何目的蛋白质组或亚蛋白质组可以通过单一参考用代数方法描述,该参考是总蛋白质浓度的共同参数的向量函数。
图37示出了目的PPP和PRP蛋白质组的氨基酸类型K的以μM计的氨基酸浓度对氨基酸类型C的以μM计的氨基酸浓度。将该数据集分割成训练集和检验集,训练集用于训练分类器以基于其测量的K和C氨基酸类型的浓度来鉴定患者样本的目的蛋白质组。
图38示出了图37中解释的经训练的分类器的预测。没有示出不正确的预测,因为其100%的预测是正确的。
图39示出了仅使用根据两种标记的氨基酸类型:K和C的标记的测量值计算的氨基酸浓度的PPP对PRP蛋白质组鉴定的K-最近邻(K-Nearest Neighbor,KNN)分类器的100%准确度百分比(使用精细(Fine)KNN的真实对预测分类)。
图40示出了高分类灵敏度和特异性对所使用的分类器类型是稳健的。例如,示出了只使用两种氨基酸类型K和C的PPP对PRP蛋白质组鉴定的100%准确度百分比(使用袋装决策树分类器的真实对预测分类)。附加地,基于根据两种标记的氨基酸类型:K和C的标记的测量值计算的氨基酸浓度,不需要优化或超参数调整来实现分类器性能的该水平(100%准确度)。
图41示出了只使用两种氨基酸类型K和C的PPP对PRP蛋白质组鉴定的100%阳性预测值(使用袋装决策树分类器的真实对预测分类)。
图42示出了作为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP和PRP蛋白质组的实验参考线的K系数。患者性别或年龄对为每个患者计算的实验蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定蛋白质组学特征。
图43示出了作为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP和PRP蛋白质组的实验参考线的C系数。患者性别或年龄对为每个患者计算的实验蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定蛋白质组学特征。
图44示出了作为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP和PRP蛋白质组的实验参考线的W系数。患者性别或年龄对为每个患者计算的实验蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定蛋白质组学特征。
图45示出了作为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP和PRP蛋白质组的实验参考线的Y系数。患者性别或年龄对为每个患者计算的实验蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定蛋白质组学特征。
图46示出了作为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP_50和PRP_50亚蛋白质组的实验参考线的K系数。患者性别或年龄对为每个患者计算的实验亚蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的亚蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定亚蛋白质组学特征。
图47示出了作为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP_50和PRP_50亚蛋白质组的实验参考线的C系数。患者性别或年龄对为每个患者计算的实验亚蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的亚蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定亚蛋白质组学特征。
图48示出了为患者年龄的函数绘制的每个个体男性和女性患者的目的PPP_50和PRP_50亚蛋白质组的实验参考线的W系数。患者性别或年龄对为每个患者计算的实验亚蛋白质组参考线的系数没有影响。这证实了使用本发明的方法测量的亚蛋白质组学特征描述了任何患者群体并且特别不受性别或年龄的影响。该结果证实了本发明的方法对个体患者变异是稳健的,并且健康患者展示了单一的鉴定亚蛋白质组学特征。
图49示出了根据健康患者质谱数据计算的w
图50示出了卵巢癌血浆样本、胰腺癌血浆样本、结肠直肠癌血浆样本和健康患者血浆(PPP)样本的氨基酸类型C、W、Y和K的以μM计的氨基酸浓度,其绘制在N维空间中,并且观察到这些数据集中的每一个采取如本文所讲解的参考线(其为总蛋白质浓度的共同参数的函数)的形式。
图51示出了对于卵巢癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型K的以μM计的氨基酸浓度和卵巢癌参考线的K系数(方向)的计算。
图52示出了对于卵巢癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型C的以μM计的氨基酸浓度和卵巢癌参考线的C系数(方向)的计算。
图53示出了对于卵巢癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型W的以μM计的氨基酸浓度和卵巢癌参考线的W系数(方向)的计算。
图54示出了对于卵巢癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型Y的以μM计的氨基酸浓度和卵巢癌参考线的Y系数(方向)的计算。
图55示出了对于胰腺癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型K的以μM计的氨基酸浓度和胰腺癌参考线的K系数(方向)的计算。
图56示出了对于胰腺癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型C的以μM计的氨基酸浓度和胰腺癌参考线的C系数(方向)的计算。
图57示出了对于胰腺癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型W的以μM计的氨基酸浓度和胰腺癌参考线的W系数(方向)的计算。
图58示出了对于胰腺癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型Y的以μM计的氨基酸浓度和胰腺癌参考线的Y系数(方向)的计算。
图59示出了对于结肠直肠癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型K的以μM计的氨基酸浓度和结肠直肠癌参考线的K系数(方向)的计算。
图60示出了对于结肠直肠癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型C的以μM计的氨基酸浓度和结肠直肠癌参考线的C系数(方向)的计算。
图61示出了对于结肠直肠癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型W的以μM计的氨基酸浓度和结肠直肠癌参考线的W系数(方向)的计算。
图62示出了对于结肠直肠癌血浆蛋白质组,作为以μM计的总摩尔蛋白质浓度的函数绘制的氨基酸类型Y的以μM计的氨基酸浓度和结肠直肠癌参考线的Y系数(方向)的计算。
图63示出了当进行本文所描述的向量函数方法作为确定患者样本中目的蛋白质组或亚蛋白质组的存在和/或浓度和/或量的一种可能方式时,获得非常高的敏感性和特异性以确定患者血浆中结肠直肠癌、卵巢癌和胰腺癌的存在与否。具体地,如在所提供的混淆矩阵中所概述的,对于从血浆中鉴定结肠直肠癌和胰腺癌实现了100%准确度,对于从血浆中鉴定卵巢癌实现了90%准确度,并且对于将癌症阴性的健康样本正确鉴定为癌症阴性的健康样本实现了95%的特异性。
图64示出了作为在本文中描述的(定量)向量函数方法的一部分确定的目的蛋白质组的浓度和/或量是高度准确的,对于所有目的蛋白质组,遵循线y=x,并且允许以非常低的误差(仅2%的误差)确定患者样本内的目的蛋白质组的浓度和/或量。
图65示出了还可以使用机器学习分类器在血浆中鉴定目的蛋白质组。对患者血浆样本的K、C、W和Y氨基酸类型的摩尔(μM)氨基酸浓度进行线性支持向量机(SVM)分类器训练,其中保留25%的数据。对于每种目的癌症蛋白质组(所有癌症患者样本)以及健康目的蛋白质组(所有健康患者样本)获得100%阳性预测值和0%错误发现率。
图66示出了也可以使用仅对三种标记的氨基酸类型的氨基酸浓度训练的机器学习分类器在血浆中鉴定目的蛋白质组。对患者血浆样本的K、C和W氨基酸类型的摩尔(μM)氨基酸浓度进行线性支持向量机(SVM)分类器训练,其中保留25%的数据。对于每种目的癌症蛋白质组(所有癌症患者样本)以及健康目的蛋白质组(所有健康患者样本)获得100%阳性预测值和0%错误发现率。
图67示出了也可以使用仅对两种标记的氨基酸类型的氨基酸浓度训练的机器学习分类器在血浆中鉴定目的蛋白质组。仅对患者血浆样本的K和C氨基酸类型的摩尔(μM)氨基酸浓度进行线性支持向量机(SVM)分类器训练,其中保留25%的数据。对于每种目的癌症蛋白质组(所有癌症患者样本)以及健康目的蛋白质组(所有健康患者样本)获得100%阳性预测值和0%错误发现率。
图68示出了混淆矩阵,其指示基于K、C、W和Y氨基酸类型的量使用本发明的方法检测阶段III结肠直肠癌的78%准确度。
图69使出了混淆矩阵,其指示基于K、C、W和Y氨基酸类型的量使用本发明的方法检测结肠直肠癌位置的100%阳性预测值。
图70示出了在尿中测量的膀胱癌样本、前列腺癌样本和肾癌样本中K、C、W和Y氨基酸类型的以μM计的氨基酸的摩尔浓度。
图71示出了阳性预测值错误发现混淆矩阵,其指示使用本发明的方法从尿样本中鉴定膀胱癌、前列腺癌和肾癌的100%阳性预测鉴定和0%错误发现。所有包括的癌症类型(膀胱癌、前列腺癌和肾癌)可以从尿样本中正确鉴定,其中真阳性率为100%,并且假阴性率为0%。
具体实施方式
在前述说明书,或下面的权利要求,或附图中公开的,以它们的特定形式或按照用于执行所公开的函数的手段,或用于获得所公开的结果的方法或过程来表达的特征,在适当时,可以单独地或以此类特征的任何组合,用于以其不同的形式实现本发明。
本发明基于以下发现:仅需要测量样本中两种或更多种氨基酸类型的标记和/或氨基酸浓度或氨基酸数目,以鉴定样本内一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。仅需要标记和测量样本内的两种或更多种氨基酸类型,以鉴定和定量蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,而不需要对样本进行测序。这是因为每种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组具有基于蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目的独特特征。基于蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型的测量的标记和氨基酸浓度特征是独特的。不必鉴定样本中氨基酸的顺序,例如,通过对样本进行测序来鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组。当在样本中标记和测量两种或更多种氨基酸类型时,鉴定样本中蛋白质序列内的氨基酸顺序不增加额外的信息(图7)。
本文所描述的本发明的方法可以用于鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。这是因为每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组具有基于每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型的已知标记值、氨基酸浓度或氨基酸数目的独特特征。因此,可以将样本的特征与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的特征进行比较,以鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。例如,与每种氨基酸类型的已知标记值和/或氨基酸浓度和/或氨基酸数目和A型流感蛋白质组的浓度相比,SARS-CoV-2蛋白质组具有基于每种氨基酸类型的已知标记值和/或氨基酸浓度和/或氨基酸数目和SARS-CoV-2蛋白质组的浓度的独特特征。因此,可以确定样本中两种或更多种氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目,并且与SARS-CoV-2蛋白质组和/或HIV蛋白质组中相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度或氨基酸数目进行比较,以鉴定样本中SARS-CoV-2蛋白质组和/或HIV蛋白质组的存在和/或浓度和/或量。
先前,没有可用于同时鉴定样本内完整目的蛋白质组或亚蛋白质组的策略。鉴定病原体诸如SARS-CoV-2的策略依赖于逆转录聚合酶链式反应(RT-PCR)来定性检测SARS-CoV-2的核酸。当前现有技术的检验具有大约30%的假阴性率,对感染控制具有显著的后果。关于病毒载量的定量信息通常是不可获得的。作为一般替代,本发明的方法用于同时鉴定样本内完整目的蛋白质组或亚蛋白质组,例如,用于鉴定患者样本内目的SARS-CoV-2蛋白质组的存在和/或浓度和/或量。
本文所描述的本发明的方法可以用于鉴定样本中目的亚蛋白质组或蛋白质组的存在和/或浓度和/或量,因为每种目的亚蛋白质组或蛋白质组具有基于目的亚蛋白质组或蛋白质组中的每种蛋白质、肽、寡肽、多肽和蛋白质复合物中两种或更多种氨基酸类型的标记的已知值、氨基酸浓度和/或氨基酸数目的独特特征。因此,可以将样本的特征与一种或多种目的亚蛋白质组或蛋白质组的特征进行比较,以鉴定样本中目的亚蛋白质组或蛋白质组的存在和/或浓度和/或量。例如,与人眼蛋白质组中每种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目相比,人血浆蛋白质组具有基于每种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目的独特特征。因此,可以确定样本中两种或更多种氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目,并且与目的蛋白质组中相同的两种或更多种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目进行比较,以鉴定样本中该蛋白质组的存在和/或浓度和/或量。
本发明的方法可以用于鉴定样本中病毒蛋白质组的存在。每种病毒蛋白质组具有基于两种或更多种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目的独特特征。因此,可以将样本中两种或更多种氨基酸类型的平均测量的标记、氨基酸浓度和/或氨基酸数目与病毒蛋白质组的相同的两种或更多种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目进行比较,以鉴定样本中病毒蛋白质组的存在和/或浓度和/或量。此外,本发明的方法可以用于鉴定样本内病毒蛋白质组的病毒载量。例如,每种病毒蛋白质组具有基于病毒蛋白质组中的每种蛋白质中两种或更多种氨基酸类型的氨基酸的平均数乘以病毒蛋白质组的总蛋白质浓度的独特特征。因此,可以在一种或多种蛋白质浓度下将样本中两种或更多种氨基酸类型的氨基酸浓度与病毒蛋白质组的相同的两种或更多种氨基酸类型的平均氨基酸浓度进行比较,以鉴定样本内病毒蛋白质组的浓度。
先前,当使用溶液相策略来鉴定样本中蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的存在和/或浓度和/或量时,必须首先将混合物分离成其单个蛋白质组分。例如,在对单个蛋白质测序之前,通过凝胶电泳基于大小或基于使用色谱柱将化合物吸附到吸附剂上来分离混合物内的蛋白质。例如,如果混合物含有两种蛋白质;牛血清白蛋白和溶菌酶,先前需要将混合物分离成牛血清白蛋白和溶菌酶的单个蛋白质组分。相反,已经发现本文所述的本发明的方法可以用于基于来自完整混合物的平均特征鉴定样本中蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的存在和/或浓度和/或量,而不需要将混合物分离成单个组分。例如,可以鉴定含有牛血清白蛋白和溶菌酶的混合物,而不需要将该混合物分离成其牛血清白蛋白和溶菌酶的单个蛋白质组分。这是因为已经发现蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物具有基于混合物中蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组中两种或更多种氨基酸类型的氨基酸的平均数的独特特征。例如,与含有牛血清白蛋白和α突触核蛋白的另一种混合物相比,含有牛血清白蛋白和溶菌酶的混合物具有基于牛血清白蛋白和溶菌酶中两种或更多种氨基酸类型的平均测量的标记、氨基酸浓度和/或氨基酸数目的独特特征,该另一种混合物具有基于牛血清白蛋白和α突触核蛋白混合物中相同的两种或更多种氨基酸类型的平均测量的标记、氨基酸浓度和/或氨基酸数目的不同独特特征。为了鉴定样本内混合物的存在和/或浓度和/或量,不必知道混合物内组分的比例。相反,当在样本中鉴定了多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组时,在样本中鉴定混合物的存在。样本的特征受混合物内组分中的每一种的特征的影响。如果目的蛋白质A在混合物内被鉴定,并且包含比同样在混合物中被鉴定的目的蛋白质B更高比例的混合物,则样本点与目的蛋白质A的参考线或点之间的距离小于样本点与目的蛋白质B的参考线或点之间的距离。相反,发现可以计算并且比较样本点与目的蛋白质A和B之间的距离,以确定混合物中目的蛋白质A和B的比例。因此,可以将样本的特征与鉴定为存在于样本中的多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的特征进行比较,以鉴定样本中此类混合物的存在和/或浓度和/或量。
本发明的方法也可以用于鉴定样本中两种或更多种蛋白质组,即样本中蛋白质组的混合物,的共感染。这是因为蛋白质组的混合物具有基于蛋白质组的混合物中的每种蛋白质中两种或更多种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目的独特特征。因此,可以确定样本中两种或更多种氨基酸类型的测量的标记值、氨基酸浓度和/或氨基酸数目,并且与多于一种目的蛋白质组中相同的两种或更多种氨基酸类型的平均已知标记值、氨基酸浓度和/或氨基酸数目进行比较。如果在样本内鉴定了多于一种目的蛋白质组的存在,则在样本内鉴定目的蛋白质组的混合物,并且混合物内每种蛋白质组的比例可以如上文对蛋白质的混合物的解释来确定。如果目的蛋白质组A在混合物内被鉴定,并且包含比同样在混合物中被鉴定的目的蛋白质组B更高比例的混合物,则样本点与目的蛋白质组A的参考线或点之间的距离小于样本点与目的蛋白质组B的参考线或点之间的距离。相反,可以计算并且比较样本点与目的蛋白质组A和B之间的距离,以确定混合物中目的蛋白质组A和B的比例。因此,可以将样本的特征与鉴定为存在于样本中的多于一种目的蛋白质组的特征进行比较,以鉴定样本中此类混合物的存在和/或浓度和/或量。例如,患者可能具有病毒和继发性细菌感染,或两种病毒感染。在这种情况下,细菌和病毒蛋白质组以及两种病毒蛋白质组在实施本发明的方法之前不需要彼此分离。这可以同样适用于蛋白质组的任何组合,诸如细菌、真菌、原生动物、植物、动物,包括人,及其任何组合。
本文所描述的本发明的方法简单、不费力并且高效,并且避免了需要已知测序技术和/或分离技术的方法的固有缺点。
本文所公开的方法可以应用于任何蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或蛋白质、肽、多肽、寡肽、亚蛋白质组和/或蛋白质组的混合物。本发明的方法仅需要标记两种或更多种氨基酸类型的氨基酸并且测量这些标记。氨基酸类型由每种氨基酸特有的R基团定义。氨基酸的每种类型的R基团是独特的。氨基酸类型可以包括22种蛋白原性氨基酸和/或非蛋白原性或合成氨基酸的修饰的和/或未修饰的氨基酸。
该方法的唯一要求是可获得一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组(例如参考)的两种或更多种氨基酸类型的特征,或氨基酸序列和/或关于翻译后修饰的任何实验信息。为了鉴定样本中蛋白质的存在和/或浓度和/或量,不必确定样本内氨基酸的序列。在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的特征是已知的(例如来自数据库)。在一些实施例中,根据作为本发明的方法的一部分的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的每一种的一个或多个氨基酸序列确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的特征。在一些实施例中,如果不知道一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的特征,则一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列可以用于确定该特征。替代地,使用本文所公开的方法(例如,标记两种或更多种氨基酸类型、测量标记的值、经由标准方法测量样本的总蛋白质浓度和将测量的标记转换为每种标记的氨基酸类型的氨基酸数目)确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的特征。
如果一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组具有一种或多种氨基酸类型,其包括氨基酸类型的修饰的氨基酸,则可以确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中的氨基酸类型的修饰的氨基酸的特征。在一些实施例中,这根据一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的翻译后修饰信息确定。例如,如果氨基酸类型C在样本中被标记并且包括修饰的半胱氨酸氨基酸半胱氨酸二硫化物(C
定义
除非另外定义,否则本文所使用的所有技术和科学术语具有与本领域中的普通技术人员通常所理解的相同含义。除非另有说明,本文中引用的所有专利、申请、公开的申请和其它出版物以全文引用的方式并入。在本文的术语具有多个定义的情况下,除非另有说明,否则以本节中的那些为准。
如本文所使用的,术语“存在”是指样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的阳性鉴定。
如本文所使用的,术语“浓度”是指每单位体积的实体丰度。实体可以是分子、复合物、聚合物内的单体,诸如蛋白质链内含有的氨基酸,或原子。质量浓度是指每单位体积的实体质量。数浓度是指每单位体积的实体的分子数。摩尔浓度是指每单位体积的实体的摩尔数。实体的摩尔数是样本内含有的实体的总数除以阿伏伽德罗常数NA,即6.02214076×1023mol-1。除非另有说明,术语“浓度”是指实体的摩尔浓度。经常提及“作为浓度t的函数的目的蛋白质、肽、寡肽、多肽或蛋白质复合物”或等效物。这意味着t是目的蛋白质的浓度,或者,t是目的肽的浓度,或者,t是目的寡肽的浓度,或者,t是目的多肽的浓度,或者,t是目的蛋白质复合物的浓度。如本文所使用的,在一些实施例中,目的蛋白质复合物的浓度是指复合物的浓度,而不是复合物内亚基的单体浓度。例如,如果目的蛋白质复合物α具有两个亚基A和B,使得目的蛋白质复合物α可以用复合物化学计量A:B来描述,则蛋白质复合物α的浓度是复合物A:B的浓度,不是亚基A的浓度加上亚基B的浓度。还经常提及“作为浓度t的函数的目的亚蛋白质组或蛋白质组”或等效物。目的亚蛋白质组的浓度是包含目的亚蛋白质组的所有蛋白质、肽、寡肽、多肽和蛋白质复合物的总浓度。这意味着t是包含目的亚蛋白质组的所有蛋白质、肽、寡肽、多肽和蛋白质复合物的总浓度。目的蛋白质组的浓度是包含目的蛋白质组的所有蛋白质、肽、寡肽、多肽和蛋白质复合物的总浓度。这意味着t是包含目的蛋白质组的所有蛋白质、肽、寡肽、多肽和蛋白质复合物的总浓度。一旦鉴定了样本中存在的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的摩尔浓度,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的质量浓度是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的摩尔浓度乘以目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的分子量(现在已鉴定,使得其一个或多个氨基酸序列可用)。在一些实施例中,蛋白质复合物的分子量是其亚基的组合分子量。目的亚蛋白质组或蛋白质组的分子量是包含目的蛋白质组或亚蛋白质组的蛋白质、肽、寡肽、多肽和/或蛋白质复合物的分子量的平均值。在一些实施例中,蛋白质组的浓度是样本中蛋白质组或蛋白质组混合物的病毒载量、细菌载量和/或寄生虫载量的量度。在一些实施例中,蛋白质组是病毒蛋白质组,并且该方法提供样本内病毒蛋白质组的总摩尔蛋白质浓度。这等同于以拷贝/mL计的传统病毒载量测量值。替代地,该方法使用本领域已知的标准技术提供以拷贝/mL计的病毒载量测量值。在一些实施例中,蛋白质组是细菌蛋白质组,并且该方法提供样本内细菌蛋白质组的总细菌浓度。这等同于以菌落形成单位(CFU)计的细菌载量测量值。替代地,该方法使用本领域已知的标准技术提供以CFU计的细菌载量测量值。在一些实施例中,蛋白质组是寄生虫蛋白质组,并且该方法提供样本内寄生虫蛋白质组的总寄生虫浓度。这等同于以每宿主样本的寄生虫数计的寄生虫载量测量值。或者,该方法使用本领域已知的标准技术提供以每宿主样本的寄生虫数计的寄生虫载量测量值。虽然我们已经关于摩尔浓度描述了某些实施例,但是这些实施例同样适用于质量浓度,如在实例中已经描述的。
如本文所使用的,术语“目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度”是指目的蛋白质的蛋白质浓度,或目的肽的肽浓度,或目的寡肽的寡肽浓度,或目的多肽的多肽浓度,或目的蛋白质复合物的蛋白质复合物浓度,或目的亚蛋白质组的亚蛋白质组浓度,或目的蛋白质组的蛋白质组浓度的缩写。
如本文所使用的,术语“量”是指样本内实体的摩尔数。实体可以是分子、复合物、聚合物内的单体,诸如蛋白质链内含有的氨基酸,或原子。实体的摩尔数是样本内含有的实体的总数除以阿伏伽德罗常数N
如本文所使用的,术语“相对浓度”是指样本之间分子浓度的倍数变化。例如,已经从第二样本稀释的第一样本具有比第二样本低的相对浓度。
如本文所使用的,术语“氨基酸浓度”是指氨基酸类型内氨基酸的摩尔或质量浓度。氨基酸浓度是指每单位体积的氨基酸类型内的氨基酸的量或质量。除非另有说明,术语氨基酸浓度是指氨基酸类型内氨基酸的摩尔浓度。氨基类型内氨基酸的摩尔浓度可以不同于分子的浓度,因为在分子内可以含有多于一种氨基酸类型的氨基酸或零个氨基酸类型的氨基酸。氨基酸类型内氨基酸的氨基酸浓度等于分子的总摩尔浓度乘以每分子氨基酸类型的氨基酸数目。例如,如果分子是蛋白质,则氨基酸类型的氨基酸浓度可以(并且通常)不同于蛋白质浓度。使用提供已知氨基酸浓度的一种或多种蛋白质或氨基酸的标记值的校准曲线或标准,根据样本内氨基酸类型的标记的测量值计算样本内氨基酸类型的氨基酸浓度。重要的是,样本的两种或更多种氨基酸类型的氨基酸浓度不是指样本的浓度。目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的氨基酸浓度不是指目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度。
如本文所使用的,术语“蛋白质”是指由一个或多个氨基酸的线性多肽链组成的生物分子或大分子。蛋白质是氨基酸的聚合物。术语“蛋白质”包括但不限于含有约50至约3000个氨基酸的分子。术语“蛋白质”是指以通常具有生物功能的方式排列的一条或多条多肽链。蛋白质可以具有折叠的3维结构、内在无序的3维结构或部分折叠和部分无序的3维结构。蛋白质也指由一个或多个氨基酸的线性多肽链组成的生物分子或大分子,其也包括其它组分。例如,蛋白质还包括糖蛋白(其中糖分子链共价附接至蛋白质分子),或核蛋白,其中蛋白质与核酸相结合或键合。
如本文所使用的,术语“肽”是指通过肽(酰胺)键连接的氨基酸短链。术语“肽”包括但不限于含有约2至约50个氨基酸的分子。在优选的方面,术语“肽”是指含有多于10个氨基酸的分子。
如本文所使用的,术语“寡肽”是指肽中的一类,包括但不限于含有约2至约20个氨基酸的分子。术语“寡肽”包括但不限于含有2个氨基酸的二肽、含有3个氨基酸的三肽、含有4个氨基酸的四肽和含有5个氨基酸的五肽。
如本文所使用的,术语“多肽”是由肽键结合在一起的许多氨基酸的单线性链。
如本文所使用的,术语“蛋白质复合物”是指含有至少一个蛋白质亚基的两个或更多个亚基的结构相关基团。蛋白质复合物通常含有两种或更多种蛋白质。它还可以含有一种或多种蛋白质和一种或多种核酸(核糖核蛋白)。蛋白质复合物是稳定的蛋白质-蛋白质相互作用的形式,其中蛋白质亚基通常协作以执行生物功能。蛋白质复合物的实例是核糖体。因为蛋白质复合物内的蛋白质亚基在结构上稳定地彼此相关联并且协作以形成生物功能,所以将蛋白质复合物的每个亚基内的两种或更多种氨基酸类型中的每一种的氨基酸数目相加,以确定蛋白质复合物的两种或更多种氨基酸类型中的每一种的氨基酸数目。
如本文所使用的,术语“蛋白质-蛋白质相互作用”是指蛋白质分子之间的相互作用,通常涉及特定的物理接触。蛋白质-蛋白质相互作用可以是稳定的或瞬时的。在本发明的方法中,不包含蛋白质复合物的蛋白质-蛋白质相互作用,诸如瞬时蛋白质相互作用,被视作蛋白质混合物。
如本文所使用的,术语“亚蛋白质组”是作为蛋白质组的一部分并且共有共同特性,诸如疾病相关,的蛋白质的集合。例如,人血浆蛋白质组内的亚蛋白质组是心脏病亚蛋白质组。疾病相关的亚蛋白质组可以包括蛋白质组内的所有或一些蛋白质。亚蛋白质组也可以描述蛋白质组内共有共同物理特性的蛋白质,诸如但不限于低分子量、大小、电荷和/或密度。在一些实施例中,低分子量特性是指小于10kDa、小于30kDa、小于50kDA、小于100kDa、10至30kDa、30至50kDa、10至50kDA、30至50kDA、10至100kDa、50至100kDa或30至100kDa的蛋白质。在优选的实施例中,低分子量是指小于10kDa、小于30kDa、小于50kDa、小于100kDa的蛋白质,或10kDa、30kDa、50kDa或100kDa的蛋白质。在优选的实施例中,低分子量是指小于50kDa的蛋白质或50kDa的蛋白质。在一些实施例中,电荷特性是指色谱法,包括可以用于选择与带相反电荷的树脂结合的蛋白质的离子交换色谱法。在一些实施例中,密度特性是指与蛋白质大小和形状相关的沉降系数。
如本文所使用的,术语“蛋白质组”是指有机体表达的所有蛋白质。术语“蛋白质组”还指由特定组织类型,例如人血浆蛋白质组,内的有机体表达的所有蛋白质。术语“蛋白质组”还指在特定细胞类型,例如成胶质细胞瘤细胞,内表达的所有蛋白质。术语“蛋白质组”还指在给定时间或在给定条件下,例如当用药物治疗时,由有机体、组织类型或细胞类型表达的蛋白质的变化。术语“蛋白质组”包括但不限于病毒蛋白质组、细菌蛋白质组、古细菌蛋白质组、寄生虫蛋白质组、酵母蛋白质组、植物蛋白质组、动物蛋白质组、哺乳动物蛋白质组和人蛋白质组。术语“蛋白质组”包括但不限于具有少于50个蛋白质的病毒蛋白质组、具有少于7000个蛋白质的细菌蛋白质组、具有少于5000个蛋白质的人血浆蛋白质组、具有少于5000个蛋白质的人尿蛋白质组、具有少于5000个蛋白质的人唾液蛋白质组,以及具有大约22000个蛋白质的人蛋白质组。
如本文所使用的,术语“混合物”是指样本中的两种或更多种蛋白质、肽、多肽或寡肽、亚蛋白质组和/或蛋白质组。例如,肽的混合物是两种或更多种肽的组合,多肽的混合物是两种或更多种多肽的组合,蛋白质的混合物是两种或更多种蛋白质的组合。混合物不必由相同的组分组成。例如,混合物也可以是蛋白质和肽的混合物、肽和多肽的混合物、蛋白质和多肽的混合物等。
如本文所使用的,“样本”是指可以含有一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的任何样本。术语“样本”还包括不含任何蛋白质的任何样本,并且因此当测量标记时没有获得值(例如标记的信号)。
如本文所使用的,术语“氨基酸类型”是指包含一个胺(-NH)和一个羧基(-CO)基团、一个α碳和一个每种氨基酸类型特有的R基团(侧链),或其包含一个胺(-NH
如本文所使用的,术语“R基团”是指存在于每种氨基酸类型的每种氨基酸中的侧链。R基团是取代基;置换氨基酸的α碳上的一个或多个氢原子的原子或原子团。每种氨基酸类型的R基团对于该氨基酸类型是独特的。本发明涵盖的每种氨基酸类型的R基团在表2中定义。氨基酸类型由存在于未修饰的(如翻译的)氨基酸类型上的R基团定义。如果后续对R基团进行修饰,则氨基酸类型不改变。例如,半胱氨酸(C)氨基酸类型由硫醇R基团定义。这是半胱氨酸氨基酸类型(还原的半胱氨酸C
如本文所使用的,“修饰的氨基酸”是指在掺入蛋白质后已经化学修饰的氨基酸类型的氨基酸。在一些实施例中,酶进行该化学修饰。在一些实施例中,修饰的氨基酸已经经历翻译后修饰。氨基酸的此类翻译后修饰的实例包括但不限于甲基化、脱氨、脱酰胺、N-连接的糖基化、异构化、二硫键形成、氧化成次磺酸、亚磺酸或磺酸、棕榈酰化、N-乙酰化(N-末端)、S-亚硝基化、环化成焦谷氨酸(N-末端)、γ-羧化、异肽键形成、N-肉豆蔻酰化(N-末端)、磷酸化、乙酰化、泛素化、SUMO化、甲基化、羟基化、氧化成亚砜或砜、羟基化、O-连接的糖基化、单-或二-氧化、犬尿氨酸的形成和/或硫酸化。例如,氨基酸类型半胱氨酸(C)的氨基酸可以在翻译后修饰期间被修饰以形成含有二硫键和氧化的硫醇R基团的半胱氨酸二硫化物(C
如本文所使用的,“未修饰的氨基酸”是指在掺入蛋白质后未经化学修饰的氨基酸类型的氨基酸。例如,氨基酸类型半胱氨酸(C)的未修饰的氨基酸是还原的半胱氨酸(C
如本文所使用的,术语“两种或更多种氨基酸类型”是指至少两种氨基酸类型。术语“两种或更多种氨基酸类型”涵盖但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40种氨基酸类型。在一些实施例中,2种氨基酸类型被标记。在一些实施例中,3种氨基酸类型被标记。在一些实施例中,4种氨基酸类型被标记。在一些实施例中,5种氨基酸类型被标记。在一些实施例中,6种氨基酸类型被标记。在一些实施例中,7种氨基酸类型被标记。在一些实施例中,8种氨基酸类型被标记。在一些实施例中,9种氨基酸类型被标记。在一些实施例中,10种氨基酸类型被标记。在一些实施例中,11种氨基酸类型被标记。在一些实施例中,12种氨基酸类型被标记。在一些实施例中,13种氨基酸类型被标记。在一些实施例中,14种氨基酸类型被标记。在一些实施例中,15种氨基酸类型被标记。在一些实施例中,16种氨基酸类型被标记。在一些实施例中,17种氨基酸类型被标记。在一些实施例中,18种氨基酸类型被标记。在一些实施例中,19种氨基酸类型被标记。在一些实施例中,20种氨基酸类型被标记。在一些实施例中,21种氨基酸类型被标记。在一些实施例中,22种氨基酸类型被标记。在一些实施例中,23种氨基酸类型被标记。在一些实施例中,24种氨基酸类型被标记。在一些实施例中,25种氨基酸类型被标记。在一些实施例中,26种氨基酸类型被标记。在一些实施例中,27种氨基酸类型被标记。在一些实施例中,28种氨基酸类型被标记。在一些实施例中,29种氨基酸类型被标记。在一些实施例中,30种氨基酸类型被标记。在一些实施例中,31种氨基酸类型被标记。在一些实施例中,32种氨基酸类型被标记。在一些实施例中,33种氨基酸类型被标记。在一些实施例中,34种氨基酸类型被标记。在一些实施例中,35种氨基酸类型被标记。在一些实施例中,36种氨基酸类型被标记。在一些实施例中,37种氨基酸类型被标记。在一些实施例中,38种氨基酸类型被标记。在一些实施例中,39种氨基酸类型被标记。在一些实施例中,40种氨基酸类型被标记。
如本文所使用的,术语“标记”或“标记的”是指添加、插入、附接、结合或键合至氨基酸类型内的氨基酸以帮助检测和/或鉴定样本内的氨基酸类型的标签、标识符或探针。例如,标记可以包括荧光团、同位素或串联质谱标签。在一些实施例中,标记提供信号。在一些实施例中,标记是荧光标记。在一些实施例中,标记是荧光染料,或在与氨基酸类型反应时变成发荧光的分子。在一些实施例中,标记共价键合至氨基酸类型内的氨基酸。在一些实施例中,标记共价键合至氨基酸类型内的氨基酸的R基团。
如本文所使用的,术语“信号”是指传达信息的事件。在一些实施例中,信号是传达信息的时变事件。标记的信号可以在单个时间点被读取,或者标记的信号可以作为时间的函数被读取。在一些实施例中,标记是荧光标记并且标记的信号是荧光强度。
如本文所使用的,术语“发光”是指由不是由热引起的物质自发发射的光。在一些实施例中,标记是发光标记并且标记的信号是发光信号。发光的几种类型,包括但不限于光致发光(其包括荧光)、化学发光(其包括生物发光)、电致发光、辐射发光和热致发光。光致发光是光子吸收的结果。光致发光的几种类型包括作为具有典型的寿命为纳秒的单线态-单线态电子弛豫的结果的光致发光的荧光。磷光是另一种类型的光致发光,它是具有典型的寿命为毫秒到小时的三线态-单线态电子弛豫的结果。化学发光是作为化学反应的结果的光发射。生物发光是化学发光的一种形式,它是活有机体中生化反应的结果。电化学发光是电化学反应的结果。电致发光是电流穿过物质的结果。阴极发光是发光材料被电子撞击的结果。声致发光是当被声音激发时气泡在液体中内爆的结果。辐射发光是电离辐射轰击的结果。热致发光是当物质被加热时吸收的能量的再发射。低温发光是当物体被冷却时的光发射。
如本文所使用的,术语“校准曲线”或术语“标准”是指用于通过将未知样本与已知浓度的一组标准样本或一个标准样本进行比较来确定未知样本中物质的浓度的通用分析化学方法。如果将未知样本与一组标准样本进行比较,则使用“校准曲线”。如果将未知样本与单个标准样本进行比较,则使用术语“标准”。校准曲线或标准用于在目的蛋白质的两种或更多种氨基酸类型中的每一种的已知氨基酸浓度与测量的标记(例如标记的信号)之间转换,或用于在相同的两种或更多种氨基酸类型的测量的标记(例如标记的信号)与样本中每种氨基酸类型的氨基酸浓度之间转换。氨基酸类型的校准曲线是指对于氨基酸类型的几种已知氨基酸浓度收集的数据(标记的信号),以及标准是指对于氨基酸类型的一种已知氨基酸浓度收集的数据(标记的信号)。根据校准曲线或标准计算校准函数或(标量)校准因子。
如本文所使用的,术语“比例”是指少于样本中氨基酸类型的所有氨基酸,即少于样本中氨基酸类型的氨基酸的100%的氨基酸类型的任何氨基酸数目。术语“比例”还指例如根据表4中提供的规则,小于与标记反应的氨基酸类型的氨基酸的所有子集(例如,氨基酸类型的未修饰的氨基酸)的氨基酸类型的任何氨基酸数目。术语“比例”包括但不限于样本中被标记的每种氨基酸类型的氨基酸的约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%。在一些实施例中,比例为样本中存在的特定氨基酸类型的氨基酸的约50%。在一些实施例中,比例为样本中存在的特定氨基酸类型的氨基酸的约60%。在一些实施例中,比例为样本中存在的特定氨基酸类型的氨基酸的约70%。在一些实施例中,比例为样本中存在的特定氨基酸类型的氨基酸的约80%。在一些实施例中,比例为样本中存在的特定氨基酸类型的氨基酸的约90%。
如本文所使用的,术语“测量”是指检测和定量。在一些实施例中,测量包括测量信号。
如本文所使用的,术语“氨基酸数目”是指每分子特定氨基酸类型的氨基酸数目。为了确定样本中每种标记类型的氨基酸数目,将样本中氨基酸类型的氨基酸浓度除以样本的摩尔蛋白质浓度。为了确定目的蛋白质或参考中氨基酸类型的氨基酸数目,氨基酸类型的氨基酸数目根据目的蛋白质的蛋白质序列计算,或先前已经确定并且例如可经由数据库访问。替代地,目的蛋白质中氨基酸类型的氨基酸数目可以通过在已知蛋白质浓度下标记目的蛋白质中的氨基酸类型、测量标记、使用本文所公开的方法将测量的标记转换为氨基酸浓度,并且将氨基酸类型的氨基酸浓度除以目的蛋白质的摩尔蛋白质浓度来确定。例如,如果赖氨酸是被标记的氨基酸类型并且样本中每蛋白质分子有54个赖氨酸,则赖氨酸的氨基酸类型的氨基酸数目是54。氨基酸类型的氨基酸数目不是指含有样本的溶液中氨基酸类型的总氨基酸数目。例如,如果样本中有10000个蛋白质分子,并且每个蛋白质分子含有54个赖氨酸氨基酸,则赖氨酸氨基酸类型的氨基酸数目是54,而不是540000。
如本文所使用的,术语“背景校正”或“背景校正的”是指已被校正以排除来自溶液中的游离标记的任何信号的每种标记的氨基酸类型的测量的标记,该游离标记未添加、插入、附接、结合、键合或共价键合至目的氨基酸类型的氨基酸、非特异性标记,或否则将有助于测量总标记的信号的其它来源,诸如细胞自体荧光。这通过本领域中的标准手段来实现。
如本文所使用的,术语“本体”是指在不将样本约束在尺寸通常为数百微米或更小的通道内的情况下进行的研究。经典地,本体研究不涉及少量(皮升到纳升)流体的操作,并且流体除了扩散之外还湍流地混合。本体研究包括流体的自动操作,例如通过泵或机器人。本体研究可以涉及分析板中的样本,该板具有样本储器以平行进行许多反应和/或测量,并且可以涉及使用板读取器或类似仪器。通常,本体研究不试图检测单一蛋白质分子。
如本文所使用的,术语“溶液相”是指在溶液中进行和测量的研究。溶液相不包括需要在表面上测量的方法,诸如转变内反射荧光(TIRF)显微术。溶液相不包括要求样本内的蛋白质穿过表面内的合成或天然孔的方法。例如,溶液相不包括在表面内掺入纳米孔、小通道的方法,并且不包括掺入生物纳米孔、包埋在脂质膜内的跨膜蛋白的方法。
如本文所使用的,术语“解卷积”是指其中分析或转变从多个分量得到的信号以揭示来自每个分量的部分的过程。在一些实施例中,如果时间分辨信号来源于两个分量并且存在两个分离的峰,则信号可以被动态地解卷积,使得对一个峰的分析提供关于一个分量的信息,并且对另一峰的分析提供关于另一分量的信息。例如,如果标记是荧光标记并且两种或更多种氨基酸类型在相同条件下用相同荧光标记标记,但标记反应以不同速率进行,则可以使用动力学解卷积,使得在某一时刻测量标记的信号提供仅关于一种氨基酸类型的信息,并且在另一时刻测量标记的信号提供仅关于另一氨基酸类型的信息。替代地,如果信号来源于两个分量并且一个分量是已知的,则可以转变该信号以去除已知分量并且仅揭示关于未知分量的信息。
如本文所使用的,术语“解卷积标准”是指样本中标记和测量的两种或更多种氨基酸类型的已知氨基酸浓度的蛋白质,其用于解卷积在相同条件下用相同标记标记两种氨基酸类型时获得的信号。解卷积标准可以在不同的激发和发射波长下测量,以解卷积每种标记的氨基酸类型在每种波长下的贡献,并且能够分离样本中每种标记的氨基酸类型的信号。解卷积标准不是上面讨论的“校准曲线或标准”。
如本文所使用的,术语“蛋白质测序”是指确定蛋白质、肽、寡肽或多肽中的氨基酸序列。蛋白质测序涉及从氨基酸链的一个末端开始沿着氨基酸序列连续读取和鉴定单个氨基酸,并且沿着氨基酸链一次移动一个氨基酸。蛋白质测序确定蛋白质内氨基酸的位置。例如,埃德曼降解是蛋白质测序的常用方法。
如本文所使用的,术语“n维空间”是指数学空间,其中n是指定其内任何点所需的坐标的最小数。在n维空间内,存在n维信息。信息的维度是被标记的氨基酸类型的数目。例如,3维信息是指被标记的3种氨基酸类型并且需要3维空间。在一些实施例中,n维空间用于绘制n种氨基酸类型的标记值、氨基酸浓度或氨基酸数目。在n维空间中,存在指定任何向量所必需的n个坐标。
如本文所使用的,术语“参考”是标准或对照值,将样本的值与该标准或对照值进行比较。该参考可以包括指示与在样本中标记的每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸类型相同的两种或更多种氨基酸类型的已知标记值,和/或氨基酸浓度,和/或氨基酸数目的信息。该参考可以包括已知标记值(例如信号,例如荧光强度)或一种或多种蛋白质浓度的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的两种或更多种氨基酸类型的氨基酸浓度,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列中两种或更多种氨基酸类型的氨基酸数目。两种或更多种氨基酸类型与样本中标记的两种或更多种氨基酸类型相同。每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考用于鉴定样本内一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度和/或量。在一些实施例中,该参考是蛋白质组或亚蛋白质组的所有氨基酸序列中两种或更多种氨基酸类型的已知标记值、氨基酸浓度或氨基酸数目的加权平均值,其通过蛋白质组、亚蛋白质组或蛋白质的混合物中每种蛋白质的比例加权。在一些实施例中,该参考被存储在数据库中,并且从数据库中被访问/获得。在一些实施例中,参考是用实验方法确定的。在一些实施例中,参考根据一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列计算。在一些实施例中,产生参考包括访问各种蛋白质的公开可获得的氨基酸序列并且去除在成熟蛋白质中生物裂解的序列部分。在一些实施例中,创建参考包括确定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列内与已标记的相同的两种或更多种氨基酸类型的氨基酸数目,其具有任选地应用表4中概述的规则以从氨基酸类型的氨基酸数目中去除翻译后修饰的氨基酸,该翻译后修饰的氨基酸将不与该氨基酸类型的标记反应。在一些实施例中,使用本文所公开的方法确定参考,即标记两种或更多种氨基酸类型、测量标记并且使用测量的标记确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种氨基酸类型的氨基酸数目,或含有每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中每种氨基酸类型的氨基酸浓度。在一些实施例中,该参考提供了与在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度,作为参数方程组或取决于共同浓度参数的向量函数。在其它实施例中,该参考提供了与在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的氨基酸数目。在一些实施例中,该参考包括已知的或使用本发明的方法确定的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度范围。在一些实施例中,这些已知浓度范围用作组成参考的一个或多个函数的界限。在一些实施例中,该参考包括附加信息,诸如并入了观察到的实验误差率的信息。在一些实施例中,该参考包括源于本福特定律的信息,该本福特定律提供了本质上观察到的许多数据集内的前导数位的频率分布。
如本文所使用的,术语“单一参考”是指为目的蛋白质组和/或亚蛋白质组提供的参考,其基于其平均组成独特地鉴定目的蛋白质组和/或亚蛋白质组。尽管目的蛋白质组和/或亚蛋白质组中可以含有许多单个蛋白质,但不需要提供已知标记值、氨基酸浓度和/或氨基酸数目作为目的蛋白质组和/或亚蛋白质组内含有的每种蛋白质的参考,以鉴定目的蛋白质组和/或亚蛋白质组。例如,如果目的蛋白质组含有700个蛋白质,则不需要提供已知标记值、氨基酸浓度和/或氨基酸数目作为目的蛋白质组和/或亚蛋白质组内含有的所有700个蛋白质的参考。相反,为目的蛋白质组和/或亚蛋白质组提供的单一参考提供了允许其鉴定的目的蛋白质组和/或亚蛋白质组的平均特征。例如,血浆中目的结肠直肠癌蛋白质组的单一参考允许仅通过标记和测量血浆溶液中的两种或更多种氨基酸类型,并且将标记的测量值或根据标记的测量值计算的氨基酸浓度与由单一参考提供的值进行比较来从血浆中鉴定目的结肠直肠癌蛋白质组。为了检测目的结肠直肠癌蛋白质组和/或亚蛋白质组的存在和/或浓度和/或量,不需要测量目的结肠直肠癌蛋白质组和/或亚蛋白质组内的单个蛋白质和/或生物标记。鉴定目的蛋白质组和/或亚蛋白质组,并且确定其浓度/量,而不需要测量其中的单一蛋白质。目的蛋白质组和/或亚蛋白质组的单一参考可以使用本发明的方法在理论上或用实验方法计算,并且是目的蛋白质组和/或亚蛋白质组的总蛋白质浓度的代数函数,其可以例如通过本文所描述的向量函数或参数方程组中的一个来描述。
如本文所使用的,术语“还原的半胱氨酸”(C
如本文所使用的,术语“半胱氨酸二硫化物”(C
如本文所使用的,术语“半胱氨酸”(C)是指未修饰的半胱氨酸氨基酸(C
如本文所使用的,术语“分类器”是指实施分类的算法。分类是基于含有已知其类别成员的观察结果的数据的训练集来鉴定新观察结果所属的类别。术语“分类器”涵盖机器学习分类器,其使用监督学习来学习基于示例性输入-输出对将输入映射到输出的函数,包括使用懒惰学习(基于实例的学习)和急切学习。例如,分类器描述了k-最近邻分类器(惰性学习)和/或支持向量机分类器(急切学习)。分类器可以用于本文所描述的方法的比较步骤中。
如本文所使用的,术语“复制品”是指罕见的情况,其中多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组具有相同的参考,或其中基于两种或更多种氨基酸类型的标记值、氨基酸浓度或两种或更多种氨基酸类型的氨基酸数目的比较,对于多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考是难以区分的。这是因为一种目的蛋白质中两种或更多种氨基酸类型的氨基酸数目与另一目的蛋白质中相同的两种或更多种氨基酸类型的氨基酸数目相同或为其倍数。参考可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个复制品,但多于1个复制品是罕见的。如果两种目的蛋白质具有相同的参考,并且该参考在样本内被鉴定,则样本被鉴定为含有这两种目的蛋白质中的任一种。有许多方法来消除这种影响并且独特地鉴定样本内存在的目的蛋白质,诸如将样本中已鉴定的参考的蛋白质浓度与两种目的蛋白质的已知生物学相关浓度范围进行比较。样本被鉴定为含有在其生物学相关浓度范围内的目的蛋白质。
为了清楚和解释,在目的蛋白质或蛋白质组的上下文中描述了该方法。然而,除非另有说明或从上下文中变得清楚,否则本发明的方法应理解为一般地、附加地或替代地适用于一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组。
样本
本方法中使用的样本已经使用标准方法从受试者中获得。优选地,样本是体液样本、组织样本、土壤样本、水样本、环境样本、作物样本、食品样本、饮料样本或实验室样本。
本发明涵盖的体液样本包括但不限于:全血样本、血清样本、血浆样本、唾液样本、痰样本、粪便样本、尿样本、精液样本、鼻拭子样本、鼻咽吸出物样本、咽拭子,或下呼吸道样本,诸如下呼吸道粘液吸出物样本、脑脊髓(CSF)样本、性健康样本,诸如尿道拭子、子宫颈拭子、阴道拭子或直肠拭子。替代地,样本可以含有本领域已知的任何其它体液。在一些实施例中,体液样本是由病变产生的任何类型的流体。在一些实施例中,样本是血浆样本。在一些实施例中,样本是贫血小板血浆(PPP)样本。在一些实施例中,样本是富血小板血浆(PPP)样本。在一些实施例中,样本是血小板样本。在一些实施例中,样本是血浆外来体样本。在一些实施例中,样本是血细胞样本。在一些实施例中,血细胞样本是淋巴细胞样本或骨髓细胞样本。在一些实施例中,样本是尿样本。
替代地,样本可以是组织样本。优选地,组织样本是任何目的组织类型的活组织检查。例如,组织样本可以是实体瘤的活组织检查。这包括例如肉瘤、淋巴瘤、癌和黑素瘤。
替代地,样本可以是环境样本。优选地,环境样本是水样本,诸如饮用水样本或废水样本。在一些实施例中,样本是疑似生物战的样本。
替代地,样本可以是食品样本,例如在食品工业中。例如,本发明的方法可以用于检验食品样本的细菌生长和组成,例如在乳酪制作中,检验面包制作中的面粉和面包质量,诸如经由评估谷蛋白的强度、定量发酵剂的量(例如,鉴定和定量红茶菌中的细菌量以确保消费安全)、检验酸奶,或检验酸面团母培养物。优选地,食物样本疑似含有过敏原。
在一些实施例中,样本可能疑似含有过敏原。优选地,过敏原是花生、谷蛋白、乳糖、花粉或尘螨、灰尘、酪蛋白、脂质运载蛋白、c型溶菌酶、蛋白酶抑制剂、原肌球蛋白、小清蛋白、猫皮屑、狗皮屑。
替代地,样本可以是饮料样本,诸如奶样本、水样本或果汁样本。例如,本发明的方法可以用于农业产业,以测量奶的激素组分的化学特征,或评估未灭菌的奶或果汁的细菌污染。
在一些实施例中,样本是体液样本(例如全血样本、血清样本、血浆样本、唾液样本、痰样本、粪便样本、尿样本、精液样本、鼻拭子样本、鼻咽吸出物样本、咽拭子,或下呼吸道样本,诸如下呼吸道粘液吸出物样本、脑脊液(CSF)样本、性健康样本,诸如尿道拭子、子宫颈拭子、阴道拭子或直肠拭子,或由病变产生的任何类型的流体)、组织样本、土壤样本、环境样本(例如水样本,诸如饮用水样本或废水样本;或疑似生物战的样本)、食品样本(例如疑似含有过敏原诸如花生、谷蛋白、乳糖或花粉、酪蛋白、脂质运载蛋白、c型溶菌酶、蛋白酶抑制剂、原肌球蛋白、小清蛋白、猫皮屑和/或狗皮屑,或功能性食品样本)或饮料样本(例如奶、水、果汁)。
在一些实施例中,使用本领域的标准技术诸如离心、过滤、提取、沉淀和差异化溶解、超速离心、尺寸排阻色谱法、基于电荷或疏水性的分离(实例包括疏水相互作用色谱法、离子交换色谱法和/或自由流动电泳)和/或亲和色谱法诸如免疫亲和色谱法或高效液相色谱法(HPLC)从样本中分离蛋白质。一旦分离,也可以浓缩样本内的蛋白质。这可以涉及但不限于冻干或超滤。例如,如果样本是唾液样本,并且在样本中检测到病毒或细菌的存在,则通过离心将样本中的病毒和细菌蛋白质与样本中的人蛋白质分离。离心后,沉淀物对应于样本中存在的病毒和细菌,上清液中不存在人蛋白质。在另一实例中,如果样本是固体组织样本,并且在样本中检测到病毒或细菌的存在,则通过冷冻组织样本、压碎样本并且将蛋白质从组织中提取到缓冲液中,将样本中的病毒和细菌蛋白质与样本中的人蛋白质分离。本领域中标准的用于从组织样本中提取蛋白质的这些技术的实例由January Ericsson,C.的从固体组织中提取蛋白质(Protein Extraction from Solid Tissue)2011,《分子生物学方法(Methods in molecular biology)》(Clifton,N.J)675:307-12.DOI:10.1007/978-1-59745-423-0_17提供。
样本可能疑似含有一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物或蛋白质组的存在。在一些实施例中,目的蛋白质、肽、寡肽、多肽、蛋白质复合物或蛋白质组是从样本中的其它蛋白质分离的。
目的蛋白质
尽管在本申请中通篇提及“目的蛋白质”,但是术语“目的蛋白质”作为实例提供并且可以用目的肽、目的寡肽、目的多肽、目的蛋白质组复合物、目的亚蛋白质组,或目的蛋白质组,或其组合替代,其在样本内的存在和/或浓度和/或量正在被检验。在该术语的一般意义上,“目的蛋白质”疑似在样本中,并且目的蛋白质在样本内的假说经由本发明的方法检验。
在一些实施例中,目的蛋白质组是疑似分别引起病毒感染、细菌感染、真菌感染或寄生虫感染的病毒蛋白质组、细菌蛋白质组、真菌蛋白质组或寄生虫蛋白质组。例如,在一些实施例中,受试者疑似患有疟疾并且目的蛋白质组包括恶性疟原虫(P.falciparum)、三日疟原虫(P.malariae)、卵形疟原虫(P.ovale)、间日疟原虫(P.vivax)和诺氏疟原虫(P.knowlesi)蛋白质组。这些寄生虫是已知的疟疾病原体。从疑似患有疟疾的受试者获得样本,诸如血液样本,并且使用过滤从血液中分离寄生虫蛋白质组。检验从血液样本中分离的寄生蛋白质中恶性疟原虫、三日疟原虫、卵形疟原虫、间日疟原虫和诺氏疟原虫蛋白质组中的任何一种的存在以证实疟疾的诊断和鉴定受试者样本中引起疟疾的特定寄生虫。
在一些实施例中,目的蛋白质组是病毒蛋白质组。例如,在一些实施例中,受试者示出干咳、疲劳,肌肉疼痛和发烧的症状,并且因此受试者疑似患有流感或冠状病毒。从受试者获得样本,诸如血液样本、鼻拭子、鼻咽吸出物或下呼吸道粘液吸出物样本,并且检验样本中流感蛋白质组,例如A型流感H1N1蛋白质组,和/或冠状病毒蛋白质组,例如SARS-CoV-2(Covid-19)蛋白质组,的存在,以鉴定引起受试者症状的病毒,并且因此鉴定受试者具有的感染。
在一些实施例中,目的蛋白质组是人蛋白质组。在一些实施例中,目的蛋白质组是人血浆蛋白质组。在一些实施例中,在该方法的剩余步骤之前去除人血浆蛋白质组的白蛋白级分。在一些实施例中,在该方法的剩余步骤之前去除人血浆蛋白质组的白蛋白和球蛋白级分。在替代实施例中,在该方法的剩余步骤之前不除去人血浆蛋白质组的白蛋白级分。在一些实施例中,在该方法的剩余步骤之前不除去人血浆蛋白质组的白蛋白和球蛋白级分。在一些实施例中,在该方法的剩余步骤之前使用离心过滤步骤去除人血浆蛋白质组的白蛋白和球蛋白级分,该离心过滤步骤在该方法的剩余步骤之前去除高分子量蛋白质诸如白蛋白和球蛋白。在一些实施例中,目的蛋白质组是以下特定腺体/组织的人蛋白质组中的一种或多种:人眼蛋白质组、视网膜、心脏、骨骼肌、平滑肌、肾上腺、甲状旁腺、甲状腺、垂体、肺、骨髓、淋巴组织、肝、胆囊、睾丸、附睾、前列腺、精囊、输精管、脂肪组织、脑、唾液腺、食道、舌、胃、肠、胰腺、肾、膀胱、乳房、阴道、子宫颈、子宫内膜、输卵管、卵巢、胎盘、皮肤、血液或其任何组合。目的蛋白质组还可以包括人代谢蛋白质组和/或人分泌蛋白质组。
在一些实施例中,目的蛋白质组可以是亚蛋白质组。例如,一种或多种人癌亚蛋白质组,其选自:人胰腺癌亚蛋白质组、人神经胶质瘤亚蛋白质组、人头颈癌亚蛋白质组、人甲状腺癌亚蛋白质组、人肺癌亚蛋白质组、人肝癌亚蛋白质组、人睾丸癌亚蛋白质组、人前列腺癌亚蛋白质组、人胃癌亚蛋白质组、人结肠/直肠癌亚蛋白质组、人乳腺癌亚蛋白质组、人子宫内膜癌亚蛋白质组、人卵巢癌亚蛋白质组、人宫颈癌亚蛋白质组、人肾癌亚蛋白质组、人泌尿和膀胱癌蛋白质组、人黑素瘤亚蛋白质组及其任何组合。以下亚蛋白质组也是目的亚蛋白质组:人I型糖尿病亚蛋白质组、人II型糖尿病亚蛋白质组、阿尔茨海默病亚蛋白质组、人帕金森氏病亚蛋白质组,人痴呆亚蛋白质组、人心血管疾病亚蛋白质组、人唐氏综合征亚蛋白质组、人衰老亚蛋白质组或其任何组合。
在一些实施例中,疾病相关亚蛋白质组包括受该有机体的疾病状态影响的有机体的那些蛋白质。在一些实施例中,目的亚蛋白质组是人血浆蛋白质组的人胰腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人贫血小板血浆(PPP)蛋白质组的人胰腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人富血小板血浆(PRP)蛋白质组的人胰腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人血浆蛋白质组的人胰腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人贫血小板血浆(PPP)蛋白质组的人胰腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人富血小板血浆(PRP)蛋白质组的人胰腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人前列腺癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人结肠直肠癌亚蛋白质组。在一些实施例中,目的亚蛋白质组是人胰腺癌亚蛋白质组。
在一些实施例中,目的蛋白质组是病毒蛋白质组。在一些实施例中,病毒蛋白质组选自:人乳头瘤病毒(HPV)蛋白质组、人免疫缺陷病毒(HIV)蛋白质组、正粘病毒科蛋白质组、爱泼斯坦巴尔蛋白质组、埃博拉病毒蛋白质组、狂犬病毒属蛋白质组、冠状病毒属蛋白质组、诺如病毒蛋白质组、A型肝炎蛋白质组、B型肝炎蛋白质组、C型肝炎蛋白质组、E型肝炎蛋白质组、丁型肝炎蛋白质组、疱疹病毒蛋白质组、乳头瘤病毒蛋白质组、鼻病毒属蛋白质组、麻疹病毒蛋白质组、腮腺炎病毒蛋白质组、脊髓灰质炎病毒蛋白质组、狂犬病蛋白质组、轮状病毒蛋白质组、西尼罗病毒蛋白质组、黄热病病毒蛋白质组、寨卡病毒蛋白质组、有尾噬菌体目蛋白质组、线头病毒科蛋白质组、核糖病毒域蛋白质组、丝形病毒科蛋白质组、小纺锤形噬菌体科蛋白质组、疱疹病毒目蛋白质组、非洲猪瘟病毒科蛋白质组、双尾病毒科蛋白质组、结核病蛋白质组、牛结核病蛋白质组及其任何组合。
在一些实施例中,正粘病毒科蛋白质组是流感蛋白质组。流感蛋白质组包括但不限于:A型流感蛋白质组、A型流感亚型H1N1蛋白质组、B型流感蛋白质组、C型流感蛋白质组或D型流感蛋白质组,或其任何组合。在一些实施例中,冠状病毒蛋白质组是SARS-CoV-2(Covid-19)蛋白质组、SARS-CoV蛋白质组或MERS-CoV蛋白质组。在一些实施例中,目的病毒蛋白质组是动物源性病毒蛋白质组。
在一些实施例中,目的蛋白质组是细菌蛋白质组。在一些实施例中,细菌蛋白质组包括但不限于大肠杆菌(Escherichia coli,E.coli)蛋白质组、铜绿假单胞菌(Pseudomonas aeruginosa,P.aeruginosa)蛋白质组、沙n氏菌蛋白质组、金黄色葡萄球菌蛋白质组、鲍氏不动杆菌蛋白质组、脆弱拟杆菌蛋白质组、洋葱伯克霍尔德菌蛋白质组、艰难梭菌蛋白质组、索氏梭菌蛋白质组、肠杆菌科蛋白质组、粪肠球菌蛋白质组、肺炎克雷伯氏菌蛋白质组、耐甲氧西林金黄色葡萄球菌蛋白质组、摩氏摩根氏菌蛋白质组、分枝杆菌蛋白质组及其任何组合。在一些实施例中,分枝杆菌蛋白质组是结核分支杆菌(Mycobacterium tuberculosis)蛋白质组。
在一些实施例中,目的蛋白质组是寄生虫蛋白质组。在一些实施例中,寄生虫蛋白质组选自:疟原虫蛋白质组、刚地弓形虫蛋白质组、阴道毛滴虫蛋白质组、十二指肠贾第虫蛋白质组、隐孢子虫蛋白质组或其任何组合。在一些实施例中,疟原虫蛋白质组是恶性疟原虫蛋白质组、诺氏疟原虫蛋白质组、三日疟原虫蛋白质组、卵形疟原虫蛋白质组和/或间日疟原虫蛋白质组。
在一些实施例中,目的蛋白质组是过敏原。优选地,过敏原是花生、谷蛋白、乳糖、酪蛋白、脂质运载蛋白、c型溶菌酶、蛋白酶抑制剂、原肌球蛋白、小清蛋白、猫皮屑和/或狗皮屑。
在一些实施例中,目的化合物是一种或多种蛋白质或肽(例如α突触核蛋白、溶菌酶、牛血清白蛋白、卵清蛋白、β-乳球蛋白、胰岛素,胰高血糖素、淀粉样蛋白β、血管紧张素转换酶2、血管紧张素转换酶、缓激肽、脊索蛋白样蛋白1、肿瘤坏死因子β、骨调节蛋白前体、基质金属蛋白酶蛋白、多效生长因子、分泌粒蛋白-3、人生长激素、胰岛素样生长因子1、瘦蛋白、端粒酶、促甲状腺激素)、人蛋白质组(例如人血浆蛋白质组、人眼蛋白质组、视网膜、心脏、骨骼肌、平滑肌、肾上腺、甲状旁腺、甲状腺、垂体、肺、骨髓、淋巴组织、肝、胆囊、睾丸、附睾、前列腺、精囊、输精管、脂肪组织、脑、唾液腺、食道、舌、胃、肠、胰腺、肾、膀胱、乳房、阴道、子宫颈、子宫内膜、输卵管、卵巢、胎盘、皮肤、血液、人代谢蛋白质组、人分泌蛋白质组)、人亚蛋白质组(例如人癌亚蛋白质组,其选自:人胰腺癌蛋白质组、人神经胶质瘤亚蛋白质组、人头颈癌亚蛋白质组、人甲状腺癌亚蛋白质组、人肺癌亚蛋白质组、人肝癌亚蛋白质组、人睾丸癌亚蛋白质组、人前列腺癌亚蛋白质组、人胃癌亚蛋白质组、人结肠/直肠癌亚蛋白质组、人乳腺癌亚蛋白质组、人子宫内膜癌亚蛋白质组、人卵巢癌亚蛋白质组、人宫颈癌亚蛋白质组、人肾癌亚蛋白质组、人泌尿和膀胱癌亚蛋白质组、人黑素瘤亚蛋白质组),(或例如人I型糖尿病亚蛋白质组、人II型糖尿病亚蛋白质组、阿尔茨海默病亚蛋白质组、人帕金森氏病亚蛋白质组、人痴呆亚蛋白质组、人心血管疾病亚蛋白质组、人唐氏综合征亚蛋白质组、人衰老亚蛋白质组)、病毒蛋白质组(例如人乳头瘤病毒(HPV)蛋白质组、人免疫缺陷病毒(HIV)蛋白质组、正粘病毒科蛋白质组,诸如流感蛋白质组,诸如A型流感蛋白质组、A型流感亚型H1N1蛋白质组、B型流感蛋白质组、C型流感蛋白质组或D型流感蛋白质组、爱泼斯坦巴尔蛋白质组、埃博拉病毒蛋白质组、狂犬病毒属蛋白质组、冠状病毒属蛋白质组,诸如SARS-CoV-2(Covid-19)蛋白质组、SARS-CoV蛋白质组或MERS-CoV、诺如病毒蛋白质组、A型肝炎蛋白质组、B型肝炎蛋白质组、C型肝炎蛋白质组、E型肝炎蛋白质组、丁型肝炎蛋白质组、疱疹病毒蛋白质组、乳头瘤病毒蛋白质组、鼻病毒属蛋白质组、麻疹病毒蛋白质组、腮腺炎病毒蛋白质组、脊髓灰质炎病毒蛋白质组、狂犬病蛋白质组、轮状病毒蛋白质组、西尼罗病毒蛋白质组、黄热病病毒蛋白质组、寨卡病毒蛋白质组、有尾噬菌体目蛋白质组、线头病毒科蛋白质组、核糖病毒域蛋白质组、丝形病毒科蛋白质组、小纺锤形噬菌体科蛋白质组、疱疹病毒目蛋白质组、非洲猪瘟病毒科蛋白质组、双尾病毒科蛋白质组、结核病蛋白质组、牛结核病蛋白质组)、动物源性病毒蛋白质组、细菌蛋白质组(例如大肠杆菌(Escherichiacoli,E.coli)蛋白质组、铜绿假单胞菌(Pseudomonas aeruginosa,P.aeruginosa)蛋白质组、沙n氏菌蛋白质组、金黄色葡萄球菌蛋白质组、鲍氏不动杆菌蛋白质组、脆弱拟杆菌蛋白质组、洋葱伯克霍尔德菌蛋白质组、艰难梭菌蛋白质组、索氏梭菌蛋白质组、肠杆菌科蛋白质组、粪肠球菌蛋白质组、肺炎克雷伯氏菌蛋白质组、耐甲氧西林金黄色葡萄球菌蛋白质组、摩氏摩根氏菌蛋白质组、分枝杆菌蛋白质组诸如结核分枝杆菌蛋白质组)、寄生虫蛋白质组(例如疟原虫蛋白质组、刚地弓形虫蛋白质组、阴道毛滴虫蛋白质组、十二指肠贾第虫蛋白质组、隐孢子虫蛋白质组或其任何组合)。在一些实施例中,疟原虫蛋白质组是恶性疟原虫蛋白质组、诺氏疟原虫蛋白质组、三日疟原虫蛋白质组、卵形疟原虫蛋白质组或间日疟原虫蛋白质组)及其任何组合。
氨基酸类型
在该方法中,两种或更多种氨基酸类型被标记。
所有氨基酸具有共同的结构:羧酸、胺和具有R基团侧链的α碳。羧酸、胺和α碳为所有氨基酸类型所共有。在氨基酸链(肽、寡肽、多肽、蛋白质)中,肽键是一种类型的酰胺键,连接相邻的氨基酸。这些相邻的氨基酸已经经历缩合反应,其中一个氨基酸的非-侧链羧酸基团与另一个氨基酸的非-侧链胺基团反应。一个相邻的氨基酸从其羧基基团(COOH)失去氢和氧,并且另一个从其胺基团(NH
本发明涵盖的两种或更多种氨基酸类型包括每种氨基酸类型的修饰的和/或未修饰的氨基酸。这包括22种蛋白原性氨基酸类型的修饰的和/或未修饰的氨基酸和/或非蛋白原性或合成氨基酸。
本发明涵盖的两种或更多种氨基酸类型包括选自以下的22种蛋白原性氨基酸:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。
在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、酪氨酸(Y)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、脯氨酸(P)、天冬氨酸(D)、谷氨酸(E)、天冬酰胺(B)、谷氨酰胺(Q)、丝氨酸(S)和/或苏氨酸(T)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、脯氨酸(P)、天冬氨酸(D)、谷氨酸(E)、天冬酰胺(B)和/或谷氨酰胺(Q)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)和/或赖氨酸(K)及其任何组合。在一些实施例中,两种或更多种氨基酸选自:半胱氨酸(C)、精氨酸(R)、组氨酸(H)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、精氨酸(R)、组氨酸(H)和/或谷氨酸(E)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、精氨酸(R)、组氨酸(H)和/或谷氨酰胺(Q)或其修饰的类型及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、精氨酸(R)、色氨酸(W)和/或天冬氨酸(D)或其修饰的形式及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:赖氨酸(K)、精氨酸(R)、组氨酸(H)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:赖氨酸(K)、色氨酸(W)、精氨酸(R)和/或谷氨酸(E)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和/或谷氨酸(E)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和/或谷氨酸(E)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和/或谷氨酸(E)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:赖氨酸(K)、天冬酰胺(B)、色氨酸(W)和/或半胱氨酸(C)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、组氨酸(H)、脯氨酸(P)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或天冬氨酸(D)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或谷氨酸(E)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或色氨酸(W)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和/或酪氨酸(Y)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、组氨酸(H)和/或色氨酸(W)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、组氨酸(H)和/或半胱氨酸(C)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、赖氨酸(K)、组氨酸(H)和/或酪氨酸(Y)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、半胱氨酸(C)、色氨酸(W)和/或酪氨酸(Y)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:精氨酸(R)、半胱氨酸(C)、色氨酸(W)和/或脯氨酸(P)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:色氨酸(W)、半胱氨酸(C)和/或赖氨酸(K)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:赖氨酸(K)、色氨酸(W)和/或酪氨酸(Y)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:色氨酸(W)、酪氨酸(Y)和/或半胱氨酸(C)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:色氨酸(W)、酪氨酸(Y)和/或赖氨酸(K)及其任何组合。在一些实施例中,两种或更多种氨基酸类型选自:半胱氨酸(C)、色氨酸(W)和/或酪氨酸(Y)及其任何组合。在一些实施例中,两种氨基酸类型是亮氨酸(L)和丝氨酸(S)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和赖氨酸(K)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和谷氨酸(E)。在一些实施例中,两种酸类型是甘氨酸(G)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是丙氨酸(A)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是天冬氨酸(D)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和脯氨酸(P)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和缬氨酸(V)。在一些实施例中,两种氨基酸类型是赖氨酸(K)和丝氨酸(S)。在一些实施例中,两种氨基酸类型是谷氨酸(E)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是丙氨酸(A)和精氨酸(R)。在一些实施例中,两种氨基酸是丙氨酸(A)和谷氨酸(E)。在一些实施例中,两种氨基酸是丙氨酸(A)和甘氨酸(G)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是色氨酸(W)、半胱氨酸(C)和酪氨酸(Y)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是半胱氨酸(C)、酪氨酸(Y)和赖氨酸(K)。在一些实施例中,3种氨基酸类型被标记,并且该3种氨基酸类型是色氨酸(W)、半胱氨酸(C)和赖氨酸(K)。在一些实施例中,3种氨基酸类型被标记,并且该3种氨基酸类型是赖氨酸(K)、色氨酸(W)和酪氨酸(Y)。在一些实施例中,3种氨基酸类型被标记,并且该3种氨基酸类型是色氨酸(W)、酪氨酸(Y)和半胱氨酸(C)。在一些实施例中,3种氨基酸类型被标记,并且该3种氨基酸类型是色氨酸(W)、酪氨酸(Y)和赖氨酸(K)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:半胱氨酸(C)、色氨酸(W)和酪氨酸(Y)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:天冬酰胺(R)、谷氨酸(E)和甘氨酸(G)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和丝氨酸(S)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:天冬酰胺(A)、谷氨酸(E)和亮氨酸(L)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:丙氨酸(A)、天冬氨酸(D)和亮氨酸(L)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和脯氨酸(P)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:丙氨酸(A)、谷氨酸(E)和亮氨酸(L)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:亮氨酸(L)、丝氨酸(S)和缬氨酸(S)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:谷氨酸(E)、异亮氨酸(I)和脯氨酸(P)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:谷氨酸(E)、甘氨酸(G)和缬氨酸(V)。在一些实施例中,3种氨基酸类型被标记,并且标记的3种氨基酸类型是:精氨酸(R)、丝氨酸(S)和缬氨酸(V)。在一些实施例中,3种氨基酸类型被标记,并且标记的3个氨基酸类型是:丙氨酸(A)、亮氨酸(L)和赖氨酸(K)。在一些实施例中,3种氨基酸类型被标记,并且标记的3个氨基酸类型是:丙氨酸(A)、精氨酸(R)和亮氨酸(L)。在一些实施例中,3种氨基酸类型被标记,并且标记的3个氨基酸类型是:丙氨酸(A)、亮氨酸(L)和缬氨酸(V)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型选自由以下组成的组:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、吡咯赖氨酸(O)、硒代半胱氨酸(U)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)及其任何组合。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是色氨酸(W)、酪氨酸(Y)、赖氨酸(K)和半胱氨酸(C)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、组氨酸(H)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、组氨酸(H)和谷氨酸(E)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、组氨酸(H)和谷氨酰胺(Q)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是半胱氨酸(C)、精氨酸(R)、色氨酸(W)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是赖氨酸(K)、精氨酸(R)、组氨酸(H)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是赖氨酸(K)、色氨酸(W)、精氨酸(R)和谷氨酸(E)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是酪氨酸(Y)、赖氨酸(K)、半胱氨酸(C)和谷氨酸(E)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和谷氨酸(E)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是脯氨酸(P)、半胱氨酸(C)、精氨酸(R)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是半胱氨酸(C)、天冬酰胺(B)、精氨酸(R)和谷氨酸(E)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是赖氨酸(K)、天冬酰胺(B)、色氨酸(W)和半胱氨酸(C)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、组氨酸(H)、脯氨酸(P)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和天冬氨酸(D)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和谷氨酸(E)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和色氨酸(W)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、半胱氨酸(C)和酪氨酸(Y)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、组氨酸(H)和色氨酸(W)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、组氨酸(H)和半胱氨酸(C)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、赖氨酸(K)、组氨酸(H)和酪氨酸(Y)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、半胱氨酸(C)、色氨酸(W)和酪氨酸(Y)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、半胱氨酸(C)、色氨酸(W)和脯氨酸(P)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是谷氨酰胺(Q)、亮氨酸(L)、赖氨酸(K)和缬氨酸(V)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是精氨酸(R)、异亮氨酸(I)、亮氨酸(L)和丝氨酸(S)。在一些实施例中,4种氨基酸类型被标记,并且标记的4种氨基酸类型是丙氨酸(A)、天冬酰胺(N)、谷氨酸(E)和丝氨酸(S)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是精氨酸(R)、谷氨酸(E)、赖氨酸(K)、丝氨酸和谷氨酰胺(Q)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是精氨酸(R)、天冬氨酸(D)、赖氨酸(K)、丝氨酸和谷氨酰胺(Q)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是精氨酸(R)、甘氨酸(G)、赖氨酸(K)、丝氨酸和谷氨酰胺(Q)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是丙氨酸(A)、天冬氨酸(D)、甘氨酸(G)、丝氨酸和精氨酸(R)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是吡咯赖氨酸(O)、天冬氨酸(D)、甘氨酸(G)、丝氨酸和精氨酸(R)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是吡咯赖氨酸(O)、天冬氨酸(D)、硒代半胱氨酸(U)、丝氨酸和精氨酸(R)。在一些实施例中,5种氨基酸类型被标记,并且标记的5种氨基酸类型是吡咯赖氨酸(O)、天冬氨酸(D)、硒代半胱氨酸(U)、赖氨酸和精氨酸(R)。
氨基酸类型涵盖每种氨基酸类型的L(左旋)异构体和/或D(右旋)异构体。
在一些实施例中,两种或更多种标记的氨基酸类型包含氨基酸类型的修饰的氨基酸和/或未修饰的氨基酸。在一些实施例中,氨基酸类型包含氨基酸类型的未修饰的氨基酸。在一些实施例中,氨基酸类型的未修饰的氨基酸未经历翻译后修饰。在一些实施例中,氨基酸类型包含氨基酸类型的修饰的氨基酸。在一些实施例中,氨基酸类型的修饰的氨基酸已经经历翻译后修饰。在一些实施例中,氨基酸类型包含氨基酸类型的修饰的和未修饰的氨基酸。例如,氨基酸类型半胱氨酸(C)可以包含未修饰的半胱氨酸氨基酸(C
在一些实施例中,氨基酸类型丙氨酸(A)是指未修饰的丙氨酸氨基酸、修饰的丙氨酸氨基酸和/或修饰的和未修饰的丙氨酸氨基酸的组合。在一些实施例中,氨基酸类型精氨酸(R)是指未修饰的精氨酸氨基酸、修饰的精氨酸氨基酸和/或修饰的和未修饰的精氨酸氨基酸的组合。在一些实施例中,氨基酸类型天冬酰胺(N)是指未修饰的天冬酰胺氨基酸、修饰的天冬酰胺氨基酸和/或修饰的和未修饰的天冬酰胺氨基酸的组合。在一些实施例中,氨基酸类型天冬氨酸(D)是指未修饰的天冬氨酸氨基酸、修饰的天冬氨酸氨基酸和/或修饰的和未修饰的天冬氨酸氨基酸的组合。在一些实施例中,氨基酸类型半胱氨酸(C)是指未修饰的半胱氨酸氨基酸、修饰的半胱氨酸氨基酸和/或修饰的和未修饰的半胱氨酸氨基酸的组合。在一些实施例中,氨基酸类型谷氨酸(E)是指未修饰的谷氨酸氨基酸、修饰的谷氨酸氨基酸和/或修饰的和未修饰的谷氨酸氨基酸的组合。在一些实施例中,氨基酸类型谷氨酰胺(Q)是指未修饰的谷氨酰胺氨基酸、修饰的谷氨酰胺氨基酸和/或修饰的和未修饰的谷氨酰胺氨基酸的组合。在一些实施例中,氨基酸类型甘氨酸(G)是指未修饰的甘氨酸氨基酸、修饰的甘氨酸氨基酸和/或修饰的和未修饰的甘氨酸氨基酸的组合。在一些实施例中,氨基酸类型组氨酸(H)是指未修饰的组氨酸氨基酸、修饰的组氨酸氨基酸和/或修饰的和未修饰的组氨酸氨基酸的组合。在一些实施例中,氨基酸类型异亮氨酸(I)是指未修饰的异亮氨酸氨基酸、修饰的异亮氨酸氨基酸和/或修饰的和未修饰的异亮氨酸氨基酸的组合。在一些实施例中,氨基酸类型亮氨酸(L)是指未修饰的亮氨酸氨基酸、修饰的亮氨酸氨基酸和/或修饰的和未修饰的亮氨酸氨基酸的组合。在一些实施例中,氨基酸类型赖氨酸(K)是指未修饰的赖氨酸氨基酸、修饰的赖氨酸氨基酸和/或修饰的和未修饰的赖氨酸氨基酸的组合。在一些实施例中,氨基酸类型甲硫氨酸(M)是指未修饰的甲硫氨酸氨基酸、修饰的甲硫氨酸氨基酸和/或修饰的和未修饰的甲硫氨酸氨基酸的组合。在一些实施例中,氨基酸类型苯丙氨酸(F)是指未修饰的苯丙氨酸氨基酸、修饰的苯丙氨酸氨基酸和/或修饰的和未修饰的苯丙氨酸氨基酸的组合。在一些实施例中,氨基酸类型吡咯赖氨酸(O)是指未修饰的吡咯赖氨酸氨基酸、修饰的吡咯赖氨酸氨基酸和/或修饰的和未修饰的吡咯赖氨酸氨基酸的组合。在一些实施例中,氨基酸类型脯氨酸(P)是指未修饰的脯氨酸氨基酸、修饰的脯氨酸氨基酸和/或修饰的和未修饰的脯氨酸氨基酸的组合。在一些实施例中,氨基酸类型硒代半胱氨酸(U)是指未修饰的硒代半胱氨酸氨基酸、修饰的硒代半胱氨酸氨基酸和/或修饰的和未修饰的硒代半胱氨酸氨基酸的组合。在一些实施例中,氨基酸类型丝氨酸(S)是指未修饰的丝氨酸氨基酸、修饰的丝氨酸氨基酸和/或修饰的和未修饰的丝氨酸氨基酸的组合。在一些实施例中,氨基酸类型苏氨酸(T)是指未修饰的苏氨酸氨基酸、修饰的苏氨酸氨基酸和/或修饰的和未修饰的苏氨酸氨基酸的组合。在一些实施例中,氨基酸类型色氨酸(W)是指未修饰的色氨酸氨基酸、修饰的色氨酸氨基酸和/或修饰的和未修饰的色氨酸氨基酸的组合。在一些实施例中,氨基酸类型酪氨酸(Y)是指未修饰的酪氨酸氨基酸、修饰的酪氨酸氨基酸和/或修饰的和未修饰的酪氨酸氨基酸的组合。在一些实施例中,氨基酸类型缬氨酸(V)是指未修饰的缬氨酸氨基酸、修饰的缬氨酸氨基酸和/或修饰的和未修饰的缬氨酸氨基酸的组合。
在优选的实施例中,R基团与表3中公开的特定染料的反应性定义了,如果氨基酸类型内的氨基酸已经历翻译后修饰,则标记反应将标记未经历翻译后修饰的该氨基酸类型内的氨基酸(未修饰的氨基酸),或还将标记已经历翻译后修饰的该氨基酸类型内的氨基酸(修饰的氨基酸)。例如,本领域技术人员将理解,如果标记反应涉及亲核R基团,诸如赖氨酸伯胺,对亲电染料的攻击,则如果赖氨酸已经被翻译后修饰使得其不再具有亲核伯胺,则标记反应将不进行。作为另一实例,本领域技术人员将理解,如果标记反应涉及与色氨酸吲哚R基团和三氯乙醇(TCE)的自由基反应,则如果色氨酸吲哚R基团被单氧化成包含羟基基团,则该反应不被抑制。应用这些原则,无论本文讨论的标记是标记未修饰的氨基酸还是标记已经历可用于氨基酸类型的翻译后修饰的几乎修饰的氨基酸,在下表(表1)中提供。如果标记反应仅标记具有指定翻译后修饰的未修饰的指定氨基酸类型内的氨基酸,则标记栏中示出“未修饰的”。如果标记反应也将标记具有指定的翻译后修饰的修饰的指定氨基酸类型内的氨基酸,则在标记栏中示出“未修饰的+修饰的”)。
表1:标记每种氨基酸类型的修饰的和/或未修饰的氨基酸
/>
在一些实施例中,如果用户希望,该用户可以通过将氨基酸类型的修饰的氨基酸(例如通过化学修饰)转变为未修饰的氨基酸以使得能够检测氨基酸类型的修饰的和未修饰的氨基酸两者来选择是否仅标记氨基酸类型的未修饰的和/或未修饰的+修饰的形式。例如,当修饰的和未修饰的半胱氨酸氨基酸的组合被标记时,修饰的氨基酸(C
半胱氨酸二硫化物(C
在一些实施例中,术语半胱氨酸(C)是指未修饰的半胱氨酸氨基酸,即还原的半胱氨酸(C
半胱氨酸的未修饰的氨基酸,即还原的半胱氨酸(C
具有可以被标记的不同R基团的任何其它氨基酸类型同样可以用作本发明的一部分。例如,本发明涵盖的两种或更多种氨基酸类型也包括合成氨基酸类型。合成氨基酸类型是天然存在的或化学合成的非蛋白原性氨基酸。本发明涵盖的合成氨基酸类型包括含有以下官能团的氨基酸类型:叠氮化物、炔烃、烯烃、环辛炔、二烯、酰基、碘、硼酸、双吖丙啶、环辛烯、环氧化物、环丙烷、生物素、亲二烯体、磺酸、亚磺酸、生物素、肟、硝酮、降冰片烯、四氮烯、四唑、四环烷、贫电子π体系、富电子π体系、卤素、NHS酯、马来酰亚胺和/或重氮基及其任何组合。并入这些官能团代替天然官能团。此外,本发明涵盖的合成氨基酸类型还包括具有附加或附接到氨基酸类型的天然官能团上的合成取代基的氨基酸类型。例如,本发明涵盖色氨酸氨基酸,其已经被合成修饰以在其吲哚环上含有降冰片烯。在一些实施例中,当合成取代基附加或附接至氨基酸类型的天然官能团时,该并入发生在本文所公开的标记反应之前。
标记两种或更多种氨基酸类型
在样本中标记两种或更多种氨基酸类型的氨基酸。
在一些实施例中,标记反应对每种氨基酸类型是特异的。完整的蛋白质分子内含有每种氨基酸类型内的所有氨基酸。这允许仅与完整蛋白质链内目的氨基酸类型反应,而不需要将蛋白质链水解成单个氨基酸或将蛋白质链蛋白水解消化成仅含有完整蛋白质链内所含的一种或一部分氨基酸类型的片段。这类似于抗体如何仅与目的蛋白质反应,即使溶液内也存在其它非目的蛋白质。由于标记和氨基酸类型的互补化学反应性,因此标记仅与目的氨基酸类型反应。在一些实施例中,每个标记仅与一种氨基酸类型反应。在一些实施例中,每个标记与一种或两种氨基酸类型反应。在一些实施例中,每个标记与一种、两种或三种氨基酸类型反应。例如,标记邻马来酰亚胺-氟硼二吡咯对半胱氨酸(C)氨基酸类型是特异的,因为只有限定半胱氨酸(C)R基团的硫醇可以与马来酰亚胺部分反应。这是因为硫醇是“软”亲核试剂并且优先与“软”亲电试剂诸如马来酰亚胺反应。
在一些实施例中,每种氨基酸类型具有用于鉴定的不同标记。例如,如果5种氨基酸类型被标记,则存在5种不同的标记。如果2种氨基酸类型被标记,则存在2种不同的标记。例如,用第一标记来标记氨基酸类型K的氨基酸,并且用不同于第一标记的第二标记来标记氨基酸类型W的氨基酸。
在一些实施例中,2种氨基酸类型被标记。在一些实施例中,3种氨基酸类型被标记。在一些实施例中,4种氨基酸类型被标记。在一些实施例中,5种氨基酸类型被标记。在一些实施例中,6种氨基酸类型被标记。在一些实施例中,7种氨基酸类型被标记。在一些实施例中,8种氨基酸类型被标记。在一些实施例中,9种氨基酸类型被标记。在一些实施例中,10种氨基酸类型被标记。在一些实施例中,11种氨基酸类型被标记。在一些实施例中,12种氨基酸类型被标记。在一些实施例中,13种氨基酸类型被标记。在一些实施例中,14种氨基酸类型被标记。在一些实施例中,15种氨基酸类型被标记。在一些实施例中,16种氨基酸类型被标记。在一些实施例中,17种氨基酸类型被标记。在一些实施例中,18种氨基酸类型被标记。在一些实施例中,19种氨基酸类型被标记。在一些实施例中,20种氨基酸类型被标记。在一些实施例中,21种氨基酸类型被标记。在一些实施例中,22种氨基酸类型被标记。在一些实施例中,23种氨基酸类型被标记。在一些实施例中,24种氨基酸类型被标记。在一些实施例中,25种氨基酸类型被标记。在一些实施例中,26种氨基酸类型被标记。在一些实施例中,27种氨基酸类型被标记。在一些实施例中,28种氨基酸类型被标记。在一些实施例中,29种氨基酸类型被标记。在一些实施例中,30种氨基酸类型被标记。在一些实施例中,31种氨基酸类型被标记。在一些实施例中,32种氨基酸类型被标记。在一些实施例中,33种氨基酸类型被标记。在一些实施例中,34种氨基酸类型被标记。在一些实施例中,35种氨基酸类型被标记。在一些实施例中,36种氨基酸类型被标记。在一些实施例中,37种氨基酸类型被标记。在一些实施例中,38种氨基酸类型被标记。在一些实施例中,39种氨基酸类型被标记。在一些实施例中,40种氨基酸类型被标记。在一些实施例中,2、3、4或5种氨基酸类型被标记。在一些实施例中,4或5种氨基酸类型被标记。在一些实施例中,3或4种氨基酸类型被标记。在一些实施例中,2种氨基酸类型被标记。
在一些实施例中,2种标记的氨基酸类型选自:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)或赖氨酸(K)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和丝氨酸(S)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和赖氨酸(K)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和谷氨酸(E)。在一些实施例中,两种酸类型是甘氨酸(G)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是丙氨酸(A)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是天冬氨酸(D)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和脯氨酸(P)。在一些实施例中,两种氨基酸类型是亮氨酸(L)和缬氨酸(V)。在一些实施例中,两种氨基酸类型是赖氨酸(K)和丝氨酸(S)。在一些实施例中,两种氨基酸类型是谷氨酸(E)和亮氨酸(L)。在一些实施例中,两种氨基酸类型是丙氨酸(A)和精氨酸(R)。在一些实施例中,两种氨基酸是丙氨酸(A)和谷氨酸(E)。在一些实施例中,两种氨基酸是丙氨酸(A)和甘氨酸(G)。
在一些实施例中,3种标记的氨基酸类型选自:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)或赖氨酸(K)。在一些实施例中,标记的3种氨基酸类型是:色氨酸(W)、半胱氨酸(C)和赖氨酸(K)。在一些实施例中,标记的3种氨基酸类型是:赖氨酸(K)、色氨酸(W)和酪氨酸(Y)。在一些实施例中,标记的3种氨基酸类型是:色氨酸(W)、酪氨酸(Y)和半胱氨酸(C)。在一些实施例中,标记的3种氨基酸类型是:色氨酸(W)、酪氨酸(Y)和赖氨酸(K)。在一些实施例中,标记的3种氨基酸类型是:半胱氨酸(C)、色氨酸(W)和酪氨酸(Y)。在一些实施例中,标记的3种氨基酸类型是:天冬酰胺(R)、谷氨酸(E)和甘氨酸(G)。在一些实施例中,标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和丝氨酸(S)。在一些实施例中,标记的3种氨基酸类型是:天冬酰胺(A)、谷氨酸(E)和亮氨酸(L)。在一些实施例中,标记的3种氨基酸类型是:标记的3种氨基酸类型是:丙氨酸(A)、天冬氨酸(D)和亮氨酸(L)。在一些实施例中,标记的3种氨基酸类型是:标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和脯氨酸(P)。在一些实施例中,标记的3种氨基酸类型是:丙氨酸(A)、谷氨酸(E)和亮氨酸(L)。在一些实施例中,标记的3种氨基酸类型是:亮氨酸(L)、丝氨酸(S)和缬氨酸(S)。在一些实施例中,标记的3种氨基酸类型是:谷氨酸(E)、异亮氨酸(I)和脯氨酸(P)。在一些实施例中,标记的3种氨基酸类型是:谷氨酸(E)、甘氨酸(G)和缬氨酸(V)。在一些实施例中,标记的3种氨基酸类型是:精氨酸(R)、丝氨酸(S)和缬氨酸(V)。在一些实施例中,标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和赖氨酸(K)。在一些实施例中,标记的3种氨基酸类型是:丙氨酸(A)、精氨酸(R)和亮氨酸(L)。在一些实施例中,标记的3种氨基酸类型是:丙氨酸(A)、亮氨酸(L)和缬氨酸(V)。
在一些实施例中,标记的4种氨基酸类型是:色氨酸(W)、酪氨酸(Y)和赖氨酸(K)以及半胱氨酸(C),其中半胱氨酸的修饰的和未修饰的氨基酸的组合被标记。在一些实施例中,标记的4种氨基酸类型是:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)和赖氨酸(K),其中还原的半胱氨酸(C
每种氨基酸类型是指该氨基酸类型的修饰的和/或未修饰的氨基酸。优选地,一旦修饰的氨基酸被还原,则氨基酸半胱氨酸(C)指未修饰的氨基酸(C
在一些实施例中,标记的5种氨基酸类型是:色氨酸(W)、半胱氨酸(C)、酪氨酸(Y)和赖氨酸(K),其中还原的半胱氨酸(C
在一些实施例中,两种或更多种氨基或更多种酸类型可以用相同的标记来标记,并且对于每种氨基酸类型独立地鉴定该标记。例如,用与氨基酸类型Y的氨基酸相同的标记来标记氨基酸类型W的氨基酸,并且将氨基酸类型W的标记独立地鉴定为氨基酸类型Y的标记。在一些实施例中,当两种氨基酸类型用相同的标记来标记时,用于检测标记的参数是不同的。例如,一种氨基酸类型的标记与第二种氨基酸类型的标记解卷积。例如,色氨酸(W)和酪氨酸(Y)的氨基酸类型都可以用相同的荧光标记来标记,但是色氨酸(W)标记的荧光强度与酪氨酸(Y)标记的荧光强度解卷积。在一些实施例中,色氨酸(W)和酪氨酸(Y)的氨基酸类型均用相同的荧光染料标记,但用于测量来自荧光染料的色氨酸(W)信号的激发和发射波长不同于用于测量来自荧光染料的酪氨酸(Y)信号的激发和发射波长参数。在一些实施例中,色氨酸(W)和酪氨酸(Y)的氨基酸类型均用相同的荧光染料标记,但用于测量来自荧光染料的色氨酸(W)信号的激发和发射波长不同于用于测量来自荧光染料的酪氨酸(Y)和色氨酸(W)信号的激发和发射波长。在一些实施例中,酪氨酸(Y)信号是根据总色氨酸(w)和酪氨酸(Y)信号减去色氨酸信号(W)测量的。
在一些实施例中,两种或更多种氨基酸类型可以用相同的标记来标记(例如反应),但标记(例如反应)在不同的条件下进行。在一些实施例中,多步骤标记过程允许相同的标记特异性地仅与一种氨基酸类型反应。例如,甲硫氨酸(M)和苯丙氨酸(F)氨基酸类型可以与相同的标记,带有叠氮化物反应性基团的染料,反应。标记反应涉及铜(I)-催化的叠氮化物-炔烃环加成(CuAAC),也称为“点击化学”。甲硫氨酸(M)或苯丙氨酸(F)氨基酸类型的标记反应的第一步是将炔烃基团引入到甲硫氨酸(M)或苯丙氨酸(F)R基团上,随后在标记反应的第二步中与染料上的叠氮化物反应。该第一步在仅与甲硫氨酸(M)氨基酸类型或仅与苯丙氨酸(F)氨基酸类型反应特异的条件下进行。以这种方式,相同的标记(例如染料)可以特异性地与多于一种氨基酸类型反应,使得在反应条件下仅所需的氨基酸类型被标记。
在一些实施例中,所有被标记的两种或更多种氨基酸类型在整个样本内被标记。在一些实施例中,在标记反应之前不将样本分离成多个单个级分。例如,提供尿样本并且在尿样本中标记氨基酸类型W、Y和K,而不将样本分离成多个单个级分,并且在单独的级分中分别标记W、Y和K。例如,单个蛋白质分子将具有所有在分子内被标记的两种或更多种氨基酸类型。在一些实施例中,所有被标记的氨基酸类型在一个级分中被标记。在该实施例中,选择对一种氨基酸类型特异的每种氨基酸类型的标记,使得它不与另一种氨基酸类型交叉反应。在一些实施例中,标记的选择取决于待修饰的氨基酸类型的化学性质。例如,当赖氨酸和色氨酸在相同的级分中被标记时,标记化学不会相互干扰,并且连接到色氨酸的染料的信号可与连接到赖氨酸的染料的信号分离,即在荧光强度的情况下不同的激发和发射波长。
在一些实施例中,在标记反应之前将样本分离成多个级分。因为未水解或消化的完整蛋白质分子内含有每种氨基酸类型的氨基酸,所以一种蛋白质分子含有许多氨基酸类型,并且因此一种级分含有许多氨基酸类型。当样本被分离成多个级分时,在每个级分中进行不同的标记反应,其特异性地标记目的氨基酸类型。在一些实施例中,每个级分含有相等的体积。在该实施例中,每个级分被标记。例如,在标记前将样本分离成两个级分,并且标记4种氨基酸类型;其中在一个级分中标记两种氨基酸类型,并且在第二个级分中标记两种替代氨基酸类型。例如,标记的样本中的4种氨基酸类型是W、K、Y和C,其中C是C
在一些实施例中,如果两种氨基酸类型具有相同的标记,则在不同的级分中标记和测量它们。例如,在一些实施例中,在不同的级分中标记和测量氨基酸类型W和Y。在一些实施例中,如果预测第一氨基酸类型的标记与第二氨基酸类型的标记交叉反应,则将第一和第二氨基酸类型分离成单独的级分。第一个级分与样本内特异于第一氨基酸类型的标记反应,并且第二个级分与样本内特异于第二氨基酸类型的标记反应。这避免了标记的交叉反应。
在一些实施例中,用不与样本中的另一荧光染料或氨基酸类型交叉反应的荧光染料将待标记的两种或更多种氨基酸类型分离成级分。
在一些实施例中,标记样本中两种或更多种氨基酸类型的所有氨基酸,即每个氨基酸。在一些实施例中,标记样本中两种或更多种氨基酸类型中的每一种的每个氨基酸(即所有氨基酸)。例如,如果氨基酸类型色氨酸被标记,则标记样本中存在的每个色氨酸氨基酸。在一些实施例中,标记样本中两种或更多种氨基酸类型中的每一种的每个氨基酸(即所有氨基酸)。例如,如果待标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则标记样本中的每个,即所有,色氨酸(W)氨基酸并且标记样本中的每个,即所有,赖氨酸(K)氨基酸。在另一实例中,如果待标记的两种或更多种氨基酸类型是色氨酸(W)、赖氨酸(K)和酪氨酸(Y),则标记样本中的每个,即所有,色氨酸(W)氨基酸,标记样本中的每个,即所有,赖氨酸(K)氨基酸,并且标记样本中的每个,即所有,酪氨酸(Y)氨基酸。
在一些实施例中,标记样本中两种或更多种氨基酸类型的一定比例的氨基酸(即不是所有氨基酸)。在一些实施例中,标记样本中两种或更多种氨基酸类型中的每一种的一定比例的氨基酸(即不是所有氨基酸)。例如,如果氨基酸类型色氨酸被标记,则标记样本中存在的一定比例的色氨酸氨基酸。例如,如果待标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则标记样本中一定比例的色氨酸(W)氨基酸,并且标记样本中一定比例的赖氨酸(K)氨基酸。如果待标记的两种或更多种氨基酸类型是色氨酸(W)、赖氨酸(K)和酪氨酸(Y),则标记样本中一定比例的色氨酸(W)氨基酸,标记样本中一定比例的赖氨酸(K)氨基酸,并且标记样本中一定比例的酪氨酸(Y)氨基酸。优选地,在样本内标记两种或更多种氨基酸类型中的每一种的约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%,或79%、80%、81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸。在一些实施例中,使用质谱确定样本内标记的氨基酸类型的氨基酸的比例。在一些实施例中,标记样本内所含的蛋白质组或亚蛋白质组中两种或更多种氨基酸类型的一定比例的氨基酸(即不是所有氨基酸)。
在一些实施例中,标记一种氨基酸类型的每个(即所有)氨基酸,并且标记另一种氨基酸类型的一定比例的氨基酸。例如,如果待标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则标记样本中所有色氨酸(W)氨基酸和样本中90%的赖氨酸(K)氨基酸。替代地,标记样本中90%的色氨酸(W)氨基酸和所有赖氨酸(K)氨基酸。
在一些实施例中,在样本内标记两种或更多种氨基酸类型内的氨基酸的R基团。每种氨基酸类型的R基团对于每种氨基酸类型是独特的。例如,色氨酸(W)的R基团不同于赖氨酸(K)的R基团。表2中提供了每种氨基酸类型特有的R基团。标记样本中的两种或更多种氨基酸类型。在一些实施例中,标记待标记的所选氨基酸类型的每个氨基酸(即所有氨基酸)。在一些实施例中,标记氨基酸类型的每个氨基酸(即所有氨基酸)的R基团。在一些实施例中,标记一定比例的氨基酸类型(即不是每个氨基酸)。在一些实施例中,氨基酸类型的一定比例的氨基酸(即不是所有氨基酸)的R基团被标记。在一些实施例中,标记氨基酸类型的每个氨基酸(即所有氨基酸),并且标记一定比例的第二氨基酸类型(即不是所有氨基酸)。在一些实施例中,标记第一氨基酸类型的每个氨基酸(即所有氨基酸)的R基团,并且标记第二氨基酸类型的一定比例的氨基酸(即不是所有氨基酸)的R基团。
优选地,标记选自以下的两种或更多种氨基酸类型中的每一种的R基团:W、C、Y或K。优选地,针对C标记的R基团是还原的半胱氨酸(C
在优选的实施例中,标记两种或更多种氨基酸类型,并且在样本中标记氨基酸类型中的每一种的R基团(即标记两种或更多种类型的R基团)。R基团的两种或更多种氨基酸类型对应于两种或更多种氨基酸类型。例如,当色氨酸和赖氨酸是被标记的两种氨基酸类型时,样本中色氨酸的R基团和赖氨酸的R基团被标记。在一些实施例中,标记2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22种氨基酸类型中的每一种的R基团。在一些实施例中,标记的3个氨基酸R基团是选自以下的3种氨基酸类型中的每一种的R基团:C、W和Y,其中C是未修饰的C氨基酸(C
在一些实施例中,针对每种氨基酸类型标记一个氨基酸R基团。例如,针对氨基酸类型色氨酸标记每个色氨酸氨基酸上的吲哚R基团。在另一实例中,针对氨基酸类型赖氨酸标记每个赖氨酸氨基酸上的ε-氨基R基团。表2列出了每种氨基酸类型的R基团。
表2:每个氨基酸类型的R基团
在优选的实施例中,样本内的两种或更多种氨基酸类型被荧光标记、同位素标记或使用质量标签标记。替代地,用核苷酸标记样本内的两种或更多种氨基酸类型。在一些实施例中,每种氨基酸类型的R基团被荧光标记、同位素标记或使用质量标签标记。在一些实施例中,用核苷酸标记每个氨基酸的R基团。
在一些实施例中,一种氨基酸用一种类型的标记来标记,并且另一种氨基酸类型用另一种类型的标记来标记。例如,一种氨基酸类型用荧光标记来标记,并且第二种氨基酸类型用串联质量标签来标记。
在一些实施例中,标记是荧光标记。在一些实施例中,荧光标记是荧光染料、荧光标签、荧光探针或荧光蛋白。在一些实施例中,荧光标记包括荧光团。在一些实施例中,荧光团选自由以下组成的组:羟基香豆素、氨基香豆素、甲氧基香豆素、瀑布蓝(Cascade Blue)、太平洋蓝、太平洋橙、荧光黄、NBD、R-藻红蛋白(PE)、PE-Cy5共轭物、PE-Cy7共轭物、红613、PerCP、TruRed、FluorX、氟硼二吡咯-FL(BODIPY-FL)、G-染料100、G-染料200、G一染料300、G-染料400、Cy2、Cy3、Cy3B、Cy3.5、Cy5、Cy5.5、Cy7、TRITC、X-罗丹明(X-Rhodamine)、丽丝胺罗丹明B、德克萨斯红、别藻蓝蛋白(APC)、APC-Cy7共轭物、DAPI、赫斯特(Hoechst)33258、SYTOX蓝、色霉素A3、光神霉素、YOYO-1、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 550、ATTO 565、ATTO Rho3B、ATTORho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO Rho13、ATTO 594、ATTO610、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTOOxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740、亮紫421、亮紫510、亮紫570、亮紫605、亮紫650、亮紫711、亮紫750、亮紫785、TM-BDP、KFL-1、KFL-2、KFL-3、KFL-4、超亮(Super Bright)436、超亮600、超亮645、超亮702、超亮780、Alexa Flour 350、Alexa Flour405、Alexa Flour 488、Alexa Flour 532、Alexa Flour 546、Alexa Flour 555、AlexaFlour 568、Alexa Flour 594、Alexa Flour 647、Alexa Flour 680、Alexa Flour 850、香豆素、太平洋绿、俄勒冈绿(Oregon Green)、荧光素(FITC)、PE-青色素7、PerCP-青色素5.5、四甲基罗丹明(Tetramethylrhodamine,TRITC)、eFlour 450、eFlour506、eFlour660、PE-eFlour 610、PerCP-eFlour 710、APC-eFlour 780、超亮436、超亮600、超亮645、超亮702、超亮780、DAPI、SYTOX绿、SYTO 9、TO-PRO-3、Qdot 525、Qdot 565、Qdot 605、Qdot 655、Qdot705、Qdot 800、R-藻红素(R-PE)、VioBlue、VioGreen、VioBright 515、Vio 515、VioBrightFITC、PE、PE-Vio 615、PerCP、PerCP-Vio 700、PE-Vio 770、APC、APC-Vio 770、1,8-萘酰亚胺、噻唑橙、CyTRAK橙、LDS 751、7-AAD、SYT0X橙、T0TO-3、TO-PRO-3、DRAQ5、DRAQ7、Indo-1、Fluo-3、Fluo-4、DCFH、DHR、SNARF、CFP、GFP(emGFP)、RFP(tagRFP)、GFP(Y66H突变)、GFP(Y66F突变)、EBFP、EBFP2、蓝铜矿、GFPuv、T-天蓝色、mCerulean、mCerulean3mCFP、mTurquoise2、ECFP、CyPet、GFP(Y66W突变)、mKeima-红、TagCFP、AmCyan1、mTFP1、GFP(S65A突变)、Midoriishi青色、野生型GFP、GFP(S65C突变)、TurboGFP、TagGFP、GFP(S65L突变)、翠绿色、GFP(S65T突变)、EGFP、Azami绿、ZsGreen1、TagYFP、EYFP、Topaz、Venus、mCitrine、YPet、TurboYFP、ZsYellow1、Kusabira橙、亮橘色(mOrange)、别藻蓝素(APC)、mKO、TurboRFP、tdTomato、TagRFP、DsRed单体、DsRed2(“RFP”)、mStrawberry、TurboFP602、AsRed2、mRFP1、J-红、R-藻红蛋白(RPE)、B-藻红蛋白(BPE)、mCherry、HcRedl、Katusha、P3、多甲藻素叶绿素(PerCP)、mKate(TagFP635)、TurboFP635、mPlum或mRaspberry。
在一些实施例中,荧光标签或荧光标记不是荧光染料。在一些实施例中,荧光标签或荧光标记还包括对定义氨基酸类型的R基团特异的反应性基团。以这种方式,荧光标记靶向特定的氨基酸类型。在一些实施例中,标记目的氨基酸类型是共价标记目的氨基酸类型。在一些实施例中,反应性基团允许选择性共价标记目的氨基酸类型的R基团。在一些实施例中,反应性基团选自由以下组成的组:NHS-酯、马来酰亚胺、炔烃、叠氮化物、溴化物、氯化物、氟化物、碘化物、芳基溴化物、芳基氯化物、芳基氟化物、芳基碘化物、二烯、亲二烯体、烯烃、四嗪、环辛炔、生物素、链霉抗生物素蛋白、异硫氰酸酯、活性酯、磺酰氯、二醛、碘乙酰胺、乙二胺、氨基吖啶酮、酰肼、羧基或烷氧基胺。例如,本领域技术人员将理解,亲电子马来酰亚胺基团选择性地靶向亲核半胱氨酸硫醇残基。因此,可以选择上面列出的任何荧光团并且与马来酰亚胺反应性基团偶联,以选择性标记半胱氨酸硫醇残基。例如,可以用包含超亮436和马来酰亚胺反应性基团的荧光标记来标记半胱氨酸硫醇残基。作为另一实例,本领域技术人员将理解不稳定的NHS酯基团选择性靶向赖氨酸伯胺R基团,并且可以与赖氨酸伯胺R基团进行共价SN2反应。因此,赖氨酸残基可以用Cy5的NHS-酯形式标记。这些标记方法是本领域技术人员所理解的,并且所公开的荧光团的指定反应性形式是可商购的。
在一些实施例中,荧光标记是靶向氨基酸类型的荧光染料或在与氨基酸类型反应时仅变成发荧光的分子。优选地,荧光染料仅在与蛋白质内的特定氨基酸类型共价反应后才变成发荧光。在这种情况下,不需要将荧光团与反应性基团偶联,因为在荧光染料或分子仅在与氨基酸类型反应时变成发荧光的情况下,对氨基酸类型的选择性已经建立在荧光染料或分子的化学结构中,该荧光染料或分子仅在与氨基酸类型反应时变成发荧光。在一些实施例中,靶向氨基酸类型的荧光染料或仅在与氨基酸类型反应后变成发荧光的分子选自由以下组成的组:4-氟-7-氨磺酰基苯并呋喃(ABD-F)、2,2,2-三氯乙醇(TCE)和/或邻苯二甲醛(OPA),或其混合物。优选地,针对每种氨基酸类型或表2和表3中的R基团选择荧光染料。然而,该列表是非排他性的,并且也可以使用在与本领域已知的氨基酸类型反应时变成发荧光的任何其它荧光染料或分子。本领域技术人员将理解,用高量子产率荧光或非荧光标记来标记可以允许鉴定样本内极低浓度的蛋白质,诸如在单分子水平。这对应于1pM至1nM的蛋白质浓度。
在一些实施例中,氨基酸类型与在与该氨基酸类型反应后变成发荧光的分子反应,或将已经发荧光的氨基酸类型的荧光转移到可见光谱中。例如,在一些实施例中,在与氨基酸类型反应后变成发荧光的分子是卤代化合物。在一些实施例中,卤代化合物是三氯乙酸、三氯甲烷、三氟乙醇、三氟乙酸、三氟甲烷、三溴乙醇、三溴乙酸、三溴甲烷、三碘乙醇、三碘乙酸或三碘甲烷。在一些实施例中,在Rh2(OAc)4、tBuHNOH的存在下,用三氯乙醇三氯乙醇(TCE)、三氯乙酸(TCA)、三氯甲烷、三氟乙醇(TFE)、三氟乙酸(TFA)、三氟甲烷、三溴乙醇、三溴乙酸(TBA)、三溴甲烷、三碘乙醇(TIE)或三碘乙酸(TIA)、三碘甲烷或用2-(2-(2-甲氧基乙氧基)乙氧基)乙基(E)-2-重氮基-4-苯基丁-3-烯酸酯标记氨基酸类型色氨酸(W)和/或酪氨酸(Y)。在一些实施例中,用三氯乙醇(TCE),或使用[RhCl(PPh3)3]、R2P(OAr)、Ar-Br、CsCO3在酪氨酸羟基基团邻位引入芳基基团来标记氨基酸类型Y。
本领域技术人员容易理解如何可以标记氨基酸。
在一些实施例中,基于与氨基酸类型的特异相互作用选择标记。例如,该标记是荧光染料并且基于与氨基酸类型的特异相互作用来选择,其中染料仅在其与特异氨基酸类型反应后变成发荧光(即其信号仅变成可检测的)。在一些实施例中,标记的选择取决于待修饰的氨基酸类型的化学性质。在一些实施例中,对于与氨基酸类型的特异反应,在氨基酸类型上存在反应性基团并且在标记上存在反应性基团,该反应性基团仅彼此反应。这由氨基酸类型上的R基团和标记上的反应性基团的特异化学反应性确定。例如,ABD-F在芳族系统上的不稳定位置处含有卤素并且易受亲电芳香族取代的影响。存在几种亲核氨基酸类型(例如半胱氨酸、赖氨酸、组氨酸),但是半胱氨酸氨基酸类型(C)是最强的亲核试剂,因为它是最可极化的。由于电子云更易可极化,亲核攻击的活化能降低。因此,ABD-F优先与半胱氨酸(C)残基反应,并且不与需要较高活化能的其它氨基酸类型诸如赖氨酸或组氨酸氨基酸类型反应。
在一些实施例中,标记反应是荧光反应。这意味着仅在与氨基酸类型反应后生成荧光,使得不需要从样本中纯化未反应的标记。
在一些实施例中,荧光反应涉及从淬灭反应的荧光团中去除基团。例如,已知当马来酰亚胺直接共轭至荧光团时,由于马来酰亚胺的低能nπ*态提供了荧光团激发态衰变的非辐射途径,马来酰亚胺猝灭荧光团,并且当其通过间隔基团连接至荧光团时,也可以猝灭荧光团,因为可以发生可光诱导的电子转移(PET)至C=C双键。例如,当马来酰亚胺附接在荧光染料BODIPY的邻位时,马来酰亚胺猝灭染料BODIPY的荧光。然而,当邻马来酰亚胺BODIPY与半胱氨酸(C)氨基酸类型的硫醇R基团反应时,C=C双键变得饱和并且不再淬灭荧光,因此BODIPY标记变得发光。本领域已知的其它淬灭基团包括叠氮基、炔烃、膦、斯德酮、四嗪或肟,并且这些可以在荧光点击反应后变得未淬灭,该荧光点击反应包括铜催化/应变促进的炔烃-叠氮化物环加成(CuAAC/SPAAC)、施陶丁格连接、铜催化/应变促进的斯德酮-炔烃环加成(CuSAC/SPSAC)、逆电子需求狄尔斯-阿德尔反应(iEDDA)或1,3-偶极环加成。
在一些实施例中,荧光反应涉及生成荧光团。这种类型的荧光反应的实例是赖氨酸(K)氨基酸类型与邻苯二醛的反应。形成第二环,延伸电子共轭,并且该较大的离域π体系在光谱的可见区域中变成发荧光。在一些实施例中,荧光反应涉及改变现有荧光底物的荧光特性。例如,固有荧光的氨基酸色氨酸与三氯乙醇(TCE)进行光-催化的自由基反应,该反应在色氨酸吲哚环上引入α-羟基酮,延伸共轭并且将色氨酸的固有荧光转移100nm至光谱的红色末端。
为了进一步说明如何对氨基酸类型进行特异性和荧光标记,下面呈现了用于本发明的荧光染料和反应方法的表格,从中可以为每种反应类型选择合适的标记和反应策略。
表3:每种氨基酸类型的每个R基团的荧光标记
/>
利用C-H键官能化的现有技术领域的标记脂肪族氨基酸的策略(DOI:10.1002/ejoc.201800896)。在替代实施例中,对P1或P1′位置的脂肪族(A、I、L、F或V)氨基酸具有裂解特异性的蛋白酶可以用于在目的氨基酸类型出现时切割蛋白质序列。这在蛋白质序列被切割的任何地方生成新的蛋白质N-末端。由于蛋白酶的裂解特异性是已知的,这可以容易地模拟。蛋白质N-末端可以使用对N-末端特异的荧光染料诸如NHS-酯反应。以这种方式,当N-末端与目的氨基酸类型相邻时,仅对N-末端特异的荧光染料反应,因此,基于当蛋白酶在V位置裂解时生成的N-末端的浓度(标记的信号报告V氨基酸类型的氨基酸浓度),测量样本中脂肪族例如缬氨酸(V)氨基酸类型的浓度。例如,人嗜中性粒细胞弹性蛋白酶在缬氨酸氨基酸处裂解。调节目的蛋白质的V氨基酸数目以增加已经存在于目的蛋白质内的N-末端的数目(基于蛋白质链的数目),并且将其用作参数方程组1的输入。在一些实施例中,蛋白酶也裂解,由于其自身的缬氨酸氨基酸而生成信号,但这被并入背景荧光强度测量中。
优选地,氨基酸类型的标记的R基团是氨基酸类型的R基团;这些包括标记含有对含有糖苷的R基团特异的糖苷的R基团,并且包含用TT/n-Bu4NN3或Ph3P:2,3-二氯-5,6-二氰基苯醌(DDQ):n-Bu4NN3选择性转换为叠氮化物,随后与Fl-DIBO反应。
标记含有脂肪酸的R基团对于含有脂肪酸的R基团是特异的,其包含用偶极3-甲氧基色酮标记,从而允许检测所有脂化氨基酸类型。标记含有磷酸基的R基团包含用羰二咪唑活化以提供离去基团,随后与半胱氨酸BODIPY染料反应,并且对于含有磷酸基的R基团是特异的,从而允许检测用磷酸基修饰的所有氨基酸类型。
在一些实施例中,氨基酸类型的修饰的氨基酸与氨基酸类型的未修饰的氨基酸标记不同。例如,对于氨基酸类型半胱氨酸,未修饰的氨基酸C
本领域技术人员将理解,尽管肽内的全部或一定比例的氨基酸暴露于溶剂并且可用于标记反应,但这可能不是折叠蛋白质的情况。在一些实施例中,样本在标记反应之前或期间变性。使蛋白质变性的方法是本领域已知的。在一些实施例中,这经由添加可混溶的有机溶剂诸如二甲基亚砜、甲醇、乙腈、乙醇或异丙醇来实现。在一些实施例中,这经由将缓冲液条件改变为低或高pH诸如pH 2、pH 3、pH 4、pH5、pH 7.5、pH 8.5、pH 9、pH 10或pH 10.5来实现。在一些实施例中,这通过将溶液加热至40℃、50℃、60℃、70℃、80℃、90℃或100℃来实现。在一些实施例中,这通过用TCEP、β-巯基乙醇、DTBA或DTT还原蛋白质二硫键来实现。在一些实施例中,这通过添加变性剂诸如脲、氯化胍或硫氰酸胍来实现。在一些实施例中,这通过添加表面活性剂诸如十二烷基硫酸钠(SDS)、十二烷基三甲基溴化铵(DTAB)、溴化十六烷基三甲铵(CTAB)、磷脂酰胆碱、Triton X-100、Triton X-114、CHAPS、NP-40、1-十一烷磺酸钠(SUS)、十二烷基苯磺酸钠(SDBS)、脱氧胆酸钠(DOC)、硬脂酸钠、4-(5-十二烷基)苯磺酸酯、磺基琥珀酸二辛酯钠、烷基醚磷酸盐、苯扎氯铵(BAC)和全氟辛烷磺酸(PFOS)来实现。在一些实施例中,在标记反应期间实现使样本内所含的蛋白质变性。在一些实施例中,标记反应在本文列出的添加剂的存在下进行。在一些实施例中,通过还原多肽二硫键并且添加表面活性剂来实现使样本内所含的多肽变性。在一些实施例中,通过还原蛋白质二硫键并且添加表面活性剂来实现使样本内所含的蛋白质变性。在一些实施例中,通过还原多肽二硫键、添加表面活性剂并且将缓冲液条件改变为高或低pH来使实现样本内所含的多肽变性。在一些实施例中,通过还原蛋白质二硫键、添加表面活性剂并且将缓冲液条件改变为高或低pH来实现使样本内所含的蛋白质变性。在一些实施例中,通过用TCEP还原蛋白质二硫键并且添加表面活性剂SDS来实现使样本内所含的蛋白质变性。在一些实施例中,通过还原蛋白质、肽、寡肽、多肽和/或蛋白质复合物二硫键并且添加表面活性剂来实现使样本内所含的包含亚蛋白质组或蛋白质组的蛋白质、肽、寡肽、多肽和/或蛋白质复合物变性。在一些实施例中,通过还原通过还原蛋白质、肽、寡肽、多肽和/或蛋白质复合物二硫键、添加表面活性剂并且将缓冲液条件改变为高或低pH来实现使样本内所含的包含亚蛋白质组或蛋白质组的蛋白质、肽、寡肽、多肽和/或蛋白质复合物变性。在一些实施例中,通过还原蛋白质、肽、寡肽、多肽和/或蛋白质复合物二硫键、添加表面活性剂并且将缓冲液条件改变为高或低pH来实现使样本内所含的包含亚蛋白质组或蛋白质组的蛋白质、肽、寡肽、多肽和/或蛋白质复合物变性。在一些实施例中,通过用TCEP还原蛋白质、肽、寡肽、多肽和/或蛋白质复合物二硫键并且添加表面活性剂SDS来实现使样本内所含的包含亚蛋白质组或蛋白质组的蛋白质、肽、寡肽、多肽和/或蛋白质复合物变性。例如,在4%w/v SDS和18mMβ-巯基乙醇的存在下,在pH 10下进行标记反应。作为另一实例,在4%SDS和10mM TCEP存在下,在pH10.5下进行标记反应。在一些实施例中,标记反应有多个步骤。在一些实施例中,第一步使未修饰的或修饰的氨基酸类型的R基团对标记具有反应性,并且在适于该反应的一组条件下进行。然后标记的第二步是在所描述的用于标记氨基酸类型的所有氨基酸的变性条件下使现在的反应性R基团反应。例如,标记C
在一些实施例中,在用TCEP还原并且用十二烷基硫酸钠(SDS)在缓冲液中变性后,用ABD-F荧光标记C
在一些实施例中,还原的半胱氨酸(C
在一些实施例中,在缓冲液中用OPA、β-巯基乙醇(BME)和SDS荧光标记赖氨酸(K)的氨基酸类型(例如R基团)的未修饰的氨基酸。在一些实施例中,缓冲液是碳酸钠缓冲液。在一些实施例中,用10至20mg OPA+5至10mL碳酸盐缓冲液+10至20μL BME+1至5mL 20%SDS荧光标记氨基酸。在一些实施例中,在200mM碳酸钠缓冲液中用12mM邻苯二甲醛(OPA)、18mMβ-巯基乙醇(BME)、4%SDS荧光标记氨基酸。染料分子OPA是二醛。赖氨酸伯胺攻击一种醛并且失去水。这导致形成亚胺,特别是席夫碱。由BME呈现的硫醇亲核试剂攻击该席夫碱,使得胺再次可用于对其它侧挂醛的闭环攻击。BME参与产生荧光团的反应,然而,可以使用其它硫醇代替BME。失去水,并且共轭延伸到新形成的环中,导致在光谱的可见区域生成荧光。
在一些实施例中,在用TCEP还原和用十二烷基硫酸钠(SDS)在缓冲液中变性之后,用TCE荧光标记色氨酸(W)的氨基酸类型的修饰的和未修饰的氨基酸(例如R基团)的组合和酪氨酸(Y)的修饰的和未修饰的氨基酸类型(例如R基团)的组合。TCEP还原蛋白质内的二硫键,使得与SDS变性一起,所有色氨酸(W)和酪氨酸(Y)氨基酸可用于反应。在一些实施例中,缓冲液是HEPES缓冲液。在一些实施例中,W氨基酸、Y氨基酸或W和Y氨基酸的激发态经历与TCE的自由基反应。在一些实施例中,该反应是用被W氨基酸、Y氨基酸,或W和Y氨基酸吸收的波长的UV光进行光催化的。在一些实施例中,在波长为260至310nm的UV光的催化下,在1至10mM HEPES中用0.01至5M TCE、2至50mM TCEP和2至20%SDS对W的氨基酸类型进行荧光标记。在一些实施例中,在波长为295至305nm的UV光的催化下,在5mM HEPES中的0.2M TCE、10mM TCEP和4%SDS中荧光标记W的氨基酸类型。在一些实施例中,在波长为260至310nm的UV光的催化下,在1至10mM HEPES中用0.01至5M TCE、2至50mM TCEP和2至20%SDS对Y的氨基酸类型进行荧光标记。在一些实施例中,在波长为285至295nm的UV光的催化下,在5mMHEPES中的0.2M TCE、10mM TCEP和4%SDS中荧光标记Y的氨基酸类型。
在一些实施例中,当标记氨基酸类型(例如R基团)半胱氨酸(C)时,其中半胱氨酸的修饰的和未修饰的氨基酸均被标记,在半胱氨酸R基团内含有的半胱氨酸硫醇在染料ABD-F上的亲电加成/消除反应中充当亲核试剂之前,氧化的(二硫化物键合的)半胱氨酸经由还原剂(TCEP)还原。这导致氟淬灭基团的损失,使得染料的荧光不再淬灭。当标记氨基酸类型赖氨酸(K)时,R基团内所含的赖氨酸伯胺攻击OPA内所含的醛中的一种。这形成亚胺,其被添加到反应中的硫醇(BME)攻击,释放伯胺以攻击剩余的侧挂醛。这封闭了第二环,并且延伸了芳族共轭,使荧光进入可见区域。
氨基酸类型色氨酸和酪氨酸的标记反应是光催化的自由基反应。可以用2,2,2-三氯乙醇(TCE)、2,2,2-三氯乙酸(TCA)或三氯甲烷以及其它二/三卤代化合物来标记色氨酸。来自色氨酸R基团的自由基与TCE结合,并且失去氢原子,导致二卤化合物添加到吲哚环上。这是不稳定的,并且被水分子攻击,然后失去盐酸,导致α羟基酮添加到吲哚环上,其使色氨酸的固有荧光向右转移约100nm,并且进入可见区域。酪氨酸反应的标记反应也是与TCE的光催化自由基反应,它使酪氨酸的固有荧光向右转移约100nm,并且进入可见区域。酪氨酸的苯酚R基团与TCE结合,经由与色氨酸标记反应相同的机制,导致α-羟基酮添加到环上。
发现对已经有固有荧光的氨基酸类型进行标记,可以实现未标记的氨基酸类型不可能实现的定量检测。例如,色氨酸和酪氨酸氨基酸是固有荧光的,因此用荧光标记来标记固有荧光的氨基酸是违反直觉的。本领域技术人员将理解,色氨酸和酪氨酸氨基酸类型的固有荧光高度依赖于3D蛋白质结构内这些残基周围的局部环境,因此色氨酸和酪氨酸氨基酸类型的固有荧光不能揭示蛋白质序列内色氨酸和酪氨酸残基的含量。然而,当这些氨基酸类型被标记后,其荧光的环境敏感性消失,并且标记的色氨酸或酪氨酸的荧光确实可以揭示样本内色氨酸或酪氨酸氨基酸类型的数目或浓度。例如,对于用三氯乙醇(TCE)标记的色氨酸和酪氨酸氨基酸类型,可以观察到荧光的环境敏感性消失了。这种意料不到的结果可能是由于色氨酸或酪氨酸的电子特性的改变,该色氨酸或酪氨酸的吲哚或苯酚环共轭已经经由添加α羟基酮而延伸,使得荧光团对局部环境的极性较不敏感。
替代地,荧光标记包括荧光蛋白或共轭抗体。优选地,荧光蛋白选自由以下组成的组:CFP、GFP(emGFP)、RFP(tagRFP)、GFP(Y66H突变)、GFP(Y66F突变)、EBFP、EBFP2、蓝铜矿、GFPuv、T-天蓝色、mCerulean、mCerulean3 mCFP、mTurquoise2、ECFP、CyPet、GFP(Y66W突变)、mKeima-红、TagCFP、AmCyan1、mTFP1、GFP(S65A突变)、Midoriishi青色、野生型GFP、GFP(S65C突变)、TurboGFP、TagGFP、GFP(S65L突变)、翠绿色、GFP(S65T突变)、EGFP、Azami绿、ZsGreen1、TagYFP、EYFP、Topaz、Venus、mCitrine、YPet、TurboYFP、ZsYellow1、Kusabira橙、亮橘色(mOrange)、别藻蓝素(APC)、mKO、TurboRFP、tdTomato、TagRFP、DsRed单体、DsRed2(“RFP”)、mStrawberry、TurboFP602、AsRed2、mRFP1、J-红、R-藻红蛋白(RPE)、B-藻红蛋白(BPE)、mCherry、HcRed1、Katusha、P3、多甲藻素叶绿素(PerCP)、mKate(TagFP635)、TurboFP635、mPlum或mRaspberry。在一些实施例中,特异于翻译后修饰的共轭抗体可以用于本发明的方法内。在一些实施例中,用本文提供的荧光标记或荧光团中的一种标记共轭抗体。优选地,共轭抗体是传统上或合成衍生的单克隆抗体,并且选自包括IgG、IgM、IgA、IgE或纳米抗体的组。优选地,每抗体用一种或荧光染料、荧光标记或荧光团标记。在一些实施例中,共轭抗体对翻译后修饰具有选择性,包括:N-乙酰化、甲基化、脱亚胺成瓜氨酸、脱酰胺成天冬氨酸或异天冬氨酸、N-连接的糖基化、异构化成异天冬氨酸、二硫键形成、氧化成次磺酸、亚磺酸或磺酸、棕榈酰化、N-乙酰化(N-末端)、S-亚硝基化、环化成焦谷氨酸(N-末端)、γ-羧化、脱酰胺成谷氨酸、异肽键形成、N-肉豆蔻酰化(N-末端)、磷酸化、泛素化、SUMO化、异肽键形成为谷氨酰胺、羟基化、N-连接的泛素化、氧化成亚砜或砜、羟基化、O-连接的糖基化、单-或二-氧化、犬尿氨酸的形成或硫酸化。
替代地,标记是串联质量标签(TMT)。优选地,串联质量标签是TMTzero、TMTduplex、TMTsimplex、TMT 10-plex、TMTpro和TMTpro Zero。替代地,标记是稳定同位素标记(即同位素标记)。在一些实施例中,稳定同位素标记是非放射性同位素。在一些实施例中,非放射性同位素标记是2H、13C和/或15N。在一些实施例中,标记策略结合使用。例如,每种氨基酸类型可以用化学方法标记(例如用荧光染料),并且然后用抗体标记。例如,化学标记两种或更多种氨基酸类型,并且然后使用翻译后修饰特异抗体,例如,检测不同氨基酸类型的氨基酸的磷酸化。
本领域技术人员将理解,作为本发明的一部分所涵盖的标记反应可以在没有分离步骤的情况下进行,或在分离样本的蛋白质组分或样本中特定目的蛋白质的分离步骤之后进行。例如,可以使用分离步骤诸如提取、沉淀和差异化增溶、离心、超速离心、超声处理、尺寸排阻色谱法、基于电荷或疏水性的分离(实例包括疏水相互作用色谱法、离子交换色谱法和/或自由流动电泳、毛细管电泳)、亲和色谱法诸如免疫亲和色谱法或高效液相色谱法(HPLC),或技术领域内已知的其它方法。
在一些实施例中,样本内的蛋白质一旦分离就被浓缩。这可以涉及但不限于冻干或超滤。在一些实施例中,样本内的一种或多种蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组一旦分离就被浓缩。
在一些实施例中,标记是荧光标记,并且两种或更多种氨基酸类型在相同条件下用相同荧光标记来标记,但标记反应以不同速率进行。因此,在某一时刻测量标记的时间分辨信号揭示标记的信号仅来自一种标记的氨基酸类型,而在另一时刻测量标记的时间分辨信号揭示标记的信号仅来自另一标记的氨基酸类型,或来自两种标记的氨基酸类型,使得在第一时间的标记的信号可以从在第二时间的标记的信号中减去,以揭示仅来自第二氨基酸类型的标记的信号。这是动力学解卷积。优选地,每种氨基酸类型的标记的检测与其它氨基酸类型解卷积,以使每种单个氨基酸类型的标记能够被检测。例如,W和Y氨基酸类型都用荧光标记TCE标记,并且标记反应在相同条件下进行,0.2M TCE、10mM TCEP和4%SDS于5mMHEPES中,以及用波长为280nm的UV光进行光催化,但标记反应以不同速率进行。在该实例中,W标记发生在Y标记之前。因此,当仅标记W残基时,通过停止标记反应使W和Y解卷积,并且然后进行反应,使W和Y都有足够的时间被标记,从而可以测量样本中Y和W中的每一个的荧光。在一些实施例中,样本中Y的荧光等于样本中W和Y的荧光减去样本中W的荧光。在优选的实施例中,氨基酸类型W和Y彼此解卷积。在优选的实施例中,氨基酸类型丝氨酸和苏氨酸彼此解卷积。在优选的实施例中,氨基酸类型天冬酰胺和谷氨酰胺彼此解卷积。在优选的实施例中,氨基酸类型谷氨酸和天冬氨酸彼此解卷积。在优选的实施例中,氨基酸类型亮氨酸和异亮氨酸彼此解卷积。
解卷积可以在标记阶段实现。在一些实施例中,当形成荧光染料时实现解卷积。在该实施例中,改变形成标记时的条件,使得用相同荧光标记来标记的两种或更多种氨基酸类型与标记相互不同地反应。在一些实施例中,用相同标记来标记的两种氨基酸类型的解卷积可以通过选择其中一种氨基酸类型将与标记反应而另一种氨基酸类型将不与标记反应的条件来实现。优选地,一种氨基酸类型的标记反应被催化,并且另一种氨基酸类型的标记反应不被催化。例如,对于W和Y氨基酸类型的光催化的修饰反应,标记在不同的光催化波长下形成,使得仅W氨基酸或W和Y氨基酸都吸收在光催化波长下催化反应所需的光。在一些实施例中,选择性标记W氨基酸类型。本领域众所周知,W氨基酸和Y氨基酸的吸收光谱不同,如
在一些实施例中,样本含有或怀疑含有亚蛋白质组或蛋白质组。在此类实施例中,标记样本中的两种或更多种氨基酸类型(例如R基团),而不需要将样本分离成其单个蛋白质、肽、寡肽、多肽或蛋白质复合物组分。本领域技术人员将理解,将复杂混合物诸如蛋白质组或亚蛋白质组分离成其单个组分可能需要大量的时间和劳力。本领域技术人员将理解,顺序分析蛋白质组或亚蛋白质组内的每个单个蛋白质的需要显著增加了分析所需的时间,就像蛋白质组含有1000个蛋白质一样,这将需要对1000个样本进行顺序分析。本发明分析蛋白质组、亚蛋白质组或混合物样本而不将样本分离成其单个蛋白质组分的能力允许该方法的高通量,因为不需要分离亚蛋白质组、蛋白质组或混合物。
测量标记
测量样本中标记的氨基酸类型中的每一种的标记。在一些实施例中,标记提供信号,并且测量标记的信号。
测量的每种氨基酸类型的标记与样本内该氨基酸类型的浓度、样本中每种氨基酸类型的氨基酸数目和样本的蛋白质浓度线性相关。在优选的实施例中,标记是荧光染料,并且测量的每种氨基酸类型的荧光强度与样本内该氨基酸类型的浓度、样本中每种氨基酸类型的氨基酸数目和样本的蛋白质浓度线性相关。在优选的实施例中,标记是非荧光染料,并且测量的每种氨基酸类型的非荧光染料的信号与样本中该氨基酸类型的浓度、样本中每种氨基酸类型的氨基酸数目和样本的蛋白质浓度线性相关。优选地,纯化非荧光染料的信号以去除未反应的染料。这可以通过色谱柱实现。在一些实施例中,标记是可以使用PCR扩增的核苷酸序列,并且测量的每种氨基酸类型的核苷酸序列与样本内该氨基酸类型的浓度、样本中每种氨基酸类型的氨基酸数目和样本的蛋白质浓度线性相关。在优选的实施例中,标记是质量标签或同位素标记,并且测量的标签或同位素标记与样本内该氨基酸类型的浓度、样本中每种氨基酸类型的氨基酸数目和样本的蛋白质浓度线性相关。
在一些实施例中,样本中的两种或更多种氨基酸类型各自用不同的同位素标记来标记,并且至少两种标记的氨基酸类型的每种同位素标记通过核磁共振(NMR)和质谱检测。
在一些实施例中,样本中的两种或更多种氨基酸类型各自用串联质量标签系统内的不同串联质量标签标记,并且至少两种标记的氨基酸类型中的每一种的串联质量标签通过质谱检测。在一些实施例中,使用TMTduplex、TMTsixplex、TMT10plex、TMT11plex或TMT16plex串联质量标签系统。在一些实施例中,串联质量标签内的蛋白质反应性基团对两种或更多种氨基酸类型中的每一种是特异的。
优选地,标记是发荧光、化学发光或生物发光的。在一些实施例中,测量标记的光谱特性。在一些实施例中,标记的光谱特性是在对标记进行照明或对标记进行化学反应时测量的。在对标记进行照明时,光可以被反射、透射、吸收或发射。可以测量标记的光的反射、透射、吸收或发射。优选地,标记是荧光的,并且响应于光的照射测量标记的光发射。在一些实施例中,一种荧光标记的氨基酸类型的激发光谱和发射光谱可与第二种荧光标记的氨基酸类型的激发光谱和发射光谱区分开。如果两种或多种氨基酸类型在一个单一级分中标记,则这是优选的。荧光标记为样本中每种标记的氨基酸类型提供了独特的荧光特征。
在一些实施例中,标记是荧光。样本中的两种或多种氨基酸类型各自用荧光标记,诸如荧光染料,并且确定至少两种标记的氨基酸类型中的每一种的荧光强度。在一些实施例中,使用荧光显微法检测至少两种标记的氨基酸类型中的每一种的荧光标记的荧光强度。在一些实施例中,使用荧光板读取器检测至少两种标记的氨基酸类型中的每一种的荧光标记的荧光强度。在一些实施例中,检测非荧光染料的荧光强度。优选地,在检测之前从未反应的染料中纯化非荧光染料。在一些实施例中,使用荧光显微法检测至少两种标记的氨基酸类型中的每一种的非荧光标记的荧光强度。在一些实施例中,使用荧光板读数器检测至少两种标记的氨基酸类型中的每一种的非荧光标记的荧光强度。
在一些实施例中,在约250nm至约400nm的激发波长和约370nm至约600nm的发射波长下测量氨基酸类型Y的荧光标记的荧光。优选地,在约270nm至约330nm的激发波长和约375nm至约500nm的发射波长下测量氨基酸类型Y的荧光。在一些实施例中,在用TCEP还原蛋白质内所含的任何二硫键,并且在缓冲液中用十二烷基硫酸钠(SDS)变性后,氨基酸类型Y的标记是TCE,并且在约270nm至约330nm的激发波长和约375nm至约500nm的发射波长下测量荧光。
在一些实施例中,在约250nm至约400nm的激发波长和约370nm至约600nm的发射波长下测量氨基酸类型W的荧光标记的荧光。优选地,在约270nm至约320nm或约350nm至约370nm的激发波长和约440nm至约550nm的发射波长下测量氨基酸类型W的荧光。在一些实施例中,在用TCEP还原蛋白质内所含的任何二硫键并且在缓冲液中用十二烷基硫酸钠(SDS)变性后,氨基酸类型W的荧光标记是TCE,并且在约250nm至约400nm的激发波长和约370nm至约600nm的发射波长下测量荧光。在一些实施例中,在用TCEP还原蛋白质内所含的任何二硫键并且在缓冲液中用十二烷基硫酸钠(SDS)变性后,氨基酸类型W的荧光标记是TCE,在约270nm至约320nm或约350nm至约370nm的激发波长和约440nm至约550nm的发射波长下测量荧光。
在一些实施例中,在约320nm至约400nm的激发波长和约415nm至约500nm的发射波长下测量氨基酸类型K的荧光。优选地,在约330nm至约390nm的激发波长和约415nm至约480nm的发射波长下测量氨基酸类型K的荧光。在一些实施例中,在标记反应开始后约2至约25秒测量氨基酸类型K的荧光。优选地,在标记反应开始后4秒内测量氨基酸类型K的荧光。在一些实施例中,在缓冲液中用OPA、β-巯基乙醇(BME)和SDS标记氨基酸类型K,并且在约320nm至约400nm的激发波长和约415nm至约500nm的发射波长下测量荧光。在一些实施例中,在缓冲液中用OPA、β-巯基乙醇(BME)和SDS标记氨基酸类型K,并且在约330nm至约390nm的激发波长和约415nm至约480nm的发射波长下测量荧光。在一些实施例中,在缓冲液中用OPA、β-巯基乙醇(BME)和SDS标记氨基酸类型K,并且在350nm的激发波长和460nm的发射波长下测量荧光。
在一些实施例中,在约330nm至约400nm的激发波长和约430nm至约550nm的发射波长下测量氨基酸类型C的荧光。优选地,在约340nm至约390nm的激发波长和约470nm至约530nm的发射波长下测量氨基酸C的荧光。这些激发和发射波长用于测量还原的半胱氨酸(C
优选地,对于被测量的每种氨基酸类型的荧光标记,激发波长与发射波长彼此分离约10nm至约20nm以避免任何串扰。这确保激发光不提供发射光的错误信号。优选地,对于每种氨基酸类型的荧光标记,激发波长与发射波长彼此分离约15nm至约20nm以避免任何串扰。
在一些实施例中,标记是荧光标记,并且两种或更多种氨基酸类型在相同条件下用相同荧光标记来标记(例如,标记是相同的,标记的浓度是相同的,用于催化反应的光的波长是相同的)。优选地,每种氨基酸类型的标记的检测与其它氨基酸类型解卷积,以使每种单个氨基酸类型的标记能够被检测。例如,用荧光标记TCE标记W和Y氨基酸类型。例如,用在5mM HEPES中用0.2M TCE、10mM TCEP和4%SDS标记W和Y氨基酸类型,并且用波长为280nm的UV光进行光催化,其中氨基酸类型W和氨基酸类型Y都吸收。因此,W和Y的荧光强度被解卷积,使得可以在样本中测量Y和W中每一个的荧光。在优选的实施例中,氨基酸类型W和Y彼此解卷积。在优选的实施例中,氨基酸类型丝氨酸和苏氨酸彼此解卷积。在优选的实施例中,氨基酸类型天冬酰胺和谷氨酰胺彼此解卷积。在优选的实施例中,氨基酸类型谷氨酸和天冬氨酸彼此解卷积。在优选的实施例中,氨基酸类型亮氨酸和异亮氨酸彼此解卷积。
在一些实施例中,解卷积在检测阶段实现。优选地,解卷积使用分离的激发波长。在其它实施例中,解卷积使用分离的发射波长。在其它实施例中,解卷积使用分离的激发和分离的发射波长。
分离的光激发波长激发新形成的染料并且测量染料的荧光。在该实施例中,通过使用激发和发射波长对来实现解卷积,其中仅一种氨基酸类型对荧光强度有贡献。分离的光激发波长靶向每种氨基酸类型。例如,含有用TCE标记的W和Y氨基酸的蛋白质具有两个激发峰。在约310nm处激发样本并且在约450至480nm处测量荧光导致检测来自W和Y氨基酸类型的荧光(波长对1)。然而,在约355nm处激发样本并且在约450至480nm处测量荧光导致测量仅来自W氨基酸类型的荧光强度(波长对2)。这提供了一种氨基酸类型的测量的标记,例如经由波长对2的W氨基酸类型。优选地,使用解卷积标准根据样本中测量的荧光强度确定样本中标记并且在检测两种氨基酸类型的激发-发射波长对处测量的其它氨基酸类型的测量的标记。
解卷积标准仅需要测量一次,并且结果可以存储或供应给用户。对于样本,每次测量在激发和发射波长对处解卷积的氨基酸类型时,不需要测量解卷积标准。不需要在每次测量样本时测量解卷积标准。
在一些实施例中,通过获得各种蛋白质的公开可获得的氨基酸序列并且去除在成熟蛋白质中生物裂解的序列部分来选择解卷积标准。确定这些蛋白质中两种或更多种对应氨基酸类型内的氨基酸数目。例如,如果样本中W和Y氨基酸类型被标记,则确定这些蛋白质序列内W和Y氨基酸的数目。
在一些实施例中,解卷积标准物包含仅一种氨基酸类型的氨基酸,其在样本中被标记并且在检测两种类型的氨基酸的波长对处被解卷积。例如,如果样本中氨基酸类型W和Y被标记,则解卷积标准含有W氨基酸,但不含有Y氨基酸。在另一实例中,解卷积标准含有Y氨基酸,但不含有W氨基酸。优选地,解卷积标准仅含有标记的氨基酸的类型,其样本的标记值(例如信号)基于激发和发射波长对是已知的。解卷积标准用于确定仅一种类型的氨基酸对在检测两种类型的氨基酸的波长对处测量的总标记(例如信号)的贡献。
在一些实施例中,解卷积标准用于解卷积色氨酸和酪氨酸;亮氨酸和异亮氨酸;天冬氨酸和谷氨酸;丝氨酸和苏氨酸;和/或天冬酰胺和谷氨酰胺的氨基酸类型。例如,对于色氨酸和酪氨酸;亮氨酸和异亮氨酸;天冬氨酸和谷氨酸;丝氨酸和苏氨酸;和/或天冬酰胺和谷氨酰胺氨基酸类型的解卷积呈现解卷积标准的选择。这些解卷积标准是通过鉴定人血浆蛋白质组内的蛋白质而发现的,对于该蛋白质,卷积的氨基酸类型的数目的乘积是零,并且卷积的氨基酸类型的数目的总和是非零的。在一些实施例中,对于色氨酸和酪氨酸氨基酸类型的解卷积,解卷积标准选自包含以下的组:α-突触核蛋白甲状旁腺激素、年龄相关的黄斑病易感性蛋白质2、10kDa热休克蛋白质线粒体、小的富含脯氨酸的蛋白质2F、精子鱼精蛋白P1、库尼茨(Kunitz)型蛋白酶抑制剂4、富酪蛋白、富组蛋白-3、弹性蛋白、β-防御素133、肿瘤抑制因子ARF、Complexin-2、B黑素瘤抗原5和/或硒蛋白W。在一些实施例中,对于亮氨酸和异亮氨酸氨基酸类型的解卷积,解卷积标准物选自包含以下的组:富含脯氨酸的蛋白质9、富含丝氨酸/精氨酸的剪接因子3、兜甲蛋白、金属硫蛋白-1M载脂蛋白C-III、β-防御素124和锌指蛋白575。在一些实施例中,对于天冬氨酸和谷氨酸氨基酸类型的解卷积,解卷积标准选自包含以下的组:Humanin样9、β-防御素136、β-防御素4A、推定的锌指蛋白726P1、T细胞受体δ多样性1、小的富含脯氨酸的蛋白质2A、小的膜内在蛋白38、T细胞受体β连接1至3、推定的未表征的蛋白质PRO0628、小的富含脯氨酸的蛋白质2D、T细胞受体β连接2至5、胰岛淀粉样多肽和/或推定的未表征的蛋白质URB1-AS1。在一些实施例中,对于丝氨酸和苏氨酸氨基酸类型的解卷积,解卷积标准选自包含以下的组:细胞色素c氧化酶装配因子1同系物、碱性唾液富含脯氨酸的蛋白质1、蛋白质BEX3、富组蛋白-1、β-防御素134、Adropin、地塞米松(Dexamethasone)诱导的蛋白质、眼质蛋白和/或蛋白质BEX5。在一些实施例中,对于天冬酰胺和谷氨酰胺氨基酸类型的解卷积,解卷积标准选自包含以下的组:甲状腺素运载蛋白、T细胞白血病/淋巴瘤蛋白质1A、睾丸发育相关蛋白质1、蛋白质WFDC11、泛素样蛋白质FUBI和/或线粒体输入受体亚基TOM7同系物。
解卷积的标记的氨基酸类型中,仅含有单独检测的氨基酸类型并且不含有未单独检测的氨基酸类型的解卷积标准经荧光标记,并且在检测两种氨基酸类型的激发和发射波长对(波长对1)处检测荧光。然后在仅检测到一种氨基酸类型的激发和发射波长对(波长对2)处测量来自相同荧光标记的解卷积标准的荧光。不需要知道解卷积标准的蛋白质浓度。优选地,在波长对1和波长对2处测量解卷积标准的相同溶液,因此在波长对1和波长对2下测量的溶液的相对和绝对蛋白质浓度是相同的。如果改变在波长对1和波长对2处测量的溶液的相对蛋白质浓度(例如,通过将相等体积的溶液添加到相等体积的缓冲液中将样本稀释2倍),则记录该稀释倍数,并且将解卷积标准已被稀释的波长对的测量信号乘以稀释倍数以获得未稀释溶液的测量信号。在该任选的稀释调整步骤之后,将波长对1处的标记的解卷积标准的测量信号除以波长对2处的标记的解卷积标准的测量信号,得到波长信号转换。然后,将仅检测到一种氨基酸类型的波长对2处的样本的标记的信号乘以波长信号转换,以揭示源自单独检测的氨基酸类型的波长对1处的信号。从波长对1的总信号中减去该信号,以揭示仅来自其它氨基酸类型的信号。以这种方式,来源于两种氨基酸类型的信号被分成两个信号,每个信号仅来源于一种氨基酸类型,使得信号的数目等于样本中标记和测量的氨基酸类型的数目。例如,荧光标记仅含有W氨基酸并且不含有任何Y氨基酸的解卷积标准,并且在激发和发射波长对处检测该荧光,在该波长对处检测到W和Y氨基酸类型(波长对1;激发:310nm,发射:450nM)。然后在激发和发射波长对处测量来自相同荧光标记的解卷积标准溶液的荧光,在该波长对处仅检测到W氨基酸类型(波长对2;激发:355nm,发射:450nM)。在波长对1和2处测量相同荧光标记的解卷积标准溶液,因此没有稀释。在波长对1处的标记的解卷积标准的测量信号除以在波长对2处的标记的解卷积标准的测量信号,得到波长信号转换。然后,将仅检测到W氨基酸类型的波长对2处的样本的标记的信号乘以波长信号转换,以揭示源自W氨基酸类型的波长对1处的信号。从波长对1的总信号中减去该信号,以揭示仅来自Y氨基酸类型的信号。
替代地,使用已知蛋白质浓度的两种解卷积标准在相同激发和发射波长对处检测的两种标记类型的氨基酸之间解卷积。在被解卷积的标记的氨基酸类型中,第一解卷积标准仅具有基于其中仅检测到一种氨基酸类型的激发-发射波长对(波长对2)的信号未知的氨基酸类型。第二解卷积标准具有信号已知的氨基酸类型和信号未知的氨基酸类型。在检测到两种氨基酸类型的激发-发射波长对(波长对1)处测量第一解卷积标准。在检测到两种氨基酸类型的激发-发射波长对(波长对1)处测量第二解卷积标准。第一解卷积标准中检测到的氨基酸类型的氨基酸浓度是已知的,因为该氨基酸类型的氨基酸数目是已知的并且第一解卷积标准的蛋白质浓度是已知的;这些相乘以揭示该氨基酸类型在第一解卷积标准中的氨基酸浓度。在波长对1处第一解卷积标准的测量的信号除以在波长对1处第一解卷积标准的该氨基酸类型的氨基酸浓度,以揭示第一解卷积标准中存在的被解卷积的氨基酸类型的每氨基酸浓度的信号。在第二解卷积标准中被解卷积的两种氨基酸类型的氨基酸浓度是已知的,因为在第二解卷积标准中两种氨基酸类型的数目是已知的,并且第二解卷积标准的蛋白质浓度是已知的。将第一解卷积标准中提供的氨基酸类型的氨基酸浓度乘以使用第一解卷积标准计算的该氨基酸类型的每氨基酸浓度的信号。这提供了第二解卷积标准内该氨基酸类型的信号。从在波长对1处测量的总信号中减去在波长对1处的第二解卷积标准内该氨基酸类型的信号,这揭示了在波长对1处的其它氨基酸类型的信号。这是相同的氨基酸类型,其信号分别在波长对2处检测。在波长对1处的第二解卷积标准的该氨基酸类型的测量信号除以在波长对2处的第二解卷积标准的该氨基酸类型的测量信号,得到波长信号转换。然后,将仅检测到一种氨基酸类型的波长对2处的样本的标记的信号乘以波长信号转换,以揭示源自单独检测的氨基酸类型的波长对1处的信号。从波长对1的总信号中减去该信号,以揭示仅来自其它氨基酸类型的信号。以这种方式,来源于两种氨基酸类型的信号被分成两个信号,每个信号仅来源于一种氨基酸类型,使得信号的数目等于样本中标记和测量的氨基酸类型的数目。例如,第一解卷积标准仅含有Y氨基酸而不含有任何W氨基酸。第一个解卷积标准具有已知的Y氨基酸浓度。第二个解卷积标准含有Y和W氨基酸。第二解卷积标准具有已知的Y和已知的W氨基酸浓度。荧光标记第一解卷积标准,并且在激发和发射波长对处检测荧光,在该波长对处检测到W和Y氨基酸类型(波长对1;激发:310nm,发射:450nM)。荧光标记第二解卷积标准,并且在激发和发射波长对处检测荧光,在该波长对处检测到W和Y氨基酸类型(波长对1;激发:310nm,发射:450nM)。第一解卷积标准在波长对1处的荧光强度除以第一解卷积标准的Y氨基酸类型的氨基酸浓度,以揭示每Y氨基酸浓度的荧光强度。每Y氨基酸浓度的荧光强度乘以第二解卷积标准的已知Y氨基酸浓度,以揭示在波长对1处来自第二解卷积标准的Y氨基酸类型的荧光强度。从第二解卷积标准在波长对1处测量的总荧光强度中减去这一点,以揭示在波长对1处w氨基酸类型的荧光强度。在波长对1处第二解卷积标准的W氨基酸类型的荧光强度除以在波长对2处第二解卷积标准的W氨基酸类型的荧光强度(波长对2;激发:355nm,发射:450nm)以揭示波长信号转换。将在波长对2处对样本测量的W氨基酸类型的荧光强度乘以波长信号转换以获得在波长对1处对W氨基酸类型测量的荧光强度。从在波长对1处对样本的W和Y氨基酸类型测量的荧光强度中减去在波长对1处对样本的W氨基酸类型测量的荧光强度,以揭示在波长对1处对样本的Y氨基酸类型测量的荧光强度。以这种方式,获得W和Y氨基酸类型的单独荧光强度。
然后在激发和发射波长对处测量来自相同荧光标记的解卷积标准溶液的荧光,在该波长对处仅检测到W氨基酸类型(波长对2;激发:355nm,发射:450nM)。在波长对1和2处测量相同荧光标记的解卷积标准溶液,因此没有稀释。在波长对1处的标记的解卷积标准的测量信号除以在波长对2处的标记的解卷积标准的测量信号,得到波长信号转换。然后,将仅检测到W氨基酸类型的波长对2处的样本的标记的信号乘以波长信号转换,以揭示源自W氨基酸类型的波长对1处的信号。从波长对1的总信号中减去该信号,以揭示仅来自Y氨基酸类型的信号。
替代地,荧光强度的信号可以在时间上解卷积。例如,一种标记反应的动力学可能比另一种标记反应的动力学快。在一些实施例中,监测信号,并且在一个标记反应已经完成并且另一个标记反应没有开始的时间点处进行测量。在一些实施例中,监测荧光强度,并且在一个标记反应已经完成并且另一个标记反应没有开始的时间点处进行测量。
在一些实施例中,测量的标记是背景校正的。在优选的实施例中,测量的标记是荧光强度,并且每种标记的氨基酸类型的荧光强度是背景校正的。从荧光强度中减去荧光背景以产生背景校正的荧光值。可以使用本领域已知的任何背景校正技术。在一些实施例中,为了计算背景荧光,将荧光染料溶液与相等体积的缓冲液而不是蛋白质组合。在一些实施例中,将荧光染料溶液与标记反应期间供应的含蛋白质溶液的体积相等体积的缓冲液组合。从染料和蛋白质溶液检测的荧光强度中减去从染料和缓冲溶液检测的荧光强度以提供背景校正的荧光特征。替代地,滴定曲线可以用于确定荧光的低浓度极限,其可被鉴定为背景。检测极限被鉴定为在该极限之上可检测的蛋白质的第一浓度。
样本中氨基酸类型的测量的标记与样本中该氨基酸类型的氨基酸浓度相关。在一些实施例中,样本中氨基酸类型的测量的标记与样本中该氨基酸类型的氨基酸浓度线性相关。在一些实施例中,样本中氨基酸类型的测量的标记与样本中该氨基酸类型的氨基酸浓度非线性相关。在一些实施例中,非线性关系的实例包括幂律、多项式方程或指数方程。在一些实施例中,样本中氨基酸类型的测量的标记用多项式方程与样本中该氨基酸类型的氨基酸浓度相关。
每种标记的氨基酸类型的测量的标记、氨基酸浓度或氨基酸数目提供了样本中该标记的氨基酸类型的特征。可以将样本中标记的氨基酸类型中的每一种的特征与参考中相同氨基酸类型的特征进行比较,以鉴定样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或量。
当在样本和用于校准曲线或标准的任何氨基酸或蛋白质中标记氨基酸类型的所有氨基酸时,测量的标记(例如标记的信号)揭示样本中该氨基酸类型的所有(例如100%)氨基酸的浓度和/或所有(例如100%)氨基酸的数目。当在样本和用于校准曲线或标准的任何氨基酸或蛋白质中标记相同比例(例如80%)的氨基酸类型的氨基酸时,测量的标记(例如标记的信号)揭示样本中该氨基酸类型的所有(例如100%)氨基酸的浓度和/或所有(例如100%)氨基酸的数目。这是因为当在所测量的任何蛋白质中标记相同比例的氨基酸时,该比例因子超出了测量的标记(例如标记的信号)与样本的浓度或氨基酸数目之间的转换。
测量每种标记的氨基酸类型的浓度
在一些实施例中,测量样本中每种标记的氨基酸类型的浓度。在一些实施例中,样本中每种标记的氨基酸类型的浓度根据氨基酸类型的测量的标记(例如,测量的标记的信号)计算。在一些实施例中,样本中氨基酸类型的浓度根据样本中该氨基酸类型的测量的荧光强度计算。在一些实施例中,样本中每种标记的氨基酸类型的浓度与测量的标记之间存在线性关系。在替代实施例中,样本中每种标记的氨基酸类型的浓度与测量的标记之间存在非线性关系。在一些实施例中,这种非线性关系的实例包括多项式关系、幂律关系或指数关系。在一些实施例中,样本中每种标记的氨基酸类型的浓度与测量的标记之间存在多项式关系。在一些实施例中,样本中每种标记的氨基酸类型的浓度与测量的标记之间存在幂律关系。在一些实施例中,样本中每种标记的氨基酸类型的浓度与测量的标记之间存在指数关系。在一些实施例中,当两种或更多种氨基酸类型用荧光染料标记时,样本中每种标记的氨基酸类型的浓度与测量的荧光强度之间存在线性关系。在一些实施例中,当两种或更多种氨基酸类型用荧光染料标记时,样本中每种标记的氨基酸类型的浓度与测量的荧光强度之间存在线性关系。荧光强度随着样本中该氨基酸类型的浓度的增加而增加。
在一些实施例中,使用校准曲线或标准根据样本中相同的两种或更多种氨基酸类型的测量的标记确定样本中两种或更多种标记的氨基酸类型中的每一种的氨基酸的浓度。校准曲线或标准是用于通过将未知样本与一组已知浓度的标准样本或一个标准样本进行比较来确定未知样本中的物质浓度的通用分析化学方法。当使用校准曲线时,绘制了氨基酸类型的已知氨基酸浓度的多于一种标准的标记值。数据与校准曲线拟合,并且校准曲线提供标记的氨基酸类型的氨基酸浓度与氨基酸类型的标记值之间的关系。当绘制已知氨基酸类型的氨基酸浓度的单一标准时,整个校准曲线无法获得,并且单一蛋白质标准的标记的氨基酸类型的氨基酸浓度和氨基酸类型的标记值提供标记的氨基酸类型的氨基酸浓度与氨基酸类型的标记值之间的关系。因为单一蛋白质标准可获得的信息较少,所以当标记值与氨基酸类型的氨基酸浓度之间的关系是线性的并且通过原点时,并且当氨基酸类型的标记值已被背景校正时,可使用该信息。
在一些实施例中,将标记的信号绘制为每种校准蛋白的每种氨基酸浓度的氨基酸浓度的函数,以提供每种氨基酸类型的校准图。在一些实施例中,以任意单位(AU)测量并且绘制标记的信号。每个校准图被拟合以提供校准曲线。在一些实施例中,校准曲线确定样本中每种标记的氨基酸类型的荧光强度或背景校正的荧光强度与氨基酸浓度之间的关系。在一些实施例中,以任意单位(AU)绘制荧光强度或背景校正的荧光强度。例如,校准曲线确定了对氨基酸类型色氨酸(W)测量的荧光强度与W的对应氨基酸浓度之间的关系。
在一些实施例中,拟合(线性)校准图以提供校准曲线是执行线性最小二乘回归。计算最佳拟合线的方程以校准氨基酸类型的标记的信号与氨基酸浓度之间的关系。在一些实施例中,这是线性方程。在一些实施例中,该线性拟合被约束穿过原点。
在一些实施例中,当使用线性回归计算最佳拟合线时,用于氨基酸类型n的最佳拟合线的方程为方程5:
标记值
其中标记值
当测量样本的氨基酸类型的信号时,通过拟合确定的校准可以用于将对样本的氨基酸类型测量的信号转变为样本的氨基酸类型的氨基酸浓度。在一些实施例中,来自方程5的拟合的输出用于使用方程6将以AU计的氨基酸类型n的标记的值转换为氨基酸类型n的氨基酸浓度:
其中A.A.浓度
在一些实施例中,当使用线性回归计算最佳拟合线时,并且用于氨基酸类型n的最佳拟合线的方程是方程7:
标记值
其中标记值
在一些实施例中,来自方程7的拟合的输出用于使用方程8将以AU计的氨基酸类型n的标记的值转换为氨基酸类型n的氨基酸浓度:
其中A.A.浓度
只要样本的标记的测量信号将转变为样本的标记的氨基酸浓度,就不需要进行该步骤。在一些实施例中,针对每种标记的氨基酸类型的校准曲线包括并且延伸超过针对每种氨基酸类型的标记反应的线性范围。在一些实施例中,用于计算校准曲线的数据含有氨基酸浓度的相等间隔,使得线性最小二乘回归是无偏的。在一些实施例中,用于计算校准曲线的数据被归一化。在一些实施例中,在拟合之前取氨基酸浓度和信号数据的对数,以避免如果考察宽氨基酸浓度范围则将拟合偏向于更高的氨基酸浓度。
替代地,通过将含有氨基酸或蛋白质的已知氨基酸浓度的标准溶液的标记的信号除以氨基酸或蛋白质的已知氨基酸浓度来确定校准因子。在一些实施例中,使用来自一种标准(校准蛋白质或氨基酸)的一种氨基酸浓度的数据确定每种氨基酸类型的校准因子。在该实施例中校准曲线是无法获得的,因为只有一个点用于校准,并且曲线需要至少两个点。每个标准具有被校准的氨基酸类型的已知氨基酸浓度,或被校准的氨基酸类型的已知蛋白质浓度和氨基酸数目,它们被相乘以提供被校准的氨基酸类型的氨基酸浓度。所有或恒定比例的被校准的氨基酸类型被标记,因此对于每种校准蛋白质测量的标记的信号与对于每种校准蛋白质被校准的氨基酸类型的氨基酸浓度成比例。被校准的氨基酸类型的氨基酸浓度除以对被校准的氨基酸类型测量的标记的信号,以提供每测量的标记的信号的氨基酸浓度。例如,对于10μM的氨基酸类型色氨酸(W)测量的标记的信号是100AU。因此,氨基酸类型色氨酸(W)的校准因子为10μM/100AU=0.1μM/AU。对于10μM的氨基酸类型赖氨酸(K)测量的信号是500AU。因此,氨基酸类型赖氨酸(K)的校准因子为10μM/500AU=0.02μM/AU。这对将在实验中标记和测量的氨基酸类型中的每一种进行。例如,如果在实验中标记和测量两种氨基酸类型,则有两种校准因子,并且如果在实验中标记和测量三种氨基酸类型,则有三种校准因子。
在一些实施例中,使用来自游离氨基酸的一个或多个氨基酸浓度的数据确定每种氨基酸类型的校准或校准因子。游离氨基酸不并入蛋白质链或肽内。在一些实施例中,使用游离氨基酸的多于一种氨基酸浓度。在一些实施例中,使用游离氨基酸的一种氨基酸浓度。
在一些实施例中,使用校准氨基酸校准一种或多种氨基酸类型,并且使用一种或多种校准蛋白的一种或多种蛋白质浓度校准一种或多种氨基酸类型。在一些实施例中,当确定标记的信号与每种氨基酸类型的氨基酸浓度之间的关系的数据被确定时,来自溶液中游离氨基酸的数据可以与来自氨基酸序列内并入的氨基酸的数据一起包括在内。
该步骤仅需执行一次,并且结果可以存储和/或供应给用户;只要样本的标记的测量信号将转变为样本的标记的氨基酸浓度,就不需要进行该步骤。
在一些实施例中,使用校准因子根据样本中相同的两种或更多种氨基酸类型的测量的荧光强度确定样本中两种或更多种标记的氨基酸类型中的每一种的氨基酸的浓度。标记和测量的每种类型的氨基酸具有不同的校准。标记和测量的每种类型的氨基酸具有不同的校准因子。校准因子在样本的测量的标记,通常以任意单位(AU)计,与样本中该氨基酸类型的氨基酸浓度之间转换。校准因子确定样本中每种标记的氨基酸类型的测量的标记与氨基酸浓度之间的关系。
这对将在实验中标记和测量的氨基酸类型中的每一种进行。例如,如果在实验中标记和测量两种氨基酸类型,则有两种校准因子,并且如果在实验中标记和测量三种氨基酸类型,则有三种校准因子。
为了鉴定和定量样本,用户仅需要标记和测量样本内两种或更多种氨基酸类型的标记。可以为几种检测设置提供任何氨基酸类型的校准函数或校准因子;例如,用于基于荧光的检测的校准因子可以根据仪器的激发波长、发射波长和增益或光电倍增管(PMT)设置来提供。
该校准因子或校准函数不依赖于氨基酸序列,并且通过在每种标记的氨基酸类型的已知和非零氨基酸浓度的一种或多种校准氨基酸或校准蛋白质的一种或多种氨基酸浓度下测量的标记来计算。在一些实施例中,一种或多种校准氨基酸或蛋白质的一种或多种氨基酸浓度在测量样本和任何任选的实验参考的相同条件(例如激发和发射波长对)下测量。在一些实施例中,不同的一种或多种校准氨基酸或校准蛋白质用于每种氨基酸类型。在一些实施例中,校准函数是非线性的。在优选的实施例中,校准函数是线性的,提供标量校准因子。如果使用一种或多种校准氨基酸或校准蛋白质的多于一种氨基酸浓度,则通过拟合描述该氨基酸类型的已知氨基酸浓度与该氨基酸类型的标记值(例如标记的测量信号)之间的关系的数据来计算每种氨基酸类型的校准因子。如果使用一种校准氨基酸或蛋白质的一种氨基酸浓度,则通过将氨基酸类型的测量的标记除以氨基酸类型的已知氨基酸浓度来计算每种氨基酸类型的校准因子,从而提供对于该氨基酸类型的已知氨基酸浓度,将测量的每种氨基酸类型的标记的标记值(例如信号)。
在一些实施例中,使用来自一种或多种校准蛋白质的几种氨基酸浓度的数据确定每种氨基酸类型的校准函数或校准因子。每种校准蛋白质具有被校准的氨基酸类型的已知氨基酸浓度,或被校准的氨基酸类型的已知蛋白质浓度和氨基酸数目,它们被相乘以提供被校准的氨基酸类型的氨基酸浓度。在一些实施例中,对于每种校准蛋白质,所有或相同比例的被校准的氨基酸类型被标记,因此对于每种校准蛋白质测量的标记的信号与对于每种校准蛋白质被校准的氨基酸类型的氨基酸浓度成比例。例如,如果待标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则样本中90%的色氨酸(W)氨基酸和用于校准的任何氨基酸或蛋白质被标记,并且样本中90%的赖氨酸(K)氨基酸和用于校准的任何氨基酸或蛋白质被标记。在一些实施例中,标记的氨基酸的比例对于每种氨基酸类型不需要是相同的比例。例如,如果待标记的两种或更多种氨基酸类型是色氨酸(W)和赖氨酸(K),则样本中90%的色氨酸(W)氨基酸和用于校准的任何氨基酸或蛋白质被标记,并且样本中80%的赖氨酸(K)氨基酸和用于校准的任何氨基酸或蛋白质被标记。在另一实例中,如果待标记的两种或更多种氨基酸类型是色氨酸(W)、赖氨酸(K)和酪氨酸(Y),则样本中90%的色氨酸(W)氨基酸和用于校准的任何氨基酸或蛋白质被标记,样本中85%的赖氨酸(K)氨基酸和用于校准的任何氨基酸或蛋白质被标记,并且样本中80%的酪氨酸(Y)氨基酸和用于校准的任何氨基酸或蛋白质被标记。
在一些实施例中,任何用实验方法测量的蛋白质(样本、任何标准诸如蛋白质或氨基酸,和任何实验参考蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组,或目的蛋白质组,或校准曲线)中的所有或相同比例的氨基酸是相同的。这确保了氨基酸类型内一定比例的氨基酸的标记被抵消并且在结果中没有观察到。当在样本和用于校准的任何氨基酸或蛋白质中标记氨基酸类型的相同比例(例如80%)的氨基酸时,标记的信号揭示样本中该氨基酸类型的所有(例如100%)氨基酸的浓度和/或所有(例如100%)氨基酸的数目。这是因为当相同比例的氨基酸被标记时,该比例因子超出了从标记的信号与样本或校准的氨基酸浓度或数目之间的转换。
测量每种标记的氨基酸类型的氨基酸数目
在一些实施例中,当样本的摩尔蛋白质浓度已知时,可以测量样本中每种标记的氨基酸类型的氨基酸数目。氨基酸类型的氨基酸数目等于该氨基酸类型的氨基酸浓度除以蛋白质浓度。氨基酸类型的氨基酸数目等同于氨基酸类型的氨基酸浓度随蛋白质浓度的变化。
根据样本中标记的氨基酸类型的测量的标记计算样本中标记的氨基酸类型的氨基酸数目。测量的标记提供了样本中该标记的氨基酸类型的氨基酸浓度。优选地,氨基酸类型用荧光染料标记,并且根据样本中标记的氨基酸类型的荧光强度计算标记的氨基酸类型的氨基酸数目。荧光强度提供了样本中该标记的氨基酸类型的氨基酸浓度。
在一些实施例中,样本的标记的氨基酸类型的氨基酸数目根据方程9计算:
测量的标记提供氨基酸浓度。一种或多种校准氨基酸或校准蛋白质的一种或多种氨基酸浓度用于使用校准曲线或标准将样本的测量的标记转换为样本中标记的氨基酸类型的摩尔氨基酸浓度。样本中标记的氨基酸类型的摩尔氨基酸浓度除以样本的总摩尔蛋白质浓度以提供样本的氨基酸类型的氨基酸数目。对样本中每种标记的氨基酸类型进行该计算。例如,如果样本中的氨基酸类型W、K和Y被标记,则对氨基酸类型W、K和Y中的每一种进行等式9。例如,通过将样本中W的摩尔氨基酸浓度除以样本的总摩尔蛋白质浓度来计算样本中W氨基酸的数目。通过将样本中K的摩尔氨基酸浓度除以样本的总摩尔蛋白质浓度来计算样本中K氨基酸的数目。通过将样本中Y的摩尔氨基酸浓度除以样本的总蛋白质浓度来计算样本中Y氨基酸的数目。
样本中每种标记的氨基酸类型的氨基酸数目为样本提供了独特特征。例如,标记样本中的三种氨基酸类型;W、K和C,其中C是C
在一些实施例中,样本的总摩尔蛋白质浓度是已知的,或使用本领域的标准技术确定。在一些实施例中,总摩尔蛋白质浓度是被动已知的。例如,例如经由A
在一些实施例中,总蛋白质浓度是主动已知的,即已经主动确定了以mg/mL计的蛋白质浓度。例如,质量蛋白质浓度已被称出或测量,因此样本中总蛋白质的质量浓度是已知的。例如,已称出0.05mg/mL蛋白质并且溶解于1mL缓冲液中,并且因此已知总质量蛋白质浓度为0.05mg/mL。作为另一实例,本领域已知的方法用于确定样本的质量蛋白质浓度。当已经确定总质量蛋白质浓度时,不可能计算样本的两种或更多种氨基酸类型中的每一种的氨基酸数目。如果总蛋白质浓度由质量提供,并且氨基酸浓度由质量提供,则方程9不允许计算样本中的氨基酸数目。代替计算样本中每蛋白质的氨基酸数目,将氨基酸质量浓度除以蛋白质质量浓度的结果将是由标记的氨基酸类型的氨基酸贡献的蛋白质的质量的相对分数。从该信息确定样本中两种或更多种氨基酸类型中的每一种的氨基酸数目需要知道确切的蛋白质分子量(MW),这取决于蛋白质序列,而由于样本的身份是未知的,所以无法获得样本的蛋白质序列。MW也不能根据蛋白质大小诸如样本的流体动力学半径(R
对于在方程9中计算样本的氨基酸数目,氨基酸浓度必须是摩尔氨基酸浓度而不是质量氨基酸浓度;这是该单位取消所需要的以揭示无单位的氨基酸数目。然而,发现当仅知道样本的总质量蛋白质浓度时仍可以使用本发明的方法,因为可以对目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组进行相关转变,根据定义,其蛋白质身份是已知的。
在一些实施例中,如果仅将蛋白质的N-末端或C-末端用荧光染料标记,则样本的摩尔蛋白质浓度是主动已知的。例如,蛋白质的N-末端经由与磷酸吡哆醛-5-(PLP)的仿生转氨反应进行位点特异性修饰,其将N-末端氧化成酮(除甘氨酸外的所有氨基酸类型)或醛(甘氨酸氨基酸类型),然后使其与携带烷氧基胺反应性基团的荧光标记物反应,形成稳定的共价肟键,如(
参考
在一些实施例中,将样本中两种氨基酸类型的测量的标记物(例如标记的信号)与含有一种或多种蛋白质浓度的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液中相同的两种或更多种氨基酸类型的已知标记值(例如标记的信号,例如标记的荧光强度或质荷比的强度)的参考进行比较。在一些实施例中,将样本中两种或更多种氨基酸类型的氨基酸浓度与含有一种或多种浓度的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液中相同的两种或更多种氨基酸类型的氨基酸浓度的参考进行比较。在一些实施例中,当参考是氨基酸浓度或已知标记值(例如标记的信号)时,参考是一组函数,其提供参考值作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度的函数。在一些实施例中,对于任何目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,参考提供了作为浓度的函数的样本测量值(例如氨基酸浓度,或每种标记的氨基酸类型的标记的信号,诸如荧光强度或信号与质量比强度)。在一些实施例中,这些函数是线性的,并且提供n维空间中的线(其中n是样本中被标记的氨基酸类型的数目)。例如,如果样本中的W和K氨基酸类型被标记,则参考是2维空间中的W和K的线。对样本测量的值(例如,n种氨基酸类型的氨基酸浓度,或n种氨基酸类型的标记的信号)总是提供n维空间中的点。当样本点在参考线上或在参考线的误差容限内时,可以检测目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在。每当检测到目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在时,还可以通过求解浓度的参考函数来确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度。在一些实施例中,使用参数方程组1、2、3和4或向量函数1、2、3或4来生成包含参考的函数。
在一些实施例中,将样本中两种或更多种标记的氨基酸类型的测量的标记与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的一个或多个已知标记值(例如标记的信号,例如标记的荧光强度、质量、振动模式或标记的放射性衰变,或标记的M-F-N-R区域)的参考进行比较。在一些实施例中,将样本中两种或更多种标记的氨基酸类型的氨基酸浓度与含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中相同的两种或更多种氨基酸类型的一种或多种氨基酸浓度的参考进行比较。在一些实施例中,将样本中两种或更多种标记的氨基酸类型的氨基酸数目与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中相同的两种或更多种氨基酸类型的数目的参考进行比较。
参考的单位必须与样本确定的单位相同。例如,将样本中氨基酸类型的氨基酸浓度与参考中相同氨基酸类型的氨基酸浓度进行比较。如果参考的单位不相同,则将参考的单位转换为样本的相同单位,或反之亦然。在一些实施例中,参考的单位被转换。在一些实施例中,样本的单位被转换。例如,样本中氨基酸类型的荧光强度不能与参考中相同氨基酸类型的氨基酸浓度进行比较,因为荧光强度和氨基酸浓度是不同的单位。相反,参考中氨基酸类型的氨基酸浓度可以使用参数方程组3转换为荧光强度。然后,将样本中氨基酸类型的荧光强度与参考中相同氨基酸类型的荧光强度进行比较。替代地,样本的单位可以转换为与参考相同的单位。例如,使用校准曲线或标准将样本中氨基酸类型的荧光强度转换为氨基酸类型的氨基酸浓度,并将样本中氨基酸类型的氨基酸浓度与参考中相同氨基酸类型的氨基酸浓度进行比较。如果样本的摩尔浓度是已知的,则样本中每种标记的氨基酸类型的氨基酸浓度可以用于使用本文所公开的方法计算样本中每种标记的氨基酸类型的氨基酸数目。将样本中标记的氨基酸类型的氨基酸数目与参考中相同氨基酸类型的数目进行比较。
在一些实施例中,如果样本的值(即两种或更多种氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目)与每种氨基酸类型的参考的值(即相同的两种或更多种氨基酸类型的已知标记值、氨基酸浓度和/或氨基酸数目)相同或在其误差容限内,则这指示目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组以特定的浓度和/或量存在于样本中。相反,在一些实施例中,样本的值(即两种或更多种氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目)与参考的值(即相同的两种或更多种氨基酸类型的已知标记值、氨基酸浓度和/或氨基酸数目)相比在误差容限之外的差异指示参考蛋白质不以任何浓度和/或量存在于样本中。
在一些实施例中,先前已经确定了参考。例如,先前已经确定了将两种或更多种氨基酸类型的已知标记值、氨基酸浓度或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的身份和/或浓度相关的信息。例如,先前已经确定了在含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液的一种或多种浓度下的两种或更多种氨基酸类型的荧光强度,或在含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液中的一种或多种浓度下的两种或更多种氨基酸类型的氨基酸浓度,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列中的两种或更多种氨基酸类型的氨基酸数目。在一些实施例中,参考被存储在可以被复制、访问或传输的介质中。作为鉴定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在和/或浓度的指示与样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度和/或氨基酸数目的信息,可以存储在可以被复制、访问或传输的介质中。参考名称(例如目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的名称)也可以存储在可以被复制、访问或传输的介质中。例如,在含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液的一种或多种浓度下的两种或更多种氨基酸类型的荧光强度,或在含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液的一种或多种浓度下的两种或更多种氨基酸类型的氨基酸浓度,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列中的两种或更多种氨基酸类型的氨基酸数目存储在可以被复制、访问或传输的介质中。在一些实施例中,参考可以源自或衍生自任何合适的数据源,包括例如数据库、基因组信息的公用数据库、已发布的数据,或为参考受试者的特定群体生成的数据,其可以各自具有共同的属性(例如,有机体的类型、疾病状态、病原体、组织类型、细胞类型、预后值、年龄或对药物的响应)。例如,在不同浓度下含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液的氨基酸浓度或已知标记值(例如标记的信号,例如荧光强度),和/或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列中的每种氨基酸类型的氨基酸数目,和/或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的名称或标识符可以从文库或数据库中访问。在一些实施例中,该参考作为取决于共同浓度参数的参数方程组或向量函数提供了与在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的已知标记值和/或氨基酸浓度。在其它实施例中,该参考提供了与在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的氨基酸数目。
在一些实施例中,参考提供了与样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的氨基酸数目,并且使用Power BI;Microsoft分析程序、Microsoft Excel或Python确定氨基酸的数目。
在一些实施例中,含有一种或多种浓度的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液中的两种或更多种氨基酸类型的参考氨基酸浓度或已知标记值(例如信号)可以根据每种氨基酸类型的氨基酸数目或平均数和目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列中的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度来计算,并且可以包括使用参数方程组1、2、3或4或向量函数1、2、3或4的每种目的氨基酸类型的校准因子。
在一些实施例中,可以用关于在各种样本和/或亚蛋白质组和/或蛋白质组上观察到的氨基酸数目的频率分布的信息,诸如关于氨基酸数目的前导数位的频率分布的观察来增强参考。本福特定律、纽康-本福特(Newcomb-Benford)定律、第一数位定律或有效数位定律,提供了关于在自然产生的数据集(特别是具有高数量级的数据集)的不同集合中的有效数位(数字的前导数字)的预期分布的信息,并且可以用于检测模式或其缺乏,使得能够检测数字模式中的异常。该定律指出,前导有效数位的预期分布不是均匀分布的,而是遵循特定的对数分布。在下面的图4、5和6中,P(d)表示前导数位d在本福特定律下的预期概率,其中d在{1,2,3,4,5,6,7,8,9}中。
发现人血浆蛋白质组的平均氨基酸数的前导数位服从该定律(图4),然而病毒蛋白质组稍微偏离(图5),其中对于细菌蛋白质组的氨基酸的平均数的前导数位的分布观察到最大的偏离(图6)。对于目的病毒和细菌蛋白质组缺乏与本福特定律的一致性证实了任何目的病毒或细菌蛋白质组内两种或更多种氨基酸类型的氨基酸平均数、氨基酸浓度和/或标记值的特征的信息丰富性。相反,如果氨基酸数目的前导数位均匀分布,则对于{1,2,3,4,5,6,7,8,9}中的所有d,P(d)将是11.11%。附加地,已知符合或偏离本福特定律或均匀分布的特定氨基酸可以用于指定某些样本类型内发生某些特征的概率。
在一些实施例中,参考是计算的参考,其基于从目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的公开可获得的氨基酸序列获得的序列数据计算。替代地,如果目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列不是公开可获得的,则可以使用标准测序方法,例如埃德曼降解,确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的一个或多个氨基酸序列。在一些实施例中,该参考是实验参考。在一些实施例中,当确定实验参考时,以已知摩尔浓度提供目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,如本文所公开的标记两种或更多种氨基酸类型,测量标记并且测量的标记用于通过将氨基酸浓度(由测量的标记确定)除以已知蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组浓度确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种标记的氨基酸类型的氨基酸数目。替代地,在一些实施例中,当确定实验参考时,以已知浓度提供实验参考中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,该已知浓度诸如经由本领域已知的方法诸如Bradford测定确定的质量浓度,如本文所公开的标记两种或更多种氨基酸类型、测量标记并且测量的标记用于确定使用校准曲线或标准的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种标记的氨基酸类型的氨基酸浓度。替代地,在一些实施例中,当确定实验参考时,实验参考中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度是未知的和未确定的。这允许鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在,并且确定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的相对浓度和/或量。提供样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组相对于另一样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度和/或量的相对浓度和/或量。
在所有实施例中,实验参考可以与样本的检验同时地确定、在样本的检验之前确定或在样本的检验之后确定。通常,如本领域技术人员所理解的,在与用于确定或表征样本的那些条件相当的条件下确定或表征该参考。
标记样本中氨基酸类型的所有或一定比例的氨基酸不影响计算的参考,因为所有氨基酸或相同比例的氨基酸被标记在样本和用于校准曲线或标准的一种或多种蛋白质中,该校准曲线或标准用于在(样本或参考的)荧光强度与氨基酸浓度之间转换。如果在样本中标记了氨基酸类型的所有氨基酸,则也应在实验参考中标记该氨基酸类型的所有氨基酸。如果在样本中标记了氨基酸类型的一定比例的氨基酸,则在实验参考中应标记该氨基酸类型的相同比例的氨基酸。这是因为当在用实验方法测量的任何蛋白质中标记相同比例的氨基酸时,该比例因子超出了标记值(例如标记的信号)与样本或参考的浓度或氨基酸数目之间的转换。
在一些实施例中,样本的身份和蛋白质数量(浓度和量)都是未知的。在一些实施例中,样本的身份和蛋白质数量(摩尔蛋白质浓度和摩尔蛋白质量)都是未知的。这是在诊断设置中遇到的最常见的情况,因为如果样本含有其身份未知的蛋白质,则在不知道该蛋白质的身份的情况下不能确定其摩尔蛋白质浓度,因为这需要知道从其氨基酸序列确定的蛋白质的精确分子量。当样本的身份和蛋白质数量(摩尔蛋白质浓度和摩尔蛋白质量)均未知时,为样本提供的测量值(两种或更多种标记的氨基酸类型的氨基酸浓度,或两种或更多种标记的氨基酸类型的测量的标记(例如标记的信号))取决于样本的未知蛋白质浓度。因此,目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的参考是样本未知浓度的函数。参数方程将一组数量描述为被称为参数的共同自变量的函数。这里,样本的未知摩尔浓度是被称为t的参数,其必须大于或等于0,因为负浓度在物理上是不可能的。
参考的一般形式是n维空间中的线,其中n是样本中标记和测量的氨基酸类型的数目。参考可以用参数方程来描述,该参数方程指定了坐标中的每一个(氨基酸浓度,或标记的信号)如何作为浓度t的函数而变化。一般参数方程为:
其中n
·当样本的测量值以氨基酸浓度提供并且参考线描述了目的蛋白质、肽、寡肽、多肽或蛋白质复合物时,c
·当样本的测量值以氨基酸浓度提供并且参考线描述了目的蛋白质组或亚蛋白质组时,c
·当样本的测量值以测量的标记(例如标记的信号)提供并且参考线描述了目的蛋白质、肽、寡肽、多肽或蛋白质复合物时为c
·当样本的测量值以测量的标记(例如标记的信号)提供并且参考线描述了目的蛋白质组或亚蛋白质组时为c
其中t是含有蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液的浓度,该浓度是n个函数中的每一个中的共同自变量(或参数),该函数共同指定了n维中的每一个中的参考线,并且其中t是针对大于或等于
参考线可以替代地描述为n维空间中的向量(参见假设检验2的讨论,其中形式方程已经在发明内容部分中提供)。
如何在比较步骤中使用参考的方法,在此以目的蛋白质和为样本测量的氨基酸浓度为背景进行概述,在本发明的实施例中是保守的,并且具体细节在以下比较步骤部分提供。
在一些实施例中,该参考是目的蛋白质的两种或更多种氨基酸类型的氨基酸浓度。目的蛋白质p
标记和测量样本中两种或更多种氨基酸类型的氨基酸浓度。在样本中标记和测量氨基酸类型1,在样本中标记和测量氨基酸类型2,和任选地在样本中标记和测量氨基酸类型n。在参数方程1中,a
由于在样本中标记和测量了n类型的氨基酸,n种函数定义了该参考。例如,如果在样本中标记和测量了2种氨基酸类型,则含有t≥0的任何浓度t的目的蛋白质p
为了鉴定样本内目的蛋白质n
如果针对目的蛋白质p
这在比较步骤中进行。在一些实施例中,在比较步骤内,通过将针对样本测量的每个氨基酸浓度设置为等于由参考函数提供的对应氨基酸浓度,将针对目的蛋白质p
AAC
AAC
AAC
其中方程的数目等于样本中标记和测量的n种氨基酸类型的数目。如果n个方程包含可以对t的单一值求解的检验1,则目的蛋白质p
在一些实施例中,这可以被正式地陈述为如果,则完成检验1
这表明如果对于所有t≥0,存在t的值,使得对于所有k=1,2,...,n,AAC
例如,获得未知蛋白质身份和未知浓度的样本,样本中色氨酸(W)和赖氨酸(K)氨基酸类型被标记,并且如本文所公开的根据测量的标记确定样本中W和K氨基酸类型的氨基酸浓度。色氨酸(W)是氨基酸类型1,并且赖氨酸(K)是氨基酸类型2。样本中氨基酸色氨酸(W)的浓度S
在该实例中,目的蛋白质是细胞因子白介素-6(IL-6),其涉及不同的宿主响应SARS-CoV-2感染。在一些实施例中,氨基酸类型的氨基酸数目是目的蛋白质的氨基酸序列中该氨基酸类型的氨基酸出现的总数。IL-6中W氨基酸的数目是1,并且IL-6中K氨基酸的数目是14。W氨基酸类型是氨基酸类型1,并且K氨基酸类型是氨基酸类型2。因此,任何蛋白质浓度的IL-6的参考由参数方程1提供为:
n
根据检验1,通过将对样本测量的每个氨基酸浓度设置为等于为参考提供的对应氨基酸浓度函数来评价样本内目的蛋白质IL-6的任何蛋白质浓度的存在:
AAC
AAC
其中
0.5μM=t
7μM=14t
并且确定是否存在解
7μM=14(0.5μM)
∴t=0.5μM
这意味着当样本中针对氨基酸类型1测量的氨基酸浓度被设置为等于为参考的氨基酸类型1提供的氨基酸浓度函数,并且样本中针对氨基酸类型2测量的氨基酸浓度被设置为等于为参考的氨基酸类型2提供的氨基酸浓度函数时,存在方程的解。方程的解是t=0.5μM。因此,目的蛋白质IL-6被鉴定为以0.5μM的蛋白质浓度存在于样本中。
作为另一实例,获得未知蛋白质身份和未知蛋白质浓度的样本,样本中色氨酸(W)和赖氨酸(K)氨基酸类型被标记,并且如本文所描述的根据标记的信号测量样本中W和K氨基酸类型的氨基酸浓度。色氨酸(W)是氨基酸类型1,并且赖氨酸(K)是氨基酸类型2。样本中氨基酸色氨酸(W)的浓度S
在该实例中,目的蛋白质是细胞周期蛋白依赖性激酶5(CDK5),它是神经元发育所必需的激酶,被认为涉及神经疾病中的凋亡细胞死亡,其被分泌到血浆中。蛋白质序列内色氨酸(W)氨基酸的数目是3,并且蛋白质序列内赖氨酸(K)氨基酸的数目是23。然而,从公开的SwissProt数据库可知,1个赖氨酸氨基酸是翻译后修饰的(乙酰化的),并且因此不可用于与本实验选择的赖氨酸标记染料反应。在一些实施例中,目的蛋白质内氨基酸类型的氨基酸数目是该氨基酸类型在目的蛋白质的一个或多个氨基酸序列内出现的数目减去该氨基酸类型的翻译后修饰的数目,该翻译后修饰将阻止该氨基酸类型与标记反应。因此,目的蛋白质内赖氨酸(K)氨基酸类型的氨基酸数目是22,并且目的蛋白质内色氨酸(W)氨基酸数目是3。参数方程组1提供了样本的未知蛋白质浓度的目的蛋白质(CDK5)的以下参考:
n
根据检验1,通过将对样本中的每种标记的氨基酸类型测量的每个氨基酸浓度设置为等于为参考提供的对应氨基酸浓度函数来评价样本内目的蛋白质CDK5的任何蛋白质浓度的存在:
AAC
AAC
其中
2.4μM=3t
17.6μM=22t
并且确定是否存在解
2.4uM=3t
17.6μM=22(0.8μM)
∴t=0.8μM
这意味着当样本中针对氨基酸类型1测量的氨基酸浓度被设置为等于为参考的氨基酸类型1提供的氨基酸浓度函数,并且样本中针对氨基酸类型2测量的氨基酸浓度被设置为等于为参考的氨基酸类型2提供的氨基酸浓度函数时,存在方程的解。方程的解是t=0.8μM。因此,目的蛋白质CDK5被鉴定为以0.8μM的蛋白质浓度存在于样本中。
在一些实施例中,参数方程1提供了对于多种目的蛋白质的参考,并且任选地,将结果存储在参考数据库中。在一些实施例中,参数方程1中使用的每种氨基酸类型的氨基酸数目也存储在数据库中,并且参数方程1对该数据库进行操作以提供参考数据库。
例如,使用HPLC从人血浆中分离蛋白质,并且其摩尔蛋白质浓度是未知的。在样本中标记氨基酸类型C、K和W。在样本中,C氨基酸类型的所有(未修饰的+修饰的)氨基酸被标记,K氨基酸类型的未修饰的氨基酸(K氨基酸类型的氨基酸,其ε-氨基基团是伯胺,而不是仲胺)和W氨基酸类型的所有(未修饰的+修饰的)氨基酸被标记。如本文所描述的,根据标记的信号在样本中测量3.8μM C、15.9μM K和0.9μM W的氨基酸浓度。C氨基酸类型是AAC
构建人血浆内发现的5种目的蛋白质的参考。这些包括Affamin、踝蛋白-1、L-选择素、C-反应蛋白和光蛋白聚糖。在一些实施例中,参考是从参考数据库获得的。
在一些实施例中,每种目的蛋白质中C、K和W氨基酸类型的氨基酸数目通过去除每种目的蛋白质的氨基酸序列的部分诸如在成熟蛋白质中裂解的信号序列、确定每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的成熟蛋白质序列中C、K和W氨基酸的出现的数目,以及从计算的K氨基酸的出现中减去将导致赖氨酸ε-氨基基团从伯胺转换为仲胺的翻译后修饰(PTM)的数目,特别是乙酰化、烷基化和甘氨酰-赖氨酸异肽形成的数目来确定。
这提供了可以任选地从数据库获得的C、K和W氨基酸类型的以下氨基酸数目:
将参数方程1顺序地应用于数据库的每一行,以产生作为任何蛋白质浓度t的函数的每种目的蛋白质的参考:
每种目的蛋白质的参考p
在比较步骤中,将检验1应用于为每种目的蛋白质提供的每个参考。我们有:
AAC
AAC
AAC
对于目的蛋白质p
3.8μM=34t;15.9μM=49t;0.9μM=0t
因此,对于所有t≥0,不存在满足包含检验1的所有方程的t的单一值,因此任何蛋白质浓度的目的蛋白质n
对于目的蛋白质p
3.8μM=38t;15.9μM=159t;0.9μM=9t
对于所有t≥0,存在t,使得对于t的单一值求解包含检验1的所有方程,因此目的蛋白质p
对于目的蛋白质p:
3.8μM=22t;15.9μM=24t;0.9μM=11t
因此,对于所有t≥0,不存在满足包含检验1的所有方程的t的单一值,因此任何蛋白质浓度的目的蛋白质p
对于目的蛋白质p
3.8μM=2t;15.9μM=13t;0.9μM=6t
因此,对于所有t≥0,不存在满足包含检验1的所有方程的t的单一值,因此任何蛋白质浓度的目的蛋白质p
对于目的蛋白质p
3.8μM=6t;15.9μM=25t;0.9μM=1t
因此,对于所有t≥0,不存在满足包含检验1的所有方程的t的单一值,因此任何蛋白质浓度的目的蛋白质p
在一些实施例中,检验1概述的步骤作为具有计算机程序的算法自动化,如果(1=真,0=假)目的蛋白质p
在一些实施例中,如果对于样本测量的点,例如(AAC
检验2通过检验样本点是否在参考线的误差容限ε内来检验目的蛋白质p存在于样本内的假设。在一些实施例中,这是通过求样本点与参考线之间的最短距离,并且然后确定该距离是否小于误差容限来实现的。如果样本点与参考线之间的最短距离小于误差容限,则鉴定样本内目的蛋白质p
在一些实施例中,点与线之间的最短距离是点与线之间的垂直距离。除了例如通过参数方程1进行参数描述之外,参考线还可以用向量格式来描述,该向量格式允许计算参考线上的精确点(浓度),该精确点(浓度)经由点积产生该垂直距离。然后,使用距离公式,例如欧几里得距离公式来求样本点与该垂直距离点之间的距离,并且将该距离与误差容限ε进行比较,以确定目的蛋白质p
检验2的一般方法是:
1.令R为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p
2.求作为t的函数的向量格式的参考线R的方程,其是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p
3.求参考线R上的点P的一般方程
4.求点P在参考线R上的精确位置,称为Q,使得从S到P的向量垂直于R。这意味着求参考线R上的点Q,使得S和Q之间的向量得到垂线。这是通过求从S到P的向量与R的方向的点积(-),将其设置为等于0,并且求解t以提供t的值而实现的,当将该值代入R上的点P的一般方程中时,产生垂直向量。如果该参考包含在样本内,则对于t,该解是其浓度。
5.使用称为D的距离公式求Q和S之间的距离。
6.评价D是否小于误差容限ε。
7.如果D>ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p
8.如果D≤ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p
例如,该参考线(R)的参数形式是
参考线的向量形式是R=<0,0,0>+t 参考线上的点(P)的一般方程是 P=<0+a 测量的样本点(S)具有坐标S=(AAC 从测量的样本点(S)到参考线上的任何点(P)的向量是P-S P-S= 为了使该向量垂直,该向量与参考线 a a a t(a t的解是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p 为了确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p P=<0+a Q是点,其是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p 使用距离公式求S与Q之间的距离D。 例如,点S与点Q之间的欧几里得距离公式为 因此,我们有 ε是例如由用户提供的错误阈值。 如果D>ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p 如果D≤ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组p 存在于样本内 例如,使用HPLC从人血浆中分离蛋白质,并且其摩尔蛋白质浓度是未知的。在样本中标记氨基酸类型C、K和W。在样本中C氨基酸类型的所有(未修饰的+修饰的)氨基酸被标记,即C 在该实例中,已经为在人血浆中发现的5种目的蛋白质构建了参考数据库。这些包括Affamin、踝蛋白-1、L-选择素、C-反应蛋白和光蛋白聚糖,如上所描述的,使用参数方程1以产生每种目的蛋白质的任何蛋白质浓度t的参考。 每种目的蛋白质p 在比较步骤中,将检验1应用于为每种目的蛋白质提供的每个参考。我们有: AAC AAC AAC 对于目的蛋白质p 3.9μM=34t;16.1μM=49t;1.0μM=0t 目的蛋白质p 对于目的蛋白质p 3.9μM=38t;16.1μM=159t;1.0μM=9t 目的蛋白质p 对于目的蛋白质p 3.9μM=22t;16.1μtM=24t;1.0μM=11t 目的蛋白质p 对于目的蛋白质p 3.9μM=2t;16.1μM=13t;1.0μM=6t 目的蛋白质P 对于目的蛋白质p 3.9μM=6t;16.1μM=25t;1.0μM=1t 目的蛋白质p 因此,样本点不在任何目的蛋白质的参考线上。然而,如果存在单一浓度值,其中在样本中测量的两种或更多种氨基酸类型的氨基酸浓度小于或等于与在一种或多种目的蛋白质的样本中已标记的氨基酸类型相同的两种或更多种氨基酸类型的氨基酸浓度的误差容限,则鉴定样本内目的蛋白质的存在和/或浓度和/或量。在一些实施例中,误差容限由方程10提供: 其中ε是误差容限, 用户已提供用户输入公差值 在检验2中,评估所有目的蛋白质以确定每个目的蛋白质的测量的样本点与参考线之间的最短(垂直)距离是否落在误差容限内。 该方法具体针对目的蛋白质p 目的蛋白质p 在向量形式中,用于该参考线的方程是 R=<0,0,0>+t<38,159,9> P=(38t,159t,9t) 该样本点是S=(3.9,16.1,1) 从测量的样本点(S)到参考线上的任何点(P)的向量是P-S P-S=<38t-3.9,159t-16.1,9t-1> 为了使该向量垂直,该向量与参考线<38,159,9>的方向的点积(-)必须为0。因此,我们设置 <38t-3.9,159t-16.1,9t-1>-<38,159,9>=0 1444t-148.2+25281t-2559.9+81t-9=0 26806t=2717.1 t=0.1014 该t的解是目的蛋白质p 为了确定参考是否存在于样本内,在参考线上求点Q,其给出垂直距离。Q=P(t)。 P= Q=(38×0.1014,159×0.1014,9×0.1014)=(3.8532,16.1226,0.9126) S=(3.9,16.1,1) D=0.1017 ε=0.167 D≤ε 因此,目的蛋白质n 在一些实施例中,每种氨基酸类型(a 已经解释了,对于目的蛋白质的情况,如何通过参数方程提供参考,以及如何在比较步骤内使用参考,以基于对样本的两种或更多种标记的氨基酸类型测量的氨基酸浓度来评价样本内目的蛋白质的存在和/或浓度和/或量。在其它实施例中,以相同的方式在比较步骤中使用参考,并且这在“比较步骤”部分中进一步描述。这里,描述参考的剩余形式,其遵循相同的方法。 本发明的方法还用于确定样本内目的蛋白质组或亚蛋白质组的存在和/或浓度和/或量。目的蛋白质组或亚蛋白质组的参考也可以是n维空间中的线,其中n是实验中标记和测量的氨基酸类型的数目。在一些实施例中,通过确定目的蛋白质组或亚蛋白质组的(假设的)平均蛋白质序列的氨基酸数目,能够构建目的亚蛋白质组的蛋白质组的参考线,其具有每种氨基酸类型的氨基酸数目,该氨基酸数目是目的蛋白质组或亚蛋白质组内含有的所有蛋白质序列的氨基酸的加权平均数;在该代表性蛋白质序列中没有氨基酸顺序的概念,并且具有每个氨基酸类型的氨基酸数目是正整数的规范约束(例如a 其中w 如本文所公开的,在优选的实施例中,q 其中int 在方程11内,q是含有c蛋白质的目的蛋白质组或亚蛋白质组内的所有目的蛋白质i上的q 由此得出,就像方程11内int q=∑int 因此, 是如本文所公开的方程11中的 为了便于参考, 质谱摩尔强度分数MSIF 其中平均(∑int 附加地,在一些实施例中,期望将质谱强度值转换为目的蛋白质组或亚蛋白质组的质量浓度或量,而不是转换为目的蛋白质组或亚蛋白质组的摩尔浓度。在这种情况下,不是计算质谱摩尔强度分数,而是计算质谱质量强度分数。不计算方程11中 其中int是目的蛋白质组或亚蛋白质组内给定蛋白质的质谱强度,并且∑int是目的蛋白质组或亚蛋白质组内所有蛋白质的强度值的总和。与MSIF 其中平均(∑int)是人血浆蛋白质组的健康亚蛋白质组的所有患者样本的∑int值的平均值。 在一些实施例中,可能需要使用质谱数据库中可获得的质谱总摩尔强度值来计算存在的蛋白质的摩尔量或质量量。总强度值∑int与质量成比例,因此如果添加到质谱仪的总蛋白质浓度是已知的,例如因为它已经被标准化,则已知总强度值∑int的总和等于该总蛋白质的质量。因此,计算每种蛋白质的强度除以样本中所有蛋白质的强度的总和 在方程11中,q 替代地,每个氨基酸类型的氨基酸的加权平均数可以用方程12确定: 其中w 替代地,氨基酸类型1的氨基酸的加权平均数(w 每种氨基酸类型的氨基酸的加权平均数用于提供目的蛋白质组或亚蛋白质组的参考线。当提供给样本的测量值是如本文所公开的针对氨基酸类型1、氨基酸类型2和氨基酸类型n测量的氨基酸浓度时,参考线由参数方程组2描述: 其中p 在一些实施例中,不需要对样本进行计算;可以简单地测量样本的标记,并且所有的计算可以替代地在目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组上进行。样本测量值的直接输出是在本发明的方法中标记和测量的两种或更多种氨基酸类型中的每一种的测量的标记(例如标记的信号),并且可以构建参考以提供作为含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的溶液的浓度的函数的已知标记值(例如标记的已知信号)。校准曲线或标准在每种氨基酸类型的氨基酸浓度与每种氨基酸类型的已知标记值(例如标记的信号)之间转换。优选地,校准曲线是线性函数。通过测量已知氨基酸浓度的一种或多种标准溶液,例如由一种或多种校准氨基酸或校准蛋白质提供的,来确定校准曲线或标准。在一些实施例中,氨基酸浓度以浓度单位提供,诸如nM或μM,并且标记的信号以任意单位测量,诸如AU。 f 在一些实施例中,校准曲线是线性的,意味着氨基酸类型n的标记值与氨基酸类型n的氨基酸浓度线性相关,并且校准函数是校准因子。在替代实施例中,校准曲线是非线性的,并且校准函数不能被简化为校准因子,因为需要附加的转变(例如,校准函数可以描述幂律关系)。 例如,测量W氨基酸类型的已知氨基酸浓度的标记值,并且将其绘制为W氨基酸类型的氨基酸浓度的函数,并且将该线拟合到方程7(在“测量每种标记的氨基酸类型的浓度”部分内)。对于W氨基酸类型,这提供了: W信号(AU)=100(AU/μM)×w浓度(μM) 校准曲线是线性的,因此可以确定校准因子。W氨基酸类型的校准因子f 当在对样本进行的测量上执行校准时使用 当根据氨基酸类型1、氨基酸类型2和氨基酸类型n的测量的标记(例如标记的信号)提供样本的测量值时,目的参考线蛋白质、肽、寡肽、多肽或蛋白质复合物的参数方程由参数方程3给出: /> 其中p 如果需要,可以进行任选的处理步骤以确保用于创建参考或参考数据库的a 在一些实施例中,可以进行处理步骤以确保将样本的测量值与反映一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的函数形式的参考进行比较,或能够与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的多于一种形式进行比较。例如,可以进行处理步骤以确保将样本的测量值与反映已经历翻译后修饰,或已经历和未经历翻译后修饰的目的蛋白质的参考进行比较。 在一些实施例中,根据一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的氨基酸序列确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中对应氨基酸类型的氨基酸数目。在一些实施例中,目的蛋白质、肽、寡肽或多肽中每种氨基酸类型的氨基酸数目是指氨基酸序列中氨基酸类型的出现频率,并且可以例如通过使用计算机程序求对应于目的蛋白质、肽、寡肽或多肽的公开可获得的FASTA序列内的氨基酸类型的特性的出现的数目来确定。不考虑翻译后修饰。例如,鸡蛋清溶菌酶是目的蛋白质。鸡蛋清溶菌酶的一个分子的氨基酸序列如下: 氨基酸类型K在蛋白质序列中出现6次(斜体)。每蛋白质分子的K数目是6,这在参数方程组1中是a 在一些实施例中,当计算用于创建参考或参考数据库的a 表4:氨基酸类型内氨基酸的PTM规则 /> 许多PTM消除了使用经典方法诸如埃德曼降解或现有技术方法诸如荧光测序对目的蛋白质进行测序的可能性。如果PTM消除了使用埃德曼降解和荧光测序对蛋白质进行测序的可能性,则“Y”出现在消除埃德曼列中。然而,含有用所有PTM修饰的蛋白质的样本能够用本发明的方法鉴定,特别是当使用本文所公开的规则计算氨基酸数目时。 在一些实施例中,可以为已经历某些翻译后修饰的目的蛋白质提供参考,并且可以为未经历某些翻译后修饰的目的蛋白质提供另一参考。在一些实施例中,当根据目的蛋白质的蛋白质序列确定每种氨基酸类型的氨基酸数目时,本发明的方法用于通过提供应用PTM规则的目的蛋白质的参考值,和不应用任何规则的附加参考值来检测目的蛋白质是否经历了特定PTM。因为PTM可以是蛋白质行为的动态调节剂,所以该结果可以指示疾病。 在一些实施例中,使用本发明的方法标记和测量未修饰的氨基酸类型。在这种情况下,在表4的规则列中存在-1(规则=-1),并且从目的蛋白质的蛋白质序列中的该氨基酸类型的氨基酸的出现的数目中减去1。例如,用OPA标记来标记赖氨酸(K)氨基酸类型并且测量未修饰的赖氨酸氨基酸,并且用F1-DIBO标记来标记丝氨酸并且测量未修饰的丝氨酸氨基酸。在一些实施例中,使用本发明的方法标记和测量氨基酸类型的修饰的和未修饰的氨基酸。在这种情况下,在表4的规则列中存在0(规则=0),并且当实验或理论数据示出观察到所指示的翻译后修饰时,没有值从目的蛋白质的蛋白质序列中的该氨基酸类型的氨基酸的出现的数目中减去。例如,用TCE标记来标记色氨酸(W)氨基酸类型并且测量未修饰的和修饰的色氨酸氨基酸,因为取代基与芳环的附接不显著影响芳环对自由基介导的TCE化学的亲核性。用TCE标记来标记酪氨酸(Y)氨基酸类型并且测量未修饰的和修饰的酪氨酸氨基酸,因为取代基与芳环的附接不显著影响芳环对自由基介导的TCE化学的亲核性。总结用于标记表4中报告的氨基酸类型内的所有(未修饰的+修饰的)或未修饰的氨基酸的这些规则,如果翻译后修饰不影响与选择用于标记氨基酸类型的标记(例如染料)反应的R基团部分,则标记未修饰的和修饰的氨基酸两者,并且如果翻译后修饰确实影响与选择用于标记氨基酸类型的染料反应的R基团部分,则仅标记未修饰的氨基酸。 在一些实施例中,氨基酸类型内的氨基酸可以在标记反应内在它们的修饰的和未修饰的形式之间转换。具体地,修饰的氨基酸可以转换为未修饰的氨基酸。这使得能够标记氨基酸类型内的氨基酸类型(未修饰的+修饰的)的所有氨基酸。这通过在与标记反应之前首先用化学反应将氨基酸类型的修饰的氨基酸转换为氨基酸类型的未修饰的氨基酸来实现。例如,修饰的氨基酸可以经由用三(2-羧乙基)膦(TCEP)还原转换为未修饰的半胱氨酸氨基酸。作为另一实例,糖基化的(修饰的)丝氨酸、苏氨酸或天冬酰胺氨基酸可以通过升高样本溶液的pH,例如升高至pH 10.5而转换为未修饰的丝氨酸、苏氨酸或天冬酰胺氨基酸,如在https://www.hindawi.com/journs/ijcc/2012/64092中所描述的。这将聚糖残基从氨基酸R基团上裂解下来,使得氨基酸不再被修饰。酶可以替代地用于将修饰的氨基酸转换为未修饰的氨基酸。如果标记方法在与标记反应之前并入转换步骤,使得该氨基酸类型的所有(未修饰的+修饰的)氨基酸可用于与标记反应,则当计算目的蛋白质的蛋白质序列中该氨基酸类型的氨基酸数目时不应用所讨论的PTM规则。例如,当标记半胱氨酸氨基酸类型的所有(未修饰的+修饰的)氨基酸时,参与二硫键的半胱氨酸氨基酸数目不从蛋白质序列中显示的C氨基酸数目中减去,因为修饰的半胱氨酸氨基酸已经经由还原转换为未修饰的氨基酸。 在一些实施例中,当TCEP不用作样本中半胱氨酸氨基酸类型的标记的一部分时,导致仅未修饰的、还原的半胱氨酸被标记(C 在一些实施例中,目的蛋白质组或亚蛋白质组的w 在一些实施例中,当确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的序列中每种氨基酸类型的氨基酸数目时,在确定该序列中每种氨基酸类型的氨基酸出现的数目和/或应用PTM规则之前,从该序列中去除生物裂解的信号序列或区域。这提供了成熟蛋白质中每种氨基酸类型的氨基酸数目。然而,如果一种或多种蛋白质、肽、寡肽、多肽、蛋白质复合物或蛋白质、肽、多肽、寡肽的混合物不是成熟蛋白质,则这不需要。 在一些实施例中,当存在目的蛋白质复合物时,将蛋白质复合物的每个亚基中每种氨基酸类型的氨基酸数目与蛋白质复合物的一个或多个剩余亚基中每种对应氨基酸类型的氨基酸数目相加。例如,为了计算26S蛋白酶体蛋白质复合物的W和K氨基酸类型的氨基酸数目,在26S蛋白酶体的所有亚基上对W氨基酸类型的氨基酸数目求和,并且在26S蛋白酶体的所有亚基上对K氨基酸类型的氨基酸数目求和。 在一些实施例中,确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物中每种氨基酸类型的氨基酸数目以提供a 在替代实施例中,作为该方法的一部分,确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的一个或多个序列。在一些实施例中,使用埃德曼蛋白质降解或质谱确定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的一个或多个序列。在所有实施例中,不必对样本进行测序。 在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的一个或多个蛋白质序列是已知的。在一些实施例中,一个或多个蛋白质序列是已知的并且提供在数据库中。在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的序列提供在数据库中。优选地,数据库是UniProt数据库、UniProt蛋白质组数据库、Swiss Prot数据库、基因库(GenBank)、Blast、NCBI蛋白质数据库或基因库序列读取存档(SRA)。 在一些实施例中,具体地目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,或包含目的亚蛋白质组或蛋白质组的蛋白质的序列在数据库中显示和访问。该数据库是列出所有已知蛋白质序列的较大数据库,如UniProt数据库,的子集。可以使用它们的标识符,诸如它们的UniProt KB标识符,和它们的序列信息下载,例如以FASTA格式,从公开可获得的数据库中检索蛋白质序列。每个序列的名称或标识符也可以在这个较小的数据库中存储和访问,或者在具有与蛋白质序列数据库相同索引的对应数据库中存储和访问。这确保,例如,如果用户发现样本内存在第10种目的蛋白质,因为参考数据库(例如参考数据库的第10行)内的第10种目的蛋白质满足检验2,则用户可以通过访问含有每种目的蛋白质的名称和/或标识符和/或完整蛋白质序列的对应数据库的第10个条目(例如行)来方便地访问第10种目的蛋白质的名称和/或标识符和/或完整蛋白质序列(参见本文提供的样本表)。在一些实施例中,如果已经进行任选的预处理步骤以例如组合(例如卷起)将反映在参考数据库中的蛋白质复合物的亚基,则更新蛋白质序列名称和/或标识符和/或完整蛋白质序列的数据库。 在一些实施例中,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的a 例如,数据库含有人血浆蛋白质组内所有蛋白质的C、K和W氨基酸类型的氨基酸数目。例如经由蛋白质图谱、肽图谱或Proteome Xchange数据库访问人血浆蛋白质组内的蛋白质,该数据库提供公开可获得的蛋白质鉴定和定量数据的资源库(https://www.nature.com/articles/nbt.2839、http://proteomecentral.proteomexchange.org/cgi/GetDataset)。提供并且可公开获得的标识符,例如UniProt KB标识符,用于检索每个标识符的蛋白质序列。一旦检索蛋白质序列,就丢弃成熟蛋白质中不存在的信号序列,并且将蛋白质复合物中亚基的氨基酸序列组合成一个条目。在一些实施例中,C、K和W氨基酸类型的氨基酸数目通过在应用表4中提供的规则后确定处理的蛋白质序列内C、K和W氨基酸类型的出现的数目来计算,以避免计算将不与标记反应的氨基酸类型的氨基酸,因为它们以使得它们不与标记反应的方式翻译后修饰。例如,如果指示赖氨酸氨基酸被翻译后修饰以与谷氨酰胺形成异肽键,并且另一赖氨酸氨基酸被乙酰化,则从该蛋白质的蛋白质序列内K氨基酸类型的出现总数中减去2。优选地,该步骤用计算机程序自动化,其根据表4中列出的逻辑规则处理蛋白质序列。如果在标记反应之前或期间将修饰的氨基酸类型转换为未修饰的氨基酸类型(如果需要标记氨基酸类型的未修饰的加修饰的氨基酸),则可以推翻从氨基酸类型的氨基酸数目中减去1的规则。例如,如果修饰的和未修饰的半胱氨酸氨基酸类型都被标记,TCEP用于还原样本中含有的二硫化物键合的半胱氨酸,因此忽略用于二硫化物键合的半胱氨酸的逻辑规则,并且不从蛋白质序列内C氨基酸类型的出现的数目中减去任何值。通常,蛋白质序列内未修饰的和修饰的氨基酸的出现数目等于蛋白质序列内C氨基酸类型的所有出现的数目,因为除二硫键形成以外的半胱氨酸氨基酸的翻译后修饰是罕见的。 作为另一实例,对于C、K和W氨基酸类型,应用这些步骤产生以下氨基酸数目,其可以显示在数据库中: 在该实例中,用户将测量样本中C、W和的氨基酸浓度。为了创建参考数据库,将参数方程1顺序地应用于数据库的每一行以产生作为任何蛋白质浓度t的函数的每种目的蛋白质的参考: 每种目的蛋白质p 在其它实施例中,如果用户将测量C、K和W氨基酸类型的标记的值,则将每种氨基酸类型的校准因子fn并入参考数据库中。 例如,C氨基酸类型是氨基酸类型1,并且根据线性校准曲线确定的C氨基酸类型的校准因子f f K氨基酸类型是氨基酸类型2,并且根据线性校准曲线确定的K氨基酸类型的校准因子f f W氨基酸类型是氨基酸类型3,并且根据线性校准曲线确定的W氨基酸类型的校准因子f f 为了创建参考数据库,将参数方程3顺序地应用于数据库的每一行以产生作为蛋白质浓度t的函数的每种目的蛋白质的参考: 当根据氨基酸类型1、氨基酸类型2和氨基酸类型n的测量的标记(例如标记的信号)提供样本的测量时,目的蛋白质组或亚蛋白质组的参考线的参数方程由参数方程4给出: 其中n 混合物 当本发明的方法用于检测蛋白质、蛋白质组、肽、寡肽、多肽、蛋白质复合物或亚蛋白质组的混合物时,使用本部分中概述的方法提供单一蛋白质、蛋白质组、肽、寡肽、多肽、蛋白质复合物或亚蛋白质组的参考。如比较步骤部分所概述的,检测混合物是因为在样本中检测到多种纯蛋白质、蛋白质组、肽、寡肽、多肽、蛋白质复合物或亚蛋白质组的存在,并且本发明的方法用于提供混合物内每种组分的比例和浓度。 特殊情况 这些实施例有两种特殊情况,以参数方程组的形式描述; 在特殊情况1中,样本的摩尔浓度是已知的,并且这是常数SC。因此,如果样本内存在目的蛋白质n 一般的参数方程组是 在特殊情况1中,一般的参数方程组简化为n维空间中的点。 p 这不再是参数方程,因为它不是共同参数(自变量)的函数,因为变量t被替换为常数SC。在特殊情况1中,对于目的蛋白质p p 这描述了n维空间中的点,其中n是样本中标记和测量的氨基酸类型的数目。 在特殊情况1中,如果存在目的蛋白质p S S S 其中S 在特殊情况1中,如果完成检验1,则目的蛋白质p 在特殊情况1中,如果存在目的蛋白质p 使用距离公式诸如欧几里得距离计算样本点(S 仅在特殊情况1中,可计算样本中每个标记和测量的氨基酸类型内的氨基酸数目。这是可获得的,因为样本的每种氨基酸类型的氨基酸数目等于样本的该氨基酸类型的氨基酸浓度除以样本的已知摩尔浓度。样本中氨基酸类型1的氨基酸数目是N 当在特殊情况1内计算样本中每种氨基酸类型的氨基酸数目时,完成检验1,条件是: N N N 当样本点恰好等于参考点时,完成检验1。 当在特殊情况1内计算样本中每种氨基酸类型的氨基酸数目时,当目的蛋白质、肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组中每种氨基酸类型的氨基酸数目小于或等于样本中每种氨基酸类型的氨基酸数目的误差容限ε时,完成检验2。这通过确定样本点与参考点之间的距离D,例如欧几里得距离来评价。 该式为: 在特殊情况2中,样本内目的蛋白质、肽、寡肽、多肽、亚蛋白质组或蛋白质组n 一般参数方程保持 然而,未使用检验1评价目的蛋白质p S S S 因为已知样本内存在目的蛋白质、肽、寡肽、多肽、亚蛋白质组或蛋白质组n 在一些实施例中,如果已对样本执行分离步骤,则应对理论参考进行相同的分离步骤。作为实例,对样本的分离步骤可以包括通过并入离心分子量筛截过滤器的离心过滤装置过滤,其中分子量小于筛截过滤器分子量的蛋白质穿过过滤器进入滤液中,并且分子量大于筛截过滤器的蛋白质不穿过过滤器,并且因此不存在于滤液中,诸如Amicon 50kDa离心过滤单元。如本文所公开的,该步骤可以用于从样本中消耗高丰度高分子量蛋白质。如果对样本执行该步骤,则分子量大于50kDa的蛋白质也应从用于计算理论参考的数据库中去除。这模拟了过滤步骤后样本内不再存在分子量大于50kDa的蛋白质的情况。过滤步骤减少了样本内平均蛋白质序列中每种氨基酸类型的氨基酸数目。样本内平均蛋白质序列的分子量降低,因为分子量例如大于50kDa的蛋白质不再包括在样本中,并且分子量和蛋白质长度线性相关。 比较 将样本的每种标记的氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的已知标记值、氨基酸浓度和/或数目进行比较。优选地,一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的已知标记值、氨基酸浓度和/或数目是参考。在一些实施例中,如果样本的每种标记的氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的已知标记值和/或作为蛋白质浓度的函数的氨基酸浓度和/或数目相同,或在误差容限内,然后对样本中一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽或寡肽、亚蛋白质组或蛋白质组的混合物的存在和/或浓度和/或量进行阳性鉴定。 如果样本的每种标记的氨基酸类型的测量的标记、氨基酸浓度和/或氨基酸数目在一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的已知标记值和/或作为蛋白质浓度的函数的氨基酸浓度和/或数目的误差容限之外,则在样本中未鉴定出一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽或寡肽、亚蛋白质组或蛋白质组的混合物的存在。如果样本中不存在目的蛋白质,则其在样本中不能具有浓度。在一些实施例中,如果样本中目的蛋白质的存在是已知的,则通过求解蛋白质浓度(t)的参考函数来确定蛋白质浓度。在一些实施例中,通过将样本体积乘以样本中鉴定的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度来鉴定目的蛋白质的量。 如参考部分所描述的,每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组可以独特地由参考描述。每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的参考提供了每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的值(每种氨基酸类型的测量的标记例如标记的信号和/或每种氨基酸类型的氨基酸浓度)作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的浓度的函数或每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的每种氨基酸类型的氨基酸数目。每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的参考可以是一组函数,其预测每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的值(每种氨基酸类型的测量的标记,例如标记的信号、每种氨基酸类型的氨基酸浓度)作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的浓度的函数。替代地,如果样本的摩尔蛋白质浓度是已知的,则参考是每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的每种对应氨基酸类型的氨基酸数目,或在每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的样本浓度下每种对应氨基酸类型的氨基酸浓度或标记的值。将样本的测量值(每种氨基酸类型的测量的标记,例如标记的信号、每种氨基酸类型的氨基酸浓度,和/或每种氨基酸类型的氨基酸数目)与由参考提供的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的值进行比较。在一些实施例中,如果样本的测量值与由参考提供的值相同或在参考提供的值的误差容限内,则在样本中鉴定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在和/或浓度和/或量。在一些实施例中,如果样本的测量值与由参考提供的值相同或在参考提供的值的误差容限内,则在样本中鉴定一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在。在一些实施例中,如果样本的测量值在由参考提供的值的误差容限之外,则在样本中未鉴定出一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在。 在一些实施例中,将样本的两种或更多种氨基酸类型中的每一种的测量的标记(例如,氨基酸类型W和K的荧光强度)与由目的蛋白质的相同氨基酸类型的参考提供的已知标记值(例如,氨基酸类型W和K的荧光强度)进行比较。如果样本的测量的标记(例如氨基酸类型W和K的荧光强度)与由作为蛋白质浓度的函数的目的蛋白质的参考提供的已知标记值(例如氨基酸类型W和K的荧光强度)相同或在其误差容限内,则对样本中目的蛋白质的存在和/或浓度和/或量进行阳性鉴定。如果样本的测量的标记(例如氨基酸类型W和K的荧光强度)与由作为蛋白质浓度的函数的目的蛋白质的参考提供的已知标记值(例如氨基酸类型W和K的荧光强度)不相同,或在其误差容限之外,则该目的蛋白质的存在被鉴定为不存在于样本中。因为在样本中未鉴定出目的蛋白质,所以在样本内没有目的蛋白质的浓度或量。 在一些实施例中,将样本的两种或更多种氨基酸类型中的每一种的氨基酸浓度(例如,氨基酸类型W和K的氨基酸浓度)与由作为蛋白质浓度的函数的目的蛋白质的参考提供的相同氨基酸类型的氨基酸浓度(例如,氨基酸类型W和K的氨基酸浓度)进行比较。如果样本的氨基酸浓度(例如氨基酸类型W和K的氨基酸浓度)与由作为蛋白质浓度的函数的目的蛋白质的参考提供的氨基酸浓度(例如氨基酸类型W和K的氨基酸浓度)相同或在其误差容限内,则对样本中目的蛋白质的存在和/或浓度和/或量进行阳性鉴定。如果样本的氨基酸浓度(例如氨基酸类型W和K的荧光强度)与由作为蛋白质浓度的函数的目的蛋白质的参考提供的氨基酸浓度(例如氨基酸类型W和K的荧光强度)不相同,或在其误差容限之外,则该目的蛋白质被鉴定为不存在于样本中。因为在样本中未鉴定出目的蛋白质,所以在样本内没有目的蛋白质的浓度或量。 在一些实施例中,将样本的两种或更多种氨基酸类型中的每一种的氨基酸数目(例如,氨基酸类型W和K的每蛋白质的氨基酸数目)与目的蛋白质的相同氨基酸类型的参考氨基酸数目(例如,氨基酸类型W和K的每蛋白质的氨基酸数目)进行比较。如果样本的每种氨基酸类型的氨基酸数目(例如,氨基酸类型W和K的每蛋白质的氨基酸数量)与目的蛋白质的每种氨基酸类型的参考氨基酸数目(例如,氨基酸类型W和K的每蛋白质的氨基酸数目)相同,或在其误差容限内,则对样本中目的蛋白质的存在进行阳性鉴定。如果样本的每种氨基酸类型的氨基酸数目(例如,氨基酸类型W和K的每蛋白质的氨基酸数量)在目的蛋白质的参考氨基酸数目(例如,氨基酸类型W和K的每蛋白质的氨基酸数目)的误差容限之外,则该目的蛋白质被鉴定为不存在于样本中。因为在样本中未鉴定出目的蛋白质,所以在样本内没有目的蛋白质的浓度或量。当样本的摩尔蛋白质浓度是已知的并且属于特殊情况1时,测量样本中每种氨基酸类型的氨基酸数目是唯一可用,所以该实施例特有的比较步骤将在此讨论。 参考的一般形式是n维空间中的线,其中n是样本中标记和测量的氨基酸类型的数目。参考可以用参数方程组来描述,该参数方程组指定了坐标中的每一个(氨基酸浓度,或测量的标记,例如标记的信号)如何作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的浓度t的函数而变化。在参考部分中提供并且解释了特定参数方程。一般参数方程为: 其中p ·当样本的测量值以氨基酸浓度提供并且参考线描述了目的蛋白质、肽、寡肽、多肽或蛋白质复合物时,c ·当样本的测量值以氨基酸浓度提供并且参考线描述了目的蛋白质组或亚蛋白质组时,c ·当样本的测量值以测量的标记,例如标记的信号,提供并且参考线描述了目的蛋白质、肽、寡肽、多肽或蛋白质复合物时为c ·当样本的测量值以测量的标记,例如标记的信号,提供并且参考线描述了目的蛋白质组或亚蛋白质组时为c 其中t是含有参考的溶液的蛋白质浓度,该蛋白质浓度是n个函数中的每一个中的共同自变量(或参数),该函数共同指定了n维中的每一个中的参考线,并且其中t是针对大于或等于 参考线可以替代地描述为n维空间中的向量,这将在后面对假设检验2的讨论内进行解释。 在本发明的方法中标记和测量了n种氨基酸类型(n≥2)。样本的测量值总是提供n维空间中的点,因为对于n维中的每一个提供了一个值。该点具有坐标(S 上述解释的提供作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的蛋白质浓度的函数的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 参数方程组1、2、3或4用于为本发明的特定实施例生成每个参考线,如参考部分中所解释的。 在比较步骤内,将样本点的测量值与该参考进行比较。在一些实施例中,如果样本的测量值等于由参考线提供的值,则鉴定样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在和/或浓度和/或量。这意味着样本点在参考线上。如果样本点在参考线上,则样本中存在目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的假设为真。为了评价该假设,执行检验1。 在一些实施例中,每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的参考是一组函数,该组函数提供了样本中标记和测量的每种氨基酸类型的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的值作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的蛋白质浓度的函数。检验1将样本的测量值(S 可以非正式地或正式地执行比较。非正式地,通常可以通过对结果作图或者通过将对样本测量的值与参考函数进行比较,通过眼睛来判断样本点是否在参考线上。例如,标记和测量样本中的氨基酸类型W和K。W氨基酸类型是氨基酸类型1,并且K氨基酸类型是氨基酸类型2。目的蛋白质溶菌酶(LYZ)的参考是: 针对样本测量的60μM W和60μM K的氨基酸浓度。当将针对样本测量的氨基酸浓度与参考进行比较时,显然样本点在参考线上,并且该参考具有10uM的蛋白质浓度t(图X)。 正式地,检验1涉及将针对样本测量的每个值(S S S S 其中方程的数目等于样本中标记和测量的n种氨基酸类型的数目。如果n个方程包含可以对t的单一值求解的检验1,则每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 在一些实施例中,这可以被正式地陈述为如果,则完成检验1 这表明如果对于所有t≥0,存在t的值,使得对于所有k=1,2,...,n,S 继续该实例,针对该样本测量的每个值被设置为等于包含该参考的对应函数,并且确定是否存在t的单一解。 60μM=6t 60μM=6t 如果存在t的值,使得对于所有k=1,2,...,n,s 在一些实施例中,如果样本的测量值在由目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的参考提供的值的误差容限ε内,则还可以鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在和/或浓度和/或量。这反映了实验测量既不具有无限准确度也不具有无限精确度的事实,因此当样本内含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 检验2考虑了实验误差,并且通过检验样本点是否在参考线的误差容限ε内来检验目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 点与线之间的最短距离是点与线之间的垂直距离。除了例如通过一般参数方程进行参数描述之外,参考线还可以用向量格式来描述,该向量格式允许计算参考线上的精确点(蛋白质浓度),该精确点(蛋白质浓度)经由点积产生该垂直距离。然后,使用距离公式,例如欧几里得距离公式来求样本点与该垂直距离点之间的距离,并且将该距离与误差容限ε进行比较,以确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 线与点之间的最短距离总是线与点之间的垂直距离。这是因为点与线之间除了90度以外的任何其它角度将形成斜边,其长度将总是大于垂直距离。 最短距离,即垂直距离,通过求参考线的方向与样本点和参考线上的任何点之间的向量的点积,将点积设置为等于0,并且求解参考线的浓度来实现的,该浓度提供了样本点与参考线之间的垂直线。点积是表示两个向量A和B之间的角度关系的标量值,即A·B=|A|*|B|*coSθ其中值|A|和|B|分别表示向量A和B的长度,并且θ是两个向量之间的角度。如果A和B垂直(即彼此成90度),则点积将为零,因为cos 90°将为零。计算样本点与参考线之间的距离,并且如果该距离小于或等于误差容限,则将目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组鉴定为以提供垂直(最小)距离的参考线上的蛋白质浓度存在。 在一些实施例中,在本发明的方法中使用其它距离度量,例如城市街区(cityblock)、切比雪夫(chebychev)、相关量、余弦、汉明(hamming)、雅科比(jaccard)、马氏(mahalanobis)、闵可夫斯基(minkowski)、seuclidean或斯皮尔曼(spearman)。 检验2的一般方法是: 9.令R为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 10.在向量格式中求参考线R的方程 11.求参考线R上的点P的一般方程 12.求点P在参考线R上的精确位置,称为Q,使得从S到P的向量垂直于R。这意味着求参考线R上的点Q,使得S和Q之间的向量得到垂线。这是通过求从S到P的向量与R的方向的点积(·),将其设置为等于0,并且求解t以提供t的值而实现的,当将该值代入R上的点P的一般方程中时,产生垂直向量。如果样本内含有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 13.使用称为D的距离公式求Q和S之间的距离。 14.评价D是否小于误差容限ε。 15.如果D>ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 16.如果D≤ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 为了说明如何执行检验2,该方法应用于在本部分中讨论的一般参数方程。 例如,目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 参考线的向量形式是R=<0,0,...,0〉+t 参考线上的点(P)的一般方程是 P=<0+c 我们测量的样本点(S)具有坐标S=(S 从我们测量的样本点(S)到参考线上的任何点(P)的向量是P-S P-S= 为了使该向量垂直,该向量与参考线 c c c t(c 该t的解是目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 为了确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p P=<0+c Q是点,它是对应于t的解的参考的值的集合。S也是点。 使用距离公式求S与Q之间的距离D。 例如,点S与点Q之间的欧几里得距离公式为 因此,我们有 ε是例如由用户提供的误差容限。 如果D>ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 如果D≤ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 并且检验2为阳性。如前所述,通过将目的蛋白质蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 回到LYZ实例,标记和测量样本中的氨基酸类型W和K。W氨基酸类型是氨基酸类型1,并且K氨基酸类型是氨基酸类型2。代替测量样本的60μM W和60μM K的氨基酸浓度,测量样本的56μM W和62μM K的氨基酸浓度。用户供应了距离阈值为6uM,对应于针对其样本测量的值的大约10%,以说明实验误差。在一些实施例中,误差容限的单位(即氨基酸浓度,例如μM,或标记的值,例如A.U,或氨基酸数目,例如标量)是与针对样本测量的值相同的单位。 目的蛋白质溶菌酶(LYZ)的参考是由参数方程组1提供的: 如所描述的,当测量样本的氨基酸浓度,并且参考描述了目的蛋白质、肽、寡肽、多肽或蛋白质复合物时,c 参考线的向量形式是R=<0,0,...,0〉+t 对于目的蛋白质LYZ,这变为R=<0,0>+t<6,6> 参考线上的点(P)的一般方程是 P=<0+6t,0+6t> 测量的样本点(S)具有坐标S=(56,62) 从测量的样本点(S)到参考线上的任何点(P)的向量是P-S P-S=<6t-56,6t-62〉 为了使该向量垂直,该向量与参考线的方向(6,6)的点积(-)必须为0。因此,我们设置 <6t-56,6t-62〉-<6,6〉=0 36t-336+36t-372=0 72t=708 该t的解是目的蛋白质LYZ的蛋白质浓度,其中样本与参考线之间的距离最短。因此,如果目的蛋白质LYZ存在于样本内,则LYZ以蛋白质浓度t存在于样本内。t的单位是提供样本的测量的氨基酸浓度的相同单位。如果提供的样本的测量的氨基酸浓度以μM计,则t的单位为μM。如果提供的样本的测量的氨基酸浓度以nM计,则t的单位为nM。如果提供的样本的测量的氨基酸浓度以pM计,则t的单位为pM。这里,提供的样本的测量的氨基酸浓度以μM计,因此t的单位为μM。如果LYZ存在于样本内,则其以9.833μM的蛋白质浓度存在于样本内。 为了确定目的蛋白质LYZ是否存在于样本内,在参考线上求点Q,其给出垂直距离。Q=P(t)。 P=(0+6t,0+6t)=(6t,6t) Q是点,它是对应于t的解的参考的值的集合。S也是点。 使用距离公式求S与Q之间的距离D。 例如,点S与点Q之间的欧几里得距离公式为 因此,我们有 D=4.24 用户已指定误差容限ε为6。 如果D>ε,则目的蛋白质LYZ不存在于样本内。 如果D≤ε,则目的蛋白质LYZ以9.833μM的蛋白质浓度t存在于样本内。 D≤ε。因此,LYZ以9.833μM的蛋白质浓度存在于样本内。 样本体积为100μL,因此LYZ的蛋白质量为9.833μM×100μL=0.9833nmol。在样本中已经鉴定了LYZ的存在,并且LYZ的分子量为14.3kDa。因此,样本中LYZ的质量为14.06ng。 在优选的实施例中,用户对误差阈值的选择由样本中标记和测量的氨基酸类型的数目和样本中测量的值指导。由于距离计算中的总和 样本点与线之间的总距离将随着维数的增加而增加。附加地,如果根据标记的信号提供针对样本测量的值,则该值取决于校准因子或校准函数,并且可能显著大于氨基酸浓度值。提供用于已知W浓度(μM)的W信号(AU)的示例校准因子f是 f 因此,在一些实施例中,误差容限由用户输入的公差值提供,该公差值乘以样本值平方的平方根,反映了距离计算。这由方程10提供: 其中ε是误差容限, 在替代优选的实施例中,用户检验样本中多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在。例如,存在如参考部分所描述的多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的参考数据库。用户怀疑样本中存在的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的数目。怀疑的样本中存在的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的数目是c。 例如,用户怀疑一种目的蛋白质存在于样本中,因此c=1。作为另一实例,用户怀疑两种目的蛋白质组存在于样本中,因此c=2。在这种情况下,用户对目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组中的每一种进行检验2,生成到每种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的每条参考线的距离D。例如,如果存在50种目的蛋白质,则存在目的蛋白质p 该方法可以正式表达为:令β为在参考数据库中针对所有目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组计算的D值的集合。集合β中存在αD值。c阶统计量(在统计学上)是集合的第c个最小(第c个最小)值。β的c阶统计量是β 因此,在参考数据库中对于c种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的D≤ε,并且因此在样本中鉴定c种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组。 当c>1时或当使用检验2鉴定样本中多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组时的方法和误差阈值ε在本部分后面的混合物小节中解释。 在一些实施例中,执行检验1。在一些实施例中,执行检验2。在一些实施例中,执行检验1和检验2两者。在一些实施例中,执行检验1,并且如果在用检验1的样本中未鉴别出目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 在一些实施例中,将样本的每种标记的氨基酸类型的值(例如测量的标记、氨基酸浓度和/或氨基酸数目)与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组的相同的两种或更多种氨基酸类型的参考(即已知标记值、氨基酸浓度和/或氨基酸数目)进行比较,并且因为多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组满足检验1和/或检验2,所以多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组被鉴定为存在于样本内。鉴定了多于一种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的存在,因此鉴定了目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的存在。蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的浓度和/或量也使用如混合物部分所描述的样本点与每种混合物组分之间的垂直距离来鉴定。如果混合物是简单的混合物,例如5种或更少目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物,则优选该实施例。 在替代实施例中,将样本的每种标记的氨基酸类型的值(例如测量的标记、氨基酸浓度和/或氨基酸数目)与目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的相同的两种或更多种氨基酸类型的参考(例如已知标记值、氨基酸浓度和/或氨基酸数目)进行比较,并且因为其参考满足检验1或检验2,所以目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物被鉴定为存在于样本中。在该实施例中,目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物以及目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的蛋白质浓度被鉴定为满足检验1或检验2的t的值。这两个实施例之间的区别在于,在该实施例中,由方程11或方程12提供的氨基酸的加权平均数用于生成混合物的氨基酸的加权平均数,并且这在参数方程2或4的集合内使用以生成目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物以及目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的参考。如果混合物不是简单的混合物,例如多于5种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物,则优选该实施例。 在一些实施例中,样本的总摩尔蛋白质浓度是未知的。将测量的A 在一些实施例中,当样本的总摩尔蛋白质浓度未知时,将样本中每种标记的氨基酸类型的氨基酸的氨基酸浓度与使用参数方程组1针对一种或多种目的蛋白质、肽、寡肽、多肽或蛋白质复合物的相同(即对应)氨基酸类型的氨基酸浓度生成的参考进行比较。在一些实施例中,当样本的总摩尔蛋白质浓度未知时,将样本中每种标记的氨基酸类型的氨基酸的氨基酸浓度与使用参数方程组2针对一种或多种目的蛋白质组或亚蛋白质组的相同(即对应)氨基酸类型的氨基酸浓度生成的参考进行比较。这允许鉴定未知蛋白质浓度的蛋白质,并且同时确定其蛋白质浓度。例如,将样本中W和K氨基酸类型的氨基酸浓度与针对目的蛋白质n 在一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽或寡肽、亚蛋白质组或蛋白质组的混合物中的对应氨基酸类型的氨基酸浓度可以使用参数方程组1或2测量或可以作为蛋白质浓度的函数提供,该函数并入了一种或多种目的蛋白中的每种氨基酸类型的氨基酸数目。参数方程组1或2已经在参考部分中详细描述,并且在此再现。 参数方程组1是: 参数方程组2是: 如果样本中每种标记的氨基酸类型的浓度与作为通过参数方程组1或2的蛋白质浓度的函数提供的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽或寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的浓度相同,或在其误差容限ε内,则可以鉴定样本内这些一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的存在和/或浓度和/或量。检验1评估样本中每种标记的氨基酸类型的浓度是否与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽或寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的浓度相同,并且检验2评估样本中每种标记的氨基酸类型的浓度是否在一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽或寡肽、亚蛋白质组或蛋白质组的混合物的相同氨基酸类型的浓度的误差容限ε内。例如,将样本中W和K的氨基酸浓度与作为目的蛋白质的蛋白质浓度的函数提供的目的蛋白质中W和K的氨基酸浓度进行比较。如果样本中的W和K的氨基酸浓度与作为目的蛋白质的蛋白质浓度的函数提供的目的蛋白质中W和K的氨基酸浓度相同(检验1),或在其误差容限内(检验2),则样本中该目的蛋白质的存在被肯定地鉴定,并且样本中目的蛋白质的浓度和/或量是满足检验1或检验2的目的蛋白质的蛋白质浓度。如果样本中W和K的氨基酸浓度在作为目的蛋白质的蛋白质浓度的函数提供的目的蛋白质中W和K的氨基酸浓度的误差容限之外,则样本中该目的蛋白质的存在不存在。因为样本内不存在目的蛋白质,所以根据定义,样本内目的蛋白质的蛋白质浓度和/或量为零。 在一些实施例中,当蛋白质组或亚蛋白质组为目的蛋白质组或亚蛋白质组时,将样本的每种标记的氨基酸类型的测量的标记、每种标记的氨基酸类型的氨基酸浓度和/或每种氨基酸类型的氨基酸数目与提供目的蛋白质组或亚蛋白质组的对应的两种或更多种氨基酸类型的已知标记值、对应的两种或更多种氨基酸类型的平均氨基酸浓度,或对应两种或更多种氨基酸类型的氨基酸的平均数的参考进行比较。 在一些实施例中,将样本的每种标记的氨基酸类型的测量的标记、每种标记的氨基酸类型的氨基酸浓度,和/或每种标记的氨基酸类型的氨基酸数目与提供目的蛋白质、肽、多肽、寡肽、蛋白质组或亚蛋白质组的混合物中的标记值、对应的两种或更多种氨基酸类型的平均浓度,或对应的两种或更多种氨基酸类型的氨基酸的平均数的参考进行比较。当本发明的方法不用于确定混合物内组分的相对比例时,使用该实施例。 在一些实施例中,将样本的标记的氨基酸类型的测量的标记或氨基酸浓度与提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物中相同的对应氨基酸类型的已知标记值或浓度的参考线进行比较,通过计算样本点与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的参考线之间的距离来计算样本的标记的氨基酸类型的测量的标记或浓度与作为一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的蛋白质浓度的函数提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的标记值或氨基酸浓度的参考线之间的距离。 在一些实施例中,将样本中每种标记的氨基酸类型的测量的标记与作为每种目的蛋白质、肽、寡肽、多肽或蛋白质复合物的蛋白质浓度的函数提供一种或多种蛋白质、肽、寡肽、多肽或蛋白质复合物的相同(即对应的)氨基酸类型的已知标记值的参考进行比较,其中该参考使用参数方程组3生成。参数方程组3已经在参考部分中详细描述,并且在此再现: 在一些实施例中,将样本中每种标记的氨基酸类型的测量的标记与作为每种目的蛋白质组或亚蛋白质组的蛋白质浓度的函数提供一种或多种目的蛋白质组或亚蛋白质组的相同(即对应)氨基酸类型的已知标记值的参考进行比较,其中该参考使用参数方程组4生成。参数方程组4已经在参考部分中详细描述,并且在此再现: 例如,将样本中标记的氨基酸类型W和K的荧光强度与作为目的蛋白质的蛋白质浓度的函数的目的蛋白质的W和K的参考荧光强度进行比较,其中该参考使用参数方程组3提供。 在一些实施例中,如果样本中每种标记的氨基酸类型的测量的标记与作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物的蛋白质浓度的函数提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的相同(即对应)氨基酸类型的已知标记值的参考相同或在其误差容限内,则可以对样本内一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的存在和/或浓度和/或量进行鉴定。样本的蛋白质浓度是标记值与样本中测量的相同氨基酸类型的标记值相同或在其误差容限内的参考的蛋白质浓度。例如,将样本中氨基酸类型W和C的荧光强度与由作为目的蛋白质的蛋白质浓度的函数的目的蛋白质的参考提供的氨基酸类型W和C的荧光强度进行比较。如果样本中氨基酸类型W和C的荧光强度与由作为目的蛋白质的蛋白质浓度的函数的目的蛋白质的参考提供的氨基酸类型W和C的荧光强度相同,或在其误差容限内,则阳性鉴定样本中目的蛋白质的存在和/或浓度和/或量。鉴定目的蛋白质的存在,并且蛋白质浓度是经由参考函数提供的目的蛋白质的蛋白质浓度,氨基酸类型W和C的荧光强度与样本中测量的氨基酸类型W和C相同或在其误差容限内。如果样本中氨基酸类型W和C的荧光强度在由作为目的蛋白质的蛋白质浓度的函数的目的蛋白质的参考提供的氨基酸类型W和C的荧光强度的误差容限之外,则样本中目的蛋白质的存在和/或浓度和/或量不存在。样本中目的蛋白质的存在不存在,并且因此样本内不存在该目的蛋白质的量和/或浓度。 目的蛋白质或蛋白质组中每种对应氨基酸类型的已知标记值(例如荧光强度)可以预先测量,其由作为目的蛋白质的蛋白质浓度与使用参数方程组3或4生成的参考的函数的参考提供,或者可以作为方法的一部分主动测量。 在一些实施例中,当鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物存在时,样本中每种标记的氨基酸类型的浓度可以用于确定样本的未知总蛋白质浓度;样本的蛋白质浓度是满足检验1或检验2的目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组或蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的蛋白质浓度。 在一些实施例中,通过本文所公开的本发明的方法已确定的样本的总蛋白质浓度提供了患者样本内的总病毒蛋白质浓度。在一些实施例中,病毒蛋白质组的身份已被同时确定。每单一病毒颗粒的总蛋白质浓度是恒定的,并且因此患者样本内病毒蛋白质组的总浓度是患者样本内病毒的相对病毒载量的量度。优选地,这以摩尔浓度单位报告,诸如μM。通常,病毒载量描述为每mL样本中病毒颗粒的数目。通过理论上确定一个病毒颗粒内蛋白质的总摩尔数,可以将本发明的方法内计算的病毒载量转换为这些单位。如果需要,这可以用于将摩尔总蛋白质浓度测量值转换为病毒颗粒每mL样本的标准量度。然而,因为这仅仅涉及将经由本发明的方法直接获得的值除以标量,所以计算病毒载量的两种方法给出了可以用于患者护理和建模的等效定量信息。 在一些实施例中,使用n维空间将样本的标记的氨基酸类型的测量的标记、标记的氨基酸类型的氨基酸浓度和/或每种标记的氨基酸类型的氨基酸数目与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组、蛋白质组的混合物的相同氨基酸类型的已知标记值、相同氨基酸类型的氨基酸浓度或相同氨基酸类型的氨基酸数目进行比较。将例如由参数方程组1、2、3或4构建的参考提供的化学信息投影到样本内标记的n氨基酸类型中的每一种的n维空间中,其中n是标记的氨基酸类型的数目,以便于可视化。例如,当样本中2种氨基酸类型被标记时,存在2维空间。当样本中3种氨基酸类型被标记时,存在3维空间。当样本中4种氨基酸类型被标记时,存在4维空间。这提供了例如由参数方程提供的参考的行为的图形表示,然而,执行本发明的方法不需要该步骤。 n维空间含有作为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物的蛋白质浓度的函数的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的n种氨基酸类型的已知标记值或氨基酸浓度。替代地,如果样本的蛋白质浓度是已知的,则n维空间提供样本的已知蛋白质浓度的一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、蛋白质复合物、亚蛋白质组或蛋白质组的混合物的标记值、氨基酸浓度或氨基酸数目。n维空间中的氨基酸类型与样本中已标记的氨基酸类型相同。例如,如果样本中4种氨基酸类型被标记;W、C、Y和K,则n维空间含有一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物,在样本的蛋白质浓度下,如果已知的话,的W、C、Y和K的已知标记值、氨基酸浓度或氨基酸数目,或如果样本的蛋白质浓度未知的话,作为蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物的蛋白质浓度的函数,提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的标记值或氨基酸浓度。 在一些实施例中,在一般参数方程、参数方程组1、2、3或4内使用每种标记的氨基酸类型的氨基酸数目来计算参考,其提供作为目的蛋白质、肽、寡肽、多肽、蛋白质组或亚蛋白质组的蛋白质浓度的函数的针对目的蛋白质、肽、寡肽、多肽、蛋白质组或亚蛋白质组的样本中标记和测量的每种氨基酸类型的氨基酸浓度或每种氨基酸类型的标记的信号。在一般参数方程、参数方程组1、2、3或4内,目的蛋白质、肽、寡肽、多肽、蛋白质组或亚蛋白质组的蛋白质浓度是变量t。这提供了n维空间中的线。每个参数方程具有域 已对比较步骤进行了一般性描述,并提供了特定实例。现在更详细地描述比较步骤,说明在每个实施例中如何基于可用于样本的信息进行比较。当可用于样本的信息是样本内两种或更多种氨基酸类型的测量的标记时,并且当样本的信息是样本中两种或更多种氨基酸类型的浓度时,在下文描述了比较步骤,该浓度任选地根据样本内两种或更多种氨基酸类型的测量的标记计算。每种情况均参考目的蛋白质和蛋白质组进行描述。然而,针对目的蛋白质概述的方法也可以应用于鉴定目的肽、寡肽、多肽或蛋白质复合物的存在和/或浓度和/或量。当混合物内每种组分的相对比例已知时,针对目的蛋白质组概述的方法也可以应用于鉴定目的亚蛋白质组的存在和/或浓度和/或量,或应用于目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物。这之后是当混合物的每种组分的相对比例未知时使用本发明的方法来鉴定蛋白质或蛋白质组的混合物的单独讨论,并且这作为该方法的一部分来确定。当混合物中每种组分的相对比例未知时,针对蛋白质或蛋白质组混合物概述的方法也适用于鉴定目的肽、寡肽、多肽、蛋白质复合物或亚蛋白质组的混合物的存在和/或浓度和/或量。最后,描述了两种特殊情况,其中已经知道关于样本的一些信息。在特殊情况1中,样本的摩尔蛋白质浓度是已知的,因此可用于计算样本的两种标记的氨基酸类型中的每一种的氨基酸数目。在特殊情况2中,样本内目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物的存在是已知的,并且本发明的方法用于准确地确定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组,或目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的混合物的浓度和/或量。 两种或更多种氨基酸类型的标记的信号,目的蛋白质 当在样本中测量两种或更多种氨基酸类型的标记(例如标记的信号),并且这不转换为样本的两种或更多种氨基酸类型的氨基酸浓度时,在提供目的蛋白质的参考时使用参数方程组3。参数方程组3已在参考部分中充分描述,并且在此再现: 在该方程中,校准因子或校准函数(f 在一些实施例中,如果在氨基酸浓度和在参考部分中描述的每种氨基酸类型的标记信号之间转换的校准函数f不是线性的,或在某些浓度范围,例如高或低氨基酸浓度,上不是线性的,则一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组,或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物中的每一种具有标记参考曲线的信号,而不是参考线。在该实施例中,将样本的标记的氨基酸类型的测量的标记与提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物中相同的对应氨基酸类型的标记值的参考曲线进行比较,通过计算样本点与一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的参考曲线之间的距离来计算样本的标记的氨基酸类型的测量的标记与作为一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的蛋白质浓度的函数提供一种或多种目的蛋白质、肽、寡肽、多肽、蛋白质复合物、亚蛋白质组、蛋白质组或目的蛋白质、肽、多肽、寡肽、亚蛋白质组或蛋白质组的混合物的相同的对应氨基酸类型的标记值的参考曲线之间的距离。样本中目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在在样本点在目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的参考曲线上被鉴定。这通过将包含每种氨基酸类型的参考曲线的函数设置为等于样本中标记和测量的每种氨基酸类型的标记的对应信号,并且如在试验1中那样求解t来评估。如果存在t的单一解,则在样本中鉴定目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的存在,并且目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组的蛋白质浓度是求解方程的t的单一解。替代地,确定样本点与参考曲线之间的最小距离(例如,如10.1109/TPCG.2003.1206938中所描述的),并且检验2评估此最小距离是否小于误差阈值ε。如果样本点与参考曲线之间的最小距离小于误差阈值,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组以提供最小距离的参考曲线上的点的蛋白质浓度存在于样本内。 优选地,在每种氨基酸类型的氨基酸浓度与标记的信号之间转换的校准曲线是线性的。在这种情况下,校准因子f f K氨基酸类型的校准因子f f W氨基酸类型的校准因子f f 在一些实施例中,校准曲线取决于为实验选择的参数和报告氨基酸浓度的浓度单位。例如,基于所提供的C氨基酸类型的校准曲线是 C信号(AU)=50(AU/μM)×C浓度(μM) 校准因子是校准曲线f ,如果C氨基酸类型的氨基酸浓度代替为以nM报告,则C氨基酸类型的校准曲线将是 并且作为校准曲线的斜率的校准因子f 优选地,每种氨基酸类型的校准曲线或校准因子以相同单位提供(例如,在实验中标记和测量的所有氨基酸类型具有以μM为单位的校准因子,或在实验中标记和测量的所有氨基酸类型具有以nM为单位的校准因子)。如参考部分所描述的,每种氨基酸类型的校准因子用于产生每种目的蛋白质的参考。例如,在样本中标记C、K和W氨基酸类型。对于C氨基酸类型(氨基酸类型1),测量的标记的值是690。对于K氨基酸类型(氨基酸类型2),测量的标记的值是3938。对于W氨基酸类型,测量的标记的值是242。已经使用参数方程组3为光蛋白聚糖创建了参考。该参考为: 为了鉴定样本中目的蛋白质的存在和/或浓度和/或量,当可用于样本的值是两种或更多种氨基酸类型的标记的值时,执行检验1和/或检验2。 检验1涉及将针对样本测量的每个值(V V V V 其中方程的数目等于样本中标记和测量的n种氨基酸类型的数目。如果n个方程包含可以对t的单一值求解的检验1,则目的蛋白质p 因为检验1失败,样本点不在参考线上。 检验2的方法是: 1.令R为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 2.在向量格式中求参考线R的方程。这是R=<0,0,...,0>+t 3.求参考线R上的点P的一般方程。这是P=<0+a 4.从S到P的向量是P-S= 5.使用称为D的距离公式求Q和S之间的距离。 6.评价D是否小于误差容限ε。 7.如果D>ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 8.如果D≤ε,则目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 参考线的向量形式是R=<0,0,...,0>+t 对于目的蛋白质光蛋白聚糖,这变为 R=<0,0,0>+t<300,1875,100> 参考线上的点(P)的一般方程是 P=<0+300t,0+1875t,0+100t> 我们测量的样本点(S)具有坐标(V1,V2,V3),其为(690,3938,242) 从我们测量的样本点(S)到参考线上的任何点(P)的向量是P-S P-S=<300t-690,1875t-3938,100t-242> 为了使该向量垂直,该向量与参考线<300,1875,100>的方向的点积(-)必须为0。 因此,我们设置 <300t-690,1875t-3938,100t-242>-<300,1875,100>=0 90000t-207000+3515625t-7383750+10000t-24200=0 3615625t=7614950 该t的解是目的蛋白质光蛋白聚糖的蛋白质浓度,其中样本与参考线之间的距离最短。因此,如果目的蛋白质光蛋白聚糖存在于样本内,则LYZ以蛋白质浓度t存在于样本内。t的单位与校准因子中使用的单位相同。如果校准因子具有单位为μM,则t的单位为μM。如果校准因子具有单位为nM,则t的单位为nM。如果校准因子具有单位为pM,则t的单位为pM。这里,校准因子具有单位为μM,因此t的单位为μM。如果光蛋白聚糖存在于样本内,则其以2.106μM的蛋白质浓度存在于样本内。 为了确定目的蛋白质光蛋白聚糖是否存在于样本内,在参考线上求点Q,其给出垂直距离。Q=P(t)。P=<0+300t,0+1875t,0+100t>=<300t,1875t,100t> Q=(300×2.106,1875×2.106,100×2.106)=(631.837,3948.980,210.613) Q是点,它是对应于t的解的参考的值的集合。S也是点。我们使用距离公式求S与Q之间的距离D。 例如,点S与点Q之间的欧几里得距离公式为 因此,我们有 由方程10提供的误差阈值是 当针对样本测量两种或更多种氨基酸类型的标记的值时,S 用户已指定公差值 因此, 如果D>ε,则目的蛋白质光蛋白聚糖不存在于样本内。 如果D≤ε,则目的蛋白质光蛋白聚糖以2.106μM的蛋白质浓度t存在于样本内。 D≤ε,因为66.997≤200.27。因此,光蛋白聚糖以2.106μM的蛋白质浓度存在于样本内。 样本体积为100μL,因此光蛋白聚糖的蛋白质量为2.106μM×100μL=2.106nmol。样本中已经鉴定了光蛋白聚糖的存在,并且光蛋白聚糖的分子量为36.66kDa。因此,样本中光蛋白聚糖的质量为77.21ng。 两种或更多种氨基酸类型的信号,目的蛋白质组 对于目的蛋白质概述的相同方法适用于目的蛋白质组。不同之处在于使用参考部分中定义的参数方程组4而不是参数方程组3来提供目的蛋白质组的参考。参数方程组4为: 其中目的蛋白质组中每种氨基酸类型的氨基酸的加权数如参考部分所解释的定义,例如使用方程11或方程12。如上所解释的,应用检验1或检验2来确定样本是否含有目的蛋白质组,并且如果在样本中鉴定出目的蛋白质组的存在,则同时确定样本内目的蛋白质组的蛋白质浓度。 例如,SARS-CoV-2蛋白质组的参考已经使用描述的如下的参数方程组4内的W和K氨基酸类型的校准因子提供: 其中W氨基酸类型是氨基酸类型1,并且K氨基酸类型是氨基酸类型2。使用具有相同氨基酸类型和校准函数的参数方程组4,还提供了HIV蛋白质组的参考: 取血液样本并且分离病毒级分。针对W和K氨基酸类型测量的标记的信号分别为327AU和837AU,在n维空间中提供点(327,837)。 使用本文所描述的方法,执行检验2。对于目的SARS-CoV-2蛋白质组,我们有: <1130t-327,4545t-837>·<1130,4545>=0 t=0.191uM,Q=(215.8,868.1),D=115.5 对于目的HIV蛋白质组,我们有: <1090t-327,2093t-837>·<1090,2093>=0 t=0.378uM,Q=(413.6,792.4),D=97.41 距离阈值已被设置为 因为对于两种目的蛋白质组,D>ε,两种目的蛋白质组被鉴定为不存在于患者样本内(鉴定患者样本内不存在每种目的蛋白质组)。 作为另一实例,已经报告在SARS-CoV-2感染后IL-6、I L1RN和IL1RA保持升高,如针对MERS所观察到的。目的亚蛋白质组,例如包含IL-6、I L1RN和IL1RA或基于SARS-CoV-2感染后患者的鼻分泌物或血浆用实验方法确定的,可以使用样本中标记和测量的W和K氨基酸类型的荧光强度来鉴定和定量。相对于先前没有感染SARS-CoV-2的对照,该目的亚蛋白质组的存在或升高可以鉴定先前SARS-CoV-2感染的亚蛋白质组标记,作为抗体检验的替代。 两种或更多种氨基酸类型的氨基酸浓度,目的蛋白质 如已经描述的,使用每种氨基酸类型的校准曲线,的倒数,根据两种或更多种氨基酸类型的标记的值计算两种或更多种氨基酸类型的氨基酸浓度。例如,使用下列逆校准曲线计算C、K和W氨基酸类型的氨基酸浓度 其提供了作为其斜率的以下逆校准因子。 如参考部分所描述的,目的蛋白质p AAC AAC AAC 检验2的方法是: 1.令R为目的蛋白质、肽、寡肽、多肽、蛋白质复合物、蛋白质组或亚蛋白质组p 2.在向量格式中求参考线R的方程。这是R=<0,0,...,0>+t 3.求参考线R上的点P的一般方程。这是P=<0+a
- 基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法
- 基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法