掌桥专利:专业的专利平台
掌桥专利
首页

一种超容量信息编码系统及其应用

文献发布时间:2023-06-19 10:41:48


一种超容量信息编码系统及其应用

技术领域

本发明属于化学分析方法技术领域,具体涉及一种超容量信息编码系统及其应用。

背景技术

光学编码技术与多路复用技术相结合,使其得到迅速发展。随着激光、发光材料和高分辨显微技术的出现,为发现新的携带多重信息的光学编码系统提供了机遇,大大提高了生物识别和科技发现的通量。这种光学编码系统需要满足几个关键要求:(1)探索新的用于信息编码的光学维度;(2)制作高通量的信息编码系统;(3)开发用于检索信息的解码仪器平台;(4)提供与特定应用相匹配的系统兼容性。为了提高编码容量,必须探究介质材料可区分的光学性质。在空间位置、光学信号波长、强度、偏振度、角动量等因素的选择中,探索波长、强度及二者互相组合的研究最为广泛。

在双抗体夹心ELISA法基础上发展出的Luminex技术,是将微球用荧光染色的方法进行编码,通过调节荧光染料的配比获得多种具有不同特征荧光谱的微球。其中修饰有羧基的磁性微球是Luminex@xMAP法中的核心成分,将每种编码微球通过羧基共价交联上针对特定检测物的抗原、抗体或探针等捕获分子,使得待测样本中的靶分子与捕获分子发生特异性结合,通过利用其磁性进行快速简便地分离操作,然后通过仪器识别微球的编码并检测荧光强度,从而实现对靶分子的分析检测。这些微球用Luminex专有的荧光染料配方制成,在相同的激发波长下具有互不干扰的发射波长。染色过程包括在含有染料的溶剂中溶胀珠子,从而使染料分子吸附进入聚合物内层。在随后的步骤中,去除溶剂,使珠子缩小,这样就可将染料分子保持在微珠内部,实现大容量的荧光编码。他们报告的最大编码容量大约为500(文献1:Houser,B.Arch.Physiol.Biochem.2012,118,192-196;文献2:Chandler,D.J.;Bedre,J.U.S.Patent 9,645,142,2017)。该方法的编码容量较小,不能满足一些大容量信息编码或检测领域的需求。

基于光谱信号的波长与强度的组合,如果每个波长处可得到10种不同的信号强度,对于10个不同位置的波长,理论上可以形成10

发明内容

发明人研究发现,将三键化合物通过溶液中不同配比的混合,直接滴加至二维平面载体,或共价键结合到三维微球载体上,此加载过程均匀可控,可以调节三键化合物的多个可分辨的自发拉曼散射强度,实现同一波长处强度的多进制编码单元,从而获得多个光谱波段的拉曼信号分子组合而成的超容量信息编码系统。

本发明目的是通过如下技术方案实现的:

一种信息编码系统,包括加载在编码载体上的编码单元组成的编码系统和解码系统,其中编码单元由选自拉曼信号分子库的拉曼信号分子组合形成,所述拉曼信号分子的拉曼位移在1800~2500cm

根据本发明,所述编码系统包括拉曼信号分子组合形成的编码单元,其中所述编码单元包括至少一种编码信号分子和一种参照信号分子,所述编码信号分子和参照信号分子具有特征拉曼信号,所述参照信号分子与编码信号分子具有不同的拉曼位移。

根据本发明,所述编码单元的编码信号分子的特征拉曼位移所处的光谱波段的划分没有特别的限定,本领域技术人员可根据对信息编码的容量或信息编码的精度确定编码信号分子的光谱波段的数目,使不同编码信号分子的拉曼位移能够彼此区分开。

在本发明的一个实施方案中,所述编码信号分子的特征拉曼位移可以分为至少一个光谱波段,例如分为一个光谱波段、两个光谱波段、三个光谱波段、四个光谱波段或更多个光谱波段,各光谱波段的拉曼位移范围彼此端点重叠、端点不重叠、或端点部分重叠。

作为一种示例性实施方案,所述编码信号分子的拉曼位移分为四个光谱波段,分别为第I、第II、第III和第IV波段;例如所述第I波段为2090-2120cm

根据本发明,每个光谱波段内可以包含至少一种编码信号分子,或者可以包含至少两种拉曼位移不同的编码信号分子,每个编码信号分子可以通过稀释到不同浓度达到多个不同的可分辨的拉曼峰强度。

根据本发明,所述拉曼信号分子选自三键化合物;优选为任意取代的单炔或二炔或多炔化合物或氰基化合物,所述取代基为芳香环、烷基、硅烷基、碘、羧基、酯基等;更优选为双芳香环取代的单炔、二炔、三炔、四炔,氰基取代的芳香化合物,芳香环、烷基、硅烷基、碘、羧基、酯基组合取代的单炔或二炔化合物中的一种或多种。

根据本发明,所述编码载体选自二维表面载体或者三维树脂珠载体。所述二维表面载体可以选自石英玻片或者硅片,所述三维树脂珠载体选自自身带反应官能团的聚合物树脂,所述官能团优选为氨基、羧基、羟基、卤代烷基中的一种或多种。

根据本发明,优选的聚合物树脂选自聚苯乙烯树脂,例如所述聚苯乙烯树脂珠选自末端带有氨基的Rink Amide树脂和末端带有氨基的TentalGel树脂。

根据本发明,所述解码系统为激光拉曼光谱仪。

本发明还提供上述信息编码系统的建立方法,包括:

(1)建立拉曼信号分子库,确定编码单元;

(2)将编码单元的拉曼信号分子与编码载体相连接;

(3)通过解码系统进行解码,获得编码信息。

所述信息编码系统、拉曼信号分子库、编码单元、解码系统如前所述。

本发明还提供所述信息编码系统在数据存储中的用途。

根据本发明,所述信息编码系统用于编码和/或存储文字、图像信息,包括将计算机可识别的通用编码元素采用所述含有拉曼信号分子的编码单元进行编码,然后将代表所述文字、图像信息的编码单元组合与编码载体相连接,经可识别拉曼光谱的解码系统进行解码,由计算机输出拉曼光谱所代表的信息,得到所述文字、图像信息。在一个示例性实施方案中,所述计算机可识别的通用编码元素选自Unicode码或ASCII码。

所述信息编码系统、拉曼信号分子、编码单元、编码载体和解码系统如前所述。

本发明还提供所述信息编码系统在制备多个化合物时对其化学结构进行标签指示的应用;例如将化合物组合库的各个化合物采用所述编码系统进行编码,并通过解码获得代表各个化合物化学结构的拉曼光谱信息,所述拉曼光谱信息作为所述化合物的化学结构标签。

根据本发明,所述拉曼光谱信息为拉曼光谱谱图;通过识别或解码所述拉曼光谱信息可直接区分所述化合物组合库中的各个化合物,进而实现对化合物化学结构进行标签指示的作用。

根据本发明,所述信息编码系统可用于化合物的多重筛选与解析。

根据本发明,所述多重筛选是利用所述信息编码系统标签指示化合物库中的每个化合物,在其中筛选与目标物具有特异性结合性质的化合物,然后通过解码系统获取与目标物特异性结合的化合物的拉曼光谱信息,从而解析该化合物的化学结构;在一个示例性实施方案中,利用所述信息编码系统筛选与肿瘤细胞具有特异性结合性质的多肽配体。所述多重筛选是通过所述信息编码系统标记多肽化合物,然后通过解码系统获取与肿瘤细胞特异性结合的多肽所处载体上的拉曼光谱信息。

本发明还提供一种从固相合成化合物组合库中筛选特异性化合物的拉曼光谱分析方法,所述方法使用如上所述的信息编码系统。

根据本发明,所述分析方法包括:

(1)建立拉曼信号分子库,确定编码单元;

(2)将编码单元的拉曼信号分子与编码载体相连接,

(3)使用所述连接有拉曼信号分子的编码载体作为固相合成载体,进行固相合成反应制备所述化合物组合库,并且使带有不同拉曼信号强度的编码载体分别编码不同的化合物结构,

(4)将所述合成反应完成后的编码载体与特异性目标物接触,

(5)对完成(4)后的编码载体进行解码,分析各编码载体中拉曼信号分子强度。

所述信息编码系统、拉曼信号分子库、编码单元、解码系统如前所述。

根据本发明,所述固相合成化合物组合库为多肽肽库、小分子化合物库或者其他任意可经固相合成的化合物分子库。

根据本发明,所述多肽肽库以树脂珠为固相载体,以氨基酸为原料,用混合-裂分的组合方法,采用酰胺缩合反应制备得到。

根据本发明,所述缩合反应依次将氨基酸偶联到所述聚合物树脂珠上形成肽链。

根据本发明,所述氨基酸选自能与所述树脂珠发生酰胺缩合反应的任一种氨基酸,例如丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、脯氨酸(Pro)、苯丙氨酸(Phe)、色氨酸(Trp)、蛋氨酸(Met)、甘氨酸(Gly)、丝氨酸(Ser)、苏氨酸(Thr)、半胱氨酸(Cys)、酪氨酸(Tyr)、天冬酰胺(Asn)、谷氨酰胺(Gln)中的一种或多种。

本发明中,所述的混合-裂分组合方法是一种基于树脂珠上化合物合成的方法,指的是:一定数量的编码载体被分成相等的若干部分,然后各部分独自与不同的起始单体原料(如氨基酸)反应;反应后,树脂的各部分又重新合并、混匀,再被分成若干部分,进一步重复上述系列反应。

根据本发明,所述特异性目标物选自肿瘤细胞、抗原分子、抗体分子或其他具有特异性识别能力的物质,本领域技术人员可根据筛选目的进行选择。

术语定义与说明

本文中术语“分子库”或“化合物组合库”代表多种各不相同的分子的总和;本文所述拉曼信号分子库包括多个拉曼信号分子,是指具有不同的特征拉曼位移的化合物的分子库,各个化合物的特征拉曼位移可以用来编码;本文所述“化合物组合库”包括多个化合物,所述多个化合物可以是在某一化学反应体系中生成的多个化学结构不同的分子,例如某一化学反应生成的结构不同的化合物的混合物,例如所述化合物组合库是固相合成制备的具有不同氨基酸序列的多肽肽库,或者带有不同化学基团的小分子化合物库。

本文中术语“三键化合物”是指两个原子间以三对公用电子构成的共价键的化合物,例如含有C≡C的炔基化合物,含有C≡N的氰基化合物。单炔化合物含有一个C≡C,二炔化合物含有相连的两个C≡C,三炔化合物含有相连的三个C≡C,依次类推。所述三键化合物可以是未被取代的或者被取代的,例如取代基包括但不限于芳香环、烷基、硅烷基、碘、羧基、酯基。所述“芳香环”包括芳基或杂芳基,例如芳基选自苯基,萘基或联苯基,杂芳基包括芳香或部分芳香的4到11元单或二环,其中含有1到6个选自氮、氧和硫的杂原子。所述“烷基”为一种饱和烃基,是由碳、氢两种原子的链状有机基团或者环烷基,所述烷基可以含有或不含有支链,例如含有1到6个碳原子的直链或支链烷基,包括甲基、乙基、正丙基、异丙基、正丁基等。

本文中术语“特异性目标物”是指可以与待筛选的化合物特异性结合的物质或者化合物,特异性目标物与待筛选分子的结合具有特异性结合,而不与其他非特异性的分子发生反应。

本文中术语“多个”包括两个或更多个,例如两个、三个、四个、五个或更多个,等等。例如,“多个拉曼信号分子”包括两个以上的拉曼信号分子。本文中术语“至少一个”或者“一个以上”包括一个,还指包括大于一个的情形,例如两个、三个、四个或更多个。

有益效果

本发明选择拉曼光谱沉默区域的三键振动峰为信号源,避免了光谱谱带重叠的问题。由于拉曼光谱为分子的振动光谱,相较于电子能级跃迁的荧光光谱,自身的信号稳定性更好。同时,将编码分子加载到信息载体上,采用了溶液混合后滴加至二维表面的策略,或溶液混合后化学键结合至树脂珠上的策略,使加载的过程均匀可控,编码系统的制作重现性较好,最终加载的信息准确、稳定、可靠,且编码系统的信息容量大幅增加。编码后的信息可在自然环境中保存较长时间,例如5个月以上。

本发明将每个三键化合物的储存液作为归一化的编码单元,将其进行不同数量的混合,在二维表面载体上进行滴加或滴加成膜,或在三维树脂珠载体上进行共价键结合,从而编辑得到八进制的编码单元,并进一步验证了二维表面载体或三维树脂珠载体上的编码容量分别接近200,000和500,000(迄今为止所实现的最大的光学编码容量)。如果发现更多可用的具备特定光学特性的拉曼信号分子,编码容量可以上升至更高的水平。

此外,写入的这些编码通过解码仪器解码来识别,此解码仪器为常见的激光拉曼光谱仪,不需要多个激发源,可以较容易的实现解码,使解码结果在很短的时间内获得,提高解码效率。

附图说明

图1为本发明超容量信息编码系统的制作示意图。

图2为超大容量编码系统示例。28种用于超大容量编码系统的拉曼化合物被划分为4个光谱波段,分别为第I、第II、第III和第IV波段。用于溶液混合的化合物(a)和共价键结合的化合物(b)的分子结构和拉曼峰波数可供编码信息选择。具体实验中,可选取

图3为超大容量拉曼编码及其在筛选特异性结合U-87MG细胞的多肽方面的应用。(a)64份不同剂量的

图4是使用Raman-ASCII系统编写英语单词的演示。(a)吸附在石英玻片上的用来表示ASCII码系统的128个拉曼编码的光谱图。(b)“Central China Normal University”在石英玻片上的31个编码点的图片。(c)31个英文字符及其八进制ASCII码和Raman码的对应,及其分别在溶液和固态薄膜中的拉曼光谱。

图5为使用Raman-Unicode系统写入中文的演示:6个汉字及其分别对应的十六进制Unicode编码、拉曼码和在溶液中的光谱。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不是用于限制本发明的保护范围。此外,应理解,在阅读了本发明所记载的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落入本发明的保护范围。

实施例1.超大容量编码系统的建立

(1)拉曼信号分子库的建立

取28种具有代表性的拉曼信号分子,其拉曼位移被划分为4个光谱波段,分别为第I、第II、第III和第IV波段。28种化合物的结构式和拉曼光谱图如图2所示。将28种化合物分别分为(a)组和(b)组,如图2(a)和图2(b)。

图2(a)组化合物从左到右依次为:

图2(b)组化合物从左到右依次为:

(2)表面载体上8进制编码单元

首先,我们通过溶液中简单的混合策略,分别组合图2a中第I波段的A(2100cm

上述的拉曼编码系统还可以继续扩充以获得更大的容量。编码容量可由式子(8×n

(3)树脂珠载体上8进制编码单元

类似的八进制的编码单元(由含有羧基的炔基化合物调制得到),通过简单的化学键合被写入到树脂珠中。编码能力取决于三个主要因素:拉曼光谱波段的数量,每个波段所使用的化合物数量,以及对于每个化合物可分辨的拉曼峰强度的数目。使用图2b中的4个光谱波段,每个波段选择一个化合物,每个化合物调制出8个可区分的拉曼强度,编码的容量为8

基于目前所发现的可用的羧基化化合物,并行使用同一波段内的所有化合物,同一波段内的编码可叠加获得更多的编码单元,不同波段之间编码数量相乘,即得总的编码容量。根据该计算公式,总编码容量为(8×3)×(8×1)×(8×4)×(8×4)=196608。取决于更多光谱波段的使用和更多可用信号分子的发现,此编码容量可进一步扩充。

实施例2.信息编码系统编码ASCII和Unicode两种数据的示例

八进制编码单元以湿墨和干墨的形式写入到石英玻片上,实现了ASCII和Unicode两种数据存储系统的编码。例如,使用图2(a)中第I波段的A(2100cm

图4b是显示了本发明的发明人所属的“Central China Normal University”是如何使用这个编码系统编写的。图4c的第四行显示了解码的结果,以及各自的拉曼码在溶液中的光谱。考虑到湿墨存储的不方便,我们还将化合物与聚甲基丙烯酸甲酯中混合,将其干燥,制成了固态的拉曼码。图4c的第五行显示了固态薄膜的解码结果,它们与溶液中的解码结果一致。

我们使用所述的Raman-Unicode系统来编写一些中文单词。其中每个字符都被写成Unicode,例如U+xxxx,包括一个U+前缀和4个十六进制编码单元的组合,十六进制编码单元的全部拉曼光谱如图2c所示,拉曼位移和强度都有良好的可分辨性。我们使用该编码系统编写了作者所在单位的中文“华中师范大学”,如图5所示。在第三行中列出了所有字符对应的拉曼编码。这些设计的编码是使用之前描述的步骤制成的。图5的第四行显示了解码结果——溶液中各自的拉曼码的光谱。这些结果表明,拉曼编码系统可以携带大量的信息,并具有原位和非破坏性解码数据的能力。

实施例3.采用此方法编码树脂珠及其用于特症癌细胞多肽配体的高通量筛选

首先制备化合物

将化合物

我们将该系统应用于筛选与肿瘤细胞特异性结合的多肽配体。我们采用双层珠策略(文献5:Liu,R.;Marik,J.;Lam,K.S.J.Am.Chem.Soc.2002,124,7678-7680),用8个树脂珠上的拉曼编码表达了8种不同的氨基酸在8-mer的环状多肽序列cGXGDdvc中的多样性(X是可变的氨基酸)。TentaGel树脂珠先与前5个氨基酸(GDdvc)反应,然后等分成8份,每等份与第六个氨基酸反应,该氨基酸对于最终多肽产物的序列至关重要,同时用相同的合成步骤,各等份的TentalGel树脂珠也与不同剂量的编码化合物反应来编码多肽。这一步反应完后,8份TentaGel树脂珠重新混合在一起,并继续与最后两个氨基酸(cG)反应。

结果表明,带编码的树脂珠载体在化学反应和生物相互作用的过程中是稳定的。通过这种固相合成中的裂分/混合策略,编码珠(

实验结果表明,接有八种不同多肽的混合珠与U-87MG细胞孵化后,在大约八分之一的珠子上,出现了阳性结合。图3g-3j的插图显示了细胞结合强度分别为很强、强、中等和弱结合的情况。我们把激光聚焦到这些阳性珠子上,测量它们的光谱。图3g-3j中的结果表明,无论结合强度如何,解码的结果始终是编码4(cGRGDdvc)。我们还随机挑选了一些阴性珠,并识别出它们的编码(图3c-3f,3k-3m),它们都对应于编码0、1、2、3、5、6和7中的一个,说明非特异性的多肽序列全部都是cGXGDdvc(X≠R)。

以上,对本发明的实施方式进行了说明。但是,本发明不限定于上述实施方式。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种超容量信息编码系统及其应用
  • 一种超容量锂离子电池正极材料及其制备方法和应用
技术分类

06120112642487