掌桥专利:专业的专利平台
掌桥专利
首页

一种利用DNA序列进行信息写入和读取的方法

文献发布时间:2023-06-19 11:42:32



技术领域

本发明涉及DNA应用相关技术领域,尤其涉及一种利用DNA序列进行信息写入和读取的方法。

背景技术

利用DNA进行信息的写入和读取是最近10年才出现的新型技术。根据报道,早在2012年,Harvard大学分子生物学教授George Church用DNA编码了一本5万个单词、数据量不到1MB的书,随后将其保存在比花粉粒还小的玻璃芯片上。在工业界,以微软公司等为代表的IT巨头,则随后几年内成功利用数百万DNA写入了数十乃至数百倍于此的数据量。而在DNA合成领域拥有成熟技术的Agilent和Twist Bioscience等,以及DNA测序的Illumina和Thermo Fisher等,通过不断的优化,使得大规模合成DNA、高通量测定DNA序列等技术的成本和时间都大大降低。这个领域也因此得到前所未有的重视和发展,现有的信息写入和读取,基本上是通过以硅基为载体的方法,利用半导体磁性不同,进行0和1的编码,例如硬盘和内存等等。

现有的常规数据储存方法是将数据保存磁盘等硅基载体,利用磁性的不同,将信息用二进制压缩。这个方法的缺点是二进制只有0和1两种,数字编码的效率不高,占用空间很大。

另外现有磁盘技术存储时间不够长(数十年甚至更长)的缺点,现有技术的缺点是保存磁盘等硅基载体,利用磁性的不同,将信息用二进制压缩。这个方法的缺点是二进制只有0和1两种,数字编码的效率不高,随着信息产生的速度越来越快,使得超大规模的存储成本和时间都难以达到需求,而且对于大量信息的长期保存,也急需新的方法,因此提出一种利用DNA序列进行信息写入和读取的方法。

发明内容

本发明的目的在于提供一种利用DNA序列进行信息写入和读取的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种利用DNA序列进行信息写入和读取的方法,包括以下步骤:

S1,首先把数据转换成为ACTG四种碱基的四进制编码,数据编码的DNA则进行下一步的合成;

S2,利用大规模的生物芯片制备方法,制备DNA簇阵列;

S3,如果需要从生物芯片读出数据,则需要通过基因测序方法,具体就是使用内全反射荧光显微镜,利用边合成边测序的DNA测序方法,得到碱基序列,从而获得相应的存储数据;

S4,读出存储信息的方法:使用全内反射荧光显微镜(奥林巴斯),可以使用棱镜型成像系统,隐失场是通过入射光经棱镜发生全反射产生的,隐失波激发生物样品的荧光分子,荧光分子所发射的荧光经过物镜成像到照相机或CCD(Hamamatsu)上实现对生物样品的记录;

S5,测序采用边合成边测序的方法,具体是使用4种荧光核酸分子,ACTG分别修饰上不同激发波长的荧光基团,例如488nm,512nm,563nm和633nm等不同组合,核酸的3’-OH带有可逆终止子,每次利用DNA聚合酶可以并且只可以在引物链上加上1个荧光碱基,从而可以准确测出对应的碱基,之后可以通过化学方法进行可逆终止子的切除,从而生成可以参与下一个循环反应的3’-OH基团。

优选的,所述S1ACTG分别代表0、1、2、3。

优选的,所述S2通常每种DNA簇由长度为100-200个碱基的相同的单链DNA组成,每张芯片可包含数百万到数十亿种DNA簇。

优选的,所述S2生物芯片可以在低温条件-20℃或者-80℃长期保存。

与现有技术相比,本发明的有益效果是:

本发明中,通过使用高通量的DNA合成芯片进行信息的写入,使用高通量的内全反射荧光DNA测序方法,对芯片上面的DNA序列进行测定,从而读取信息,利用DNA的4种核苷酸ACTG,则信息可采用更加高密度的四进制表示,利用DNA等生物大分子可以极大的提高效率,经过自然界的进化DNA分子,单链密度大概每10个碱基长度为3纳米多,远远高于现有的磁盘储存密度,在常温状态,DNA本来已经不易分解,如果存储于低温干燥环境中,保存时间更加可达数万年甚至更长这就解决了海量数据不能长时间储存的缺点。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种技术方案:

一种利用DNA序列进行信息写入和读取的方法,包括以下步骤:

S1,首先把数据转换成为ACTG四种碱基的四进制编码,数据编码的DNA则进行下一步的合成;

S2,利用大规模的生物芯片制备方法,制备DNA簇阵列;

S3,如果需要从生物芯片读出数据,则需要通过基因测序方法,具体就是使用内全反射荧光显微镜,利用边合成边测序的DNA测序方法,得到碱基序列,从而获得相应的存储数据;

S4,读出存储信息的方法:使用全内反射荧光显微镜(奥林巴斯),可以使用棱镜型成像系统,隐失场是通过入射光经棱镜发生全反射产生的,隐失波激发生物样品的荧光分子,荧光分子所发射的荧光经过物镜成像到照相机或CCD(Hamamatsu)上实现对生物样品的记录;

S5,测序采用边合成边测序的方法,具体是使用4种荧光核酸分子,ACTG分别修饰上不同激发波长的荧光基团,例如488nm,512nm,563nm和633nm等不同组合,核酸的3’-OH带有可逆终止子,每次利用DNA聚合酶可以并且只可以在引物链上加上1个荧光碱基,从而可以准确测出对应的碱基,之后可以通过化学方法进行可逆终止子的切除,从而生成可以参与下一个循环反应的3’-OH基团。

所述S1ACTG分别代表0、1、2、3。

所述S2通常每种DNA簇由长度为100-200个碱基的相同的单链DNA组成,每张芯片可包含数百万到数十亿种DNA簇。

所述S2生物芯片可以在低温条件-20℃或者-80℃长期保存。

通过使用高通量的DNA合成芯片进行信息的写入,使用高通量的内全反射荧光DNA测序方法,对芯片上面的DNA序列进行测定,从而读取信息,利用DNA的4种核苷酸ACTG,则信息可采用更加高密度的四进制表示,利用DNA等生物大分子可以极大的提高效率,经过自然界的进化DNA分子,单链密度大概每10个碱基长度为3纳米多,远远高于现有的磁盘储存密度,在常温状态,DNA本来已经不易分解,如果存储于低温干燥环境中,保存时间更加可达数万年甚至更长这就解决了海量数据不能长时间储存的缺点。

实施例:通过Agilent公司的SureSelect定制化生物芯片,设计长度为150碱基的生物芯片,具体为1千万个DNA簇形成的阵列,其中25个碱基为相同序列的通用序列,用于测序时与因为相结合。因此编码序列为150-25=125个碱基,一共可以编码125X10,000,000=1.25GB数据。

首先把数据转换成为ACTG四种碱基的四进制编码,ACTG分别代表0、1、2、3,数据编码的DNA则进行下一步的合成;利用大规模的生物芯片制备方法,制备DNA簇阵列,通常每种DNA簇由长度为100-200个碱基的相同的单链DNA组成,每张芯片可包含数百万到数十亿种DNA簇;如果需要从生物芯片读出数据,则需要通过基因测序方法,具体就是使用内全反射荧光显微镜,利用边合成边测序的DNA测序方法,得到碱基序列,从而获得相应的存储数据;由此可得储存信息的生物芯片,可以在低温条件(-20oC或者-80oC)长期保存;

读出存储信息的方法:使用全内反射荧光显微镜(奥林巴斯),可以使用棱镜型成像系统,隐失场是通过入射光经棱镜发生全反射产生的,隐失波激发生物样品的荧光分子,荧光分子所发射的荧光经过物镜成像到照相机或CCD(Hamamatsu)上实现对生物样品的记录;

测序采用边合成边测序的方法,具体是使用4种荧光核酸分子,ACTG分别修饰上不同激发波长的荧光基团,例如488nm,512nm,563nm和633nm等不同组合。核酸的3’-OH带有可逆终止子,每次利用DNA聚合酶可以并且只可以在引物链上加上1个荧光碱基,从而可以准确测出对应的碱基。之后可以通过化学方法进行可逆终止子的切除,从而生成可以参与下一个循环反应的3’-OH基团。

通过使用高通量的DNA合成芯片进行信息的写入,使用高通量的内全反射荧光DNA测序方法,对芯片上面的DNA序列进行测定,从而读取信息,利用DNA的4种核苷酸ACTG,则信息可采用更加高密度的四进制表示,利用DNA等生物大分子可以极大的提高效率,经过自然界的进化DNA分子,单链密度大概每10个碱基长度为3纳米多,远远高于现有的磁盘储存密度,在常温状态,DNA本来已经不易分解,如果存储于低温干燥环境中,保存时间更加可达数万年甚至更长这就解决了海量数据不能长时间储存的缺点。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

相关技术
  • 一种利用DNA序列进行信息写入和读取的方法
  • 一种利用物联网址在物联网中进行信息的识别和读取方法
技术分类

06120113021464