掌桥专利:专业的专利平台
掌桥专利
首页

阳离子聚合物和用于生物分子递送的用途

文献发布时间:2023-06-19 09:47:53



相关申请的交叉引用

本申请要求于2018年4月27日提交的美国临时专利申请第62/663,985号和于2018年10月24日提交的美国临时专利申请第62/750,097号的权益,其全部公开内容通过援引加入本文。

通过援引加入以电子形式提交的材料

通过援引整体加入本文的是与本申请同时提交并鉴定如下的计算机可读核苷酸/氨基酸序列表:在2019年4月29日创建的名称为“512879.TXT”的一个62527字节ASCII(文本)文件。

发明背景

已无数次将基于肽、蛋白质和核酸的技术应用于疾病的预防、治愈和治疗。然而,安全有效地将大分子(例如,多肽和核酸)递送至它们的靶组织仍然是个问题。因此,仍需要用于递送治疗性分子的新组合物和方法。

发明内容

本文提供包含式1的结构的聚合物:

其中:

m

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

R

R

A

-(CH

-(CH

-(CH

-(CH

B

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6、r1和r2以及s1至s4各自独立地为1至5的整数;R

还提供式2的聚合物:

其中:

m

c为0至50的整数;

Y任选地存在并且是可裂解的连接基;

R

R

R

R

本公开还提供包含式1的结构和/或式2的聚合物以及核酸和/或多肽的组合物。还提供制备包含式1的结构的聚合物或式2的聚合物的方法,以及例如使用所述聚合物和包含所述聚合物的组合物将核酸或蛋白质递送至细胞的方法。

附图简要说明

图1提供来自酿脓链球菌(Streptococcus pyogene)的Cas9的氨基酸序列(SEQ IDNO:1)。

图2提供来自土拉热弗朗西斯菌(Francisella tularensis)亚种Novicida U112的Cpf1的氨基酸序列(SEQ ID NO:2)。

图3是在聚合物/Cas9组合物的不同剂量下,通过在GFP-HEK细胞中的绿色荧光蛋白(“GFP”)阴性%测量的Cas9 RNP递送水平的图示。

图4是ai9报道子等位基因的示意图。

图5显示了在聚合物/Cre组合物的不同浓度下,通过RFP+表达量测量的Cre重组酶递送至原代成肌细胞的水平。

图6说明通过红色荧光蛋白可视化的小鼠肌肉中Cre重组酶递送水平(颜色较浅的部分指示荧光)。

图7显示了Cas9递送展示的人神经元干细胞indel突变率。

图8是HEK 293T中Traffic Light Reporter的示意图。

图9显示了在聚合物/Cre组合物的不同浓度下通过RFP+表达量测量的Cre重组酶递送至TLR-HEK 293T的水平。

图10是在聚合物/Cas9组合物的不同剂量下通过GFP-HEK细胞中的绿色荧光蛋白(“GFP”)%测量的Cas9 RNP递送水平的图示。

图11说明通过GFP%测量的eGFP mRNA递送至HEK 293T细胞的水平。

图12显示通过GFP%测量的eGFP mRNA递送至HEK 293T细胞的水平的孵育时间依赖性。

图13说明在存在和不存在1.5kDaPEG-PAsp(DET)聚合物的情况下通过RFP+表达测量的红色荧光蛋白(“RFP”)mRNA递送至HEK 293T细胞的水平。

图14说明在存在和不存在1.5kDaPEG-PAsp(DET)聚合物的情况下通过RFP+表达测量的红色荧光蛋白(“RFP”)mRNA水平。

图15图示了针对缓冲液中的聚合物/Cas9纳米颗粒,通过GFP-HEK细胞中的绿色荧光蛋白(“GFP”)%测量的Cas9 RNP递送水平。

图16提供AsCpf1的序列(SEQ ID NO:19)。

图17提供LbCpf1的序列(SEQ ID NO:20)。

具体实施方式

本发明提供了包含式1的结构的聚合物:

其中:

m

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

R

R

A

-(CH

-(CH

-(CH

-(CH

B

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

其中

p1至p4、q1至q6、r1和r2以及s1至s4各自独立地为1至5的整数;

R

R

并且R

如本文所用,“烷基”是指取代或未取代的烃链。烷基基团可以具有任何数目的碳原子(例如,C

术语“杂环基”或“杂环基团”是指环状基团,例如芳香性(例如杂芳基)或非芳香性的,其中所述环状基团具有一个或多个杂原子(例如,氧、氮和/或硫的1、2、3、4或5个或更多个原子)。在一些实施方案中,杂环基或杂环基团(即环状基团,例如芳香性(例如杂芳基)或非芳香性的,其中所述环状基团具有一个或多个杂原子)被一个或多个取代基取代。

术语“芳基”是指具有任何合适数目的环原子和任何合适数目的环的芳香环系。芳基基团可以包含任何合适数目的环原子,例如6、7、8、9、10、11、12、13、14、15或16个环原子,以及6至10、6至12或6至14个环成员。芳基可以是单环的,稠合形成双环或三环基团的,或通过键连接形成联芳基基团。代表性芳基基团包括苯基、萘基和联苯基。在一些实施方案中,芳基基团包含亚烷基连接基团以形成芳基烷基基团(例如,苄基基团)。一些芳基基团具有6至12个环成员,例如苯基、萘基或联苯基。其他芳基基团具有6至10个环成员,例如苯基或萘基。在一些实施方案中,芳基取代基包含一个或多个杂原子(例如1、2、3、4或5个或更多个氧原子、氮原子和/或硫原子),从而提供杂芳基基团。在一些实施方案中,芳基被一个或多个取代基取代。

应理解,前述基团中的任一者可以是单价的、二价的或多价的(例如,亚烷基、亚烯基、亚炔基、亚芳基、亚杂烷基、亚杂烯基、亚杂炔基、亚杂环基、亚杂芳基等)。

本文所用的术语“取代的”可以指所指明的原子或基团(例如取代的烷基基团)上的一个或多个氢被另一基团取代,条件是不超过所指明的原子的正常化合价。例如,当取代基是氧代(即,═O)时,则原子上的两个氢被替换。取代基可以包括醛、酯、酰胺、酮、硝基、氰基、氟烷基(例如,三氟甲烷)、卤素(例如,氟)、芳基(例如,苯基)、杂环基或杂环基团(即,环状基团,例如芳香性(例如,杂芳基)或非芳香性基团,其中所述环状基团具有一个或多个杂原子)、氧代或其组合中的一种或多种。取代基和/或变量的组合是允许的,条件是取代不显著不利地影响化合物的合成或使用。

根据式1,m

所述聚合物可以以任何合适的结构类型存在。例如,所述聚合物可以作为交替聚合物、无规聚合物、嵌段聚合物、接枝聚合物、线性聚合物、支化聚合物、环状聚合物或其组合存在。在某些实施方案中,所述聚合物是无规聚合物、嵌段聚合物、接枝聚合物或其组合。

因此,在式1的结构中,单体(其可以通过它们各自的侧链A

所述聚合物可以进一步说明的方式描述为式1.1:

或者,当骨架为α、β构型时,描述为式1.2:

其中,

m

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

R

R

每个A

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6、r1和r2以及s1至s4各自独立地为1至5的整数;

R

R

R

条件是至少约5%(例如至少约10%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或甚至100%)的A

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

在其他实施方案中,所述聚合物的一些或甚至大部分A

-(CH

-(CH

-(CH

-(CH

在任何上述聚合物结构中,R

基团A

在基团A

在聚合物结构中,R

在式1的一些实施方案中,A

在式1.1的一些实施方案中,A

此外,在聚合物结构中,R

在一些实施方案中,每个R

其中

R

R

z为1至5的整数;

c为0至50的整数;

Y任选地存在并且是可裂解的连接基;

n为0至50的整数;以及

R

R

R

R

Y的每次出现任选地存在。如本文所用,短语“任选地存在”意指,被称作任选地存在的取代基可以存在或不存在,并且当该取代基不存在时,相邻取代基直接彼此结合。当Y存在时,Y是可裂解的连接基。如本文所用,短语“可裂解的连接基”是指连接两个物质(species)的任何化学元件,该化学元件可被裂解以分开所述两个物质。例如,可裂解的连接基可以通过水解过程、光化学过程、自由基过程、酶促过程、电化学过程或其组合裂解。示例性的可裂解的连接基包括但不限于:

其中R

所述聚合物可以是任何合适的聚合物,条件是所述聚合物包含前述聚合物结构作为所述聚合物的部分。在一些实施方案中,所述聚合物是嵌段共聚物,其包含具有式1、1.1或1.2的结构的聚合物嵌段和一或多种其他聚合物嵌段(例如,环氧乙烷次级单元或环氧丙烷次级单元)。在其他实施方案中,所述式1、1.1或1.2的结构为所述聚合物的唯一聚合单元,其可在任一端用合适的末端“封端”。在某些实施方案中,所述聚合物还包含取代基,所述取代基包含组织特异性或细胞特异性靶向部分。

在一些实施方案中,所述聚合物具有式1A的结构:

其中Q具有下式:

或具有式1A1的结构:

其中

c为0至50的整数;

Y任选地存在并且是如先前所述的可裂解的连接基;

R

R

R

并且所有其他取代基(例如,m

类似地,所述聚合物可具有式1.1A的结构:

或者,当骨架为α、β构型时,如下式1.2A所示:

其中,

c为0至50的整数;

Y任选地存在并且是如先前所述的可裂解的连接基;

R

R

R

并且所有其他取代基(例如,m

在前述的一些实施方案中,R

聚合物1

聚合物2

聚合物3

聚合物4

聚合物5

聚合物6

聚合物15

聚合物16

聚合物17

聚合物18

聚合物29

其中a、b、c和d各自独立地为0至1000的整数,例如0-500、0-200、0-100或0-50,条件是(a+b+c+d)>约5。在一些实施方案中,(a+b)为约0至约75(例如,约5至约75、约20至约75、约40至约75、约40至约60、约50至约75、约60至约75或约70至约75),并且(c+d)为约5至约80(例如,约5至约75、约5至约60、约5至约40、约20至约40、约5至约30、约5至约20或约5至约10)。在某些实施方案中,(a+b)大于(c+d)。例如,在一些实施方案中,(a+b)/(c+d)之比为约1至约3(例如,(a+b)为约55且(c+d)为约25,或者(a+b)/(c+d)之比为约3至约10(例如,(a+b)为约70,并且(c+d)为约10)。在其他实施方案中,(a+b)小于(c+d),使得(a+b)/(c+d)之比小于1(例如,约0.1或更大,但小于1)。同样,在这些示例性聚合物中单元的数目的指示(“a”、“b”、“c”和“d”)不暗示嵌段共聚物结构;相反,这些数字表示总的单元数,所述单元可以随机排列,如式中“/”符号所示。

本发明还提供包含式2的结构的聚合物:

其中:

a为10至2000的整数;

c为0至50的整数;

Y任选地存在并且是如本文先前所述的可裂解的连接基;

R

并且R

本发明还提供包含式4的结构的聚合物:

其中,

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6以及r1和r2各自独立地为1至5的整数;

R

R

R

本发明还提供具有式4A的结构的聚合物:

其中,

c为0至50的整数;

Y任选地存在并且是可裂解的连接基;

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6以及r1和r2各自独立地为1至5的整数;

R

R

R

R

R

在包含式4的结构的聚合物和具有式4A的结构的聚合物的实施方案中,R

在包含式4的结构的聚合物和具有式4A的结构的聚合物的实施方案中,R

根据任意前文所述,基团A

因此,本文提供的聚合物的非限制性实例包括例如:

聚合物30

聚合物31

聚合物32

聚合物33

聚合物37

聚合物38

其中a和b各自独立地为0至1000,例如0-500、0-200、0-100或0-50的整数。因此,在一些实施方案中,a或b可以是0,或者所述聚合物可以具有一定的a和b之比。在一些实施方案中,(a+b)是约5或更大(例如,约5至约160、约5至约140、约5至约120、约5至约100、约5至约80,或约5至约60)或约25或更大(例如,约25至约160、约25至约140、约25至约120、约25至约100、约25至约80,或约25至约60)或甚至约50或更大(例如,约50至约160、约50至约140、约50至约120、约50至约100,或约50至约80)。其他实例包括聚合物30-33,其中将一个或两个侧链的末端叔胺脱甲基化以提供仲胺(例如,-NHCH

聚合物39

聚合物40

聚合物41

聚合物42

其中a和b如上所述。

任何前述聚合物可在所述式中指示的位置处包含组织特异性或细胞特异性靶向部分,或可以另外修饰所述聚合物以包含组织特异性或细胞特异性靶向部分。用于连接组织特异性或细胞特异性靶向部分的方法是本领域已知的,其中一些方法包括迈克尔加成、环氧化物开环、置换反应或使用具有适当官能团的组织特异性或细胞特异性靶向部分的“点击”化学(例如,CuAAC、SPAAC、SPANC,或应变烯烃的反应)。所述组织特异性或细胞特异性靶向部分可以是能够识别(例如,特异性结合)给定靶组织或细胞(例如,特异性结合特定配体、受体或允许所述靶向部分区分开靶组织或细胞和其他非靶组织或细胞的其他蛋白质或分子)的任何小分子、蛋白质(例如,抗体或抗原)、氨基酸序列、糖、寡核苷酸、基于金属的纳米颗粒或其组合。在一些实施方案中,所述组织特异性或细胞特异性靶向部分是配体的受体。在一些实施方案中,所述组织特异性或细胞特异性靶向部分是受体的配体。

所述组织特异性或细胞特异性靶向部分可用于靶向任何期望的组织或细胞类型。在一些实施方案中,所述组织特异性或细胞特异性靶向部分将所述聚合物定位于个体的外周神经系统、中枢神经系统、肝、肌肉(例如心肌)、肺、骨(例如造血细胞)或眼的组织。在某些实施方案中,所述组织特异性或细胞特异性靶向部分将所述聚合物定位于肿瘤细胞。例如,所述组织特异性或细胞特异性靶向部分可以是与特定组织或细胞上的受体结合的糖。

在一些实施方案中,所述组织特异性或细胞特异性靶向部分是:

其中R

典型地,所述聚合物是阳离子型的(即,在pH 7和23℃时带正电荷)。如本文所用,“阳离子型”聚合物是指具有总净正电荷的聚合物,不管所述聚合物仅包含阳离子单体单元还是阳离子单体单元与非离子或阴离子单体单元的组合。

在某些实施方案中,所述聚合物具有约5kDa至约2000kDa,例如约10kDa至约2000kDa的重均分子量。所述聚合物的重均分子量可以为约2000kDa或更低,例如约1800kDa或更低、约1600kDa或更低、约1400kDa或更低、约1200kDa或更低、约1000kDa或更低、约900kDa或更低、约800kDa或更低、约700kDa或更低、约600kDa或更低、约500kDa或更低、约100kDa或更低、或约50kDa或更低、或甚至约40kDa或更低,例如约30kDa或更低或25kDa或更低。或者,或另外,所述聚合物的重均分子量可以为约5kDa或更高或约10kDa或更高,例如约50kDa或更高,约100kDa或更高,约200kDa或更高,约300kDa或更高,或约400kDa或更高。因此,所述聚合物可以具有由前述端点中的任何两个所限定的重均分子量。例如,所述聚合物的重均分子量为约5kDa至约50kDa、约10kDa至约50kDa、约10kDa至约100kDa、约10kDa至约500kDa、约50kDa至约500kDa、约100kDa至约500kDa、约200kDa至约500kDa、约300kDa至约500kDa、约400kDa至约500kDa、约400kDa至约600kDa、约400kDa至约700kDa、约400kDa至约800kDa、约400kDa至约900kDa、约400kDa至约1000kDa、约400kDa至约1200kDa、约400kDa至约1400kDa、约400kDa至约1600kDa、约400kDa至约1800kDa、约400kDa至约2000kDa、约200kDa至约2000kDa、约500kDa至约2000kDa,或约800kDa至约2000kDa。

可以通过任何合适的技术测定重均分子量。通常,重均分子量使用装有柱的尺寸排阻色谱法测定,所述柱选自TSKgel Guard、GMPW、GMPW、G1000PW,和Waters 2414(WatersCorporation,Milford,Massachusetts)折射率检测器。此外,通过使用150-875000道尔顿的聚环氧乙烷/聚乙二醇标准物校准来测定重均分子量。

制备方法

可以通过任何合适的方法提供本文提供的聚合物。在一些实施方案中,所述聚合物可通过包括修饰包含式3的结构的聚合物的基团A

其中:

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

R

R

A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6以及r1和r2各自独立地为1至5的整数;并且R

以产生包含式1的结构的聚合物:

其中m

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

R

R

A

-(CH

-(CH

-(CH

-(CH

B

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6、r1和r2以及s1至s4各自独立地为1至5的整数;R

通过所述方法制备的包含式1的结构的聚合物可以是任何式1的聚合物,包括式1.1、1.2、1A1、1A、1.1A、1.2A、4或4A以及如关于本发明的聚合物所描述的其任何和所有实施方案。

包含式3的结构的聚合物可以是满足该标准的任何合适的聚合物。在一些实施方案中,所述聚合物可改为描述为式3.1:

或者,当骨架为α、β构型时,描述为式3.2:

其中,

m

符号“/”表示由其分隔的单元随机或以任意顺序连接;

R

R

每个A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6以及r1和r2各自独立地为1至5的整数;并且R

可以通过任何合适的方式修饰指定名为A

在一个实施方案中,包含式3的结构的聚合物的基团A

所述α,β-不饱和羰基化合物可以是能够接受来自亲核试剂的迈克尔加成的任何α,β-不饱和羰基化合物。在一些实施方案中,所述α,β-不饱和羰基化合物为丙烯酸酯、丙烯酰胺、乙烯基砜或其组合。因此,迈克尔加成反应可以在包含式3的结构的聚合物与丙烯酸酯、丙烯酰胺、乙烯基砜或其组合之间进行。因此,在一些实施方案中,所述方法包括使所述包含式3的结构的聚合物与丙烯酸酯接触;使所述包含式3的结构的聚合物与丙烯酰胺接触;或使所述包含式3的结构的聚合物与乙烯基砜接触。

在其中被指定为A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6、r1和r2以及s1至s4各自独立地为1至5的整数;R

适用的丙烯酸酯、丙烯酰胺和乙烯基砜的实例包括下式的丙烯酸酯:

其中R

在一些实施方案中,通过酸和/或碱促进迈克尔加成反应。所述酸和/或碱可以是具有任何合适的pKa的任何合适的酸和/或碱。所述酸和/或碱可以是有机酸(例如对甲苯磺酸)、有机碱(例如三乙胺)、无机酸(例如四氯化钛)、无机碱(例如碳酸钾)或其组合。

在一些实施方案中,通过酸来促进迈克尔加成反应。所述酸可以是布朗斯特酸或路易斯酸。在所述酸是布朗斯特酸的实施方案中,所述酸可以是弱酸(即pKa为约4至约7)或强酸(即pKa为约-2至约4)。通常,所述酸为弱酸。在某些实施方案中,所述酸为路易斯酸。例如,所述酸可以是双(三氟甲磺酰)亚胺或对甲苯磺酸。

在一些实施方案中,通过碱促进迈克尔加成反应。所述碱可以是弱碱(即,约7至约12的pKa)或强碱(即,约12至约50的pKa)。通常,所述碱是弱碱。例如,所述碱可以是三乙胺、二异丙基乙胺、吡啶、N-甲基吗啉或N,N-二甲基哌嗪或其衍生物。

在一些实施方案中,迈克尔加成反应在溶剂中进行。所述溶剂可以是能够增溶待反应的聚合物和α,β-不饱和羰基化合物的任何合适的溶剂或溶剂的混合物。例如,所述溶剂可以包括水、质子有机溶剂和/或非质子有机溶剂。溶剂的示例性列表包括水、二氯甲烷、乙醚、二甲亚砜、乙腈、甲醇和乙醇。

在一个实施方案中,所述聚合物的基团A

在其中通过环氧化物开环反应修饰被指定为A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6以及r1和r2各自独立地为1至5的整数;R

适用的环氧化物的实例包括下式的环氧化物:

其中R

在一些实施方案中,通过酸和/或碱促进环氧化物开环反应。所述酸和/或碱可以是具有任何合适的pKa的任何合适的酸和/或碱。所述酸和/或碱可以是有机酸(例如对甲苯磺酸)、有机碱(例如三乙胺)、无机酸(例如四氯化钛)、无机碱(例如碳酸钾)或其组合。

在一些实施方案中,通过酸促进环氧化物开环反应。所述酸可以是布朗斯特酸或路易斯酸。在所述酸是布朗斯特酸的实施方案中,所述酸可以是弱酸(即pKa为约4至约7)或强酸(即pKa为约-2至约4)。通常,所述酸为弱酸。在某些实施方案中,所述酸为路易斯酸。例如,所述酸可以是双(三氟甲磺酰)亚胺或对甲苯磺酸。

在一些实施方案中,通过碱促进环氧化物开环反应。所述碱可以是弱碱(即,约7至约12的pKa)或强碱(即,约12至约50的pKa)。通常,所述碱是弱碱。例如,所述碱可以是三乙胺、二异丙基乙胺、吡啶、N-甲基吗啉或N,N-二甲基哌嗪或其衍生物。

在一些实施方案中,环氧化物开环反应在溶剂中进行。所述溶剂可以是能够增溶待反应的聚合物和环氧化合物的任何合适的溶剂或溶剂的混合物。例如,所述溶剂可以包括水、质子有机溶剂和/或非质子有机溶剂。所述溶剂的示例性列表包括水、二氯甲烷、乙醚、二甲亚砜、乙腈、甲醇和乙醇。

在一个实施方案中,通过所述聚合物与包含离去基团(例如氯原子、溴原子、碘原子、甲苯磺酸酯、三氟甲磺酸酯、甲磺酸酯等)的化合物之间的置换反应来修饰所述聚合物的基团A

在其中通过置换反应修饰被指定名为A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6、r1和r2以及s1至s4各自独立地为1至5的整数;R

在一些实施方案中,所述方法包括由式A的化合物制备包含式5的结构的聚合物:

其中,

R

W为-NR

Z是A

A

-(CH

-(CH

-(CH

-(CH

其中p1至p4、q1至q6以及r1和r2各自独立地为1至5的整数;并且R

通常,包括从式A的化合物形成包含式5的结构的聚合物的方法包括所述式A的化合物的开环聚合。可以通过任何合适的方法(例如温度、光、催化剂、化合物等)来引发所述式A的化合物的开环聚合。在一些实施方案中,所述式A的化合物的开环聚合用含胺化合物引发。

在某些实施方案中,用下式的含胺化合物引发所述式A化合物的开环聚合:

其中,

c为0至50的整数;

Y任选地存在并且是可裂解的连接基;以及

R

在一些实施方案中,在所述式A的化合物中,Y是-O-,并且Z是任选地包含1至8个或2至8个仲胺或叔胺的烷基基团、环烷基基团、烯基基团、环烯基基团、芳基基团、芳基烷基基团、杂烷基基团、杂环基基团或其组合。在一些实施方案中,Z是芳基烷基基团,例如苄基。制备式5的聚合物的方法则进一步包括在开环聚合之后,将得到的中间体聚合物用式NHR

R

适用的含有离去基团的化合物的实例包括下式的化合物:

其中LG是离去基团(例如氯原子、溴原子、碘原子、甲苯磺酸酯、三氟甲磺酸酯、甲磺酸酯等),并且R

在一些实施方案中,通过酸和/或碱促进置换反应。所述酸和/或碱可以是具有任何合适的pKa的任何合适的酸和/或碱。所述酸和/或碱可以是有机酸(例如对甲苯磺酸)、有机碱(例如三乙胺)、无机酸(例如四氯化钛)、无机碱(例如碳酸钾)或其组合。

在一些实施方案中,酸促进置换反应。所述酸可以是布朗斯特酸或路易斯酸。在所述酸是布朗斯特酸的实施方案中,所述酸可以是弱酸(即pKa为约4至约7)或强酸(即pKa为约-2至约4)。通常,所述酸为弱酸。在某些实施方案中,所述酸为路易斯酸。例如,所述酸可以是双(三氟甲磺酰)亚胺或对甲苯磺酸。

在一些实施方案中,通过碱促进置换反应。所述碱可以是弱碱(即,约7至约12的pKa)或强碱(即,约12至约50的pKa)。通常,所述碱是弱碱。例如,所述碱可以是三乙胺、二异丙基乙胺、吡啶、N-甲基吗啉或N,N-二甲基哌嗪或其衍生物。

在一些实施方案中,在溶剂中进行置换反应。所述溶剂可以是能够增溶待反应的聚合物和包含离去基团的化合物的任何合适的溶剂或溶剂的混合物。例如,所述溶剂可以包括水、质子有机溶剂和/或非质子有机溶剂。所述溶剂的示例性列表包括水、二氯甲烷、二乙醚、二甲亚砜、乙腈、甲醇和乙醇。

在一些实施方案中,所述方法还包括分离所示包含式1的结构的聚合物。可以通过任何合适的方式分离所述包含式1的结构的聚合物。例如,可以通过萃取、结晶、重结晶、柱色谱法、过滤或其任何组合分离所述包含式1的结构的聚合物。

组合物

本文提供的聚合物可用于任何目的。然而,认为所述聚合物特别可用于将核酸和/或多肽(例如,蛋白质)递送至细胞。因此,本文提供包含本文所述的聚合物和核酸和/或多肽(例如,蛋白质)的组合物。

在一些实施方案中,所述组合物包含核酸。可以使用任何核酸。核酸的示例性列表包括CRISPR系统的引导核酸和/或供体核酸、siRNA、MicroRNA、干扰RNA或RNAi、dsRNA、mRNA、DNA载体、核酶、反义多核苷酸,以及编码siRNA、MicroRNA、dsRNA、核酶或反义核酸的DNA表达盒。SiRNA包含双链结构,通常含有15-50个碱基对,优选19-25个碱基对,并且具有与细胞内表达的靶基因或RNA相同或几乎相同的核苷酸序列。SiRNA可以由退火的双多核苷酸或形成发夹的单多核苷酸组成。MicroRNA(miRNA)是小的非编码多核苷酸,约22个核苷酸长,其引导它们的mRNA靶的破坏或翻译阻抑。反义多核苷酸包含与基因或mRNA互补的序列。反义多核苷酸包括但不限于:吗啉代、2’-O-甲基多核苷酸、DNA、RNA等。基于多核苷酸的表达抑制剂可以在体外聚合,重组,含有嵌合序列或这些基团的衍生物。基于多核苷酸的表达抑制剂可以含有核糖核苷酸、脱氧核糖核苷酸、合成核苷酸或任何合适的组合,从而使靶RNA和/或基因被抑制。所述多核苷酸也可以是用作“条形码”的序列,用于例如体外或体内追踪递送的目的。

除了核酸之外或代替核酸,所述组合物还可以包含用于递送的任何蛋白质。所述多肽可以是任何合适的多肽。例如,所述多肽可以是锌指核酸酶、转录激活子样效应物核酸酶(“TALEN”)、重组酶、脱氨酶、核酸内切酶或其组合。在一些实施方案中,所述多肽是RNA引导的核酸内切酶(例如,Cas9多肽、Cpf1多肽或其变体)或DNA重组酶(例如,Cre多肽)。

本文提供的聚合物被认为特别可用于递送CRISPR系统的一种或多种组分。因此,在一些实施方案中,所述组合物包含引导RNA、RNA引导的核酸内切酶或编码它们的核酸,和/或供体核酸。所述组合物可以包含一种、两种或所有三种组分以及本文所述的聚合物。此外,所述组合物可以包含多种引导RNA、RNA引导的内切核酸酶或编码它们的核酸,和/或供体核酸。例如,可以包含用于不同的靶位点的多种不同的引导RNA,以及任选存在的多种不同的供体核酸和甚至多种不同的RNA引导的内切核酸酶或编码它们的核酸。

此外,CRISPR系统的组分可以以任何特定的方式或顺序与彼此(当存在多个组分时)以及所述聚合物组合。在一些实施方案中,所述引导RNA在与所述聚合物组合之前与RNA内切核酸酶复合。此外,或者替代地,所述引导RNA可以在与所述聚合物组合之前连接(共价或非共价地)至供体核酸。

所述组合物不限于任何特定的CRISPR系统(即,任何特定的引导RNA、RNA引导的核酸内切酶或供体核酸),其中许多是已知的。然而,为了进一步说明,下面描述一些此类系统的组分。

供体核酸

供体核酸(或“供体序列”或“供体多核苷酸”或“供体DNA”)是待插入由RNA引导的核酸内切酶(例如,Cas9多肽或Cpf1多肽)诱导的裂解位点处的核酸序列。供体多核苷酸会与裂解位点处的靶基因组序列具有足够的同源性,例如与裂解位点侧翼的核苷酸序列具有70%、80%、85%、90%、95%或100%同源性,例如所述核苷酸序列在裂解位点的约50个碱基或更少碱基内,例如在约30个碱基内、在约15个碱基内、在约10个碱基内、在约5个碱基内,或紧邻裂解位点,以支持其和与其具有同源性的基因组序列之间的同源性定向修复。供体和基因组序列之间的序列同源性的大约25、50、100或200个核苷酸或者超过200个核苷酸(或10和200个核苷酸之间的任何整数值,或更多)会支持同源性定向修复。供体序列可以是任何长度,例如10个或更多个核苷酸、50个或更多个核苷酸、100个或更多个核苷酸、250个或更多个核苷酸、500个或更多个核苷酸、1000个或更多个核苷酸、5000个或更多个核苷酸等。

供体序列通常与其替代的基因组序列不相同。相反,供体序列可以含有相对于基因组序列的一个或多个单碱基改变、插入、缺失、倒位或重排,只要存在足够的同源性以支持同源性定向修复。在一些实施方案中,供体序列包含侧翼为两个同源区的非同源序列,使得靶DNA区与两个侧翼序列之间的同源性定向修复导致非同源序列在靶区处的插入。供体序列还可以包含载体骨架,该载体骨架包含与目的DNA区不同源且不打算插入目的DNA区的序列。通常,供体序列的同源区会与需要重组的基因组序列具有至少50%的序列同一性。在某些实施方案中,存在60%、70%、80%、90%、95%、98%、99%或99.9%的序列同一性。取决于供体多核苷酸的长度,可以存在1%至100%序列同一性之间的任何值。

与基因组序列相比,供体序列可以包含某些序列差异,例如限制性位点、核苷酸多态性、选择性标记(例如,药物抗性基因、荧光蛋白、酶等)等,其可以用于评估供体序列在裂解位点的成功插入,或在一些实施方案中可以用于其他目的(例如,表示在所靶向的基因组基因座的表达)。在一些实施方案中,如果位于编码区,这样的核苷酸序列差异不会改变氨基酸序列,或会产生沉默的氨基酸改变(即不影响蛋白质的结构或功能的改变)。或者,这些序列差异可包括侧翼重组序列,例如FLP、loxP序列等,它们可在稍后的时间被激活以除去标记序列。

供体序列可以单链DNA、单链RNA、双链DNA或双链RNA的形式提供给细胞。它可以以线性或环状形式引入细胞中。如果以线性形式引入,则可通过本领域技术人员已知的方法保护供体序列的末端(例如,免于核酸外切降解)。例如,将一个或多个双脱氧核苷酸残基添加至线性分子的3'末端和/或将自身互补寡核苷酸连接至一个或两个末端。例如,参见Chang等人(1987)Proc.Natl.Acad Sci USA 84:4959-4963;Nehls等人(1996)Science272:886-889。如本文所例举的,也可以有利地使用扩增方法如滚环扩增。保护外源多核苷酸免于降解的其他方法包括但不限于添加末端氨基和使用修饰的核苷酸间键,例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。

作为保护线性供体序列末端的替代方案,可以在可以被降解而不影响重组的同源区之外包括额外长度的序列。可以将供体序列作为载体分子的一部分引入细胞,该载体分子具有额外的序列,例如,复制起点、启动子和编码抗生素抗性的基因。此外,供体序列可以作为裸核酸、作为与例如脂质体或聚合物的物质(agent)复合的核酸引入,或可以由病毒(例如腺病毒、AAV)递送,如本文对编码Cas9引导RNA和/或Cas9融合多肽和/或供体多核苷酸的核酸所述。

引导核酸

在一些实施方案中,所述组合物包含引导核酸。适于包含在本公开的组合物中的引导核酸包括单分子引导RNA(“单引导RNA”/“sgRNA”)和双分子引导核酸(“双引导RNA”/“dgRNA”)。

适于包含在本公开的复合物中的引导核酸(例如,引导RNA)将RNA引导的核酸内切酶(例如,Casf9或Cpf1多肽)的活性到向靶核酸内的特异性靶序列。引导核酸(例如,引导RNA)包含:第一片段(在本文中也称为“核酸靶向片段”,或简称为“靶向片段”);以及第二片段(在本文中也称为“蛋白结合片段”)。术语“第一”和“第二”并不意味着所述片段在引导RNA中出现的顺序。元件相对于彼此的顺序取决于待使用的特定RNA引导的多肽。例如,Casf9的引导RNA通常具有位于靶向片段的3'的蛋白结合片段,而Cpf1的引导RNA通常具有位于靶向片段的5'的蛋白结合片段。

引导RNA可以以线性或环状形式引入细胞。如果以线性形式引入,则可以通过本领域技术人员已知的方法保护引导RNA的末端(例如,免于核酸外切降解)。如本文所例举的,也可以有利地使用扩增方法如滚环扩增。

第一片段:靶向片段

引导核酸(例如,引导RNA)的第一片段包括与靶核酸中的序列(靶位点)互补的核苷酸序列。换句话说,引导核酸(例如,引导RNA)的靶向片段可以经由杂交(即,碱基配对)以序列特异性方式与靶核酸(例如,RNA、DNA、双链DNA)相互作用。因此,靶向片段的核苷酸序列可以变化,并且可以确定引导核酸(例如,引导RNA)和靶核酸会相互作用的靶核酸内的位置。可以修饰(例如,通过基因工程)引导核酸(例如,引导RNA)的靶向片段以与靶核酸内的任何期望序列(靶位点)杂交。

靶向片段可以具有12个核苷酸至100个核苷酸的长度。与靶核酸的核苷酸序列(靶位点)互补的靶向片段的核苷酸序列(靶向序列,也称为引导序列)可以具有12个nt或更长的长度。例如,与靶核酸的靶位点互补的靶向片段的靶向序列可以具有12个nt或更多、15个nt或更多、17个nt或更多、18个nt或更多、19个nt或更多、20个nt或更多、25个nt或更多、30个nt或更多、35个nt或更多或40个nt的长度。

靶向片段的靶向序列(即,引导序列)与靶核酸的靶位点之间的互补性百分比可以是60%或更多(例如,65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、97%或更多、98%或更多、99%或更多,或100%)。在一些实施方案中,靶向片段的靶向序列与靶核酸的靶位点之间的互补性百分比对于靶核酸的靶位点的7个连续的最5’(5’-most)核苷酸为100%。在一些实施方案中,靶向片段的靶向序列与靶核酸的靶位点之间的互补性百分比对于20个连续核苷酸为60%或更多。在一些实施方案中,靶向区段的靶向序列与靶核酸的靶位点之间的互补性百分比对于靶核酸的靶位点的17、18、19或20个连续的最5’核苷酸为100%,并且对于其余核苷酸为低至0%或更多。在这种情况下,可以认为靶向序列的长度分别为17、18、19或20个核苷酸。

第二片段:蛋白结合片段

引导核酸(例如,引导RNA)的蛋白结合片段与RNA引导的核酸内切酶相互作用(结合)。引导核酸(例如,引导RNA)经由上述靶向片段/靶向序列/引导序列将结合的核酸内切酶引导至靶核酸内的特定核苷酸序列(靶位点)。引导核酸的蛋白结合片段(例如,引导RNA)包含彼此互补的两个核苷酸区段。蛋白结合片段的互补核苷酸杂交形成双链RNA双链体(dsRNA双链体)。

单引导核酸和双引导核酸

双引导核酸(例如,引导RNA)包含两个单独的核酸分子。所述双引导核酸(例如,引导RNA)的两个分子中的每一者包含彼此互补的核苷酸中的一段,使得两个分子的互补核苷酸杂交以形成蛋白结合片段的双链RNA双链体。

在一些实施方案中,对于8个或更多个连续核苷酸的区段(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸),激活剂的双链体形成片段与国际专利申请号PCT/US2016/052690和PCT/US2017/062617中所述的激活剂(tracrRNA)分子之一或其互补物具有60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的同一性或100%同一性。

在一些实施方案中,对于8个或更多个连续核苷酸(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸)的区段,靶向剂的双链体形成片段与国际专利申请号PCT/US2016/052690和PCT/US2017/062617中所示的靶向剂(crRNA)序列中的一者或其互补物具有60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的同一性或100%同一性。

可以设计双引导核酸(例如,引导RNA)以允许靶分子与激活剂的受控(即,条件性)结合。因为除非激活剂和靶向剂两者在功能性复合物中与Cas9结合,否则双引导核酸(例如引导RNA)是无功能的,所以通过使激活剂和靶向剂之间的结合成为可诱导的,双引导核酸(例如引导RNA)可以是可诱导的(例如药物可诱导的)。作为一个非限制性实例,RNA适体可用于调节(即,控制)激活剂与靶向剂的结合。因此,激活剂和/或靶向剂可以包括RNA适体序列。

适体(例如,RNA适体)是本领域已知的,并且通常是核糖开关的合成形式。术语“RNA适体”和“核糖开关”在本文中可互换使用,包括合成的和天然的核酸序列,其允许诱导型调节它们所属的核酸分子(例如,RNA、DNA/RNA杂交体等)的结构(以及因此诱导型调节特定序列的可用性)。RNA适体通常包含折叠成特定结构(例如,发夹)的序列,其特异性结合特定药物(例如,小分子)。药物的结合引起RNA折叠的结构变化,这改变了适体是其一部分的核酸的特征。作为非限制性实例:(i)具有适体的激活剂可能不能结合到同源靶向剂,除非适体被合适的药物结合;(ii)具有适体的靶向剂可能不能结合到同源激活剂,除非适体被合适的药物结合;以及(iii)各自包含结合不同药物的不同适体的靶向剂和激活剂可能不能彼此结合,除非两种药物都存在。如这些实例所示,可以将双引导核酸(例如,引导RNA)设计为可诱导的。

适体和核糖开关的实例可见于例如:Nakamura et al.,Genes Cells.2012May;17(5):344-64;Vavalle et al.,Future Cardiol.2012May;8(3):371-82;Citartan et al.,Biosens Bioelectron.2012Apr 15;34(1):1-11;and Liberman et al.,WileyInterdiscip Rev RNA.2012May-Jun;3(3):369-84;所有这些文献通过引用整体并入本文。

包括在国际专利申请第PCT/US2016/052690和PCT/US2017/062617号中的可以包括在双引导核酸(例如,引导RNA)中的核苷酸序列,或可以杂交以形成蛋白结合区段的其互补物的非限制性实例。

本发明的单引导核酸(例如,引导RNA)包含两个核苷酸区段(很像双引导核酸的“靶向剂”和“激活剂”),它们彼此互补,杂交以形成蛋白结合区段的双链RNA双链体(dsRNA双链体)(从而导致茎-环结构),并且通过间插核苷酸(“连接基”或“连接基核苷酸”)共价连接。因此,所述单引导核酸(例如,单引导RNA)可以包含各自具有双链体形成片段的靶向剂和激活剂,其中靶向剂和激活剂的双链体形成片段彼此杂交以形成dsRNA双链体。靶向剂和激活剂可以通过靶向剂的3'端和该激活剂的5'端共价连接。或者,靶向剂和激活剂可通过靶向剂的5'端和激活剂的3'端共价连接。

单引导核酸的连接基可以具有3个核苷酸至100个核苷酸的长度。在一些实施方案中,单引导核酸(例如,引导RNA)的连接基是4个nt。

示例性的单引导核酸(例如,引导RNA)包含杂交形成dsRNA双链体的两个互补核苷酸区段。在一些实施方案中,对于8个或更多个连续核苷酸的区段(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸)上,单引导核酸(例如,引导RNA)(或编码该区段的DNA)的两个互补核苷酸区段之一与国际专利申请第PCT/US2016/052690和PCT/US 2017/062617号中列出的激活剂(tracrRNA)分子之一或其互补物具有60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的同一性或100%同一性。

在一些实施方案中,对于8个或更多个连续核苷酸(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸)的区段,单引导核酸(例如,引导RNA)(或编码该区段的DNA)的两个互补核苷酸区段之一与国际专利申请第PCT/US2016/052690和PCT/US2017/062617号中所示的靶向剂(crRNA)序列中的一者或其互补物具有60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的同一性或100%同一性。

在一些实施方案中,对于8个或更多个连续核苷酸的区段(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸),单引导核酸(例如,引导RNA)(或编码该片段的DNA)的两个互补核苷酸区段中的一者与在国际专利申请第PCT/US 2016/052690和PCT/US 2017/062617号中所示的靶向剂(crRNA)序列或激活剂(tracrRNA)序列中的一者或其互补物具有60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的同一性或100%同一性。

通过考虑物种名称和碱基配对(对于蛋白结合结构域的dsRNA双链体),可以常规确定合适的靶分子和激活剂的同源对。任何激活剂/靶向剂对可以用作双引导核酸(例如引导RNA)的一部分或用作单引导核酸(例如引导RNA)的一部分。

在一些实施方案中,双引导核酸(例如,引导RNA)(例如,双引导RNA)或单引导核酸(例如,引导RNA)(例如,单引导RNA)的激活剂(例如,trRNA、trRNA样分子等)包括与国际专利申请第PCT/US2016/052690和PCT/US2017/062617号中所示的激活剂(tracrRNA)分子或其互补物具有60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高序列同一性或100%序列同一性的核苷酸段。

在一些实施方案中,双引导核酸(例如,双引导RNA)或单引导核酸(例如,单引导RNA)的激活剂(例如,trRNA、trRNA样分子等)包括30个或更多个核苷酸(nt)(例如,40个或更多个、50个或更多个、60个或更多个、70个或更多个、75个或更多个nt)。在一些实施方案中,双引导核酸(例如,双引导RNA)或单引导核酸(例如,单引导RNA)的激活剂(例如,trRNA、trRNA样分子等)具有30至200个核苷酸(nt)的长度。

蛋白结合片段可以具有10个核苷酸至100个核苷酸的长度。

同样对于本发明的单引导核酸(例如,单引导RNA)和本发明的双引导核酸(例如,双引导RNA),蛋白结合片段的dsRNA双链体的长度可以是6个碱基对(bp)至50bp。杂交形成蛋白结合片段的dsRNA双链体的核苷酸序列之间的互补性百分比可以是60%或更高。例如,杂交形成蛋白结合片段的dsRNA双链体的核苷酸序列之间的互补性百分比可以是65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、98%或更多,或99%或更多(例如,在一些实施方案中,存在一些不杂交并因此在dsRNA双链体内产生凸起的核苷酸)。在一些实施方案中,杂交形成蛋白结合片段的dsRNA双链体的核苷酸序列之间的互补性百分比为100%。

杂交引导核酸

在一些实施方案中,引导核酸是两个RNA分子(双引导RNA分子)。在一些实施方案中,引导核酸是一个RNA分子(单引导RNA分子)。在一些实施方案中,引导核酸是DNA/RNA杂交分子。在这样的实施方案中,引导核酸的蛋白结合片段是RNA并形成RNA双链体。因此,激活剂和靶向剂的形成双链体的片段为RNA。然而,引导核酸的靶向片段可以是DNA。因此,如果DNA/RNA杂交引导核酸是双引导核酸,则“靶向剂”分子是杂交分子(例如,靶向片段可以是DNA,而双链体形成片段可以是RNA)。在这样的实施方案中,“激活剂”分子的双链体形成片段可以是RNA(例如,为了与靶向剂分子的双链体形成片段形成RNA双链体),而“激活剂”分子的双链体形成片段之外的核苷酸可以是DNA(在这种情况下,激活剂分子是杂交DNA/RNA分子)或者可以是RNA(在这种情况下,激活剂分子是RNA)。如果DNA/RNA杂交引导核酸是单引导核酸,那么靶向片段可以是DNA,形成双链体的片段(其组成单引导核酸的蛋白质结合片段)可以是RNA,靶向和形成双链体的片段之外的核苷酸可以是RNA或DNA。

DNA/RNA杂交引导核酸可用于例如当靶核酸是RNA时的一些实施方案中。Cas9通常和与靶DNA杂交的引导RNA结合,从而在靶位点形成DNA-RNA双链体。因此,当靶核酸是RNA时,有时有利的是通过使用作为DNA而不是RNA的(引导核酸的)靶向片段在靶位点处重获DNA-RNA双链体。然而,因为引导核酸的蛋白结合片段是RNA-双链体,所以靶向剂分子是靶向片段中的DNA和形成双链体的片段中的RNA。相对于双链靶核酸,杂交引导核酸可以使Cas9与单链靶核酸结合偏向。

示例性引导核酸

可以使用任何引导核酸。许多不同类型的引导核酸是本领域已知的。所选择的引导核酸会适当地与正在使用的特定CRISPR系统配对(例如,正在使用的特定RNA引导的内切核酸酶)。因此,引导核酸可以是例如对应于本文所述或本领域已知的任何RNA引导的内切核酸酶的引导核酸。在例如国际专利申请第PCT/US 2016/052690和PCT/US 2017/062617号中描述了引导核酸和RNA引导的内切核酸酶。

在一些实施方案中,合适的引导核酸包括两个单独的RNA多核苷酸分子。在一些实施方案中,两个单独的RNA多核苷酸分子中的第一者(激活剂)包含这样的核苷酸序列,对于8个或更多个连续核苷酸(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸)的区段,所述核苷酸序列与国际专利申请第PCT/US2016/052690和PCT/US2017/062617号中所示的核苷酸序列中的任一者或其互补物具有60%或更多(例如,65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多,或100%)核苷酸序列同一性。在一些实施方案中,两个单独的RNA多核苷酸分子中的第二者(靶向剂)包含这样的核苷酸序列,对于8个或更多个连续核苷酸(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸)的区段,所述核苷酸序列与国际专利申请第PCT/US2016/052690和PCT/US/201 062617号中列出的核苷酸序列中的任一者或其互补物具有60%或更多(例如,65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多,或100%)核苷酸序列同一性。

在一些实施方案中,合适的引导核酸是单RNA多核苷酸,并且包含第一核苷酸序列和第二核苷酸序列,对于8个或更多个连续核苷酸(例如,8个或更多个连续核苷酸、10个或更多个连续核苷酸、12个或更多个连续核苷酸、15个或更多个连续核苷酸,或20个或更多个连续核苷酸)的区段,所述第一核苷酸序列和第二核苷酸序列与国际专利申请第PCT/US2016/052690和PCT/US2017/062617号中所示的核苷酸序列中的任一者或其互补物具有60%或更多(例如,65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多,或100%)的核苷酸序列同一性。

在一些实施方案中,引导RNA是Cpf1和/或Cas9引导RNA。Cpf1和/或Cas9引导RNA可以具有30个核苷酸(nt)至100个nt,例如30个nt至40个nt、40个nt至45个nt、45个nt至50个nt、50个nt至60个nt、60个nt至70个nt、70个nt至80个nt、80个nt至90个nt,或90个nt至100个nt的总长度。在一些实施方案中,Cpf1和/或Cas9引导RNA的总长度为35个nt、36个nt、37个nt、38个nt、39个nt、40个nt、41个nt、42个nt、43个nt、44个nt、45个nt、46个nt、47个nt、48个nt、49个nt或50个nt。Cpf1和/或Cas9引导RNA可以包含靶核酸结合片段和双链体形成片段。

Cpf1和/或Cas9引导RNA的靶核酸结合片段可以具有15个nt至30个nt,例如15个nt、16个nt、17个nt、18个nt、19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt、26个nt、27个nt、28个nt、29个nt或30个nt的长度。在一些实施方案中,靶核酸结合片段的长度为23个nt。在一些实施方案中,靶核酸结合片段的长度为24个nt。在一些实施方案中,靶核酸结合片段的长度为25个nt。

Cpf1和/或Cas9引导RNA的靶核酸结合片段可以与相应长度的靶核酸序列具有100%的互补性。靶向片段可以与靶核酸序列的相应长度具有小于100%的互补性。例如,Cpf1和/或Cas9引导RNA的靶核酸结合片段可以具有与靶核酸序列不互补的1、2、3、4或5个核苷酸。例如,在一些实施方案中,其中靶核酸结合片段具有25个核苷酸的长度,并且靶核酸序列具有25个核苷酸的长度,在一些实施方案中,靶核酸结合片段与靶核酸序列具有100%互补性。作为另一个实例,在一些实施方案中,其中靶核酸结合片段具有25个核苷酸的长度,并且靶核酸序列具有25个核苷酸的长度,在一些实施方案中,靶核酸结合片段与靶核酸序列具有1个非互补核苷酸和24个互补核苷酸。

Cpf1和/或Cas9引导RNA的双链体形成片段可以具有15个nt至25个nt,例如15个nt、16个nt、17个nt、18个nt、19个nt、20个nt、21个nt、22个nt、23个nt、24个nt或25个nt的长度。

在一些实施方案中,Cpf1引导RNA的双链体形成片段可以包含核苷酸序列5’-AAUUUCUACUGUUGUAGAU-3’。

附加元件

在一些实施方案中,引导核酸(例如,引导RNA)包含一个或多个额外的区段(在一些实施方案中在5’端,在一些实施方案中在3’端,在一些实施方案中在5’或3’端,在一些实施方案中嵌入序列内(即,不在5’和/或3’端),在一些实施方案中在5’端和3’端,在一些实施方案中,嵌入以及在5’端和/或3’端等)。例如,合适的另外的片段可包括5’帽(例如,7-甲基鸟苷酸帽(M

RNA引导的核酸内切酶

除了引导核酸之外,或代替引导核酸,所述组合物可包含RNA引导的核酸内切酶蛋白或编码其的核酸(例如mRNA或载体)。可以使用任何RNA引导的内切核酸酶。所使用的RNA引导的内切核酸酶的选择至少部分地取决于所使用的CRISPR系统的预期最终用途。

在一些实施方案中,多肽是Cas9多肽。适合包含在本公开的组合物中的Cas9多肽包括天然存在的Cas9多肽(例如,天然存在于细菌和/或古细菌细胞中),或非天然存在的Cas9多肽(例如,Cas9多肽是变体Cas9多肽、如下文所讨论的嵌合多肽等),如下所述。在一些实施方案中,本领域技术人员可以理解,本文公开的Cas9多肽可以是源自或分离自任何来源的任何变体。在其他实施方案中,本公开的Cas9肽可以包括文献中描述的一个或多个突变,包括但不限于在以下文献中描述的功能突变:Fonfara et al.Nucleic AcidsRes.2014Feb;42(4):2577-90;Nishimasu H.et al.Cell.2014Feb 27;156(5):935-49;Jinek M.et al.Science.2012 337:816-21;and Jinek M.et al.Science.2014 Mar 14;343(6176);还参见2013年3月15日提交的美国专利申请第13/842,859号,其通过引用并入本文;还参见美国专利8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8,906,616;8,932,814;8,945,839;8,993,233,其全部内容通过引用并入本文。因此,在一些实施方案中,本文公开的系统和方法可以与具有双链核酸酶活性的野生型Cas9蛋白、作为单链切口酶起作用的Cas9突变体或具有改性的核酸酶活性的其他突变体一起使用。因此,适于包含在本公开的组合物中的Cas9多肽可以是具有酶活性的Cas9多肽,例如可以在靶核酸中产生单链或双链断裂,或者与野生型Cas9多肽相比,可以具有降低的酶活性。

天然存在的Cas9多肽结合引导核酸,由此导向靶核酸内的特定序列(靶位点),并裂解靶核酸(例如,裂解dsDNA以产生双链断裂、裂解ssDNA、裂解ssRNA等)。所述Cas9多肽包含两个部分,即RNA结合部分和活性部分。RNA结合部分与所述引导核酸相互作用,活性部分表现出定点(site-directed)酶活性(例如,核酸酶活性、DNA和/或RNA甲基化活性、DNA和/或RNA裂解活性、组蛋白乙酰化活性、组蛋白甲基化活性、RNA修饰活性、RNA结合活性、RNA剪接活性等)。在一些实施方案中,活性部分是无酶促活性的。

测定蛋白质是否具有与受试引导核酸相互作用的RNA结合部分的测定法可以是测试蛋白质与核酸之间结合的任何方便的结合测定法。示例性结合测定法包括涉及向靶核酸添加引导核酸和Cas9多肽的结合测定法(例如,凝胶移位测定法)。

确定蛋白质是否具有活性部分(例如,确定多肽是否具有裂解靶核酸的核酸酶活性)的测定法可以是测试核酸裂解的任何方便的核酸裂解测定法。示例性裂解测定法包括向靶核酸中加入引导核酸和Cas9多肽。

在一些实施方案中,适合包含在本公开的组合物中的Cas9多肽具有修饰靶核酸的酶活性(例如核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂解酶活性或糖基化酶活性)。

在其他实施方案中,适合包含在本公开的组合物中的Cas9多肽具有修饰与靶核酸相关的多肽(例如组蛋白)的酶活性(例如甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷酸化活性、去腺苷酸化活性、核糖基化活性、去腺苷酸化活性、肉豆蔻酰化活性或脱髓鞘化活性)。

已经鉴定了来自多种物种的许多Cas9直系同源物,并且在一些实施方案中,蛋白质仅共享几个相同的氨基酸。所有鉴定的Cas9直系同源物具有相同的结构域结构,该结构域结构具有中心HNH核酸内切酶结构域和分裂的RuvC/RNaseH结构域。Cas9蛋白共有4个具有保守结构的关键基序。基序1、2和4是RuvC样基序,而基序3是HNH基序。

在一些实施方案中,合适的Cas9多肽包含具有4个基序的氨基酸序列,基序1-4中的每一个与图1(SEQ ID NO:1)中描述的Cas9氨基酸序列,或下表1中描述的Cas9氨基酸序列的基序1-4(SEQ ID NO:1的基序1-4分别为SEQ ID NO:3-6,如下表1中描述),或图1所示Cas9氨基酸序列(SEQ ID NO:1)的氨基酸7-166或731-1003具有60%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、99%或更多或100%的氨基酸序列同一性。

在一些实施方案中,Cas9多肽包含与图1中描述的以及在SEQ ID NO:1中列出的氨基酸序列具有75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、或98%的氨基酸序列同一性的氨基酸序列;并且包含相对于SEQ ID NO:1中所示的氨基酸序列的N497、R661、Q695和Q926的氨基酸取代;或包含相对于SEQ ID NO:1中所示的氨基酸序列的K855的氨基酸取代;或包含相对于SEQ ID NO:1中所示的氨基酸序列的K810、K1003和R1060的氨基酸取代;或包含相对于SEQ ID NO:1中所示的氨基酸序列的K848、K1003和R1060的氨基酸取代。

如本文所用,术语“Cas9多肽”涵盖术语“变体Cas9多肽”;术语“变体Cas9多肽”涵盖术语“嵌合Cas9多肽”。

变体Cas9多肽

适合包含在本公开的组合物中的Case9多肽包括变体Case9多肽。变体Cas9多肽具有与野生型Cas9多肽(例如天然存在的Cas9多肽,如上所述))的氨基酸序列相比时,一个氨基酸不同(例如缺失、插入、取代、融合)(即至少一个氨基酸不同)的氨基酸序列。在一些情况下,变体Cas9多肽具有降低Cas9多肽的核酸酶活性的氨基酸改变(例如,缺失、插入或取代)。例如,在一些情况下,变体Cas9多肽具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的相应野生型Cas9多肽的核酸酶活性。在一些实施方案中,变体Cas9多肽基本上没有核酸酶活性。当Case9多肽是不具有实质性核酸酶活性的变体Case9多肽时,它可以被称为“dCas9”。

在一些实施方案中,变体Cas9多肽具有降低的核酸酶活性。例如,适用于本公开的结合方法的变体Cas9多肽表现出小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%的野生型Cas9多肽(例如包含如图1(SEQ ID NO:1)中所描绘的氨基酸序列的野生型Cas9多肽)的核酸内切酶活性。

在一些实施方案中,变体Cas9多肽可裂解靶核酸的互补链,但裂解双链靶核酸的非互补链的能力降低。例如,变体Cas9多肽可以具有降低RuvC结构域(例如图1的“结构域1”)的功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体Cas9多肽具有D10A突变(例如,在对应于SEQ ID NO:1的位置10的氨基酸位置处的天冬氨酸变为丙氨酸),并且因此可以裂解双链靶核酸的互补链,但是裂解双链靶核酸的非互补链的能力降低(因此,当变体Cas9多肽裂解双链靶核酸时导致单链断裂(SSB)而不是双链断裂(DSB))(例如参见Jinek et al.,Science.2012 Aug 17;337(6096):816-21)。

在一些实施方案中,变体Cas9多肽可以裂解双链靶核酸的非互补链,但裂解靶核酸的互补链的能力降低。例如,变体Cas9多肽可以具有降低HNH结构域(RuvC/HNH/RuvC结构域基序,图1的“结构域2”)的功能的突变(氨基酸取代)。作为一个非限制性实例,在一些实施方案中,变体Cas9多肽可以具有H840A突变(例如,在对应于SEQ ID NO:1的位置840的氨基酸位置处的组氨酸变为丙氨酸)(图1)并且因此可以裂解靶核酸的非互补链,但裂解靶核酸的互补链的能力降低(因此,当变体Cas9多肽裂解双链靶核酸时产生SSB而不是DSB)。这样的Cas9多肽具有降低的裂解靶核酸(例如,单链靶核酸)的能力,但保留结合靶核酸(例如,单链或双链靶核酸)的能力。

在一些实施方案中,变体Cas9多肽具有降低的裂解双链靶核酸的互补链和非互补链两者的能力。作为非限制性实例,在一些实施方案中,变体Cas9多肽同时包含D10A和H840A突变(例如,在RuvC结构域和HNH结构域两者中的共同突变),使得所述多肽具有降低的裂解双链靶核酸的互补链和非互补链两者的能力。这样的Cas9多肽具有降低的裂解靶核酸(例如,单链靶核酸或双链靶核酸)的能力,但保留结合靶核酸(例如,单链靶核酸或双链靶核酸)的能力。

作为另一个非限制性实例,在一些实施方案中,变体Cas9多肽含有W476A和W1126A突变,使得所述多肽具有降低的裂解靶核酸的能力。这样的Cas9多肽具有降低的裂解靶核酸的能力但保留结合靶核酸的能力。

作为另一个非限制性实例,在一些实施方案中,变体Cas9多肽含有P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得所述多肽具有降低的裂解靶核酸的能力。这样的Cas9多肽具有降低的裂解靶核酸的能力但保留结合靶核酸的能力。

作为另一个非限制性实例,在一些实施方案中,变体Cas9多肽含有H840A、W476A和W1126A突变,使得所述多肽具有降低的裂解靶核酸的能力。这样的Cas9多肽具有降低的裂解靶核酸的能力但保留结合靶核酸的能力。

作为另一个非限制性实例,在一些实施方案中,变体Cas9多肽含有H840A、D10A、W476A和W1126A突变,使得所述多肽具有降低的裂解靶核酸的能力。这样的Cas9多肽具有降低的裂解靶核酸的能力但保留结合靶核酸的能力。

作为另一个非限制性实例,在一些实施方案中,变体Cas9多肽包含H840A、P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得所述多肽具有降低的裂解靶核酸的能力。这样的Cas9多肽具有降低的裂解靶核酸的能力但保留结合靶核酸的能力。

作为另一个非限制性实例,在一些实施方案中,变体Cas9多肽含有D10A、H840A、P475A、W476A、N477A、D1125A、W1126A和D1127A突变,使得所述多肽具有降低的裂解靶核酸的能力。这样的Cas9多肽具有降低的裂解靶核酸的能力但保留结合靶核酸的能力。

可以突变其他残基以达到上述效果(即,使一个或另一个核酸酶部分失活)。作为非限制性实例,残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987可被改变(例如,被取代)(关于Cas9氨基酸残基的保守性的更多信息参见表1)。此外,除了丙氨酸取代之外的突变也是合适的。

在一些实施方案中,具有降低的催化活性的变体Cas9多肽(例如,当Cas9蛋白具有D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987突变,例如D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A和/或D986A时),只要其保留与引导核酸相互作用的能力,变体Cas9多肽仍可以位点特异性方式结合靶核酸(因为其仍被引导核酸引导至靶核酸序列)。

表1.表1列出了存在于来自不同物种的Cas9序列中的4个基序。此处列出的氨基酸来自酿脓链球菌(S.pyogenes)的Cas9(SEQ ID NO:1)。

除了上述之外,变体Cas9蛋白可以具有与上述Cas9多肽相同的序列同一性参数。因此,在一些实施方案中,合适的变体Cas9多肽包含具有4个基序的氨基酸序列,基序1-4中的每一个与图1(SEQ ID NO:1)中所示的Cas9氨基酸序列、或基序1-4(SEQ ID NO:1的基序1-4分别为SEQ ID NO:3-6,如表1中所示)、或图1(SEQ ID NO:1)中描述的Cas9氨基酸序列的氨基酸7-166或731-1003具有60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、99%或更高或100%的氨基酸序列同一性。如上定义的任何Cas9蛋白可在本公开的组合物中用作Cas9多肽或用作嵌合Cas9多肽的一部分,包括在国际专利申请号PCT/US2016/052690和PCT/US2017/062617中具体引用的那些。

在一些实施方案中,合适的变体Cas9多肽包含与图1(SEQ ID NO:1)中描绘的Cas9氨基酸序列具有60%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、99%或更多、或100%氨基酸序列同一性的氨基酸序列。如上定义的任何Cas9蛋白可在本公开的组合物用作变体Cas9多肽或用作嵌合变体Cas9多肽的一部分,包括在国际专利申请号PCT/US2016/052690和PCT/US2017/062617中具体引用的那些。

嵌合多肽(融合多肽)

在一些实施方案中,变体Cas9多肽是嵌合Cas9多肽(在本文中也称为融合多肽,例如,“Cas9融合多肽”)。Cas9融合多肽可以结合和/或修饰靶核酸(例如裂解、甲基化、脱甲基化等)和/或与靶核酸相关的多肽(例如组蛋白尾部的甲基化、乙酰化等)。

Cas9融合多肽由于在序列上不同于野生型Cas9多肽(例如天然存在的Cas9多肽)而为变体Cas9多肽。Cas9融合多肽是与共价连接的异源多肽(也称为“融合配偶体”)融合的Cas9多肽(例如野生型Cas9多肽、变体Cas9多肽、具有降低的核酸酶活性的变体Cas9多肽(如上所述)等)。在一些实施方案中,Cas9融合多肽是与共价连接的异源多肽融合的具有降低的核酸酶活性的变体Cas9多肽(例如,dCas9)。在一些实施方案中,异源多肽显示(并因此提供)也会由Cas9融合多肽显示的活性(例如,酶活性)(例如,甲基转移酶活性、乙酰转移酶活性、激酶活性、泛蛋白化活性等)。在一些这样的实施方案中,结合方法,例如,当Cas9多肽是具有修饰靶核酸的活性(例如酶活性)的融合配偶体(即具有异源多肽)的变体Cas9多肽时,该方法也可以被认为是修饰靶核酸的方法。在一些实施方案中,结合靶核酸的方法(例如,单链靶核酸)可导致靶核酸的修饰。因此,在一些实施方案中,结合靶核酸(例如,单链靶核酸)的方法可以是修饰靶核酸的方法。

在一些实施方案中,异源序列提供亚细胞定位,即,该异源序列是亚细胞定位序列(例如,用于靶向细胞核的核定位信号(NLS),将融合蛋白保持在细胞核外的序列,例如核输出序列(NES或NES),让融合蛋白保留在细胞质中的序列,靶向线粒体的线粒体定位信号,靶向叶绿体的叶绿体定位信号,内质网(ER)保留信号等)。在一些实施方案中,变体Cas9不包括NLS,使得蛋白质不靶向细胞核(这可能是有利的,例如当靶核酸是存在于细胞液中的RNA时)。在一些实施方案中,异源序列可提供标记(即,异源序列是可检测标记)以便于追踪和/或纯化(例如,荧光蛋白,如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;组氨酸标记,例如6XHis标记;血凝素(HA)标记;FLAG标记;Myc标记;等等)。在一些实施方案中,异源序列可以提供增加或降低的稳定性(即,异源序列是稳定性控制肽,例如降解决定子,其在一些实施方案中是可控制的(例如,温度敏感的或药物可控制的降解决定子序列,参见下文)。在一些实施方案中,异源序列可提供从靶核酸增加或减少的转录(即,异源序列是转录调节序列,例如转录因子/激活因子或其片段、募集转录因子/激活因子的蛋白质或其片段、转录阻抑蛋白或其片段、募集转录阻抑蛋白的蛋白质或其片段、小分子/药物响应性转录调节物等)。在一些实施方案中,异源序列可提供结合结构域(即,异源序列是蛋白结合序列,例如,提供Cas9融合多肽结合另一目标蛋白质的能力,该目标蛋白质例如是DNA或组蛋白修饰蛋白、转录因子或转录阻抑蛋白、募集蛋白、RNA修饰酶、RNA结合蛋白、翻译起始因子、RNA剪接因子等)。可以将异源核酸序列与另一核酸序列连接(例如,通过遗传工程连接)以产生编码嵌合多肽的嵌合核苷酸序列。

受试Cas9融合多肽(Cas9融合蛋白)可以具有多个(1个或更多,2个或更多,3个或更多,等)上述任意组合的融合配偶体。作为说明性实例,Cas9融合蛋白可具有提供活性(例如,用于转录调节、靶向剂改性、与靶核酸相关的蛋白质的改性等)的异源序列,并且还可具有亚细胞定位序列。在一些实施方案中,这样的Cas9融合蛋白还可具有便于追踪和/或纯化的标记(例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;组氨酸标记,例如6XHis标记;血凝素(HA)标记;FLAG标记;Myc标记等)。作为另一个说明性实例,Cas9蛋白可具有一个或多个NLS(例如,2个或更多个,3个或更多个,4个或更多个,5个或更多个,1、2、3、4或5个NLS)。在一些实施方案中,融合配偶体(或多个融合配偶体)(例如NLS、标记、提供活性的融合配偶体等)位于或靠近Cas9的C末端。在一些实施方案中,融合配偶体(或多个融合配偶体)(例如NLS、标记,提供活性的融合配偶体等)位于Cas9的N末端。在一些实施方案中,Cas9在N末端和C末端都具有融合配偶体(或多个融合配偶体)(例如NLS、标签、提供活性的融合配偶体等)。

提供增加或降低的稳定性的合适的融合配偶体包括但不限于降解决定子序列。降解决定子是本领域普通技术人员容易理解的,是控制蛋白质(所述降解决定子是该蛋白质的部分)的稳定性的氨基酸序列。例如,包含降解决定子序列的蛋白质的稳定性部分地由降解决定子序列控制。在一些实施方案中,合适的降解决定子是组成型的,使得降解决定子不依赖于实验控制而对蛋白质稳定性施加影响(即降解决定子不是药物诱导的、温度诱导的,等等)。在一些实施方案中,降解决定子提供具有可控稳定性的变体Cas9多肽,使得变体Cas9多肽可根据所需条件而被“开启”(即稳定)或“关闭”(即不稳定、降解)。例如,如果降解决定子是温度敏感的降解决定子,则变体Cas9多肽在阈值温度以下可以是功能性的(即“开启”,稳定的)(例如42℃、41℃、40℃、39℃、38℃、37℃、36℃、35℃、34℃、33℃、32℃、31℃、30℃,等),但在阈值温度以上是非功能性的(即“关闭”,降解的)。作为另一个实例,如果降解决定子是药物诱导型降解决定子,则药物的存在或不存在可以将蛋白质从“关闭”(即,不稳定)状态切换至“开启”(即,稳定)状态,或反之亦然。示例性的药物诱导型降解决定子衍生自FKBP12蛋白。降解决定子的稳定性通过存在或不存在结合降解决定子的小分子来控制。

合适的降解决定子的实例包括但不限于由Shield-1、DHFR、生长素和/或温度控制的那些降解决定子。合适的降解决定子的非限制性实例是本领域已知的(例如,Dohmen etal.,Science,1994.263(5151):p.1273-1276:Heat-inducible degron:a method forconstructing temperature-sensitive mutants;Schoeber et al.,Am J Physiol RenalPhysiol.2009Jan;296(1):F204-11:Conditional fast expression and function ofmultimeric TRPV5 channels using Shield-1;Chu et al.,Bioorg Med ChemLett.2008Nov 15;18(22):5941-4:Recent progress with FKBP-derived destabilizingdomains;Kanemaki,Pflugers Arch.2012Dec 28:Frontiers of protein expressioncontrol with conditional degrons;Yang et al.,Mol Cell.2012Nov 30;48(4):487-8:Titivated for destruction:the methyl degron;Barbour et al.,Biosci Rep.2013Jan18;33(1).:Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase;and Greussing et al.,J VisExp.2012Nov 10;(69):Monitoring of ubiquitin-proteasome activity in livingcells using a Degron(dgn)-destabilized green fluorescent protein(GFP)-basedreporter protein;其全部内容通过引用整体并入本文)。

已经在细胞和动物中对示例性的降解决定子序列进行充分表征和测试。因此,将Cas9(例如野生型Cas9;变体Cas9;具有降低的核酸酶活性的变体Cas9,例如dCas9;等等)与降解决定子序列融合产生“可调的”和“可诱导的”Cas9多肽。本文所述的任何融合配偶体可以任何期望的组合使用。作为说明这一点的一个非限制性实例,Cas9融合蛋白(即,嵌合Cas9多肽)可包含用于检测的YFP序列、用于稳定的降解决定子序列和增加靶核酸转录的转录激活子序列。用作Cas9多肽(例如野生型Cas9、变体Cas9、具有降低的核酸功能的变体Cas9等)的融合配偶体的合适的报告蛋白包括但不限于以下示例性蛋白(或其功能片段):his3,β-半乳糖苷酶、荧光蛋白(例如GFP、RFP、YFP、Cherry、Tomato等,及其各种衍生物)、荧光素酶、β-葡糖醛酸糖苷酶和碱性磷酸酶。此外,可以在Case9融合蛋白中使用的融合配偶体的数量是不受限制的。在一些实施方案中,Cas9融合蛋白包含1个或多个(例如2个或更多个、3个或更多个、4个或更多个,或5个或更多个)异源序列。

合适的融合配偶体包括但不限于提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、泛素化活性、去泛素化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性或去肉豆蔻酰化活性的多肽,这些活性中的任一者可旨在修饰核酸(例如,DNA或RNA的甲基化)或旨在修饰核酸相关多肽(例如,组蛋白、DNA结合蛋白和RNA结合蛋白等)。其他合适的融合配偶体包括但不限于:边界元件(例如CTCF)、提供外周募集的蛋白及其片段(例如Lamin A、Lamin B等)和蛋白质对接元件(例如FKBP/FRB、Pil1/Aby1等)。

用于所述变体Case9多肽的各种另外的合适融合配偶体(或其片段)的实例包括但不限于在以下PCT专利申请中描述的那些:WO 2010/075303、WO 2012/068627和WO 2013/155555,它们通过引用整体并入本文。

合适的融合配偶体包括但不限于提供活性的多肽,该活性通过直接作用于靶核酸或与靶核酸相关的多肽(例如,组蛋白、DNA结合蛋白、RNA编辑蛋白等)而间接增加转录。合适的融合配偶体包括但不限于提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷酸化活性、去腺苷酸化活性、泛素化活性、去泛素化活性、核糖基化活性、去腺苷酸化活性、肉豆蔻酰化活性或脱去核糖基化活性的多肽。

其他合适的融合配偶体包括但不限于直接提供靶核酸(例如,转录激活因子或其片段、募集转录激活因子的蛋白质或其片段、小分子/药物应答性转录和/或翻译调节子、翻译调节蛋白等)的增加的转录和/或翻译的多肽。

实现增加的或减少的转录的融合配偶体的非限制性实例包括转录激活剂和转录阻抑蛋白结构域(例如,Krüppel associated box(KRAB或SKD);Mad mSIN3相互作用结构域(SID);ERF阻抑蛋白结构域(ERD)等)。在一些这样的实施方案中,Cas9融合蛋白由引导核酸靶向中靶核酸中的特定位置(即序列),并且发挥基因座特异性调控,例如阻断RNA聚合酶与启动子(其选择性抑制转录激活因子功能)结合,和/或修饰局部染色质状态(例如当使用修饰靶核酸或修饰与靶核酸相关的多肽的融合序列时)。在一些实施方案中,改变是暂时的(例如,转录抑制或激活)。在一些实施方案中,改变是可遗传的(例如,当对靶核酸或与靶核酸相关的蛋白质(例如,核小体组蛋白)进行表观遗传修饰时)。

在靶向ssRNA靶核酸时使用的融合配偶体的非限制性实例包括(但不限于):剪接因子(例如RS结构域);蛋白质翻译组分(例如,翻译起始、延伸和/或释放因子;例如,eIF4G);RNA甲基化酶;RNA编辑酶(例如RNA脱氨酶,例如作用于RNA的腺苷脱氨酶(ADAR),包括A至I和/或C至U编辑酶);heliembodiments;RNA结合蛋白;等等。应理解,融合配偶体可包括整个蛋白质,或在一些实施方案中可包括蛋白质的片段(例如,功能性结构域)。

在一些实施方案中,异源序列可以与Cas9多肽的C末端融合。在一些实施方案中,异源序列可以与Cas9多肽的N末端融合。在一些实施方案中,异源序列可以与Cas9多肽的内部部分(即,除N末端或C末端之外的部分)融合。

此外,嵌合Cas9多肽的融合配偶体可以是能够与ssRNA暂时或不可逆地、直接或间接地相互作用的任何结构域(出于本公开的目的,其包括分子内和/或分子间二级结构,例如双链RNA双链体例如发夹、茎环等),包括但不限于选自以下的效应子结构域:来自蛋白例如SMG5和SMG6的核酸内切酶(例如RNase I、CRR

可以(全部或作为其片段)用作Cas9多肽的融合配偶体的一些RNA剪接因子具有模块化组织,具有单独的序列特异性RNA结合模块和剪接效应子结构域。例如,富含丝氨酸/精氨酸(SR)的蛋白家族的成员包含与前mRNA中的外显子剪接增强子(ESE)结合的N末端RNA识别基序(RRMs)和促进外显子保留(exon inclusion)的C末端RS结构域。作为另一个实例,hnRNP蛋白hnRNPA

在一些实施方案中,Cas9多肽(例如野生型Cas9、变体Cas9、具有降低的核酸酶活性的变体Cas9等)可通过肽间隔区与融合配偶体连接。

在一些实施方案中,Cas9多肽包含“蛋白转导结构域”或PTD(也称为CPP-细胞穿透肽),其可指多肽、多核苷酸、碳水化合物、或促进穿过脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的有机或无机化合物。附着于另一分子的PTD促进分子穿过膜,例如从胞外空间到胞内空间,或从胞质溶胶到细胞器内,所述另一分子可以是从小极性分子到大的高分子和/或纳米颗粒。在一些实施方案中,与另一分子连接的PTD促进所述分子进入核中(例如,在一些实施方案中,PTD包括核定位信号(NLS))。在一些实施方案中,Cas9多肽包含两个或更多个NLS,例如,串联的两个或更多个NLS。在一些实施方案中,PTD共价连接至Cas9多肽的氨基末端。在一些实施方案中,PTD共价连接至Cas9多肽的羧基端。在一些实施方案中,PTD共价连接至Cas9多肽的氨基末端和羧基末端。在一些实施方案中,PTD共价连接至核酸(例如,引导核酸、编码引导核酸的多核苷酸、编码Cas9多肽的多核苷酸等)。示例性PTD包括但不限于最小的十一肽蛋白转导结构域(对应于HIV-1TAT的残基47-57,包含YGRKKRRQRRR;SEQ ID NO:7);聚精氨酸序列,其包含足以引导进入细胞的数量的精氨酸(例如,3、4、5、6、7、8、9、10或10-50个精氨酸);VP22结构域(Zender et al.(2002)Cancer Gene Ther.9(6):489-96);果蝇触角蛋白转导域(Noguchi et al.(2003)Diabetes 52(7):1732-1737);截短的人降钙素肽(Trehin et al.(2004)Pharm.Research 21:1248-1256);聚赖氨酸(Wender et al.(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008);RRQRRTSKLMKR(SEQ ID NO:8);Transportan GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:9);KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:10);以及RQIKIWFQNRRMKWKK(SEQ ID NO:11)。示例性PTD包括但不限于,YGRKKRRQRRR(SEQ ID NO:12)、RKKRRQRRR(SEQ ID NO:13);3个精氨酸残基至50个精氨酸残基的精氨酸均聚物;示例性PTD结构域氨基酸序列包括但不限于以下任何序列:YGRKKRRQRRR(SEQ ID NO:14);RKKRRQRR(SEQ ID NO:15);YARAAARQARA(SEQ ID NO:16);THRLPRRRRRR(SEQ ID No:17);以及GGRRARRRRRR(SEQ ID NO:18)。在一些实施方案中,PTD是可激活的CPP(ACPP)(Aguilera et al.(2009)Integr Biol(Camb)June;1(5-6):371-381)。ACPP含有聚阳离子CPP(例如,Arg9或“R9”),通过可裂解的接头与匹配的聚阴离子(例如,Glu9或“E9”)相连,它将净电荷减少到几乎为零,从而抑制粘附和摄入细胞。在连接基裂解时,聚阴离子被释放,局部地暴露聚精氨酸及其固有的粘附性,从而“激活”ACPP以横穿膜。

在一些实施方案中,所述组合物可以包含Cpf1 RNA引导的核酸内切酶,其实例在图2、16或17中提供。Cpf1 RNA引导的核酸内切酶的另一个名称是Cas12a。本公开的Cpf1CRISPR系统包含i)单一内切核酸酶蛋白,和ii)crRNA,其中crRNA的3'末端的部分含有与靶核酸互补的引导序列。在该系统中,Cpf1核酸酶由crRNA直接募集到靶DNA。在一些实施方案中,为了实现可检测的DNA裂解,Cpf1的引导序列必须为至少12个nt、13个nt、14个nt、15个nt或16个nt,为了实现有效的DNA裂解,Cpf1的引导序列最少为14个nt、15个nt、16个nt、17个nt或18个nt。

本公开的Cpf1系统在各方面不同于Cas9。首先,与Cas9不同,Cpf1不需要单独的tracrRNA用于裂解。在一些实施方案中,Cpf1 crRNA可以短至约42-44个碱基长,其中23-25个nt是引导序列并且19个nt是组成型直接重复序列。相反,组合的Cas9tracrRNA和crRNA合成序列可以是约100个碱基长。

第二,Cpf1优选位于其靶向剂的5’上游的“TTN”PAM基序。这与位于Cas9系统的靶DNA的3'上的“NGG”PAM基序相反。在一些实施方案中,紧邻地在引导序列之前的尿嘧啶碱基不能被取代(Zetsche,B.et al.2015.“Cpf1 Is a Single RNA-Guided Endonuclease ofa Class 2CRISPR-Cas System”Cell 163,759-771,其通过引用整体并入本文用于所有目的)。

第三,Cpf1的裂解位点错开约3-5个碱基,这产生“粘性末端”(2016年6月6日在线出版的Kim et al.,2016.“Genome-wide analysis reveals specificities ofCpf1endonucleases in human cells”)。这些具有3-5bp突出端的粘性末端被认为促进NHEJ介导的连接,并改善具有匹配末端的DNA片段的基因编辑。裂解位点在靶DNA的3’末端,远离PAM所在的5’末端。裂解位置通常跟随未杂交链上的第18个碱基和与crRNA杂交的互补链上的对应第23个碱基。

第四,在Cpf1复合物中,“种子”区位于引导序列的第一个5个nt内。Cpf1 crRNA种子区域对突变高度敏感,甚至该区域的单碱基取代也能显著降低裂解活性(参见ZetscheB.et al.2015“Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2CRISPR-CasSystem”Cell 163,759-771)。严格地说,与Cas9 CRISPR靶不同,Cpf1系统的裂解位点和种子区不重叠。在(Zetsche B.et al.2015.“Cpf1 Is a Single RNA-Guided Endonucleaseof a Class 2CRISPR-Cas System”Cell 163,759-771)上可获得设计靶向Cpf1 crRNA的寡聚物的另外的指导。

本领域技术人员会将理解,本文公开的Cpf1可以是衍生自或分离自任何来源的任何变体,其中许多是本领域已知的。例如,在一些实施方案中,本公开的Cpf1肽可包括图2所示FnCPF1(例如SEQ ID NO:2)、AsCpf1(例如图16)、LbCpf1(例如图17)或任何其他已知的来自各种其他微生物物种的Cpf1蛋白及其合成变体。

在一些实施方案中,所述组合物包含Cpf1多肽。在一些实施方案中,Cpf1多肽具有酶活性,例如Cpf1多肽在结合引导RNA时裂解靶核酸。在一些实施方案中,Cpf1多肽相对于野生型Cpf1多肽(例如相对于包括图2、16或17描述的氨基酸序列的Cpf1多肽)显示降低的酶活性,并保持DNA结合活性。

在一些实施方案中,对于图2、16或17中描绘的氨基酸序列,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性。在一些实施方案中,对于图2、16或17描述的氨基酸序列的100个氨基酸至200个氨基酸(aa)、200aa至400aa、400aa至600aa、600aa至800aa、800aa至1000aa、1000aa至1100aa、1100aa至1200aa或1200aa至1300aa的连续段,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性。

在一些实施方案中,对于图2、16或17所描绘的氨基酸序列的Cpf1多肽的RuvCI结构域,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性。在一些实施方案中,对于图2、16或17中描绘的氨基酸序列的Cpf1多肽的RuvCII结构域,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性。在一些实施方案中,对于图2、16或17所描绘的氨基酸序列的Cpf1多肽的RuvCIII结构域,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性。

在一些实施方案中,所述Cpf1多肽相对于野生型Cpf1多肽(例如相对于包括图2、16或17描述的氨基酸序列的Cpf1多肽)显示降低的酶活性,并保持DNA结合活性。在一些实施方案中,对于图2、16或17中描绘的氨基酸序列,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性;并且在与图2、16或17中所示氨基酸序列的917位氨基酸对应的氨基酸残基处包含氨基酸取代(例如,D→A取代)。在一些实施方案中,对于图2、16或17中描绘的氨基酸序列,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性;并且在与图2、16或17中所示氨基酸序列的1006位氨基酸对应的氨基酸残基处包含氨基酸取代(例如,E→A取代)。在一些实施方案中,对于图2、16或17中描绘的氨基酸序列,Cpf1多肽包含的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少90%或100%的氨基酸序列同一性;并且在与图2、16或17中所示氨基酸序列的1255位氨基酸对应的氨基酸残基处包含氨基酸取代(例如,D→A取代)。

在一些实施方案中,Cpf1多肽是融合多肽,例如,其中Cpf1融合多肽包含:a)Cpf1多肽;以及b)异源融合配偶体。在一些实施方案中,异源融合配偶体融合到Cpf1多肽的N末端。在一些实施方案中,异源融合配偶体融合到Cpf1多肽的C末端。在一些实施方案中,异源融合配偶体融合到Cpf1多肽的N末端和C末端。在一些实施方案中,异源融合配偶体插入Cpf1多肽内部。

合适的异源融合配偶体包括NLS、表位标记、荧光多肽等。

连接的引导RNA和供体核酸

在一个方面,本发明提供包含CRISPR系统的复合物,该CRISPR系统包含RNA引导的内切核酸酶(例如Cas9或Cpf1多肽)、引导RNA和供体多核苷酸,其中该引导RNA和该供体多核苷酸是连接的。如本文所例举的,引导RNA和供体多核苷酸可以共价或非共价连接。在一个实施方案中,引导RNA与供体多核苷酸化学连接。在另一个实施方案中,引导RNA和供体多核苷酸被酶促连接。在一个实施方案中,引导RNA和供体多核苷酸彼此杂交。在另一个实施方案中,引导RNA和供体多核苷酸都与桥序列杂交。任何数目的这种杂交方案都是可能的。

脱氨酶

在一些实施方案中,所述复合物或组合物还包含脱氨酶(例如,腺嘌呤碱基编辑器)。如本文所用,术语“脱氨酶”或“脱氨酶结构域”是指催化从分子中除去胺基团或脱氨基的酶。在一些实施方案中,脱氨酶是胞苷脱氨酶,其催化胞苷或脱氧胞苷分别水解脱氨为尿苷或脱氧尿苷。在一些实施方案中,脱氨酶是胞嘧啶脱氨酶,催化胞嘧啶水解脱氨成尿嘧啶(例如在RNA中)或胸腺嘧啶(例如在DNA中)。

在一些实施方案中,所述脱氨酶为腺苷脱氨酶,其催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,所述脱氨酶或脱氨酶结构域是分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷的腺苷脱氨酶。在一些实施方案中,所述腺苷脱氨酶催化脱氧核糖核酸(DNA)中的腺嘌呤或腺苷的水解脱氨。本文提供的腺苷脱氨酶(例如工程化的腺苷脱氨酶、进化的(evolved)腺苷脱氨酶)可以来自任何生物体,例如细菌。在一些实施方案中,所述脱氨酶或脱氨酶结构域是来自生物体例如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然存在的脱氨酶的变体。

在一些实施方案中,所述脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,对于天然存在的脱氨酶,所述脱氨酶或脱氨酶结构域具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。在一些实施方案中,所述腺苷脱氨酶来自细菌,例如大肠杆菌(E.coli)、金黄色葡萄球菌(S.aureus)、伤寒杆菌(S.typhi)、腐败链霉菌(S.putrefaciens)、流感嗜血杆菌(H.influenzae)或新月柄杆菌(C.crescentus)。在一些实施方案中,所述腺苷脱氨酶是塔达(TadA)脱氨酶。在一些实施方案中,TadA脱氨酶是大肠杆菌TadA脱氨酶(ecTadA)。在一些实施方案中,TadA脱氨酶是截短的大肠杆菌TadA脱氨酶。例如,截短的ecTadA相对于全长ecTadA可能缺失一个或多个N末端氨基酸。在一些实施方案中,截短的ecTadA相对于全长ecTadA可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N末端氨基酸残基。在一些实施方案中,截短的ecTadA相对于全长ecTadA可以缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个C末端氨基酸残基。在一些实施方案中,ecTadA脱氨酶不包含N末端甲硫氨酸。在一些实施方案中,所述脱氨酶是APOBEC1或其变体。

所述脱氨酶可以与在此描述的任何其他CRISPR元件结合使用(即,作为组合物),或者所述脱氨酶可以与在此描述的任何其他CRISPR元件(例如,Cas9或Cpf1)融合(即,作为复合物)。在某些实施方案中,所述脱氨酶与Cas9、Cpf1或其变体融合。

其他组分

所述组合物可以进一步包含通常用于核酸或蛋白质递送制剂中的任何其他组分。例如,所述组合物可以进一步包含脂质、脂蛋白(例如胆固醇和衍生物)、磷脂、聚合物,或者脂质体或胶束递送载体的其他组分。所述组合物还可包含适于施用至细胞或宿主(例如哺乳动物或人)的溶剂或载体。

在一些实施方案中,所述组合物包含第二聚合物,所述第二聚合物包含聚环氧乙烷(PEG)。例如,所述组合物可以包含PEG-pAsp(DET)、PEG-pAsp、PEG-pAsp(DET)的衍生物、PEG-pAsp的衍生物或其组合。不希望受任何特定理论的束缚,据信这些聚乙二醇化的聚合物可以控制纳米颗粒的尺寸及其与血清蛋白和靶细胞的相互作用。聚环氧乙烷聚合物可以以任何方式和任何顺序与其他组分组合。

在一些实施方案中,所述组合物还包含一种或多种表面活性剂。表面活性剂可以是非离子表面活性剂和/或两性离子表面活性剂。示例性表面活性剂的列表包括但不限于:聚氧乙烯脱水山梨糖醇酯表面活性剂(通常称为吐温),尤其是聚山梨醇酯20和聚山梨醇酯80;以商品名DOWFAX出售的环氧乙烷(EO)、环氧丙烷(PO)和/或环氧丁烷(BO)的共聚物,例如线性EO/PO嵌段共聚物;辛苯昔醇,其可以具有数量变化的重复乙氧基(氧基-1,2-乙二基),其中辛苯昔醇-9(Triton X-100,或叔辛基苯氧基聚乙氧基乙醇)是特别令人感兴趣的;(辛基苯氧基)聚乙氧基乙醇(IGEPAL CA-6301NP-40);磷脂,例如磷脂酰胆碱(卵磷脂);衍生自月桂醇、鲸蜡醇、硬脂醇和油醇的聚氧乙烯脂肪醚(称为Brij表面活性剂),例如三甘醇一月桂醚(Brij 30);聚氧乙烯-9-月桂基醚,和脱水山梨糖醇酯(通常称为SPAN),例如脱水山梨糖醇三油酸酯(Span 85)和脱水山梨糖醇单月桂酸酯。在一些实施方案中,表面活性剂是抗凝血剂(例如肝素等)。在一些实施方案中,所述组合物还包含一种或多种药学上可接受的载体和/或赋形剂。

在一些情况下,组分(例如,核酸组分(例如,引导核酸等);蛋白质组分(例如,Casf9或Cpf1多肽、变体Casf9或Cpf1多肽);等)包括标记部分。如本文所用,术语“标记”、“可检测标记”或“标记部分”是指允许信号检测并且可根据测定的特定性质而广泛变化的任何部分。感兴趣的标记部分包括可直接检测的标记(直接标记)(例如荧光标记)和可间接检测的标记(间接标记)(例如结合对成员)。荧光标记可以是任何荧光标记(例如,荧光染料(例如,荧光素、德克萨斯红、罗丹明、ALEXAFLOR标记等)、荧光蛋白(例如,绿色荧光蛋白(GFP))、增强型GFP(EGFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、青色荧光蛋白(CFP)、Cherry、Tomato、Tangerine和其任何荧光衍生物)等等)。用于所述方法的合适的可检测(直接或间接)标记部分包括可通过光谱、光化学、生物化学、免疫化学、电学、光学、化学或其他方式检测的任何部分。例如,合适的间接标记包括生物素(结合对成员),其可被链霉抗生物素蛋白(其本身可被直接或间接标记)结合。标记还可以包括:放射性标记(直接标记)(例如,

任何给定的组分或组分的组合可以是未标记的,或者可以用标记部分可检测地标记。在一些实施方案中,当两种或更多种组分被标记时,它们可以用可彼此区分的标记部分标记。

包封和纳米颗粒

在所述组合物的一些实施方案中,所述聚合物与所述核酸和/或多肽组合,并且部分或完全地包封所述核酸和/或多肽。在一些制剂中,所述组合物可以提供包含所述聚合物和核酸和/或多肽的纳米颗粒。

在一些实施方案中,除了本文所述的聚合物和核酸或多肽之外,所述组合物还可包含核心纳米颗粒。可以使用任何合适的纳米颗粒,包括金属(例如,金)纳米颗粒或聚合物纳米颗粒。

本文所述的聚合物和核酸(例如,引导RNA、供体多核苷酸或两者)或多肽可直接或间接缀合至纳米颗粒表面。例如,本文所述的聚合物和核酸(例如,引导RNA、供体多核苷酸或两者)或多肽可直接缀合至纳米颗粒的表面或通过间插连接基间接缀合至纳米颗粒的表面。

任何类型的分子可用作连接基。例如,连接基可以是包括至少两个碳原子(例如,3、4、5、6、7、8、9、10或更多个碳原子)的脂族链,并且可以被一个或多个官能团取代,所述官能团包括酮、醚、酯、酰胺、醇、胺、脲、硫脲、亚砜、砜、磺酰胺和二硫化物官能团。在其中纳米颗粒包含金的实施方案中,连接基可以是任何含硫醇的分子。硫醇基团与金的反应产生共价的硫化物(-S-)键。连接基设计和合成是本领域熟知的。

在一些实施方案中,与纳米颗粒缀合的核酸是连接基核酸,其用于将一个或多个本文所述元件(例如,Cas9多肽和引导RNA、供体多核苷酸和Cpf1多肽)非共价结合至纳米颗粒-核酸缀合物。例如,连接基核酸可以具有与引导RNA或供体多核苷酸杂交的序列。

与纳米颗粒(例如,胶体金属(例如,金)纳米颗粒;包含生物相容性聚合物的纳米颗粒)缀合的核酸可以具有任何合适的长度。当核酸是引导RNA或供体多核苷酸时,其长度会适于此类分子,如本文所讨论的和本领域已知的。如果核酸是连接基核酸,则其可以具有对于连接基而言任何合适的长度,例如10个核苷酸(nt)至1000个nt的长度,例如约1个nt至约25个nt、约25个nt至约50个nt、约50个nt至约100个nt、约100个nt至约250个nt、约250个nt至约500个nt、或约500个nt至约1000个nt。在一些情况下,与纳米颗粒(例如,胶体金属(例如金)纳米颗粒;包含生物相容性聚合物的纳米颗粒)缀合的核酸可以具有大于1000个nt的长度。

当连接(例如,共价连接;非共价连接)至纳米颗粒的核酸包含与本公开的复合物中存在的引导RNA或供体多核苷酸的至少一部分杂交的核苷酸序列时,其具有与引导RNA或供体多核苷酸序列的互补物的区域具有足以促进杂交的序列同一性的区域。在一些实施方案中,与本公开的复合物中的纳米颗粒连接的核酸与存在于所述复合物中的引导RNA或供体多核苷酸的10至50个核苷酸(例如,10个核苷酸(nt)至15个nt、15个nt至20个nt、20个nt至25个nt、25个nt至30个nt、30个nt至40个nt或40个nt至50个nt)的互补物具有至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或100%的核苷酸序列同一性。

在一些实施方案中,连接(例如,共价连接;非共价连接)至纳米颗粒的核酸是供体多核苷酸,或具有与供体多核苷酸相同或基本上相同的核苷酸序列。在一些实施方案中,连接(例如,共价连接;非共价连接)至纳米颗粒的核酸包含与供体DNA模板互补的核苷酸序列。

使用方法

本文提供的聚合物可用于任何目的,但被认为特别可用于和用于各种目的的生物分子(例如,核酸和多肽)组合,并且在一些实施方案中,可用于包封用于各种目的的生物分子(例如,核酸和多肽)。在一方面,提供包封生物分子(例如多肽或核酸)的方法,所述方法通过将本文所述的本发明的聚合物与所述生物分子结合,由此所述聚合物部分或完全地包封所述生物分子。被所述聚合物部分或完全地包封的生物分子有时称为纳米颗粒。

本文还提供将核酸和/或多肽递送至细胞的方法,其中所述细胞可以是体外或体内的。所述方法包括向所述细胞或向含有所述细胞的个体施用如本文所述的包含所述聚合物和核酸和/或多肽的组合物。所述方法可用于任何类型的细胞或个体,但特别适用于哺乳动物细胞(例如,人类细胞)。在一些实施方案中,所述聚合物包含靶向剂,使得核酸和/或多肽主要地或完全地被递送至靶细胞或组织(例如,外周神经系统、中枢神经系统、个体的眼、肝、肌肉、肺、骨(例如,造血细胞)的细胞或组织,或肿瘤细胞或组织)。

当与包含CRISPR系统的一种或多种组分的组合物一起使用时,所述方法可以用于诱导编辑靶核酸或基因。在一些实施方案中,修饰靶核酸的方法包括同源定向修复(HDR)。在一些实施方案中,使用本公开的复合物进行HDR提供至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%或大于25%的HDR效率。在一些实施方案中,修饰靶核酸的方法包括非同源末端连接(NHEJ)。在一些实施方案中,使用本公开的复合物进行HDR提供至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%或大于25%的NHEJ效率。

以下实施例进一步说明本发明,但当然不应以任何方式解释为限制其范围。

实施例1

该实施例为本文所述的聚合物的合成提供了指导。该合成包括与丙烯酸酯的迈克尔加成。示例性方法如下。

路线1.

在玻璃小瓶中,将pAsp(DET)(5mg,0.22mol)悬浮于二甲基亚砜(“DMSO”;700μL)中。向该悬浮液中加入30μL三甲胺(“TEA”),搅拌所得悬浮液直至所有聚合物完全溶解。向反应混合物中加入丙烯酸酯1(1.15mg,5.5mol)并将反应混合物在室温下搅拌40小时。通过在乙腈中沉淀纯化粗产物并用乙腈洗涤三次,得到4mg聚合物5,其中(a+b)为55且(c+d)为25。

如路线1所示,与丙烯酸酯1的迈克尔加成产生基于胺的键(参见例如聚合物5)。因此,pAsp(DET)中的原始胺官能团保持完整。

可以使用类似的方法来制备另外的式1的聚合物(例如,聚合物1-4和6-12)。亲核取代可用于提供聚合物28和29。

此外,该方法可以应用于不同的起始聚合物,例如如实施例7中所示制备的聚合物,以提供其他式1的聚合物(例如,从聚合物30或32开始,在末端氮脱甲基化以提供伯胺或仲胺,该方法可以提供聚合物13-24)。

实施例2

该实施例为本文所述的聚合物的合成提供了指导。该合成包括与丙烯酸酯的迈克尔加成。示例性方法如下。

路线2.

在玻璃小瓶中,将pASP(DET)(5mg,0.22mol)悬浮于无水甲醇(300μL)中并且将30μL三乙胺(“TEA”)添加至悬浮液中。将所得溶液在室温下搅拌10min以完全溶解聚合物。用300μL的DCM稀释溶液。向反应混合物中加入在30μL的DCM中的丙烯酸酯2(1.05mg,5.5mol),并将反应混合物在室温下搅拌48小时。通过在大大过量的乙醚中沉淀来纯化粗产物,得到4.3mg聚合物8,其中(a+b)为55且(c+d)为25。

如路线2所示,与丙烯酸酯2的迈克尔加成产生基于胺的键(参见例如聚合物8)。因此,pAsp(DET)中的原始胺官能团保持完整。

实施例3

本实施例证明本文所述的聚合物将Cas9核糖核蛋白(“Cas9 RNP”)递送至细胞中的能力。使用绿色荧光蛋白(“GFP”)诱导型HEK293T(“GFP-HEK”)细胞评估Cas9 RNP递送水平。

将10pmole的Cas9 RNP与以下混合:(i)聚合物5,(ii)聚合物8和(iii)作为对照的pAsp(DET)。在非血清条件下用所得混合物处理GFP-HEK细胞。以0.375μg、0.75μg、1.25μg、2.5μg、5μg和10μg的剂量添加聚合物以筛选给出最高效率和最小毒性的最佳剂量。结果示于图3中。

图3显示了通过用三种混合物处理的GFP-HEK细胞的GFP(-)百分比测量的Cas9RNP递送水平。在0.375μg至2.5μg的聚合物剂量下,所有三种聚合物(即,聚合物5、聚合物8和pAsp(DET))显示相似水平的基因编辑。然而,在5μg和10μg的聚合物剂量下,聚合物8和pAsp(DET)显示出显著水平的细胞毒性(细胞活力小于50%)。然而,聚合物5在5μg的聚合物剂量下显示出最佳递送,如由GFP%的水平所证明的,且没有显著的毒性。

实施例4

本实施例证明本文所述的聚合物将Cre重组酶递送到细胞中的能力,该Cre重组酶可以改变loxP序列。

使用来自ai9小鼠的在loxP之间具有终止序列(参见图4中的灰色箭头)的原代成肌细胞,可以通过RFP表达来测量所递送的Cre重组酶的水平。Ai9报道等位基因含有侧翼为loxP序列的STOP盒,从而阻止RFP转录。Cre重组酶去除侧翼为loxP序列的STOP盒,并允许RFP转录。

将Cre重组酶(2μg)与(i)聚合物5和(ii)作为对照的pAsp(DET)混合以产生纳米颗粒。以1.25μg、2.5μg、5μg、10μg和20μg的剂量添加聚合物以筛选给出最高效率和最小毒性的最佳剂量。用所得纳米颗粒处理Ai9成肌细胞,处理后4天使用流式细胞术定量RFP+群体。结果示于图5中。

图5显示通过RFP+表达量测量的Cre重组酶递送至原代成肌细胞的水平。如图5中所示,在5μg、10μg和20μg的聚合物剂量下,聚合物5产生比对照(pAsp(DET))更高水平的RFP+表达,由此证明在Cre重组酶投递方面,聚合物5在更高剂量下比pAsp(DET)更有效。

实施例5

本实施例证明本文所述的聚合物在小鼠体内递送Cre重组酶的能力。

给Ai9小鼠注射(i)仅Cre重组酶和(ii)包封Cre重组酶的PEG化聚合物纳米颗粒(即,Polymer 5和PEG-聚合物的混合物)。将Cre重组酶(35μg)与聚合物5和PEG-PAsp(DET)混合物(100μg)一起递送。聚合物5和PEG-PAsp(DET)的共混合有助于控制聚合物纳米颗粒的尺寸。注射两周后从ai9小鼠收获腓肠肌肌肉。将收获的肌肉横截面成像以可视化由于DNA重组而产生的红色荧光蛋白。结果示于图5中。

图6表明Cre重组酶在小鼠肌肉中的递送被聚合物纳米颗粒增强。仅注射Cre重组酶导致RFP在有限的肌肉区域中表达,如由较少的可视化的红色荧光蛋白所证明的。然而,注射由聚合物纳米颗粒包封的Cre重组酶在腓肠肌中的大部分区域显示出RFP表达。

蛋白质递送的挑战是蛋白质如何广泛地被递送和影响大面积的组织。得自聚合物5和PEG-聚合物的混合物的纳米颗粒可以有效地递送Cre重组酶并帮助其在ai9小鼠中的分布。

实施例6

本实施例证明本文所述的聚合物将Cas9递送至表达GFP的神经元细胞的能力。

使用从神经元祖细胞分化来的表达GFP的神经元细胞来研究聚合物5是否能够将Cas9 RNP递送到神经元细胞中。使用本文描述的聚合物作为递送方法,用sgRNA和Cas9蛋白处理表达GFP的神经元细胞。处理7天后,从细胞中提取基因组DNA并进行GFP基因的PCR扩增。进行TIDE分析(荷兰癌症研究所,Desktop Genetics的TIDE软件)以测量由于Cas9进行的基因编辑而导致的indel突变的频率。结果示于图7中。

如图7所展示,聚合物5能够递送Cas9 RNP并在神经元细胞中诱导11%indel突变。

实施例7

该实施例为本文所述的聚合物的合成提供了指导。该合成包括开环聚合,随后进一步修饰以产生式4的聚合物。示例性方法如下。

路线3。

聚合物33的合成:(a)甲苯磺酰氯、TEA、DCM;(b)N,N,N-三甲基乙二胺、K

如路线3所示,化合物10的开环聚合导致增长以形成n=63的化合物11,其可以被进一步修饰以在用化合物9处理时形成聚合物33。

类似的方法可用于制备其他式4的聚合物(例如,聚合物30-32)。另外,聚合物侧链上的末端叔胺可通过常规技术脱甲基化以提供聚合物39-42。

实施例8

本实施例证明本文所述的聚合物将Cre重组酶递送到细胞中的能力,该Cre重组酶可以改变loxP序列。

使用交通灯报道子(TLR)-HEK 293T细胞,其是在HEK 293T中通过交通灯报道子的病毒转导产生的(参见图8),可以通过红色荧光蛋白(“RFP”)表达来测量递送的Cre重组酶的水平。HEK 293T中的交通灯报道子含有STOP盒,以及位于GFP序列侧翼的两个loxP序列,从而阻止RFP转录,并在不存在Cre的情况下依次表达GFP。Cre重组酶去除loxP序列,并允许RFP的转录。

将Cre重组酶(1μg)与实施例7中制备的聚合物33或作为对照的pAsp(DET)混合,以产生纳米颗粒。以1.25μg或2.5μg的剂量添加聚合物以筛选给出最高效率和最小毒性的最佳剂量。用所得纳米颗粒处理TLR-HEK293T细胞,并且在处理后3天使用流式细胞术对RFP+群体进行定量。结果示于图9中。

图9显示了通过RFP+表达的量而测量的向(TLR)-HEK 293T细胞递送Cre重组酶的水平。如图9中所示,相对于仅包含Cre的样品和包含对比物pAsp(DET)的样品,聚合物33在1.25μg和2.5μg的聚合物剂量下提供增强的递送。

实施例9

本实施例证明本文所述的聚合物将Cas9核糖核蛋白(“Cas9 RNP”)递送至细胞中的能力。使用绿色荧光蛋白(“GFP”)诱导型HEK 293T(“GFP-HEK”)细胞评估Cas9 RNP递送水平。

将15pmole的Cas9 RNP(sgRNA+Cas9蛋白)与实施例7中制备的聚合物33或作为对比的pAsp(DET)混合,以产生纳米颗粒。以2.5μg的剂量添加聚合物。在非血清条件下用所得混合物处理GFP-HEK细胞。结果示于图10中。

图10显示通过用两种混合物处理的GFP-HEK细胞的GFP%测量的Cas9 RNP递送水平。相对于对照,两种聚合物(即,聚合物33和pAsp(DET))在2.5μg的聚合物剂量下显示递送Cas9 RNP的能力。然而,在2.5μg的聚合物剂量下,聚合物33胜过pAsp(DET)。

实施例10

本实施例证明本文所述的聚合物递送核酸的能力。使用绿色荧光蛋白(“GFP”)评估eGFP mRNA递送至HEK 293T细胞的水平。

将eGFP mRNA(200ng)与实施例7中制备的聚合物33(600ng)混合,并温育5分钟。将得到的聚合物纳米颗粒在优化的培养基中处理HEK 293T细胞。24小时后,将细胞从板上分离并用流式细胞仪分析。Lipofectamine用作eGFP mRNA递送的阳性对照。结果示于图11中。

图11显示相对于对照,聚合物33提供eGFP mRNA向HEK 293T细胞的增加的递送。

实施例11

本实施例证明了孵育时间对本文所述的聚合物递送核酸的能力的影响。使用绿色荧光蛋白(“GFP”)评估eGFP mRNA递送至HEK 293T细胞的水平。

将eGFP mRNA(200ng)与如实施例7中制备的聚合物33(1.2μg)混合,并且孵育2min、5min、10min和30min的时间段。将得到的聚合物纳米颗粒在OptiMEM中处理HEK 293T细胞。24小时后,将细胞从板上分离并用流式细胞仪分析。Lipofectamine用作eGFP mRNA递送的阳性对照。结果示于图12中。

图12显示在孵育2分钟内形成的纳米颗粒和聚合物33在所有孵育时间提供eGFPmRNA的有效递送。

实施例12

该实施例证明本文所述的聚合物递送mRNA的能力。使用RFP+表达来评估红色荧光蛋白(RFP)mRNA递送至HEK 293T细胞的水平。

将RFP mRNA(200ng)与实施例7中制备的聚合物33或pAsp(DET)混合以制备纳米颗粒。以(i)600ng的剂量,或(ii)480ng与120ng 1.5kDa PEG-PAsp(DET)聚合物组合的剂量,添加聚合物33和pAsp(DET)。1.5kDa PEG-PAsp(DET)聚合物可以帮助在控制纳米颗粒的尺寸方面起作用。用所得纳米颗粒处理TLR-HEK293T细胞,并且在处理后24小时使用流式细胞术对RFP+群体进行定量。结果示于图13中。

图13显示相对于对比聚合物(PAsp(DET)),在不存在1.5kDa PEG-PAsp(DET)聚合物的情况下,聚合物33改善了mRNA向HEK 293T细胞的递送。另外,图13显示600ng的聚合物33提供了比480ng的聚合物33与120ng的1.5kDaPEG-PAsp(DET)聚合物的组合更有效的mRNA向HEK 293T细胞的递送。

实施例13

该实施例证明本文所述的聚合物递送mRNA的能力。使用RFP+表达来评估红色荧光蛋白(RFP)mRNA递送至HEK 293T细胞的水平。

将RFP mRNA(200ng)与实施例7中制备的聚合物33或pAsp(DET)混合以制备纳米颗粒。以(i)1μg的剂量或(ii)800ng与200ng 1.5kDa PEG-PAsp(DET)聚合物组合的剂量,添加聚合物33和pAsp(DET)。1.5kDa PEG-PAsp(DET)聚合物可以帮助在控制纳米颗粒的尺寸方面起作用。用所得纳米颗粒处理TLR-HEK293T细胞,并且在处理后24小时使用流式细胞术对RFP+群体进行定量。结果示于图14中。

图14显示相对于对比聚合物(PAsp(DET)),在存在和不存在1.5kDa PEG-PAsp(DET)聚合物的两种情况下,聚合物33以(i)1μg的剂量或(ii)800ng与200ng的1.5kDa PEG-PAsp(DET)聚合物组合的剂量向HEK 293T细胞提供相当的mRNA递送。

实施例14

本实施例使用不同缓冲液证明本文所述的聚合物将Cas9核糖核蛋白(“Cas9RNP”)递送至细胞中的能力。使用绿色荧光蛋白(“GFP”)诱导型HEK 293T(“GFP-HEK”)细胞评估Cas9 RNP递送水平。

将30pmole的Cas9 RNP(sgRNA+Cas9蛋白)与4μg的实施例7中制备的Polymer33或5μg的作为对比的pAsp(DET)混合,以制备纳米颗粒。在三种不同的缓冲条件下处理GFP-HEK细胞(200,000个细胞),即(i)(4-(2-羟基乙基)-1-哌嗪乙磺酸)(“HEPES”;20mM),(ii)Opti-MEM

图15显示了在三种不同缓冲液条件下,用两种混合物(即4μg聚合物33或5μg pAsp(DET))处理的GFP-HEK细胞的GFP(-)百分比测量的Cas9 RNP递送的水平。两种聚合物(即,聚合物33和pAsp(DET))对三种不同的缓冲液显示相同的趋势,HEPES优于Opti-MEM

实施例15

本实施例证明本文所述的聚合物稳定地包封核酸的能力。

将本公开的聚合物2、5和33(1ug/uL,10mM HEPES)与寡核苷酸(1ug/uL,10mMHEPES)以5:1的质量比移液管混合,然后在室温下放置10分钟以形成纳米颗粒。当不使用时,将它们储存在4C下。用10mM HEPES以大约1:20的比率稀释来自储备液的纳米颗粒,并在制备后0、3、5和7天(n=1)通过动态光散射(DLS)表征。强度平均粒度显示在图18中。

观察到150nm至350nm的纳米颗粒尺寸。聚合物在7天内显示出最小的尺寸变化,表明纳米颗粒是稳定的。pAsp[DET]作为对照运行(数据未显示),到第7天为止显示比其他测试的纳米颗粒稍微更大的尺寸变化。

实施例16

本实施例例示了根据本公开的聚合物的制备

将100mg(0.0074mmol)聚(β-1-天冬氨酸苄酯)(PBLA)溶解到3mL NMP中。向该反应混合物中加入1.5gm的1,4,7,10-四甲基-三亚乙基四胺,并将反应在RT下搅拌16小时。粗反应混合物在乙醚中沉淀,并通过离心(5000g,15分钟)收集粗产物。将粗产物溶解于3mL的1MHCl中,并用水透析以获得pH=6。将所得聚合物溶液冻干以获得为白色粉末的聚合物41。

实施例17

本实施例说明本文所述的聚合物向细胞递送mRNA的用途。

将编码绿色或红色荧光蛋白的mRNA与测试聚合物混合,并与如表2所示的几种不同的细胞类型之一组合。测定转染,作为荧光的函数。结果显示于表2中,其显示几乎所有聚合物在至少一种细胞类型中产生一定水平的转染。

表2

N/A=未测试

模拟试验=无mRNA的聚合物

使用编码绿色荧光蛋白的mRNA进行小鼠原代成肌细胞测试。使用编码红色荧光蛋白的mRNA检测所有其他细胞类型。

在此描述了本发明的优选实施方案,包括发明人已知的用于实施本发明的最佳模式。通过阅读前面的描述,那些优选实施方案的变化对于本领域普通技术人员来说是显而易见的。本发明人预期本领域技术人员适当地采用这些变化,并且本发明人意图使本发明以不同于本文具体描述的方式实施。因此,本发明包括适用法律允许的所附权利要求书中所述主题的所有修改和等同。此外,本发明涵盖上述要素在其所有可能变化中的任何组合,除非本文另有说明或与上下文明显矛盾。

在提供数值范围的情况下,应当理解,除非上下文另外明确指出,否则在该范围的上限和下限之间的每个中间值至下限单位的十分之一,以及在该规定范围内的任何其他规定的或中间值,都包括在本发明内。这些较小范围的上限和下限可独立地包括在较小范围内,并且也涵盖在本发明内,服从在所述范围内的任何具体排除的限制。其中所述范围包括一个或两个极限,排除那些所包括的极限中的任一者或两者的范围也包括在本发明中。

除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。尽管与本文所述的那些类似或等同的任何方法和材料也可用于本发明的实践或测试,但现在描述优选的方法和材料。本文提及的所有出版物通过引用并入本文以公开和描述与出版物所引用的方法和/或材料相关的方法和/或材料。

必须注意的是,如在此和所附权利要求中所使用的,英文单数形式“a”、“an”和“the”包括复数指示物,除非上下文另有明确规定。因此,例如,提及“复合物”包括多个这样的复合物,并且提及“Cas9多肽”包括提及本领域技术人员已知的一种或多种Cas9多肽及其等同物,等等。还应当注意,权利要求书可以被撰写为排除任何可选要素。同样地,该陈述旨在用作使用例如与权利要求要素的陈述有关的“唯一地”等排他术语或使用“否定的”限制的先行基础。

应理解,为清楚起见,在分开的实施方案的上下文中描述的本发明的某些特征也可在单个实施方案中组合提供。相反,为简洁起见而在单个实施方案的上下文中描述的本发明的各种特征也可单独提供或以任何合适的子组合提供。与本发明有关的实施方案的所有组合都由本发明具体包括,并且在此公开,就像每一个和每个组合都被单独和明确地公开一样。此外,本发明还特别包括各种实施方案及其要素的所有子组合,并且在本文中公开,就像每个这样的子组合在本文中单独和明确地公开一样。

提供本文讨论的出版物仅仅是为了它们在本申请的申请日之前的公开内容。本文不应被解释为承认本发明无权由于在先发明而早于这样的公开。此外,所提供的出版日期可能与实际出版日期不同,这可能需要独立确认。

序列表

<110> 基因编辑有限公司

<120> 阳离子聚合物和用于生物分子递送的用途

<130> 512879

<150> 62663985

<151> 2018-04-27

<150> 62750097

<151> 2018-10-24

<160> 20

<170> PatentIn version 3.5

<210> 1

<211> 1368

<212> PRT

<213> Streptococcus pyogenes

<220>

<221> MISC_FEATURE

<222> (1)..(1368)

<223> AKP81606.1

<400> 1

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Ser Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 2

<211> 2560

<212> PRT

<213> Francisella tularensis

<400> 2

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Ser Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Met Ser Ile

1250 1255 1260

Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg

1265 1270 1275

Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala

1280 1285 1290

Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys

1295 1300 1305

Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu

1310 1315 1320

Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn

1325 1330 1335

Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn

1340 1345 1350

Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln

1355 1360 1365

Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe

1370 1375 1380

Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu

1385 1390 1395

Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe

1400 1405 1410

Lys Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile

1415 1420 1425

Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His

1430 1435 1440

Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser

1445 1450 1455

Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu

1460 1465 1470

Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala

1475 1480 1485

Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu Thr

1490 1495 1500

Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe

1505 1510 1515

Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu

1520 1525 1530

Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys

1535 1540 1545

Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr

1550 1555 1560

Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys

1565 1570 1575

Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu

1580 1585 1590

Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val

1595 1600 1605

Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys

1610 1615 1620

Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe

1625 1630 1635

Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe

1640 1645 1650

Lys Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp

1655 1660 1665

Asp Tyr Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln

1670 1675 1680

Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln

1685 1690 1695

Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu

1700 1705 1710

Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His Arg Asp

1715 1720 1725

Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe Ala

1730 1735 1740

Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn

1745 1750 1755

Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp

1760 1765 1770

Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp

1775 1780 1785

Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe

1790 1795 1800

His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp

1805 1810 1815

Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala

1820 1825 1830

Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln

1835 1840 1845

Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser

1850 1855 1860

Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr

1865 1870 1875

Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met

1880 1885 1890

Asn Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu

1895 1900 1905

Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro

1910 1915 1920

Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser

1925 1930 1935

Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn

1940 1945 1950

His Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu

1955 1960 1965

Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp Phe

1970 1975 1980

Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly

1985 1990 1995

Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe

2000 2005 2010

Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn

2015 2020 2025

Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu

2030 2035 2040

Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys

2045 2050 2055

Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp

2060 2065 2070

Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala

2075 2080 2085

Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His

2090 2095 2100

Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys

2105 2110 2115

Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe

2120 2125 2130

Thr Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe

2135 2140 2145

Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu

2150 2155 2160

Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg

2165 2170 2175

Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly

2180 2185 2190

Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg

2195 2200 2205

Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys Asp

2210 2215 2220

Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys

2225 2230 2235

Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala

2240 2245 2250

Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu

2255 2260 2265

Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val

2270 2275 2280

Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu

2285 2290 2295

Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg

2300 2305 2310

Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly

2315 2320 2325

Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser

2330 2335 2340

Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys

2345 2350 2355

Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp

2360 2365 2370

Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe

2375 2380 2385

Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr

2390 2395 2400

Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp

2405 2410 2415

Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu

2420 2425 2430

Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly

2435 2440 2445

Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe

2450 2455 2460

Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg

2465 2470 2475

Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val

2480 2485 2490

Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys

2495 2500 2505

Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly

2510 2515 2520

Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu

2525 2530 2535

Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu

2540 2545 2550

Phe Val Gln Asn Arg Asn Asn

2555 2560

<210> 3

<211> 15

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic

<400> 3

Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile

1 5 10 15

<210> 4

<211> 8

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 4

Ile Val Ile Glu Met Ala Arg Glu

1 5

<210> 5

<211> 27

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 5

Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile

1 5 10 15

Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn

20 25

<210> 6

<211> 8

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 6

His His Ala His Asp Ala Tyr Leu

1 5

<210> 7

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 7

Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5 10

<210> 8

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 8

Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg

1 5 10

<210> 9

<211> 27

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 9

Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu

1 5 10 15

Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu

20 25

<210> 10

<211> 33

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 10

Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala

1 5 10 15

Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu

20 25 30

Ala

<210> 11

<211> 16

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 11

Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys

1 5 10 15

<210> 12

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 12

Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5 10

<210> 13

<211> 9

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 13

Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5

<210> 14

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 14

Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5 10

<210> 15

<211> 8

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 15

Arg Lys Lys Arg Arg Gln Arg Arg

1 5

<210> 16

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 16

Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala

1 5 10

<210> 17

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 17

Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg

1 5 10

<210> 18

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 18

Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg

1 5 10

<210> 19

<211> 1307

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<400> 19

Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr

1 5 10 15

Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln

20 25 30

Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys

35 40 45

Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln

50 55 60

Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile

65 70 75 80

Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile

85 90 95

Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly

100 105 110

Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile

115 120 125

Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys

130 135 140

Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg

145 150 155 160

Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg

165 170 175

Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg

180 185 190

Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe

195 200 205

Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn

210 215 220

Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val

225 230 235 240

Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp

245 250 255

Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu

260 265 270

Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn

275 280 285

Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro

290 295 300

Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu

305 310 315 320

Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr

325 330 335

Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu

340 345 350

Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His

355 360 365

Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr

370 375 380

Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys

385 390 395 400

Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu

405 410 415

Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser

420 425 430

Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala

435 440 445

Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys

450 455 460

Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu

465 470 475 480

Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe

485 490 495

Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser

500 505 510

Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val

515 520 525

Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp

530 535 540

Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn

545 550 555 560

Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys

565 570 575

Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys

580 585 590

Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys

595 600 605

Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr

610 615 620

Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys

625 630 635 640

Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln

645 650 655

Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala

660 665 670

Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr

675 680 685

Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr

690 695 700

Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His

705 710 715 720

Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu

725 730 735

Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys

740 745 750

Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu

755 760 765

Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln

770 775 780

Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His

785 790 795 800

Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr

805 810 815

Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His

820 825 830

Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn

835 840 845

Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe

850 855 860

Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln

865 870 875 880

Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu

885 890 895

Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg

900 905 910

Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu

915 920 925

Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu

930 935 940

Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val

945 950 955 960

Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile

965 970 975

His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu

980 985 990

Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu

995 1000 1005

Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu

1010 1015 1020

Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly

1025 1030 1035

Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala

1040 1045 1050

Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro

1055 1060 1065

Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe

1070 1075 1080

Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu

1085 1090 1095

Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe

1100 1105 1110

Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly

1115 1120 1125

Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn

1130 1135 1140

Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys

1145 1150 1155

Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr

1160 1165 1170

Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu

1175 1180 1185

Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu

1190 1195 1200

Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu

1205 1210 1215

Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly

1220 1225 1230

Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys

1235 1240 1245

Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp

1250 1255 1260

Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu

1265 1270 1275

Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile

1280 1285 1290

Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn

1295 1300 1305

<210> 20

<211> 1228

<212> PRT

<213> Artificial Sequence

<220>

<223> Synthetic Sequence

<220>

<221> misc_feature

<222> (162)..(162)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (188)..(188)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (457)..(457)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (532)..(532)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (559)..(559)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (593)..(593)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (604)..(604)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (627)..(627)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (702)..(702)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (723)..(723)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (747)..(747)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (950)..(950)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (958)..(958)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (987)..(987)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (1036)..(1036)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (1129)..(1129)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (1132)..(1132)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (1135)..(1135)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (1138)..(1138)

<223> Xaa can be any naturally occurring amino acid

<400> 20

Ala Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys

1 5 10 15

Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile

20 25 30

Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr

35 40 45

Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn

50 55 60

Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser

65 70 75 80

Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu

85 90 95

Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly

100 105 110

Ala Ala Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile

115 120 125

Leu Pro Glu Ala Ala Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser

130 135 140

Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu

145 150 155 160

Asn Xaa Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys

165 170 175

Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Xaa Asp Ile Phe Glu

180 185 190

Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu

195 200 205

Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu

210 215 220

Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala

225 230 235 240

Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu

245 250 255

Asn Glu Tyr Ile Asn Leu Tyr Asn Ala Lys Thr Lys Gln Ala Leu Pro

260 265 270

Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu

275 280 285

Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val

290 295 300

Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys

305 310 315 320

Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly

325 330 335

Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile

340 345 350

Phe Gly Glu Trp Asn Leu Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp

355 360 365

Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp

370 375 380

Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln

385 390 395 400

Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys

405 410 415

Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser

420 425 430

Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys

435 440 445

Lys Asn Asp Ala Val Val Ala Ile Xaa Lys Asp Leu Leu Asp Ser Val

450 455 460

Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu

465 470 475 480

Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp

485 490 495

Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val

500 505 510

Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn

515 520 525

Pro Gln Phe Xaa Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg

530 535 540

Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Xaa Asp

545 550 555 560

Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn

565 570 575

Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys

580 585 590

Xaa Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Xaa Ala Tyr Tyr Asn

595 600 605

Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys

610 615 620

Gly Asp Xaa Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe

625 630 635 640

Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe

645 650 655

Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg

660 665 670

Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys

675 680 685

Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Xaa Phe Gln

690 695 700

Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu

705 710 715 720

His Thr Xaa Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln

725 730 735

Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Xaa Arg Arg Ala Ser Leu

740 745 750

Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn

755 760 765

Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val

770 775 780

Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro

785 790 795 800

Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu

805 810 815

Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile

820 825 830

Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys

835 840 845

Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe

850 855 860

Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys

865 870 875 880

Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn

885 890 895

Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile

900 905 910

Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu

915 920 925

Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr

930 935 940

Gln Lys Phe Glu Lys Xaa Leu Ile Asp Lys Leu Asn Tyr Xaa Val Asp

945 950 955 960

Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln

965 970 975

Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Xaa Ser Thr Gln Asn Gly

980 985 990

Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser

995 1000 1005

Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala

1010 1015 1020

Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Xaa Tyr Val

1025 1030 1035

Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe

1040 1045 1050

Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser

1055 1060 1065

Tyr Gly Asn Arg Ile Arg Ile Phe Ala Ala Ala Lys Lys Asn Asn

1070 1075 1080

Val Phe Ala Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu

1085 1090 1095

Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg

1100 1105 1110

Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe

1115 1120 1125

Xaa Ala Leu Xaa Ser Leu Xaa Leu Gln Xaa Arg Asn Ser Ile Thr

1130 1135 1140

Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser

1145 1150 1155

Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn

1160 1165 1170

Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile

1175 1180 1185

Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu

1190 1195 1200

Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu

1205 1210 1215

Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys

1220 1225

相关技术
  • 阳离子聚合物和用于生物分子递送的用途
  • 用于递送生物分子的包含陶瓷粒子的粒状物质
技术分类

06120112302775