掌桥专利:专业的专利平台
掌桥专利
首页

FN3结构域-siRNA缀合物及其用途

文献发布时间:2024-04-18 20:02:18


FN3结构域-siRNA缀合物及其用途

相关申请

本申请要求2021年4月14日提交的美国临时专利申请第63/174,776号、2021年7月30日提交的美国临时专利申请第63/203,776号和2022年3月28日提交的美国临时申请第63/324,437号的优先权,所述申请特此以引用的方式整体并入。

技术领域

本发明实施方案涉及可缀合至III型纤连蛋白结构域(FN3)的siRNA分子以及制备和使用所述分子的方法。

背景技术

治疗性核酸包括例如小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸、核酶、质粒、免疫刺激性核酸、反义物、antagomir、antimir、微小RNA模拟物、超级微小RNA(supermir)、U1衔接子和适体。在siRNA或miRNA的情况下,这些核酸可通过称为RNA干扰(RNAi)的过程来下调特定蛋白质的细胞内水平。RNAi的治疗性应用极为广泛,因为可使用任何针对靶蛋白的核苷酸序列来合成siRNA和miRNA构建体。迄今为止,siRNA构建体已展示能够特异性下调体外和体内模型中的靶蛋白。另外,siRNA构建体当前正在临床研究中进行评估且已被批准用于各种疾病。

然而,siRNA构建体当前所面临的两个问题为,首先,其易于在血浆中发生核酸酶降解;并且其次,在作为游离siRNA或miRNA全身性施用时,其进入细胞内区室(其中它们可结合RISC(RNA诱导的沉默复合物))的能力有限。已使用某些递送系统(如由阳离子脂质与其他脂质组分(如胆固醇和PEG脂质)、碳水化合物(如GalNac三聚体)形成的脂质纳米颗粒)来促进寡核苷酸的细胞摄取。然而,这些系统尚未展示成功地将siRNA高效且有效地递送至除肝以外的组织中的其预期靶标中。

仍需要用于将siRNA递送至其预期细胞靶标中的组合物和方法。另外,需要可特异性结合至CD71的具有用于临床使用的优化性质的FN3结构域;以及使得能够经由受体介导的CD71内化进入细胞内的使用此类分子进行新颖治疗的方法。本发明实施方案满足了这些需要以及其他需要。

发明内容

在一些实施方案中,提供缀合至结合CD71蛋白的FN3结构域的siRNA。

在一些实施方案中,提供包含本文所提供的任何FN3结构域的氨基酸序列的FN3结构域。在一些实施方案中,FN3结构域结合至CD71。在一些实施方案中,FN3结构域特异性结合至CD71。

在一些实施方案中,组合物包含两个通过接头(如柔性接头)连接的FN3结构域。在一些实施方案中,两个FN3结构域结合至不同靶标。在一些实施方案中,第一FN3结构域结合至CD71。在一些实施方案中,第二FN3结构域结合至并非CD71的不同靶标。

在一些实施方案中,本文提供寡核苷酸,如dsRNA或siRNA分子。在一些实施方案中,寡核苷酸具有如本文所提供的序列,其具有或不具有本文所提供的修饰。在一些实施方案中,寡核苷酸提供于组合物(如药物组合物)中。在一些实施方案中,寡核苷酸缀合至多肽。

在一些实施方案中,提供包含一个或多个缀合至siRNA分子的FN3结构域的组合物。

在一些实施方案中,提供具有式(X1)

在一些实施方案中,提供具有式C-(X1)

在一些实施方案中,提供具有式(X1)

在一些实施方案中,提供具有式X4-L-(X1)

在一些实施方案中,提供具有式C-X4-L-(X1)

在一些实施方案中,提供具有式X4-L-(X1)

在一些实施方案中,提供具有式C-(X1)

在一些实施方案中,提供具有式(X1)

在一些实施方案中,提供包含本文所提供的一种或多种组合物的药物组合物。

在一些实施方案中,提供治疗有需要的受试者的庞贝病(Pompe Disease)(GSD2,酸性α-葡萄糖苷酶(GAA)缺乏)的方法,所述方法包括施用本文所提供的组合物。

在一些实施方案中,提供治疗有需要的受试者的糖原贮积病的方法,所述方法包括施用本文所提供的组合物。在一些实施方案中,糖原贮积病选自由以下组成的组:柯里氏病(Cori’s disease)或福布斯氏病(Forbes’disease)(GSD3,糖原去分支酶(AGL)缺乏)、麦卡德尔病(McArdledisease)(GSD5,肌糖原磷酸化酶(PYGM)缺乏)、II型糖尿病/糖尿病性肾病变、醛醇缩酶A缺乏GSD12、拉弗拉病(Lafora Disease)、低氧症、安德森病(Andersendisease)(GSD4,糖原去分支酶(GBE1)缺乏)、塔里氏病(Tarui’s Disease)(GSD7,肌磷酸果糖激酶(PFKM)缺乏)和成人葡聚糖体病。在一些实施方案中,糖原贮积病选自由以下组成的组:糖原合酶(GYS2)缺乏(GSD0)、葡萄糖-6-磷酸酶(G6PC/SLC37A4)缺乏(GSD1,冯吉尔克氏病(von Gierke’s disease))、赫尔斯氏病(Hers’disease)(GSD6,肝糖原磷酸化酶(PYGL)或肌磷酸甘油酸变位酶(PGAM2)缺乏)、磷酸化酶激酶(PHKA2/PHKB/PHKG2/PHKA1)缺乏(GSD9)、磷酸甘油酸变位酶(PGAM2)缺乏(GSD10)、肌乳酸脱氢酶(LDHA)缺乏(GSD11)、范可尼-比克尔综合征(Fanconi-Bickel syndrome)(GSD 11,葡萄糖转运蛋白(GLUT2)缺乏)、醛醇缩酶A缺乏(GSD 12)、β-烯醇酶(ENO3)缺乏(GSD13)和糖原生成蛋白-1(GYG1)缺乏(GSD15)。

在一些实施方案中,提供治疗有需要的受试者的癌症的方法,所述方法包括向所述受试者施用本文所提供的组合物。

在一些实施方案中,提供治疗有需要的受试者的神经学疾患和/或脑肿瘤的方法,所述方法包括向所述受试者施用本文所提供的组合物。在一些实施方案中,神经学疾患选自由以下组成的组:阿尔茨海默氏病(Alzheimer’s Disease)、肌萎缩性脊髓侧索硬化症、帕金森氏病(Parkinson’s Disease)、拉弗拉病、庞贝病、成人葡聚糖体病、中风、脊髓损伤、共济失调、贝尔氏麻痹(Bell’s Palsy)、脑动脉瘤、癫痫、抽搐、格林-巴利综合征(Guillain-Barre Syndrome)、多发性硬化、肌肉营养不良症、神经皮肤综合征、偏头痛、脑炎、败血症和重症肌无力。

在一些实施方案中,提供治疗有需要的受试者的自身免疫性疾病的方法,所述方法包括向所述受试者施用本文所提供的组合物。在一些实施方案中,自身免疫性疾病选自由以下组成的组:类风湿性关节炎、桥本氏自身免疫性甲状腺炎(Hashimoto’s autoimmunethyroiditis)、乳糜泻、1型糖尿病、白癜风、风湿热、恶性贫血/萎缩性胃炎、斑秃和免疫性血小板减少性紫癜。

在一些实施方案中,提供如本文所提供的组合物在制备用于治疗癌症的药物组合物或药剂中的用途。在一些实施方案中,癌症选自由以下组成的组:急性髓系白血病、骨髓增生异常综合征、胃癌、透明细胞肾细胞癌、乳房透明细胞癌、子宫内膜透明细胞癌、卵巢透明细胞癌、子宫透明细胞癌、肝细胞癌、胰腺癌、前列腺癌、软组织癌、尤文氏肉瘤(Ewingssarcoma)和非小细胞肺癌。

在一些实施方案中,提供降低细胞中的靶基因表达的方法,所述方法包括使所述细胞与如本文所提供的组合物接触。在一些实施方案中,细胞为肿瘤细胞、肝细胞、肌细胞、免疫细胞、树突状细胞、心脏细胞或CNS细胞。

在一些实施方案中,提供选择性地减少骨骼肌中的GYS1 mRNA和蛋白质的方法。在某些实施方案中,肝和/或肾中的GYS1 mRNA和蛋白质并未减少。

在一些实施方案中,提供编码本文所述的FN3结构域的经分离多核苷酸。

在一些实施方案中,提供包含本文所述的多核苷酸的载体。

在一些实施方案中,提供包含本文所述的载体的宿主细胞。

在一些实施方案中,提供产生FN3结构域的方法。在一些实施方案中,所述方法包括培养包含编码或表达FN3结构域的载体的宿主细胞。在一些实施方案中,所述方法进一步包括纯化FN3结构域。在一些实施方案中,FN3结构域结合CD71。

在一些实施方案中,提供药物组合物,所述药物组合物包含结合至CD71且连接至寡核苷酸分子的FN3结构域和药学上可接受的载体。在一些实施方案中,提供药盒,所述药盒包括一个或多个FN3结构域且含有或不含寡核苷酸分子。

附图说明

图1为展现siRNA筛选所评估和考虑的性质的流程图。

图2为RNA测序实验的图形,所述实验鉴别了在使用siRNA对HHH转染细胞之后的转录物组变化,其中箭头鉴别GYS1转录物的显著降低。

图3提供在蛋白质组阵列中使用超过6,000个受体的靶标结合测定的结果,其中数据证实CD71为FN3结构域的唯一结合靶标。

图4A显示与单独媒介物相比,在使用3种不同FN3结构域-siRNA缀合物时小鼠腓肠肌中的GYS1 mRNA的敲低。图4B显示与单独媒介物相比,在使用3种不同FN3结构域-siRNA缀合物时小鼠腓肠肌中的GYS1蛋白的敲低。

图5显示与针对不同靶标(AHA-1)的siRNA相比,在使用3种不同FN3结构域-siRNA缀合物时骨骼肌的GYS1敲低具有高度特异性。

图6为纯化缀合物(加标签蛋白质)的Histrap色谱图的实例。

图7为纯化缀合物(无标签蛋白质)的HIC色谱图的实例。

图8为纯化缀合物(加标签/无标签蛋白质)的离子-交换色谱图的实例。

图9为centyrin-寡核苷酸缀合物的分析型SEC的实例。

图10为缀合物的SDS PAGE凝胶的实例。

具体实施方式

除非上下文另外明确指明,否则如本说明书和随附权利要求书中所使用,单数形式“一个/种(a/an)”和“所述”包括多个指示物。因此,举例而言,提及“细胞”包括两个或更多个细胞的组合,等等。

“III型纤连蛋白(FN3)结构域”(FN3结构域)是指通常出现于包含纤连蛋白、腱生蛋白、细胞内细胞骨架蛋白、细胞因子受体和原核酶在内的蛋白质中的结构域(Bork和Doolittle,Proc Nat Acad Sci USA 89:8990-8994,1992;Meinke等人,J Bacteriol 175:1910-1918,1993;Watanabe等人,J Biol Chem 265:15659-15665,1990)。示例性FN3结构域为存在于人腱生蛋白C中的15种不同FN3结构域、存在于人纤连蛋白(FN)中的15不同FN3结构域和如阐述于例如美国专利第8,278,419号中的非天然合成FN3结构域。单独FN3结构域为根据结构域编号和蛋白质名称来提及,例如腱生蛋白第3FN3结构域(TN3)或纤连蛋白第10FN3结构域(FN10)。如通篇所使用,“centyrin”也指FN3结构域。另外,如本文所述的FN3结构域并非抗体,因为其不具有可变重(V

如本文中所使用,“自身免疫性疾病”是指其中个体的免疫反应为针对个体的自身组分且从而产生不期望和通常使人衰弱的疾患的疾病状况和状态。如本文中所使用,“自身免疫性疾病”意欲进一步包括自身免疫性疾患、综合征和诸如此类。自身免疫性疾病包括但不限于阿狄森氏病(Addison's disease)、过敏、过敏性鼻炎、关节粘连性脊椎炎、哮喘、动脉粥样硬化、耳朵自身免疫性疾病、眼睛自身免疫性疾病、自身免疫性萎缩性胃炎、自身免疫性肝炎、自身免疫性溶血性贫血、自身免疫性腮腺炎、自身免疫性葡萄膜炎、乳糜泻、原发性胆管肝硬化、良性淋巴细胞性血管炎、COPD、结肠炎、冠状动脉心脏病、克罗恩氏病(Crohn's disease)、糖尿病(I型)、抑郁症、糖尿病(包括1型和/或2型糖尿病)、附睪炎、肾小球性肾炎、古德帕斯丘综合征(Goodpasture's syndrome)、格雷夫斯氏病(Graves'disease)、格林-巴利综合征(Guillain-Barre syndrome)、桥本氏病(Hashimoto'sdisease)、溶血性贫血、特发性血小板减少性紫癜、炎症性肠病(IBD)、重组药物产品免疫反应(例如血友病中的因子VII)、幼年型特发性关节炎、全身性红斑狼疮、狼疮性肾炎、男性不育、混合结缔组织疾病、多发性硬化、重症肌无力、肿瘤、骨关节炎、疼痛、原发性粘液水肿、天疱疮、恶性贫血、多肌炎、银屑病、银屑病性关节炎、反应性关节炎、风湿热、类风湿性关节炎、类肉瘤病、硬皮症、舍格伦综合征(Sjogren'ssyndrome)、脊柱关节病、交感性眼炎、T细胞淋巴瘤、T细胞急性淋巴母细胞性白血病、睪丸血管中心T细胞淋巴瘤、甲状腺炎、移植排斥、溃疡性结肠炎、自身免疫性葡萄膜炎和血管炎。自身免疫性疾病包括但不限于受影响组织为一级靶标且在一些情况下为二级靶标的疾患。此类疾患包括但不限于AIDS、特应性变态反应、支气管哮喘、湿疹、麻风、精神分裂症、遗传抑郁症、组织和器官移植、慢性疲劳综合征、阿尔茨海默氏病、帕金森氏病、心肌梗塞、中风、自闭症、癫痫、阿图斯氏现象(Arthus'sphenomenon)、过敏反应和酒精与药物成瘾。

术语“捕获剂”是指结合至特定类型的细胞且使得所述细胞能够与其他细胞分离的物质。示例性捕获剂为磁珠、铁磁流体、囊封试剂、结合特定细胞类型的分子和诸如此类。

“样品”是指从受试者分离的类似流体、细胞或组织的集合体以及存在于受试者内的流体、细胞或组织。示例性样品为组织活检、细针抽吸液、手术切除的组织、器官培养物、细胞培养物和生物流体,如血液、血清和浆膜液、血浆、淋巴液、尿液、唾液、囊液、泪滴、粪便、痰液、分泌组织和器官的粘膜分泌物、阴道分泌物、腹水、胸膜、心包膜、腹膜、腹部和其他体腔的流体、通过支气管灌洗收集的流体、滑液、与受试者或生物来源接触的液体溶液(例如细胞和器官培养基,包含细胞或器官条件化培养基)和灌洗液以及诸如此类。

“取代(Substituting或substituted)”或“突变(mutating或mutated)”是指改变、缺失或插入多肽或多核苷酸序列中的一个或多个氨基酸或核苷酸以生成所述序列的变体。

“变体”是指与参考多肽或参考多核苷酸因一个或多个修饰(例如取代、插入或缺失)而不同的多肽或多核苷酸。

“特异性结合(Specifically binds或specific binding)”是指FN3结构域能够以约1×10

“文库”是指变体的集合。文库可由多肽或多核苷酸变体构成。

“稳定性”是指分子能够在生理条件下维持折叠状态,从而其保留至少一种其正常功能活性(例如结合至预定抗原,如CD71)。

“CD71”是指具有SEQ ID NO:2或5的氨基酸序列的人类CD71蛋白。在一些实施方案中,SEQ ID NO:2为全长人类CD71蛋白。在一些实施方案中,SEQ ID NO:5为人类CD71的细胞外结构域。

“Tencon”是指合成III型纤连蛋白(FN3)结构域,其具有展示于以下SEQ ID NO:1中:

LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYD LTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT

且阐述于美国专利公布第2010/0216708号中的共有序列。

“癌细胞”或“肿瘤细胞”是指在体内、离体和在组织培养物中的癌性、癌前期或转化细胞,其具有未必涉及摄取新遗传物质的自发性或经诱导的表型变化。尽管转化可源自感染转化病毒和纳入新基因组核酸或摄取外源核酸,但其也可自发性地或在暴露于致癌物后产生,由此使内源基因发生突变。转化/癌症可例示为(例如)体外、体内和离体的形态变化、细胞永生化、异常生长控制、病灶形成、增殖、恶性肿瘤、肿瘤特异性标记物含量、侵袭、肿瘤生长或适宜动物宿主(如裸小鼠)中的抑制和诸如此类(Freshney,Culture of AnimalCells:A Manual of Basic Technique(第3版,1994))。

“树突状细胞”是指在适应性免疫系统中发挥重要作用的一类抗原呈现细胞(APC)。树突状细胞的主要功能在于将抗原呈递至T淋巴细胞,并且分泌可进一步直接或间接调节免疫反应的细胞因子。树突状细胞能够诱导惰性或静止初始T淋巴细胞中的初级免疫反应。

“免疫细胞”是指分类为淋巴细胞(T细胞、B细胞和NK细胞)、嗜中性粒细胞或单核细胞/巨噬细胞的免疫系统细胞。这些细胞均为白细胞类型。

“载体”是指能够复制于生物系统内或可在此类系统之间移动的多核苷酸。载体多核苷酸通常含有用于促进这些多核苷酸在生物系统中的复制或维持的元件,如复制起点、聚腺苷酸化信号或选择标记物。此类生物系统的实例可包括细胞、病毒、动物、植物和利用能够复制载体的生物组分的重构生物系统。构成载体的多核苷酸可为DNA或RNA分子或这些分子的杂合体。

“表达载体”是指可利用于生物系统或重构生物系统中以诱导翻译由存在于表达载体中的多核苷酸序列编码的多肽的载体。

“多核苷酸”是指包括由糖-磷酸酯主链或其他等效共价化学结构共价连接的核苷酸链的合成分子。cDNA为多核苷酸的典型实例。

“多肽”或“蛋白质”是指包含至少两个通过肽键连接以形成多肽的氨基酸残基的分子。具有少于约50个氨基酸的小多肽可称为“肽”。

“化合价”是指在分子中存在指定数量的对抗原具有特异性的结合位点。因此,术语“单价”、“二价”、“四价”和“六价”是指在分子中分别存在一个、两个、四个和六个对抗原具有特异性的结合位点。

“受试者”包括任何人或非人动物。“非人动物”包括所有脊椎动物,例如哺乳动物和非哺乳动物,如非人灵长类动物、绵羊、狗、猫、马、牛、鸡、两栖动物、爬行动物等。除非予以指明,否则术语“患者”或“受试者”可互换使用。

“经分离”是指已与分子产生系统中的其他组分(如重组细胞)实质上分离和/或予以纯化的分子(如合成多核苷酸或多肽,如FN3结构域)的均质群体;以及已经历至少一个纯化或分离步骤的蛋白质。“经分离FN3结构域”是指实质上不含其他细胞物质和/或化学物质的FN3结构域,并且涵盖分离至较高纯度(如至80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的纯度)的FN3结构域。

在一些实施方案中,提供包含连接至寡核苷酸分子的多肽(如包含FN3结构域的多肽)的组合物。寡核苷酸分子可为例如siRNA分子。

因此,在一些实施方案中,siRNA为能够抑制靶基因的表达的双链RNAi(dsRNA)剂。dsRNA剂包含有义链(过客链)和反义链(引导链)。在一些实施方案中,dsRNA剂的每一链的长度可介于12-40个核苷酸之间。举例而言,每一链可长度为14-40个核苷酸、长度为17-37个核苷酸、长度为25-37个核苷酸、长度为27-30个核苷酸、长度为17-23个核苷酸、长度为17-21个核苷酸、长度为17-19个核苷酸、长度为19-25个核苷酸、长度为19-23个核苷酸、长度为19-21个核苷酸、长度为21-25个核苷酸或长度为21-23个核苷酸。

在一些实施方案中,有义链和反义链通常形成双链体dsRNA。dsRNA剂的双链体区的长度可为12-40个核苷酸对。举例而言,双链体区可长度为14-40个核苷酸对、长度为17-30个核苷酸对、长度为25-35个核苷酸对、长度为27-35个核苷酸对、长度为17-23个核苷酸对、长度为17-21个核苷酸对、长度为17-19个核苷酸对、长度为19-25个核苷酸对、长度为19-23个核苷酸对、长度为19-21个核苷酸对、长度为21-25个核苷酸对或长度为21-23个核苷酸对。在另一实例中,双链体区的长度选自15、16、17、18、19、20、21、22、23、24、25、26和27个核苷酸对。

在一些实施方案中,dsRNA在一条链的3'-端或5'-端或两端处包含dsRNA剂的一个或多个突出端区和/或封端基团。突出端可长度为1-10个核苷酸、长度为1-6个核苷酸、长度为(例如)2-6个核苷酸、长度为1-5个核苷酸、长度为2-5个核苷酸、长度为1-4个核苷酸、长度为2-4个核苷酸、长度为1-3个核苷酸、长度为2-3个核苷酸或长度为1-2个核苷酸。突出端可因为一条链长于另一条链或因为具有相同长度的两条链发生交错。突出端可与靶mRNA形成错配或者其可与所靶向基因序列互补或可为其他序列。第一链和第二链还可(例如)通过额外碱基接合以形成发夹,或通过其他非碱基接头接合。

在一些实施方案中,dsRNA剂的突出端区中的核苷酸可各自独立地为经修饰或未修饰的核苷酸,包括但不限于经2'-糖修饰,如2-F、2'-O甲基、2'-O-(2-甲氧基乙基)、2'-O-(2-甲氧基乙基)、2'-O-(2-甲氧基乙基)以及其任何组合。举例而言,TT(UU)可为任一链上的任一端的突出端序列。突出端可与靶mRNA形成错配或者其可与所靶向基因序列互补或者可为其他序列。

dsRNA剂的有义链、反义链或两条链处的5'-或3'-突出端可经磷酸化。在一些实施方案中,突出端区含有两个核苷酸且在两个核苷酸之间具有硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯,其中两个核苷酸可相同或不同。在一个实施方案中,突出端存在于有义链、反义链或两条链的3'-端处。在一个实施方案中,此3'-突出端存在于反义链中。在一个实施方案中,此3'-突出端存在于有义链中。

dsRNA剂可仅包含单一突出端,所述单一突出端可强化dsRNA的干扰活性且并不影响其整体稳定性。举例而言,单链突出端位于有义链的3'-末端处,或者替代地位于反义链的3'-末端处。dsRNA也可具有位于反义链的5'-端(或有义链的3'-端)处或反之亦然的钝端。通常,dsRNA的反义链在3'-端处具有核苷酸突出端,并且5'-端为钝端。不受限于理论,反义链的5'-端处的不对称钝端和反义链的3'-端突出端有利于引导链负载至RISC中。举例而言,单一突出端包含至少2、3、4、5、6、7、8、9或10个核苷酸的长度。

在一些实施方案中,dsRNA剂也可在dsRNA双链体的两端处具有两个钝端。

在一些实施方案中,dsRNA剂的有义链和反义链中的每一核苷酸可经修饰。每一核苷酸可经相同或不同修饰进行修饰,所述修饰可包括以下各项中的一者或多者:改变一个或两个非连接性磷酸氧和/或一个或多个连接性磷酸氧;改变核糖的组分,例如改变核糖上的2羟基;使用“去磷酸”接头完全代替磷酸酯部分;修饰或代替天然存在的碱基;和代替或修饰核糖-磷酸酯主链。

在一些实施方案中,3'或5'突出端中的所有或一些碱基可例如用本文所述的修饰进行修饰。修饰可包括例如使用在核糖的2'位处的本领域已知的修饰(例如使用脱氧核糖核苷酸、2'-脱氧-2'-氟(2'-F)或2'-O-甲基修饰来代替核碱基的核糖)和磷酸酯基团的修饰(例如硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯修饰)。突出端未必与靶序列同源。

在一些实施方案中,有义链和反义链的每一残基独立地经LNA、HNA、CeNA、2'-甲氧基乙基、2'-O-甲基、2'-O-烯丙基、2'-C-烯丙基、2'-脱氧或2'-氟修饰。链可含有多于一种修饰。在一个实施方案中,有义链和反义链的每一残基独立地经2'-O-甲基或2'-氟修饰。

在一些实施方案中,至少两种不同修饰通常存在于有义链和反义链上。那两种修饰可为2'-脱氧、2'-O-甲基或2'-氟修饰、非环状核苷酸或其他。

在一个实施方案中,有义链和反义链各自包含两种选自2'-氟、2'-O-甲基或2'-脱氧的不同核苷酸修饰。

dsRNA剂可进一步包含至少一种硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯、甲磺酰基氨基磷酸酯或甲基膦酸酯核苷酸间键联。硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯、甲磺酰基氨基磷酸酯或甲基膦酸酯核苷酸间键联修饰可出现于有义链或反义链的任何核苷酸上或出现于两条链的任何位置中。举例而言,核苷酸间键联修饰可出现于有义链和/或反义链上的每一核苷酸上;每一核苷酸间键联修饰可以交替模式出现于有义链或反义链上;或者有义链或反义链均以交替模式包含核苷酸间键联修饰。有义链上的核苷酸间键联修饰的交替模式可与反义链相同或不同,并且有义链上的核苷酸间键联修饰的交替模式可相对于反义链上的核苷酸间键联修饰的交替模式有所改变。

在一些实施方案中,dsRNA剂在突出端区中包含硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯、甲磺酰基氨基磷酸酯或甲基膦酸酯核苷酸间键联修饰。举例而言,突出端区包含两个核苷酸且在两个核苷酸之间具有硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯、甲磺酰基氨基磷酸酯或甲基膦酸酯核苷酸间键联。还可使核苷酸间键联修饰连接突出端核苷酸与双链体区内的末端配对核苷酸。举例而言,至少2、3、4个或所有突出端核苷酸可通过硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯、甲磺酰基氨基磷酸酯或甲基膦酸酯核苷酸间键联连接,并且任选地,可存在连接突出端核苷酸与紧邻突出端核苷酸的配对核苷酸的额外硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯、甲磺酰基氨基磷酸酯或甲基膦酸酯核苷酸间键联。举例而言,可在三个末端核苷酸之间存在至少两个硫代磷酸酯核苷酸间键联,其中三个核苷酸中的两者为突出端核苷酸,并且第三者为紧邻突出端核苷酸的配对核苷酸。在一些实施方案中,这三个末端核苷酸可位于反义链的3'-端处。

在一些实施方案中,dsRNA组合物通过经修饰的碱基或核苷类似物连接,如美国专利第7,427,672号中所阐述,所述专利以引用的方式并入本文中。在一些实施方案中,经修饰的碱基或核苷类似物在本文所述的式中称为接头或L。

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构:

其中碱基表示任选地具有取代基的芳香族杂环基团或芳香族烃环基团,R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中作为R

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中碱基为嘌呤-9-基、2-氧代嘧啶-1-基或具有选自以下α基团的取代基的嘌呤-9-基或2-氧代嘧啶-1-基:羟基、经用于核酸合成的保护基团保护的羟基、具有1至5个碳原子的烷氧基、巯基、经用于核酸合成的保护基团保护的巯基、具有1至5个碳原子的烷硫基、氨基、经用于核酸合成的保护基团保护的氨基、由具有1至5个碳原子的烷基取代的氨基、具有1至5个碳原子的烷基和卤素原子。

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中碱基为6-氨基嘌呤-9-基(即腺嘌呤基)、氨基经用于核酸合成的保护基团保护的6-氨基嘌呤-9-基、2,6-二氨基嘌呤-9-基、2-氨基-6-氯嘌呤-9-基、氨基经用于核酸合成的保护基团保护的2-氨基-6-氯嘌呤-9-基、2-氨基-6-氟嘌呤-9-基、氨基经用于核酸合成的保护基团保护的2-氨基-6-氟嘌呤-9-基、2-氨基-6-溴嘌呤-9-基、氨基经用于核酸合成的保护基团保护的2-氨基-6-溴嘌呤-9-基、2-氨基-6-羟基嘌呤-9-基(即鸟嘌呤基)、氨基经用于核酸合成的保护基团保护的2-氨基-6-羟基嘌呤-9-基、6-氨基-2-甲氧基嘌呤-9-基、6-氨基-2-氯嘌呤-9-基、6-氨基-2-氟嘌呤-9-基、2,6-二甲氧基嘌呤-9-基、2,6-二氯嘌呤-9-基、6-巯基嘌呤-9-基、2-氧代-4-氨基-1,2-二氢嘧啶-1-基(即胞嘧啶基)、氨基经用于核酸合成的保护基团保护的2-氧代-4-氨基-1,2-二氢嘧啶-1-基、2-氧代-4-氨基-5-氟-1,2-二氢嘧啶-1-基、氨基经用于核酸合成的保护基团保护的2-氧代-4-氨基-5-氟-1,2-二氢嘧啶-1-基、4-氨基-2-氧代-5-氯-1,2-二氢嘧啶-1-基、2-氧代-4-甲氧基-1,2-二氢嘧啶-1-基、2-氧代-4-巯基-1,2-二氢嘧啶-1-基、2-氧代-4-羟基-1,2-二氢嘧啶-1-基(即尿嘧啶基)、2-氧代-4-羟基-5-甲基-1,2-二氢嘧啶-1-基(即胸腺嘧啶基)、4-氨基-5-甲基-2-氧代-1,2-二氢嘧啶-1-基(即5-甲基胞嘧啶基)或氨基经用于核酸合成的保护基团保护的4-氨基-5-甲基-2-氧代-1,2-二氢嘧啶-1-基。

在一些实施方案中,经修饰的碱基或核苷类似物具有如化学式I及其盐中所展示的结构,其中m为0,并且n为1。

在一些实施方案中,经修饰的碱基或核苷类似物为含有具有如化学式II中所展示结构的核苷类似物的一种或多种类型的单元结构中的一者或两者或更多者的DNA寡核苷酸或RNA寡核苷酸类似物或其药理学上可接受的盐,条件为寡核苷酸类似物中的相应核苷之间的连接形式可含有一个或两个或更多个硫代磷酸酯键[--OP(O)(S

其中碱基表示任选地具有取代基的芳香族杂环基团或芳香族烃环基团,R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中作为R

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中碱基为嘌呤-9-基、2-氧代嘧啶-1-基或具有选自以下α基团的取代基的嘌呤-9-基或2-氧代嘧啶-1-基:羟基、经用于核酸合成的保护基团保护的羟基、具有1至5个碳原子的烷氧基、巯基、经用于核酸合成的保护基团保护的巯基、具有1至5个碳原子的烷硫基、氨基、经用于核酸合成的保护基团保护的氨基、由具有1至5个碳原子的烷基取代的氨基、具有1至5个碳原子的烷基和卤素原子。

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中碱基为6-氨基嘌呤-9-基(即腺嘌呤基)、氨基经用于核酸合成的保护基团保护的6-氨基嘌呤-9-基、2,6-二氨基嘌呤-9-基、2-氨基-6-氯嘌呤-9-基、氨基经用于核酸合成的保护基团保护的2-氨基-6-氯嘌呤-9-基、2-氨基-6-氟嘌呤-9-基、氨基经用于核酸合成的保护基团保护的2-氨基-6-氟嘌呤-9-基、2-氨基-6-溴嘌呤-9-基、氨基经用于核酸合成的保护基团保护的2-氨基-6-溴嘌呤-9-基、2-氨基-6-羟基嘌呤-9-基(即鸟嘌呤基)、氨基经用于核酸合成的保护基团保护的2-氨基-6-羟基嘌呤-9-基、6-氨基-2-甲氧基嘌呤-9-基、6-氨基-2-氯嘌呤-9-基、6-氨基-2-氟嘌呤-9-基、2,6-二甲氧基嘌呤-9-基、2,6-二氯嘌呤-9-基、6-巯基嘌呤-9-基、2-氧代-4-氨基-1,2-二氢嘧啶-1-基(即胞嘧啶基)、氨基经用于核酸合成的保护基团保护的2-氧代-4-氨基-1,2-二氢嘧啶-1-基、2-氧代-4-氨基-5-氟-1,2-二氢嘧啶-1-基、氨基经用于核酸合成的保护基团保护的2-氧代-4-氨基-5-氟-1,2-二氢嘧啶-1-基、4-氨基-2-氧代-5-氯-1,2-二氢嘧啶-1-基、2-氧代-4-甲氧基-1,2-二氢嘧啶-1-基、2-氧代-4-巯基-1,2-二氢嘧啶-1-基、2-氧代-4-羟基-1,2-二氢嘧啶-1-基(即尿嘧啶基)、2-氧代-4-羟基-5-甲基1.2-二氢嘧啶-1-基(即胸腺嘧啶基)、4-氨基-5-甲基-2-氧代-1,2-二氢嘧啶-1-基(即5-甲基胞嘧啶基)或氨基经用于核酸合成的保护基团保护的4-氨基-5-甲基-2-氧代-1,2-二氢嘧啶-1-基。

在一些实施方案中,寡核苷酸类似物或其药理学上可接受的盐具有如化学式II中所展示的结构,其中m为0,并且n为1。

在一些实施方案中,本文所述的组合物还包含聚合物(聚合物部分C)。在一些情况下,聚合物为由具支链或无支链单体的长链和/或二维或三维交联单体网络组成的天然或合成聚合物。在一些情况下,聚合物包含多糖、木质素、橡胶或聚环氧烷(例如聚乙二醇)。在一些情况下,至少一种聚合物包括但不限于α-、ω-二羟基聚乙二醇、基于内酯的生物可降解聚合物(例如聚丙烯酸)、聚交酯酸(PLA)、聚(乙醇酸)(PGA)、聚丙烯、聚苯乙烯、聚烯烃、聚酰胺、聚氰基丙烯酸酯、聚酰亚胺、聚对苯二甲酸乙二酯(polyethylenterephthalat,PET、PETG)、聚对苯二甲酸乙二酯(polyethylene terephthalate,PETE)、聚丁二醇(PTG)或聚氨基甲酸酯以及其混合物。如本文中所使用,混合物涉及在同一化合物内使用不同聚合物且提及嵌段共聚物。在一些情况下,嵌段共聚物为聚合物的至少一个区段为从另一聚合物的单体构建的聚合物。在一些情况下,聚合物包括聚环氧烷。在一些情况下,聚合物包括PEG。在一些情况下,聚合物包括聚乙烯酰亚胺(PEI)或羟乙基淀粉(HES)。

在一些情况下,C为PEG部分。在一些情况下,PEG部分缀合于寡核苷酸分子的5’末端处,而结合部分缀合于寡核苷酸分子的3’末端处。在一些情况下,PEG部分缀合于寡核苷酸分子的3’末端处,而结合部分缀合于寡核苷酸分子的5’末端处。在一些情况下,PEG部分结合至寡核苷酸分子的内部位点。在一些情况下,PEG部分、结合部分或其组合缀合至寡核苷酸分子的内部位点。在一些情况下,缀合为直接缀合。在一些情况下,缀合为经由天然连接。

在一些实施方案中,聚环氧烷(例如PEG)为多分散体或单分散体化合物。在一些情况下,多分散体材料包括具有不同分子量的材料(特征在于平均重量(重量平均值)大小和分散度)的分散分布。在一些情况下,单分散PEG包含一种大小的分子。在一些实施方案中,C为多分散或单分散聚环氧烷(例如PEG)且指示分子量代表聚环氧烷(例如PEG)分子的分子量平均值。

在一些实施方案中,聚环氧烷(例如PEG)的分子量为约200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1450、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3350、3500、3750、4000、4250、4500、4600、4750、5000、5500、6000、6500、7000、7500、8000、10,000、12,000、20,000、35,000、40,000、50,000、60,000或100,000Da。

在一些实施方案中,C为聚环氧烷(例如PEG)且具有约200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1450、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3350、3500、3750、4000、4250、4500、4600、4750、5000、5500、6000、6500、7000、7500、8000、10,000、12,000、20,000、35,000、40,000、50,000、60,000或100,000Da的分子量。在一些实施方案中,C为PEG且具有约200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1450、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3350、3500、3750、4000、4250、4500、4600、4750、5000、5500、6000、6500、7000、7500、8000、10,000、12,000、20,000、35,000、40,000、50,000、60,000或100,000Da的分子量。在一些情况下,C的分子量为约200Da。在一些情况下,C的分子量为约300Da。在一些情况下,C的分子量为约400Da。在一些情况下,C的分子量为约500Da。在一些情况下,C的分子量为约600Da。在一些情况下,C的分子量为约700Da。在一些情况下,C的分子量为约800Da。在一些情况下,C的分子量为约900Da。在一些情况下,C的分子量为约1000Da。在一些情况下,C的分子量为约1100Da。在一些情况下,C的分子量为约1200Da。在一些情况下,C的分子量为约1300Da。在一些情况下,C的分子量为约1400Da。在一些情况下,C的分子量为约1450Da。在一些情况下,C的分子量为约1500Da。在一些情况下,C的分子量为约1600Da。在一些情况下,C的分子量为约1700Da。在一些情况下,C的分子量为约1800Da。在一些情况下,C的分子量为约1900Da。在一些情况下,C的分子量为约2000Da。在一些情况下,C的分子量为约2100Da。在一些情况下,C的分子量为约2200Da。在一些情况下,C的分子量为约2300Da。在一些情况下,C的分子量为约2400Da。在一些情况下,C的分子量为约2500Da。在一些情况下,C的分子量为约2600Da。在一些情况下,C的分子量为约2700Da。在一些情况下,C的分子量为约2800Da。在一些情况下,C的分子量为约2900Da。在一些情况下,C的分子量为约3000Da。在一些情况下,C的分子量为约3250Da。在一些情况下,C的分子量为约3350Da。在一些情况下,C的分子量为约3500Da。在一些情况下,C的分子量为约3750Da。在一些情况下,C的分子量为约4000Da。在一些情况下,C的分子量为约4250Da。在一些情况下,C的分子量为约4500Da。在一些情况下,C的分子量为约4600Da。在一些情况下,C的分子量为约4750Da。在一些情况下,C的分子量为约5000Da。在一些情况下,C的分子量为约5500Da。在一些情况下,C的分子量为约6000Da。在一些情况下,C的分子量为约6500Da。在一些情况下,C的分子量为约7000Da。在一些情况下,C的分子量为约7500Da。在一些情况下,C的分子量为约8000Da。在一些情况下,C的分子量为约10,000Da。在一些情况下,C的分子量为约12,000Da。在一些情况下,C的分子量为约20,000Da。在一些情况下,C的分子量为约35,000Da。在一些情况下,C的分子量为约40,000Da。在一些情况下,C的分子量为约50,000Da。在一些情况下,C的分子量为约60,000Da。在一些情况下,C的分子量为约100,000Da。

在一些实施方案中,聚环氧烷(例如PEG)为离散PEG,其中离散PEG为包含多于一个重复环氧乙烷单元的聚合PEG。在一些情况下,离散PEG(dPEG)包含2至60、2至50或2至48个重复环氧乙烷单元。在一些情况下,dPEG包含约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、26、28、30、35、40、42、48、50个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约2个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约3个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约4个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约5个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约6个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约7个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约8个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约9个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约10个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约11个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约12个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约13个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约14个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约15个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约16个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约17个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约18个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约19个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约20个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约22个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约24个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约26个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约28个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约30个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约35个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约40个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约42个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约48个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约50个或更多个重复环氧乙烷单元。在一些情况下,dPEG由纯(例如约95%、98%、99%或99.5%)起始材料以逐步方式合成为单分子量化合物。在一些情况下,dPEG具有比分子量而非平均分子量。在一些情况下,本文所述的dPEG为来自Quanta Biodesign,LMD的dPEG。

在一些实施方案中,C为白蛋白结合结构域。在某些方面中,白蛋白结合结构域特异性结合至血清白蛋白(例如人血清白蛋白(HSA))以延长所述结构域或与白蛋白结合结构域缔合或连接的另一治疗剂的半衰期。在一些实施方案中,人血清白蛋白结合结构域包含连接至分子的N-末端的起始甲硫氨酸(Met)。在一些实施方案中,人血清白蛋白结合结构域包括连接至结构域的C-末端或N-末端的半胱氨酸(Cys)。添加N-末端Met和/或C-末端Cys可促进另一分子(其可为另一半衰期延长分子,如PEG、Fc区和诸如此类)的表达和/或缀合。

在一些实施方案中,白蛋白结合结构域包含表8中所提供的SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列。在一些实施方案中,白蛋白结合结构域(蛋白质)为经分离的。在一些实施方案中,白蛋白结合结构域包含与SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列至少或为85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列。在一些实施方案中,白蛋白结合结构域包含与SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列至少或为85%、86%、87%、88%、89%、90%、901%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列,条件为所述蛋白质具有对应于SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的位置10的取代。在一些实施方案中,取代为A10V。在一些实施方案中,取代为A10G、A10L、A10I、A10T或A10S。在一些实施方案中,位置10处的取代为任何天然存在的氨基酸。在一些实施方案中,经分离白蛋白结合结构域包含与SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列相比具有1、2、3、4、5、6、7、8、9、10、11、12、13或14个取代的氨基酸序列。在一些实施方案中,取代位于对应于SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的位置10的位置处。在一些实施方案中,所提供的FN3结构域在至少一个对应于SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的残基位置6、11、22、25、26、52、53、61、88或位置6、8、10、11、14、15、16、20、30、34、38、40、41、45、47、48、53、54、59、60、62、64、70、88、89、90、91或93的残基位置中或在C-末端处包含半胱氨酸残基。尽管位置以系列形式列示,但每一位置也可单独地进行选择。在一些实施方案中,半胱氨酸位于对应于位置6、53或88的位置处。在一些实施方案中,白蛋白结合结构域的其他实例可参见美国专利第10,925,932号,所述专利特此以引用的方式并入。

表8

在一些实施方案中,dsRNA剂在双链体内包含与靶标的错配或其组合。错配可出现于突出端区或双链体区中。碱基对可基于其促进解离或解链的倾向来排列(例如基于特定配对的缔合或解离的自由能,最简单方式为基于个别对来检验碱基对,但也可使用次近邻或类似分析)。就促进解离而言:A:U优于G:C;G:U优于G:C;并且I:C优于G:C(I=肌苷)。错配(例如非规范或不规范配对,如本文其他处所阐述)优于规范(A:T,A:U,G:C)配对;并且包含通用碱基的配对优于规范配对。

在一些实施方案中,dsRNA剂可在有义链或反义链的5'-端处包含含磷基团。5'-端含磷基团可为5'-端磷酸酯(5'-P)、5'-端硫代磷酸酯(5'-PS)、5'-端二硫代磷酸酯(5'-PS2)、5'-端乙烯基膦酸酯(5'-VP)、5'-端甲基膦酸酯(MePhos)、5’-端甲磺酰基氨基磷酸酯(5'MsPA)或5'-脱氧-5'-C-丙二酰基。在5'-端含磷基团为5'-端乙烯基膦酸酯(5'-VP)时,5'-VP可为5'-E-VP异构体,如反式-乙烯基磷酸酯或顺式-乙烯基磷酸酯或其混合物。这些修饰的代表性结构可参见(例如)美国专利第10,233,448号,所述专利特此以引用的方式整体并入。

在一些实施方案中,核苷酸类似物或合成核苷酸碱基包含在核糖部分的2'羟基处具有修饰的核酸。在一些情况下,修饰包括H、OR、R、卤基、SH、SR、NH2、NHR、NR2或CN,其中R为烷基部分。示例性烷基部分包括但不限于直链和支链的甲基、乙基、正丙基、异丙基、正丁基、异丁基、叔丁基、C

在一些情况下,2'羟基处的修饰为2'-O-甲基修饰或2'-O-甲氧基乙基(2'-O-MOE)修饰。腺苷分子的2'-O-甲基修饰和尿苷的2'O-甲氧基乙基修饰的示例性化学结构如下所示。

在一些情况下,2’羟基处的修饰为2’-O-氨基丙基修饰,其中包含丙基接头的延伸氨基使氨基结合至2’氧。在一些情况下,这种修饰通过从每一糖的氨基引入一个正电荷来中和寡核苷酸分子的磷酸酯源总负电荷且由此改进细胞摄取性质(因其两性离子性质)。2’-O-氨基丙基核苷亚磷酰胺的示例性化学结构如下所示。

在一些情况下,2’羟基处的修饰为锁定或桥接核糖修饰(例如锁核酸或LNA),其中结合于2’碳处的氧分子通过亚甲基连接至4’碳,由此形成2’-C,4’-C-氧基-亚甲基连接的双环核糖核苷酸单体。LNA的化学结构的示例性代表图如下所示。展示于左侧的代表图突出显示LNA单体的化学连接。展示于右侧的代表图突出显示LNA单体的呋喃糖环的锁定3'-内向(3E)构象。

在一些情况下,2’羟基处的修饰包括乙烯核酸(ENA),如例如2’-4’-乙烯桥接核酸,其将糖构象锁定为C3’-内向糖折叠构象。ENA为也包含LNA的经修饰核酸的桥接核酸类别的一部分。ENA和桥接核酸的示例性化学结构如下所示。

在一些实施方案中,2'羟基处的其他修饰包括2'-脱氧、2'-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2'-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)。

在一些实施方案中,核苷酸类似物包含经修饰的碱基,如但不限于5-丙炔基尿苷、5-丙炔基胞苷、6-甲基腺嘌呤、6-甲基鸟嘌呤、N,N,-二甲基腺嘌呤、2-丙基腺嘌呤、2丙基鸟嘌呤、2-氨基腺嘌呤、1-甲基肌苷、3-甲基尿苷、5-甲基胞苷、5-甲基尿苷和在5位处具有修饰的其他核苷酸、5-(2-氨基)丙基尿苷、5-卤基胞苷、5-卤基尿苷、4-乙酰基胞苷、1-甲基腺苷、2-甲基腺苷、3-甲基胞苷、6-甲基尿苷、2-甲基鸟苷、7-甲基鸟苷、2,2-二甲基鸟苷、5-甲基氨基乙基尿苷、5-甲基氧基尿苷、脱氮核苷酸(如7-脱氮-腺苷)、6-偶氮鸟苷、6-偶氮胞苷、6-偶氮胸苷、5-甲基-2-硫基尿苷、其他硫代碱基(例如2-硫代尿苷和4-硫代尿苷和2-硫代胞苷)、二氢尿苷、假尿苷、辫苷、古嘌苷、萘基和经取代的萘基、任何O-和N-烷基化嘌呤和嘧啶(如N6-甲基腺苷)、5-甲基羰基甲基尿苷、尿苷5-氧基乙酸、吡啶-4-酮、吡啶-2-酮、苯基和经修饰的苯基(如氨基苯酚或2,4,6-三甲氧基苯)、用作G形夹核苷酸的经修饰的胞嘧啶、8-取代的腺嘌呤和鸟嘌呤、5-取代的尿嘧啶和胸腺嘧啶、氮杂嘧啶、羧基羟基烷基核苷酸、羧基烷基氨基烷基核苷酸和烷基羰基烷基化核苷酸。经修饰的核苷酸还包括针对糖部分进行修饰的那些核苷酸以及具有非核糖基的糖或其类似物的核苷酸。举例而言,在一些情况下,糖部分为或基于甘露糖、阿拉伯糖、吡喃葡萄糖、吡喃半乳糖、4′-硫代核糖和其他糖、杂环或碳环。术语核苷酸还包括本领域已知作为通用碱基者。举例而言,通用碱基包括但不限于3-硝基吡咯、5-硝基吲哚或水粉蕈素(nebularine)。

在一些实施方案中,核苷酸类似物还包含吗啉核酸(morpholinos)、肽核酸(PNA)、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸、2’-氟N3-P5’-亚磷酰胺、1’,5’-脱水己糖醇核酸(HNA)或其组合。吗啉核酸或二氨基磷酸酯吗啉代寡聚物(PMO)包含合成分子,所述合成分子的结构通过偏离正常糖和磷酸酯结构来模拟天然核酸结构。在一些情况下,5元核糖环被含有四个碳、一个氮和一个氧的6元吗啉代环取代。在一些情况下,核糖单体由二氨基磷酸酯基团而非磷酸酯基团连接。在此类情况下,主链改变可去除所有使得吗啉核酸中性分子能够无需细胞递送剂(如由带电寡核苷酸使用的那些)的帮助即跨越细胞膜的正电荷和负电荷。

在一些实施方案中,肽核酸(PNA)不含糖环或磷酸酯键联且碱基通过寡甘氨酸样分子连接并适当隔开,由此消除了主链电荷。

在一些实施方案中,一个或多个修饰任选地出现于核苷酸间键联处。在一些情况下,经修饰的核苷酸间键联包括但不限于硫代磷酸酯、甲磺酰基氨基磷酸酯、二硫代磷酸酯、甲基膦酸酯、5'-亚烷基膦酸酯、5'-甲基膦酸酯、3'-亚烷基膦酸酯、三氟硼酸酯、3'-5'键联或2'-5'键联的硼烷磷酸酯和硒代磷酸酯、磷酸三酯、硫羰基烷基磷酸三酯、膦酸氢酯键联、烷基膦酸酯、烷基硫代膦酸酯、芳基硫代膦酸酯、硒代磷酸酯、二硒代磷酸酯、次膦酸酯、氨基磷酸酯、3'-烷基氨基磷酸酯、氨基烷基氨基磷酸酯、硫羰基氨基磷酸酯、哌嗪磷酸酯、苯胺硫代磷酸酯、苯胺磷酸酯、酮、砜、磺酰胺、碳酸酯、氨基甲酸酯、亚甲基亚甲基亚肼基、亚甲基二甲基亚甲基亚肼基、甲缩醛、硫代甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、硫代氨基甲酸酯、具有核乙酰基的键联、氨基乙基甘氨酸、甲硅烷基或硅氧烷键联、含有或不含杂原子且具有(例如)1至10个碳的饱和或不饱和的和/或经取代和/或含有杂原子的烷基或环烷基键联、具有吗啉代结构的键联、酰胺、碱基直接或间接连接至主链的氮杂氮的聚酰胺以及其组合。硫代磷酸酯反义寡核苷酸(PS ASO)为包含硫代磷酸酯键联的反义寡核苷酸。甲磺酰基氨基磷酸酯反义寡核苷酸(MsPA ASO)为包含甲磺酰基氨基磷酸酯键联的反义寡核苷酸。

在一些情况下,修饰为甲基或硫醇修饰,如甲基膦酸酯、甲磺酰基氨基磷酸酯或硫醇膦酸酯修饰。在一些情况下,经修饰的核苷酸包括但不限于2’-氟N3-P5’-亚磷酰胺。

在一些情况下,经修饰的核苷酸包括但不限于己糖醇核酸(或1’,5’-脱水己糖醇核酸(HNA))。

在一些实施方案中,一个或多个修饰进一步任选地在3’或5’末端处包括核糖部分、磷酸酯主链和核苷的修饰或核苷酸类似物的修饰。举例而言,3’末端任选地包含3’阳离子基团,或使用3’-3’键联倒转3’-末端处的核苷。在另一替代方式中,3’-末端任选地与氨基烷基(例如3’C5-氨基烷基dT)缀合。在另一替代方式中,3’-末端任选地与无碱基位点(例如与无嘌呤或无嘧啶位点)缀合。在一些情况下,5’-末端与氨基烷基(例如5’-O-烷基氨基取代基)缀合。在一些情况下,5’-末端与无碱基位点(例如与无嘌呤或无嘧啶位点)缀合。

在一些实施方案中,寡核苷酸分子包含本文所述的一个或多个合成核苷酸类似物。在一些情况下,寡核苷酸分子包含本文所述的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25个或更多个合成核苷酸类似物。在一些实施方案中,合成核苷酸类似物包含经2’-O-甲基、2’-O-甲氧基乙基(2’-O-MOE)、2’-O-氨基丙基、2'-脱氧、2'-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2'-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的LNA、ENA、PNA、HNA、吗啉核酸、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸、2'-氟N3-P5'-亚磷酰胺或其组合。在一些情况下,寡核苷酸分子包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25个或更多个选自以下的合成核苷酸类似物:经2'-O-甲基、2'-O-甲氧基乙基(2'-O-MOE)、2’-O-氨基丙基、2'-脱氧、2'-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2'-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的LNA、ENA、PNA、HNA、吗啉核酸、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸、2'-氟N3-P5’-亚磷酰胺或其组合。在一些情况下,寡核苷酸分子包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25个或更多个经2'-O-甲基修饰的核苷酸。在一些情况下,寡核苷酸分子包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25个或更多个经2'-O-甲氧基乙基(2'-O-MOE)修饰的核苷酸。在一些情况下,寡核苷酸分子包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25个或更多个硫醇膦酸酯核苷酸。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约5%至约100%的修饰、约10%至约100%的修饰、约20%至约100%的修饰、约30%至约100%的修饰、约40%至约100%的修饰、约50%至约100%的修饰、约60%至约100%的修饰、约70%至约100%的修饰、约80%至约100%的修饰和约90%至约100%的修饰。在一些情况下,寡核苷酸分子包含100%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约90%的修饰、约20%至约90%的修饰、约30%至约90%的修饰、约40%至约90%的修饰、约50%至约90%的修饰、约60%至约90%的修饰、约70%至约90%的修饰和约80%至约100%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约80%的修饰、约20%至约80%的修饰、约30%至约80%的修饰、约40%至约80%的修饰、约50%至约80%的修饰、约60%至约80%的修饰和约70%至约80%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约70%的修饰、约20%至约70%的修饰、约30%至约70%的修饰、约40%至约70%的修饰、约50%至约70%的修饰和约60%至约70%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约60%的修饰、约20%至约60%的修饰、约30%至约60%的修饰、约40%至约60%的修饰和约50%至约60%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约50%的修饰、约20%至约50%的修饰、约30%至约50%的修饰和约40%至约50%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约40%的修饰、约20%至约40%的修饰和约30%至约40%的修饰。

在一些情况下,寡核苷酸分子包含以下各项中的至少一者:约10%至约30%的修饰和约20%至约30%的修饰。

在一些情况下,寡核苷酸分子包含约10%至约20%的修饰。

在一些情况下,寡核苷酸分子包含约15%至约90%、约20%至约80%、约30%至约70%或约40%至约60%的修饰。

在其他情况下,寡核苷酸分子包含至少约15%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的修饰。

在一些实施方案中,寡核苷酸分子包含至少约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39或约40个修饰。

在一些情况下,寡核苷酸分子包含至少约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39或约40个经修饰的核苷酸。

在一些情况下,约5%至约100%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约5%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约10%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约15%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约20%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约25%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约30%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约35%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约40%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约45%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约50%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约55%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约60%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约65%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约70%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约75%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约80%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约85%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约90%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约95%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约96%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约97%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约98%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约99%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些情况下,约100%的寡核苷酸分子包含本文所述的合成核苷酸类似物。在一些实施方案中,合成核苷酸类似物包含经2’-O-甲基、2’-O-甲氧基乙基(2’-O-MOE)、2’-O-氨基丙基、2'-脱氧、2'-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2'-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的LNA、ENA、PNA、HNA、吗啉核酸、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸、2'-氟N3-P5'-亚磷酰胺或其组合。

在一些实施方案中,寡核苷酸分子包含约1至约25个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约1个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约2个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约3个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约4个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约5个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约6个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约7个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约8个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约9个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约10个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约11个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约12个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约13个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约14个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约15个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约16个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约17个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约18个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约19个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约20个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约21个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约22个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约23个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约24个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约25个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约26个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约27个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约28个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约29个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约30个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约31个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约32个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约33个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约34个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约35个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约36个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约37个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约38个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约39个修饰,其中修饰包含本文所述的合成核苷酸类似物。在一些实施方案中,寡核苷酸分子包含约40个修饰,其中修饰包含本文所述的合成核苷酸类似物。

在一些实施方案中,寡核苷酸分子为从两个单独多核苷酸组装,其中一个多核苷酸构成寡核苷酸分子的有义链且第二多核苷酸构成反义链。在其他实施方案中,有义链经由连接分子连接至反义链,所述连接分子在一些情况下为多核苷酸接头或非核苷酸接头。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中有义链中的嘧啶核苷酸包含2'-O-甲基嘧啶核苷酸且有义链中的嘌呤核苷酸包含2'-脱氧嘌呤核苷酸。在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中存在于有义链中的嘧啶核苷酸包含2'-脱氧-2'-氟嘧啶核苷酸且其中存在于有义链中的嘌呤核苷酸包含2'-脱氧嘌呤核苷酸。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中存在于所述反义链中的嘧啶核苷酸为2'-脱氧-2'-氟嘧啶核苷酸且存在于所述反义链中的嘌呤核苷酸为2'-O-甲基嘌呤核苷酸。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中存在于所述反义链中的嘧啶核苷酸为2'-脱氧-2'-氟嘧啶核苷酸且其中存在于所述反义链中的嘌呤核苷酸包含2'-脱氧-嘌呤核苷酸。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,并且有义链和反义链中的至少一者具有多个(例如2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个,等等)经2’-O-甲基或2’-脱氧-2’-氟修饰的核苷酸。在一些实施方案中,多个经2’-O-甲基或2’-脱氧-2’-氟修饰的核苷酸中的至少2、3、4、5、6或7者为连续核苷酸。在一些实施方案中,经2’-O-甲基或2’-脱氧-2’-氟修饰的连续核苷酸位于有义链和/或反义链的5’-端处。在一些实施方案中,经2’-O-甲基或2’-脱氧-2’-氟修饰的连续核苷酸位于有义链和/或反义链的3’-端处。在一些实施方案中,寡核苷酸分子的有义链在其5’端和/或3’端或两者处包含至少4个、至少5个、至少6个经2’-O-甲基修饰的连续核苷酸。任选地,在所述实施方案中,在多核苷酸5’端的至少4个、至少5个、至少6个经2’-O-甲基修饰的连续核苷酸的3’端处,或在多核苷酸3’端的至少4个、至少5个、至少6个经2’-O-甲基修饰的连续核苷酸的5’端处,寡核苷酸分子的有义链包含至少一个、至少两个、至少三个、至少四个经2’-脱氧-2’-氟修饰的核苷酸。另外,任选地,此类至少两个、至少三个、至少四个经2’-脱氧-2’-氟修饰的核苷酸为连续核苷酸。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,并且有义链和反义链中的至少一者具有位于有义链和/或反义链的5’-端处的经2’-O-甲基修饰的核苷酸。在一些实施方案中,有义链和反义链中的至少一者具有位于有义链和/或反义链的3’-端处的经2’-O-甲基修饰的核苷酸。在一些实施方案中,位于有义链和/或反义链的5’-端处的经2’-O-甲基修饰的核苷酸为嘌呤核苷酸。在一些实施方案中,位于有义链和/或反义链的5’-端处的经2’-O-甲基修饰的核苷酸为嘧啶核苷酸。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,并且有义链和反义链中的一者具有至少两个位于5’-端处的经2’-脱氧-2’-氟修饰的连续核苷酸,而另一链具有至少两个位于5’-端处的经2’-O-甲基修饰的连续核苷酸。在链具有至少两个位于5’-端处的经2’-脱氧-2’-氟修饰的连续核苷酸的一些实施方案中,所述链还在至少两个经2’-脱氧-2’-氟修饰的连续核苷酸的3’端处包含至少两个、至少三个经2’-O-甲基修饰的连续核苷酸。在一些实施方案中,有义链和反义链中的一者具有至少2个、至少3个、至少4个、至少5个、至少6个或至少7个连接至其5’-端和/或3’端上的经2’-脱氧-2’-氟修饰的核苷酸的经2’-O-甲基修饰的连续核苷酸。在一些实施方案中,有义链和反义链中的一者具有至少4个、至少5个交替具有经2’-O-甲基修饰的核苷酸和经2’-脱氧-2’-氟修饰的核苷酸的核苷酸。

在一些实施方案中,寡核苷酸分子(如siRNA)具有如式I所示的式:

N

N

其中由N表示的每一核苷酸独立地为A、U、C或G或经修饰的核苷酸碱基,诸如本文所提供的那些。有义链和反义链的N

举例而言,在一些实施方案中,有义链在N

在一些实施方案中,反义链包含连接至N

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中在有义链的5′-端、3′-端或5′端和3′端两者处,有义链包含末端帽部分。在其他实施方案中,末端帽部分为倒转脱氧无碱基部分。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中在反义链的3'端处,反义链包含甘油基修饰。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中有义链包含一个或多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或约一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于有义链的3'-端、5'-端或3'-端和5'-端两者处的末端帽分子;并且其中反义链包含约1至约10个或更多个(具体而言约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于反义链的3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。在其他实施方案中,有义链和/或反义链的一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)嘧啶核苷酸经2'-脱氧、2'-O-甲基和/或2'-脱氧-2'-氟核苷酸化学修饰,并且在相同或不同链中存在或不存在一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或位于3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中有义链包含约1至约25个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于有义链的3-端、5'-端或3'-端和5'-端两者处的末端帽分子;并且其中反义链包含约1至约25个或更多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于反义链的3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。在其他实施方案中,有义链和/或反义链的一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)嘧啶核苷酸经2'-脱氧、2'-O-甲基和/或2'-脱氧-2'-氟核苷酸化学修饰,并且在相同或不同链中存在或不存在约1至约25个或更多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或位于3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中反义链包含一个或多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或约一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸(在有义链和/或反义链的3'-端、5'-端或3'-端和5'-端两者处)和任选的末端帽分子(在有义链的3'-端、5'-端或3'-端和5'-端两者处)。在一些实施方案中,反义链包含约1至约10个或更多个(具体而言约1、2、3、4、5、6、7、8、9、10个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于反义链的3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。在其他实施方案中,有义链和/或反义链的一个或多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)嘧啶核苷酸经2'-脱氧、2'-O-甲基和/或2'-脱氧-2'-氟核苷酸化学修饰,并且在相同或不同链中存在或不存在一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或位于3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。

在一些实施方案中,寡核苷酸分子包含有义链和反义链,其中反义链包含约1至约25个或更多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于有义链的3'-端、5'-端或3'-端和5'-端两者处的末端帽分子;并且反义链包含约1至约25个或更多个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)经2'-脱氧、2'-O-甲基、2'-脱氧-2'-氟和/或一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)通用碱基修饰的核苷酸和任选地位于反义链的3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。在其他实施方案中,有义链和/或反义链的一个或多个(例如约1、2、3、4、5、6、7、8、9、10个或更多个)嘧啶核苷酸经2'-脱氧、2'-O-甲基和/或2'-脱氧-2'-氟核苷酸化学修饰,并且在相同或不同链中存在或不存在约1至约5个(例如约1、2、3、4、5个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联和/或位于3'-端、5'-端或3'-端和5'-端两者处的末端帽分子。

在一些实施方案中,本文所述的寡核苷酸分子为经化学修饰的短干扰核酸分子,其中在寡核苷酸分子的每一链中具有约1至约25个(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个)硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联。在一些实施方案中,寡核苷酸分子包含有义链和反义链,并且在反义链的3'端处反义链包含磷酸酯主链修饰。替代地和/或另外,寡核苷酸分子包含有义链和反义链,并且在反义链的5'端处有义链包含磷酸酯主链修饰。在一些情况下,磷酸酯主链修饰为硫代磷酸酯。在一些情况下,磷酸酯主链修饰为二硫代磷酸酯。在一些情况下,磷酸酯主链修饰为膦酸酯。在一些情况下,磷酸酯主链修饰为氨基磷酸酯。在一些情况下,磷酸酯主链修饰为甲磺酰基氨基磷酸酯。在一些实施方案中,有义链或反义链具有三个经由两个硫代磷酸酯主链偶联的连续核苷。在一些实施方案中,有义链或反义链具有三个经由两个二硫代磷酸酯主链偶联的连续核苷。在一些实施方案中,有义链或反义链具有三个经由两个膦酸酯主链偶联的连续核苷。在一些实施方案中,有义链或反义链具有三个经由两个氨基磷酸酯主链偶联的连续核苷。在一些实施方案中,有义链或反义链具有三个经由两个甲磺酰基氨基磷酸酯主链偶联的连续核苷。

在另一实施方案中,本文所述的寡核苷酸分子包含2'-5'核苷酸间键联。在一些情况下,2'-5'核苷酸间键联位于一条或两条序列链的3'-端、5'-端或3'-端和5'-端两者处。在其他情况下,2'-5'核苷酸间键联存在于一条或两条序列链内的各个其他位置处,举例而言,寡核苷酸分子的一条或两条链中的嘧啶核苷酸的约1、2、3、4、5、6、7、8、9、10个或更多个(包括每一个)核苷酸间键联包含2'-5'核苷酸间键联,或寡核苷酸分子的一条或两条链中的嘌呤核苷酸的约1、2、3、4、5、6、7、8、9、10个或更多个(包括每一个)核苷酸间键联包含2'-5'核苷酸间键联。

在一些实施方案中,寡核苷酸分子为介导细胞或重构体外系统中的RNAi活性的单链分子,其中寡核苷酸分子包含与靶核酸序列具有互补性的单链多核苷酸,并且其中存在于寡核苷酸分子中的一个或多个嘧啶核苷酸为2'-脱氧-2'-氟嘧啶核苷酸(举例而言,其中所有嘧啶核苷酸均为2'-脱氧-2'-氟嘧啶核苷酸或替代地多个嘧啶核苷酸为2'-脱氧-2'-氟嘧啶核苷酸),并且其中存在于寡核苷酸分子中的任何嘌呤核苷酸为2'-脱氧嘌呤核苷酸(举例而言,其中所有嘌呤核苷酸均为2'-脱氧嘌呤核苷酸或替代地多个嘌呤核苷酸为2'-脱氧嘌呤核苷酸),并且寡核苷酸分子包括任选地存在于反义序列的3'-端、5'-端或3'-端和5'-端两者处的末端帽修饰,在寡核苷酸分子的3'-端处寡核苷酸分子任选地还包含约1至约4个(例如约1、2、3或4个)末端2'-脱氧核苷酸,其中末端核苷酸还包含一个或多个(例如1、2、3或4个)硫代磷酸酯或甲磺酰基氨基磷酸酯核苷酸间键联,并且其中寡核苷酸分子任选地还包含末端磷酸酯基团(例如5'-末端磷酸酯基团)。

在一些情况下,与天然多核酸分子和核酸内切酶相比,本文所述的一种或多种合成核苷酸类似物抵抗核酸酶,如例如核糖核酸酶(如RNA酶H)、脱氧核糖核酸酶(如DNA酶)或核酸外切酶(例如5’-3’核酸外切酶和3’-5’核酸外切酶)。在一些情况下,包含2’-O-甲基、2’-O-甲氧基乙基(2’-O-MOE)、2’-O-氨基丙基、2'-脱氧、2’-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2’-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的LNA、ENA、PNA、HNA、吗啉核酸、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸、2’-氟N3-P5’-亚磷酰胺或其组合的合成核苷酸类似物对核酸酶有抗性,例如核糖核酸酶(如RNA酶H)、脱氧核糖核酸酶(例如DNA酶)或核酸外切酶(例如5’-3’核酸外切酶和3’-5’核酸外切酶)。在一些情况下,经2’-O-甲基修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2’O-甲氧基乙基(2’-O-MOE)修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2’-O-氨基丙基修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2'-脱氧修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2’-脱氧-2'-氟修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2'-O-氨基丙基(2'-O-AP)修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2'-O-二甲基氨基乙基(2'-O-DMAOE)修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2'-O-二甲基氨基丙基(2'-O-DMAP)修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2’-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经LNA修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经ENA修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经HNA修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,吗啉核酸为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经PNA修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经甲基膦酸酯核苷酸修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,经硫醇膦酸酯核苷酸修饰的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,包括2’-氟N3-P5’-亚磷酰胺的寡核苷酸分子为核酸酶抗性(例如RNA酶H、DNA酶、5’-3’核酸外切酶或3’-5’核酸外切酶抗性)。在一些情况下,本文所述的5’缀合物抑制5’-3’核酸外切性裂解。在一些情况下,本文所述的3’缀合物抑制3’-5’核酸外切性裂解。

在一些实施方案中,相对于等效天然多核酸分子,本文所述的一种或多种合成核苷酸类似物对其mRNA靶标具有增加的结合亲和力。相对于等效天然多核酸分子,一种或多种包含经2'-O-甲基、2'-O-甲氧基乙基(2'-O-MOE)、2'-O-氨基丙基、2'-脱氧、2'-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2'-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的LNA、ENA、PNA、HNA、吗啉核酸、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸或2'-氟N3-P5'-亚磷酰胺的合成核苷酸类似物对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-甲基修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-甲氧基乙基(2'-O-MOE)修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-氨基丙基修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-脱氧修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-脱氧-2'-氟修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-氨基丙基(2'-O-AP)修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-二甲基氨基乙基(2'-O-DMAOE)修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-二甲基氨基丙基(2'-O-DMAP)修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经LNA修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经ENA修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经PNA修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经HNA修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经吗啉核酸修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经甲基膦酸酯核苷酸修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,经硫醇膦酸酯核苷酸修饰的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,相对于等效天然多核酸分子,包含2’-氟N3-P5’-亚磷酰胺的寡核苷酸分子对其mRNA靶标具有增加的结合亲和力。在一些情况下,使用较低Kd、较高解链温度(Tm)或其组合来阐释增加的亲和力。

在一些实施方案中,本文所述的寡核苷酸分子为手性纯(或立体纯)的多核酸分子或包含单一对映异构体的多核酸分子。在一些情况下,寡核苷酸分子包含L-核苷酸。在一些情况下,寡核苷酸分子包含D-核苷酸。在一些情况下,寡核苷酸分子组合物包含小于30%、25%、20%、15%、10%、5%、4%、3%、2%、1%或更少的其镜像对映异构体。在一些情况下,寡核苷酸分子组合物包含小于30%、25%、20%、15%、10%、5%、4%、3%、2%、1%或更少的外消旋混合物。

在一些实施方案中,进一步修饰本文所述的寡核苷酸分子以包含适体缀合部分。在一些情况下,适体缀合部分为DNA适体缀合部分。在一些情况下,适体缀合部分为Alphamer,其包含识别特定细胞表面靶标的适体部分和呈递用于连接至循环抗体的特定表位的部分。

在其他实施方案中,修饰本文所述的寡核苷酸分子以增加其稳定性。在一些实施方案中,寡核苷酸分子为RNA(例如siRNA)。在一些情况下,通过一个或多个上述修饰来修饰寡核苷酸分子以增加其稳定性。在一些情况下,在2’羟基位置处(例如)通过以下各项来修饰寡核苷酸分子:2’-O-甲基、2’-O-甲氧基乙基(2’-O-MOE)、2’-O-氨基丙基、2'-脱氧、2’-脱氧-2'-氟、2'-O-氨基丙基(2'-O-AP)、2'-O-二甲基氨基乙基(2'-O-DMAOE)、2'-O-二甲基氨基丙基(2'-O-DMAP)、2’-O-二甲基氨基乙基氧基乙基(2'-O-DMAEOE)或2'-O-N-甲基乙酰胺基(2'-O-NMA)修饰或锁定或桥接核糖构象(例如LNA或ENA)。在一些情况下,通过2’-O-甲基和/或2’-O-甲氧基乙基核糖修饰寡核苷酸分子。在一些情况下,寡核苷酸分子还包含吗啉核酸、PNA、HNA、甲基膦酸酯核苷酸、硫醇膦酸酯核苷酸和/或2’-氟N3-P5’-亚磷酰胺以增加其稳定性。在一些情况下,寡核苷酸分子为手性纯(或立体纯)的寡核苷酸分子。在一些情况下,修饰手性纯(或立体纯)的寡核苷酸分子以增加其稳定性。熟练的技术人员应明了用以增加递送稳定性的适合RNA修饰。

在一些实施方案中,寡核苷酸分子包含2’修饰。在一些实施方案中,寡核苷酸分子在从有义链的5’端起的位置3、7、8、9、12和17处的核苷酸未经2’O-甲基修饰所修饰。在一些实施方案中,寡核苷酸分子在从有义链的5’端起的位置3、7、8、9、12和17处的核苷酸经2’氟修饰所修饰。在一些实施方案中,寡核苷酸分子在从反义链的5’端起的位置2和14处的核苷酸未经2’O-甲基修饰所修饰。在一些实施方案中,寡核苷酸分子在从反义链的5’端起的位置2和14处的核苷酸经2'氟修饰所修饰。在一些实施方案中,任一核苷酸还可包含5’-硫代磷酸酯基团修饰。在一些实施方案中,寡核苷酸分子在从有义链的5’端起的位置1和2处的核苷酸经5’-硫代磷酸酯基修饰所修饰。在一些实施方案中,寡核苷酸分子在从反义链的5’端起的位置1、2、20和21处的核苷酸经5’-硫代磷酸酯基修饰所修饰。在一些实施方案中,寡核苷酸分子的有义链或反义链的5’端还可包含乙烯基膦酸酯修饰。在一些实施方案中,寡核苷酸分子在从反义链的5’端起的位置1处的核苷酸经乙烯基膦酸酯修饰所修饰。

在一些情况下,寡核苷酸分子为包含自互补有义区和反义区的双链多核苷酸分子,其中反义区包含与靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列且有义区具有对应于靶核酸序列或其部分的核苷酸序列。在一些情况下,寡核苷酸分子从两个单独多核苷酸组装,其中一条链为有义链且另一链为反义链,其中反义链与有义链自互补(举例而言,每一链包括与另一链中的核苷酸序列互补的核苷酸序列;例如其中反义链和有义链形成双链体或双链结构,例如其中双链区具有约19、20、21、22、23个或更多个碱基对);反义链包含与靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列且有义链包含对应于靶核酸序列或其部分的核苷酸序列。或者,寡核苷酸分子从单一寡核苷酸组装,其中寡核苷酸分子的自互补有义区和反义区借助基于核酸或非基于核酸的接头连接。

在一些情况下,寡核苷酸分子为具有双链体、不对称双链体、发夹或不对称发夹二级结构且具有自互补有义区和反义区的多核苷酸,其中反义区包含与单独靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列且有义区具有对应于靶核酸序列或其部分的核苷酸序列。在其他情况下,寡核苷酸分子为具有两个或更多个环结构和包含自互补有义区和反义区的茎的环形单链多核苷酸,其中反义区包含与靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列且有义区具有对应于靶核酸序列或其部分的核苷酸序列,并且其中在体内或体外加工环形多核苷酸以生成能够介导RNAi的活性寡核苷酸分子。在其他情况下,寡核苷酸分子还包含具有与靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列的单链多核苷酸(举例而言,其中所述寡核苷酸分子无需在寡核苷酸分子内存在对应于靶核酸序列或其部分的核苷酸序列),其中单链多核苷酸还包含末端磷酸酯基团(例如5'-磷酸酯或5',3'-二磷酸酯)。

在一些情况下,不对称发夹为线性寡核苷酸分子,其包含反义区、包含核苷酸或非核苷酸的环部分和有义区,所述有义区包含少于反义区的核苷酸,只要有义区具有足够互补核苷酸与反义区进行碱基配对并与环形成双链体。举例而言,不对称发夹寡核苷酸分子包含长度足以介导细胞或体外系统中的RNAi(例如约19至约22个核苷酸)的反义区和包含约4至约8个核苷酸的环区以及具有约3至约18个与反义区互补的核苷酸的有义区。在一些情况下,不对称发夹寡核苷酸分子还包含经化学修饰的5'-末端磷酸酯基团。在其他情况下,不对称发夹寡核苷酸分子的环部分包含核苷酸、非核苷酸、接头分子或缀合物分子。

在一些实施方案中,不对称双链体为具有两条包含有义区和反义区的单独链的寡核苷酸分子,其中有义区包含少于反义区的核苷酸,只要有义区具有足够互补核苷酸与反义区进行碱基配对并形成双链体。举例而言,不对称双链体寡核苷酸分子包含长度足以介导细胞或体外系统中的RNAi(例如约19至约22个核苷酸)的反义区和具有约3至约19个与反义区互补的核苷酸的有义区。

在一些情况下,通用碱基是指与每一天然DNA/RNA碱基形成碱基对且其间几乎没有区别的核苷酸碱类似物。通用碱基的非限制性实例包括如本领域中已知的C-苯基、C-萘基和其他芳香族衍生物、肌苷、唑羧酰胺和硝基唑衍生物(如3-硝基吡咯、4-硝基吲哚、5-硝基吲哚和6-硝基吲哚)。

在一些实施方案中,dsRNA剂经5'磷酸化或在5'主末端包含磷酰基类似物。5'-磷酸酯修饰包括与RISC介导的基因沉默相容的那些。适合修饰包含:5'-单磷酸酯((HO

在一些实施方案中,寡核苷酸分子的序列与GYS1的靶序列至少40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或99.5%互补。在一些实施方案中,GYS1的靶序列为GYS1中的具有约10-50个碱基对长度、约15-50个碱基对长度、15-40个碱基对长度、15-30个碱基对长度或15-25个碱基对长度的核酸序列,其中靶序列的第一核苷酸始于编码区或5'或3'-未翻译区(UTR)中的GYS1 mRNA转录物中的任何核苷酸。举例而言,可选择靶序列的第一核苷酸,从而其始于GYS1 mRNA的编码或非编码区(5'或3'-未翻译区)中的核酸位置(nal,数量始于GYS1 mRNA的全长的5'-端,举例而言,5'-端第一核苷酸为nal.1)1、nal 2、nal 3、nal 4、nal 5、nal 6、nal 7、nal 8、nal 9、nal 10、nal 11、nal 12、nal 13、nal 14、nal 15、nal 15、nal 16、nal 17或任何其他核酸位置处。在一些实施方案中,可选择靶序列的第一核苷酸,从而其始于以下各项之内或之间的位置:nal 10-nal 15、nal 10-nal 20、nal 50-nal 60、nal 55-nal 65、nal 75-nal 85、nal 95-nal 105、nal135-nal 145、nal 155-nal 165、nal 225-nal 235、nal 265-nal 275、nal 275-nal 245、nal 245-nal 255、nal 285-nal 335、nal 335-nal 345、nal 385-nal 395、nal 515-nal525、nal 665-nal 675、nal 675-nal 685、nal 695-nal 705、nal 705-nal 715、nal 875-nal 885、nal 885-nal 895、nal 895-nal 905、nal 1035-nal 1045、nal 1045-nal 1055、nal 1125-nal 1135、nal 1135-nal 1145、nal 1145-nal 1155、nal 1155-nal 1165、nal1125-nal 1135、nal 1155-nal 1165、nal 1225-nal 1235、nal 1235-nal 1245、nal 1275-nal 1245、nal 1245-nal 1255、nal 1265-nal 1275、nal 1125-nal 1135、nal 1155-nal1165、nal 1225-nal 1235、nal 1235-nal 1245、nal 1275-nal 1245、nal 1245-nal 1255、nal 1265-nal 1275、nal 1275-nal 1285、nal 1335-nal 1345、nal 1345-nal 1355、nal1525-nal 1535、nal 1535-nal 1545、nal 1605-nal 1615、nal 1615-c.1625、nal 1625-nal 1635、nal 1635-1735、nal 1735-1835、nal 1835-1935、nal.1836-1856、nal 1935-2000、nal 2000-2100、nal 2100-2200、nal 2200-2260、nal 2260-2400、nal 2400-2500、nal 2500-2600、nal 2600-2700、nal 2700-2800、nal 2800-2500、nal 2500-2600、nal2600-2700、nal 2700-2800、nal 2800-2860等。在一些实施方案中,将GYS1 mRNA的序列提供为NCBI参考序列:NM_002103。

在一些实施方案中,dsRNA剂的反义链与靶RNA 100%互补以与其杂交并通过RNA干扰抑制其表达。靶RNA可为表达于细胞中的任何RNA。在另一实施方案中,细胞为肿瘤细胞、肝细胞、肌细胞、免疫细胞、树突状细胞、心脏细胞或中枢神经系统细胞。在另一实施方案中,dsRNA剂的反义链与靶RNA至少99%、至少98%、至少97%、至少96%、95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%互补。在一些实施方案中,靶RNA为GYS1 RNA。在一些实施方案中,siRNA分子为降低GYS1的表达的siRNA。在一些实施方案中,siRNA分子为如本文所述在本文所述的测定中在不超过200nm的浓度下降低GYS表达且并不使其他RNA的表达降低50%以上的siRNA。

siRNA可靶向任何模板基因或RNA(例如mRNA)转录物。

其他修饰和修饰模式可参见(例如)美国专利第10,233,448号,所述专利特此以引用的方式并入。

其他修饰和修饰模式可参见(例如)Anderson等人,Nucleic Acids Research2021,49(16),9026-9041,所述文献特此以引用的方式并入。

其他修饰和修饰模式可参见(例如)PCT公布第WO2021/030778号,所述公布特此以引用的方式并入。

其他修饰和修饰模式可参见(例如)PCT公布第WO2021/030763号,所述公布特此以引用的方式并入。

在一些实施方案中,siRNA连接至诸如FN3结构域的蛋白质。siRNA可连接至多个结合至相同靶蛋白或不同靶蛋白的FN3结构域。在一些实施方案中,接头连接至有义链,其可用于促进有义链与FN3结构域的键联。

在一些实施方案中,本文提供具有式(X1)

在一些实施方案中,本文提供具有式(X1)-(X2)-L-(X4)的组合物,其中X1为第一FN3结构域,X2为第二FN3结构域,L为接头,并且X4为核酸分子。在一些实施方案中,X4为siRNA分子。在一些实施方案中,X1为结合至一个CD71的FN3结构域。在一些实施方案中,X2为结合至一个CD71的FN3结构域。在一些实施方案中,X1和X2不结合至相同靶蛋白。在一些实施方案中,X1和X2结合至相同靶蛋白,但结合于所述蛋白质上的不同结合位点处。在一些实施方案中,X1和X2结合至相同靶蛋白。在一些实施方案中,X1和X2为结合至CD71的FN3结构域。在一些实施方案中,组合物不包括(例如不含)结合至ASGPR的化合物或蛋白质。

在一些实施方案中,本文提供具有式C-(X1)

在一些实施方案中,本文提供具有式(X1)

在一些实施方案中,本文提供具有式C-(X1)

在一些实施方案中,本文提供具有式(X1)

在一些实施方案中,提供具有式A

C为聚合物,例如PEG;

L

X

X

F

其中X

在一些实施方案中,C可为延长分子半衰期的分子。此类部分的实例阐述于本文中。在一些实施方案中,C也可为内转运体(Endoporter)、INF-7、TAT、聚精氨酸、聚赖氨酸或两亲性肽。这些部分可用于代替本文所提供的其他半衰期延长部分或与其一起使用。在一些实施方案中,C可为将复合物递送至细胞、胞内体或ER中的分子;所述分子选自表9中所列的那些肽:

在一些实施方案中,提供具有式A

在一些实施方案中,提供具有式A

在一些实施方案中,有义链为如本文所提供的有义链。

在一些实施方案中,反义链为如本文所提供的反义链。

在一些实施方案中,有义链和反义链形成靶向GYS1的双链siRNA分子。在一些实施方案中,双链寡核苷酸的长度为约21-23个核苷酸碱基对。在某些实施方案中,C为任选的。

在一些实施方案中,提供具有式A

F

L

C为聚合物,如PEG;

X

X

在一些实施方案中,提供具有式A

在一些实施方案中,提供具有式A

在一些实施方案中,C为由具支链或无支链单体的长链和/或二维或三维交联单体网络组成的天然或合成聚合物。在一些情况下,聚合物包含多糖、木质素、橡胶或聚环氧烷(其可为例如聚乙二醇)。在一些情况下,至少一种聚合物包括但不限于α-、ω-二羟基聚乙二醇、基于内酯的生物可降解聚合物(例如聚丙烯酸)、聚交酯酸(PLA)、聚(羟乙酸)(PGA)、聚丙烯、聚苯乙烯、聚烯烃、聚酰胺、聚氰基丙烯酸酯、聚酰亚胺、聚对苯二甲酸乙二酯(polyethylenterephthalat,PET、PETG)、聚对苯二甲酸乙二酯(polyethylene-B-Bterephthalate,PETE)、聚丁二醇(PTG)或聚氨基甲酸酯以及其混合物。如本文中所使用,混合物涉及在同一化合物内使用不同聚合物且提及嵌段共聚物。在一些情况下,嵌段共聚物为聚合物的至少一个区段从另一聚合物的单体构建的聚合物。在一些情况下,聚合物包括聚环氧烷。在一些情况下,聚合物包括PEG。在一些情况下,聚合物包括聚乙烯酰亚胺(PEI)或羟乙基淀粉(HES)。

在一些实施方案中,聚环氧烷(例如PEG)为多分散体或单分散体化合物。在一些情况下,多分散体材料包括具有不同分子量的材料(特征在于平均重量(重量平均值)大小和分散度)的分散分布。在一些情况下,单分散PEG包含一种大小的分子。在一些实施方案中,C为多分散或单分散聚环氧烷(例如PEG)且指示分子量代表聚环氧烷(例如PEG)分子的分子量平均值。

在一些实施方案中,聚环氧烷(例如PEG)的分子量为约200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1450、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3350、3500、3750、4000、4250、4500、4600、4750、5000、5500、6000、6500、7000、7500、8000、10,000、12,000、20,000、35,000、40,000、50,000、60,000或100,000Da。

在一些实施方案中,C为聚环氧烷(例如PEG)且具有约200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1450、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3350、3500、3750、4000、4250、4500、4600、4750、5000、5500、6000、6500、7000、7500、8000、10,000、12,000、20,000、35,000、40,000、50,000、60,000或100,000Da的分子量。在一些实施方案中,C为PEG且具有约200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1450、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3350、3500、3750、4000、4250、4500、4600、4750、5000、5500、6000、6500、7000、7500、8000、10,000、12,000、20,000、35,000、40,000、50,000、60,000或100,000Da的分子量。在一些情况下,C的分子量为约200Da。在一些情况下,C的分子量为约300Da。在一些情况下,C的分子量为约400Da。在一些情况下,C的分子量为约500Da。在一些情况下,C的分子量为约600Da。在一些情况下,C的分子量为约700Da。在一些情况下,C的分子量为约800Da。在一些情况下,C的分子量为约900Da。在一些情况下,C的分子量为约1000Da。在一些情况下,C的分子量为约1100Da。在一些情况下,C的分子量为约1200Da。在一些情况下,C的分子量为约1300Da。在一些情况下,C的分子量为约1400Da。在一些情况下,C的分子量为约1450Da。在一些情况下,C的分子量为约1500Da。在一些情况下,C的分子量为约1600Da。在一些情况下,C的分子量为约1700Da。在一些情况下,C的分子量为约1800Da。在一些情况下,C的分子量为约1900Da。在一些情况下,C的分子量为约2000Da。在一些情况下,C的分子量为约2100Da。在一些情况下,C的分子量为约2200Da。在一些情况下,C的分子量为约2300Da。在一些情况下,C的分子量为约2400Da。在一些情况下,C的分子量为约2500Da。在一些情况下,C的分子量为约2600Da。在一些情况下,C的分子量为约2700Da。在一些情况下,C的分子量为约2800Da。在一些情况下,C的分子量为约2900Da。在一些情况下,C的分子量为约3000Da。在一些情况下,C的分子量为约3250Da。在一些情况下,C的分子量为约3350Da。在一些情况下,C的分子量为约3500Da。在一些情况下,C的分子量为约3750Da。在一些情况下,C的分子量为约4000Da。在一些情况下,C的分子量为约4250Da。在一些情况下,C的分子量为约4500Da。在一些情况下,C的分子量为约4600Da。在一些情况下,C的分子量为约4750Da。在一些情况下,C的分子量为约5000Da。在一些情况下,C的分子量为约5500Da。在一些情况下,C的分子量为约6000Da。在一些情况下,C的分子量为约6500Da。在一些情况下,C的分子量为约7000Da。在一些情况下,C的分子量为约7500Da。在一些情况下,C的分子量为约8000Da。在一些情况下,C的分子量为约10,000Da。在一些情况下,C的分子量为约12,000Da。在一些情况下,C的分子量为约20,000Da。在一些情况下,C的分子量为约35,000Da。在一些情况下,C的分子量为约40,000Da。在一些情况下,C的分子量为约50,000Da。在一些情况下,C的分子量为约60,000Da。在一些情况下,C的分子量为约100,000Da。

在一些实施方案中,聚环氧烷(例如PEG)为离散PEG,其中离散PEG为包含多于一个重复环氧乙烷单元的聚合PEG。在一些情况下,离散PEG(dPEG)包含2至60、2至50或2至48个重复环氧乙烷单元。在一些情况下,dPEG包含约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、26、28、30、35、40、42、48、50个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约2个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约3个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约4个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约5个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约6个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约7个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约8个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约9个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约10个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约11个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约12个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约13个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约14个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约15个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约16个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约17个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约18个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约19个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约20个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约22个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约24个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约26个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约28个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约30个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约35个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约40个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约42个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约48个或更多个重复环氧乙烷单元。在一些情况下,dPEG包含约50个或更多个重复环氧乙烷单元。在一些情况下,dPEG从纯(例如约95%、98%、99%或99.5%)起始材料以逐步方式合成为单分子量化合物。在一些情况下,dPEG具有比分子量而非平均分子量。在一些情况下,本文所述的dPEG来自Quanta Biodesign,LMD的dPEG。

在一些实施方案中,L

其中X

在一些实施方案中,n=0-20。在一些实施方案中,R和R1独立地为甲基。在一些实施方案中,R和R1独立地存在或两者均不存在。在一些实施方案中,X和Y独立地为S。在一些实施方案中,X和Y独立地存在或不存在。在一些实施方案中,肽为酶促可裂解肽,如但不限于Val-Cit、Val-Ala等。

在一些实施方案中,L

在一些实施方案中,复合物中的L

其中X

在一些实施方案中,n=0-20。在一些实施方案中,R和R1独立地为甲基。在一些实施方案中,R和R1独立地存在或两者均不存在。在一些实施方案中,X和Y独立地为S。在一些实施方案中,X和Y独立地存在或不存在。在一些实施方案中,肽为酶促可裂解肽,如但不限于Val-Cit、Val-Ala等。

在一些实施方案中,接头通过F1上存在的半胱氨酸残基共价连接至F1,并且可如下所示:

在一些实施方案中,A1-B1具有下式:

其中C为如本文所提供的聚合物,如PEG、内转运体、INF-7、TAT、聚精氨酸、聚赖氨酸、两亲性肽或表9中所列的肽,X

举例而言,在一些实施方案中,有义链在N

在一些实施方案中,反义链包含连接至N

在一些实施方案中,化合物具有下式:

其中F

在一些实施方案中,F

在一些实施方案中,X

在一些实施方案中,本文提供具有式(X1)

在一些实施方案中,本文提供具有式X4-L-(X1)

在一些实施方案中,本文提供具有式C-X4-L-(X1)

在一些实施方案中,本文所提供具有式X4-L-(X1)

在一些实施方案中,GYS1 siRNA对可遵循以下序列:有义链(5’-3’)nsnsnnnnNfNfNfnnnnnnnnsnsa和反义链(5’-3’)UfsNfsnnnNfnnnnnnnNfnNfnnnsusu,其中(n)为2’-O-Me(甲基),(Nf)为2’-F(氟),(s)为硫代磷酸酯主链修饰。有义链和反义链两者中的每一核苷酸在核糖和核碱基位置处经独立或组合修饰。

在一些实施方案中,siRNA分子包含来自表1A或1B的序列对。

表1A:siRNA有义序列和反义序列

/>

/>

/>

/>

/>

缩写注释:(n/N=任何核苷酸)mN=2'-O-甲基残基,fN=2'-F残基,*=硫代磷酸酯且(idT)=倒转Dt,(VP)2’-O甲基乙烯基膦酸酯尿苷。方括号指示单独碱基。

表1B

/>

/>

/>

在一些实施方案中,上文所阐释的多核苷酸包括不包含2’-O甲基乙烯基膦酸酯尿苷作为siRNA的反义链上的5’核苷酸的那些。

在一些实施方案中,多核苷酸如本文所提供。在一些实施方案中,多核苷酸包含第一链和第二链以形成包含双链体的部分。在一些实施方案中,多核苷酸包含有义链和反义链。在一些实施方案中,包含如表1A或1B中所示的序列。在一些实施方案中,包含如表1A或1B中所示的不含碱基修饰的序列。在一些实施方案中,药物组合物包含如本文所提供的siRNA对。在一些实施方案中,siRNA对并不缀合至FN3结构域。

在一些实施方案中,使用化学合成和/或酶促连接反应且使用本领域已知的程序来构建本文所述的寡核苷酸分子。举例而言,使用天然存在的核苷酸或各种经修饰的核苷酸来化学合成寡核苷酸分子,所述经修饰的核苷酸被设计为增加分子的生物稳定性或增加形成于寡核苷酸分子与靶核酸之间的双链体的物理稳定性。或者,使用表达载体以生物学方式产生寡核苷酸分子,其中寡核苷酸分子已以反义取向亚克隆至所述表达载体中(即,从所插入寡核苷酸分子转录的RNA将与目标靶多核酸分子具有反义取向)。

在一些实施方案中,寡核苷酸分子经由串联合成方法合成,其中将两条链合成为由可裂解接头隔开的单一邻接寡核苷酸片段或链,所述可裂解接头随后发生裂解以提供进行杂交并允许纯化双链体的单独片段或链。

在一些情况下,寡核苷酸分子也从两个不同核酸链或片段组装,其中一个片段包含有义区且第二片段包含分子的反义区。

在一些情况下,尽管使用具有硫代磷酸酯、二硫代磷酸酯、膦酸酯、氨基磷酸酯或甲磺酰基氨基磷酸酯的寡核苷酸分子核苷酸间键联进行化学修饰,但键联改进了稳定性。过度修饰有时会引起毒性或降低活性。因此,在设计核酸分子时,在一些情况下需最小化这些核苷酸间键联的量。在此类情况下,降低这些键联的浓度会降低毒性,增加功效并提高这些分子的特异性。

如本文所述,在一些实施方案中,可修饰核酸分子以在dsRNA的有义链的5'端处包含接头。在一些实施方案中,可修饰核酸分子以在dsRNA的反义链的5'端处包含乙烯基膦酸酯或经修饰的乙烯基膦酸酯。在一些实施方案中,可修饰核酸分子以在dsRNA的有义链的3'端处包含接头。在一些实施方案中,可修饰核酸分子以在dsRNA的反义链的3'端处包含乙烯基膦酸酯。可使用接头来连接dsRNA与FN3结构域。接头可共价连接至(例如)FN3结构域上的半胱氨酸残基,所述半胱氨酸残基天然存在或已如本文和例如美国专利第10,196,446号(其特此以引用的方式整体并入)中所阐述经取代。dsRNA的此类经修饰链的非限制性实例示于表2中。

表2:具有接头和/或乙烯基膦酸酯的对

/>

/>

/>

/>

/>

在一些实施方案中,上文所提供的A至PPPP的siRNA对在有义链的3'处包含接头。在一些实施方案中,上文所提供的A至PPPP的siRNA对在有义链的5’端处包含乙烯基膦酸酯。

缩写注释:(n/N=任何核苷酸),mN=2'-O-甲基残基,fN=2'-F残基,*=硫代磷酸酯并且(idT)=倒转Dt,(VP)2’-O甲基乙烯基膦酸酯尿苷,BMPS=丙基马来酰亚胺,

接头(L)的结构如下表3中所示。

表3:接头(L)的代表性实例

还可使用其他接头,如使用点击化学、酰胺偶联、还原胺化、肟、酶促偶联(如转谷氨酰胺酶和分选酶缀合)形成的接头。在此所提供的接头为示例性且还可使用利用其他此类方法制得的其他接头。

在连接至siRNA时,结构L-(X4)可由下式表示:

尽管本文阐释某些具有某些经修饰的核碱基的siRNA序列,本文还提供不含此类修饰的序列。即,序列可包含不含任何修饰的本文所提供的表中所示的序列。在一些实施方案中,未修饰的siRNA序列仍可在dsRNA的有义链的5'端处包含接头。在一些实施方案中,可修饰核酸分子以在dsRNA的反义链的5'端处包含乙烯基膦酸酯。在一些实施方案中,可修饰核酸分子以在dsRNA的有义链的3'端处包含接头。在一些实施方案中,可修饰核酸分子以在dsRNA的反义链的3'端处包含乙烯基膦酸酯。接头可如本文所提供。

在一些实施方案中,提供包含结合CD71的多肽的FN3蛋白。在一些实施方案中,多肽包含结合至CD71的FN3结构域。在一些实施方案中,提供包含SEQ ID NO:273、288-291、301-310、312-572、592-599或708-710的序列的多肽。在一些实施方案中,结合CD71的多肽包含SEQ ID NO:301-301、310、312-572、592-599或708-710的序列。多肽可结合的CD71蛋白的序列可为例如SEQ ID NO:2或3。在一些实施方案中,结合至CD71的FN3结构域特异性结合至CD71。

在一些实施方案中,结合CD71的FN3结构域为基于SEQ ID NO:1的Tencon序列或SEQ ID NO:4(LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAIFTT)的Tencon 27序列,并且任选地在残基位置11、14、17、37、46、73或86(残基编号对应于SEQ ID NO:4)处具有取代。

在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:273、288-291、301-310、312-572、592-599或708-710的氨基酸序列。

在一些实施方案中,包含多肽的蛋白质包含SEQ ID NO:273的氨基酸序列。SEQ IDNO:273为基于SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290和SEQ ID NO:291的序列的共有序列。SEQ ID NO:273的序列为

MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFX

其中X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

在一些实施方案中:

X

X

X

X

X

X

X

X

X

X

X

X

X

X

在一些实施方案中,X

在一些实施方案中,X

在一些实施方案中,序列如SEQ ID NO:288的序列中所展示,除了对应于X

在一些实施方案中,序列如SEQ ID NO:289的序列中所展示,除了对应于X

在一些实施方案中,序列如SEQ ID NO:290的序列中所展示,除了对应于X

在一些实施方案中,序列如SEQ ID NO:291的序列中所展示,除了对应于X

在一些实施方案中,包含多肽的蛋白质包含与SEQ ID NO:273的序列至少62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列。在一些实施方案中,所述蛋白质与SEQ ID NO:273的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一。在一些实施方案中,所述蛋白质与SEQ ID NO:273的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一。在一些实施方案中,所述蛋白质与SEQ ID NO:273的序列至少95%、96%、97%、98%或99%同一。

可使用可经由NCBI网站获得的BlastP使用默认参数来比对两个序列而确定序列同一性。

在一些实施方案中,提供结合或特异性结合人类CD71蛋白(SEQ ID NO:2或5)的III型纤连蛋白(FN3)结构域。如本文所提供,FN3结构域可结合至CD71蛋白。还提供(即使未明确陈述),所述结构域还可特异性结合至CD71蛋白。因此,举例而言,结合至CD71的FN3结构域还将涵盖特异性结合至CD71的FN3结构域蛋白。这些分子可用于例如治疗性和诊断性应用以及成像。在一些实施方案中,提供编码本文公开的FN3结构域或其互补核酸的多核苷酸、载体、宿主细胞以及其制备和使用方法。

在一些实施方案中,提供结合或特异性结合CD71的经分离FN3结构域。

在一些实施方案中,FN3结构域包含两个通过接头连接的FN3结构域。接头可为柔性接头。接头可为短肽序列,如本文所述的那些。举例而言,接头可为G/S接头和诸如此类。

在一些实施方案中,FN3结构域包含两个通过接头(诸如本文所提供的那些)连接的FN3结构域。示例性接头包括但不限于(GS)

在一些实施方案中,FN3结构域可以小于约1×10

在一些实施方案中,在标准溶液ELISA测定中,FN3结构域可以至少5倍于针对阴性对照所获得的信号的信号来结合CD71。

在一些实施方案中,结合或特异性结合CD71的FN3结构域包含连接至分子的N-末端的起始甲硫氨酸(Met)。在一些实施方案中,结合或特异性结合CD71的FN3结构域包含连接至FN3结构域的C-末端的半胱氨酸(Cys)。添加N-末端Met和/或C-末端Cys可促进表达和/或缀合以延长半衰期并提供其他分子功能。

FN3结构域还可含有半胱氨酸取代,如阐述于美国专利第10,196,446号(其特此以引用的方式整体并入)中的那些。简言之,在一些实施方案中,本文所提供的多肽可在选自由以下组成的组的位置处包含至少一个半胱氨酸取代:FN3结构域的残基6、8、10、11、14、15、16、20、30、34、38、40、41、45、47、48、53、54、59、60、62、64、70、88、89、90、91和93,所述FN3结构域基于美国专利第10,196,446号的SEQ ID NO:6或SEQ ID NO:1;和相关FN3结构域中的等效位置。在一些实施方案中,取代位于残基6处。在一些实施方案中,取代位于残基8处。在一些实施方案中,取代位于残基10处。在一些实施方案中,取代位于残基11处。在一些实施方案中,取代位于残基14处。在一些实施方案中,取代位于残基15处。在一些实施方案中,取代位于残基16处。在一些实施方案中,取代位于残基20处。在一些实施方案中,取代位于残基30处。在一些实施方案中,取代位于残基34处。在一些实施方案中,取代位于残基38处。在一些实施方案中,取代位于残基40处。在一些实施方案中,取代位于残基41处。在一些实施方案中,取代位于残基45处。在一些实施方案中,取代位于残基47处。在一些实施方案中,取代位于残基48处。在一些实施方案中,取代位于残基53处。在一些实施方案中,取代位于残基54处。在一些实施方案中,取代位于残基59处。在一些实施方案中,取代位于残基60处。在一些实施方案中,取代位于残基62处。在一些实施方案中,取代位于残基64处。在一些实施方案中,取代位于残基70处。在一些实施方案中,取代位于残基88处。在一些实施方案中,取代位于残基89处。在一些实施方案中,取代位于残基90处。在一些实施方案中,取代位于残基91处。在一些实施方案中,取代位于残基93处。

结构域或蛋白质中的某一位置处的半胱氨酸取代包括使用半胱氨酸残基代替现有氨基酸残基。在一些实施方案中,将半胱氨酸插入毗邻上文所列位置的序列中而非进行取代。半胱氨酸修饰的其他实例可参见例如美国专利申请公布第20170362301号,所述公布特此以引用的方式整体并入。可使用BlastP使用例如NCBI网站处的默认参数来进行序列的比对。

在一些实施方案中,将半胱氨酸残基插入结构域或蛋白质中的任何位置处。

在一些实施方案中,使结合CD71的FN3结构域内化至细胞中。在一些实施方案中,FN3结构域的内化可有助于将可检测标记或治疗剂递送至细胞中。在一些实施方案中,FN3结构域的内化可有助于将细胞毒性剂递送至细胞中。细胞毒性剂可用作治疗剂。在一些实施方案中,FN3结构域的内化可有助于将本文公开的任何可检测标记、治疗剂和/或细胞毒性剂递送至细胞中。在一些实施方案中,FN3结构域的内化可有助于将寡核苷酸递送至细胞中。在一些实施方案中,细胞为肿瘤细胞。在一些实施方案中,细胞为肝细胞。在一些实施方案中,细胞为肌细胞。在一些实施方案中,细胞为免疫细胞。在一些实施方案中,细胞为树突状细胞。在一些实施方案中,细胞为中枢神经系统细胞。在一些实施方案中,细胞为心脏细胞。

在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:273、288-291、301-310、312-572、592-599或708-710的氨基酸序列。

在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:301的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:302的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:303的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:304的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:305的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:306的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:307的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:310的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:312的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:313的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:314的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:315的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:316的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:317的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:318的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:319的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:320的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:321的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:322的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:323的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:324的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:325的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:326的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:327的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:328的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:329的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:330的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:331的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:332的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:333的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:334的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:335的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:336的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:337的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:338的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:339的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:340的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:341的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:342的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:343的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:344的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:345的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:346的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:347的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:348的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:349的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:350的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:351的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:352的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:353的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:354的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:355的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:356的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:357的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:358的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:359的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:360的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:361的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:362的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:363的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:364的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:365的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:366的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:367的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:368的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:369的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:370的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:371的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:372的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:373的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:374的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:375的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:376的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:377的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:378的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:379的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:380的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:381的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:382的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:383的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:384的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:385的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:386的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:387的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:388的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:389的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:390的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:391的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:392的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:393的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:394的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:395的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:396的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:397的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:398的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:399的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:400的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:401的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:402的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:403的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:404的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:405的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:406的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:407的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:408的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:409的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:410的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:411的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:412的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:413的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:414的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:415的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:416的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:417的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:418的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:419的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:420的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:421的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:422的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:423的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:424的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:425的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:426的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:427的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:428的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:429的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:430的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:431的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:432的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:433的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:434的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:435的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:436的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:437的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:438的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:439的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:440的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:441的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:442的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:443的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:444的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:445的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:446的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:447的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:448的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:449的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:450的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:451的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:452的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:453的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:454的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:455的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:456的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:457的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:458的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:459的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:460的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:461的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:462的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:463的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:464的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:465的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:466的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:467的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:468的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:469的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:470的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:471的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:472的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:473的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:474的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:475的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:476的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:477的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:478的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:479的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:480的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:481的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:482的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:483的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:484的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:485的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:486的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:487的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:488的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:489的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:490的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:491的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:492的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:493的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:494的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:495的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:496的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:497的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:498的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:499的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:500的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:501的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:502的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:503的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:504的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:505的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:506的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:507的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:508的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:509的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:510的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:511的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:512的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:513的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:514的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:515的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:516的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:517的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:518的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:519的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:521的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:522的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:523的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:524的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:525的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:526的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:527的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:528的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:529的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:530的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:531的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:532的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:533的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:534的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:535的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:536的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:537的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:538的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:539的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:540的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:541的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:542的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:543的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:544的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:545的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:546的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:547的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:548的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:549的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:550的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:551的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:552的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:553的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:554的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:555的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:556的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:557的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:558的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:559的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:560的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:561的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:562的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:563的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:564的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:565的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQID NO:566的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ IDNO:567的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:568的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:569的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:570的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:571的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:572的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:708的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:709的氨基酸序列。在一些实施方案中,结合CD71的经分离FN3结构域包含SEQ ID NO:710的氨基酸序列。

在一些实施方案中,结合CD71的经分离FN3结构域包含连接至分子的N-末端的起始甲硫氨酸(Met)。

在一些实施方案中,结合CD71的经分离FN3结构域包含与SEQ ID NO:273、288-291、301-310、312-572、592-599或708-710的氨基酸序列中的一者62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列。可使用可经由NCBI网站获得的BlastP使用默认参数来比对两个序列而确定百分比同一性。结合至CD71的FN3结构域的序列可参见例如表4。

表4:结合CD71的FN3结构域序列

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

如本文所提供,在一些实施方案中,结合至CD71的FN3结构域结合至SEQ ID NO:2(人类成熟CD71)或SEQ ID NO:5(人类成熟CD71细胞外结构域),各自的序列提供于下文中:

在一些实施方案中,FN3结构域包含两个通过接头连接的FN3结构域。接头可为柔性接头。接头可为短肽序列,如本文所述的那些。举例而言,接头可为G/S或G/A接头和诸如此类。如本文所提供,接头可为(例如)(GS)

在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ IDNO:592的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:593的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:594的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:595的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:596的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:597的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ IDNO:598的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:599的氨基酸序列。在一些实施方案中,包含两个通过接头连接的FN3结构域的FN3结构域具有SEQ ID NO:592-599中的一者的氨基酸序列。

在一些实施方案中,FN3结构域可适当地以小于约1×10

在一些实施方案中,在标准溶液ELISA测定中,FN3结构域可以至少5倍于针对阴性对照所获得的信号的信号来结合至其靶蛋白。

在一些实施方案中,结合或特异性结合靶蛋白的FN3结构域包含连接至分子的N-末端的起始甲硫氨酸(Met)。在一些实施方案中,结合或特异性结合至靶蛋白的FN3结构域包含连接至FN3结构域的C-末端的半胱氨酸(Cys)。添加N-末端Met和/或C-末端Cys可促进半衰期延长分子的表达和/或缀合。

FN3结构域还可含有半胱氨酸取代,如阐述于美国专利第10,196,446号(其特此以引用的方式整体并入)中的那些。简言之,在一些实施方案中,包含FN3结构域的多肽可具有残基经半胱氨酸取代的FN3结构域,所述结构域可被称为经半胱氨酸工程化的III型纤连蛋白(FN3)结构域。在一些实施方案中,FN3结构域在选自由以下组成的组的位置处包含至少一个半胱氨酸取代:FN3结构域的残基6、8、10、11、14、15、16、20、30、34、38、40、41、45、47、48、53、54、59、60、62、64、70、88、89、90、91和93,所述FN3结构域为基于美国专利第10,196,446号(其特此以引用的方式整体并入)的SEQ ID NO:1(LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTG LKPGTEYTVSIYGVKGGHRSNPLSAEFTT);和相关FN3结构域中的等效位置。结构域或蛋白质中的某一位置处的半胱氨酸取代包括使用半胱氨酸残基代替现有氨基酸残基。半胱氨酸修饰的其他实例可参见例如美国专利申请公布第20170362301号,所述公布特此以引用的方式整体并入。可使用BlastP使用例如NCBI网站处的默认参数来进行序列的比对。

在一些实施方案中,使结合至靶蛋白的FN3结构域内化至细胞中。在一些实施方案中,FN3结构域的内化可有助于将可检测标记或治疗剂递送至细胞中。在一些实施方案中,FN3结构域的内化可有助于将细胞毒性剂递送至细胞中。细胞毒性剂可用作治疗剂。在一些实施方案中,FN3结构域的内化可有助于将本文公开的任何可检测标记、治疗剂和/或细胞毒性剂递送至细胞中。在一些实施方案中,细胞为肿瘤细胞。在一些实施方案中,细胞为肝细胞、肺细胞、肌细胞、免疫细胞、树突状细胞、CNS细胞或心脏细胞。在一些实施方案中,治疗剂为如本文所提供的siRNA分子。可使用结合与可检测标记缀合的CD71的FN3结构域在体内或体外评估样品(如肿瘤组织)上的CD71表达。可使用结合与可检测标记缀合的CD71的FN3结构域在体内或体外评估血液、免疫细胞、肌细胞或树突状细胞样品上的CD71表达。

如本文所提供,连接至siRNA分子的不同FN3结构域也可缀合或连接至结合至不同靶标的另一FN3结构域。这使得分子能够具有多特异性(例如双特异性、三特异性等),从而其结合至第一靶标和(例如)另一靶标。在一些实施方案中,第一FN3结合结构域连接至结合至由肿瘤细胞表达的抗原(肿瘤抗原)的另一FN3结构域。

在一些实施方案中,FN3结构域可通过接头连接在一起以形成二价FN3结构域。接头可为柔性接头。在一些实施方案中,接头为G/S接头。在一些实施方案中,接头具有1、2、3或4个G/S重复。G/S重复单元为后接丝氨酸的四个甘氨酸(例如GGGGS)。接头的其他实例提供于本文中且也可使用。

在一些实施方案中,接头为多肽(GS)

不受限于任何特定理论,在一些实施方案中,连接至核酸分子的FN3结构域可用于将治疗剂靶向递送表达一个或多个FN3结构域的结合配偶体的细胞(例如肿瘤细胞)中,并且使核酸分子细胞内累积于其中。这可使得siRNA分子适当地与细胞机器相互作用以抑制靶基因的表达,改进功效,并且在一些实施方案中也避免了可源自非靶向施用相同siRNA分子的毒性。

本文所述的结合至其特定靶蛋白的FN3结构域可生成为单体、二聚体或多聚体(例如作为增加化合价且由此增加靶分子结合的亲合力的方式),或生成为同时结合两个或更多个不同靶分子的双-或多特异性支架。可通过连接单特异性、双或多特异性蛋白质支架来生成二聚体和多聚体,例如通过包含氨基酸接头(例如含有聚甘氨酸、甘氨酸和丝氨酸、或丙氨酸和脯氨酸的接头)。示例性接头包括(GS)

二聚体和多聚体可沿N至C方向彼此连接。使用天然存在的以及合成的肽接头将多肽连接成新颖连接的融合多肽已在文献中众所周知(Hallewell等人,J Biol Chem 264,5260-5268,1989;Alfthan等人,Protein Eng.8,725-731,1995;Robinson和Sauer,Biochemistry 35,109-116,1996;美国专利第5,856,456号)。本段落中所阐述的接头也可用于连接本文和上文所提供的式中所提供的结构域。

半衰期延长部分

在一些实施方案中,FN3结构域也可(例如)经由共价相互作用并入其他亚单元。在一些实施方案中,FN3结构域还包含半衰期延长部分。示例性半衰期延长部分为白蛋白、白蛋白变体、白蛋白结合蛋白和/或结构域、转铁蛋白以及其片段和类似物和Fc区。人类Fc区的氨基酸序列众所周知,并且包括IgG1、IgG2、IgG3、IgG4、IgM、IgA和IgE Fc区。在一些实施方案中,FN3结构域结合至白蛋白、白蛋白变体、白蛋白结合蛋白和/或结构域以及其片段和类似物,从而延长了整个分子的半衰期。

在一些实施方案中,白蛋白结合结构域包含SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列。在一些实施方案中,白蛋白结合结构域(蛋白质)为经分离的。在一些实施方案中,白蛋白结合结构域包含与SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列至少或为85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列。在一些实施方案中,白蛋白结合结构域包含与SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列至少或为85%、86%、0.87%、88%、89%、90%、901%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列,条件为所述蛋白质具有对应于SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的位置10的取代。在一些实施方案中,取代为A10V。在一些实施方案中,取代为A10G、A10L、A10I、A10T或A10S。在一些实施方案中,位置10处的取代为任何天然存在的氨基酸。在一些实施方案中,经分离白蛋白结合结构域包含与SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的氨基酸序列相比具有1、2、3、4、5、6、7、8、9、10、11、12、13或14个取代的氨基酸序列。在一些实施方案中,取代位于对应于SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的位置10的位置处。在一些实施方案中,所提供的FN3结构域在至少一个对应于SEQ ID NO:101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118或119的残基位置6、11、22、25、26、52、53、61、88或位置6、8、10、11、14、15、16、20、30、34、38、40、41、45、47、48、53、54、59、60、62、64、70、88、89、90、91或93的残基位置中或在C-末端处包含半胱氨酸残基。尽管位置以系列形式列出,但每一位置也可单独地进行选择。在一些实施方案中,半胱氨酸位于对应于位置6、53或88的位置处。在一些实施方案中,白蛋白结合结构域的其他实例可参见美国专利第10,925,932号,所述专利特此以引用地方式并入。

抗体恒定区的全部或一部分可连接至FN3结构域以赋予抗体样性质,尤其与Fc区相关的那些性质,如Fc效应功能,如C1q结合、补体依赖性细胞毒性(CDC)、Fc受体结合、抗体依赖性细胞介导的细胞毒性(ADCC)、吞噬作用、细胞表面受体(例如B细胞受体;BCR)的下调;并且可通过修饰负责这些活性的Fc中的残基来进一步修饰(综述可参见Strohl,CurrOpin Biotechnol.20,685-691,2009)。

可将其他部分并入FN3结构域中以实现所需的性质,如聚乙二醇(PEG)分子(如PEG5000或PEG20,000)、具有不同链长的脂肪酸和脂肪酸酯(例如月桂酸酯、肉豆蔻酸酯、硬脂酸酯、花生酸酯、山嵛酸酯、油酸酯、花生四烯酸酯、辛二酸、十四烷二酸、十八烷二酸、二十二烷二酸和诸如此类)、聚赖氨酸、辛烷、碳水化合物(葡聚糖、纤维素、寡糖或多糖)。这些部分可与蛋白质支架编码序列直接融合且可通过标准克隆和表达技术生成。或者,可使用熟知化学偶联方法来将所述部分连接至本文公开的重组产生的分子。

可例如通过以下方式将PEG部分添加至FN3结构域中:将半胱氨酸残基并入分子的C-末端或将半胱氨酸工程化至背对分子结合面的残基位置中,并使用熟知方法将PEG基团连接至半胱氨酸。

可通过若干熟知测定比较并入其他部分的FN3结构域的功能性。举例而言,可在Fc受体结合测定中使用可溶性受体形式(如FcγRI、FcγRII、FcγRIII或FcRn受体)或使用基于细胞的熟知测定(测量例如ADCC或CDC或在体内模型中评估本文所公开分子的药物动力学性质)来测定因并入Fc结构域和/或Fc结构域变体而改变的性质。

可通过制备FN3蛋白和核酸分子并将其连接至一起来制备本文所提供的组合物。连接蛋白质与核酸分子的技术为已知的且可使用任何方法。举例而言,在一些实施方案中,使用接头(如本文所提供的接头)修饰核酸分子,并且然后将蛋白质与包含接头的核酸分子混合以形成组合物。举例而言,在一些实施方案中,使用硫醇-马来酰亚胺化学使FN3结构域缀合至siRNA和半胱氨酸。在一些实施方案中,可在例如磷酸盐缓冲盐水(或任何其他适当缓冲液)中使用还原剂(例如三(2-羧乙基)膦(TCEP))还原含有半胱氨酸的FN3结构域以产生游离硫醇。然后,在一些实施方案中,将含有游离硫醇的FN3结构域与马来酰亚胺连接的经修饰siRNA双链体混合并在形成连接复合物的条件下孵育。在一些实施方案中,将混合物在室温下孵育0-5小时或约1、2、3、4或5小时。可例如使用N-乙基马来酰亚胺终止反应。在一些实施方案中,可使用亲和色谱和离子交换纯化缀合物。还可使用其他方法且此方法仅为一种非限制性实施方案。

制备FN3蛋白的方法为已知的且可使用任何方法来产生蛋白质。实例提供于以引用的方式并入本文中的参考文献中。

在一些实施方案中,特异性结合CD71的FN3结构域包含SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的氨基酸序列,其中已将组氨酸标签附加至多肽的N-末端或C-末端以便于纯化。在一些实施方案中,组氨酸标签(His标签)包含六个组氨酸残基。在其他实施方案中,通过至少一个甘氨酸残基或约2至约4个甘氨酸残基将His标签连接至FN3结构域。因此,在纯化FN3结构域并从多肽裂解His标签之后,一个或多个甘氨酸可保留于N-末端或C-末端。在一些实施方案中,如果从N-末端除去His标签,则所有甘氨酸均已除去。在一些实施方案中,如果从C-末端除去His标签,则一个或多个甘氨酸得以保留。

在一些实施方案中,特异性结合CD71的FN3结构域包含SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的氨基酸序列,其中N-末端甲硫氨酸在纯化FN3结构域之后得以保留。

药盒

在一些实施方案中,提供包括本文所述的组合物的药盒。

药盒可用于治疗性用途和用作诊断试剂盒。

在一些实施方案中,药盒包括缀合至核酸分子的FN3结构域。

缀合物FN3结构域的用途

本文所提供的组合物可用于诊断、监测、调节、治疗、缓解、帮助预防发生或减轻细胞、组织、器官、流体或通常宿主中的人类疾病或特定病况的症状。

在一些实施方案中,提供选择性地减少骨骼肌中的GYS1 mRNA和蛋白质的方法。在某些实施方案中,肝和/或肾中的GYS1 mRNA和蛋白质并未减少。

在一些实施方案中,在施用本文所述的缀合物之后,GYS1 mRNA和蛋白质的减少持续约1周、约2周、约3周、约4周、约5周或大于5周。

在一些实施方案中,FN3结构域可有助于递送至CD71阳性组织(例如骨骼肌、平滑肌)中以治疗肌肉疾病。

在一些实施方案中,FN3结构域可有助于递送至活化的淋巴细胞、树突状细胞或其他免疫细胞中以治疗免疫疾病。

在一些实施方案中,结合至CD71的多肽为针对免疫细胞。在一些实施方案中,结合至CD71的多肽为针对树突状细胞。在一些实施方案中,提供治疗有需要的受试者的自身免疫性疾病的方法。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。在一些实施方案中,自身免疫性疾病选自由以下组成的组:类风湿性关节炎、桥本氏自身免疫性甲状腺炎、乳糜泻、1型糖尿病、白癜风、风湿热、恶性贫血/萎缩性胃炎、斑秃和免疫性血小板减少性紫癜。

在一些实施方案中,提供治疗患有庞贝病(GSD2,酸性α-葡萄糖苷酶(GAA)缺乏)的受试者的方法,所述方法包括向所述受试者施用本文所提供的组合物。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。

在一些实施方案中,提供治疗有需要的受试者的糖原贮积病的方法,所述方法包括施用本文所提供的组合物。在一些实施方案中,糖原贮积病选自由以下组成的组:柯里氏病或福布斯氏病(GSD3,糖原去分支酶(AGL)缺乏)、麦卡德尔病(GSD5,肌糖原磷酸化酶(PYGM)缺乏)、II型糖尿病/糖尿病性肾病变、醛醇缩酶A缺乏GSD12、拉弗拉病、低氧症、安德森病(GSD4、糖原去分支酶(GBE1)缺乏)、塔里氏病(GSD7,肌磷酸果糖激酶(PFKM)缺乏)和成人葡聚糖体病。在一些实施方案中,糖原贮积病选自由以下组成的组:糖原合酶(GYS2)缺乏(GSD0)、葡萄糖-6-磷酸酶(G6PC/SLC37A4)缺乏(GSD1,冯吉尔克氏病)、赫尔斯氏病(GSD6,肝糖原磷酸化酶(PYGL)或肌磷酸甘油酸变位酶(PGAM2)缺乏)、磷酸化酶激酶(PHKA2/PHKB/PHKG2/PHKA1)缺乏(GSD9)、磷酸甘油酸变位酶(PGAM2)缺乏(GSD10)、肌乳酸脱氢酶(LDHA)缺乏(GSD11)、范可尼-比克尔综合征(GSD 11)、葡萄糖转运蛋白(GLUT2)缺乏、醛醇缩酶A缺乏(GSD 12)、β-烯醇酶(ENO3)缺乏(GSD13)和糖原生成蛋白-1(GYG1)缺乏(GSD15)。

在一些实施方案中,提供如本文所提供的组合物在制备用于治疗癌症的药物组合物或药剂中的用途。在一些实施方案中,癌症选自由以下组成的组:急性髓系白血病、骨髓增生异常综合征、胃癌、透明细胞肾细胞癌、乳房透明细胞癌、子宫内膜透明细胞癌、卵巢透明细胞癌、子宫透明细胞癌、肝细胞癌、胰腺癌、前列腺癌、软组织癌、尤文氏肉瘤和非小细胞肺癌。

在一些实施方案中,CD71细胞为参与CNS疾病、炎症性/免疫疾病(如MS和感染性脑病)的细胞。在一些实施方案中,结合至CD71的多肽为针对中枢神经系统。在一些实施方案中,提供治疗有需要的受试者的神经学疾患和/或脑肿瘤的方法。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。在一些实施方案中,脑肿瘤选自由以下组成的组:非恶性脑肿瘤、良性脑肿瘤和恶性脑肿瘤。在一些实施方案中,神经学疾患选自由以下组成的组:阿尔茨海默氏病、肌萎缩性脊髓侧索硬化症、帕金森氏病、拉弗拉病、庞贝病、成人葡聚糖体病、中风、脊髓损伤、共济失调、贝尔氏麻痹、脑动脉瘤、癫痫、抽搐、格林-巴利综合征、多发性硬化、肌肉营养不良症、神经皮肤综合征、偏头痛、脑炎、败血症和重症肌无力。

在一些实施方案中,提供治疗患有癌症的受试者的方法,所述方法包括向所述受试者施用本文所提供的组合物。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。

在一些实施方案中,受试者患有实体肿瘤。

在一些实施方案中,实体肿瘤为黑素瘤。

在一些实施方案中,实体肿瘤为肺癌。在一些实施方案中,实体肿瘤为非小细胞肺癌(NSCLC)。在一些实施方案中,实体肿瘤为鳞状非小细胞肺癌(NSCLC)。在一些实施方案中,实体肿瘤为非鳞状NSCLC。在一些实施方案中,实体肿瘤为肺腺癌。

在一些实施方案中,实体肿瘤为肾细胞癌(RCC)。

在一些实施方案中,实体肿瘤为间皮瘤。

在一些实施方案中,实体肿瘤为鼻咽癌(NPC)。

在一些实施方案中,实体肿瘤为结肠直肠癌。

在一些实施方案中,实体肿瘤为前列腺癌。在一些实施方案中,实体肿瘤为去势抗性前列腺癌。

在一些实施方案中,实体肿瘤为胃癌。

在一些实施方案中,实体肿瘤为卵巢癌。

在一些实施方案中,实体肿瘤为胃癌。

在一些实施方案中,实体肿瘤为肝癌。

在一些实施方案中,实体肿瘤为胰腺癌。

在一些实施方案中,实体肿瘤为甲状腺癌。

在一些实施方案中,实体肿瘤为头颈鳞状细胞癌。

在一些实施方案中,实体肿瘤为食道癌或胃肠道癌。

在一些实施方案中,实体肿瘤为乳腺癌。

在一些实施方案中,实体肿瘤为输卵管癌。

在一些实施方案中,实体肿瘤为脑癌。

在一些实施方案中,实体肿瘤为尿道癌。

在一些实施方案中,实体肿瘤为泌尿生殖道癌。

在一些实施方案中,实体肿瘤为子宫内膜异位症。

在一些实施方案中,实体肿瘤为子宫颈癌。

在一些实施方案中,实体肿瘤为转移性癌症病灶。

在一些实施方案中,受试者患有血液恶性肿瘤。

在一些实施方案中,血液恶性肿瘤为淋巴瘤、骨髓瘤或白血病。在一些实施方案中,血液恶性肿瘤为B细胞淋巴瘤。在一些实施方案中,血液恶性肿瘤为伯基特氏淋巴瘤(Burkitt's lymphoma)。在一些实施方案中,血液恶性肿瘤为霍奇金氏淋巴瘤(Hodgkin'slymphoma)。在一些实施方案中,血液恶性肿瘤为非霍奇金氏淋巴瘤。

在一些实施方案中,血液恶性肿瘤为骨髓增生异常综合征。

在一些实施方案中,血液恶性肿瘤为急性髓系白血病(AML)。在一些实施方案中,血液恶性肿瘤为慢性髓系白血病(CML)。在一些实施方案中,血液恶性肿瘤为慢性骨髓单核细胞性白血病(CMML)。

在一些实施方案中,血液恶性肿瘤为多发性骨髓瘤(MM)。

在一些实施方案中,血液恶性肿瘤为浆细胞瘤。

在一些实施方案中,癌症为软组织癌。在一些实施方案中,软组织癌为尤文氏肉瘤。

在一些实施方案中,提供治疗有需要的受试者的癌症的方法。在一些实施方案中,所述方法包括向所述受试者施用本文所提供的任何组合物。在一些实施方案中,提供如本文所提供的组合物在制备用于治疗癌症的药物组合物或药剂中的用途。在一些实施方案中,所述组合物可用于治疗癌症。

在一些实施方案中,提供治疗有需要的受试者的庞贝病(GSD2,酸性α-葡萄糖苷酶(GAA)缺乏)的方法。在一些实施方案中,所述方法包括向所述受试者施用本文所提供的任何组合物。在一些实施方案中,提供如本文所提供的组合物在制备用于治疗庞贝病(GSD2,酸性α-葡萄糖苷酶(GAA)缺乏)的药物组合物或药剂中的用途。在一些实施方案中,所述组合物可用于治疗庞贝病(GSD2,酸性α-葡萄糖苷酶(GAA)缺乏)。

在一些实施方案中,提供治疗有需要的受试者的糖原贮积病的方法。在一些实施方案中,所述方法包括向所述受试者施用本文所提供的任何组合物。在一些实施方案中,提供如本文所提供的组合物在制备用于治疗糖原贮积病的药物组合物或药剂中的用途。在一些实施方案中,所述组合物可用于治疗糖原贮积病。

在一些实施方案中,提供治疗有需要的受试者的糖原贮积病的方法,所述方法包括施用本文所提供的组合物。在一些实施方案中,糖原贮积病选自由以下组成的组:柯里氏病或福布斯氏病(GSD3,糖原去分支酶(AGL)缺乏)、麦卡德尔病(GSD5,肌糖原磷酸化酶(PYGM)缺乏)、II型糖尿病/糖尿病性肾病变、醛醇缩酶A缺乏GSD12、拉弗拉病、低氧症、安德森病(GSD4,糖原去分支酶(GBE1)缺乏)、塔里氏病(GSD7,肌磷酸果糖激酶(PFKM)缺乏)和成人葡聚糖体病。在一些实施方案中,糖原贮积病选自由以下组成的组:糖原合酶(GYS2)缺乏(GSD0)、葡萄糖-6-磷酸酶(G6PC/SLC37A4)缺乏(GSD1,冯吉尔克氏病)、赫尔斯氏病(GSD6,肝糖原磷酸化酶(PYGL)或肌磷酸甘油酸变位酶(PGAM2)缺乏)、磷酸化酶激酶(PHKA2/PHKB/PHKG2/PHKA1)缺乏(GSD9)、磷酸甘油酸变位酶(PGAM2)缺乏(GSD10)、肌乳酸脱氢酶(LDHA)缺乏(GSD11)、范可尼-比克尔综合征(GSD 11)、葡萄糖转运蛋白(GLUT2)缺乏、醛醇缩酶A缺乏(GSD 12)、β-烯醇酶(ENO3)缺乏(GSD13)和糖原生成蛋白-1(GYG1)缺乏(GSD15)。

在一些实施方案中,结合至CD71的多肽为针对中枢神经系统。在一些实施方案中,提供治疗有需要的受试者的神经学疾患和/或脑肿瘤的方法。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。在一些实施方案中,脑肿瘤选自由以下组成的组:非恶性脑肿瘤、良性脑肿瘤和恶性脑肿瘤。在一些实施方案中,神经学疾患选自由以下组成的组:阿尔茨海默氏病、肌萎缩性脊髓侧索硬化症、帕金森氏病、拉弗拉病、庞贝病、成人葡聚糖体病、中风、脊髓损伤、共济失调、贝尔氏麻痹、脑动脉瘤、癫痫、抽搐、格林-巴利综合征、多发性硬化、肌肉营养不良症、神经皮肤综合征、偏头痛、脑炎、败血症和重症肌无力。在一些实施方案中,提供治疗受试者的神经学疾患和/或脑肿瘤的方法,所述方法包括向所述受试者施用结合CD71的FN3结构域且FN3结构域缀合至治疗剂(例如细胞毒性剂、寡核苷酸(如siRNA、ASO和诸如此类)、结合至另一靶标的FN3结构域和诸如此类)。

在一些实施方案中,提供治疗有需要的受试者的庞贝病的方法。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。在一些实施方案中,提供治疗受试者的庞贝病的方法,所述方法包括向所述受试者施用结合CD71的FN3结构域且FN3结构域缀合至治疗剂(例如细胞毒性剂、寡核苷酸(如siRNA、ASO和诸如此类)、结合至另一靶标的FN3结构域和诸如此类)。

在一些实施方案中,结合至CD71的多肽为针对免疫细胞。在一些实施方案中,结合至CD71的多肽为针对树突状细胞。在一些实施方案中,提供治疗有需要的受试者的自身免疫性疾病的方法。在一些实施方案中,所述方法包括向所述受试者施用结合至CD71的多肽或药物组合物。在一些实施方案中,多肽为结合至CD71的FN3结构域。在一些实施方案中,多肽包含诸如SEQ ID NO:301-301、310、312-519、521-572、592-599或708-710的序列,或包含如本文所提供连接至或缀合至治疗剂的多肽。在一些实施方案中,自身免疫性疾病选自由以下组成的组:类风湿性关节炎、桥本氏自身免疫性甲状腺炎、乳糜泻、1型糖尿病、白癜风、风湿热、恶性贫血/萎缩性胃炎、斑秃和免疫性血小板减少性紫癜。在一些实施方案中,提供治疗受试者的自身免疫性疾病的方法,所述方法包括向所述受试者施用结合CD71的FN3结构域且FN3结构域缀合至治疗剂(例如细胞毒性剂、寡核苷酸(如siRNA、ASO和诸如此类)、结合至另一靶标的FN3结构域和诸如此类)。

在一些实施方案中,提供降低细胞中的靶基因表达的方法。在一些实施方案中,所述方法包括向细胞递送如本文所提供的组合物或药物组合物。在一些实施方案中,细胞为离体细胞。在一些实施方案中,细胞为体内细胞。在一些实施方案中,靶基因为GYS1。然而,靶基因可为任何靶基因,因为本文所提供的证据证实siRNA分子在缀合至FN3结构域时可有效递送。在一些实施方案中,靶向GYS1的siRNA连接至FN3结构域。在一些实施方案中,FN3多肽(结构域)为结合至CD71者。在一些实施方案中,FN3多肽如本文所提供或如PCT申请第PCT/US20/55509号、美国申请第17/070,337号、PCT申请第PCT/US20/55470号或美国申请第17/070,020号(其各自特此以引用的方式整体并入)所提供。在一些实施方案中,siRNA未缀合至FN3结构域。

在一些实施方案中,提供降低细胞中的靶基因表达的方法。在一些实施方案中,所述方法包括向细胞递送如本文所提供的组合物或药物组合物。在一些实施方案中,细胞为离体细胞。在一些实施方案中,细胞为体内细胞。在一些实施方案中,降低靶基因表达的方法使得降低约99%、90%-99%、50%-90%或10%-50%的靶基因表达。

在一些实施方案中,提供降低GYS1的表达的方法。在一些实施方案中,降低的表达为GYS1 mRNA的表达(量)。在一些实施方案中,降低GYS1的表达的方法使得降低约99%、90%-99%、50%-90%或10%-50%的GYS1表达。在一些实施方案中,降低的表达为GYS1蛋白的表达(量)。在一些实施方案中,减少的蛋白质为糖原。在一些实施方案中,糖原减少发生于肌细胞中。在一些实施方案中,糖原减少发生于心脏细胞中。在一些实施方案中,所述方法包括向细胞递送如本文所提供靶向GYS1的siRNA分子。在一些实施方案中,siRNA缀合至FN3结构域。在一些实施方案中,FN3结构域为结合至CD71的FN3结构域。在一些实施方案中,FN3结构域如本文所提供。在一些实施方案中,FN3结构域为两个结合至CD71的FN3结构域的二聚体。在一些实施方案中,FN3结构域为相同的。在一些实施方案中,两个FN3结构域为不同的,即结合至CD71的不同区域或氨基酸残基,即不同表位。在一些实施方案中,所述方法包括向受试者(患者)施用GYS1 siRNA分子(诸如本文所提供的那些)。在一些实施方案中,施用于受试者的GYS1 siRNA缀合或连接至FN3结构域。在一些实施方案中,FN3结构域为结合至CD71的FN3结构域。在一些实施方案中,FN3结构域如本文所提供。在一些实施方案中,FN3结构域为两个结合至CD71的FN3结构域的二聚体。在一些实施方案中,FN3结构域为相同的。在一些实施方案中,两个FN3结构域为不同的,即结合至CD71的不同区域或氨基酸残基,即不同表位。在一些实施方案中,CD71结合结构域为如本文所提供的多肽。

在一些实施方案中,提供将siRNA分子递送至受试者的细胞的方法。在一些实施方案中,所述方法包括向所述受试者施用包含如本文所提供的组合物的药物组合物。在一些实施方案中,细胞为CD71阳性细胞。提及蛋白质的术语“阳性细胞”是指表达蛋白质的细胞。在一些实施方案中,蛋白质表达于细胞表面上。在一些实施方案中,细胞为肿瘤细胞、肝细胞、免疫细胞、树突状细胞、心脏细胞、肌细胞、CNS细胞或血脑屏障内部的细胞。在一些实施方案中,siRNA下调细胞中的靶基因表达。在一些实施方案中,靶基因为GYS1。

在一些实施方案中,本文所提供的组合物可用于诊断、监测、调节、治疗、缓解、帮助预防发生或减轻细胞、组织、器官、流体或通常宿主中的人类疾病或特定病况的症状,并且还展现能够跨越血脑屏障的性质。血-脑屏障(BBB)可防止大部分大分子(例如DNA、RNA和多肽)和许多小分子进入脑中。BBB主要由具有高度限制性紧密连接的特殊内皮细胞构成,因此,通过BBB来控制大小物质从血液进入中枢神经系统的通道。这种结构使得神经学疾病和病症(例如脑癌)患者难以治疗和管控,因为许多治疗剂不能以所需效率递送穿过BBB。涉及BBB干扰的其他疾患包含:中风、糖尿病、抽搐、高血压性脑病、获得性免疫缺陷综合征、创伤性脑损伤、多发性硬化、拉弗拉病、庞贝病、成人葡聚糖体病、帕金森氏病(PD)和阿尔茨海默氏病。这种能力尤其可用于治疗脑癌,包括例如:星形细胞瘤、髓母细胞瘤、神经胶质瘤、室管膜瘤、生殖细胞瘤(松果体瘤)、多形性神经胶质母细胞瘤、少突神经胶质细胞瘤、神经鞘瘤、视网膜母细胞瘤和先天性肿瘤;或脊髓癌,例如神经纤维瘤、脑膜瘤、神经胶质瘤和肉瘤。这进一步可用于治疗庞贝病和/或糖原贮积病。在某些实施方案中,本文所提供的组合物可用于递送治疗剂或细胞毒性剂,例如跨越血脑屏障。在某些实施方案中,本文所提供的组合物可用于将治疗剂或细胞毒性剂递送至例如肌肉中。

在一些实施方案中,提供治疗有需要的受试者的糖原贮积病的方法,所述方法包括施用本文所提供的组合物。在一些实施方案中,糖原贮积病选自由以下组成的组:柯里氏病或福布斯氏病(GSD3,糖原去分支酶(AGL)缺乏)、麦卡德尔病(GSD5,肌糖原磷酸化酶(PYGM)缺乏)、II型糖尿病/糖尿病性肾病变、醛醇缩酶A缺乏GSD12、拉弗拉病、低氧症、安德森病(GSD4,糖原去分支酶(GBE1)缺乏)、塔里氏病(GSD7,肌磷酸果糖激酶(PFKM)缺乏)和成人葡聚糖体病。在一些实施方案中,糖原贮积病选自由以下组成的组:糖原合酶(GYS2)缺乏(GSD0)、葡萄糖-6-磷酸酶(G6PC/SLC37A4)缺乏(GSD1,冯吉尔克氏病)、赫尔斯氏病(GSD6,肝糖原磷酸化酶(PYGL)或肌磷酸甘油酸变位酶(PGAM2)缺乏)、磷酸化酶激酶(PHKA2/PHKB/PHKG2/PHKA1)缺乏(GSD9)、磷酸甘油酸变位酶(PGAM2)缺乏(GSD10)、肌乳酸脱氢酶(LDHA)缺乏(GSD11)、范可尼-比克尔综合征(GSD 11)、葡萄糖转运蛋白(GLUT2)缺乏、醛醇缩酶A缺乏(GSD 12)、β-烯醇酶(ENO3)缺乏(GSD13)和糖原生成蛋白-1(GYG1)缺乏(GSD15)。

在一些实施方案中,本文所提供的组合物或药物组合物可用于治疗肌肉疾病,如肌肉营养不良症、DMD和诸如此类。

在一些实施方案中,本文所提供的组合物或药物组合物可单独施用,或与其他治疗剂组合(即同时或依序)施用。在一些实施方案中,其他或额外治疗剂为其他抗肿瘤剂或抗肿瘤治疗剂。不同肿瘤类型和肿瘤阶段可能需要使用各种可用于治疗癌症的辅助化合物。举例而言,本文所提供的组合物可与各种化学治疗剂组合使用,例如尤其为紫杉醇(taxol)、酪氨酸激酶抑制剂、甲酰四氢叶酸(leucovorin)、氟尿嘧啶(fluorouracil)、伊立替康(irinotecan)、磷酸酶抑制剂、MEK抑制剂。所述组合物还可与调节对肿瘤的免疫反应的药物(如尤其为抗PD-1或抗CTLA-4)组合使用。其他治疗剂可为调节免疫系统的药剂,如靶向PD-1或PD-L1的抗体。

在一些实施方案中,本文所提供的组合物或药物组合物可与GAA酶替代疗法(ERT)组合施用。

“治疗(Treat或treatment)”是指治疗性治疗和防治性措施,其中目标为预防或减缓(减轻)不期望生理学变化或病症(如癌症的发生或扩散)。在一些实施方案中,有益或所需临床结果包括但不限于缓解症状、减小疾病范围、稳定疾病状态(即不恶化)、延迟或减缓疾病进展、改善或缓和疾病状态以及可检测或不可检测地缓解病情(部分或全部)。“治疗”还可意味着与未接受治疗者的预期存活期相比延长存活期。需要治疗者包括已患有疾患或病症者以及倾向于患有所述疾患或病症者或待预防所述疾患或病症者。

“治疗有效量”是指在必要的剂量和时间段下有效实现所需治疗结果的量。本文所提供的组合物的治疗有效量可根据诸如以下等因素而有所变化:个体的疾病状态、年龄、性别和体重。有效量的示例性指示为患者幸福感有所改进、肿瘤大小降低或收缩、肿瘤生长经阻止或减缓和/或不存在癌细胞向身体其他位置的转移。

施用/药物组合物

在一些实施方案中,提供本文所提供的组合物和药学上可接受的载体的药物组合物。对于治疗性应用而言,组合物可被制备为含有有效量的于药学上可接受的载体中的结构域或分子作为活性成分的药物组合物。“载体”是指与活性化合物一起施用的稀释剂、佐剂、赋形剂或媒介物。此类媒介物可为液体,如水和油,包括石油、动物、植物或合成来源的那些,如花生油、大豆油、矿物油、芝麻油和诸如此类。举例而言,可使用0.4%盐水和0.3%甘氨酸。这些溶液无菌且通常不含微粒物质。其可通过常规、熟知灭菌技术(例如过滤)来灭菌。组合物可根据需要含有药学上可接受的辅助物质以接近生理条件,如pH调节剂和缓冲剂、稳定剂、增稠剂、润滑剂和着色剂等。此类药物制剂中的本文所公开的分子的浓度可广泛变化(即从小于约0.5重量%、通常至少约1重量%至最多15或20重量%)且主要基于所需剂量、流体体积、粘度等根据所选特定施用模式来进行选择。适合媒介物和制剂(包括其他人类蛋白,例如人血清白蛋白)阐述于(例如)Remington:The Science and Practice ofPharmacy,第21版,Troy,D.B.编辑,Lipincott Williams和Wilkins,Philadelphia,PA2006,第5部分,Pharmaceutical Manufacturing第691-1092页,尤其需参见第958-989页。

本文所公开的组合物的治疗性用途的施用模式可为将剂递送至宿主中的任何适合途径,例如(如本领域中所熟知的)肠胃外施用,例如真皮内、肌内、腹膜内、静脉内或皮下、经肺;经粘膜(经口、鼻内、阴道内、直肠),其使用呈片剂、胶囊、溶液、粉末、凝胶、颗粒形式的制剂;和含于注射器、植入装置、渗透泵、柱、微型泵;或熟练的技术人员所了解的其他方式。位点特异性施用可通过例如以下方式来实现:关节内、支气管内、腹内、囊内、软骨内、腔内、体腔内、小脑内、脑室内、结肠内、宫颈管内、胃内、肝内、心肌内、骨内、骨盆内、心包内、腹膜内、胸膜内、前列腺内、肺内、直肠内、肾内、视网膜内、脊柱内、滑膜内、胸内、子宫内、血管内、膀胱内、病灶内、经阴道、经直肠、经颊、舌下、鼻内或经皮递送。

药物组合物可供应为包括含有如本文所述的药物组合物的容器的药盒。药物组合物可提供为例如用于单一或多个剂量的可注射溶液形式,或提供为在注射之前重构的无菌粉末。或者,这种药盒可包括干粉分散器、液体气溶胶生成器或用于施用药物组合物的喷雾器。这种药盒还可包括关于药物组合物的适应症和用法的书面信息。

实施例

下列实施例阐释本文公开的实施方案。这些实施例仅提供用于阐释目的且实施方案决不应解释为限制这些实施例,而应解释为涵盖从本文所提供的教示内容将明了的任何和所有变化。本领域技术人员将容易地识别各种非关键参数,可对所述参数进行改变或修改以获得基本上类似的结果。

实施例1:GYS1 siRNA序列ID和表征

siRNA计算机筛选:实施计算机siRNA筛选以鉴别与人类GYS1mRNA互补的人类siRNA,参见图1。从人类GYS1 siRNA序列(NM_001161587)生成所有可能的19聚体反义序列且评估每一19聚体针对其他人类GYS1同种型以及潜在交叉反应性小鼠、大鼠和食蟹猴(Cynomolgus macaque)的活性。使用dbSNP(b155 v2)评价人类siRNA靶位点的共同人类SNP(MAF>1%)。弃除靶向常见等位基因的序列。接下来,在所有相关模型生物体中评估siRNA脱靶基因的有义链和反义链。这种选择获得200个潜在候选物,通过体外敲低筛选进一步定义所述候选物。主要siRNA候选物示于表1A和1B中。制备如表3中所述用于缀合至经半胱氨酸工程化的centyrin的GYS1siRN接头。

使用10nM ABXO-HHH(siRNA对HHH)将HEK293T细胞以及未处理对照细胞脂转染24小时(6个重复/处理组)。从细胞polyA+选择mRNA并在Illumina HiSeq平台上实施无链2×150bp配对端测序直至平均深度>30百万个读数。

图2为展示ABXO-HHH细胞与未处理细胞的DESeq2结果的火山图(Volcano plot)。X轴代表所有基因的基因表达的log

使用FastQC检查RNA-seq文库质量。使用Kallisto将文库与GrCH38人类转录物组假对齐。我们实现异常读数对齐,其中平均>90%的读数与转录物组对齐。然后使用DESeq2评估差异表达以比较经ABXO-HHH处理的细胞与仅经lipofectamine处理的细胞。

DESeq结果展示GYS1靶标的实质性和显著性敲低。经ABXO-HHH处理的样品中的GYS1表达下调至未处理样品的31%(图2)。GYS1为在ABXO-HHH处理下差异性表达(DE)的所有基因中下调最大的蛋白质编码基因。GYS1也为迄今为止具有最低p值的DE基因,并且调节p值为1e-87.7,所述值小于下一最低调节p值30个数量级以上。

使用BLAST实施潜在脱靶效应的计算机预测。针对从GRCh38转录物组创建的内部BLAST数据库来BLAST比对ABXO-HHH有义序列和反义序列。在通过BLAST鉴别的所有潜在脱靶效应中,仅RAP2C在ABXO-HHH存在下显著下调(图2)且并未超过的log

这些数据共同证实,ABXO-HHH在人类转录物组中为高度特异性siRNA,即使在相对较高浓度下。

寡核苷酸合成、脱保护和退火方案:

在Mermade 12合成器上使用标准亚磷酰胺化学于

反义链的脱保护

在合成之后,使用乙腈(ACN)洗涤载体并于柱中在真空下干燥,并且转移至可紧密密封的1mL螺帽中并使用于氨水溶液中的5%二乙胺溶液在65℃下振荡5小时。通过液相色谱-质谱(LC-MS)检查粗制寡聚物的裂解和脱保护且随后通过IEX-HPLC纯化。

含有马来酰亚胺的寡核苷酸的合成和脱保护

使用经3'氨基修饰的CPG固体载体或经5'氨基修饰的亚磷酰胺来制备含有马来酰亚胺的寡聚物。将载体转移至可紧密密封的1mL小瓶中并使用50/50v/v 40%甲胺水溶液和氨水溶液(AMA)在室温下孵育2小时或在65℃下孵育10分钟以进行裂解和脱保护。通过IEX色谱纯化单链并在马来酰亚胺添加之前使用与反义链相同的条件脱盐。

制备大约20mg/mL于0.05M磷酸盐缓冲液(pH 7.1)中的经胺修饰的有义链,向其中添加10当量溶解于ACN中的马来酰亚胺/N-羟基琥珀酰亚胺(NHS)酯。将NHS酯溶液添加至寡核苷酸水溶液中并在室温下振荡3小时。通过反相色谱(缓冲液B中的含有80%乙腈的20mM三乙基乙酸铵)纯化现有马来酰亚胺缀合的寡核苷酸以防止离子交换缓冲液条件下的马来酰亚胺水解。

在纯化之后,汇集寡核苷酸级分,浓缩,并脱盐。

为避免马来酰亚胺的水解,经由冷冻-干燥使用等摩尔量的每一脱盐单链对有义链和反义链实施双链化。

Centyrin与siRNA缀合、缀合物纯化和分析:通过半胱氨酸特异性化学经由马来酰亚胺使Centyrin缀合至siRNA。使用10mM三(2-羧乙基)膦(TCEP)在室温下还原于PBS中的50-200μM含有半胱氨酸的Centyrin(30分钟)以产生游离硫醇。然后立即将含有游离硫醇的Centyrin与含有马来酰亚胺的siRNA双链体以约1.5:1Centyrin:siRNA的摩尔比率在水中混合。在室温或37℃下孵育2小时之后,使用N-乙基马来酰亚胺(反应混合物中的最终NEM浓度为1mM)终止反应。在两个步骤中纯化缀合物。步骤I:固定化金属亲和色谱(用于加标签蛋白质)或疏水性相互作用色谱(用于无标签蛋白质);用以除去未反应SiRN接头。步骤II-Capto-DEAE;用以除去未反应centyrin。汇集含有缀合物的级分,通过使用透析脱盐来交换至HBS中,并根据需要浓缩。

Centyrin-siRNA缀合物的分析型表征:通过分析技术的组合表征Centyrin-siRNA缀合物。使用SDS-PAGE比较缀合物与游离蛋白质的量。对于SDS-PAGE而言,将4%-20%

Centyrin与siRNA缀合、缀合物纯化和分析:通过半胱氨酸特异性化学经由马来酰亚胺使Centyrin缀合至siRNA。使用10mM三(2-羧乙基)膦(TCEP)在室温下还原于PBS中的50-200μM含有半胱氨酸的Centyrin(30分钟)以产生游离硫醇。然后立即将含有游离硫醇的Centyrin与含有马来酰亚胺的siRNA双链体以约1.5:1 Centyrin:siRNA的摩尔比率在水中混合。在室温或37℃下孵育2小时之后,使用N-乙基马来酰亚胺(反应混合物中的最终NEM浓度为1mM)终止反应。在两个步骤中纯化缀合物。步骤I:固定化金属亲和色谱(用于加标签蛋白质)或疏水性相互作用色谱(用于无标签蛋白质);用以除去未反应SiRN接头。步骤II-Capto-DEAE;用以除去未反应centyrin。汇集含有缀合物的级分,通过使用透析脱盐来交换至HBS中,并根据需要浓缩。

图6:加标签蛋白质的IMAC色谱。对于IMAC而言,使用来自Cytiva的Histrap HP柱(1ml,5ml)。Histrap缓冲液A(结合缓冲液)为于1型H2O中的50mM Tris(pH7.4)、500mM NaCl和10mM咪唑,Histrap缓冲液B(洗脱缓冲液):于1型H2O中的50mM Tris(pH7.4)、500mM NaCl和250mM咪唑。经由样品回路或样品泵将反应样品直接注入到柱上。在施加样品后,使用5-10CV的缓冲液A洗涤柱。通常从分级梯度(0%-100%)开始洗脱。在UV读数为50mAU和更高时,使用级分收集器收集级分并实施峰分裂。

图7:HIC-用于无标签蛋白质(除去过量siRNA)。对于HIC而言,使用来自Cytiva的HiTrap Butyl HP柱(1ml,5ml)。HIC缓冲液A(结合缓冲液)为于1型H2O中的2M硫酸铵、25mM磷酸钠(pH 7.0),而HIC缓冲液B(洗脱缓冲液)为于1型H2O中的25mM磷酸钠(pH 7.0)。使用缓冲液A以1:1的比率稀释缀合反应样品。经由样品回路或样品泵将上文所制备样品注入到柱上。在施加样品后,使用5CV的缓冲液A洗涤柱。通常从0.0%B开始洗脱且然后使用下表10的梯度。在UV读数为50mAU和更高时,使用级分收集器收集级分并实施峰分裂。

表10

开环-为避免经由逆向迈克尔反应(retro-Michael rection)损失负荷,实施马来酰亚胺环水解。将来自histrap(加标签蛋白质)或来自HIC(无标签蛋白质)的汇集级分透析至25mM TRIS(pH 8.9)缓冲液中。将于此缓冲液中的反应液置于37℃孵育振荡器中并保持72小时。通过LC-MS监测反应是否完成。

图8:离子交换色谱(IEX)-用于加标签和无标签蛋白质(除去过量未反应centyrin)。对于IEX色谱而言,使用来自Cytiva的HiTrap Capto DEAE柱(1ml,5ml)。CaptoDEAE缓冲液A(结合缓冲液)为于1型H2O中的25mM Tris(pH 8.8),而所用Capto DEAE缓冲液B(洗脱缓冲液)为于1型H2O中的25mM Tris pH 8.8(1M NaCl)。

经由样品回路或样品泵将开环后样品直接注入到柱上。在施加样品后,使用5-10CV的缓冲液A洗涤柱。通常从0.0%B开始洗脱且然后使用下表11的梯度。

以流过液形式洗脱出未反应蛋白质(其通常为第一峰)且第二峰通常为纯缀合物。收集所有级分并汇集。通过使用Nanodrop测量A260来确定汇集液的浓度以计算产率。

表11

图9:centyrin-寡核苷酸缀合物的分析型SEC的实例。通过分析技术的组合表征Centyrin-siRNA缀合物。使用分析型SEC分析Centyrin-siRNA缀合物的纯度和聚集状态。使用Waters H类UPLC以及Waters ACQUITY UPLC蛋白质BEH SEC柱(125A,1.7μm,4.6X150mm)来进行常规SEC分析。通常,使用自动采样仪注入2-5ul样品,流速为0.25ml/min且所用流动相为1X PBS或100mM(pH 7.2)磷酸盐缓冲液。

图10:缀合物的SDS PAGE凝胶的实例。使用SDS-PAGE比较缀合物与游离蛋白质的量。为实施SDS-PAGE凝胶,使用Invitrogen微型凝胶槽、PowerEase

在多种浓度下将候选siRNA序列转染至人类细胞(H358)中。在转染后24小时收获RNA并经由定量逆转录聚合酶链反应(RT-PCR)分析GYS1水平。使用18S核糖体RNA作为RT-PCR内源对照基因。将敲低程度与未处理细胞进行比较。使用Graphpad Prism软件计算EC50值且Emax值代表所观察的最大百分比的GYS1 mRNA敲低(表5)。

表5

还如上所述来测试其他siRNA且其EC50提供于表6中。

表6

通过在一系列浓度下将siRNA转染至人类细胞(HEK-293)中来评估候选siRNA序列的选择性。在转染后72小时使用CellTiterGlo评估细胞活力。Emax值报告为在所测试最高siRNA浓度(10nM)下细胞活力的最大减小百分比(表7)。

表7

实施例2:结合CD71的III型纤连蛋白(FN3)结构域的选择

用于鉴别结合至CD71且不抑制转铁蛋白结合至CD71的FN3结构域的淘选和生物化学筛选方法。为筛选特异性结合CD71且不抑制转铁蛋白结合至CD71的FN3结构域,将经链霉抗生物素蛋白(streptavidin)包被的Maxisorp板(Nunc目录号:436110)在Starting BlockT20(Pierce)中封闭1小时且然后使用生物素化CD71(使用与淘选中相同的抗原)或阴性对照(不相关Fc融合性重组蛋白和人血清白蛋白)在转铁蛋白存在下包被1小时或用结合至CD71转铁蛋白结合位点的FN3蛋白包被。转铁蛋白的浓度为最高35μM。不受限于任何特定理论,包括转铁蛋白或结合至CD71转铁蛋白结合位点的FN3蛋白有助于选择那些不与转铁蛋白竞争结合至CD71或抑制所述结合的FN3结构域。使用TBST冲洗板,并且将经稀释裂解物施加至板中并保持1小时。在额外冲洗后,使用与HRP缀合的抗V5标签抗体(Abcam,ab1325)将孔处理1小时且然后使用POD(Roche,11582950001)进行分析。对FN3结构域裂解物中ELISA信号至少10倍于链霉抗生物素蛋白对照的信号的DNA进行测序,从而获得从筛选中分离的FN3结构域序列。

实施例3:结合CD71且不与转铁蛋白竞争的III型纤连蛋白(FN3)结构域的选择

为鉴别不与转铁蛋白竞争或竞争性最小的结合CD71的FN3结构域,设计偏向性CIS展示策略。简言之,使用在对人类CD71的ECD淘选5轮之后恢复的输出(实施例3)。如实施例3中所阐述再实施几轮解离速率选择,并且增加以下步骤:1)洗涤步骤,在最终洗脱步骤之前使用人类全转铁蛋白洗脱与转铁蛋白结合于相同位点的Centyrin,或2)使用单克隆抗体OKT9洗脱FN3结构域结合剂。如先前所阐述,对从转铁蛋白洗涤策略和OKT9洗脱策略回收的FN3结构域实施PCR扩增并克隆至pET载体中。通过ELISA证实,228个特异性结合huCD71的FN3结构域结合至huCD71 ECD。通过SEC分析独特结合剂的子组,使其缀合至MMAF并经由细胞活力测定在含有/不含全人类转铁蛋白的SKBR-3细胞中评估内化。发现多肽由受体内化。

Integral Molecular实施膜蛋白质组阵列(MPA)测定以描述ABX1198(SEQ ID NO:509)和ABX1100(SEQ ID NO:509+具有接头编号OOOO的siRNA对)针对人类膜蛋白文库的特异性。MPA文库含有6000多种人类膜蛋白,包含94%的所有单通、多通和GPI锚定蛋白质(包含GPCR、离子通道和转运蛋白),其中每一膜蛋白独特表达于禽类QT6细胞背景中。使用流式细胞术直接检测配体(FN3结构域)与单独地表达于未固定细胞中的膜蛋白的结合。

在具有最佳信号/背景噪声比的浓度(分别为1.25ug/ml、1.25ug/ml和0.31ug/ml)下针对MPA来筛选ABX1198(SEQ ID NO:509)和ABX1100(SEQ ID NO:509+具有接头编号OOOO的siRNA对)。在验证程序中使用配体连续稀释液和用所鉴别靶标单独转染的细胞来追踪在筛选中鉴别的膜蛋白靶标。

实施例4.使用CD71 FN3结构域-寡核苷酸缀合物敲低肌细胞中的mRNA。

使用马来酰亚胺化学经由独特工程化至FN3结构域中的半胱氨酸使结合muCD71的FN3结构域缀合至siRNA寡核苷酸或反义寡核苷酸(ASO)。半胱氨酸取代可为诸如提供于本文中并且还提供于美国专利申请公布第20150104808号(其特此以引用的方式整体并入)中的那些。使用标准化学修饰来修饰siRNA或ASO且证实此使得能够敲低体外靶向mRNA。以最高10mg/kg寡核苷酸有效载荷的剂量向小鼠经静脉内给予FN3结构域-寡核苷酸缀合物。在给药后的不同时间点下,将小鼠处死;回收骨骼肌、心肌和各种其他组织并储存于RNAlater

所测试地FN3-siRNA缀合物如表8中所述。

表8

图4A显示,与单独媒介物相比,使用3种不同FN3结构域-siRNA缀合物可敲低小鼠腓肠肌中的GYS1 mRNA。在功效研究中,从Jackson实验室获得雄性GAA-/-小鼠(年龄为4-5周)。根据IACUC方案来治疗所有动物。5只动物接受5.4mg/kg三种不同FN3结构域-siRNA缀合物(3mpk Gys1siRNA)或媒介物的单一尾静脉静脉内浓注。在单一剂量之后4周,对小鼠实施安乐死,将腓肠肌收集于RNAlater中,储存于4℃下过夜并在-80℃下冷冻。使用Qiagen’sRNeasy纤维组织试剂盒从腓肠肌分离总RNA。使用实时、定量PCR分析靶Gys1和内源对照(Pgki、Ubc、Hprti和Ahai)的表达水平。使用ΔΔCt方法分析数据,并归一化至仅给予媒介物的对照动物。通过将剩余Gys1 mRNA水平百分比减去100来测量FN3结构域-siRNA缀合物治疗组中的Gys1 mRNA的敲低百分比。在GraphPad Prism软件中使用单因素ANOVA与邓尼特多重比较测试(Dunnett’s multiple comparison test)来计算统计学显著性。统计学显著性以星号显示于图上,***p<0.001。

图4B显示,与单独媒介物相比,使用3种不同FN3结构域-siRNA缀合物可敲低小鼠腓肠肌中的GYS1蛋白。通过将腓肠肌在RIPA缓冲液中均质化来对腓肠肌实施GYS1蛋白量化。使用Bradford测定测量腓肠肌中的蛋白质浓度。使用制造商用于12-230kDa Jess分离模块(SM-W004)的标准方法来量化Gys1水平。通过使用protein Simple的专属光活化捕获化学固定于毛细管上来分离蛋白质。使用以1:100稀释的抗Gys1一级抗体。使用过氧化物/发光胺-S确立化学发光揭示。使用Compass的Simple Western软件捕获毛细管化学发光的数字影像,所述软件自动测量高度(化学发光强度)、面积和信号/噪声比。内部系统包括于每一运行中。将FN3结构域-siRNA缀合物治疗组的峰面积值归一化至媒介物处理组织,并且通过将剩余Gys1蛋白水平百分比减去100来测量治疗组中的Gys1蛋白的敲低百分比。在GraphPad Prism软件中使用单因素ANOVA与邓奈特多重对比测试来计算统计学显著性。统计学显著性以星号显示于图上,***p<0.001。

图5显示,与针对不同靶标(AHA-1)的siRNA相比,在使用3种不同FN3结构域-siRNA缀合物时骨骼肌的GYS1敲低具有高度特异性。从Jackson实验室获得雄性GAA-/-小鼠(年龄为8-9周)。根据IACUC方案来治疗所有动物。三只动物接受17.9mg/kg三种不同FN3结构域-siRNA缀合物(10mpk Gys1siRNA)、17.9mg/kg一种FN3结构域-siRNA缀合物(10mpk Aha1siRNA)或媒介物的单一尾部静脉静脉内浓注。在单一剂量之后两周,对小鼠实施安乐死。将腓肠肌、四头肌、横膈膜、心脏、肝和肾组织收集于RNAlater中,储存于4℃下过夜并在-80℃下冷冻。使用Qiagen’s RNeasy纤维组织试剂盒从所述组织分离总RNA。使用实时、定量PCR分析靶Gys1/Aha1和内源对照(Pgk1)的表达水平。使用ΔΔCt方法分析数据,并归一化至仅给予媒介物的对照动物。

实施例5:比较经ABX-HHH处理的细胞与未处理细胞的RNA-seq实验。

在使用10nM ABXO-HHH脂转染HEK293T细胞24小时之后对polyA+选择的mRNA实施mRNA测序。对每一处理的6个复制品进行测序直至平均深度>30百万个读数。使用Kallisto将文库与GRCh38转录物组假对齐且比对率>90%。使用DESeq2生成此火山图中的值以比较经ABXO-HHH处理的RNA-seq文库与未处理细胞。图2的绘图中的每一点代表所测量的基因表达变化。X轴代表所有基因的基因表达的log

实施例6:CD71 FN3结构域siRNA缀合物的结合特异性。

Integral Molecular(www.integralmolecular.com)实施其专属膜蛋白质组阵列(MPA)测定以描述CD71 FN3结构域和CD71 FN3结构域siRNA缀合物针对人类膜蛋白文库的特异性(图3)。MPA含有6000多种人类膜蛋白,涵盖94%的所有单通、多通和GPI锚定蛋白质(包含GPCR、离子通道和转运蛋白),其中每一膜蛋白独特表达于禽类QT6细胞背景中。使用流式细胞术直接检测FN3结构域与单独地表达于未固定细胞中的膜蛋白的结合。

在具有最佳信号/背景噪声比的浓度(分别为1.25ug/ml或0.31ug/ml)下针对MPA来筛选FN3结构域和FN3结构域-siRNA缀合物。使用配体连续稀释液在独特表达所鉴别靶标的细胞上验证在筛选中鉴别的膜蛋白靶标。

一般方法

分子生物学中的标准方法阐述于以下文献中:Sambrook、Fritsch和Maniatis(1982和1989年第2版,2001年第3版)Molecular Cloning,A Laboratory Manual,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY;Sambrook和Russell(2001)Molecular Cloning,第3版,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY;Wu(1993)Recombinant DNA,第217卷,Academic Press,San Diego,CA)。步骤方法也出现于以下文献中:Ausbel等人(2001)Current Protocols in Molecular Biology,第1-4卷,John Wiley and Sons,Inc.New York,NY,其阐述在细菌细胞中的克隆和DNA诱变(第1卷)、哺乳动物细胞和酵母中的克隆(第2卷)、糖缀合物和蛋白质表达(第3卷)和生物信息学(第4卷)。

描述了包括免疫沉淀、色谱、电泳、离心和结晶的蛋白质纯化的方法(Coligan等人(2000)Current Protocols in Protein Science,第1卷,John Wiley and Sons,Inc.,NewYork)。描述了化学分析、化学修饰、翻译后修饰、融合蛋白的产生、蛋白质的糖基化(参见例如Coligan等人(2000)Current Protocols in Protein Science,第2卷,John Wiley andSons,Inc.,New York;Ausubel等人(2001)Current Protocols in Molecular Biology,第3卷,John Wiley and Sons,Inc.,NY,NY,第16.0.5-16.22.17页;Sigma-Aldrich,Co.(2001)Products for Life Science Research,St.Louis,MO;第45-89页;AmershamPharmacia Biotech(2001)BioDirectory,Piscataway,N.J.,第384-391页)。描述了多克隆和单克隆抗体的产生、纯化和片段化(Coligan等人(2001)Current Protcols inImmunology,第1卷,John Wiley and Sons,Inc.,New York;Harlow和Lane(1999)UsingAntibodies,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY;Harlow和Lane,同上)。可利用表征配体/受体相互作用的标准技术(参见例如Coligan等人(2001)Current Protocols in Immunology,第4卷,John Wiley,Inc.,New York)。

本文所引用的所有参考文献均以引用的方式并入,其并入程度如同每一个别出版物、数据库条目(例如基因库序列或GeneID条目)、专利申请或专利均具体地且单独地指示以引用的方式并入一般。申请者意欲依照37 C.F.R.§1.57(b)(1)使以引用的方式并入的此声明涉及每一和所有单独出版物、数据库条目(例如Genbank序列或GeneID条目)、专利申请或专利(其各自均按照37 C.F.R.§1.57(b)(2)明确鉴别),即使这种引用未紧随以引用的方式并入的专用声明。以引用的方式并入的专用声明(如果存在)包括在说明书内并不以任一方式减弱以引用的方式并入的此一般声明。本文参考文献的引用并不意欲承认参考文献为相关先前技术,其也不欲构成对这些出版物或文件的内容或日期的任何承认。

本发明实施方案在范围上并不受限于本文所述的特定实施方案。实际上,除本文所述的修改外,本领域技术人员依据前述说明还将明了所述实施方案的各种修改。此类修改意欲在随附权利要求书的范围内。

认为上述书面说明足以使得本领域技术人员实践实施方案。实际上,除本文所展示和描述的那些外,本领域技术人员根据上述说明将明了实施方案的各种修改,并且所述修改在随附权利要求书的范围内。

技术分类

06120116576169