掌桥专利:专业的专利平台
掌桥专利
首页

与大豆中疾病抗性相关联的新颖的抗性基因

文献发布时间:2023-06-19 19:30:30


与大豆中疾病抗性相关联的新颖的抗性基因

发明领域

本披露涉及用于使用新颖的抗性基因来鉴定、选择和产生增强的疾病和/或病原体抗性植物的组合物和方法。

相关申请

本申请要求于2020年6月22日提交的美国临时专利申请号63/042101的优先权。

关于提交序列表的声明

提供ASCII文本格式的序列表作为纸质副本的替代,该序列表是根据37 C.F.R.§1.821提交的,名称为“82139_seqlist_ST25”,于2021年6月22日生成,大小为约122kb,并且经由EFS-Web提交。这个序列表特此通过引用以其披露内容并入本说明书中。

背景技术

已知植物病原体对重要作物造成相当大的损害,这导致显著的农业损失,伴随着对依赖植物材料的食物供应和其他工业的广泛的后果。同样,申请人期望降低农业病原体对作物产生的发病率和/或影响。

若干种病原体与对大豆的损害相关联,该损害在美国和全世界范围内单独地和共同地有可能造成重大的产量损失。示例性病原体包括但不限于真菌(例如,疫霉(Phytophthora)属和亚洲大豆锈病豆薯层锈菌(Phakopsora pachyrhizi))、线虫(例如,根结线虫(Meloidogyne)属,特别是爪哇根结线虫(Meloidogyne javanica))和大豆茎溃疡病。鉴于这些病原体存在对全球食物供应的显著威胁以及与处理大豆作物以预防产量损失相关联的时间和花费,需要用于产生病原体抗性大豆栽培品种的新方法。申请人因此期望可以引入商业大豆植物以控制大豆病原体的新颖的抗性基因。

发明内容

本概述列出了本披露主题的若干实施例,并且在许多情况下列出了这些实施例的变化和排列。

提供了用于鉴定、选择和产生具有增强的疾病抗性的大豆属(Glycine)植物(包括野生大豆属,例如,灰色大豆(Glycine canescens)、澎湖大豆(Glycine clandestine)、短绒野大豆(Glycine tomentella)和大豆(Glycine max)品系)的组合物和方法。还提供了疾病抗性大豆植物和种质。在一些实施例中,提供了产生疾病抗性大豆植物的方法。

在本发明的一个方面,提供了DNA构建体,该DNA构建体包含在植物细胞中起作用的可操作地连接到选自RG21基因和RG22基因中至少一种的新颖的抗性基因的启动子。在本发明的又一方面,提供了含有DNA构建体的转基因植物,其中该转基因植物对大豆病原体,特别是亚洲大豆锈病(ASR)具有抗性。RG21和RG22基因可因实施例而变化。RG21基因可以包括例如编码与SEQ ID NO:1具有至少70%-100%序列同一性的蛋白质的基因。类似地,RG22基因可以变化,并且可以包括编码与SEQ ID NO:12具有至少70%-100%序列同一性的蛋白质的基因。

本发明的另一方面是制备可育转基因植物的方法,该方法包括提供包含RG21基因和RG22基因中至少一种的植物表达盒,并在允许受体细胞摄取该植物表达盒的条件下使这些受体植物细胞与该植物表达盒接触;选择含有该植物表达盒的受体植物细胞;从所选择的受体植物细胞再生植物;并且鉴定对大豆病原体,特别是ASR有抗性的可育转基因植物。

在本发明的另一方面,提供了可育转基因植物,其包含含有RG21基因和RG22基因中至少一种的植物表达盒,并且其中该植物对大豆病原体,特别是ASR具有抗性。

在本发明的另一方面,提供了在田间控制ASR的方法,该方法包括种植来自包含RG21基因和RG22基因中至少一种的植物的种子的步骤。

因此,本披露主题的一个目的是提供用于将病原体抗性传递到非抗性大豆种质或植物品系的方法。

此外,当前披露的主题提供了新颖的大豆品系,其在其基因组中包含源自野生大豆属物种(例如灰色大豆或澎湖大豆或短绒野大豆)的RG21基因和RG22基因中的至少一种,并进一步赋予所述新颖的大豆品系的ASR抗性。还提供了通过本发明的方法鉴定、产生或选择的大豆植物和/或种质,以及源自通过这些方法鉴定、产生或选择的大豆植物或种质的任何子代或种子。

作为另一方面,本发明涵盖转基因植物,其包含植物细胞、植物部分、核苷酸序列、表达盒、载体和/或RG21基因和RG22基因中的至少一种。

作为另外的方面,涉及产生本发明的转基因植物的种子和由本发明的转基因植物产生的种子。

还提供了源自本发明的转基因植物的收获产物,其中该收获产物任选地包含核苷酸序列、表达盒、载体和/或RG21基因和RG22基因中的至少一种。进一步提供了源自本发明的收获产物的加工产物,其中该收获产物任选地包含核苷酸序列、表达盒、载体和/或RG21基因和RG22基因中的至少一种。

更进一步,本披露作为另外的方面,提供了产生对大豆病原体具有增加的抗性的转基因植物的方法。在实施例中方法包括向植物中引入本发明的多核苷酸、表达盒或载体,其中RG21基因和RG22基因中的至少一种在该植物中表达,从而产生对大豆病原体具有增加的抗性的转基因植物。任选地,引入步骤包括:(i)用多核苷酸、表达盒或载体转化植物细胞并且再生转基因植物;或者(ii)使包含多核苷酸、表达盒或载体的第一植物与第二植物杂交。在一些实施例中,引入可以通过手动渗入外源基因以产生非存活的非天然胚胎并且化学拯救该胚胎来实现。在实施例中,方法进一步包括产生来自转基因植物的种子。在实施例中,方法进一步包括从转基因植物中获得子代植物,其中该子代植物包含多核苷酸、表达盒或载体,表达RG21基因和RG22基因中的至少一种,并且对大豆病原体具有增加的抗性。

作为再一方面,本发明提供了产生对大豆植物病原体(例如亚洲大豆锈病)具有增加的抗性的转基因植物的方法,该方法包括:(a)种植包含本发明的多核苷酸、表达盒或载体的种子;和(b)使来自该种子的转基因植物生长,其中该转基因植物包含该多核苷酸、表达盒或载体并产生RG21基因,并且对大豆病原体具有增加的抗性。在实施例中,方法进一步包括:(c)收获来自(b)的转基因植物的种子,其中所收获的种子包含该多核苷酸、表达盒、载体和/或RG21基因和RG22基因中的至少一种。

更进一步,作为另一方面,本发明提供了产生种子的方法。在实施例中,方法包括:(a)提供包含本发明的多核苷酸、表达盒或载体的转基因植物;和(b)收获来自(a)的转基因植物的种子,其中所收获的种子包含该多核苷酸、表达盒或载体和/或RG21基因和RG22基因中的至少一种。

本发明进一步考虑到产生杂交植物种子的方法。在代表性实施例中,方法包括:(a)使第一近交植物(其是包含本发明的多核苷酸、表达盒或运载体的转基因植物)与不同近交植物(其可以包含或不包含本发明的多核苷酸、表达盒或运载体)杂交;和(b)允许形成杂交种子。

本发明还涉及使用本发明的多核苷酸的方法,例如在DNA构建体或表达盒或载体中用于在生物(包括植物)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(如植物)中表达的天然的或合成的序列。

在实施例中,本发明提供了使用本发明的多核苷酸、表达盒或载体以产生转基因种子的方法,其中该转基因种子生长成对大豆病原体具有增加的抗性的转基因植物。

上述的以及本发明的其他目的和方面将在以下阐述的附图和说明中进行详细解释。

附图说明

图1是含有RG21基因的载体25307的图示。

图2显示了对从载体25307生成的初级大豆事件收集的叶进行的锈病生物测定实验的照片。

图3是显示锈病1的生物测定真菌生物量定量结果的图。

图4是显示锈病2和锈病3的生物测定真菌生物量定量结果的图。

图5是载体25374的图示。

图6是载体VC24965的图示。

图7是显示RG21基因的相对表达(y轴)的图,包括在含有RG21基因和不含有RG21基因的转基因大豆中。

图8是含有RG22基因的载体25190的图示。

图9是显示从载体25190产生的几个初级大豆事件中获得的锈病定量的图。

序列表的简要说明

SEQ ID NO:1是RG21基因的氨基酸序列。

SEQ ID NO:2是RG21基因的DNA序列。

SEQ ID NO:3-4是包含RG21基因的示例性载体。

SEQ ID NO:6-8是适用于驱动RG21基因表达的示例性启动子。

SEQ ID NO:9-11是用于检测RG21的测定组分。

SEQ ID NO:12是RG22基因的氨基酸序列。

SEQ ID NO:13是RG22基因的DNA序列。

SEQ ID NO:14是包含RG22基因的示例性载体。

具体实施方式

本披露的主题涉及用于将新颖抗性基因(RG21和/或RG22基因)引入商业大豆植物以控制大豆病原体的组合物和方法。在一些实施例中,方法涉及用编码本发明的RG21和/或RG22基因的核苷酸序列转化生物体。本发明的核苷酸序列可用于制备表现出对大豆病原体,特别是亚洲大豆锈病(本文中,“ASR”)增加的抗性的植物。因此,提供了转化的植物、植物细胞、植物组织和种子。组合物包括与大豆病原体抗性植物以及转化的植物、植物组织和种子有关的核酸和蛋白质。披露了RG21和RG22基因的核苷酸序列和由此编码的蛋白质的氨基酸序列。序列可用于构建表达载体以随后转化到目的植物中,作为分离其他RG21和RG22基因的探针等。

通过将提供抗性的DNA分子插入植物基因组中,有可能产生大豆病原体抗性植物(Cook等人,2012年,关于SCN抗性;Kawashima等人,2016年,关于来自木豆的大豆锈病抗性)。

本说明不旨在是可以实施本发明的所有不同方式或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明预期了,在本发明的一些实施例中,可以排除或省略本文陈述的任何特征或特征的组合。此外,鉴于本披露内容,本文建议的不同实施例的众多变化以及增加物对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。

下面列出的所有参考文献、以及在即时披露中引用的所有参考文献,包括但不限于所有专利、专利申请及其出版物、科学杂志上的文章以及数据库条目(例如,

本文提供的核苷酸序列以5'至3'方向从左至右表示,并且使用代表核苷酸碱基的标准代码表示,如37 CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述,例如:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。

氨基酸同样是使用WIPO标准ST.25来指示,例如:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;1)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。

定义

除非另外定义,本文使用的所有技术和科学术语具有与本披露主题所属领域的普通技术人员通常所理解的相同的意义。

尽管认为以下术语可以很好地为本领域的普通技术人员所理解,但是提出以下定义是为了使本披露主题容易理解。

如在本发明的说明书和所附的权利要求中所使用的,单数形式“一个”、“一种”和“该/所述(the)”旨在也包括复数形式,除非上下文清楚地另外指示。

如本文所使用的,“和/或”是指并且涵盖一个或多个相关的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。

如本文所使用的,术语“约”当是指一个可测量的值如剂量或时间段等时意在涵盖±20%、±10%、±5%、±1%、±0.5%、或甚至±0.1%的指定量的变化。如本文所使用的,短语如“在约X和Y之间”意指“在约X和约Y之间”,并且短语如“从约X至Y”意指“从约X至约Y”。

除非上下文另有说明,如本文所使用的,例如“在约X和Y之间”、“在约X和约Y之间”、“从X至Y”和“从约X至约Y”(以及类似短语)的短语应被解释为包括X和Y。

“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。在实施例中,RNA随后被翻译以产生蛋白质。

如本文所使用的,“密码子优化的”核苷酸序列意指重组的、转基因的、或合成的多核苷酸的核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以如下方式来完成,该方式是为了保持由密码子优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,针对构建体有待在其中进行表达的细胞(例如,动物、植物、真菌或细菌细胞)对核苷酸序列进行密码子优化。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014。在实施例中,本发明的多核苷酸被密码子优化用于在植物细胞(例如,双子叶植物细胞或单子叶植物细胞)或细菌细胞中表达。

术语“包含(comprise)”、“包含(comprises)”或“包含(comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、和/或其组的存在或添加。

如本文所使用的,过渡短语“基本上由……组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。

如本文所使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种目的多核苷酸(如编码本发明的蛋白的RG21或RG22基因多核苷酸)的表达的核酸分子,该核酸分子包含可操作地连接至目的多核苷酸(其可操作地连接至终止信号)的启动子。“表达盒”还典型地包含另外的多核苷酸以促进目的多核苷酸的正确翻译。表达盒还可以包含与目的多核苷酸的表达无关的但是由于用于从表达载体去除表达盒的方便限制位点而存在的其他多核苷酸。在实施例中,表达盒中的至少一种组分相对于至少一种其他组分(例如,与目的多核苷酸可操作相关联的异源启动子)可以是异源的(即外来的)。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,表达盒相对于宿主是异源的,即该表达盒(或甚至目的多核苷酸)不是天然存在于宿主细胞中的,并且已经通过转化方法或育种方法引入到该宿主细胞或其祖先细胞中。该表达盒中的一个或多个目的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的(如本文更详细描述的)。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。

“基因”在本文定义为包括一个或多个多核苷酸的遗传单位,该遗传单位占据染色体或质粒上特定位置并且包含用于生物中的特定特征或性状的遗传指令。

如本文所使用的,关于植物的术语“引入”意指以任何方式完成,该方式包括但不限于:基因渗入、转基因、规律成簇的间隔短回文重复修饰(CRISPR)、转录激活子样效应子核酸酶(TALEN)(Feng等人2013,Joung和Sander 2013)、大范围核酸酶或锌指核酸酶(ZFN)。

如本文所使用的,术语“野生大豆属”是指多年生大豆属植物,例如灰毛大豆(G.canescens)、银毛大豆(G.argyrea)、澎湖大豆(G.clandestine)、G.latrobeana、白色大豆(G.albicans)、G.aphyonota、沙生大豆(G.arenaria)、弯大豆(G.curvata)、弯裂片大豆(G.cyrtoloba)、扁豆荚大豆(G.dolichocarpa)、镰状大豆(G.falcate)、G.gracei、密毛大豆(G.hirticaulis)、乳绿大豆(G.lactovirens)、阔叶大豆(G.latifolia)、小叶大豆(G.microphylla)、蒙蒂-道格拉斯大豆(G.montis-douglas)、G.peratosa、G.pescadrensis、G.pindanica、G.pullenii、黄紫大豆(G.rubiginosa)、G.stenophita、G.syndetika、或短绒野大豆中任一种。

如本文所使用的,术语“等位基因”是指在特定基因座处出现的两个或更多个不同核苷酸或核苷酸序列中的一个。

当标记与性状连锁并且当标记的存在指示了所希望的性状或性状形式是否会和/或会以什么程度发生在包含标记的植物/种质中时,则该标记与该性状“相关联”。类似地,当标记与等位基因连锁并且当标记的存在指明了等位基因是否存在于包含标记的植物/种质中时,则该标记与该等位基因“相关联”。例如,“与增强的病原体抗性相关联的标记”是指其存在或不存在可用于预测植物是否和/或在何种程度上显示病原体抗性表型的标记。

如本文所使用的,术语“回交”和“回交的”是指一种方法,凭借该方法将子代植物反复与其亲本之一回交。在回交方案中,“供体”亲本是指具有待基因渗入的所期望的等位基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座被基因渗入其中的亲本植物。例如,参见Ragot,M.等人Marker-assisted Backcrossing:A Practical Example[标记辅助回溯:实践实例],Techniqueset Utilisations des Marqueurs Moleculaires Les Colloques,第72卷,第45-56页(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding[回交育种中的标记辅助选择],Proceedings of the Symposium“Analysis of Molecular MarkerData”[专题讨论会会议记录“分子标记数据分析”],第41-53页(1994)。初始杂交产生F1代。术语“BC1”是指第二次使用轮回亲本,“BC2”是指第三次使用轮回亲本,以此类推。

厘摩(“cM”)是重组频率的度量单位。一个cM等于有1%的机会,一个遗传基因座处的标记会由于单代中的交换而与第二基因座处的标记分离。

如本文所使用的,关于特定基因座和/或等位基因使用的术语“由……定义并包括其的染色体区间”是指由基因座/等位基因限定并涵盖基因座/等位基因的染色体区间。

如本文所使用的,术语“杂交(cross)”或“经杂交的(crossed)”是指通过授粉融合配子以产生子代(例如,细胞、种子或植物)。该术语涵盖有性杂交(一个植物由另一个授粉)和自交(自花授粉,例如当花粉和胚珠是来自同一植物时)两者。术语“使杂交(crossing)”是指通过授粉使配子融合以产生子代的行为。

如本文所使用的,术语“栽培品种”和“品种”是指可以通过结构或遗传特点和/或表现与相同物种内的其他品种区别开的一组相似的植物。

如本文所使用的,术语“所希望的等位基因”、“有利等位基因”和“目的等位基因”可互换使用以指与所希望的性状(例如ASR抗性)相关联的等位基因。

如本文所使用的,术语“增强的病原体抗性”或“增强的疾病抗性”是指与一种或多种对照植物(例如,亲本中的一个或两个、或缺乏与针对对应的病原体/疾病的增强的病原体抗性相关联的标记的植物)相比,尽管感染了疾病(例如亚洲大豆锈病),植物的耐受和/或繁殖能力的改善、增强或增加。增强的疾病抗性包括减少指示对应的疾病(如亚洲大豆锈病、大豆胞囊线虫、疫霉菌等)感染的症状的表达的任何机制(除了全株植物免疫或抗性)。

“优良品系”或“优良品种”是农艺学上有优势的品系,该品系是从针对有优势的农艺学表现的许多个周期的选育而产生的。众多的优良品系是可获得的并且对于大豆育种领域的普通技术人员是已知的。“优良群体”是一类优良个体或品系,其可以用来代表在给定作物物种(如大豆)的农艺学上有优势的基因型方面的现有技术。类似地,“优良种质”或种质的优良品种是农艺学上有优势的种质,典型地源自和/或能够产生具有有优势的农艺学表现的植物,例如现有的或新开发的大豆优良品系。

“优良”植物是来自优良品系的任何植物,因此优良植物是来自优良品种的代表性植物。农民或大豆育种者可商购的优良大豆品种的非限制性实例包括:AG00802、A0868、AG0902、A1923、AG2403、A2824、A3704、A4324、A5404、AG5903、AG6202、AG0934;AG1435;AG2031;AG2035;AG2433;AG2733;AG2933;AG3334;AG3832;AG4135;AG4632;AG4934;AG5831;AG6534;和AG7231(阿斯格罗种子公司(Asgrow Seeds),德梅因(Des Moines),爱荷华州,美国);BPR0144RR、BPR 4077NRR和BPR 4390NRR(生物植物研究所(Bio Plant Research),营点(Camp Point),伊利诺伊州,美国);DKB17-51和DKB37-51(迪卡白遗传公司(DeKalbGenetics),迪卡尔布(DeKalb),伊利诺伊州,美国);DP 4546RR、和DP 7870RR(三角洲和松树陆地公司(Delta&Pine Land Company),卢博克市(Lubbock),德克萨斯州,美国);JG03R501、JG 32R606C ADD和JG 55R503C(JGL有限公司(JGL Inc.),格林卡斯尔(Greencastle),印第安纳州,美国);NKS 13-K2(先正达种子公司NK部门(NK Division ofSyngenta Seeds),黄金谷(Golden Valley),明尼苏达洲,美国);90M01、91M30、92M33、93M11、94M30、95M30、97B52、P008T22R2;P16T17R2;P22T69R;P25T51R;P34T07R2;P35T58R;P39T67R;P47T36R;P46T21R;和P56T03R2(先锋良种国际有限公司(Pioneer Hi-BredInternational),庄士敦(Johnston),爱荷华州,美国);SG4771NRR和SG5161NRR/STS(大豆遗传学有限责任公司(Soygenetics,LLC,),拉斐特(Lafayette),印第安纳州,美国);S00-K5、S11-L2、S28-Y2、S43-B1、S53-A1、S76-L9、S78-G6、S0009-M2;S007-Y4;S04-D3;S14-A6;S20-T6;S21-M7;S26-P3;S28-N6;S30-V6;S35-C3;S36-Y6;S39-C4;S47-K5;S48-D9;S52-Y2;S58-Z4;S67-R6;S73-S8;和S78-G6(先正达种子公司,亨德森市(Henderson),肯塔基州,美国);Richer(北极星种业有限责任公司(Northstar Seed Ltd.),亚伯达省(Alberta),加拿大);14RD62(斯汀种子公司(Stine Seed Co.),爱荷华州,美国);或Armor 4744(阿莫尔种子有限责任公司(Armor Seed,LLC),阿拉斯加州,美国)。

如本文所使用的,术语“农艺学上优良的”意指具有许多可区分性状(例如出苗、活力、营养活力、疾病抗性、结实(seed set)、可立性、产量和脱粒性)的基因型,其允许生产者收获具有商业意义的产物。

如本文所使用的,术语“商业上显著的产量”或“农艺学上可接受的产量”是指商业对比(check)品种如AG2703或DKB23-51的至少100%的谷物产量。

“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源性的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于生物体中的或对生物体来说是内源性的mRNA。

术语“核酸”、“核酸分子”、“核苷酸序列”、“寡核苷酸”以及“多核苷酸”本文可以互换地使用,除非上下文另外指示,并且是指核苷酸的杂聚物。这些术语包括但不限于DNA和RNA分子,包括cDNA、基因组DNA、合成的(例如,化学合成的)DNA和RNA、质粒DNA、mRNA、反义RNA和RNA/DNA杂交体,其中的任一项都可以是线状的或分支的、单链的或双链的、或其组合。当合成地产生dsRNA时,较少见的碱基,如肌苷,5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤和其他也可以用于反义、dsRNA和核酶配对作用。例如,已经显示含有尿苷和胞苷的C-5丙炔类似物的多核苷酸以高亲和力结合RNA并且是基因表达的强力反义抑制剂。也可以作出其他修饰,如修饰磷酸二酯主链或RNA的核糖基团中的2'-羟基。在实施例中,“核酸”、“核酸分子”、“核苷酸序列”、“寡核苷酸”或“多核苷酸”是指DNA。

如本文所使用的“可操作地连接”或“可操作地相关联”意指所指定的元件是彼此功能上相关的,并且还通常是物理相关的。因此,如本文所使用的术语“可操作地连接的”或“可操作地相关联的”是指在功能上相关联的一个单一核酸分子上的核苷酸序列。因此,可操作地连接至第二核苷酸序列的第一核苷酸序列是指当该第一核苷酸序列被放入与该第二核苷酸序列的功能关系中时的情况。例如,如果启动子影响核苷酸序列的转录或表达,则该启动子与所述核苷酸序列可操作地相关联。本领域普通技术人员将理解,控制序列(例如启动子)不需要和与其可操作地相关联的核苷酸序列邻接,只要该控制序列能发挥指导其表达的功能。因此,例如,介入未翻译的、已转录的序列可以存在于启动子与核苷酸序列之间,并且该启动子仍可以被认为“可操作地连接至”该核苷酸序列上或与该核苷酸序列“可操作地相关联”。

如本文所使用的,术语“疾病耐受性”和“疾病抗性”是指尽管感染了对应的疾病,植物的耐受和/或繁殖能力。当关于种质使用时,这些术语是指尽管感染了对应的疾病,由该种质产生的植物的耐受和/或繁殖能力。在一些实施例中,感染的疾病抗性大豆植物可以与未感染的大豆植物一样(或几乎同样)产生。通常,如果植物或种质显示“增强的病原体抗性”,则标记为“疾病抗性”。

如本文所使用的,术语“内源性”是指起源于生物体或细胞内的物质。“外源性”是指起源于生物体或细胞外部的物质。这典型地适用于在生产经转化或转基因宿主细胞和植物中使用的核酸分子。

如本文所使用的,术语“外来的”、“外来的品系”和“外来的种质”是指不是优良的任何植物、品系或种质。通常,外来的植物/种质不是源自任何已知的优良植物或种质,而是选择的以将一个或多个所希望的遗传元件引入育种程序(例如,将新颖的等位基因引入育种程序中)。

如本文所使用的,“遗传图谱”是对给定物种内的一个或多个染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格形式描绘。对于每个遗传图谱,基因座之间的距离是通过它们之间的重组频率来测量的。基因座之间的重组可以使用各种标记来检测。遗传图谱是定位群体、所用标记的类型以及不同群体之间每个标记的多态性潜力的产物。一个遗传图谱与另一个遗传图谱的基因座之间的顺序和遗传距离可以不同。

如本文所使用的,术语“基因组”适用于植物细胞时不仅涵盖细胞核内发现的染色体DNA,还涵盖细胞的亚细胞组分内发现的细胞器DNA。术语“基因”是指包含染色体DNA、质粒DNA、cDNA、人工DNA多核苷酸或转录成RNA分子的其他DNA(其中该RNA可以编码肽、多肽或蛋白质)的多核苷酸,以及编码序列侧翼的参与本发明mRNA或多肽表达调节的遗传元件。基因的“片段”是全长多核酸分子的一部分,其至少具有能够转录成RNA、翻译成肽或用作DNA检测方法中的探针或引物的最小长度。

如本文所使用的,术语“基因型”是指与可观察到的和/或可检测的和/或所表现的性状(表型)形成对照,在一个或多个遗传基因座处的个体(或个体组)的遗传组成。基因型由个体遗传自其亲本的一个或多个已知基因座的一个或多个等位基因定义。术语基因型可以用来指单一基因座处、多个基因座处的个体的遗传组成,或者更普遍地,术语基因型可以用来指其基因组中所有基因的个体遗传构成。可以例如使用标记来间接表征基因型和/或通过核酸测序来直接表征基因型。

如本文所使用的,术语“种质”是指属于或来自个体(例如,植物)、个体群体(例如,植物品系、品种或家族)、或源自品系、品种、物种或培养物的克隆的遗传物质。种质可以是生物体或细胞的一部分,也可以与生物体或细胞分离。通常,种质提供了具有特定分子构成的遗传物质,该分子构成提供了对于生物体或细胞培养物的一些或所有遗传品质而言的物理基础。如本文所使用的,种质可以是指可以从中生长新植物的种子、细胞(包括原生质体和愈伤组织)、或组织,以及可以培养成全株植物的植物部分(例如,茎、芽、根、叶等)。

如本文所使用的,“异源DNA”序列是指源自外来来源或物种的多核苷酸序列,或者如果来自相同来源,则从其原始形式修饰的多核苷酸序列。

如本文所使用的,“同源DNA”是指来自与受体细胞相同来源的DNA。

如本文所使用的,术语“杂种”是指当至少两个遗传上不相同的亲本杂交时产生的种子和/或植物。

如本文所使用的,术语“同一性”是指两个多核酸或蛋白质序列之间的相似程度。通过合适的算法执行两个序列的比对。用于进行序列比对的一种被广泛使用和接受的计算机程序是CLUSTALW v1.6(Thompson,等人.Nucl.Acids Res.[核酸研究],22:4673-4680,1994),尽管其他程序通常被使用。将匹配的碱基或氨基酸的数目除以碱基或氨基酸的总数目并乘以100,以获得百分比同一性。例如,如果两个580个碱基对序列具有145个匹配的碱基,则它们会是25%同一的。如果两个进行比较的序列具有不同的长度,则将匹配的数目除以这两个长度中较短的一个。例如,如果在200个氨基酸的蛋白质与400个氨基酸的蛋白质之间存在100个匹配的氨基酸,则相对于较短的序列而言这两个蛋白质是50%相同的。如果该较短的序列在长度上小于150个碱基或50个氨基酸,则将匹配的数目除以150(对于核酸碱基而言)或50(对于氨基酸而言)并乘以100,获得百分比同一性。除了同一性位置,共有位置也通常计分。共有氨基酸是那些已知具有类似氨基酸性质(例如电荷、大小、极性和芳香性)的氨基酸。

如本文所使用的,术语“近交”是指基本上纯合的植物或种类。术语可以是指在整个基因组中基本上纯合的植物或品种,或者相对于特别目的基因组部分是基本上纯合的植物或植物品种。

如本文所使用的,术语“indel”是指在一对核苷酸序列中的插入或缺失,其中第一序列可被称为具有相对于第二序列的插入,或第二序列可被称为具有相对于第一序列的删除。

如本文所使用的,术语“基因渗入(introgression)”、“使基因渗入(introgressing)”和“经基因渗入的(introgressed)”是指使一个或多个遗传基因座的所期望的等位基因或所期望的等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传送。例如,可以通过相同物种的两个亲本之间的有性杂交将指定基因座处的所希望的等位基因传送给至少一个子代,其中这些亲本中的至少一个在其基因组内具有该所希望的等位基因。可替代地,例如,等位基因的传送可以通过两个供体基因组之间的重组而发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所希望的等位基因。所希望的等位基因可以是标记的经选择的等位基因、QTL、转基因等。包括所希望的等位基因的后代可以重复地与具有一个所希望的遗传背景的品系回交,并且对于所希望的等位基因进行选择,其中结果是所希望的等位基因变得在一个所希望的遗传背景中是固定的。例如,与增强的ASR耐受性相关联的标记可以从供体基因渗入到不具有疾病抗性的轮回亲本中。然后可以将得到的后代重复回交并选择,直到子代在轮回亲本背景中具有一个或多个ASR耐受性等位基因。

如本文所使用的,“分离的”核酸分子基本上与通常与核酸相关联的其他核酸序列分离开来,例如与核酸天然存在的细胞的染色体或染色体外DNA分离开来。当核酸分子包含存在于另一生物体基因组中的转基因或转基因的一部分时,它是分离的核酸分子。该术语还包括经生物化学纯化以基本上除去污染核酸和其他细胞组分的核酸。术语“转基因”是指转化到细胞或生物体中的对该细胞或该生物体而言规范的任何多核酸分子。“转基因”还涵盖通过定向重组或位点特异性突变插入规范性多核酸分子而修饰的天然植物基因的组成部分。

如果多肽是从天然伴随它的细胞组分(核酸、脂质、碳水化合物和其他多肽)中分离出来的,或者是化学合成或重组的,则该多肽称为“分离的”。当多肽分子在另一个生物体中从转基因表达时,该多肽分子是分离的多肽分子。当样品中至少60重量%、优选90重量%或更多、更优选95重量%或更多、最优选超过99重量%由单体多肽构成时,该单体多肽是分离的。蛋白质纯度或均一性例如通过以下来指示:蛋白质样品的聚丙烯酰胺凝胶电泳,随后在聚丙烯酰胺凝胶染色后可视单个多肽条带;高压液相色谱法;或其他常规方法。蛋白质可以通过本领域已知的任何方法纯化,例如如以下中所述:Guide to Protein Purification[蛋白质纯化指南],Deutscher编辑,Meth.Enzymol.[酶学方法]185,学术出版社(AcademicPress),圣地亚哥,1990年;以及Scopes,Protein Purification:Principles andPractice[蛋白质纯化:原理与实践],斯普林格,纽约,1982。

使用公知的方法,本领域技术人员可以容易地产生提供经修饰的基因产物的基因和蛋白质的核苷酸和氨基酸序列变体。核酸的化学合成可以例如在自动化寡核苷酸合成仪上进行。这样的变体优选不改变核酸的蛋白质编码区的阅读框。本发明还涵盖缺乏全长蛋白质的至少一个残基,但基本上保持该蛋白质的活性的蛋白质片段。

“基因座”是基因或标记或等位基因所在的染色体上的位置。在一些实施例中,基因座可以涵盖一个或多个核苷酸。

“非天然存在的大豆品种”是自然界中不存在的任何品种的大豆。可以通过本领域已知的任何方法产生“非天然存在的大豆品种”,该方法包括但不限于转化大豆植物或种质、转染大豆植物或种质并将天然存在的大豆品种与非天然存在的大豆品种杂交。在一些实施例中,“非天然存在的大豆品种”可以包含一种或多种异源核苷酸序列。在一些实施例中,“非天然存在的大豆品种”可以包含天然存在的核苷酸序列的一个或多个非天然存在的拷贝(即天然存在于大豆中的基因的外来拷贝)。在一些实施例中,“非天然存在的大豆品种”可以包含两种或更多种天然存在的核苷酸序列的非天然组合(即,在同一大豆中不天然存在的两种或更多种天然存在的基因,例如在大豆品系中未发现的基因)。

如本文所使用的,术语“表型”、“表型性状”或“性状”是指生物体的一种或多种性状和/或表现。表型是对于裸眼或通过本领域已知的任何其他评价手段(例如,显微术、生物化学分析、或电子机械测定)可以观察的表现。在一些情况中,表型或性状直接由单一基因或遗传基因座控制,即,“单基因性状”。在其他情况下,表型或性状是多个基因的结果。应当指出,如本文所使用的,术语“疾病抗性表型”考虑了可能影响对应的疾病的环境条件,这样使得该效应是真实且是可重复的。

如本文所使用的,术语“植物”可以是指全株植物、其任何部分、或源自植物的细胞或组织培养物。因此,术语“植物”可以指以下中的任一项:全株植物、植物组分或器官(例如,根、茎、叶、芽、花、荚等)、植物组织、种子和/或植物细胞。植物细胞是从植物取得的植物细胞,或者是通过培养从取自植物的细胞衍生的植物细胞。因此,术语“大豆植物”可以是指整株大豆植物、大豆植物的一个或多个部分(例如,根、根尖、茎、叶、芽、花、豆荚、种子、子叶等)、大豆植物细胞、大豆植物原生质体和/或大豆植物愈伤组织。

“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。在实施例中,植物细胞是不繁殖的和/或不能再生全株植物。

“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。

“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。

“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花芽或胚。

如本文所使用的,术语“植物部分”包括但不限于,胚、花粉、胚珠、种子、叶、花、枝、果实、茎秆、根、根尖、花药、和/或植物细胞(包括在植物和/或植物的部分中完整的植物细胞)、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团(plantclumps)等。

如本文所使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。

“多聚腺苷酸化信号”或“聚A信号”是指位于编码区3'的核酸序列,其导致在从编码区转录的mRNA的3'末端添加腺苷酸核苷酸。

“聚合酶链式反应(PCR)”是指DNA扩增方法,其使用酶促技术来建立一个核酸序列(扩增子)的多个拷贝。DNA分子的拷贝是通过在两个扩增物之间穿梭DNA聚合酶来制备的。这种扩增方法的基础是多个循环的温度变化以变性,然后使扩增物(DNA引物分子)重新退火,接着是延伸,在位于侧翼扩增物之间的区域中合成新的DNA链。核酸扩增可以通过本领域已知的各种核酸扩增方法中的任何一种来完成,包括聚合酶链式反应(PCR)。本领域已知多种扩增方法,并且特别是在美国专利号4,683,195和4,683,202以及PCR Protocols:AGuide to Methods and Applications[PCR方案:方法和应用指南],Innis等人编辑,学术出版社,圣地亚哥,1990中描述的。已经开发了PCR扩增方法,以扩增多达22kb基因组DNA和多达42kb的噬菌体DNA(Cheng等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:5695-5699,1994)。这些方法以及DNA扩增领域中已知的其他方法可用于本发明的实践。

如本文所使用的,术语“引物”是指当置于诱导合成引物延伸产物的条件(例如在核苷酸和用于聚合的试剂(如DNA聚合酶)的存在下并且在合适的温度和pH)下时能够退火至核酸靶并用作DNA合成的启动点的寡核苷酸。为了在延伸和/或扩增中获得最大效率,在一些实施例中,引物(在一些实施例中是延伸引物,并且在一些实施例中是扩增引物)是单链的。在一些实施例中,引物是寡脱氧核苷酸。引物典型地足够长以在用于聚合的试剂存在下引发延伸和/或扩增产物的合成。引物的最小长度可以取决于许多因素,包括但不限于该引物的温度和组成(A/T对比G/C含量)。在扩增引物的情况下,这些扩增引物典型地作为由一个正向和一个反向引物组成的一对双向引物提供,或作为DNA扩增领域中(例如在PCR扩增中)常用的一对正向引物提供。如此,应该理解的是,如本文所使用的术语“引物”可以指超过一种引物,特别是在关于待扩增的靶区域的一个或多个末端序列的信息中存在一些歧义的情况下。因此,“引物”可以包括含有代表该序列中的可能变异的序列的引物寡核苷酸的集合,或包括允许典型的碱基配对的核苷酸。可以通过任何本领域已知的合适的方法来制备引物。用于制备特异性序列的寡核苷酸的方法是本领域已知的,并且包括例如适当的序列的克隆和限制以及直接化学合成。化学合成方法可以包括例如美国专利号4,458,066中披露的磷酸二酯或三酯法、二乙基氨基磷酸酯法和固相支持体法。若需要,可以通过掺入可检测部分,例如光谱部分、荧光部分、光化学部分、生物化学部分、免疫化学部分或化学部分来标记引物。可以对如表1-5中任一个中描述的任何有利SNP建立诊断ASR抗性(即能够基于ASR抗性等位基因的存在来鉴定或选择)的引物。PCR方法在手册中已经很好地描述,并且是本领域技术人员已知的。通过PCR扩增后,可以通过与探针多核苷酸杂交来检测靶多核苷酸,该探针多核苷酸在严格至中度严格的杂交和洗涤条件下与靶序列形成稳定的杂交体。如果预期探针与靶序列基本上完全互补(即,约99%或更多),则可以使用严格条件。如果预期有一些错配,例如如果预期变体品种会导致探针不完全互补,则可以降低杂交的严格性。在一些实施例中,选择条件以排除非特异性/偶然结合。影响杂交的条件和针对非特异性结合选择的条件是本领域已知的,并且描述于例如Sambrook和Russell(2001)中。MolecularCloning:A Laboratory Manual[分子克隆:实验室手册],第三版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港实验室,纽约,美国。通常,较低的盐浓度和较高温度的杂交和/或洗涤增加了杂交条件的严格性。

如本文所使用的,术语“子代”和“子代植物”是指从一个或多个亲本植物通过无性或有性繁殖产生的植物。子代植物可以通过克隆或单一亲本植物自交,或者通过两种亲本植物杂交来获得。

术语“启动子”或“启动子区”是指起调节元件作用的多核酸分子,通常在编码序列的上游(5')发现,该多核酸分子通过提供RNA聚合酶的识别位点和/或在正确位点开始转录所必需的其他因子来控制信使RNA(mRNA)的产生来控制编码序列的表达。如本文所设想的,启动子或启动子区域包括通过连接到各种调节序列、随机或受控突变以及增强子序列的添加或重复而衍生的启动子的变化。本文披露的启动子区域及其生物学功能等价物在作为合适的重组DNA构建体的一部分引入宿主时负责驱动在其控制下的编码序列的转录,如其产生mRNA的能力所证明的。

“重组”核酸是由核酸序列的两个在其他情况下分开的片段组合而成的,例如,通过化学合成或通过基因工程技术操纵多核酸的分离片段。术语“重组DNA构建体”是指任何试剂,例如质粒、粘粒、病毒、自主复制序列、噬菌体、或线性或环状单链或双链DNA或RNA核苷酸序列,其源自任何来源,能够基因组整合或自主复制,包含一个或多个DNA序列已经以功能性操作方式连接的DNA分子。这样的重组DNA构建体能够将用于所选基因产物的5'调节序列或启动子区和DNA序列以如下方式引入细胞,该方式使得该DNA序列被转录成功能性mRNA,该功能性mRNA被翻译并因此被表达。重组DNA构建体可以构建成能够表达反义RNA或稳定的双链反义RNA。

在两个核酸或两个氨基酸序列的上下文中,短语“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少约50%核苷酸或氨基酸残基同一性(如使用序列比较算法或通过目测检查所测量的)的两个或更多个序列或子序列。在某些实施例中,基本上同一的序列具有至少约60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的核苷酸或氨基酸残基同一性。在某些实施例中,相对于蛋白质序列或编码其的核苷酸序列,在序列至少约50个氨基酸残基、100个氨基酸残基、150个氨基酸残基、200个氨基酸残基、250个氨基酸残基、300个氨基酸残基、350个氨基酸残基、400个氨基酸残基、450个氨基酸残基、500个氨基酸残基、525个氨基酸残基、526个氨基酸残基、527个氨基酸残基、528个氨基酸残基、529个氨基酸残基、530个氨基酸残基、531个氨基酸残基、532个氨基酸残基、533个氨基酸残基、534个氨基酸残基、535个氨基酸残基、536个氨基酸残基的区域中存在基本同一性。在另外的实施例中,当这些序列在编码区的整个长度上时,这些序列是基本上同一的。

“同一性”或“同一性百分比”是指在两种核酸或氨基酸序列之间的同一性的程度。对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。

对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。

用于比较的序列的最佳比对可以例如通过Smith&Waterman,Adv.Appl.Math.[应用数学进展]2:482(1981)的局部同源算法,通过Needleman&Wunsch,J.Mol.Biol.[分子生物学杂志]48:443(1970)的同源比对算法,通过Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA[美国国家科学院学报]85:2444(1988)的搜索相似性方法,通过这些算法的计算机实现(Wisconsin Genetics Software Package[威斯康星遗传学软件包],Genetics Computer Group[遗传学计算机组],575Science[科学],麦迪逊博士,威斯康星州中的GAP、BESTFIT、FASTA和TFASTA),或通过目视检查(通常参见)进行。

适于确定序列同一性百分比以及序列相似性的算法的一个实例是BLAST算法,其描述于以下文献中:Altschul等人,J.Mol.Biol.[分子生物学杂志]215:403-410(1990)。执行BLAST分析的软件可通过美国国家生物技术信息中心(National Center forBiotechnology Information)公开地获得(在the world wide web atncbi.nlm.nih.gov/)。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈(Altschul等人.,J.Mol.Biol.[分子生物学杂志]215:403-410(1990))。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:10915(1989))。

除了计算序列同一性百分之外,BLAST算法还进行两个序列之间相似性的统计分析(参见,例如,Karlin和Altschul,Proc.Nat'l.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。

用于进行序列比对的另一种被广泛使用和接受的计算机程序是CLUSTALW v1.6(Thompson,等人.Nuc.Acids Res.[核酸研究],22:4673-4680,1994)。将匹配的碱基或氨基酸的数目除以碱基或氨基酸的总数目并乘以100,以获得百分比同一性。例如,如果两个580个碱基对序列具有145个匹配的碱基,则它们会是25%同一的。如果两个进行比较的序列具有不同的长度,则将匹配的数目除以这两个长度中较短的一个。例如,如果在200个氨基酸的蛋白质与400个氨基酸的蛋白质之间存在100个匹配的氨基酸,则相对于较短的序列而言这两个蛋白质是50%同一的。如果该较短的序列在长度上小于150个碱基或50个氨基酸,则将匹配的数目除以150(对于核酸碱基而言)或50(对于氨基酸而言)并乘以100,获得百分比同一性。

当两个核苷酸序列在严格条件下彼此杂交时,这两个核苷酸序列也可以被认为是基本上同一的。在代表性实施例中,被认为基本上同一的两个核苷酸序列在高严格条件下彼此杂交。

术语“严格条件”或“严格杂交条件”包括指核酸与其靶序列杂交的程度将比它与其他序列杂交的程度可检测地更高(例如,至少2倍于非靶序列)的条件,并且任选地可以基本上排除与非靶序列的结合。严格条件是序列依赖性的并且在不同的情形下将会改变。通过控制杂交和/或洗涤条件的严格度,可以鉴定可以与参考核苷酸序列高达100%互补的靶序列。可替代地,可以使用中等或甚至低严格条件来允许序列中的一些不匹配,从而检测到较低程度的序列相似性。例如,本领域技术人员将理解,为了起到引物或探针的作用,核酸序列仅需要与靶序列充分互补以基本上与其结合,从而在采用的条件下形成稳定的双链结构。因此,可以在高、中等或甚至低严格条件下使用引物或探针。类似地,低或中等严格条件可以有利于检测同源物、直向同源物和/或旁系同源序列,该同源物、直向同源物和/或旁系同源序列具有与在高严格条件下鉴定的较低的序列同一性程度。

如本文所使用的,术语“互补的(complementary)”或“互补性(complementarity)”(和类似术语)是指多核苷酸在容许性盐条件和温度条件下通过碱基配对发生天然结合。例如,序列“A-G-T”与互补序列“T-C-A”结合。两个单链分子之间的互补可能是部分的,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补时,互补可能是完全的。核酸链之间的互补性程度对于分子之间杂交的效率和强度具有显著影响。如本文所使用的,术语“基本上互补的”(和类似术语)意指两个核酸序列是至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多互补的。可替代地,术语“基本上互补的”(和类似术语)可以意指两个核酸序列在高严格条件(如本文描述的)下可以杂交在一起。

如本文所使用的,“特异性”或“选择性”杂交(和类似术语)是指分子在严格条件下与特定的核酸靶序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的DNA或RNA)中时进行的,以致于基本上排除非靶核酸,或甚至与非靶序列没有可检测的结合、双链化或杂交。特异性或选择性杂交序列典型地是至少约40%互补的并且任选地是基本上互补的或甚至完全互补的(即,100%同一的)。

对于DNA-DNA杂交物,T

典型地,严格条件是这些:其中盐浓度小于约1.5M Na离子、典型地在约pH 7.0至pH 8.3下大约0.01M至1.0M钠离子浓度(或其他盐),并且对于短探针(例如,10至50个核苷酸)温度为至少约30℃而对于长探针(例如,大于50个核苷酸)至少约60℃。通过添加不稳定剂如甲酰胺或Denhardt's(在500ml水中的5g聚蔗糖(Ficoll)、5g聚乙烯吡咯烷酮、5g牛血清白蛋白)也可以达到严格条件。示例性的低严格性条件包括在37℃下与30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,以及在50℃至55℃下在1X至2XSSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格条件包括在37℃下在40%至45%甲酰胺、1M NaCl、1%SDS中杂交以及在55℃至60℃下在0.5X至1X SSC中洗涤。示例性的高严格条件包括在37℃下在50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60℃至65℃下在0.1X SSC中洗涤。高严格条件的另一个非限制性实例包括在65℃下在4X SSC、5X Denhardt's、0.1mg/ml煮沸的鲑鱼精子DNA和25mM磷酸钠中杂交,以及在65℃下在0.1XSSC、0.1%SDS中洗涤。高严格杂交条件的另一个说明包括在50℃下在7%SDS、0.5M NaPO

如果在严格条件下彼此不杂交的核酸所编码的蛋白质是基本上同一的,则它们仍然是基本上同一的(例如,由于遗传密码的简并性)。

两个核酸序列或蛋白质基本上同一的另一个指示是由第一核酸编码的蛋白质与由第二核酸编码的蛋白质进行免疫性交联反应。因此,蛋白典型地是与第二蛋白基本上一致的,例如其中这两种蛋白仅区别于保守性取代。

术语“载体”是指用于将一种或多种核酸转移、递送或引入细胞中的组合物。载体包含含有待转移、递送或引入的一个或多个核苷酸序列的核酸分子。

RG21和RG22基因编码序列在植物中的表达

制备DNA构建体,其含有在植物中表达RG21和RG22基因编码序列所必需的各种遗传元件。“DNA构建体”是指构成重组DNA分子的可操作地彼此连接的异源遗传元件,并且可以包括提供DNA多核苷酸分子在宿主细胞中表达的元件和提供构建体在宿主细胞中的维持的元件。植物表达盒包括遗传元件的可操作连接,这些遗传元件在转移到植物细胞中时提供所需基因产物的表达。“植物表达盒”是指嵌合DNA片段,这些嵌合DNA片段包含可操作地连接以提供转基因产物在植物中的表达的调节元件。启动子、前导序列、内含子、编码多核酸的转运肽、3'转录终止区都是植物分子生物学领域的技术人员可操作地连接以向本发明的RG21或RG22基因提供所需水平的表达或功能的遗传元件。DNA构建体可以包含表达本发明的DNA分子或在作物植物基因工程中使用的其他DNA分子的一个或多个植物表达盒。

在营养组织如叶、茎、根和块茎中特异性活性的多种启动子可用于表达本发明的RG21和/或RG22基因多核酸分子。

翻译前导序列是指位于基因启动子和编码序列之间的DNA分子。翻译前导序列存在于完全加工的mRNA中的翻译起始序列上游。翻译前导序列可影响初级转录物至mRNA的加工、mRNA稳定性或翻译效率。翻译前导序列的实例包括玉蜀黍和矮牵牛热休克蛋白前导序列、植物病毒外壳蛋白前导序列,植物二磷酸核酮糖羧化酶(rubisco)基因前导序列等(Turner和Foster,Molecular Biotechnology[分子生物技术]3:225,1995)。

“3'非翻译序列”是指位于结构多核苷酸序列下游的DNA序列,并且包括编码多聚腺苷酸化和能够影响mRNA加工或基因表达的其他调节信号的序列。多聚腺苷酸化信号在植物中的作用是导致多聚腺苷酸核苷酸添加到mRNA前体的3′末端。多聚腺苷酸化序列可源自天然基因、源自各种植物基因、或源自T-DNA。多聚腺苷酸化序列的实例是胭脂碱合酶3'序列(nos 3′;Fraley等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:4803-4807,1983)。不同3'非翻译序列的使用例示于Ingelbrecht等人,Plant Cell[植物细胞]1:671-680,1989。

本文使用的重组DNA技术中的实验室程序是本领域中公知的和通常采用的那些程序。标准技术用于克隆、DNA和RNA分离、扩增和纯化。通常,涉及DNA连接酶、DNA聚合酶、限制性内切酶等的酶促反应根据制造商的规范进行。这些技术和各种其他技术通常根据Sambrook等人(1989)执行。

本发明的DNA构建体可通过本领域技术人员公知的各种常规转化技术引入所需植物宿主的基因组中。“转化”是指将外源多核酸分子(例如DNA构建体,重组多核酸分子)引入细胞或原生质体,且该外源多核酸分子掺入宿主细胞基因组或细胞器基因组(例如叶绿体或线粒体)或能够自主复制。“转化的”或“转基因的”是指插入了外来多核酸例如DNA载体或重组多核酸分子进入的细胞、组织、器官或生物体。“转基因的”或“转化的”细胞或生物体还包括细胞或生物体的子代和从育种程序产生的子代,该育种程序采用“转基因的”植物作为杂交中的亲本,并且从育种程序产生的子代表现出由于外来多核酸分子的存在而导致的改变的表型。

植物细胞或组织的转化方法包括但不限于农杆菌介导的转化方法和生物射弹或粒子枪介导的转化方法。用于农杆菌介导转化的目的的合适植物转化载体包括-源自根癌农杆菌的肿瘤诱导(Ti)质粒的那些元件,例如右边界(RB)区和左边界(LB)区,以及Herrera-Estrella等人,Nature[自然]303:209(1983);Bevan,Nucleic Acids Res.[核酸研究]12:8711-8721(1984);Klee等人,Bio-Technology[生物技术]3(7):637-642(1985)披露的其他元件。除了源自农杆菌Ti或根诱导(Ri)质粒的植物转化载体外,可使用替代方法将本发明的DNA构建体插入植物细胞。这些方法可以涉及但不限于例如脂质体的使用、电穿孔、增加游离DNA摄取的化学物质、通过微射弹轰击的游离DNA递送、以及使用病毒或花粉的转化。

可以制备掺入本发明的RG21基因编码序列的DNA构建体,用于指导直接从宿主植物细胞质体表达这些序列。适用于此目的的此类构建体的实例和方法是本领域已知的并且通常描述于例如Svab等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:8526-8530,(1990)和Svab等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:913-917(1993)和美国专利号5,693,507。

当获得足够数量的含有编码本发明多肽的外源多核酸分子的细胞时,可以培养这些细胞,然后将其再生为全株植物。“再生”是指从植物细胞(例如,植物原生质体或外植体)生长出植物的过程。这种再生技术依赖于组织培养生长培养基中某些植物激素的操纵,典型地依赖于已与所需核苷酸序列一起引入的杀生物剂和/或除草剂标记。再生步骤的方法选择并不重要,参见例如,Ammirato等人,Handbook of Plant Cell Culture—CropSpecies.[植物细胞培养-作物物种手册]Macmillan出版公司(1984);Shimamoto等人,Nature[自然]338:274-276(1989);Fromm,UCLA Symposium on Molecular Strategiesfor Crop Improvement[加州大学洛杉矶分校作物改良分子策略研讨会],1990年4月16日至22日.基斯通,科罗拉多州(Keystone,Colo.)(1990);Vasil等人,Bio/Technology[生物/技术]8:429-434(1990);Vasil等人,Bio/Technology[生物/技术]10:667-674(1992);Hayashimoto,Plant Physiol.[植物生理学]93:857-863(1990);以及Datta等人,Bio-technology[生物技术]8:736-740(1990)。这种再生技术通常是Klee等人,Ann.Rev.PlantPhys.[植物生理学年度综述]38:467-486(1987)中描述的。

含有编码目的多肽的外源多核酸分子的转基因植物的发育或再生是本领域公知的。优选地,再生的植物自花授粉以提供纯合转基因植物,如上所述。另外,从再生的植物获得的花粉与重要农艺品系的种子生长植物杂交。相反,来自这些重要品系植物的花粉被用来为再生的植物授粉。

疾病抗性大豆植物和种质

本发明提供了疾病抗性大豆植物和种质。疾病抗性大豆植物或种质可以通过任何方法产生,借这些方法将RG21基因和RG22基因中至少一种引入大豆植物或种质中,这些方法包括但不限于转化、原生质体转化、或融合,双单倍体技术,远缘杂交例如通过胚拯救、基因编辑、和/或通过任何其他核酸转移系统。

在一些实施例中,大豆植物或种质包含非天然存在的大豆品种。在一些实施例中,大豆植物或种质的基因组与优良大豆品种的基因组是至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或100%同一性。

疾病抗性大豆植物或种质可以是优良大豆品种和以下大豆品种之间的杂交子代,该大豆品种包含编码与SEQ ID NO:1具有至少70%-100%序列同一性的蛋白质的RG21基因,或编码与SEQ ID NO:12具有至少70%-100%序列同一性的蛋白质的RG21基因。在许多实例中,实施例将具有与SEQ ID NO:1或SEQ ID NO:12中任一个具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的至少一个。

疾病抗性大豆植物或种质可以是基因渗入的子代,其中轮回亲本是优良大豆品种,并且供体包含与增强的疾病耐受性和/或抗性相关联的RG21和/或RG22基因,其中该供体携带与SEQ ID NO:2具有70%-100%同一性的RG21基因和/或与SEQ ID NO:13具有70%-100%同一性的RG22基因。

疾病抗性大豆植物或种质可以是第一优良大豆品种(例如,测试品系)之间的杂交的子代,和第二优良大豆品种(例如,轮回亲本)与包含RG21基因和RG22基因中至少一种的大豆品种之间的杂交的子代。

疾病抗性大豆种子

本发明提供了疾病抗性大豆种子。如上所述,本发明的方法可用于鉴定、产生和/或选择疾病抗性大豆种子。除了上述方法,疾病抗性大豆种子可以通过将RG21基因和RG22基因中至少一种引入该大豆种子中的任何方法(这些方法包括但不限于转化、原生质体转化或融合、双单倍体技术、胚拯救、基因编辑(例如CRISPR或TALEN或大范围核酸酶)产生,和/或通过任何其他核酸转移系统产生。

在一些实施例中,疾病抗性大豆种子包含非天然存在的大豆品种。在一些实施例中,大豆种子与优良大豆品种的基因组是至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或100%同一性。

疾病抗性大豆种子可以由通过本发明的方法鉴定、产生或选择的疾病抗性大豆植物产生。

本发明的疾病抗性大豆种子可以包含来自本发明的一种或多种RG21或RG22基因、通过使用其选择或通过使用其产生。

本披露还包括选择包含赋予对ASR的抗性的RG21基因和RG22基因中的至少一种的大豆植物的方法。在典型的实施例中,方法包括从大豆植物中分离核酸或蛋白质中的至少一种;在这些核酸或蛋白质中检测与RG21基因相关联的标记,并且选择包含这些标记中的一种或多种的大豆植物,从而选择对ASR具有增加的抗性的植物。当在分离的核酸样品中进行检测时,标记可以包括基于PCR的标记(例如用于RG21基因或其部分的SNP检测或扩增的Taqman)。当在分离的蛋白质样品中进行检测时,标记还可以包括基于免疫测定的标记(例如ELISA)。因此,本披露还涉及用于检测与RG21和RG22基因相关联的标记的组合物。例如,组合物可以包含引物对(例如,用于基于基因或其部分检测扩增);引物对和探针(例如用于基于SNP进行检测);或抗RG21抗体(例如用于使用基于免疫测定的方法比如ELISA进行检测的抗RG21兔或山羊抗体)。

实例

以下实例不旨在是一个本发明得以实施的所有不同方式或可以加入本发明中的所有特征的详细目录。本领域的技术人员将理解到可以在不偏离本发明的情况下对不同实施例作出众多变化和添加。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。

实例1:包含RG21基因的载体的构建

构建图1所示的载体25307(SEQ ID NO:3),其包含RG21基因(SEQ ID NO:2)和短绒野大豆启动子(SEQ ID NO:7)。特征和位置描述如下:

cGtoRG21-01(起点:2217终点:5987)是源自短绒野大豆PI499939的R基因cGtoRG21的CDS序列,其特征是卷曲螺旋、核苷酸结合和富含亮氨酸的重复序列结构域(CNL),与位于大豆染色体20上的基因同源。CDS中的内含子被移除。

cNtALS-01(起点:9387终点:11381)片段编码被密码子优化用于大豆表达的乙酰乳酸合酶双突变体。

cSpec-03(起点:12731终点:13519)也被称为aadA,是编码酶氨基糖苷3'腺苷酰转移酶的基因,赋予了对大观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和农杆菌中。

cVirG-01(起点:13819终点:14544)。

cRepA-03(起点:14574终点:15647)

bNRB-04(起点:4终点:143)根癌农杆菌胭脂碱ti质粒的T-DNA的右边界区。

bNRB-01-01(起点:101终点:125)右边界重复。

bNLB-05(起点:12322终点:12451)根癌农杆菌胭脂碱ti质粒的T-DNA的左边界区。

bNLB-01-01(起点:12357终点:12381)根癌农杆菌胭脂碱ti质粒的T-DNA的25bp左边界重复区。

iGmEF-02(起点:8459终点:9367)大豆延伸因子(EF)基因的第一内含子。

gGtoRG21-01(起点:217终点:7293)含有来自短绒野大豆PI499939的RG21大豆锈病抗性基因的基因组片段,其特征是卷曲螺旋、核苷酸结合和富含亮氨酸的重复序列结构域(CNL),与位于大豆染色体20上的基因同源,表达由天然启动子和终止子区驱动。

xTAG-06(起点:144终点:183)40bp位点用于植物插入物完整性测试和终止通读ORF。

xSTOPS-01(起点:184终点:195)6框终止以使意外ORF通读最小化。

START(起点:2217终点:2219)。

STOP(起点:5985终点:5987)。

xSTOPS-01(起点:7301终点:7312)6框终止以使意外ORF通读最小化。

Start(起点:8396终点:8396)转录起点位点。

xSTOPS-01(起点:12186终点:12197)6框终止以使意外ORF通读最小化。

xSTOPS-01(起点:12262终点:12273)6框终止以使意外ORF通读最小化。

xTAG-02(起点:12274终点:12313)40bp位点用于植物插入物完整性测试和终止通读ORF。

启动子_GtoRG21(起点:217终点:1946)。

prGmEF-05(起点:7313终点:9378)。

prVirG-01(起点:13614终点:13744)virG启动子。

oVS1-02(起点:15690终点:16094)来自质粒的复制起点和分隔区,并且在根癌农杆菌宿主中用作复制起点。

oCOLE-06(起点:16772终点:17578)在大肠杆菌中起作用的ColE1复制起点。

终点子_RG21(起点:6294终点:7293)。

tGmEPSPS-04(起点:11388终点:12185)tGMEPS-02的经修饰版本;来自大豆的EPSPS终止子。

3'UTR_RG21(起点:6025终点:6293)。

5'UTR_RG21(起点:1948终点:2216)。

u5GmEF-01(起点:8396终点:8458)

u5GmEF-02(起点:9368终点:9378)

实例2:RG21基因抗ASR的验证

使用实施例1的载体建立了许多大豆事件。将来自初级事件的叶放在皮氏培养皿中的湿纸巾上,然后用6种不同锈病小种的孢子悬浮液孵育。14天后,评估这些叶的抗性。

与野生型大豆相比,超过一半的测试事件提供了>90%或更多的强抗性保护。在这些事件中,超过一半对6种所测试的锈病中的6种表现出近乎完全的免疫反应。图2是一张说明性照片,显示了所测试的6种锈病小种中的3种的结果。野生型大豆植物的叶用作阴性对照。

为了量化疾病抗性水平,对这些叶进行了取样进行qRT-PCR分析,以量化大豆锈菌β-微管蛋白基因的相对表达。图3说明了锈病1的定量,包括抗性评级和基因拷贝。图4说明了锈病2和3的定量,包括抗性评级和基因拷贝。如图所示,感染后14天没有或几乎没有可检测到的真菌生物量(图中的绿色事件或图3和图4中从左到右的前10个事件)。这可由相同的一组事件和其他T0事件再现地显示。一些T0分离叶测定延长至18天,在这些中,我们也在整个实验中观察到了强抗性。

在本实验中,在基因拷贝数>2的事件中检测到强抗性(图中为绿色事件),而具有1个拷贝的事件通常部分易感。然而,性状基因的qRT表明在大多数事件中的低表达,因此抗性未显现需要高表达水平。

实例3:其他载体的构建

还使用不同的启动子(分别为prGmUbi和prUBQ3)构建了图5所示的载体25374(SEQID NO:4)和图6所示的载体24965(SEQ ID NO:5)。建立这些载体是为了说明基因表达的增加。

载体25374的特征如下:

cGtoRG21-01(起点:2239终点:6009)源自短绒野大豆PI499939的合成R基因cGtoRG21的CDS序列,其特征是卷曲螺旋、核苷酸结合和富含亮氨酸的重复序列结构域(CNL),与位于大豆染色体20上的基因同源。CDS中的内含子被移除。

cNtALS-01(起点:8463终点:10457)NtALS DNA片段编码被密码子优化用于大豆表达的乙酰乳酸合酶双突变体。

cSpec-03(起点:11807终点:12595)基因编码酶氨基糖苷3'腺苷酰转移酶,赋予了对大观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和农杆菌中。

cVirG-01(起点:12895终点:13620)virG。

cRepA-03(起点:13650终点:14723)。

bNRB-04(起点:4终点:143)根癌农杆菌胭脂碱ti质粒的T-DNA的右边界区。

bNRB-01-01(起点:101终点:125)右边界重复。

bNLB-05(起点:11398终点:11527)根癌农杆菌胭脂碱ti质粒的T-DNA的左边界区。

bNLB-01-01(起点:11433终点:11457)根癌农杆菌胭脂碱ti质粒的T-DNA的25bp左边界重复区。

iGmUbi1-01(起点:1695终点:2226)prGmUbi1-02中发现的5'UTR内含子。

iGmEF-02(起点:7535终点:8443)大豆延伸因子(EF)基因的第一内含子,其中内部BamHI位点和3'端非预期ORF被移除。

xTAG-06(起点:144终点:183)40bp位点用于植物插入物完整性测试和终止通读ORF。

xSTOPS-01(起点:184终点:195)6框终止以使意外ORF通读最小化。

xSTOPS-05(起点:217终点:228)6框终止以使意外ORF通读最小化。

TSS(起点:1571终点:1571)转录起点位点。

START(起点:2239终点:2241)。

STOP(起点:6007终点:6009)。

xSTOPS-01(起点:6377终点:6388)6框终止以使意外ORF通读最小化。

Start(起点:7472终点:7472)。

xSTOPS-01(起点:11262终点:11273)6框终止以使意外ORF通读最小化。

xSTOPS-01(起点:11338终点:11349)6框终止以使意外ORF通读最小化。

xTAG-02(起点:11350终点:11389)40bp位点用于植物插入物完整性测试和终止通读ORF。

prGmUbi1-03(起点:229终点:2226)启动子。

prGmEF-05(起点:6389终点:8454)翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的utr,来自大豆(williams 82)。

prVirG-01(起点:12690终点:12820)virG启动子,其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp 45至83),另一个响应于中度酸化(86至128)。

oVS1-02(起点:14766终点:15170)在根癌农杆菌宿主中作为复制起点。

oCOLE-06(起点:15848终点:16654)在大肠杆菌中起作用的ColE1复制起点;tAtUbq3-02(起点:6016终点:6361)终止子。

tGmEPSPS-04(起点:10464终点:11261)源自大豆的终止子。

u5GmEF-01(起点:7472终点:7534)大豆延伸因子(EF)基因的第一5'UTR。

u5GmEF-02(起点:8444终点:8454)大豆延伸因子(EF)基因的第二5'UTR。

载体24965的特征如下:

cGtoRG21-01(1658终点:5428)源自短绒野大豆PI499939的合成R基因cGtoRG21的CDS序列,其特征是卷曲螺旋、核苷酸结合和富含亮氨酸的重复序列结构域(CNL),与位于大豆染色体20上的基因同源。CDS中的内含子被移除。

cNtALS-01(起点7882终点:9876)NtALS DNA片段编码被密码子优化用于大豆表达的乙酰乳酸合酶双突变体。

cSpec-03(起点:11226终点:12014)基因编码酶氨基糖苷3'腺苷酰转移酶,赋予了对大观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和农杆菌中。

cVirG-01(12314终点:13039)virG。

cRepA-03(13069终点:14142)。

bNRB-04(起点:4终点:143)根癌农杆菌胭脂碱ti质粒的T-DNA的右边界区。

bNRB-01-01(起点:101终点:125)右边界重复。

bNLB-05(起点:10817终点:10946)根癌农杆菌胭脂碱ti质粒的T-DNA的左边界区。

bNLB-01-01(起点:10852终点:10876)根癌农杆菌胭脂碱ti质粒的T-DNA的25bp左边界重复区。

iUBQ3-01(起点:1268终点:1642)UBQ3内含子。

iGmEF-02(起点:6954终点:7862)大豆延伸因子(EF)基因的第一内含子,其中内部BamHI位点和3'端非预期ORF被移除。

xTAG-06(起点:144终点:183)40bp位点用于植物插入物完整性测试和终止通读ORF。

xSTOPS-01(起点:184终点:195)6框终止以使意外ORF通读最小化。

xSTOPS-05(起点:217终点:228)6框终止以使意外ORF通读最小化。

START(起点:1658终点:1660)。

STOP(起点:5426终点:5428)。

xSTOPS-01(起点:5796终点:5807)6框终止以使意外ORF通读最小化。

Start(起点:6891终点:6891)。

xSTOPS-01(起点:10757终点:10768)6框终止以使意外ORF通读最小化。

xSTOPS-01(起点:10681终点:10692)6框终止以使意外ORF通读最小化。

xTAG-02(起点:10769终点:10808)40bp位点用于植物插入物完整性测试和终止通读ORF。

prUBQ3-13(起点:221终点:1642)源自拟南芥泛素3的启动子。

prGmEF-05(起点:5808终点:7873)翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的utr,来自大豆(williams 82)。

prVirG-01(起点:12109终点:12239)virG启动子,其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp 45至83),另一个响应于中度酸化(86至128)。

oVS1-02(起点:14185终点:14589)在根癌农杆菌宿主中作为复制起点。

oCOLE-06(起点:15267终点:16073)在大肠杆菌中起作用的ColE1复制起点;

tAtUbq3-01(起点:5435终点:5781)终止子。

tGmEPSPS-04(起点:9883终点:10680)源自大豆的终止子。

u5GmEF-01(起点:6891终点:6953)大豆延伸因子(EF)基因的第一5'UTR。

u5GmEF-02(起点:7863终点:7873)大豆延伸因子(EF)基因的第二5'UTR。

实例4:RG21基因通过胚拯救渗入大豆品系

非天然存在的突变大豆品系是通过化学渗入来自短绒野大豆PI499939或PI499939的F2:3子代的外源基因RG21而建立的。进行胚拯救并施加化学处理以产生双二倍体芽。如果双二倍体植物是可育的,它们将用于与大豆回交。与大豆回交和随后的胚拯救需要进行几代,以逐渐消除多年生野生大豆属染色体。

远缘杂交:将优良先正达大豆品系(RM 3.7至4.8)用作雌性(花粉接种者),并将多种短绒野大豆用作雄性或花粉供体。在适当的发育阶段从含有花药的大豆属植物中选择花是重要的。新鲜、全开、鲜艳的花朵保持具有成熟花粉的花药。花粉应呈现松散的黄色尘状。这些花从大豆属植物中取出并带至大豆植物进行授粉。来自大豆属植物的花粉应在除花后30分钟内使用。鉴定和选择可供授粉的大豆花芽也很重要。当与未成熟的芽相比时,当大豆花芽的尺寸较大时,其通常是可供使用的(ready)。大豆花的萼片颜色较浅,并且花瓣刚刚开始出现。首先,使用一对细尖的镊子小心地从花芽上分离萼片,露出外层花瓣。然后,轻轻地抓住并去除花上的花瓣(总共5篇),露出雌蕊周围的雄蕊环。由于在花药开始脱落花粉前1天,柱头受到花粉,因此认识到“雌性可供使用,雄性未能供使用(not ready)”的阶段性发育是很重要的。当在这个发育阶段授粉大豆花时,没有必要去除雌花。找到大豆花上的柱头。然后使用1朵雄花,小心地剥离花瓣以暴露花药,并将花粉粒轻轻地撒在大豆花的柱头上。在此过程中,应随时注意不要损害柱头。在授粉后的第二天开始,将激素混合物喷洒在授粉的花上,并且最终每天发育F1豆荚1X直至收获。授粉的花或豆荚充满了激素混合物的轻雾,注意不要使花/豆荚过早地从植物上脱落。该混合物含有100mg GA3、25mg NAA和5mg激动素/L蒸馏水。这些激素有助于保持豆荚发育和增加的豆荚生长。

收获:在授粉后大约14至16天收获来自远缘杂交的豆荚。(文献中的收获日期建议19到21天。)在选择单独的豆荚收获之前,确认萼片被移除(这表明远缘杂交尝试)并且种子大小与针对远缘杂交预期的一样。收集豆荚并根据远缘杂交组合进行计数以确定杂交成功。远缘杂交豆荚可以含有1至3个种子,但通常在每个F1荚中发现2个种子。

胚拯救:将收获的豆荚收集并带回实验室进行灭菌。首先用70%EtOH冲洗豆荚2至3分钟,然后在平台振荡器上以大约130RPM将其置于10%Clorox漂白剂中持续另外30分钟。最后,用无菌水冲洗豆荚多次以除去任何残留的漂白剂。在豆荚灭菌后可以立即开始胚分离,或者在胚分离之前豆荚可以在4℃储存长达24小时。接下来,将灭菌的豆荚放入层流净化罩中,在其中可以拯救胚。将个体豆荚置于无菌皮氏培养皿中并使用手术刀和镊子打开。沿着远缘杂交豆荚的长度远离种子做一个切口。然后可以容易地打开豆荚以暴露种子。可替代地,可以使用两对镊子来分离豆荚壳。小心地从豆荚中取出种子,并在解剖显微镜下放入无菌皮氏培养皿中。需要非常精细的镊子将胚与种子分离。用一只手握住镊子,轻轻地将种子的一侧远离胚,使脐带朝上。另一只手使用另一对镊子从含有胚的种子一侧除去种皮。剥掉胚周围的膜,并将胚从底部向上推。胚应该经过球状发育阶段,并且优选地经过早期心(heart)发育阶段(中期到晚期心阶段、子叶阶段和早期成熟阶段胚是所希望的)。将分离的胚转移到胚拯救培养基,例如大豆ER1-1。此时可以处理胚以诱导染色体加倍。(有关染色体加倍的详细信息,参见下文)在24℃下,将分离的胚在胚拯救培养基上保留21至30天。胚可以在ER1-1的整个孵育中保持在黑暗中,可以在黑暗中开始孵育并且在光照下完成,或者可以在光照下进行整个孵育。该方案中没有愈伤组织诱导阶段。芽直接从胚发育而来。

染色体加倍处理:秋水仙碱或氟乐灵可用于诱导染色体加倍。理想地,对晚期心阶段远缘杂交胚(或更大)进行化学处理以在分离长达1周后的任何时间紧接分离进行诱导染色体加倍。双倍剂可以在固体或液体培养基中混合并施用数小时或长达几天。氟乐灵在固体或液体培养基中以10uM-40uM浓度使用。此外,秋水仙碱在固体或液体培养基中以0.4mg/ml-1mg/ml的浓度使用。化学处理后,将胚转移到新鲜胚拯救培养基中。

芽再生:在24℃的光照下,将发育中的胚从拯救培养基转移至发芽培养基(比如大豆ER GSMv2)持续约3至5周。可替代地,在24℃在光照下,可以将发育中的胚从拯救培养基转移到延伸培养基(比如大豆E1 0No TCV)持续约3至5周。可以将发育中的芽从培养基板转移到含有发芽或延伸培养基的Phytocons中以进一步发育芽。将已建立的芽移至土壤中。最初的植物护理对于这些芽的存活至关重要。

倍性分析

收获-在授粉后14至16天收获豆荚(比文献中早约5天,缩短了时间线)。

胚拯救-我们的胚拯救方案涉及从胚直接芽再生,而不是通过胚发生再生,从而使植物恢复更快(与长达1年时间线相比,芽在大约2-3个月内恢复)。我们的方案不包括转移到萌发培养基后在黑暗中培养。我们的方案不需要转移到生根培养基。

染色体加倍-已成功使用氟乐灵处理产生加倍的F1植物:胚拯救后可立即进行氟乐灵处理。

实例5:ASR抗性性状基因渗入

通过胚拯救将RG21基因渗入大豆产生的三个独立的B2F1非天然存在的突变大豆品系,对6个亚洲大豆锈病小种进行了功效测试。在ASR感染之前,通过使用RG21特异性探针(TQ2681)(SEQ ID NO:9)的qRT-PCR分析来监测渗入性状基因的表达。通过使用大豆作为阴性对照(n=10)和供体(登记PI499939)(n=8)作为阳性对照,从各个渗入品系中收集了总共12个叶盘(n=12)。通过与内源大豆Cyp2(GmCyp2)对照进行比较,确定了三个独立品系中渗入的RG21基因的表达。在感染后14天对针对9种NA ASR的功效进行评级。

在三个独立的B2F1品系中成功地渗入了性状基因RG21。两个渗入品系UR234613938和UR234817537的RG21表达相对低于UR235760102。供体(登记PI499949)中RG21基因的表达高于所有三个渗入品系(图7)。

作为供体(登记PI499939),所有三个渗入品系对六个所测试的ASR小种表现出近乎完全的免疫,而野生型大豆在感染所有六个ASR(TAN2/3至TAN4)时表现出严重的孢子形成。重要的是,所有三个渗入品系都不允许任何无抗性表型比如红棕色(RB)症状的孢子形成(RB0 nsp=RB0无孢子形成;表1)。

表1

实例6:包含RG22基因的载体的构建

构建图8所示的载体25190(SEQ ID NO:4),其包含RG22基因(SEQ ID NO:3)。特征通常与前面描述的载体相似。

实例7:RG22基因抗ASR的验证

使用实施例6的载体建立了许多大豆事件。将来自初级事件的叶放在皮氏培养皿中的湿纸巾上,然后用6种不同锈病小种的孢子悬浮液孵育。14天后,评估这些叶的抗性。

与野生型大豆相比,许多测试事件提供了强大的抗性。为了量化疾病抗性水平,对叶进行了取样进行qRT-PCR分析,以量化大豆锈菌β-微管蛋白基因的相对表达。图9说明了感染后14天ASR菌株的定量。

以上实例清楚地说明本发明的优点。虽然已经参考某些实施例的具体细节描述本发明,但不希望此类细节被视为对本发明范围的限制,除非它们被包括在所附权利要求书中或到它们被包括在所附权利要求书中的程度。

在整个申请中,引用了各种专利、专利出版物和非专利出版物。这些专利、专利出版物和非专利出版物的披露内容通过引用以其整体在此并入本申请中,以便更全面地描述本发明所属领域的现状。

序列表

<110>Syngenta Crop Protection AG

Liu, Qingli

Curley, Thomas J Jr.

Breitinger, Becky W

Hipskind, John D

Dawson, John L

Tan, Xiaoping

Farmer, Andrew D

Chung, Euihwan D

<120>与大豆中疾病抗性相关联的新颖的抗性基因

<130>82139-US-REG-ORG-NAT-1

<150>US 63/042,101

<151>2020-06-22

<160>14

<170>PatentIn version 3.5

<210>1

<211>1256

<212>PRT

<213>短绒野大豆(Glycine tomentella)

<400>1

Met Ala Leu Ala Ile Val Gly Glu Ala Leu Ile Ser Ala Ser Val Glu

1 5 1015

Ile Leu Leu Asp Arg Ile Thr Ser Val Glu Phe Arg Asn Phe Phe Ala

202530

Asn Arg Lys Leu Asn Val Ser Leu Leu Asp Glu Leu Lys Ile Lys Leu

354045

Leu Ala Leu Ser Ala Val Leu Asn Asp Ala Glu Glu Lys Gln Ile Thr

505560

Asn Ser Glu Val Lys Ala Trp Leu Asp Glu Leu Lys Asp Ala Val Leu

65707580

Asp Ala Glu Asp Leu Leu Asp Gln Ile Asn Thr Asp Ser Leu Arg Cys

859095

Lys Val Glu Glu Gln Tyr Lys Thr Phe Lys Ser Gln Val Trp Ser Ser

100 105 110

Leu Ser Ser Pro Phe Asn Gln Phe Tyr Arg Ser Met Asn Ser Lys Leu

115 120 125

Glu Ala Ile Ser Gly Arg Leu Glu Asn Phe Ile Lys Gln Lys Asp Ile

130 135 140

Leu Gly Leu Lys Ser Val Ala Gly Arg Val Ser Tyr Arg Lys Asp Thr

145 150 155 160

Asp Arg Ser Val Glu Tyr Val Val Ala Arg Asp Asp Asp Lys Lys Lys

165 170 175

Leu Leu Thr Met Leu Leu Ser Asp Glu Asp Glu Asn Asn Asn His Ile

180 185 190

Lys Val Leu Thr Ile Trp Gly Met Gly Gly Leu Gly Lys Thr Thr Leu

195 200 205

Ala Gln Ser Leu Leu Asn Asp Asp Ala Val Gln Asn His Phe Asp Leu

210 215 220

Lys Ala Trp Ala Trp Val Ser Asp Pro Phe Asp Val Phe Lys Ala Thr

225 230 235 240

Lys Ala Ile Val Glu Ser Ala Thr Ser Lys Thr Cys Asp Thr Thr Asn

245 250 255

Phe Asp Ala Leu Arg Val Glu Leu Lys Asn Thr Phe Lys Asp Lys Phe

260 265 270

Phe Leu Leu Val Leu Asp Asp Leu Trp Asn Met Gln Tyr His Asp Trp

275 280 285

Asp Gln Leu Ile Ala Pro Phe Ile Ser Cys Gly Lys Lys Gly Ser Ile

290 295 300

Ile Ile Val Thr Thr Arg Gln His Arg Ile Ala Glu Ile Thr Ser Thr

305 310 315 320

Phe Pro Ile His Glu Leu Lys Ile Leu Thr Asp Asp Asn Cys Trp Cys

325 330 335

Ile Leu Ala Lys His Ala Phe Gly Asn Gln Gly Tyr Asp Lys Tyr Pro

340 345 350

Ile Leu Ala Glu Ile Gly Arg Gln Ile Ala Thr Lys Cys Lys Gly Leu

355 360 365

Pro Leu Ala Ala Lys Thr Leu Gly Gly Leu Leu Arg Ser Asn Val Asp

370 375 380

Ala Glu Tyr Trp Asn Glu Ile Leu Asn Ser Asn Met Trp Ala Asn Asn

385 390 395 400

Glu Val Leu Pro Ala Leu Cys Ile Ser Tyr Leu Gln Leu Pro Pro His

405 410 415

Leu Lys Arg Cys Phe Ala Tyr Cys Ser Ile Phe Pro Arg Gln His Leu

420 425 430

Leu Asp Arg Lys Glu Leu Ile Leu Leu Trp Met Ala Glu Gly Phe Leu

435 440 445

Pro Gln Ile His Arg Glu Lys Ala Met Glu Ser Ala Gly Glu Asp Tyr

450 455 460

Phe Asn Glu Leu Leu Ser Arg Ser Leu Ile Glu Lys Asp Lys Asn Glu

465 470 475 480

Gly Lys Glu Gln Phe Arg Met His Asp Leu Ile Tyr Asp Leu Ala Arg

485 490 495

Leu Val Ser Gly Lys Arg Ser Cys Tyr Phe Glu Gly Gly Glu Val Pro

500 505 510

Ile Asn Val Arg His Leu Thr Tyr His Pro Arg Tyr Leu Asp Val Ser

515 520 525

Thr Arg Phe Glu Gly Leu Tyr Gly Leu Lys Leu Leu Arg Ser Phe Leu

530 535 540

Arg Leu Ser Gln Tyr Ser Ser Ser Val Ser Lys Arg Val Thr His Glu

545 550 555 560

Trp Leu Pro Thr Leu Thr Tyr Leu Arg Thr Leu Ser Leu Ile Gln Tyr

565 570 575

Arg Asn Ile Thr Glu Leu Pro Asp Ser Ile Ser Asn Leu Val Leu Leu

580 585 590

Arg Tyr Leu Asp Leu Ser Tyr Thr Ser Ile Lys Ser Leu Pro Asp Ala

595 600 605

Thr Phe Arg Leu Tyr Asn Leu Gln Thr Leu Lys Leu Ser His Cys Glu

610 615 620

His Leu Thr Glu Leu Thr Glu Gln Ile Gly Asp Leu Leu Leu Leu Arg

625 630 635 640

Tyr Leu Asp Leu Ser Tyr Thr Ser Ile Asn Gln Leu Pro Glu Gln Ile

645 650 655

Gly Asn Leu Val Asn Leu Arg His Leu Asp Ile Arg Gly Thr Asn Leu

660 665 670

Thr Glu Met Pro Ala Gln Ile Ser Lys Leu Gln Asp Leu Arg Val Leu

675 680 685

Thr Ser Phe Val Val Gly Arg Glu Asp Gly Val Asn Ile Arg Glu Leu

690 695 700

Arg Lys Phe Pro Tyr Leu Gln Gly Thr Leu Ser Ile Leu Arg Leu Gln

705 710 715 720

Asn Val Val Asp Pro Lys Asp Ala Phe Gln Ala Asp Leu Lys Lys Lys

725 730 735

Glu His Ile Glu Glu Leu Arg Leu Glu Trp Gly Ser Glu Pro Gln Asp

740 745 750

Ser Gln Ile Glu Lys Asp Val Leu Gln Asn Leu Gln Pro Ser Thr Asn

755 760 765

Leu Lys Lys Leu Ser Val Arg Tyr Tyr Ser Gly Thr Ser Phe Pro Lys

770 775 780

Trp Leu Gly Asp Ser Ser Tyr Ser Tyr Val Ile Phe Leu Cys Ile Thr

785 790 795 800

Asn Cys Lys Tyr Cys Phe Ser Leu Pro Pro Phe Gly Gln Leu Pro Ser

805 810 815

Leu Lys Glu Leu Val Ile Lys Arg Met Lys Met Val Lys Thr Val Gly

820 825 830

Glu Glu Phe Tyr Cys Asn Asn Gly Val Ser Leu Ser Phe Gln Pro Phe

835 840 845

Pro Leu Leu Glu Ser Ile Glu Phe Glu Glu Met Ser Glu Trp Glu Glu

850 855 860

Trp Leu Pro Phe Glu Gly Glu Gly Ser Lys Phe Pro Phe Pro Cys Leu

865 870 875 880

Lys His Leu Ser Leu Ser Lys Cys Pro Lys Leu Arg Gly Asn Leu Pro

885 890 895

Asn His Leu Pro Ser Leu Thr Glu Val Ser Ile Ser Glu Cys Asn Arg

900 905 910

Leu Glu Ala Lys Ser His Asp Leu His Trp Asn Thr Ser Ile Glu Glu

915 920 925

Ile Thr Ile Arg Glu Ala Gly Glu Gln Leu Leu Ser Leu Leu Asp Asn

930 935 940

Phe Ser Tyr Arg Asn Leu Arg Ile Glu Lys Cys Asp Ser Leu Ser Ser

945 950 955 960

Leu Pro Arg Met Ile Leu Ala Ala Asn Cys Leu Gln Arg Leu Thr Leu

965 970 975

Lys Asp Ile Pro Asn Leu Ile Ser Phe Pro Ala Asp Gly Leu Pro Thr

980 985 990

Ser Leu Gln Phe Leu Asp Ile AspAsn Cys Glu Asn LeuGlu Phe Leu

995 1000 1005

Ser ProGlu Ser Cys His LysTyr Thr Ser Leu GluTyr Leu Ser

1010 1015 1020

Ile ValAsn Ser Cys His SerLeu Ala Ser Leu ProLeu Asp Gly

1025 1030 1035

Phe SerSer Leu Gln Ser LeuGln Ile Leu Glu CysPro Asn Met

1040 1045 1050

Glu AlaIle Thr Thr Gln GlyGly Thr Asn Ala LeuLys Leu Thr

1055 1060 1065

Tyr LeuTyr Val Tyr Lys CysLys Lys Leu Arg SerLeu Pro Glu

1070 1075 1080

Gln IleAsp Leu Pro Ala LeuGln Trp Leu Gly LeuSer Glu Leu

1085 1090 1095

Pro GluLeu Thr Ser Leu ProPro Arg Cys Leu ProSer Ser Leu

1100 1105 1110

Glu ThrLeu Lys Val Glu ValGly Met Leu Ser SerMet Ser Lys

1115 1120 1125

His GluLeu Gly Phe Leu PheGln Arg Leu Thr SerLeu Ser Arg

1130 1135 1140

Leu TyrIle Ser Gly Phe GlyGlu Glu Asp Val ValAsn Thr Leu

1145 1150 1155

Leu LysGlu Cys Leu Leu ProThr Ser Leu Gln HisLeu Ser Leu

1160 1165 1170

Trp TyrPhe Asp Asp Leu LysLeu Leu Glu Gly LysGly Leu Gln

1175 1180 1185

His LeuThr Ser Leu Arg AspLeu Gly Ile Arg AsnCys Lys Ser

1190 1195 1200

Leu GluSer Leu Pro Glu AspGln Leu Pro Ser SerLeu Glu Leu

1205 1210 1215

Leu GluIle His Gly Cys ProLeu Leu Glu Ala ArgTyr Gln Ser

1220 1225 1230

Arg LysGly Lys His Trp SerLys Ile Ala His IlePro Ala Ile

1235 1240 1245

Lys IleAsn Asp Glu Val IleIle

1250 1255

<210>2

<211>3771

<212>DNA

<213>短绒野大豆(Glycine tomentella)

<400>2

atggctttgg ctattgtggg agaggcactt atctctgctt ctgtggagat cttgctggat60

aggataactt ctgtggagtt tcgaaatttc tttgccaata gaaagctgaa tgtttctctc 120

ttggatgagc tgaagataaa gctgttggca ctcagtgctg tgctcaatga tgctgaggag 180

aaacagatca ctaattcaga agtgaaggca tggcttgatg agttgaaaga tgctgtttta 240

gacgcagagg atttgttgga ccaaatcaac acagattctc tgaggtgcaa ggtggaggaa 300

caatacaaaa cctttaaaag ccaggtgtgg tcatcacttt cttctccctt taatcaattc 360

tataggagca tgaattccaa gcttgaagca atatctggaa ggctagaaaa ttttatcaaa 420

caaaaagata ttcttggttt gaaaagtgtt gctggcagag tctcttaccg aaaagataca 480

gatcgatcgg tggaatatgt tgttgcaaga gacgatgaca aaaagaagct gttgaccatg 540

cttctctctg atgaagatga gaataataat cacataaaag tgctgacaat atggggcatg 600

ggaggtcttg gaaaaacaac ccttgctcag agccttttaa atgacgatgc agtgcagaac 660

cattttgatc tcaaagcttg ggcatgggta tctgatcctt ttgatgtgtt taaggcaacg 720

aaggcaattg ttgaatctgc cacttcaaaa acttgtgata ctactaattt tgatgctctt 780

cgagttgaat tgaagaacac ctttaaagat aaattttttt tgcttgtgct cgatgacctt 840

tggaatatgc agtatcatga ttgggatcaa ctaatagccc cttttattag ctgtgggaag 900

aagggaagta taatcattgt gacaacccga caacacagaa ttgcagaaat cactagtaca 960

tttcccattc acgagctgaa gattcttaca gatgacaact gttggtgtat acttgctaaa1020

catgcatttg gaaatcaagg atatgacaaa tatcccatcc tagcagaaat tggtagacaa1080

attgcaacaa aatgcaaggg tctaccatta gcagctaaaa cattgggagg tcttttgcga1140

tcaaatgttg atgcagagta ttggaatgaa attctgaaca gcaacatgtg ggcaaataat1200

gaagttttac cagctttatg cataagttat cttcaacttc caccacatct gaaaagatgt1260

tttgcctatt gctcaatttt tcctagacaa catttgttgg ataggaagga attgattctg1320

ttatggatgg ctgaaggctt tcttccacaa atccacagag agaaagcaat ggaatcagca1380

ggtgaagact acttcaatga attgttatct agatctttaa ttgaaaaaga caaaaatgag1440

ggaaaggaac agtttcgaat gcatgacctt atctacgatt tagccagact agtctctggt1500

aagagatctt gttactttga aggaggagaa gtcccaataa atgttcgcca tctgacatat1560

catcccagat atcttgatgt ctctacaaga tttgagggct tgtatgggct aaagcttttg1620

cgcagctttt tacgactatc tcaatattct agtagtgtat ccaaaagggt gacacatgag1680

tggctgccaa cactaacata tctgcgaaca ttgtccttga ttcagtatag aaatatcact1740

gagctgcctg attcaataag caatttggta ctgttgcggt atcttgacct ttcctatact1800

tccatcaaaa gtttgcctga tgcaaccttt aggctttaca atttgcagac tttgaaatta1860

tcacattgtg aacatcttac agagttgact gaacagatag gagatttgtt acttttacgg1920

tatcttgacc tttcctatac ttccatcaat cagctgcctg aacagatagg aaatttggtc1980

aatctacgcc accttgatat tagaggcaca aatttgacgg agatgccagc acaaataagc2040

aagctacaag atctccgtgt gttgacttct tttgttgtag gcagagaaga tggagtaaat2100

atcagagaat taagaaagtt tccttacttg caaggtacgc tttccatttt gaggttacaa2160

aatgttgttg atcccaagga tgcttttcaa gctgacttaa agaagaaaga gcatattgag2220

gagcttaggt tggagtgggg cagtgagcca caagattcac aaattgagaa agatgtactt2280

cagaacctgc aaccatcgac aaatttaaag aaactcagcg taagatacta cagtggcaca2340

agctttccta aatggttggg tgactcttca tattcttatg ttatattcct ttgcatcact2400

aattgcaaat attgcttttc acttccacca tttggacaac taccttctct caaggagctt2460

gtgataaaaa ggatgaaaat ggtgaagaca gttggtgaag aattctactg caacaatggg2520

gtttcccttt catttcaacc atttccattg ttggagagta tcgagttcga agagatgtca2580

gagtgggaag agtggctacc atttgaaggt gaaggcagca agtttccttt tccttgcctt2640

aaacatttga gtttatcaaa atgccccaag ttgagaggaa acttgcccaa ccatctacct2700

tccttgacag aggttagtat atcagagtgc aaccggctag aggcaaaatc acatgatcta2760

cattggaaca catcaattga agaaataacg attagagaag caggagaaca attgttgtcc2820

ttgcttgaca acttttctta caggaatcta cggattgaaa aatgtgacag cttgtcatct2880

ttgccaagaa tgatactagc tgccaattgt ctccaaaggt tgactcttaa ggatatcccc2940

aatttgattt ccttcccagc cgatggcttg ccaacgtcat tgcaatttct tgacattgac3000

aactgtgaga acttagaatt tctgtctccc gaatcatgcc acaaatacac atcacttgaa3060

tatctgtcaa ttgtcaatag ctgccattcc ctggcatcct taccattaga tggtttctct3120

tccctacaaa gtcttcaaat cttggaatgt cccaacatgg aagcaattac tactcaaggt3180

ggaacgaatg ctctcaaatt aacttatctt tatgtttata aatgtaagaa acttaggtca3240

cttccagaac agattgatct ccctgccctt caatggttag ggctttctga gcttccagag3300

ctgacatcat tgcccccaag gtgtttgcct tccagtttag aaacactcaa agttgaagtt3360

ggaatgctat catcaatgtc taaacacgag ttaggtttcc tattccaacg cctcacttct3420

ctgtctcgtc tttacattag tggttttggg gaggaagatg ttgttaacac cctgttgaag3480

gagtgcttac tgcccacttc gctgcaacat ctgtccctat ggtattttga tgatttaaag3540

ttgttggaag gaaaagggct ccaacatctc acttccctca gagatcttgg catcaggaat3600

tgtaaaagcc tcgagtcctt gcccgaagat cagcttccat cctctcttga attactggag3660

atacatggtt gtcctttact agaagcaagg tatcaaagtc ggaaagggaa acactggtct3720

aagattgctc acattcctgc gatcaagata aatgatgaag tgataatatg a 3771

<210>3

<211>17590

<212>DNA

<213>人工

<220>

<223>载体25307

<400>3

attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt60

taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120

tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180

tccctaatta gctaacccgg gggcgcgccg ggaccctaaa tatttaaata tattttgata 240

tgcacacata tttcaaaaaa ttgttatttt gttgtgttct aggtagaatt ttcttcacat 300

taataatgtc ttgcatgctc cttttttact ttcttttaaa caaagttgat ttattttatt 360

ttattttatt ttgtaattgt gttatcagta caaattattt aatggttttg ttcatgatta 420

ttttttgtca aaaaataaca cctatatcca cgtaataata cattctttta taatacattt 480

taaaattaaa ttaattaaat atgttaaagt tatcaatata tacatttctt aggtcctatg 540

ttatttggga atccgttaga cttgcaaggc tttgattttt attctacagg gatctctaat 600

ttaggctatg ttttgttttg atttaattat atttttttta gttctcactc atattttaat 660

ttatgggaaa ttttatagta ttttaaattt taattcttta tactttattt ttatacaatt 720

taattattaa aattaagttc ctcatttcaa atttcatcca ataacgtatg aataaaagat 780

tgtgaggtga ctttgattta tacaaattgg tgtaagaaag ataaatatat attaagagaa 840

aaaaaataac ttcttgtaag gacacattat cacataatgt attgtaagga cttcaatgta 900

agaaattgtg aatcaaaact atcgaccact cctattacta ctttattgtc attgtataaa 960

tatttattta aggcaactta atcacatcct caaatttgaa aaaagtattt tttttcaatt1020

tttattctcc atgtccagta tcattgccct taaaaagcta aaaaaaaaac atatatagat1080

gtgcaatcta aaatacatga tttctttatt aataataatc atttaatatc ttaccaaatt1140

attatcaatt tgccacagca tgtcaatttt tttttgttca tagtaatcta ttactttatt1200

tttatacact ttatacgaat aaataaataa attaaaaatt tgcaacaata aacaattata1260

tgtaaattat taaaactttt ttgaaggaat aaattatcat aactttaata atataaatta1320

ttatttttaa ttaaatataa aaaatgatag ccaaaaaatt atacatgatg aagtttaaac1380

ttaatatccg tgcaaggcac accggatttt acgctagtaa attttaacta aaattacaca1440

tgttaaatta aagggatcag aagtgtaatt attttatttt atttttttta aaaatcatct1500

taaaataata caagtaataa gtaattattc taaaaatttg attcctccga gagtgaaact1560

ttcaactacc taatgcaaac tttgtcaaag tgaaatttga ctacacccag caaactttgt1620

aagcaatgtt gcaatgttct aagagttaat ctcatagcta ttcttgtaag gactccgaat1680

caattaaaga caaagagtag ggaatctaac tttttcaaca acaaattaat tacatgcacg1740

atagtgtagg ccgtttaaga aagtttaaga gagtaactga tatgtggcat cttagatata1800

tactaagcaa ataatattgc ataatagaac atgaaatcat gaatgctgat ttaaaagcat1860

taaacaaacg aattgaggaa tgagggaggt gtcaagtttt aggaattcag aaaaatgtat1920

aattaactct tattaagttt ttttttgctg aaattcactg tattattaca cttcgtaggc1980

agaagatatc aggaaggacc gaagaagtat acattattga aaaagtccaa acgcagagtg2040

gttggatggt cacattaaag gaaataaact attgtactat tctttgtttt ctcaaagaca2100

ggcaaataaa acatttattt atgatcatac cctaattcct cactagctaa gatataacct2160

tcagcgtttg actaaaggtt cagagatctg atactatttg caaaactaga gaagagatgg2220

ctttggctat tgtgggagag gcacttatct ctgcttctgt ggagatcttg ctggatagga2280

taacttctgt ggagtttcga aatttctttg ccaatagaaa gctgaatgtt tctctcttgg2340

atgagctgaa gataaagctg ttggcactca gtgctgtgct caatgatgct gaggagaaac2400

agatcactaa ttcagaagtg aaggcatggc ttgatgagtt gaaagatgct gttttagacg2460

cagaggattt gttggaccaa atcaacacag attctctgag gtgcaaggtg gaggaacaat2520

acaaaacctt taaaagccag gtgtggtcat cactttcttc tccctttaat caattctata2580

ggagcatgaa ttccaagctt gaagcaatat ctggaaggct agaaaatttt atcaaacaaa2640

aagatattct tggtttgaaa agtgttgctg gcagagtctc ttaccgaaaa gatacagatc2700

gatcggtgga atatgttgtt gcaagagacg atgacaaaaa gaagctgttg accatgcttc2760

tctctgatga agatgagaat aataatcaca taaaagtgct gacaatatgg ggcatgggag2820

gtcttggaaa aacaaccctt gctcagagcc ttttaaatga cgatgcagtg cagaaccatt2880

ttgatctcaa agcttgggca tgggtatctg atccttttga tgtgtttaag gcaacgaagg2940

caattgttga atctgccact tcaaaaactt gtgatactac taattttgat gctcttcgag3000

ttgaattgaa gaacaccttt aaagataaat tttttttgct tgtgctcgat gacctttgga3060

atatgcagta tcatgattgg gatcaactaa tagccccttt tattagctgt gggaagaagg3120

gaagtataat cattgtgaca acccgacaac acagaattgc agaaatcact agtacatttc3180

ccattcacga gctgaagatt cttacagatg acaactgttg gtgtatactt gctaaacatg3240

catttggaaa tcaaggatat gacaaatatc ccatcctagc agaaattggt agacaaattg3300

caacaaaatg caagggtcta ccattagcag ctaaaacatt gggaggtctt ttgcgatcaa3360

atgttgatgc agagtattgg aatgaaattc tgaacagcaa catgtgggca aataatgaag3420

ttttaccagc tttatgcata agttatcttc aacttccacc acatctgaaa agatgttttg3480

cctattgctc aatttttcct agacaacatt tgttggatag gaaggaattg attctgttat3540

ggatggctga aggctttctt ccacaaatcc acagagagaa agcaatggaa tcagcaggtg3600

aagactactt caatgaattg ttatctagat ctttaattga aaaagacaaa aatgagggaa3660

aggaacagtt tcgaatgcat gaccttatct acgatttagc cagactagtc tctggtaaga3720

gatcttgtta ctttgaagga ggagaagtcc caataaatgt tcgccatctg acatatcatc3780

ccagatatct tgatgtctct acaagatttg agggcttgta tgggctaaag cttttgcgca3840

gctttttacg actatctcaa tattctagta gtgtatccaa aagggtgaca catgagtggc3900

tgccaacact aacatatctg cgaacattgt ccttgattca gtatagaaat atcactgagc3960

tgcctgattc aataagcaat ttggtactgt tgcggtatct tgacctttcc tatacttcca4020

tcaaaagttt gcctgatgca acctttaggc tttacaattt gcagactttg aaattatcac4080

attgtgaaca tcttacagag ttgactgaac agataggaga tttgttactt ttacggtatc4140

ttgacctttc ctatacttcc atcaatcagc tgcctgaaca gataggaaat ttggtcaatc4200

tacgccacct tgatattaga ggcacaaatt tgacggagat gccagcacaa ataagcaagc4260

tacaagatct ccgtgtgttg acttcttttg ttgtaggcag agaagatgga gtaaatatca4320

gagaattaag aaagtttcct tacttgcaag gtacgctttc cattttgagg ttacaaaatg4380

ttgttgatcc caaggatgct tttcaagctg acttaaagaa gaaagagcat attgaggagc4440

ttaggttgga gtggggcagt gagccacaag attcacaaat tgagaaagat gtacttcaga4500

acctgcaacc atcgacaaat ttaaagaaac tcagcgtaag atactacagt ggcacaagct4560

ttcctaaatg gttgggtgac tcttcatatt cttatgttat attcctttgc atcactaatt4620

gcaaatattg cttttcactt ccaccatttg gacaactacc ttctctcaag gagcttgtga4680

taaaaaggat gaaaatggtg aagacagttg gtgaagaatt ctactgcaac aatggggttt4740

ccctttcatt tcaaccattt ccattgttgg agagtatcga gttcgaagag atgtcagagt4800

gggaagagtg gctaccattt gaaggtgaag gcagcaagtt tccttttcct tgccttaaac4860

atttgagttt atcaaaatgc cccaagttga gaggaaactt gcccaaccat ctaccttcct4920

tgacagaggt tagtatatca gagtgcaacc ggctagaggc aaaatcacat gatctacatt4980

ggaacacatc aattgaagaa ataacgatta gagaagcagg agaacaattg ttgtccttgc5040

ttgacaactt ttcttacagg aatctacgga ttgaaaaatg tgacagcttg tcatctttgc5100

caagaatgat actagctgcc aattgtctcc aaaggttgac tcttaaggat atccccaatt5160

tgatttcctt cccagccgat ggcttgccaa cgtcattgca atttcttgac attgacaact5220

gtgagaactt agaatttctg tctcccgaat catgccacaa atacacatca cttgaatatc5280

tgtcaattgt caatagctgc cattccctgg catccttacc attagatggt ttctcttccc5340

tacaaagtct tcaaatcttg gaatgtccca acatggaagc aattactact caaggtggaa5400

cgaatgctct caaattaact tatctttatg tttataaatg taagaaactt aggtcacttc5460

cagaacagat tgatctccct gcccttcaat ggttagggct ttctgagctt ccagagctga5520

catcattgcc cccaaggtgt ttgccttcca gtttagaaac actcaaagtt gaagttggaa5580

tgctatcatc aatgtctaaa cacgagttag gtttcctatt ccaacgcctc acttctctgt5640

ctcgtcttta cattagtggt tttggggagg aagatgttgt taacaccctg ttgaaggagt5700

gcttactgcc cacttcgctg caacatctgt ccctatggta ttttgatgat ttaaagttgt5760

tggaaggaaa agggctccaa catctcactt ccctcagaga tcttggcatc aggaattgta5820

aaagcctcga gtccttgccc gaagatcagc ttccatcctc tcttgaatta ctggagatac5880

atggttgtcc tttactagaa gcaaggtatc aaagtcggaa agggaaacac tggtctaaga5940

ttgctcacat tcctgcgatc aagataaatg atgaagtgat aatatgacct gtggcatgag6000

taggaagtag gaaccatcca gaagctgaaa ttcactgtat tattacactt cgtaggcaga6060

agatatcagg aaggaccgaa gaagtataca ttattgaaaa agtccaaacg cagagtggtt6120

ggatggtcac attaaaggaa ataaactatt gtactattct ttgttttctc aaagacaggc6180

aaataaaaca tttatttatg atcataccct aattcctcac tagctaagat ataaccttca6240

gcgtttgact aaaggttcag agatctgata ctatttgcaa aactagagaa gagaagttga6300

ataattattt taaaatgttc tgattatagt gcaagcttgc aagtgaatga agtgatagat6360

tgtatgtgta tatgggcatt gttatcaaac ttgatctgga ctggccggtc ggatcgagat6420

tcgatgacat aatcagatcg gttccacttt cgaatcagtt aaacagttga tccggttaaa6480

cccggtcagg tcaccagatc ccagttggac ttgtccgact cggttgattt ttttttaaaa6540

actaattttt ataatttttt aaaatttgaa ttttggaatg tggatgagtt tttcttactc6600

aaataatgtt agttatatac ttatatgtaa tagatatata tatatatata agtttgaatt6660

cttaatatat atcgagtcaa atcaggctaa ttactggctc accagttgga ccactaactc6720

gctgacctat tacctcgatc gggtcaatga ctagactgag tttcacaact atgattacgg6780

ggaaacaatg tcaataagtt agattataaa atctgatttt tgactataaa aaaaaccaac6840

taataaaagt gtaacaaatt aagaatatat ttatgataca agaaaaaaaa tatgcaaaat6900

gatagtttgt agctcctttc aaaatcaata tcatctagca acccacgatt ttcggcatta6960

gaagctttac ttaaacgtgg tatcaaattc ttttaacatt ggccatctaa ttcttttatt7020

tttatttgat tttttttggt actataatca acttgattac acaaggagta ttctcaaata7080

ctctttgcac ttcctctccc acactgatac tcgctcctta atttggtaca acatggcttt7140

tacaaagaca aaacatataa aacaatgttg aataacccaa ctaatttagc acaaaatatt7200

gtattgaaca aattgttcat agtttcatat tagcatgttg ttaacggaac ctcaataaga7260

atgatcttaa attttttggt tgattttgtg agacggaccc ctaattagct aagagacact7320

tgtgtgattg agagaaacac taatcttgtg aggactgaag tttggtgatt atttcttgtg7380

atctgtcgac aaaaatatca aatggggttt cttttacaaa ttatttacct aaatgaatct7440

gttttgaaaa tatttactcc attgggtcta tttttttatt acaaagcgtc tccctgaagg7500

gcgcgttccc cgtgaaagtg acacgtggca ggacttggga cgtgccctgc gtacaggcgc7560

gatagttagt gttgttacag caggcgcatc gggtcgtgtt ggggaccaag gtacgacagg7620

tcgcgctggg tgacccagac acgacccaat tgggtcgcac tttatttaat attttttata7680

ttttgtatat tgtttttatt taatatattt ttatattatt ttatttaatt tttttatatt7740

ttatataata gtttctatat taaataaatt cttagcatta tgtatgattt taaagtcata7800

aataattttt tatattgttt ttatttacta tattttttat attttattta atatttatat7860

attaaataaa tccttcatat tagaaaaaat aaagaaaata ttaaataaaa tataaaatat7920

aaaaaagtaa aaaatattaa ataaaataat ataaaaaata ttataaaaac aatataaaaa7980

atataaaaat atttaataaa ataataaaaa aaatattatt ttaaataaaa ttatttatga8040

ctttaaactc taaagttgaa ttttaaaaaa atataatttt tttacgattt tagtaaaaaa8100

aaaatacaag ccgcacaata caagtcgcct tctcaaaccc ttcctcacga cattctcgga8160

ccttatgaca ccgtcaccaa aacaatgatc cacgcgatat taggcgcgtg caaatcactc8220

taatccgaaa ctagtagaca tgggaagcac gagctatacg cgagcgtttc aattgccgcc8280

acgaaagcag agaaggccag aaacggaacc acggtaaaat ggtaagggta ttttcgtaaa8340

cagaagaaaa gagttgtagc tataaataaa ccctctaacc cacggcgcac tatttctctt8400

cactccttcg ttcactcttc ttctcttgcg gctagggttt tagcgcagct tcttctaggt8460

tcgttctctt ccgccgctct atggatttta aaccttcgaa tcatgtttat tccattgaat8520

tatgttgctt gcagtttata ttttctgaat ctgtagttgt tgtcttcaat ttatcctatg8580

ctttatagat caatcttttg tgtgtgtagt acgtaatttt tgttcttttt gcttttcgtt8640

caagttgttg ggaataatcg gggtatcatg ttttgatatt gtttgttttc ttttttgact8700

gcttaataat ttttaagttg gttttggttt tggggtttta tgtgcttgtt atattcaaat8760

ctttgtgatc cagatcttac aaaagttttg ggtttaagga tgtttttggc tgatgatgaa8820

tagatctata aactgttcct tttaatcgat tcaagcttag gattttacta ggcttttgcg8880

aataaatacg tgacagtaag ctaattatgt cctttttttg tctcaatcat atctgtctgg8940

gtgtgccata atttgtgata tgtctatctg gtagaatctt gtgttttatg ctttacgatt9000

tggtatacct gtttttgaac ttgttgtatg atgggtattt agatcaccct atctttttta9060

tgcttctgga agttttatgt aaatgtcgaa tatcttaatg ttgttgaact tataatgttg9120

tgttgatgta tgtatgatgg ttttgacaac ttttttcact ggttctgaaa gttttatgta9180

aattgcaaat atgttaatgt tgttgaactt attttttttc cttcgatgtt gttttgatgt9240

atgtatgatg gttttcaccg tagtttctat ggctaatatc ttaatgttgt tgagcttatt9300

tttttcctta tatgttgtgt tgatgtattg tatgatggtt ttgacaactt ttttagtttc9360

tttgcagatt taaggaagga tcaaaaatgg ctgctgctgc tgcagctcca tctccatcat9420

tctctaagac cttgtcctct tcatcctcta agtcctctac tcttttgcca aggtctactt9480

tcccattccc acatcatcca cataagacta ctccaccacc acttcatctt accccaaccc9540

atattcactc tcagagaaga aggttcacca tctctaacgt tatctccacc acccaaaagg9600

tttcagagac tcaaaaggct gagactttcg tttctaggtt cgctccagat gagccaagaa9660

agggatctga tgttcttgtt gaggctcttg aaagggaagg tgttactgat gttttcgctt9720

atccaggtgg cgcttctatg gaaattcatc aagctcttac caggtcctcc atcattagaa9780

acgttttgcc aagacatgag cagggtggtg ttttcgctgc tgaaggatat gctagagcta9840

ctggattccc tggtgtgtgt attgctactt ctggaccagg tgctaccaac cttgtttctg9900

gacttgctga tgctctcctt gattctgttc caattgtggc tattaccgga caagttgcta9960

gaaggatgat tggaaccgat gctttccaag agactccaat tgtggaagtg accagatcta 10020

tcaccaagca caactacctt gtgatggatg ttgaggatat tccaagggtt gtgagagagg 10080

cattcttctt ggctagatct ggtagaccag gaccagttct tattgatgtg ccaaaggata 10140

ttcagcagca gcttgttatc ccagattggg atcaacctat gagacttcca ggttacatgt 10200

ctaggcttcc aaagcttcct aacgagatgc ttcttgagca gattgtgagg cttatttccg 10260

agtctaagaa gccagttctc tacgttggtg gtggatgctc tcaatcttct gaggaactta 10320

gacgtttcgt tgagcttacc ggaattccag ttgcttctac tcttatggga cttggagctt 10380

tcccaactgg tgatgaactt tctctttcca tgcttggaat gcatggaacc gtttatgcta 10440

actacgctgt ggattcctcc gatcttcttc ttgctttcgg tgttaggttc gatgatagag 10500

ttaccggaaa gcttgaggct ttcgcttcta gagctaagat tgtgcacatc gatatcgatt 10560

ccgctgagat tggaaagaac aagcagccac atgtgtccat ttgcgctgat attaagcttg 10620

cacttcaggg actcaactcc attcttgaat ccaaagaggg aaagctcaag cttgatttct 10680

ctgcttggag gcaagagctt actgttcaga aggttaagta ccccctcaac ttcaagactt 10740

tcggagatgc tattccacca cagtacgcta ttcaagtgct tgatgagctt accaacggct 10800

ctgctattat ttctactggt gttggacagc atcagatgtg ggctgctcaa tattacaagt 10860

acagaaagcc aaggcagtgg cttacttctg gtggacttgg tgctatggga ttcggacttc 10920

cagctgctat tggagctgct gttggtagac cagatgaagt tgttgtggat atcgatggtg 10980

atggctcctt cattatgaac gttcaagagc ttgccaccat caaggttgaa aaccttccag 11040

tgaagatcat gctccttaac aaccagcatc ttggaatggt tgtgcaactt gaggacagat 11100

tctacaaggc taacagggct catacctatc ttggaaaccc atctaacgag gctgagattt 11160

tcccaaacat gcttaagttc gctgaggctt gcggagttcc tgctgctaga gttactcata 11220

gagatgatct cagggctgct attcagaaga tgcttgatac tccaggacca taccttctcg 11280

atgttattgt gccacatcaa gagcatgtgc tcccaatgat tccatctggt ggtgctttca 11340

aggatgttat tactgagggt gatggaaggt cctcctacta agtgctagca ttttgtacat 11400

tgagtaggga agagagagag atatatataa atactcacaa agcagtgagt atatggcttg 11460

cttttgtttc taaacattcc tttataagga cttgagataa tttgtattgt ttaaaagagc 11520

cattggttct gttgtatcaa agtaatttaa ttttcagtac cgacttggct ctactcatat 11580

gtggtggtgt acattgcatc tttgcatttg attccatatc tattgggatg ggaccataca 11640

ttttttgttt attatttaag tcaaacatat cagataatat gtggtgacca gaaaagtgtc 11700

tagcaatcaa atgggtctgt gattgcatgt ttgagttcag gacatttatt aatgagtgac 11760

agaattttaa aaagctcgcc aataggagtt gccacatctg atcgagtctt ctgtaaacac 11820

taactgtaac ttgagtttga taatcagatt ccccccgttg gtaggtaata tgtaaatttc 11880

actatagatt cttactgagg atgatggtct tgacttcgaa gtggtgagtg taattctcta 11940

atctaaactt tatatatata taaaaaaaga atgttaaaaa cttgagtgac atacagcaaa 12000

tagcaatgaa agcatgacca ttggccttgg ggggccaaat ggccatgtac cacttttcca 12060

cctacttgag agccattggt cctgaatgag gtccttttgt ttcatttttt ttacaataaa 12120

gaaagttcat attcttggca atagcaaggc aaatcatttg tggaagtcac atgaaattca 12180

ccatactaat tagctaacgg acccgattta aatcggtacc actagtaata ttcggaccgc 12240

ctgcaggccc gggggcgcgc cctaattagc taacggccag gatcgccgcg tgagccttta 12300

gcaactagct agattaatta acgcaatctg ttattaagtt gtctaagcgt caatttgttt 12360

acaccacaat atatcctgcc accagccagc caacagctcc ccgaccggca gctcggcaca 12420

aaatcaccac tcgatacagg cagcccatca gaattaattc tcatgtttga cagcttatca 12480

tcgactgcac ggtgcaccaa tgcttctggc gtcaggcagc catcggaagc tgtggtatgg 12540

ctgtgcaggt cgtaaatcac tgcataattc gtgtcgctca aggcgcactc ccgttctgga 12600

taatgttttt tgcgccgaca tcataacggt tctggcaaat attctgaaat gagctgttga 12660

caattaatca tccggctcgt ataatgtgtg gaattgtgag cggataacaa tttcacacag 12720

gaaacagacc atgagggaag cgttgatcgc cgaagtatcg actcaactat cagaggtagt 12780

tggcgtcatc gagcgccatc tcgaaccgac gttgctggcc gtacatttgt acggctccgc 12840

agtggatggc ggcctgaagc cacacagtga tattgatttg ctggttacgg tgaccgtaag 12900

gcttgatgaa acaacgcggc gagctttgat caacgacctt ttggaaactt cggcttcccc 12960

tggagagagc gagattctcc gcgctgtaga agtcaccatt gttgtgcacg acgacatcat 13020

tccgtggcgt tatccagcta agcgcgaact gcaatttgga gaatggcagc gcaatgacat 13080

tcttgcaggt atcttcgagc cagccacgat cgacattgat ctggctatct tgctgacaaa 13140

agcaagagaa catagcgttg ccttggtagg tccagcggcg gaggaactct ttgatccggt 13200

tcctgaacag gatctatttg aggcgctaaa tgaaacctta acgctatgga actcgccgcc 13260

cgactgggct ggcgatgagc gaaatgtagt gcttacgttg tcccgcattt ggtacagcgc 13320

agtaaccggc aaaatcgcgc cgaaggatgt cgctgccgac tgggcaatgg agcgcctgcc 13380

ggcccagtat cagcccgtca tacttgaagc taggcaggct tatcttggac aagaagatcg 13440

cttggcctcg cgcgcagatc agttggaaga atttgttcac tacgtgaaag gcgagatcac 13500

caaagtagtc ggcaaataaa gctctagtgg atctccgtac ccagggatct ggctcgcggc 13560

ggacgcacga cgccggggcg agaccatagg cgatctccta aatcaatagt agctgtaacc 13620

tcgaagcgtt tcacttgtaa caacgattga gaatttttgt cataaaattg aaatacttgg 13680

ttcgcatttt tgtcatccgc ggtcagccgc aattctgacg aactgcccat ttagctggag 13740

atgattgtac atccttcacg tgaaaatttc tcaagcgctg tgaacaaggg ttcagatttt 13800

agattgaaag gtgagccgtt gaaacacgtt cttcttgtcg atgacgacgt cgctatgcgg 13860

catcttatta ttgaatacct tacgatccac gccttcaaag tgaccgcggt agccgacagc 13920

acccagttca caagagtact ctcttccgcg acggtcgatg tcgtggttgt tgatctagat 13980

ttaggtcgtg aagatgggct cgagatcgtt cgtaatctgg cggcaaagtc tgatattcca 14040

atcataatta tcagtggcga ccgccttgag gagacggata aagttgttgc actcgagcta 14100

ggagcaagtg attttatcgc taagccgttc agtatcagag agtttctagc acgcattcgg 14160

gttgccttgc gcgtgcgccc caacgttgtc cgctccaaag accgacggtc tttttgtttt 14220

actgactgga cacttaatct caggcaacgt cgcttgatgt ccgaagctgg cggtgaggtg 14280

aaacttacgg caggtgagtt caatcttctc ctcgcgtttt tagagaaacc ccgcgacgtt 14340

ctatcgcgcg agcaacttct cattgccagt cgagtacgcg acgaggaggt ttatgacagg 14400

agtatagatg ttctcatttt gaggctgcgc cgcaaacttg aggcagatcc gtcaagccct 14460

caactgataa aaacagcaag aggtgccggt tatttctttg acgcggacgt gcaggtttcg 14520

cacgggggga cgatggcagc ctgagccaat tcccagatcc ccgaggaatc ggcgtgagcg 14580

gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct gggtgatgac ctggtggaga 14640

agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga ggcagaagca cgccccggtg 14700

aatcgtggca agcggccgct gatcgaatcc gcaaagaatc ccggcaaccg ccggcagccg 14760

gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca accagatttt ttcgttccga 14820

tgctctatga cgtgggcacc cgcgatagtc gcagcatcat ggacgtggcc gttttccgtc 14880

tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta cgagcttcca gacgggcacg 14940

tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg ggattacgac ctggtactga 15000

tggcggtttc ccatctaacc gaatccatga accgataccg ggaagggaag ggagacaagc 15060

ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa gttctgccgg cgagccgatg 15120

gcggaaagca gaaagacgac ctggtagaaa cctgcattcg gttaaacacc acgcacgttg 15180

ccatgcagcg tacgaagaag gccaagaacg gccgcctggt gacggtatcc gagggtgaag 15240

ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg gcggccggag tacatcgaga 15300

tcgagctggc tgattggatg taccgcgaga tcacagaagg caagaacccg gacgtgctga 15360

cggttcaccc cgattacttt ttgatcgatc ccggcatcgg ccgttttctc taccgcctgg 15420

cacgccgcgc cgcaggcaag gcagaagcca gatggttgtt caagacgatc tacgaacgca 15480

gtggcagcgc cggagagttc aagaagttct gtttcaccgt gcgcaagctg atcgggtcaa 15540

atgacctgcc ggagtacgat ttgaaggagg aggcggggca ggctggcccg atcctagtca 15600

tgcgctaccg caacctgatc gagggcgaag catccgccgg ttcctaatgt acggagcaga 15660

tgctagggca aattgcccta gcaggggaaa aaggtcgaaa aggtctcttt cctgtggata 15720

gcacgtacat tgggaaccca aagccgtaca ttgggaaccg gaacccgtac attgggaacc 15780

caaagccgta cattgggaac cggtcacaca tgtaagtgac tgatataaaa gagaaaaaag 15840

gcgatttttc cgcctaaaac tctttaaaac ttattaaaac tcttaaaacc cgcctggcct 15900

gtgcataact gtctggccag cgcacagccg aagagctgca aaaagcgcct acccttcggt 15960

cgctgcgctc cctacgcccc gccgcttcgc gtcggcctat cgcggccgct ggccgctcaa 16020

aaatggctgg cctacggcca ggcaatctac cagggcgcgg acaagccgcg ccgtcgccac 16080

tcgaccgccg gcgctgaggt ctgcctcgtg aagaaggtgt tgctgactca taccaggcct 16140

gaatcgcccc atcatccagc cagaaagtga gggagccacg gttgatgaga gctttgttgt 16200

aggtggacca gttggtgatt ttgaactttt gctttgccac ggaacggtct gcgttgtcgg 16260

gaagatgcgt gatctgatcc ttcaactcag caaaagttcg atttattcaa caaagccgcc 16320

gtcccgtcaa gtcagcgtaa tgctctgcca gtgttacaac caattaacca attctgatta 16380

gaaaaactca tcgagcatca aatgaaactg caatttattc atatcaggat tatcaatacc 16440

atatttttga aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc agttccatag 16500

gatggcaaga tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa tacaacctat 16560

taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag tgacgactga 16620

atccggtgag aatggcaaaa gctctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 16680

gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 16740

ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 16800

gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 16860

aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 16920

gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 16980

ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 17040

cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 17100

cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 17160

gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 17220

cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 17280

agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 17340

ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 17400

ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 17460

gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 17520

cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttga 17580

tccggaatta17590

<210>4

<211>16666

<212>DNA

<213>人工

<220>

<223>载体25374

<400>4

attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt60

taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120

tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180

tccctaatta gctaacccgg gggcgcgccg ggacccttaa ctagctagat tccaaaattt 240

tcagttagtc cttactaatt attaaattat agtattaatc caatgtgatt gcggttacat 300

catgtacgga aaaataattc taatccttgt tttaaatttg atcttgacta tttatttatt 360

ctttatttca ttttgtaaat cattttatgt atctcctggc aagcaatttt atccaccttg 420

caccaacacc ttcgggttcc ataatcaaac caccttaact tcacaccatg ctgtaactca 480

caccgcccag catctccaat gtgaaagaag ctaaaattta ataaacaatc atacgaagca 540

gtgacaaaat accagatggt attaatgctt tgataaaatt aattggaaag tataaaatgg 600

tagaaaataa taaattataa ttattttaaa taagataaaa aataattaaa aactaaaatg 660

ttaaaatttt aaaaaaatta ttttaaataa tatttaaaaa cattaaaaat cattttaaaa 720

aatttattta tagaacaatt aaataaatat ttcagctaat aaaaaacaaa agcttaccta 780

gccttagaag acaacttgtc caacaattag atgataccca ttgcccttac gttttcttta 840

acatcaatta ttgtttttgt caacaagcta tcttttagtt ttattttatt ggtaaaaaat 900

atgtcgcctt caagttgcat catttaacac atctcgtcat tagaaaaata aaactcttcc 960

ctaaacgatt agtagaaaaa atcattcgat aataaataag aaagaaaaat tagaaaaaaa1020

taacttcatt ttaaaaaaat cattaaggct atatttttta aatgactaat tttatataga1080

ctgtaactaa aagtatacaa tttattatgc tatgtatctt aaagaattac ttataaaaat1140

ctacggaaga atatcttaca aagtgaaaaa caaatgagaa agaatttagt gggatgatta1200

tgattttatt tgaaaattga aaaaataatt attaaagact ttagtggagt aagaaagctt1260

tcctattagt cttttcttat ccataaaaaa aaaaaaaaat ctagcgtgac agcttttcca1320

tagattttaa taatgtaaaa tactggtagc agccgaccgt tcaggtaatg gacactgtgg1380

tcctaacttg caacgggtgc gggcccaatt taataacgcc gtggtaacgg ataaagccaa1440

gcgtgaagcg gtgaaggtac atctctgact ccgtcaagat tacgaaaccg tcaactacga1500

aggactcccc gaaatatcat ctgtgtcata aacaccaagt cacaccatac atgggcacgc1560

gtcacaattt gattggagaa cggttccacc gcatatgcta taaattgccc ccacacccct1620

cgaccctaat cgcacttcaa ttgcaatcaa attagttcat tctctttgcg cagttcccta1680

cctctccttt caaggttcgt agatttcttc tgtttttttt tcttcttctt tattgtttgt1740

tctacatcag catgatgttg atttgattgt gttttctatc gtttcatcga ttataaattt1800

tcataatcag aagattcagc ttttattaat gcaagaacgt ccttaattga tgattttata1860

accgtaaatt aggtctaatt agagtttttt tcataaagat tttcagatcc gtttacaaca1920

agccttaatt gttgattctg tagtcgtaga ttaaggtttt tttcatgaac tacttcagat1980

ccgttaaaca acagccttat ttgttgatac ttcagtcgtt tttcaagaaa ttgttcagat2040

ccgttgataa aagccttatt cgttgattct gtatggtatt tcaagagata ttgctcaggt2100

cctttagcaa ctaccttatt tgttgattct gtggccatag attaggattt tttttcacga2160

aattgcttct tgaaattacg tgatggattt tgattctgat ttatcttgtg attgttgact2220

ctacagggat cctaaaccat ggctttggct attgtgggag aggcacttat ctctgcttct2280

gtggagatct tgctggatag gataacttct gtggagtttc gaaatttctt tgccaataga2340

aagctgaatg tttctctctt ggatgagctg aagataaagc tgttggcact cagtgctgtg2400

ctcaatgatg ctgaggagaa acagatcact aattcagaag tgaaggcatg gcttgatgag2460

ttgaaagatg ctgttttaga cgcagaggat ttgttggacc aaatcaacac agattctctg2520

aggtgcaagg tggaggaaca atacaaaacc tttaaaagcc aggtgtggtc atcactttct2580

tctcccttta atcaattcta taggagcatg aattccaagc ttgaagcaat atctggaagg2640

ctagaaaatt ttatcaaaca aaaagatatt cttggtttga aaagtgttgc tggcagagtc2700

tcttaccgaa aagatacaga tcgatcggtg gaatatgttg ttgcaagaga cgatgacaaa2760

aagaagctgt tgaccatgct tctctctgat gaagatgaga ataataatca cataaaagtg2820

ctgacaatat ggggcatggg aggtcttgga aaaacaaccc ttgctcagag ccttttaaat2880

gacgatgcag tgcagaacca ttttgatctc aaagcttggg catgggtatc tgatcctttt2940

gatgtgttta aggcaacgaa ggcaattgtt gaatctgcca cttcaaaaac ttgtgatact3000

actaattttg atgctcttcg agttgaattg aagaacacct ttaaagataa attttttttg3060

cttgtgctcg atgacctttg gaatatgcag tatcatgatt gggatcaact aatagcccct3120

tttattagct gtgggaagaa gggaagtata atcattgtga caacccgaca acacagaatt3180

gcagaaatca ctagtacatt tcccattcac gagctgaaga ttcttacaga tgacaactgt3240

tggtgtatac ttgctaaaca tgcatttgga aatcaaggat atgacaaata tcccatccta3300

gcagaaattg gtagacaaat tgcaacaaaa tgcaagggtc taccattagc agctaaaaca3360

ttgggaggtc ttttgcgatc aaatgttgat gcagagtatt ggaatgaaat tctgaacagc3420

aacatgtggg caaataatga agttttacca gctttatgca taagttatct tcaacttcca3480

ccacatctga aaagatgttt tgcctattgc tcaatttttc ctagacaaca tttgttggat3540

aggaaggaat tgattctgtt atggatggct gaaggctttc ttccacaaat ccacagagag3600

aaagcaatgg aatcagcagg tgaagactac ttcaatgaat tgttatctag atctttaatt3660

gaaaaagaca aaaatgaggg aaaggaacag tttcgaatgc atgaccttat ctacgattta3720

gccagactag tctctggtaa gagatcttgt tactttgaag gaggagaagt cccaataaat3780

gttcgccatc tgacatatca tcccagatat cttgatgtct ctacaagatt tgagggcttg3840

tatgggctaa agcttttgcg cagcttttta cgactatctc aatattctag tagtgtatcc3900

aaaagggtga cacatgagtg gctgccaaca ctaacatatc tgcgaacatt gtccttgatt3960

cagtatagaa atatcactga gctgcctgat tcaataagca atttggtact gttgcggtat4020

cttgaccttt cctatacttc catcaaaagt ttgcctgatg caacctttag gctttacaat4080

ttgcagactt tgaaattatc acattgtgaa catcttacag agttgactga acagatagga4140

gatttgttac ttttacggta tcttgacctt tcctatactt ccatcaatca gctgcctgaa4200

cagataggaa atttggtcaa tctacgccac cttgatatta gaggcacaaa tttgacggag4260

atgccagcac aaataagcaa gctacaagat ctccgtgtgt tgacttcttt tgttgtaggc4320

agagaagatg gagtaaatat cagagaatta agaaagtttc cttacttgca aggtacgctt4380

tccattttga ggttacaaaa tgttgttgat cccaaggatg cttttcaagc tgacttaaag4440

aagaaagagc atattgagga gcttaggttg gagtggggca gtgagccaca agattcacaa4500

attgagaaag atgtacttca gaacctgcaa ccatcgacaa atttaaagaa actcagcgta4560

agatactaca gtggcacaag ctttcctaaa tggttgggtg actcttcata ttcttatgtt4620

atattccttt gcatcactaa ttgcaaatat tgcttttcac ttccaccatt tggacaacta4680

ccttctctca aggagcttgt gataaaaagg atgaaaatgg tgaagacagt tggtgaagaa4740

ttctactgca acaatggggt ttccctttca tttcaaccat ttccattgtt ggagagtatc4800

gagttcgaag agatgtcaga gtgggaagag tggctaccat ttgaaggtga aggcagcaag4860

tttccttttc cttgccttaa acatttgagt ttatcaaaat gccccaagtt gagaggaaac4920

ttgcccaacc atctaccttc cttgacagag gttagtatat cagagtgcaa ccggctagag4980

gcaaaatcac atgatctaca ttggaacaca tcaattgaag aaataacgat tagagaagca5040

ggagaacaat tgttgtcctt gcttgacaac ttttcttaca ggaatctacg gattgaaaaa5100

tgtgacagct tgtcatcttt gccaagaatg atactagctg ccaattgtct ccaaaggttg5160

actcttaagg atatccccaa tttgatttcc ttcccagccg atggcttgcc aacgtcattg5220

caatttcttg acattgacaa ctgtgagaac ttagaatttc tgtctcccga atcatgccac5280

aaatacacat cacttgaata tctgtcaatt gtcaatagct gccattccct ggcatcctta5340

ccattagatg gtttctcttc cctacaaagt cttcaaatct tggaatgtcc caacatggaa5400

gcaattacta ctcaaggtgg aacgaatgct ctcaaattaa cttatcttta tgtttataaa5460

tgtaagaaac ttaggtcact tccagaacag attgatctcc ctgcccttca atggttaggg5520

ctttctgagc ttccagagct gacatcattg cccccaaggt gtttgccttc cagtttagaa5580

acactcaaag ttgaagttgg aatgctatca tcaatgtcta aacacgagtt aggtttccta5640

ttccaacgcc tcacttctct gtctcgtctt tacattagtg gttttgggga ggaagatgtt5700

gttaacaccc tgttgaagga gtgcttactg cccacttcgc tgcaacatct gtccctatgg5760

tattttgatg atttaaagtt gttggaagga aaagggctcc aacatctcac ttccctcaga5820

gatcttggca tcaggaattg taaaagcctc gagtccttgc ccgaagatca gcttccatcc5880

tctcttgaat tactggagat acatggttgt cctttactag aagcaaggta tcaaagtcgg5940

aaagggaaac actggtctaa gattgctcac attcctgcga tcaagataaa tgatgaagtg6000

ataatatgag agctcagctt tttgtgatct gatgataagt ggttggttcg tgtctcatgc6060

acttgggagg tgatctattt cacctggtgt agtttgtgtt tccgtcagtt ggaaaaactt6120

atccctatcg atttcgtttt cattttctgc ttttctttta tgtaccttcg tttgggcttg6180

taacgggcct ttgtatttca actctcaata ataatccaag tgcatgttaa acaatttgtc6240

atctgtttcg gctttgatat actactggtg aagatgggcc gtactactgc atcacaacga6300

aaaataataa taagatgaaa aacttgaagt ggaaaaaaaa aacttgaatg ttcactacta6360

cctagctagc ggacccctaa ttagctaaga gacacttgtg tgattgagag aaacactaat6420

cttgtgagga ctgaagtttg gtgattattt cttgtgatct gtcgacaaaa atatcaaatg6480

gggtttcttt tacaaattat ttacctaaat gaatctgttt tgaaaatatt tactccattg6540

ggtctatttt tttattacaa agcgtctccc tgaagggcgc gttccccgtg aaagtgacac6600

gtggcaggac ttgggacgtg ccctgcgtac aggcgcgata gttagtgttg ttacagcagg6660

cgcatcgggt cgtgttgggg accaaggtac gacaggtcgc gctgggtgac ccagacacga6720

cccaattggg tcgcacttta tttaatattt tttatatttt gtatattgtt tttatttaat6780

atatttttat attattttat ttaatttttt tatattttat ataatagttt ctatattaaa6840

taaattctta gcattatgta tgattttaaa gtcataaata attttttata ttgtttttat6900

ttactatatt ttttatattt tatttaatat ttatatatta aataaatcct tcatattaga6960

aaaaataaag aaaatattaa ataaaatata aaatataaaa aagtaaaaaa tattaaataa7020

aataatataa aaaatattat aaaaacaata taaaaaatat aaaaatattt aataaaataa7080

taaaaaaaat attattttaa ataaaattat ttatgacttt aaactctaaa gttgaatttt7140

aaaaaaatat aattttttta cgattttagt aaaaaaaaaa tacaagccgc acaatacaag7200

tcgccttctc aaacccttcc tcacgacatt ctcggacctt atgacaccgt caccaaaaca7260

atgatccacg cgatattagg cgcgtgcaaa tcactctaat ccgaaactag tagacatggg7320

aagcacgagc tatacgcgag cgtttcaatt gccgccacga aagcagagaa ggccagaaac7380

ggaaccacgg taaaatggta agggtatttt cgtaaacaga agaaaagagt tgtagctata7440

aataaaccct ctaacccacg gcgcactatt tctcttcact ccttcgttca ctcttcttct7500

cttgcggcta gggttttagc gcagcttctt ctaggttcgt tctcttccgc cgctctatgg7560

attttaaacc ttcgaatcat gtttattcca ttgaattatg ttgcttgcag tttatatttt7620

ctgaatctgt agttgttgtc ttcaatttat cctatgcttt atagatcaat cttttgtgtg7680

tgtagtacgt aatttttgtt ctttttgctt ttcgttcaag ttgttgggaa taatcggggt7740

atcatgtttt gatattgttt gttttctttt ttgactgctt aataattttt aagttggttt7800

tggttttggg gttttatgtg cttgttatat tcaaatcttt gtgatccaga tcttacaaaa7860

gttttgggtt taaggatgtt tttggctgat gatgaataga tctataaact gttcctttta7920

atcgattcaa gcttaggatt ttactaggct tttgcgaata aatacgtgac agtaagctaa7980

ttatgtcctt tttttgtctc aatcatatct gtctgggtgt gccataattt gtgatatgtc8040

tatctggtag aatcttgtgt tttatgcttt acgatttggt atacctgttt ttgaacttgt8100

tgtatgatgg gtatttagat caccctatct tttttatgct tctggaagtt ttatgtaaat8160

gtcgaatatc ttaatgttgt tgaacttata atgttgtgtt gatgtatgta tgatggtttt8220

gacaactttt ttcactggtt ctgaaagttt tatgtaaatt gcaaatatgt taatgttgtt8280

gaacttattt tttttccttc gatgttgttt tgatgtatgt atgatggttt tcaccgtagt8340

ttctatggct aatatcttaa tgttgttgag cttatttttt tccttatatg ttgtgttgat8400

gtattgtatg atggttttga caactttttt agtttctttg cagatttaag gaaggatcaa8460

aaatggctgc tgctgctgca gctccatctc catcattctc taagaccttg tcctcttcat8520

cctctaagtc ctctactctt ttgccaaggt ctactttccc attcccacat catccacata8580

agactactcc accaccactt catcttaccc caacccatat tcactctcag agaagaaggt8640

tcaccatctc taacgttatc tccaccaccc aaaaggtttc agagactcaa aaggctgaga8700

ctttcgtttc taggttcgct ccagatgagc caagaaaggg atctgatgtt cttgttgagg8760

ctcttgaaag ggaaggtgtt actgatgttt tcgcttatcc aggtggcgct tctatggaaa8820

ttcatcaagc tcttaccagg tcctccatca ttagaaacgt tttgccaaga catgagcagg8880

gtggtgtttt cgctgctgaa ggatatgcta gagctactgg attccctggt gtgtgtattg8940

ctacttctgg accaggtgct accaaccttg tttctggact tgctgatgct ctccttgatt9000

ctgttccaat tgtggctatt accggacaag ttgctagaag gatgattgga accgatgctt9060

tccaagagac tccaattgtg gaagtgacca gatctatcac caagcacaac taccttgtga9120

tggatgttga ggatattcca agggttgtga gagaggcatt cttcttggct agatctggta9180

gaccaggacc agttcttatt gatgtgccaa aggatattca gcagcagctt gttatcccag9240

attgggatca acctatgaga cttccaggtt acatgtctag gcttccaaag cttcctaacg9300

agatgcttct tgagcagatt gtgaggctta tttccgagtc taagaagcca gttctctacg9360

ttggtggtgg atgctctcaa tcttctgagg aacttagacg tttcgttgag cttaccggaa9420

ttccagttgc ttctactctt atgggacttg gagctttccc aactggtgat gaactttctc9480

tttccatgct tggaatgcat ggaaccgttt atgctaacta cgctgtggat tcctccgatc9540

ttcttcttgc tttcggtgtt aggttcgatg atagagttac cggaaagctt gaggctttcg9600

cttctagagc taagattgtg cacatcgata tcgattccgc tgagattgga aagaacaagc9660

agccacatgt gtccatttgc gctgatatta agcttgcact tcagggactc aactccattc9720

ttgaatccaa agagggaaag ctcaagcttg atttctctgc ttggaggcaa gagcttactg9780

ttcagaaggt taagtacccc ctcaacttca agactttcgg agatgctatt ccaccacagt9840

acgctattca agtgcttgat gagcttacca acggctctgc tattatttct actggtgttg9900

gacagcatca gatgtgggct gctcaatatt acaagtacag aaagccaagg cagtggctta9960

cttctggtgg acttggtgct atgggattcg gacttccagc tgctattgga gctgctgttg 10020

gtagaccaga tgaagttgtt gtggatatcg atggtgatgg ctccttcatt atgaacgttc 10080

aagagcttgc caccatcaag gttgaaaacc ttccagtgaa gatcatgctc cttaacaacc 10140

agcatcttgg aatggttgtg caacttgagg acagattcta caaggctaac agggctcata 10200

cctatcttgg aaacccatct aacgaggctg agattttccc aaacatgctt aagttcgctg 10260

aggcttgcgg agttcctgct gctagagtta ctcatagaga tgatctcagg gctgctattc 10320

agaagatgct tgatactcca ggaccatacc ttctcgatgt tattgtgcca catcaagagc 10380

atgtgctccc aatgattcca tctggtggtg ctttcaagga tgttattact gagggtgatg 10440

gaaggtcctc ctactaagtg ctagcatttt gtacattgag tagggaagag agagagatat 10500

atataaatac tcacaaagca gtgagtatat ggcttgcttt tgtttctaaa cattccttta 10560

taaggacttg agataatttg tattgtttaa aagagccatt ggttctgttg tatcaaagta 10620

atttaatttt cagtaccgac ttggctctac tcatatgtgg tggtgtacat tgcatctttg 10680

catttgattc catatctatt gggatgggac catacatttt ttgtttatta tttaagtcaa 10740

acatatcaga taatatgtgg tgaccagaaa agtgtctagc aatcaaatgg gtctgtgatt 10800

gcatgtttga gttcaggaca tttattaatg agtgacagaa ttttaaaaag ctcgccaata 10860

ggagttgcca catctgatcg agtcttctgt aaacactaac tgtaacttga gtttgataat 10920

cagattcccc ccgttggtag gtaatatgta aatttcacta tagattctta ctgaggatga 10980

tggtcttgac ttcgaagtgg tgagtgtaat tctctaatct aaactttata tatatataaa 11040

aaaagaatgt taaaaacttg agtgacatac agcaaatagc aatgaaagca tgaccattgg 11100

ccttgggggg ccaaatggcc atgtaccact tttccaccta cttgagagcc attggtcctg 11160

aatgaggtcc ttttgtttca ttttttttac aataaagaaa gttcatattc ttggcaatag 11220

caaggcaaat catttgtgga agtcacatga aattcaccat actaattagc taacggaccc 11280

gatttaaatc ggtaccacta gtaatattcg gaccgcctgc aggcccgggg gcgcgcccta 11340

attagctaac ggccaggatc gccgcgtgag cctttagcaa ctagctagat taattaacgc 11400

aatctgttat taagttgtct aagcgtcaat ttgtttacac cacaatatat cctgccacca 11460

gccagccaac agctccccga ccggcagctc ggcacaaaat caccactcga tacaggcagc 11520

ccatcagaat taattctcat gtttgacagc ttatcatcga ctgcacggtg caccaatgct 11580

tctggcgtca ggcagccatc ggaagctgtg gtatggctgt gcaggtcgta aatcactgca 11640

taattcgtgt cgctcaaggc gcactcccgt tctggataat gttttttgcg ccgacatcat 11700

aacggttctg gcaaatattc tgaaatgagc tgttgacaat taatcatccg gctcgtataa 11760

tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagaccatga gggaagcgtt 11820

gatcgccgaa gtatcgactc aactatcaga ggtagttggc gtcatcgagc gccatctcga 11880

accgacgttg ctggccgtac atttgtacgg ctccgcagtg gatggcggcc tgaagccaca 11940

cagtgatatt gatttgctgg ttacggtgac cgtaaggctt gatgaaacaa cgcggcgagc 12000

tttgatcaac gaccttttgg aaacttcggc ttcccctgga gagagcgaga ttctccgcgc 12060

tgtagaagtc accattgttg tgcacgacga catcattccg tggcgttatc cagctaagcg 12120

cgaactgcaa tttggagaat ggcagcgcaa tgacattctt gcaggtatct tcgagccagc 12180

cacgatcgac attgatctgg ctatcttgct gacaaaagca agagaacata gcgttgcctt 12240

ggtaggtcca gcggcggagg aactctttga tccggttcct gaacaggatc tatttgaggc 12300

gctaaatgaa accttaacgc tatggaactc gccgcccgac tgggctggcg atgagcgaaa 12360

tgtagtgctt acgttgtccc gcatttggta cagcgcagta accggcaaaa tcgcgccgaa 12420

ggatgtcgct gccgactggg caatggagcg cctgccggcc cagtatcagc ccgtcatact 12480

tgaagctagg caggcttatc ttggacaaga agatcgcttg gcctcgcgcg cagatcagtt 12540

ggaagaattt gttcactacg tgaaaggcga gatcaccaaa gtagtcggca aataaagctc 12600

tagtggatct ccgtacccag ggatctggct cgcggcggac gcacgacgcc ggggcgagac 12660

cataggcgat ctcctaaatc aatagtagct gtaacctcga agcgtttcac ttgtaacaac 12720

gattgagaat ttttgtcata aaattgaaat acttggttcg catttttgtc atccgcggtc 12780

agccgcaatt ctgacgaact gcccatttag ctggagatga ttgtacatcc ttcacgtgaa 12840

aatttctcaa gcgctgtgaa caagggttca gattttagat tgaaaggtga gccgttgaaa 12900

cacgttcttc ttgtcgatga cgacgtcgct atgcggcatc ttattattga ataccttacg 12960

atccacgcct tcaaagtgac cgcggtagcc gacagcaccc agttcacaag agtactctct 13020

tccgcgacgg tcgatgtcgt ggttgttgat ctagatttag gtcgtgaaga tgggctcgag 13080

atcgttcgta atctggcggc aaagtctgat attccaatca taattatcag tggcgaccgc 13140

cttgaggaga cggataaagt tgttgcactc gagctaggag caagtgattt tatcgctaag 13200

ccgttcagta tcagagagtt tctagcacgc attcgggttg ccttgcgcgt gcgccccaac 13260

gttgtccgct ccaaagaccg acggtctttt tgttttactg actggacact taatctcagg 13320

caacgtcgct tgatgtccga agctggcggt gaggtgaaac ttacggcagg tgagttcaat 13380

cttctcctcg cgtttttaga gaaaccccgc gacgttctat cgcgcgagca acttctcatt 13440

gccagtcgag tacgcgacga ggaggtttat gacaggagta tagatgttct cattttgagg 13500

ctgcgccgca aacttgaggc agatccgtca agccctcaac tgataaaaac agcaagaggt 13560

gccggttatt tctttgacgc ggacgtgcag gtttcgcacg gggggacgat ggcagcctga 13620

gccaattccc agatccccga ggaatcggcg tgagcggtcg caaaccatcc ggcccggtac 13680

aaatcggcgc ggcgctgggt gatgacctgg tggagaagtt gaaggccgcg caggccgccc 13740

agcggcaacg catcgaggca gaagcacgcc ccggtgaatc gtggcaagcg gccgctgatc 13800

gaatccgcaa agaatcccgg caaccgccgg cagccggtgc gccgtcgatt aggaagccgc 13860

ccaagggcga cgagcaacca gattttttcg ttccgatgct ctatgacgtg ggcacccgcg 13920

atagtcgcag catcatggac gtggccgttt tccgtctgtc gaagcgtgac cgacgagctg 13980

gcgaggtgat ccgctacgag cttccagacg ggcacgtaga ggtttccgca gggccggccg 14040

gcatggccag tgtgtgggat tacgacctgg tactgatggc ggtttcccat ctaaccgaat 14100

ccatgaaccg ataccgggaa gggaagggag acaagcccgg ccgcgtgttc cgtccacacg 14160

ttgcggacgt actcaagttc tgccggcgag ccgatggcgg aaagcagaaa gacgacctgg 14220

tagaaacctg cattcggtta aacaccacgc acgttgccat gcagcgtacg aagaaggcca 14280

agaacggccg cctggtgacg gtatccgagg gtgaagcctt gattagccgc tacaagatcg 14340

taaagagcga aaccgggcgg ccggagtaca tcgagatcga gctggctgat tggatgtacc 14400

gcgagatcac agaaggcaag aacccggacg tgctgacggt tcaccccgat tactttttga 14460

tcgatcccgg catcggccgt tttctctacc gcctggcacg ccgcgccgca ggcaaggcag 14520

aagccagatg gttgttcaag acgatctacg aacgcagtgg cagcgccgga gagttcaaga 14580

agttctgttt caccgtgcgc aagctgatcg ggtcaaatga cctgccggag tacgatttga 14640

aggaggaggc ggggcaggct ggcccgatcc tagtcatgcg ctaccgcaac ctgatcgagg 14700

gcgaagcatc cgccggttcc taatgtacgg agcagatgct agggcaaatt gccctagcag 14760

gggaaaaagg tcgaaaaggt ctctttcctg tggatagcac gtacattggg aacccaaagc 14820

cgtacattgg gaaccggaac ccgtacattg ggaacccaaa gccgtacatt gggaaccggt 14880

cacacatgta agtgactgat ataaaagaga aaaaaggcga tttttccgcc taaaactctt 14940

taaaacttat taaaactctt aaaacccgcc tggcctgtgc ataactgtct ggccagcgca 15000

cagccgaaga gctgcaaaaa gcgcctaccc ttcggtcgct gcgctcccta cgccccgccg 15060

cttcgcgtcg gcctatcgcg gccgctggcc gctcaaaaat ggctggccta cggccaggca 15120

atctaccagg gcgcggacaa gccgcgccgt cgccactcga ccgccggcgc tgaggtctgc 15180

ctcgtgaaga aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga 15240

aagtgaggga gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga 15300

acttttgctt tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca 15360

actcagcaaa agttcgattt attcaacaaa gccgccgtcc cgtcaagtca gcgtaatgct 15420

ctgccagtgt tacaaccaat taaccaattc tgattagaaa aactcatcga gcatcaaatg 15480

aaactgcaat ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg 15540

taatgaagga gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc 15600

tgcgattccg actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag 15660

gttatcaagt gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagctc 15720

tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 15780

cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 15840

actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 15900

gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 15960

ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 16020

acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 16080

ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 16140

cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 16200

tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 16260

gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 16320

ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 16380

acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 16440

gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 16500

ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 16560

tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 16620

gattatcaaa aaggatcttc acctagatcc ttttgatccg gaatta16666

<210>5

<211>16085

<212>DNA

<213>人工

<220>

<223>VC24965

<400>5

attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt60

taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120

tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180

tccctaatta gctaacccgg gggcgcgccg ggaccctagg ccggttcaac attttttttg 240

ttttgagtta ttatctgggc ttaataacgc aggcctgaaa taaattcaag gcccaactgt 300

tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac aacaacaaaa 360

aaagataaag aaaataataa caattacttt aattgtagac taaaaaaaca tagattttat 420

catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaacata cagatcttct 480

aattattaac ttttcttaaa aattaggtcc tttttcccaa caattaggtt tagagttttg 540

gaattaaacc aaaaagattg ttctaaaaaa tactcaaatt tggtagataa gtttccttat 600

tttaattagt caatggtaga tacttttttt tcttttcttt attagagtag attagaatct 660

tttatgccaa gtattgataa attaaatcaa gaagataaac tatcataatc aacatgaaat 720

taaaagaaaa atctcatata tagtattagt attctctata tatattatga ttgcttattc 780

ttaatgggtt gggttaacca agacatagtc ttaatggaaa gaatcttttt tgaacttttt 840

ccttattgat taaattcttc tatagaaaag aaagaaatta tttgaggaaa agtatataca 900

aaaagaaaaa tagaaaaatg tcagtgaagc agatgtaatg gatgacctaa tccaaccacc 960

accataggat gtttctactt gagtcggtct tttaaaaacg cacggtggaa aatatgacac1020

gtatcatatg attccttcct ttagtttcgt gataataatc ctcaactgat atcttccttt1080

ttttgttttg gctaaagata ttttattctc attaatagaa aagacggttt tgggcttttg1140

gtttgcgata taaagaagac cttcgtgtgg aagataataa ttcatccttt cgtctttttc1200

tgactcttca atctctccca aagcctaaag cgatctctgc aaatctctcg cgactctctc1260

tttcaaggta tattttctga ttctttttgt ttttgattcg tatctgatct ccaatttttg1320

ttatgtggat tattgaatct tttgtataaa ttgcttttga caatattgtt cgtttcgtca1380

atccagcttc taaattttgt cctgattact aagatatcga ttcgtagtgt ttacatctgt1440

gtaatttctt gcttgattgt gaaattagga ttttcaagga cgatctattc aatttttgtg1500

ttttctttgt tcgattctct ctgttttagg tttcttatgt ttagatccgt ttctctttgg1560

tgttgttttg atttctctta cggcttttga tttggtatat gttcgctgat tggtttctac1620

ttgttctatt gttttatttc aggtaggatc ctaaaccatg gctttggcta ttgtgggaga1680

ggcacttatc tctgcttctg tggagatctt gctggatagg ataacttctg tggagtttcg1740

aaatttcttt gccaatagaa agctgaatgt ttctctcttg gatgagctga agataaagct1800

gttggcactc agtgctgtgc tcaatgatgc tgaggagaaa cagatcacta attcagaagt1860

gaaggcatgg cttgatgagt tgaaagatgc tgttttagac gcagaggatt tgttggacca1920

aatcaacaca gattctctga ggtgcaaggt ggaggaacaa tacaaaacct ttaaaagcca1980

ggtgtggtca tcactttctt ctccctttaa tcaattctat aggagcatga attccaagct2040

tgaagcaata tctggaaggc tagaaaattt tatcaaacaa aaagatattc ttggtttgaa2100

aagtgttgct ggcagagtct cttaccgaaa agatacagat cgatcggtgg aatatgttgt2160

tgcaagagac gatgacaaaa agaagctgtt gaccatgctt ctctctgatg aagatgagaa2220

taataatcac ataaaagtgc tgacaatatg gggcatggga ggtcttggaa aaacaaccct2280

tgctcagagc cttttaaatg acgatgcagt gcagaaccat tttgatctca aagcttgggc2340

atgggtatct gatccttttg atgtgtttaa ggcaacgaag gcaattgttg aatctgccac2400

ttcaaaaact tgtgatacta ctaattttga tgctcttcga gttgaattga agaacacctt2460

taaagataaa ttttttttgc ttgtgctcga tgacctttgg aatatgcagt atcatgattg2520

ggatcaacta atagcccctt ttattagctg tgggaagaag ggaagtataa tcattgtgac2580

aacccgacaa cacagaattg cagaaatcac tagtacattt cccattcacg agctgaagat2640

tcttacagat gacaactgtt ggtgtatact tgctaaacat gcatttggaa atcaaggata2700

tgacaaatat cccatcctag cagaaattgg tagacaaatt gcaacaaaat gcaagggtct2760

accattagca gctaaaacat tgggaggtct tttgcgatca aatgttgatg cagagtattg2820

gaatgaaatt ctgaacagca acatgtgggc aaataatgaa gttttaccag ctttatgcat2880

aagttatctt caacttccac cacatctgaa aagatgtttt gcctattgct caatttttcc2940

tagacaacat ttgttggata ggaaggaatt gattctgtta tggatggctg aaggctttct3000

tccacaaatc cacagagaga aagcaatgga atcagcaggt gaagactact tcaatgaatt3060

gttatctaga tctttaattg aaaaagacaa aaatgaggga aaggaacagt ttcgaatgca3120

tgaccttatc tacgatttag ccagactagt ctctggtaag agatcttgtt actttgaagg3180

aggagaagtc ccaataaatg ttcgccatct gacatatcat cccagatatc ttgatgtctc3240

tacaagattt gagggcttgt atgggctaaa gcttttgcgc agctttttac gactatctca3300

atattctagt agtgtatcca aaagggtgac acatgagtgg ctgccaacac taacatatct3360

gcgaacattg tccttgattc agtatagaaa tatcactgag ctgcctgatt caataagcaa3420

tttggtactg ttgcggtatc ttgacctttc ctatacttcc atcaaaagtt tgcctgatgc3480

aacctttagg ctttacaatt tgcagacttt gaaattatca cattgtgaac atcttacaga3540

gttgactgaa cagataggag atttgttact tttacggtat cttgaccttt cctatacttc3600

catcaatcag ctgcctgaac agataggaaa tttggtcaat ctacgccacc ttgatattag3660

aggcacaaat ttgacggaga tgccagcaca aataagcaag ctacaagatc tccgtgtgtt3720

gacttctttt gttgtaggca gagaagatgg agtaaatatc agagaattaa gaaagtttcc3780

ttacttgcaa ggtacgcttt ccattttgag gttacaaaat gttgttgatc ccaaggatgc3840

ttttcaagct gacttaaaga agaaagagca tattgaggag cttaggttgg agtggggcag3900

tgagccacaa gattcacaaa ttgagaaaga tgtacttcag aacctgcaac catcgacaaa3960

tttaaagaaa ctcagcgtaa gatactacag tggcacaagc tttcctaaat ggttgggtga4020

ctcttcatat tcttatgtta tattcctttg catcactaat tgcaaatatt gcttttcact4080

tccaccattt ggacaactac cttctctcaa ggagcttgtg ataaaaagga tgaaaatggt4140

gaagacagtt ggtgaagaat tctactgcaa caatggggtt tccctttcat ttcaaccatt4200

tccattgttg gagagtatcg agttcgaaga gatgtcagag tgggaagagt ggctaccatt4260

tgaaggtgaa ggcagcaagt ttccttttcc ttgccttaaa catttgagtt tatcaaaatg4320

ccccaagttg agaggaaact tgcccaacca tctaccttcc ttgacagagg ttagtatatc4380

agagtgcaac cggctagagg caaaatcaca tgatctacat tggaacacat caattgaaga4440

aataacgatt agagaagcag gagaacaatt gttgtccttg cttgacaact tttcttacag4500

gaatctacgg attgaaaaat gtgacagctt gtcatctttg ccaagaatga tactagctgc4560

caattgtctc caaaggttga ctcttaagga tatccccaat ttgatttcct tcccagccga4620

tggcttgcca acgtcattgc aatttcttga cattgacaac tgtgagaact tagaatttct4680

gtctcccgaa tcatgccaca aatacacatc acttgaatat ctgtcaattg tcaatagctg4740

ccattccctg gcatccttac cattagatgg tttctcttcc ctacaaagtc ttcaaatctt4800

ggaatgtccc aacatggaag caattactac tcaaggtgga acgaatgctc tcaaattaac4860

ttatctttat gtttataaat gtaagaaact taggtcactt ccagaacaga ttgatctccc4920

tgcccttcaa tggttagggc tttctgagct tccagagctg acatcattgc ccccaaggtg4980

tttgccttcc agtttagaaa cactcaaagt tgaagttgga atgctatcat caatgtctaa5040

acacgagtta ggtttcctat tccaacgcct cacttctctg tctcgtcttt acattagtgg5100

ttttggggag gaagatgttg ttaacaccct gttgaaggag tgcttactgc ccacttcgct5160

gcaacatctg tccctatggt attttgatga tttaaagttg ttggaaggaa aagggctcca5220

acatctcact tccctcagag atcttggcat caggaattgt aaaagcctcg agtccttgcc5280

cgaagatcag cttccatcct ctcttgaatt actggagata catggttgtc ctttactaga5340

agcaaggtat caaagtcgga aagggaaaca ctggtctaag attgctcaca ttcctgcgat5400

caagataaat gatgaagtga taatatgaga gctcagcttt ttgtgatctg atgataagtg5460

gttggttcgt gtctcatgca cttgggaggt gatctatttc acctggtgta gtttgtgttt5520

ccgtcagttg gaaaaactta tccctatcga tttcgttttc attttctgct tttcttttat5580

gtaccttcgt ttgggcttgt aacgggcctt tgtatttcaa ctctcaataa taatccaagt5640

gcatgttaaa caatttgtca tctgtttcgg ctttgatata ctactggtga agatgggccg5700

tactactgca tcacaacgaa aaataataat aagatgaaaa acttgaagtg gaaaaaaaaa5760

aacttgaatg ttcactacta ctaattgacg gaccgctaat tagctaagag acacttgtgt5820

gattgagaga aacactaatc ttgtgaggac tgaagtttgg tgattatttc ttgtgatctg5880

tcgacaaaaa tatcaaatgg ggtttctttt acaaattatt tacctaaatg aatctgtttt5940

gaaaatattt actccattgg gtctattttt ttattacaaa gcgtctccct gaagggcgcg6000

ttccccgtga aagtgacacg tggcaggact tgggacgtgc cctgcgtaca ggcgcgatag6060

ttagtgttgt tacagcaggc gcatcgggtc gtgttgggga ccaaggtacg acaggtcgcg6120

ctgggtgacc cagacacgac ccaattgggt cgcactttat ttaatatttt ttatattttg6180

tatattgttt ttatttaata tatttttata ttattttatt taattttttt atattttata6240

taatagtttc tatattaaat aaattcttag cattatgtat gattttaaag tcataaataa6300

ttttttatat tgtttttatt tactatattt tttatatttt atttaatatt tatatattaa6360

ataaatcctt catattagaa aaaataaaga aaatattaaa taaaatataa aatataaaaa6420

agtaaaaaat attaaataaa ataatataaa aaatattata aaaacaatat aaaaaatata6480

aaaatattta ataaaataat aaaaaaaata ttattttaaa taaaattatt tatgacttta6540

aactctaaag ttgaatttta aaaaaatata atttttttac gattttagta aaaaaaaaat6600

acaagccgca caatacaagt cgccttctca aacccttcct cacgacattc tcggacctta6660

tgacaccgtc accaaaacaa tgatccacgc gatattaggc gcgtgcaaat cactctaatc6720

cgaaactagt agacatggga agcacgagct atacgcgagc gtttcaattg ccgccacgaa6780

agcagagaag gccagaaacg gaaccacggt aaaatggtaa gggtattttc gtaaacagaa6840

gaaaagagtt gtagctataa ataaaccctc taacccacgg cgcactattt ctcttcactc6900

cttcgttcac tcttcttctc ttgcggctag ggttttagcg cagcttcttc taggttcgtt6960

ctcttccgcc gctctatgga ttttaaacct tcgaatcatg tttattccat tgaattatgt7020

tgcttgcagt ttatattttc tgaatctgta gttgttgtct tcaatttatc ctatgcttta7080

tagatcaatc ttttgtgtgt gtagtacgta atttttgttc tttttgcttt tcgttcaagt7140

tgttgggaat aatcggggta tcatgttttg atattgtttg ttttcttttt tgactgctta7200

ataattttta agttggtttt ggttttgggg ttttatgtgc ttgttatatt caaatctttg7260

tgatccagat cttacaaaag ttttgggttt aaggatgttt ttggctgatg atgaatagat7320

ctataaactg ttccttttaa tcgattcaag cttaggattt tactaggctt ttgcgaataa7380

atacgtgaca gtaagctaat tatgtccttt ttttgtctca atcatatctg tctgggtgtg7440

ccataatttg tgatatgtct atctggtaga atcttgtgtt ttatgcttta cgatttggta7500

tacctgtttt tgaacttgtt gtatgatggg tatttagatc accctatctt ttttatgctt7560

ctggaagttt tatgtaaatg tcgaatatct taatgttgtt gaacttataa tgttgtgttg7620

atgtatgtat gatggttttg acaacttttt tcactggttc tgaaagtttt atgtaaattg7680

caaatatgtt aatgttgttg aacttatttt ttttccttcg atgttgtttt gatgtatgta7740

tgatggtttt caccgtagtt tctatggcta atatcttaat gttgttgagc ttattttttt7800

ccttatatgt tgtgttgatg tattgtatga tggttttgac aactttttta gtttctttgc7860

agatttaagg aaggatcaaa aatggctgct gctgctgcag ctccatctcc atcattctct7920

aagaccttgt cctcttcatc ctctaagtcc tctactcttt tgccaaggtc tactttccca7980

ttcccacatc atccacataa gactactcca ccaccacttc atcttacccc aacccatatt8040

cactctcaga gaagaaggtt caccatctct aacgttatct ccaccaccca aaaggtttca8100

gagactcaaa aggctgagac tttcgtttct aggttcgctc cagatgagcc aagaaaggga8160

tctgatgttc ttgttgaggc tcttgaaagg gaaggtgtta ctgatgtttt cgcttatcca8220

ggtggcgctt ctatggaaat tcatcaagct cttaccaggt cctccatcat tagaaacgtt8280

ttgccaagac atgagcaggg tggtgttttc gctgctgaag gatatgctag agctactgga8340

ttccctggtg tgtgtattgc tacttctgga ccaggtgcta ccaaccttgt ttctggactt8400

gctgatgctc tccttgattc tgttccaatt gtggctatta ccggacaagt tgctagaagg8460

atgattggaa ccgatgcttt ccaagagact ccaattgtgg aagtgaccag atctatcacc8520

aagcacaact accttgtgat ggatgttgag gatattccaa gggttgtgag agaggcattc8580

ttcttggcta gatctggtag accaggacca gttcttattg atgtgccaaa ggatattcag8640

cagcagcttg ttatcccaga ttgggatcaa cctatgagac ttccaggtta catgtctagg8700

cttccaaagc ttcctaacga gatgcttctt gagcagattg tgaggcttat ttccgagtct8760

aagaagccag ttctctacgt tggtggtgga tgctctcaat cttctgagga acttagacgt8820

ttcgttgagc ttaccggaat tccagttgct tctactctta tgggacttgg agctttccca8880

actggtgatg aactttctct ttccatgctt ggaatgcatg gaaccgttta tgctaactac8940

gctgtggatt cctccgatct tcttcttgct ttcggtgtta ggttcgatga tagagttacc9000

ggaaagcttg aggctttcgc ttctagagct aagattgtgc acatcgatat cgattccgct9060

gagattggaa agaacaagca gccacatgtg tccatttgcg ctgatattaa gcttgcactt9120

cagggactca actccattct tgaatccaaa gagggaaagc tcaagcttga tttctctgct9180

tggaggcaag agcttactgt tcagaaggtt aagtaccccc tcaacttcaa gactttcgga9240

gatgctattc caccacagta cgctattcaa gtgcttgatg agcttaccaa cggctctgct9300

attatttcta ctggtgttgg acagcatcag atgtgggctg ctcaatatta caagtacaga9360

aagccaaggc agtggcttac ttctggtgga cttggtgcta tgggattcgg acttccagct9420

gctattggag ctgctgttgg tagaccagat gaagttgttg tggatatcga tggtgatggc9480

tccttcatta tgaacgttca agagcttgcc accatcaagg ttgaaaacct tccagtgaag9540

atcatgctcc ttaacaacca gcatcttgga atggttgtgc aacttgagga cagattctac9600

aaggctaaca gggctcatac ctatcttgga aacccatcta acgaggctga gattttccca9660

aacatgctta agttcgctga ggcttgcgga gttcctgctg ctagagttac tcatagagat9720

gatctcaggg ctgctattca gaagatgctt gatactccag gaccatacct tctcgatgtt9780

attgtgccac atcaagagca tgtgctccca atgattccat ctggtggtgc tttcaaggat9840

gttattactg agggtgatgg aaggtcctcc tactaagtgc tagcattttg tacattgagt9900

agggaagaga gagagatata tataaatact cacaaagcag tgagtatatg gcttgctttt9960

gtttctaaac attcctttat aaggacttga gataatttgt attgtttaaa agagccattg 10020

gttctgttgt atcaaagtaa tttaattttc agtaccgact tggctctact catatgtggt 10080

ggtgtacatt gcatctttgc atttgattcc atatctattg ggatgggacc atacattttt 10140

tgtttattat ttaagtcaaa catatcagat aatatgtggt gaccagaaaa gtgtctagca 10200

atcaaatggg tctgtgattg catgtttgag ttcaggacat ttattaatga gtgacagaat 10260

tttaaaaagc tcgccaatag gagttgccac atctgatcga gtcttctgta aacactaact 10320

gtaacttgag tttgataatc agattccccc cgttggtagg taatatgtaa atttcactat 10380

agattcttac tgaggatgat ggtcttgact tcgaagtggt gagtgtaatt ctctaatcta 10440

aactttatat atatataaaa aaagaatgtt aaaaacttga gtgacataca gcaaatagca 10500

atgaaagcat gaccattggc cttggggggc caaatggcca tgtaccactt ttccacctac 10560

ttgagagcca ttggtcctga atgaggtcct tttgtttcat tttttttaca ataaagaaag 10620

ttcatattct tggcaatagc aaggcaaatc atttgtggaa gtcacatgaa attcaccata 10680

ctaattagct aacggacccg atttaaatcg gtaccactag taatattcgg accccctgca 10740

ggcccggggg cgcgccctaa ttagctaacg gccaggatcg ccgcgtgagc ctttagcaac 10800

tagctagatt aattaacgca atctgttatt aagttgtcta agcgtcaatt tgtttacacc 10860

acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg gcacaaaatc 10920

accactcgat acaggcagcc catcagaatt aattctcatg tttgacagct tatcatcgac 10980

tgcacggtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 11040

caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 11100

ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 11160

aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 11220

agaccatgag ggaagcgttg atcgccgaag tatcgactca actatcagag gtagttggcg 11280

tcatcgagcg ccatctcgaa ccgacgttgc tggccgtaca tttgtacggc tccgcagtgg 11340

atggcggcct gaagccacac agtgatattg atttgctggt tacggtgacc gtaaggcttg 11400

atgaaacaac gcggcgagct ttgatcaacg accttttgga aacttcggct tcccctggag 11460

agagcgagat tctccgcgct gtagaagtca ccattgttgt gcacgacgac atcattccgt 11520

ggcgttatcc agctaagcgc gaactgcaat ttggagaatg gcagcgcaat gacattcttg 11580

caggtatctt cgagccagcc acgatcgaca ttgatctggc tatcttgctg acaaaagcaa 11640

gagaacatag cgttgccttg gtaggtccag cggcggagga actctttgat ccggttcctg 11700

aacaggatct atttgaggcg ctaaatgaaa ccttaacgct atggaactcg ccgcccgact 11760

gggctggcga tgagcgaaat gtagtgctta cgttgtcccg catttggtac agcgcagtaa 11820

ccggcaaaat cgcgccgaag gatgtcgctg ccgactgggc aatggagcgc ctgccggccc 11880

agtatcagcc cgtcatactt gaagctaggc aggcttatct tggacaagaa gatcgcttgg 11940

cctcgcgcgc agatcagttg gaagaatttg ttcactacgt gaaaggcgag atcaccaaag 12000

tagtcggcaa ataaagctct agtggatctc cgtacccagg gatctggctc gcggcggacg 12060

cacgacgccg gggcgagacc ataggcgatc tcctaaatca atagtagctg taacctcgaa 12120

gcgtttcact tgtaacaacg attgagaatt tttgtcataa aattgaaata cttggttcgc 12180

atttttgtca tccgcggtca gccgcaattc tgacgaactg cccatttagc tggagatgat 12240

tgtacatcct tcacgtgaaa atttctcaag cgctgtgaac aagggttcag attttagatt 12300

gaaaggtgag ccgttgaaac acgttcttct tgtcgatgac gacgtcgcta tgcggcatct 12360

tattattgaa taccttacga tccacgcctt caaagtgacc gcggtagccg acagcaccca 12420

gttcacaaga gtactctctt ccgcgacggt cgatgtcgtg gttgttgatc tagatttagg 12480

tcgtgaagat gggctcgaga tcgttcgtaa tctggcggca aagtctgata ttccaatcat 12540

aattatcagt ggcgaccgcc ttgaggagac ggataaagtt gttgcactcg agctaggagc 12600

aagtgatttt atcgctaagc cgttcagtat cagagagttt ctagcacgca ttcgggttgc 12660

cttgcgcgtg cgccccaacg ttgtccgctc caaagaccga cggtcttttt gttttactga 12720

ctggacactt aatctcaggc aacgtcgctt gatgtccgaa gctggcggtg aggtgaaact 12780

tacggcaggt gagttcaatc ttctcctcgc gtttttagag aaaccccgcg acgttctatc 12840

gcgcgagcaa cttctcattg ccagtcgagt acgcgacgag gaggtttatg acaggagtat 12900

agatgttctc attttgaggc tgcgccgcaa acttgaggca gatccgtcaa gccctcaact 12960

gataaaaaca gcaagaggtg ccggttattt ctttgacgcg gacgtgcagg tttcgcacgg 13020

ggggacgatg gcagcctgag ccaattccca gatccccgag gaatcggcgt gagcggtcgc 13080

aaaccatccg gcccggtaca aatcggcgcg gcgctgggtg atgacctggt ggagaagttg 13140

aaggccgcgc aggccgccca gcggcaacgc atcgaggcag aagcacgccc cggtgaatcg 13200

tggcaagcgg ccgctgatcg aatccgcaaa gaatcccggc aaccgccggc agccggtgcg 13260

ccgtcgatta ggaagccgcc caagggcgac gagcaaccag attttttcgt tccgatgctc 13320

tatgacgtgg gcacccgcga tagtcgcagc atcatggacg tggccgtttt ccgtctgtcg 13380

aagcgtgacc gacgagctgg cgaggtgatc cgctacgagc ttccagacgg gcacgtagag 13440

gtttccgcag ggccggccgg catggccagt gtgtgggatt acgacctggt actgatggcg 13500

gtttcccatc taaccgaatc catgaaccga taccgggaag ggaagggaga caagcccggc 13560

cgcgtgttcc gtccacacgt tgcggacgta ctcaagttct gccggcgagc cgatggcgga 13620

aagcagaaag acgacctggt agaaacctgc attcggttaa acaccacgca cgttgccatg 13680

cagcgtacga agaaggccaa gaacggccgc ctggtgacgg tatccgaggg tgaagccttg 13740

attagccgct acaagatcgt aaagagcgaa accgggcggc cggagtacat cgagatcgag 13800

ctggctgatt ggatgtaccg cgagatcaca gaaggcaaga acccggacgt gctgacggtt 13860

caccccgatt actttttgat cgatcccggc atcggccgtt ttctctaccg cctggcacgc 13920

cgcgccgcag gcaaggcaga agccagatgg ttgttcaaga cgatctacga acgcagtggc 13980

agcgccggag agttcaagaa gttctgtttc accgtgcgca agctgatcgg gtcaaatgac 14040

ctgccggagt acgatttgaa ggaggaggcg gggcaggctg gcccgatcct agtcatgcgc 14100

taccgcaacc tgatcgaggg cgaagcatcc gccggttcct aatgtacgga gcagatgcta 14160

gggcaaattg ccctagcagg ggaaaaaggt cgaaaaggtc tctttcctgt ggatagcacg 14220

tacattggga acccaaagcc gtacattggg aaccggaacc cgtacattgg gaacccaaag 14280

ccgtacattg ggaaccggtc acacatgtaa gtgactgata taaaagagaa aaaaggcgat 14340

ttttccgcct aaaactcttt aaaacttatt aaaactctta aaacccgcct ggcctgtgca 14400

taactgtctg gccagcgcac agccgaagag ctgcaaaaag cgcctaccct tcggtcgctg 14460

cgctccctac gccccgccgc ttcgcgtcgg cctatcgcgg ccgctggccg ctcaaaaatg 14520

gctggcctac ggccaggcaa tctaccaggg cgcggacaag ccgcgccgtc gccactcgac 14580

cgccggcgct gaggtctgcc tcgtgaagaa ggtgttgctg actcatacca ggcctgaatc 14640

gccccatcat ccagccagaa agtgagggag ccacggttga tgagagcttt gttgtaggtg 14700

gaccagttgg tgattttgaa cttttgcttt gccacggaac ggtctgcgtt gtcgggaaga 14760

tgcgtgatct gatccttcaa ctcagcaaaa gttcgattta ttcaacaaag ccgccgtccc 14820

gtcaagtcag cgtaatgctc tgccagtgtt acaaccaatt aaccaattct gattagaaaa 14880

actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca ataccatatt 14940

tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg 15000

caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt 15060

tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg actgaatccg 15120

gtgagaatgg caaaagctct gcattaatga atcggccaac gcgcggggag aggcggtttg 15180

cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15240

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15300

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15360

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 15420

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 15480

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 15540

ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 15600

taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 15660

gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 15720

gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 15780

ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 15840

ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 15900

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 15960

caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 16020

taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttgatccgg 16080

aatta 16085

<210>6

<211>1998

<212>DNA

<213>大豆(Glycine max)

<400>6

attccaaaat tttcagttag tccttactaa ttattaaatt atagtattaa tccaatgtga60

ttgcggttac atcatgtacg gaaaaataat tctaatcctt gttttaaatt tgatcttgac 120

tatttattta ttctttattt cattttgtaa atcattttat gtatctcctg gcaagcaatt 180

ttatccacct tgcaccaaca ccttcgggtt ccataatcaa accaccttaa cttcacacca 240

tgctgtaact cacaccgccc agcatctcca atgtgaaaga agctaaaatt taataaacaa 300

tcatacgaag cagtgacaaa ataccagatg gtattaatgc tttgataaaa ttaattggaa 360

agtataaaat ggtagaaaat aataaattat aattatttta aataagataa aaaataatta 420

aaaactaaaa tgttaaaatt ttaaaaaaat tattttaaat aatatttaaa aacattaaaa 480

atcattttaa aaaatttatt tatagaacaa ttaaataaat atttcagcta ataaaaaaca 540

aaagcttacc tagccttaga agacaacttg tccaacaatt agatgatacc cattgccctt 600

acgttttctt taacatcaat tattgttttt gtcaacaagc tatcttttag ttttatttta 660

ttggtaaaaa atatgtcgcc ttcaagttgc atcatttaac acatctcgtc attagaaaaa 720

taaaactctt ccctaaacga ttagtagaaa aaatcattcg ataataaata agaaagaaaa 780

attagaaaaa aataacttca ttttaaaaaa atcattaagg ctatattttt taaatgacta 840

attttatata gactgtaact aaaagtatac aatttattat gctatgtatc ttaaagaatt 900

acttataaaa atctacggaa gaatatctta caaagtgaaa aacaaatgag aaagaattta 960

gtgggatgat tatgatttta tttgaaaatt gaaaaaataa ttattaaaga ctttagtgga1020

gtaagaaagc tttcctatta gtcttttctt atccataaaa aaaaaaaaaa atctagcgtg1080

acagcttttc catagatttt aataatgtaa aatactggta gcagccgacc gttcaggtaa1140

tggacactgt ggtcctaact tgcaacgggt gcgggcccaa tttaataacg ccgtggtaac1200

ggataaagcc aagcgtgaag cggtgaaggt acatctctga ctccgtcaag attacgaaac1260

cgtcaactac gaaggactcc ccgaaatatc atctgtgtca taaacaccaa gtcacaccat1320

acatgggcac gcgtcacaat ttgattggag aacggttcca ccgcatatgc tataaattgc1380

ccccacaccc ctcgacccta atcgcacttc aattgcaatc aaattagttc attctctttg1440

cgcagttccc tacctctcct ttcaaggttc gtagatttct tctgtttttt tttcttcttc1500

tttattgttt gttctacatc agcatgatgt tgatttgatt gtgttttcta tcgtttcatc1560

gattataaat tttcataatc agaagattca gcttttatta atgcaagaac gtccttaatt1620

gatgatttta taaccgtaaa ttaggtctaa ttagagtttt tttcataaag attttcagat1680

ccgtttacaa caagccttaa ttgttgattc tgtagtcgta gattaaggtt tttttcatga1740

actacttcag atccgttaaa caacagcctt atttgttgat acttcagtcg tttttcaaga1800

aattgttcag atccgttgat aaaagcctta ttcgttgatt ctgtatggta tttcaagaga1860

tattgctcag gtcctttagc aactacctta tttgttgatt ctgtggccat agattaggat1920

tttttttcac gaaattgctt cttgaaatta cgtgatggat tttgattctg atttatcttg1980

tgattgttga ctctacag1998

<210>7

<211>1730

<212>DNA

<213>短绒野大豆(Glycine tomentella)

<400>7

taaatattta aatatatttt gatatgcaca catatttcaa aaaattgtta ttttgttgtg60

ttctaggtag aattttcttc acattaataa tgtcttgcat gctccttttt tactttcttt 120

taaacaaagt tgatttattt tattttattt tattttgtaa ttgtgttatc agtacaaatt 180

atttaatggt tttgttcatg attatttttt gtcaaaaaat aacacctata tccacgtaat 240

aatacattct tttataatac attttaaaat taaattaatt aaatatgtta aagttatcaa 300

tatatacatt tcttaggtcc tatgttattt gggaatccgt tagacttgca aggctttgat 360

ttttattcta cagggatctc taatttaggc tatgttttgt tttgatttaa ttatattttt 420

tttagttctc actcatattt taatttatgg gaaattttat agtattttaa attttaattc 480

tttatacttt atttttatac aatttaatta ttaaaattaa gttcctcatt tcaaatttca 540

tccaataacg tatgaataaa agattgtgag gtgactttga tttatacaaa ttggtgtaag 600

aaagataaat atatattaag agaaaaaaaa taacttcttg taaggacaca ttatcacata 660

atgtattgta aggacttcaa tgtaagaaat tgtgaatcaa aactatcgac cactcctatt 720

actactttat tgtcattgta taaatattta tttaaggcaa cttaatcaca tcctcaaatt 780

tgaaaaaagt attttttttc aatttttatt ctccatgtcc agtatcattg cccttaaaaa 840

gctaaaaaaa aaacatatat agatgtgcaa tctaaaatac atgatttctt tattaataat 900

aatcatttaa tatcttacca aattattatc aatttgccac agcatgtcaa tttttttttg 960

ttcatagtaa tctattactt tatttttata cactttatac gaataaataa ataaattaaa1020

aatttgcaac aataaacaat tatatgtaaa ttattaaaac ttttttgaag gaataaatta1080

tcataacttt aataatataa attattattt ttaattaaat ataaaaaatg atagccaaaa1140

aattatacat gatgaagttt aaacttaata tccgtgcaag gcacaccgga ttttacgcta1200

gtaaatttta actaaaatta cacatgttaa attaaaggga tcagaagtgt aattatttta1260

ttttattttt tttaaaaatc atcttaaaat aatacaagta ataagtaatt attctaaaaa1320

tttgattcct ccgagagtga aactttcaac tacctaatgc aaactttgtc aaagtgaaat1380

ttgactacac ccagcaaact ttgtaagcaa tgttgcaatg ttctaagagt taatctcata1440

gctattcttg taaggactcc gaatcaatta aagacaaaga gtagggaatc taactttttc1500

aacaacaaat taattacatg cacgatagtg taggccgttt aagaaagttt aagagagtaa1560

ctgatatgtg gcatcttaga tatatactaa gcaaataata ttgcataata gaacatgaaa1620

tcatgaatgc tgatttaaaa gcattaaaca aacgaattga ggaatgaggg aggtgtcaag1680

ttttaggaat tcagaaaaat gtataattaa ctcttattaa gttttttttt 1730

<210>8

<211>1422

<212>DNA

<213>拟南芥属(Arabidopsis)

<400>8

ccggttcaac attttttttg ttttgagtta ttatctgggc ttaataacgc aggcctgaaa60

taaattcaag gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg 120

aattaacaac aacaacaaaa aaagataaag aaaataataa caattacttt aattgtagac 180

taaaaaaaca tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa 240

aaaaaacata cagatcttct aattattaac ttttcttaaa aattaggtcc tttttcccaa 300

caattaggtt tagagttttg gaattaaacc aaaaagattg ttctaaaaaa tactcaaatt 360

tggtagataa gtttccttat tttaattagt caatggtaga tacttttttt tcttttcttt 420

attagagtag attagaatct tttatgccaa gtattgataa attaaatcaa gaagataaac 480

tatcataatc aacatgaaat taaaagaaaa atctcatata tagtattagt attctctata 540

tatattatga ttgcttattc ttaatgggtt gggttaacca agacatagtc ttaatggaaa 600

gaatcttttt tgaacttttt ccttattgat taaattcttc tatagaaaag aaagaaatta 660

tttgaggaaa agtatataca aaaagaaaaa tagaaaaatg tcagtgaagc agatgtaatg 720

gatgacctaa tccaaccacc accataggat gtttctactt gagtcggtct tttaaaaacg 780

cacggtggaa aatatgacac gtatcatatg attccttcct ttagtttcgt gataataatc 840

ctcaactgat atcttccttt ttttgttttg gctaaagata ttttattctc attaatagaa 900

aagacggttt tgggcttttg gtttgcgata taaagaagac cttcgtgtgg aagataataa 960

ttcatccttt cgtctttttc tgactcttca atctctccca aagcctaaag cgatctctgc1020

aaatctctcg cgactctctc tttcaaggta tattttctga ttctttttgt ttttgattcg1080

tatctgatct ccaatttttg ttatgtggat tattgaatct tttgtataaa ttgcttttga1140

caatattgtt cgtttcgtca atccagcttc taaattttgt cctgattact aagatatcga1200

ttcgtagtgt ttacatctgt gtaatttctt gcttgattgt gaaattagga ttttcaagga1260

cgatctattc aatttttgtg ttttctttgt tcgattctct ctgttttagg tttcttatgt1320

ttagatccgt ttctctttgg tgttgttttg atttctctta cggcttttga tttggtatat1380

gttcgctgat tggtttctac ttgttctatt gttttatttc ag 1422

<210>9

<211>30

<212>DNA

<213>人工

<220>

<223>TQ2681探针

<400>9

agcttttgcg cagcttttta cgactatctc 30

<210>10

<211>27

<212>DNA

<213>人工

<220>

<223>TQ2681引物

<400>10

gtcacccttt tggatacact actagaa27

<210>11

<211>22

<212>DNA

<213>人工

<220>

<223>TQ2681引物

<400>11

caagatttga gggcttgtat gg 22

<210>12

<211>1237

<212>PRT

<213>短绒野大豆(Glycine tomentella)

<400>12

Met Ala Leu Ala Met Val Gly Glu Ala Leu Ile Ser Ala Ser Val Glu

1 5 1015

Ile Leu Leu Asp Arg Ile Thr Ser Thr Glu Phe Arg Asp Phe Phe Ala

202530

Asn Arg Asn Leu Asn Val Ser Leu Leu Asp Glu Leu Lys Ile Lys Leu

354045

Leu Ala Leu Asn Ala Val Leu Asn Asp Ala Glu Glu Lys Gln Ile Thr

505560

Asn Ser Ala Val Lys Gly Trp Leu Asp Glu Leu Lys Asp Ala Val Leu

65707580

Asp Ala Glu Asp Leu Met Asp Glu Ile Asn Thr Asp Ser Leu Arg Cys

859095

Lys Val Glu Gly Glu Phe Lys Thr Phe Thr Ser Gln Val Trp Ser Ser

100 105 110

Leu Ser Ser Pro Phe Asn Gln Phe Tyr Arg Ser Met Asn Ser Lys Leu

115 120 125

Glu Ala Ile Ser Gly Arg Leu Glu His Phe Met Lys Gln Lys Asp Ile

130 135 140

Leu Gly Leu Gln Ser Val Ser Arg Lys Val Ser Tyr Lys Thr Val Thr

145 150 155 160

Asp Ser Leu Val Glu Ser Val Val Val Ala Arg Glu Asp Asp Lys Glu

165 170 175

Lys Leu Leu Ser Met Leu Leu Ser Asp Glu Asp Glu Lys Asn Asn Asn

180 185 190

Ile Glu Val Leu Thr Ile Leu Gly Met Gly Gly Leu Gly Lys Thr Thr

195 200 205

Leu Ala Gln Cys Leu Tyr Asn Asp Ser Ala Val Gln Lys His Phe Asp

210 215 220

Leu Thr Thr Trp Ala Trp Val Ser Asp Asp Phe Asp Val Phe Arg Val

225 230 235 240

Thr Lys Thr Ile Val Glu Ser Val Thr Ser Lys Asn Cys Asn Ser Thr

245 250 255

Asn Phe Asp Ala Leu Arg Val Glu Leu Lys Asn Ser Leu Lys Asp Lys

260 265 270

Lys Phe Leu Leu Val Leu Asp Asp Leu Trp Asn Glu Lys Tyr Asn Asp

275 280 285

Trp His His Leu Ile Ala Pro Phe Ser Gly Gly Lys Lys Gly Ser Lys

290 295 300

Ile Ile Val Thr Thr Arg Gln Gln Lys Val Ala Gln Met Thr His Thr

305 310 315 320

Tyr Pro Val Tyr Glu Leu Lys His Leu Thr Asp Asp Asn Cys Trp Cys

325 330 335

Ile Leu Ala Glu His Ala Phe Gly Asn Glu Gly Tyr Asp Glu Tyr Pro

340 345 350

Ile Leu Glu Glu Ile Gly Arg Lys Ile Ala Lys Lys Cys Asn Gly Leu

355 360 365

Pro Leu Ala Ala Lys Thr Leu Gly Gly Leu Leu Arg Ser Asn Val Asp

370 375 380

Ala Lys Glu Trp Asn Arg Ile Leu Asn Ser Asn Leu Trp Ala His Glu

385 390 395 400

Glu Val Leu Pro Ala Leu His Ile Ser Tyr Leu His Leu Pro Ala His

405 410 415

Leu Lys Arg Cys Phe Ser Tyr Cys Ser Ile Phe Pro Lys Gln His Leu

420 425 430

Leu Asp Arg Lys Glu Leu Ile Leu Leu Trp Met Ala Glu Gly Phe Leu

435 440 445

Gln Gln Ile His Gly Glu Lys Ala Met Glu Leu Ala Gly Asp Asp Tyr

450 455 460

Phe Asn Glu Leu Leu Ser Arg Ser Leu Ile Glu Lys Asp Lys Thr Glu

465 470 475 480

Ala Glu Asp Lys Phe Arg Met His Asp Leu Ile Tyr Asp Leu Ala Arg

485 490 495

Leu Ile Ala Gly Lys Asn Ser Cys Tyr Leu Glu Gly Asn Lys Ile Ser

500 505 510

Gly Gly Val Arg Gln Leu Ala Phe Tyr Ser Arg Lys Phe Asp Val Ser

515 520 525

Glu Arg Phe Glu Gly Leu His Asp Leu Lys Phe Leu Arg Thr Phe Leu

530 535 540

Arg Leu Phe Lys Tyr Gly Pro Phe Ser Tyr Gly His Val Thr Lys Lys

545 550 555 560

Val Ser His Asp Trp Leu Pro Lys Leu Lys Tyr Leu Arg Thr Leu Ser

565 570 575

Leu Leu Gly Tyr Glu Asn Ile Thr Glu Leu Pro Asp Ser Ile Ser Asn

580 585 590

Leu Val Leu Leu Arg Tyr Leu Asp Leu Ser Tyr Thr Ser Ile Lys Arg

595 600 605

Leu Pro Asp Ala Thr Phe Arg Leu Tyr Asn Leu Gln Thr Leu Lys Leu

610 615 620

Ser Asn Cys Lys Cys Leu Thr Gln Leu Pro Glu Gln Ile Gly Asn Leu

625 630 635 640

Val Asn Leu Arg His Leu Asp Ile Arg Gly Thr Asn Leu Thr Glu Met

645 650 655

Pro Ala Gln Ile Ser Lys Leu Gln Asp Leu Arg Val Leu Thr Ser Phe

660 665 670

Val Val Gly Arg Glu Asp Gly Val Asn Ile Arg Glu Leu Arg Lys Phe

675 680 685

Pro Tyr Leu Gln Gly Thr Leu Ser Ile Leu Gly Leu Gln Asn Val Val

690 695 700

Asp Pro Lys His Ala Phe Gln Ala Asp Leu Lys Lys Lys Glu His Val

705 710 715 720

Glu Glu Leu Thr Leu Glu Trp Gly Ser Glu Pro Gln Tyr Ser Gln Leu

725 730 735

Glu Lys Asp Val Leu Gln Asn Leu Gln Pro Ser Thr Asn Leu Lys Lys

740 745 750

Leu Thr Ile Arg Tyr Tyr Ser Gly Thr Ser Phe Pro Lys Trp Leu Gly

755 760 765

Asp Ser Ser Tyr Ser Tyr Val Ile Phe Leu Cys Ile Thr Asn Cys Lys

770 775 780

Tyr Cys Phe Ser Leu Pro Pro Phe Gly Gln Leu Pro Ser Leu Lys Glu

785 790 795 800

Leu Val Ile Lys Arg Met Lys Met Val Lys Thr Val Gly Glu Glu Phe

805 810 815

Tyr Cys Asn Asn Gly Val Ser Leu Ser Phe Gln Pro Phe Pro Leu Leu

820 825 830

Glu Ser Ile Gln Phe Glu Glu Met Ser Glu Trp Glu Glu Trp Leu Pro

835 840 845

Phe Glu Gly Glu Gly Ser Lys Phe Pro Phe Pro Cys Leu Lys His Leu

850 855 860

Ser Leu Ser Lys Cys Pro Lys Leu Arg Gly Asn Leu Pro Asn His Leu

865 870 875 880

Pro Ser Leu Thr His Val Arg Ile Ser Glu Cys Asn Lys Leu Glu Ala

885 890 895

Lys Ser His Asp Leu His Trp Asn Thr Ser Ile Glu Glu Ile Lys Val

900 905 910

Arg Glu Ala Gly Glu Asp Leu Leu Ser Leu Leu Asp Asn Phe Ser Tyr

915 920 925

Arg Asn Leu Arg Ile Lys Lys Cys Asp Ser Leu Ser Ser Leu Pro Arg

930 935 940

Met Ile Leu Ala Ala Asn Cys Leu Gln Arg Leu Thr Leu Lys Asp Ile

945 950 955 960

Pro Asn Leu Ile Ser Phe Pro Ala Asp Gly Leu Pro Thr Ser Leu Gln

965 970 975

Ser Leu Ser Ile Phe Asp Cys Glu Asn Leu Glu Phe Leu Ser Pro Glu

980 985 990

Ser Cys His Lys Tyr Thr Ser LeuGlu Tyr Leu Ser IleVal Asn Ser

995 1000 1005

Cys HisSer Leu Ala Ser LeuPro Leu Asp Gly PheSer Ser Leu

1010 1015 1020

Gln ArgLeu Gln Ile Gln LysCys Pro Asn Met GluAla Ile Thr

1025 1030 1035

Thr GlnGly Gly Thr Asn AlaLeu Lys Leu Thr HisLeu Tyr Val

1040 1045 1050

Arg AspCys Lys Lys Leu ArgSer Leu Pro Glu GlnIle His Leu

1055 1060 1065

Pro AlaLeu Arg Trp Leu GluLeu Ser Lys Leu ProGlu Leu Ile

1070 1075 1080

Ser LeuPro Pro Arg Cys LeuPro Ser Ser Leu GlnVal Leu Glu

1085 1090 1095

Val GluVal Gly Met Leu SerSer Met Ser Lys HisGlu Leu Gly

1100 1105 1110

Phe LeuPhe Gln Arg Leu ThrSer Leu Ser Ser LeuGlu Ile Ser

1115 1120 1125

Gly TyrGly Glu Glu Asp ValVal Asn Thr Leu LeuLys Glu Cys

1130 1135 1140

Leu LeuPro Thr Ser Leu GlnTyr Leu Cys Leu ValLys Phe Asp

1145 1150 1155

Asp LeuLys Leu Leu Glu GlyLys Gly Leu Gln GlnLeu Thr Ser

1160 1165 1170

Leu ArgGly Phe Gly Ile ArgAsn Cys Lys Ser LeuGlu Ser Leu

1175 1180 1185

Pro GluAsp Gln Leu Pro SerSer Leu Glu Leu LeuGlu Ile His

1190 1195 1200

Gly CysPro Leu Leu Glu AlaArg Tyr Gln Ser ArgLys Gly Lys

1205 1210 1215

His TrpSer Lys Ile Ala HisIle Pro Ala Ile GluIle Asn Asp

1220 1225 1230

Glu ValIle Ile

1235

<210>13

<211>3714

<212>DNA

<213>短绒野大豆(Glycine tomentella)

<400>13

atggccttag ctatggtggg agaggcactt atctctgctt ctgtggagat cttgctggat60

aggataactt ctacagagtt tcgcgatttc tttgccaaca gaaacctcaa tgtttctctc 120

ttggatgagc tgaagataaa gctgttggca ctcaatgctg tgctcaatga tgctgaggag 180

aaacagatca ctaattcagc agtgaaggga tggcttgatg agttgaaaga tgctgtttta 240

gacgcagagg atttgatgga cgaaatcaac acagattctc tgaggtgcaa ggtggaggga 300

gaatttaaaa cctttactag ccaggtgtgg tcatcacttt cttctccctt taatcaattc 360

tataggagca tgaattccaa gcttgaagca atatctggaa ggctagaaca ttttatgaaa 420

caaaaagata ttcttggttt gcaaagtgtt tctaggaaag tctcctacaa aacagttaca 480

gattcattgg ttgaatctgt tgttgttgca agggaggatg acaaagagaa gctactgagc 540

atgcttctct ctgatgaaga tgagaagaat aataacatag aagtgctaac aatattgggc 600

atgggaggtc ttggaaaaac aaccttagct caatgccttt ataatgatag tgcagtgcag 660

aaacattttg atttgaccac ttgggcatgg gtatctgatg attttgatgt gtttagggtg 720

acaaagacaa ttgttgaatc tgtcacttct aaaaattgta atagtactaa ttttgatgct 780

cttcgtgttg agttgaagaa cagcttgaaa gataaaaagt ttttgcttgt cctcgatgac 840

ctttggaacg aaaagtataa tgattggcat cacctaatag caccttttag cggtggaaaa 900

aagggaagta agattattgt gacaactcga caacagaaag ttgcacaaat gacacataca 960

tatcccgttt atgagctgaa acatctaaca gatgacaatt gttggtgtat acttgctgaa1020

catgcatttg gcaatgaagg ttatgatgaa tatccaatcc tagaagaaat tggtaggaaa1080

attgcaaaaa aatgcaatgg cctaccttta gctgctaaaa cattgggagg tcttttgcga1140

tcaaatgtgg atgcaaaaga atggaataga attctgaaca gcaacttatg ggcacatgaa1200

gaggtgttac cagctttaca cataagttat cttcatctcc cagcacattt gaaaagatgt1260

ttttcttatt gctcaatttt tccaaaacaa catttgttgg ataggaagga gttgattctg1320

ttatggatgg ctgaaggctt tcttcaacaa attcacggag agaaagcaat ggaattagca1380

ggtgatgact actttaatga attattatca agatctttaa ttgaaaaaga caaaactgaa1440

gcagaggata agtttcgaat gcatgacctc atctatgatt tggctagact aatagctgga1500

aaaaactctt gctacttgga aggtaataaa atctcaggag gtgttcgcca attagcattt1560

tattcaagaa aatttgatgt ctctgaaaga tttgagggct tgcatgacct aaagtttttg1620

cgcacttttt tacgactctt taaatatgga cctttcagtt atgggcatgt aaccaaaaag1680

gtgtcacatg attggttgcc aaaactaaaa tatttgcgaa cattgtcctt gcttggctat1740

gaaaatatca ctgagttgcc tgattcaata agcaatttgg tgcttttgag gtatcttgac1800

ctttcctata cttccatcaa aaggttgccc gatgcaacct ttaggcttta caatttgcag1860

actttgaaat tgtcaaattg taaatgcctt actcagttgc ctgaacagat aggaaatttg1920

gtcaatctac gccaccttga tattagaggc acaaatttga cggagatgcc agcacaaata1980

agcaagctac aagatctccg tgtgttgact tcttttgttg taggcagaga agatggagta2040

aatatcagag aattaagaaa gtttccttac ttgcaaggta ctctttctat tttggggcta2100

caaaatgttg ttgatcccaa gcatgctttt caagctgact taaagaagaa agagcatgtt2160

gaggagctta cgctagagtg gggtagtgag ccacaatatt cacaacttga gaaagatgta2220

cttcagaacc tgcaaccatc aacaaattta aagaaactca ccataagata ctacagtggc2280

acaagctttc ctaaatggtt gggtgactct tcatattctt atgttatatt cctttgcatc2340

actaattgca aatattgctt ttcacttcca ccatttggac aactaccttc tctcaaggag2400

cttgtgataa aaaggatgaa aatggtgaag acagttggtg aagaattcta ctgcaacaat2460

ggggtttccc tttcatttca accatttcca ttgttggaga gtatccagtt cgaagagatg2520

tcagagtggg aagagtggct accatttgaa ggtgaaggca gcaagtttcc ttttccttgc2580

cttaaacatt tgagtttatc aaaatgcccc aagttgagag gaaacttgcc caaccatcta2640

ccttcgttga cacatgttcg tatatcagag tgcaacaagc tagaggcaaa atcacatgat2700

ctacattgga acacatcaat tgaagaaata aaggttagag aagcaggaga agatttgttg2760

tccttgcttg acaacttttc ttataggaat ctacggatta aaaagtgtga cagcttgtca2820

tctttgccaa gaatgatact agctgccaat tgtctccaaa ggttgactct taaggatatc2880

cccaatttga tttccttccc agccgatggc ttgccaacgt cattgcaatc acttagcatt2940

ttcgactgtg agaacttaga atttctgtct cccgaatcat gccacaaata cacatcactt3000

gaatatctgt caattgtcaa tagctgccat tccctggcgt ccttaccatt agatggtttc3060

tcttccctac aaagacttca aatccagaaa tgtcccaaca tggaagcaat tactactcaa3120

ggtggaacga atgctctcaa attaactcat ctgtatgttc gggattgtaa gaaacttagg3180

tcacttccag aacagattca tctccctgcc cttcgatggt tagagctttc taagcttcca3240

gagctaatat cattgccccc aaggtgtttg ccttccagtt tacaagtact cgaagttgaa3300

gttggaatgc tatcatcaat gtctaaacac gagttaggtt tcctattcca acgcctcact3360

tctctgtcta gtcttgagat tagtggttat ggggaggaag atgttgttaa caccctgttg3420

aaggagtgct tactgcccac ttcgctgcaa tatctgtgcc tagtgaagtt tgatgattta3480

aagttgttgg aaggaaaagg gcttcaacag ctcacttccc tcagagggtt tggcatcagg3540

aattgtaaaa gcctcgagtc cttgcccgaa gatcagcttc catcctctct tgaattactg3600

gagatacatg gttgtccttt actagaagca aggtatcaaa gtcggaaagg gaaacactgg3660

tctaagattg ctcacattcc tgcgatcgag ataaatgatg aagtgataat atga3714

<210>14

<211>15445

<212>DNA

<213>人工

<220>

<223>载体25190

<400>14

attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt60

taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120

tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180

tccctaatta gctaacccgg gggcgcgccg ggacccgtga ttgcggttac atcatgtacg 240

gaaaaataat tctaatcctt gatttaaatt tgatcttgac tatttattta ttctttattt 300

cattttgtaa atcattttat gtatcccctg gcaaggcaat tttatccacc ttgcacccaa 360

cacttcgggt tcccataaat caaaccacct taacttcaca caatgctgta actcacaccg 420

cccagcatct ccaatgtgaa agaagctaaa atttaataaa caatcatacg aagcagtgac 480

aaaataccag atggtattaa tgctttgata aaattaattg gaaagtataa aatggtagga 540

aataattaat tataattaat ttaaataaga ttaaaaataa tttaaaacta aaatgttaaa 600

attttaagaa aattatttta aataatattt aaaaacattt aaaatcattt taaaaaattt 660

atttatagga caattaaatg aatatttcag ctaattaaaa acaaaagctt acctagcctt 720

agaagacaac ttgtccaaca attagatgat acccattgcc cttacgtttt ctttaacatc 780

aattattgtt tttgtcaaca agctatcttt tagttttatt ttattggtaa aaaatattgt 840

cgccttcaag ttgcatcatt taacacatct cgtcattaga aaaataaaac tcttccctaa 900

acgattagta gaaaaaatca ttcgataata aataagcaag caaaattagg aaaaaataac 960

ttcattttaa aaaaatcatt aaggctatat tttttaaatg actaatttta tatagactgt1020

aactaaaagt atacaattta ttatgctatg tatcttaaag aattacttat aaaaatctac1080

ggaagaatat cttacaaagt gaaaaacaaa tgagaaagaa tttagtggga tgattatgat1140

tttatttgaa aattgaaaaa ataattatta aagactttag tggagtaaga aagctttcct1200

attagtcttt tcttatccat aaaaaaaaaa aaaaaaatct agcgtgacag cttttccata1260

gattttaata atgtaaaata ctggtagcag ccgaccgttc aggtaatgga cactgtggtc1320

ctaacttgca acgggtgcgg gcccaattta ataacgccgt ggtaacggat aaagccaagc1380

gtgaaggggt gaaggtacat ctctgactcc gtcaagatta cgaaaccgtc aactacgaag1440

gactccccga aatatcatct gtgtcataaa caccaagtca caccatacat gggcacgcgt1500

cacaatatga ttggagaacg gttccaccgc atatgctata aattgccccc acacccctcg1560

accctaatcg cacttgaatt gcaatcaaat tagttcattc tctttgcgca gttccctacc1620

tccccctttc aaggtccgta gattcctcct gttttttttt cttcttcttt attgtttgtt1680

ctacatcagc atgatgttga tttgattgtg ttttctatcg tttcatcgat tataaatttt1740

cataatcaga agattcagct tttattaatg caagaacgtc cttaattgat gattttataa1800

ccgtaaatta ggtctaatta gagttttttt cataaagatt ttcagatccg tttacaacaa1860

gccttaattg ttgattctgt agtcgtagat taaggttttt ttcatgaact acttcagatc1920

cgttaaacaa cagccttatt tgttgatact tcagtcgttt ttcaagaaat tgttcagatc1980

cgttgataaa agccttattc gttgattctg tatggtattt caagagatat tgctcaggtc2040

ctttagcaac taccttattt gttgattctg tggccataga ttaggatttt ttttcacgaa2100

attgcttctt gaaattacgt gatggatttt gattctgatt tatcttgtga ttgttgactc2160

tacaggatcc aaaaaatggc cttagctatg gtgggagagg cacttatctc tgcttctgtg2220

gagatcttgc tggataggat aacttctaca gagtttcgcg atttctttgc caacagaaac2280

ctcaatgttt ctctcttgga tgagctgaag ataaagctgt tggcactcaa tgctgtgctc2340

aatgatgctg aggagaaaca gatcactaat tcagcagtga agggatggct tgatgagttg2400

aaagatgctg ttttagacgc agaggatttg atggacgaaa tcaacacaga ttctctgagg2460

tgcaaggtgg agggagaatt taaaaccttt actagccagg tgtggtcatc actttcttct2520

ccctttaatc aattctatag gagcatgaat tccaagcttg aagcaatatc tggaaggcta2580

gaacatttta tgaaacaaaa agatattctt ggtttgcaaa gtgtttctag gaaagtctcc2640

tacaaaacag ttacagattc attggttgaa tctgttgttg ttgcaaggga ggatgacaaa2700

gagaagctac tgagcatgct tctctctgat gaagatgaga agaataataa catagaagtg2760

ctaacaatat tgggcatggg aggtcttgga aaaacaacct tagctcaatg cctttataat2820

gatagtgcag tgcagaaaca ttttgatttg accacttggg catgggtatc tgatgatttt2880

gatgtgttta gggtgacaaa gacaattgtt gaatctgtca cttctaaaaa ttgtaatagt2940

actaattttg atgctcttcg tgttgagttg aagaacagct tgaaagataa aaagtttttg3000

cttgtcctcg atgacctttg gaacgaaaag tataatgatt ggcatcacct aatagcacct3060

tttagcggtg gaaaaaaggg aagtaagatt attgtgacaa ctcgacaaca gaaagttgca3120

caaatgacac atacatatcc cgtttatgag ctgaaacatc taacagatga caattgttgg3180

tgtatacttg ctgaacatgc atttggcaat gaaggttatg atgaatatcc aatcctagaa3240

gaaattggta ggaaaattgc aaaaaaatgc aatggcctac ctttagctgc taaaacattg3300

ggaggtcttt tgcgatcaaa tgtggatgca aaagaatgga atagaattct gaacagcaac3360

ttatgggcac atgaagaggt gttaccagct ttacacataa gttatcttca tctcccagca3420

catttgaaaa gatgtttttc ttattgctca atttttccaa aacaacattt gttggatagg3480

aaggagttga ttctgttatg gatggctgaa ggctttcttc aacaaattca cggagagaaa3540

gcaatggaat tagcaggtga tgactacttt aatgaattat tatcaagatc tttaattgaa3600

aaagacaaaa ctgaagcaga ggataagttt cgaatgcatg acctcatcta tgatttggct3660

agactaatag ctggaaaaaa ctcttgctac ttggaaggta ataaaatctc aggaggtgtt3720

cgccaattag cattttattc aagaaaattt gatgtctctg aaagatttga gggcttgcat3780

gacctaaagt ttttgcgcac ttttttacga ctctttaaat atggaccttt cagttatggg3840

catgtaacca aaaaggtgtc acatgattgg ttgccaaaac taaaatattt gcgaacattg3900

tccttgcttg gctatgaaaa tatcactgag ttgcctgatt caataagcaa tttggtgctt3960

ttgaggtatc ttgacctttc ctatacttcc atcaaaaggt tgcccgatgc aacctttagg4020

ctttacaatt tgcagacttt gaaattgtca aattgtaaat gccttactca gttgcctgaa4080

cagataggaa atttggtcaa tctacgccac cttgatatta gaggcacaaa tttgacggag4140

atgccagcac aaataagcaa gctacaagat ctccgtgtgt tgacttcttt tgttgtaggc4200

agagaagatg gagtaaatat cagagaatta agaaagtttc cttacttgca aggtactctt4260

tctattttgg ggctacaaaa tgttgttgat cccaagcatg cttttcaagc tgacttaaag4320

aagaaagagc atgttgagga gcttacgcta gagtggggta gtgagccaca atattcacaa4380

cttgagaaag atgtacttca gaacctgcaa ccatcaacaa atttaaagaa actcaccata4440

agatactaca gtggcacaag ctttcctaaa tggttgggtg actcttcata ttcttatgtt4500

atattccttt gcatcactaa ttgcaaatat tgcttttcac ttccaccatt tggacaacta4560

ccttctctca aggagcttgt gataaaaagg atgaaaatgg tgaagacagt tggtgaagaa4620

ttctactgca acaatggggt ttccctttca tttcaaccat ttccattgtt ggagagtatc4680

cagttcgaag agatgtcaga gtgggaagag tggctaccat ttgaaggtga aggcagcaag4740

tttccttttc cttgccttaa acatttgagt ttatcaaaat gccccaagtt gagaggaaac4800

ttgcccaacc atctaccttc gttgacacat gttcgtatat cagagtgcaa caagctagag4860

gcaaaatcac atgatctaca ttggaacaca tcaattgaag aaataaaggt tagagaagca4920

ggagaagatt tgttgtcctt gcttgacaac ttttcttata ggaatctacg gattaaaaag4980

tgtgacagct tgtcatcttt gccaagaatg atactagctg ccaattgtct ccaaaggttg5040

actcttaagg atatccccaa tttgatttcc ttcccagccg atggcttgcc aacgtcattg5100

caatcactta gcattttcga ctgtgagaac ttagaatttc tgtctcccga atcatgccac5160

aaatacacat cacttgaata tctgtcaatt gtcaatagct gccattccct ggcgtcctta5220

ccattagatg gtttctcttc cctacaaaga cttcaaatcc agaaatgtcc caacatggaa5280

gcaattacta ctcaaggtgg aacgaatgct ctcaaattaa ctcatctgta tgttcgggat5340

tgtaagaaac ttaggtcact tccagaacag attcatctcc ctgcccttcg atggttagag5400

ctttctaagc ttccagagct aatatcattg cccccaaggt gtttgccttc cagtttacaa5460

gtactcgaag ttgaagttgg aatgctatca tcaatgtcta aacacgagtt aggtttccta5520

ttccaacgcc tcacttctct gtctagtctt gagattagtg gttatgggga ggaagatgtt5580

gttaacaccc tgttgaagga gtgcttactg cccacttcgc tgcaatatct gtgcctagtg5640

aagtttgatg atttaaagtt gttggaagga aaagggcttc aacagctcac ttccctcaga5700

gggtttggca tcaggaattg taaaagcctc gagtccttgc ccgaagatca gcttccatcc5760

tctcttgaat tactggagat acatggttgt cctttactag aagcaaggta tcaaagtcgg5820

aaagggaaac actggtctaa gattgctcac attcctgcga tcgagataaa tgatgaagtg5880

ataatatgac tgagctcagc tttttgtgat ctgatgataa gtggttggtt cgtgtctcat5940

gcacttggga ggtgatctat ttcacctggt gtagtttgtg tttccgtcag ttggaaaaac6000

ttatccctat cgatttcgtt ttcattttct gcttttcttt tatgtacctt cgtttgggct6060

tgtaacgggc ctttgtattt caactctcaa taataatcca agtgcatgtt aaacaatttg6120

tcatctgttt cggctttgat atactactgg tgaagatggg ccgtactact gcatcacaac6180

gaaaaataat aataagatga aaaacttgaa gtggaaaaaa aaaacttgaa tgttcactac6240

tacctagcta gttagcggac cgctaattag ctaagagaca cttgtgtgat tgagagaaac6300

actaatcttg tgaggactga agtttggtga ttatttcttg tgatctgtcg acaaaaatat6360

caaatggggt ttcttttaca aattatttac ctaaatgaat ctgttttgaa aatatttact6420

ccattgggtc tattttttta ttacaaagcg tctccctgaa gggcgcgttc cccgtgaaag6480

tgacacgtgg caggacttgg gacgtgccct gcgtacaggc gcgatagtta gtgttgttac6540

agcaggcgca tcgggtcgtg ttggggacca aggtacgaca ggtcgcgctg ggtgacccag6600

acacgaccca attgggtcgc actttattta atatttttta tattttgtat attgttttta6660

tttaatatat ttttatatta ttttatttaa tttttttata ttttatataa tagtttctat6720

attaaataaa ttcttagcat tatgtatgat tttaaagtca taaataattt tttatattgt6780

ttttatttac tatatttttt atattttatt taatatttat atattaaata aatccttcat6840

attagaaaaa ataaagaaaa tattaaataa aatataaaat ataaaaaagt aaaaaatatt6900

aaataaaata atataaaaaa tattataaaa acaatataaa aaatataaaa atatttaata6960

aaataataaa aaaaatatta ttttaaataa aattatttat gactttaaac tctaaagttg7020

aattttaaaa aaatataatt tttttacgat tttagtaaaa aaaaaataca agccgcacaa7080

tacaagtcgc cttctcaaac ccttcctcac gacattctcg gaccttatga caccgtcacc7140

aaaacaatga tccacgcgat attaggcgcg tgcaaatcac tctaatccga aactagtaga7200

catgggaagc acgagctata cgcgagcgtt tcaattgccg ccacgaaagc agagaaggcc7260

agaaacggaa ccacggtaaa atggtaaggg tattttcgta aacagaagaa aagagttgta7320

gctataaata aaccctctaa cccacggcgc actatttctc ttcactcctt cgttcactct7380

tcttctcttg cggctagggt tttagcgcag cttcttctag gttcgttctc ttccgccgct7440

ctatggattt taaaccttcg aatcatgttt attccattga attatgttgc ttgcagttta7500

tattttctga atctgtagtt gttgtcttca atttatccta tgctttatag atcaatcttt7560

tgtgtgtgta gtacgtaatt tttgttcttt ttgcttttcg ttcaagttgt tgggaataat7620

cggggtatca tgttttgata ttgtttgttt tcttttttga ctgcttaata atttttaagt7680

tggttttggt tttggggttt tatgtgcttg ttatattcaa atctttgtga tccagatctt7740

acaaaagttt tgggtttaag gatgtttttg gctgatgatg aatagatcta taaactgttc7800

cttttaatcg attcaagctt aggattttac taggcttttg cgaataaata cgtgacagta7860

agctaattat gtcctttttt tgtctcaatc atatctgtct gggtgtgcca taatttgtga7920

tatgtctatc tggtagaatc ttgtgtttta tgctttacga tttggtatac ctgtttttga7980

acttgttgta tgatgggtat ttagatcacc ctatcttttt tatgcttctg gaagttttat8040

gtaaatgtcg aatatcttaa tgttgttgaa cttataatgt tgtgttgatg tatgtatgat8100

ggttttgaca acttttttca ctggttctga aagttttatg taaattgcaa atatgttaat8160

gttgttgaac ttattttttt tccttcgatg ttgttttgat gtatgtatga tggttttcac8220

cgtagtttct atggctaata tcttaatgtt gttgagctta tttttttcct tatatgttgt8280

gttgatgtat tgtatgatgg ttttgacaac ttttttagtt tctttgcaga tttaaggaag8340

aaaaaaaaaa tggctcttgt tgctagacca gtgctttctg ctagagttgc tgcttctaga8400

ccaagagttg ctgcaagaaa ggctgttaga gtgtctgcta tgtctcatgg tgcttcatct8460

agaccagcta ctgctagaaa gtcctctgga ctttctggaa ctgttaggat tccaggcgat8520

aagtctattt cccaccgttc tttcatgttc ggaggacttg cttctggtga gactagaatt8580

actggacttc ttgagggcga ggatgttatt aacactggaa aggctatgca ggctatggga8640

gctagaatta gaaaagaggg cgatacctgg attattgatg gtgttggaaa cggtggactt8700

cttgctccag aagctccact tgatttcgga aacgctgcta ctggatgcag acttactatg8760

ggacttgttg gagtgtacga tttcgattcc accttcattg gagatgcttc tcttactaag8820

aggccaatgg gaagagtgct taacccactt agagagatgg gagttcaggt taagtctgag8880

gatggtgata ggcttccagt tactcttaga ggaccaaaga ctccaacccc aattacttac8940

agagtgccaa tggcttctgc tcaagttaag tctgctgttc ttcttgctgg acttaacact9000

ccaggtatta ccactgtgat cgagccaatt atgaccagag atcataccga gaagatgctt9060

caaggattcg gagctaacct taccgttgaa actgatgctg atggtgttag gaccattaga9120

cttgagggaa gaggaaagct taccggacaa gttattgatg ttccaggtga tccatcttct9180

accgctttcc ctcttgttgc tgctcttttg gttccaggat ctgatgtgac cattcttaac9240

gtgctcatga acccatctag gaccggactt attcttaccc ttcaagaaat gggcgctgat9300

attgaggtta tcaacccaag acttgctggt ggtgaagatg ttgctgatct tagggttagg9360

tcctctactc ttaagggtgt tactgttcca gaagataggg ctccatccat gattgatgag9420

tacccaattc ttgctgtggc tgctgctttc gctgaaggtg ctactgttat gaacggactt9480

gaggaactta gggtgaaaga gtctgatagg ctttctgctg ttgctaacgg acttaagctt9540

aacggtgtgg attgtgatga gggtgagact tctcttgttg ttagaggtag accagatgga9600

aagggacttg gaaacgcttc tggtgcagca gttgcaactc atcttgatca taggatcgct9660

atgtccttcc ttgttatggg tcttgtttct gagaacccag ttaccgttga tgatgctact9720

atgattgcta ccagcttccc agagttcatg gatcttatgg ctggacttgg agctaagatt9780

gagctttctg ataccaaggc tgcctgacta attagctaag agcttgatcc gtcgacctgc9840

agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc9900

gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg9960

catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 10020

cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 10080

tatgttacta gatccctgca ggcccggggg cgcgccctaa ttagctaacg gccaggatcg 10140

ccgcgtgagc ctttagcaac tagctagatt aattaacgca atctgttatt aagttgtcta 10200

agcgtcaatt tgtttacacc acaatatatc ctgccaccag ccagccaaca gctccccgac 10260

cggcagctcg gcacaaaatc accactcgat acaggcagcc catcagaatt aattctcatg 10320

tttgacagct tatcatcgac tgcacggtgc accaatgctt ctggcgtcag gcagccatcg 10380

gaagctgtgg tatggctgtg caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg 10440

cactcccgtt ctggataatg ttttttgcgc cgacatcata acggttctgg caaatattct 10500

gaaatgagct gttgacaatt aatcatccgg ctcgtataat gtgtggaatt gtgagcggat 10560

aacaatttca cacaggaaac agaccatgag ggaagcgttg atcgccgaag tatcgactca 10620

actatcagag gtagttggcg tcatcgagcg ccatctcgaa ccgacgttgc tggccgtaca 10680

tttgtacggc tccgcagtgg atggcggcct gaagccacac agtgatattg atttgctggt 10740

tacggtgacc gtaaggcttg atgaaacaac gcggcgagct ttgatcaacg accttttgga 10800

aacttcggct tcccctggag agagcgagat tctccgcgct gtagaagtca ccattgttgt 10860

gcacgacgac atcattccgt ggcgttatcc agctaagcgc gaactgcaat ttggagaatg 10920

gcagcgcaat gacattcttg caggtatctt cgagccagcc acgatcgaca ttgatctggc 10980

tatcttgctg acaaaagcaa gagaacatag cgttgccttg gtaggtccag cggcggagga 11040

actctttgat ccggttcctg aacaggatct atttgaggcg ctaaatgaaa ccttaacgct 11100

atggaactcg ccgcccgact gggctggcga tgagcgaaat gtagtgctta cgttgtcccg 11160

catttggtac agcgcagtaa ccggcaaaat cgcgccgaag gatgtcgctg ccgactgggc 11220

aatggagcgc ctgccggccc agtatcagcc cgtcatactt gaagctaggc aggcttatct 11280

tggacaagaa gatcgcttgg cctcgcgcgc agatcagttg gaagaatttg ttcactacgt 11340

gaaaggcgag atcaccaaag tagtcggcaa ataaagctct agtggatctc cgtacccagg 11400

gatctggctc gcggcggacg cacgacgccg gggcgagacc ataggcgatc tcctaaatca 11460

atagtagctg taacctcgaa gcgtttcact tgtaacaacg attgagaatt tttgtcataa 11520

aattgaaata cttggttcgc atttttgtca tccgcggtca gccgcaattc tgacgaactg 11580

cccatttagc tggagatgat tgtacatcct tcacgtgaaa atttctcaag cgctgtgaac 11640

aagggttcag attttagatt gaaaggtgag ccgttgaaac acgttcttct tgtcgatgac 11700

gacgtcgcta tgcggcatct tattattgaa taccttacga tccacgcctt caaagtgacc 11760

gcggtagccg acagcaccca gttcacaaga gtactctctt ccgcgacggt cgatgtcgtg 11820

gttgttgatc tagatttagg tcgtgaagat gggctcgaga tcgttcgtaa tctggcggca 11880

aagtctgata ttccaatcat aattatcagt ggcgaccgcc ttgaggagac ggataaagtt 11940

gttgcactcg agctaggagc aagtgatttt atcgctaagc cgttcagtat cagagagttt 12000

ctagcacgca ttcgggttgc cttgcgcgtg cgccccaacg ttgtccgctc caaagaccga 12060

cggtcttttt gttttactga ctggacactt aatctcaggc aacgtcgctt gatgtccgaa 12120

gctggcggtg aggtgaaact tacggcaggt gagttcaatc ttctcctcgc gtttttagag 12180

aaaccccgcg acgttctatc gcgcgagcaa cttctcattg ccagtcgagt acgcgacgag 12240

gaggtttatg acaggagtat agatgttctc attttgaggc tgcgccgcaa acttgaggca 12300

gatccgtcaa gccctcaact gataaaaaca gcaagaggtg ccggttattt ctttgacgcg 12360

gacgtgcagg tttcgcacgg ggggacgatg gcagcctgag ccaattccca gatccccgag 12420

gaatcggcgt gagcggtcgc aaaccatccg gcccggtaca aatcggcgcg gcgctgggtg 12480

atgacctggt ggagaagttg aaggccgcgc aggccgccca gcggcaacgc atcgaggcag 12540

aagcacgccc cggtgaatcg tggcaagcgg ccgctgatcg aatccgcaaa gaatcccggc 12600

aaccgccggc agccggtgcg ccgtcgatta ggaagccgcc caagggcgac gagcaaccag 12660

attttttcgt tccgatgctc tatgacgtgg gcacccgcga tagtcgcagc atcatggacg 12720

tggccgtttt ccgtctgtcg aagcgtgacc gacgagctgg cgaggtgatc cgctacgagc 12780

ttccagacgg gcacgtagag gtttccgcag ggccggccgg catggccagt gtgtgggatt 12840

acgacctggt actgatggcg gtttcccatc taaccgaatc catgaaccga taccgggaag 12900

ggaagggaga caagcccggc cgcgtgttcc gtccacacgt tgcggacgta ctcaagttct 12960

gccggcgagc cgatggcgga aagcagaaag acgacctggt agaaacctgc attcggttaa 13020

acaccacgca cgttgccatg cagcgtacga agaaggccaa gaacggccgc ctggtgacgg 13080

tatccgaggg tgaagccttg attagccgct acaagatcgt aaagagcgaa accgggcggc 13140

cggagtacat cgagatcgag ctggctgatt ggatgtaccg cgagatcaca gaaggcaaga 13200

acccggacgt gctgacggtt caccccgatt actttttgat cgatcccggc atcggccgtt 13260

ttctctaccg cctggcacgc cgcgccgcag gcaaggcaga agccagatgg ttgttcaaga 13320

cgatctacga acgcagtggc agcgccggag agttcaagaa gttctgtttc accgtgcgca 13380

agctgatcgg gtcaaatgac ctgccggagt acgatttgaa ggaggaggcg gggcaggctg 13440

gcccgatcct agtcatgcgc taccgcaacc tgatcgaggg cgaagcatcc gccggttcct 13500

aatgtacgga gcagatgcta gggcaaattg ccctagcagg ggaaaaaggt cgaaaaggtc 13560

tctttcctgt ggatagcacg tacattggga acccaaagcc gtacattggg aaccggaacc 13620

cgtacattgg gaacccaaag ccgtacattg ggaaccggtc acacatgtaa gtgactgata 13680

taaaagagaa aaaaggcgat ttttccgcct aaaactcttt aaaacttatt aaaactctta 13740

aaacccgcct ggcctgtgca taactgtctg gccagcgcac agccgaagag ctgcaaaaag 13800

cgcctaccct tcggtcgctg cgctccctac gccccgccgc ttcgcgtcgg cctatcgcgg 13860

ccgctggccg ctcaaaaatg gctggcctac ggccaggcaa tctaccaggg cgcggacaag 13920

ccgcgccgtc gccactcgac cgccggcgct gaggtctgcc tcgtgaagaa ggtgttgctg 13980

actcatacca ggcctgaatc gccccatcat ccagccagaa agtgagggag ccacggttga 14040

tgagagcttt gttgtaggtg gaccagttgg tgattttgaa cttttgcttt gccacggaac 14100

ggtctgcgtt gtcgggaaga tgcgtgatct gatccttcaa ctcagcaaaa gttcgattta 14160

ttcaacaaag ccgccgtccc gtcaagtcag cgtaatgctc tgccagtgtt acaaccaatt 14220

aaccaattct gattagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 14280

aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 14340

gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 14400

atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 14460

atgagtgacg actgaatccg gtgagaatgg caaaagctct gcattaatga atcggccaac 14520

gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 14580

tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 14640

tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 14700

ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 14760

agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 14820

accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 14880

ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 14940

gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 15000

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 15060

gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 15120

taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 15180

tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 15240

gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 15300

cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 15360

agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 15420

cctagatcct tttgatccgg aatta 15445

相关技术
  • 与大豆中疾病抗性相关联的新颖的抗性基因
  • 与大豆中疾病抗性相关联的新颖的抗性基因
技术分类

06120115936958