首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 说明书 / 序列表 / 控制棕榈壳表型的基因

控制棕榈壳表型的基因

阅读:1022发布:2020-06-28

专利汇可以提供控制棕榈壳表型的基因专利检索,专利查询,专利分析的服务。并且用于预测并控制棕榈的壳表型的核酸序列。,下面是控制棕榈壳表型的基因专利的具体信息内容。

1.用于确定E.guineensis或E.oleifera棕榈植物种子的壳表型的方法,所述方法包括:
提供来自所述植物或种子的样品;从样品中扩增对应SEQ ID NO:8218的基因组区域的核苷酸,并对所述扩增核苷酸分析或测序;以及根据分析或测序确定样品在对应SEQ ID NO:8218的基因组区域中的至少一个多态性标记的基因型,所述多态性标记位于SEQ ID NO:1-7009;根据所述区域内的杂合性表明tenera壳表型的存在,其中,仅存在dura SHELL等位基因表示该植物或种子具有或会具有dura壳表型,仅存在pisifera SHELL等位基因表示该植物或种子具有或会具有pisifera壳表型,或者存在pisifera SHELL等位基因和dura SHELL等位基因表示该植物或种子具有或会具有tenera壳表型,其中,所述dura SHELL等位基因编码SEQ ID NO:8220,所述pisifera SHELL等位基因编码SEQ ID NO:8221或8222。
2.根据权利要求1所述的方法,其特征在于,所述植物或种子产生自:(i)具有dura壳表型的植物和具有pisifera壳表型的植物之间的尝试杂交;(ii)tenera棕榈自交;(iii)具有tenera壳表型的两株植物杂交;(iv)dura和tenera棕榈之间的杂交;(v)tenera和pisifera棕榈之间的杂交。
3.根据权利要求1所述的方法,其特征在于,所述植物的年龄小于5年。
4.根据权利要求1所述的方法,其特征在于,所述植物的年龄小于1年。
5.根据权利要求1所述的方法,其特征在于,所述多态性标记处在与SEQ ID NO:8219相对应的基因组区域内的位置中。
6.根据权利要求1所述的方法,其特征在于,所述多态性标记处在对应SEQ ID NO:8219的基因组区域中的位置的1、10、20、50、100、200、500、1000kb内。
7.根据权利要求1所述的方法,其特征在于,所述多态性标记能够预测至少86%、88%、
90%、92%、94%、96%、97%、98%或99%的tenera表型。
8.根据权利要求1所述的方法,其特征在于,如果所述植物的多态性标记是杂合的,所述方法进一步包括选择所述植物用于栽培。
9.根据权利要求1所述的方法,其特征在于,如果所述植物具有dura基因型,所述方法进一步包括选择所述植物用于栽培。
10.根据权利要求1所述的方法,其特征在于,如果所述植物具有pisifera基因型,所述方法进一步包括选择该植物用于栽培。
11.根据权利要求1所述的方法,其特征在于,如果所述植物或种子不具有预测为tenera壳表型的基因型,丢弃所述植物或种子。
12.基于预测的壳表型将多种E.guineensis或E.oleifera棕榈植物分为不同类别的方法,所述方法包括:
提供来自多种植物中的各株植物的样品;从样品中扩增对应SEQ ID NO:8218的基因组区域的核苷酸,并对所述扩增核苷酸分析或测序;根据分析或测序确定样品在对应SEQ ID NO:8218的基因组区域中的至少一个多态性标记的基因型,所述多态性标记位于SEQ ID NO:1-7009;以及基于所述多态性标记的基因型将所述植物分组,仅存在dura SHELL等位基因表示该植物或种子具有或会具有dura壳表型,仅存在pisifera SHELL等位基因表示该植物或种子具有或会具有pisifera壳表型,或者存在pisifera SHELL等位基因和dura SHELL等位基因表示该植物或种子具有或会具有tenera壳表型,其中,所述dura SHELL等位基因编码SEQ ID NO:8220,所述pisifera SHELL等位基因编码SEQ ID NO:8221或8222;其中至少一组仅包含如下植物中的一种:(i)预测具有tenera壳表型的植物;(ii)预测具有dura壳表型的植物;或(iii)预测具有pisifera壳表型的植物。
13.一种用于确定E.guineensis或E.oleifera棕榈植物的壳表型的试剂盒,所述试剂盒包括:一条或多条寡核苷酸引物或探针,其包括:SEQ ID NO:8218的至少18、20、22或24个核苷酸的序列;或与SEQ ID NO:8218的至少18、20、22或24个核苷酸100%互补的序列,以扩增得到包含至少一个SEQ ID NO:1-7009范围内的所述多态性标记的核苷酸片段;根据所述区域内的杂合性表明tenera壳表型的存在,其中,仅存在dura SHELL等位基因表示该植物或种子具有或会具有dura壳表型,仅存在pisifera SHELL等位基因表示该植物或种子具有或会具有pisifera壳表型,或者存在pisifera SHELL等位基因和dura SHELL等位基因表示该植物或种子具有或会具有tenera壳表型,其中,所述dura SHELL等位基因编码SEQ ID NO:8220,所述pisifera SHELL等位基因编码SEQ ID NO:8221或8222。
14.根据权利要求13所述的试剂盒,其特征在于,所述引物或探针与棕榈植物DNA特异性杂交。
15.根据权利要求13所述的试剂盒,其特征在于,所述引物或探针包括:SEQ ID NO:
8219的至少18、20、22或24或大于24个的核苷酸的序列;或与SEQ ID NO:8219的至少18、20、
22或24个核苷酸100%互补的序列,以扩增得到包含至少一个SEQ ID NO:8219区域内的所述多态性标记的核苷酸片段。
16.根据权利要求13-15中任何一项所述的试剂盒,其特征在于,可检测的标签连接至寡核苷酸。
17.根据权利要求16所述的试剂盒,其特征在于,可检测的标签为发荧光的。
18.根据权利要求13、14、15或17中任何一项所述的试剂盒,其特征在于,进一步包括多聚核苷酸,所述多聚核苷酸编码含有如下序列的多肽:与SEQ ID NO:8220、8221或8222具有至少80,85,90,95,97,98或99%一致或完全一致的序列。

说明书全文

控制棕榈壳表型的基因

技术领域

[0001] 本发明涉及植物遗传工程领域。更具体地,涉及操纵控制棕榈壳表型的基因。

背景技术

[0002] 本专利申请要求2012年3月19日提交的美国临时专利申请61/612,885的权益,为了各种目的通过参考将其引入。
[0003] 油棕(E.guineensis和E.oleifera)可根据其果实特性分为不同的组,并且具有3种天然存在的果实类型,其壳厚度和油产量有所不同。Dura类棕榈是壳基因的野生型等位基因的纯合体(sh+/sh+),具有厚种皮或壳(2-8mm),并且每年每公顷生产约5.3吨油。Tenera+ -
类棕榈是壳基因的野生型和突变型等位基因的杂合体(sh/sh),具有由明显的纤维环包围的相对薄的壳,并且每年每公顷生产约7.4吨油。最后,pisifera类棕榈是壳基因的的突变型等位基因的纯合体(sh-/sh-),没有种皮或壳,并且通常是雌性不育的(Hartley,1988)(表
1)。因此,单基因控制壳表型的遗传机制是对棕榈油产量的主要贡献。
[0004] Tenera是dura和pisifera棕榈之间的杂交体。Whitmore(1973)根据不同类的油棕描述各种果实形式。但是,Latiff(2000)认同Purseglove(1972)Whitmore提议的种类或品种在该物种中不具有严格意义。因此,Latiff(2000)提出了术语“种族”来区分dura、pisifera和tenera。种族被认为是一个适当的术语,因为它反映出稳定的小种,其中不同的种族彼此能够交换基因,这已在油棕中所观察到的不同果实形式得到充分证实(Latiff,
2000)。实际上,这三中不同种族的特性证明是简单地由单个基因的遗传所控制。遗传研究表明,shell基因显示共显性单基因遗传,这可用于育种计划(Beirnaert和Vanderweyen,
1941)。
[0005] 20世纪40年代,比属刚果首次报道了负责该表型的shell基因(Beirnaert和Venderweyan,1941)。然而,在此之前非洲已经认识并充分利用了tenera果实形式
(Devuyst,1953;Godding,1930;Sousa等人,2011)。鉴于shell基因所起的核心作用,油棕育种以北卡罗来纳州模型1(North Carolina Model 1)玉米育种设计的母本(dura)和父本
(pisifera)库利用相互轮回选拨法(Rajanaidu等人,2000)。德利dura种群,是种植在印度尼西亚茂物帕多瓦植物园(Bogor Botanical Garden,Indonesia)的四株原非洲棕榈的直系后代(1848),与AVROS(Algemene Vereniging van Rubberplanters ter Oostkust van Sumatra)和其它pisifera父本棕榈具有良好的配合。AVROS pisifera棕榈源于刚果著名的“Djongo”棕榈,而目前dura和pisifera的几个不同新增品系也是源自非洲(Rajanaidu el等人,2000)。
[0006] Tenera果实类型具有较高的中果皮/果实比率,这直接转化为比dura或pisifera棕榈明显更高的油产量(如表1所示)。
[0007] 表1:dura、tenera和pisifera果实形式的比较
[0008]
[0009] *通常表现为雌性不育,花束过早腐烂
[0010] **纤维环存在于中果皮中并且通常用作区分dura和tenera棕榈的判断工具。
[0011] (来源:Hardon等人,1985;Hartley,1988)
[0012] 由于油棕榈育种计划的关键是生产具有较高油产量的种植原料,而tenera棕榈是商业化种植的首选。出于这个原因,商业化种子生产商将大量资源投入到杂交种生产中dura和pisifera棕榈的杂交选择。尽管已经在油棕榈杂交种子的生产中取得许多进展,但在种子生产过程中仍有两个重要的问题。首先,产生高油产量tenera型棕榈的成批的
tenera种子,往往被dura种子污染(Donough和Law,1995)。现今,据估计,tenera种子中的dura污染可达到约5%的比率(由于质量控制措施改进的结果,从20世纪90年代初高达20-
30%下降)。种子污染部分是由于在开放的种植条件下,工人用梯子对高大树木进行人工授粉,并且对于一束指定的棕榈花,其成熟经历一段时间,使得难以在单个人工授粉事件中给花束中的所有花授粉,因此难以生产纯tenera种子。花束中的一些花可能在人工授粉之前已经成熟,因此可能有机会通过未知的树进行媒授粉,从而在花束中产生污染的种子。可替换地,在人工授粉时,花束中可能存在未成熟的花,并且该未成熟的花可能在授粉发生之后成熟,使得其可以通过未知的树进行风媒授粉,从而在花束中产生污染的种子。在在此描述的发明之前,不可能识别由种子产生的指定植物的指定种子的果实类型,除非其成熟到足以产生第一批果实,这通常在萌芽后耗费大约六年的时间。值得注意的是,在从发芽到果实生产的四到五年的间隔中,大量的土地、劳动力、资金和能源资源投入到被认为是tenera树的树中,其中一些将最终成为低产的、污染的、不想要的果实类型。等到识别这些不理想的树,将其从田中移除并且用tenera树替换是不切实际的,因此,在污染的树的25至30年的生产寿命中,生产商获得较低的棕榈油产量。因此,批量的tenera种子被dura或pisifera种子污染的问题是油棕榈育种的难题,强调需要一种以高准确度预测种子和育苗的果实类型的方法。
[0013] 种子生产过程中的第二个问题是种子生产商在维持dura和pisifera品系与杂交种子生产过程中产生的其它费用的投资。在本发明之前,没有已知的生产这样的树的方法:
当具有最优壳表型的树与其本身杂交或与另一具有最优壳表型的树杂交会产生将只产生
最优壳表型的种子。因此,为了最优壳表型,有必要改造树的基因以从一代到下一代繁殖纯种。
[0014] Mayes等人最初试图攻克壳基因的遗传图谱(1997)。在巴西,使用群体分离分析法(BSA)和遗传图谱的结合的第二组,报道两个随机扩增多态性DNA(RAPD)标记位于壳位点之侧(Moretzsohn等人,2000)。最近,Billotte等人,(2005)报道了基于简单重复序列(SSR)的油棕的高密度图谱,涉及薄壳E.guineensis(tenera)棕榈和厚壳E.guineensis(dura))棕榈之间的杂交。来西亚棕榈油局(MPOB)记录在档的专利描述了使用限制性片段技术的标记的识别,特别是连接至用于植株识别和育种目的的壳基因的限制性片段长度多态性(RFLP)标记(RAJINDER SINGH,LESLIE OOI CHENG-LI,RAHIMAH A.RAHMAN AND 
LESLIE LOW ENG TI.2008.Method for identification of a molecular marker linked to the shell gene of oil palm.专利申请号PI 20084563.专利于2008年11月13日提
交)。通过产生或构建tenera果实类型的棕榈的遗传图谱识别RFLP标记(SFB 83)。
[0015] 定义
[0016] “壳基因”指的是由壳存在或缺失或壳厚度引起的E.guineensis-dura,tenera和pisifera的三种果实形式。“多态性标记”指的是区分两个等位基因之间的遗传标记。
[0017] 基因组区域“对应”测试序列指的是基因组DNA与测试序列比对。通常,预期植物基因组将只有一个基因组区域(即,由二倍体植物的两个等位基因所表示的位点)对应测试序列。在一定程度上,来自植物的多于一个的基因组区域可以与测试序列比对,“对应的”基因组区域是具有最高百分比的相同核苷酸的基因组区域。可以使用Altschul等人,Nuc.Acids Res.25:3389 3402(1977)和Altschul等人,J.Mol.Biol.215:403 410(1990)中分别描述的包括BLAST2.2算法的任何BLAST以默认参数进行序列比较。
[0018] 在此使用的术语“核酸”,“多聚核苷酸”和“寡核苷酸”指的是核酸区域、核酸片段、引物、探针、扩增子和低聚物片段。该术语不受长度限制,,对于多聚脱核苷酸(含有2-脱氧-D-核糖)、多聚核糖核苷酸(含有D-核糖)和嘌呤或嘧啶基、或修饰的嘌呤或嘧啶碱基的任何其它N-糖苷的线型聚合物是通用的。这些术语包括双链和单链DNA,以及双链和单链RNA。
[0019] 核酸,多聚核苷酸或寡核苷酸可以包括,例如,磷酸二酯键或修饰的键,包括但不限于磷酸三酯,基磷酸酯,氧烷,酸酯,羧甲基酯,乙酰胺酯(acetamidate),氨基甲酸酯,硫醚,桥接的氨基磷酸酯,桥接的亚甲基膦酸酯,硫代磷酸酯,甲基膦酸酯,二硫代磷酸酯,桥接的硫代磷酸酯或砜键,以及这样的键的组合。
[0020] 核酸、多聚核苷酸或寡核苷酸可以包含五种生物学上存在的碱基(腺嘌呤、嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶)和/或除了这五种生物学上存在的碱基之外的碱基。
[0021] 可以通过Smith和Waterman Add.APL.Math.2:482(1981)的局部同源性算法,通过Needle man和Wunsch J.Mol.Biol.48:443(1970)的同源比对算法,通过Pearson和Lipman Proc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)的搜索相似性方法,通过这些算法(Wisconsin Genetics软件包中的GAP,BESTFIT,BLAST,FASTA,和TFASTA,Genetics 
Computer Group(GCG),575Science Dr.,Madison,WI)的计算机运行或通过目测对比较序列进行最优比对。
[0022] “序列一致性百分比”通过在比较窗口比较两条最优比对的序列确定,其中,在两条序列的最优比对中,相比于参考序列(其不包含插入或缺失),在比较窗口中的多聚核苷酸序列的部分可以包含插入或缺失(即,间隙)。通过确定在相同的核酸碱基或氨基酸残基出现在两条序列中的位置数所得出的匹配位置数,将匹配位置数除以在比较窗口中的位置总数,并将结果乘以100,以得出序列一致性百分比。
[0023] 多肽序列的术语“基本一致”是指包括具有至少75%序列一致性的序列的多肽。可替代地,百分比一致性可以是从75%到100%的任意整数。使用在此描述的程序,优选使用标准参数的BLAST,与参考序列比较,示例性实施例包括至少:75%、80%、85%、90%、95%或99%,如下文所述。技术人员将认识到,这些值可以适当地调整,从而通过考虑密码子简并性、氨基酸相似性、阅读框位置等等,确定由两条核苷酸序列编码的蛋白质的相应的一致性。除了不一致的残基位置可以因保守氨基酸变化而不同,“基本相似”的多肽共享序列,如上文所述。保守氨基酸替换指的是具有相似侧链的残基的可互换性,例如,具有脂肪族侧链的氨基酸组为:甘氨酸,丙氨酸,缬氨酸,亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的氨基酸组为丝氨酸和苏氨酸;具有含酰胺侧链的氨基酸组为天冬酰胺和谷氨酰胺;具有芳香族侧链的氨基酸组为苯丙氨酸、酪氨酸和色氨酸;、具有碱性侧链的氨基酸组为赖氨酸、精氨酸和组氨酸;具有含硫侧链的氨基酸组为半胱氨酸和甲硫氨酸。优选的保守氨基酸替代组为:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,天冬氨酸-谷氨酸,和天冬酰胺-谷氨酰胺。
[0024] 核苷酸序列基本一致的另一指征是,两个分子在严格条件下是否彼此杂交,或与第三条核酸杂交。严格条件依赖于序列并且在不同情况下不同。一般地,严格条件选定为在指定的离子强度和PH下比热解链点(Tm)低约5℃。Tm是50%的靶序列与完美匹配的探针杂交时的温度(在限定的离子强度和pH下)。典型地,严格条件是那些pH为7时盐浓度为约0.02摩尔,并且温度为至少约60℃的条件。
[0025] 术语“启动子”或“调节元件”指的是位于转录起始上游或下游并参与RNA聚合酶和其它蛋白质的识别和结合以启动转录的区域或序列决定因子。启动子不必是植物来源的,例如,可以使用源自植物病毒的启动子,如CaMV 35S启动子。
[0026] 术语“植物”包括整株植物、枝条营养器官/结构(例如,叶子、茎和茎)、根、花和花器官/结构(例如,苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟的子房)、植物组织(例如,维管组织、基本组织等)和细胞(例如,保卫细胞、卵细胞、毛状体等等),及其子代。可在本发明的方法中使用的植物的种类通常是指可广泛适合于转化技术的高等和低等植物种类,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类植物,和多细胞藻类。它包括各种倍体数的植物,包括非整倍体,多倍体,二倍体,单倍体和半合子。
[0027] “表达盒”指的是核酸构建体,当其导入宿主细胞时,分别导致RNA或多肽的转录和/或翻译。没有或不能翻译的反义构建体或正义构建体特别地包括在这个定义中。
[0028] 术语“可操作地连接”指的是核酸表达控制序列(比如启动子,或转录因子结合位点的阵列)和第二核酸序列之间的功能性连接,其中所述表达控制序列指导对应所述第二序列的核酸的转录。
[0029] 如果多聚核苷酸序列来自外来物种,或者,如果来自相同物种,该多聚核苷酸序列是从其原始形式修饰的,那么该多聚核苷酸序列与生物体或第二多核苷酸序列是“异源的”。例如,可操作地连接到编码序列的异源启动子指的是来自与衍生编码序列的物种不同的物种的启动子,或者,如果来自相同物种,与任何天然存在的等位基因变体不同的启动子。

发明内容

[0030] 在该专利中,我们描述并识别负责不同果实形式的壳基因的遗传图谱以及用于确定棕榈植物(包括但不限于整株棕榈植物或棕榈种子)壳表型的方法。我们通过测序使用纯合子作图克服由表型实验种群造成的挑战,并且我们发现油棕MADS-box基因的DNA结合域中的两个独立的突变大致类似于拟南芥SEEDSTICK(STK),也称为AGAMOUS-like 11(AGL11),以及拟南芥SHATTERPROOF(SHP1),还被称为AGAMOUS-like 1(AGL1)。为简单起见,在此我们将壳基因称为SHELL。我们证明,SHELL负责在撒哈拉以南的非洲的栽培和野生棕榈的壳表型。此外,我们的研究结果为单基因杂种优势归因于SHELL提供了遗传解释。这第一次用基因突变解释油棕经济性状,对日趋竞争激烈的全球食用油生产、生物燃料和热带雨林保护具有重要意义(Danielsen等人,2009)。
[0031] 在一些实施例中,提供用于确定棕榈(例如,油棕)植物(包括但不限于整株棕榈植物或棕榈种子)的壳表型的方法。在一些实施例中,该方法包括,提供来自该植物或种子的样品;以及从样品中确定对应SEQ ID NO:8218的基因组区域中的至少一个多态性标志,其中,所述区域内的杂合性指示tenera壳表型的存在。在一些实施例中,植物或种子由如下产生i)具有dura壳表型的植物和具有pisifera壳表型的植物之间杂交;ii)tenera棕榈自交;iii)具有tenera壳表型的两株植物之间杂交;iv),具有dura壳表型和具有tenera壳表型的植物之间杂交;或v)具有tenera壳表型的植物和具有pisifera壳表型的植物之间杂交。在一些实施例中,所述植物小于5年。在一些实施例中,所述植物小于1年。
[0032] 在一些实施例中,多态型标志在对应SEQ ID NO:8219的基因组区域中位置内。在一些实施例中,多态型标志在对应SEQ ID NO:8219的基因组区域的位置的1、10、20、50、100、200、500、1000、200、3000kb内。在一些实施例中,多态型标志预测至少86、88、90、92、
94、96、97、98,或99%的tenera表型。
[0033] 在一些实施例中,如果植物的多态型标志是杂合的,所述方法进一步包括选择用于栽培的种子或植物。在一些实施例中,如果植物或种子不具有预测tenera壳表型的基因型,则丢弃该植物或种子。
[0034] 还提供了一种基于预测的壳表型将多种棕榈(例如,油棕)植物分为不同类别的方法。在一些实施例中,该方法包括,提供来自多种植物中的各种植物的样品;确定样品对应SEQ ID NO:8218的遗传区域中的至少一个多态性标志的基因型;基于多态性标记的基因型将植物分组,其中所述组对应预测具有tenera壳表型的植物,预测具有dura壳表型的植物,和预测具有pisifera壳表型的植物。
[0035] 还提供用于确定棕榈种子或植物的壳表型的试剂盒。在一些实施例中,所述试剂盒包含一种或多种寡核苷酸引物或探针,该寡核苷酸引物或探针包括:
[0036] SEQ ID NO:8218的至少,例如,6、7、8、9、10、11、12、13、14、15、16、17,或18个(或20、22、24,或更多个)核苷酸的序列;或
[0037] 与SEQ ID NO:8218的至少,例如,6、7、8、9、10、11、12、13、14、15、16、17,或18个(或20、22、24,或更多个)核苷酸100%互补的序列。
[0038] 在一些实施例中,该引物或探针与棕榈植物的DNA或RNA特异性杂交。
[0039] 在一些实施例中,该引物或探针包括:
[0040] SEQ ID NO:8219的至少,例如,6、7、8、9、10、11、12、13、14、15、16、17,或18个(或20、22、24,或更多个)核苷酸的序列;或
[0041] 与SEQ ID NO:8219的至少,例如,6、7、8、9、10、11、12、13、14、15、16、17,或18个(或20、22、24,或更多个)核苷酸100%互补的序列。
[0042] 在一些实施例中,可检测标记连接至该寡核苷酸。在一些实施例中,可检测标记为发荧光的。
[0043] 在一些实施方案中,所述试剂盒包括编码多肽的多聚核苷酸,该多肽包括与SEQ ID NO:8220、8221或8222基本(例如,至少80、85、90、95、97、98、99%)一致或一致的序列。
[0044] 还提供一种分离的核酸,该核酸包括编码多肽的多聚核苷酸,该多肽包括与SEQ ID NO:8220、8221或8222基本(例如,至少80、85、90、95、97、98、99%)一致或一致的序列。
[0045] 还提供包括异源表达盒的细胞或种子或植物,该表达盒包括异源启动子,该异源启动子可操作地连接至编码多肽的多聚核苷酸,该多肽包括与SEQ ID NO:8220、8221或8222基本(例如,至少80、85、90、95、97、98、99%)一致或一致的序列。在一些实施例中,该种子和植物为棕榈(例如,油棕)种子或棕榈(例如,油棕)植物。在一些实施例中,该多肽包括SEQ ID NO:8220、8221,或8222。在一些实施例中,该异源启动子导致编码该种子或植物中的多肽的RNA的表达平低于、等于或高于该种子或植物中的内源SHELL RNA的表达。在一些实施例中,该种子或植物包括内源SHELL基因的两个pisifera等位基因。在一些实施例中,该种子或植物产生的成熟壳的厚度平均小于2mm。
[0046] 还提供包括异源表达盒的细胞或种子或植物,所述表达盒包括启动子,该启动子可操作地连接至多聚核苷酸,其中当在种子或植物中表达时,(相比缺乏表达盒的对照植物)该多聚核苷酸降低该种子或植物中的SHELL多肽的表达,其中SHELL多肽的表达降低导致该植物产生的将来的种子的壳厚度降低。
[0047] 在一些实施例中,该多聚核苷酸包括编码与SEQ ID NO:8220、8221或8222基本(例如,至少80、85、90、95、97、98、99%)一致或一致的SHELL多肽的内源核酸的至少20个连续的核苷酸,或其互补物,使得多聚核苷酸的表达抑制内源SHELL基因的表达。在一些实施例中,该多聚核苷酸包括与编码SHELL多肽的内源核酸的至少100个连续的核苷酸,或其互补物至少80%一致的序列,使得多聚核苷酸的表达抑制内源SHELL基因的表达。其中该SHELL多肽与SEQ ID NO:8220、8221或8222基本(例如,至少80、85、90、95、97、98、99%)一致或一致。在一些实施例中,该多聚核苷酸编码siRNA、反义多聚核苷酸,microRNA,或者正义抑制核酸,从而抑制内源SHELL基因的表达。在一些实施例中,该种子或植物产生的成熟壳的厚度平均小于2mm。
[0048] 还提供了包括异源表达盒的植物,该表达盒包括启动子,该启动子可操作地连接至编码多肽的多聚核苷酸,该多肽包括SHELL M、I,和K结构域但缺乏功能性C结构域。在一些实施例中,所述多肽包括与棕榈SHELL多肽基本(例如,至少80、85、90、95、97、98、99%)一致或一致的氨基酸序列。在一些实施例中,所述多肽包括非功能性C结构域。在一些实施例中,所述植物是棕榈植物。在一些实施例中,棕榈植物为dura背景。
[0049] 还提供如上文或本文其它地方所述的制造植物的方法,包括将表达盒导入植物中。
[0050] 还提供一种栽培在此所述的植物的方法。
[0051] 阅读本发明的其余部分,其它实施例将是显而易见的。附图说明
[0052] 图1对应连锁群7并产生纯合子分布图的的基因组框架。基于遗传图谱,Shell基因(Sh)位于连锁群7的39.7cM处。一旦来自该区域的标记与Pisifera的基因组参考序列比较,该基因定位至框架43(SEQ ID NO:8218)。相比具有Pisifera果实的尼日利亚棕榈库2),以及Dura和Tenera棕榈(库3),具有Pisifera果实形式的AVROS棕榈在该区域中的SNP频率大大下降(库1)。因为已知在AVROS品系中Pisifera性状来自单一祖代,因此该纯合区域表示携带Shell基因。
[0053] 图2:包括SHELL的连锁群7。来自T128种群的SHELL染色体(连锁群7)的图谱。箭头表示SSR标记。SHELL基因用(SH和星号)标记。其它所有标记为SNP标记。
[0054] 图3:用于纯合子作图的AVROS系谱。显示了SHELL基因为杂合的(tenera:1107,3,2,27,10,8,36,28,13,31,20,27,45,149,116,364,263,286,374,445,575,577,196,213,
630,776,732,628,720,42,1111,0102)和纯合的(pisifera:10/119,593,160,307,207,
112,655,498,304,30,480,77,413,417,TP10,TP9,TP1,TP3)的棕榈连接至种植50年的亲本和子代。11种分别测序的棕榈为498,304,30,480,77,413,417,TP10,TP9,TP1,TP3。还对三种另外的来自该延伸的系谱的pisifera棕榈进行测序(未示出),而其余pisifera棕榈作为库进行测序。
[0055] 图4:油棕的壳性状的纯合子作图。a:将SHELL位点绘制到框架p3-sc00043(3.4Mb)上,在来自AVROS系谱的14种单独的和29种混合的pisifera棕榈中确定SNP的密度,并且沿着框架绘制(上半部分)。在尼日利亚T128 F1作图种群中,SHELL基因周围的标记按带有SNP单倍型的pisifera棕榈的百分比绘图。SHELL基因绘制在400Kb和1Mb的侧翼标记之间(用菱形表示)。在该间隔区(插图)内找到最小200Kb的局部多样性。b:该局部多样性最小值含有5个纯合子基因(盒子),其中仅有一个位于侧翼标记之间(SHELL)。没有阴影的椭圆形表示重复元件。
[0056] 图5:SHELL位点的序列保守性。SHELL基因的序列保守性在尼日利亚(C/T=Y)和其它非洲棕榈(A/T=W)中发现的壳表型诱发的SNP的任何一侧延伸200bp(未展示)。油棕-Dura等位基因=SEQ ID NO:8223;Pisifera等位基因安哥拉、刚果、马达加斯加=SEQ ID NO:8224,尼日利亚=SEQ ID NO:8225;Tenera等位基因安哥拉,马达加斯加,尼日利亚(371),坦桑尼亚=SEQ ID NO:8226,尼日利亚(棕榈T128)=SEQ ID NO:8227,尼日利亚(88)=SEQ ID NO:8228。
[0057] 图6:MADS结构域的蛋白质序列,Pisifera棕榈中的氨基酸替换和shell表达。a,拟南芥SHP(P29381.1;SEQ ID NO:8229)和STK(AEE82818.1;SEQ ID NO:8230)蛋白质、预测的杨树蛋白质(XP_002327282.1;SEQ ID NO:8231)、葡萄MADS-box蛋白质5(XP_002281890.1;SEQ ID NO:8232)、番茄TAGL1(AAM33101.2;SEQ ID NO:8231)和桃子SHATTERPROOF-like(ABG75908.1;SEQ ID NO:8233)(外群),E.oleifera,E.guineensis和Deli dura(油棕-Dura等位基因)(SEQ ID NO:8234)样品,以及来自T128-尼日利亚和AVROS-刚果的pisifera的样品(油棕-Pisifera等位基因)。Pisifera果实形式由影响MADS-box DNA结合和二聚化结构域中的高度保守的氨基酸基序的两个中断的SNP(SEQ ID NOS:8235和8236)引起。括号中为序列登录号(外群例子)或样品标识符(油棕例子)。
[0058] 图7:SHELL基因模型。通过RNA-seq确认外显子(盒子)和内含子(水平线)。基因图下提供了由所示外显子编码的蛋白质结构域的图。展示了SHELL蛋白质的MADS-box、I、K和C结构域。突出显示了MADS-box结构域中的突变的氨基酸(L突变为P以及K突变为N)的位置。在MADS-box和I结构域下用垂直标志表示参与DNA结合和/或MADS-box蛋白质同源或异源二聚化的保守残基的位置。

具体实施方式

[0059] I.导入
[0060] 本发明描述MPOB的尼日利亚种质资源库命名为T128的自交tenera棕榈的密集遗传图谱的构建体,命名为T128。在该遗传图谱上确定了壳位点的位置。用位于含壳基因的连锁群上的标记抽出从pisifer全基因组DNA测序中产生的、对应连锁群的基因框架。随后在该基因框架中识别连接到壳位点的基因。在此公开的,负责果壳类型的基因大致类似于拟南芥SEEDSTICK(STK),也称为AGAMOUS-like 11(AGL11),以及拟南芥SHATTERPROOF(SHP1),还称为AGAMOUS-like 1(AGL1)。为简单起见,在此我们将壳基因称为SHELL。在336株个体油棕中识别并验证了该II型MADS-box转录因子基因的DNA结合结构域中的两个独立突变,一个出现在从尼日利亚采集的pisifera中,并且另一个出现在从扎伊尔采集的pisifera中。
这两个位置中的任何一个的基因型解释了该336个样品种群(148株tenera、100株
pisifera、86株dura和2个未知表型的样品)的96.7%果壳表型。总体上,具有该表型的334株棕榈中仅11株棕榈(3株tenera、2株pisifera和6株dura)的果实类型的表型与SHELL基因型不一致。分别基于有疑问的果实类型分类或从田中非计划中的树采集样品,3.3%的不一致率在错误的表型分型或基因分型的比率范围内(大约5%)。这表明第一次证实基因突变解释油棕中的重要的经济性状。此外,研究结果为果壳表型的单基因杂种优势特征提供了遗传解释,并且该研究结果对在油棕育种和商业化种子生产中产生影响。
[0061] 多态性标记紧密地连接至壳基因的特征,或壳基因自身的识别和适用位于该基因自身内的多肽多态性标记在商业上是明显重要的,因为种子生产商可以将其用作质量控制工具,从而i)降低或排除tenera种子或树苗的dura或pisifera污染,以及ii)明确识别tenera种子或树苗,随后将该tenera种子或树苗选为用于棕榈油商业生产的合适的种植材料。壳基因或在遗传上连接至壳性状的标记在育种计划中也是重要的。负责该性状的基因的标记或等位基因可用于在育苗中区分dura、tenera和pisifera植物。在此优势为,可以基于壳表型分别种植dura、tenera和pisifera植物。这是有益的,因为pisifera棕榈通常显示非常旺盛的营养生长,所以在由所有三种类型组成的形状中,由于内部杂交竞争可能使结果发生扭曲。此外,将pisifera棕榈分离并且高密度种植促进雄花生长,并且这促进育种计划中所用的花粉的生产(Jack等人,1998)。因此,如下文所述,在检测dura、pisifera或tenera的SHELL基因型或连接的标记的存在或缺失之后,可以实现如下的进一步步骤:(1)减少或排除tenera种子或树苗的dura或pisifera污染;(2)明确识别tenera种子或树苗,随后将该tenera种子或树苗选为用于棕榈油商业生产的合适的种植材料;或(3)将dura、
tenera或pisifera植物分为两组或更多组(例如,预测为tenera的植物在一组而预测为
dura或pisifera的植物在第二组;预测为dura的植物在一组,而预测为tenera或pisifera的植物在第二组;预测为pisifera的植物在一组,而预测为dura或tenera的植物在第二组;
或分为三组:dura、tenera和pisifera)
[0062] 在杂交的亲本dura和pisifera树之间存在多态性并且连接至壳位点的任何标记具有作为分子信号以在杂交中识别tenera树的潜力。例如,如果在接近壳位点的指定SNP位置为纯合子“T”(即,T/T)的dura树与在该相同的SNP位置为纯合子“A”(即,A/A)的pisifera树杂交,则可以针对SNP位置对杂交种子或从杂交种子产生的树苗进行基因分型,以监测并识别污染的种子或树苗。在SNP位置确定为杂合子的种子非常可能是tenera,除非进行基因分型的个体在该标记和壳基因之间发生重组。类似地,在SNP位置为“A”或“T”纯合子的种子(即,A/A或T/T)分别为pisifera或dura污染树,并且当若干年后这些树性成熟时,会产生不理想的果实类型。此外,在SNP位置具有“C”或“G”(其中任何一个都存在于杂交的亲本棕榈中)的种子或树苗可能是由与杂交中预期的花粉供体不同的花粉供体产生的树,并且因此可以作为污染的种子或树苗丢弃。较接近壳位点的标记比远离壳位点的标记具有较高的预测准确性,因为标记越接近壳基因,越不可能发生重组,从而打断标记和壳基因之间的连锁。因此,预期壳基因自身内的多态性标记具有最强的预测能力,并且分析紧密连接至或在壳基因内的多种标记可能是有益的。
[0063] II.基于核酸检测确定壳表型
[0064] 鉴于SHELL基因型分为tenera/pisifera/dura壳表型的发现,在SHELL位点或邻近的基因组区域对植物或种子进行基因分型可以用于预测棕榈植物的壳表型。
[0065] SEQ ID NO:8220代表dura果实类型的油棕中表达的蛋白质的N端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括不包含于SEQ ID NO:8220中的另外的C端氨基酸。在dura果实类型的油棕中,源自该基因的两个等位基因的蛋白质包括在28th氨基酸位置的亮氨酸(L)和在30th氨基酸位置的赖氨酸(K)。
[0066] SEQ ID NO:8221代表来自扎伊尔品系的pisifera果实类型的油棕中表达的蛋白质的N端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括不包含于SEQ ID NO:8221中的另外的C端氨基酸。该多肽包括在28th氨基酸位置的亮氨酸(L)和在30th氨基酸位置的天冬酰胺(N)。
[0067] SEQ ID NO:8222代表来自尼日利亚品系的pisifera果实类型的油棕中表达的蛋白质的N端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括在此不包含的另外的C端氨基酸。该多肽包括在28th氨基酸位置的脯氨酸(P)和在30th氨基酸位置的赖氨酸(K)。
[0068] pisifera果实类型的油棕树是至少三种可能性之一的结果:i)两个等位基因编码SEQ ID NO:8221蛋白质序列;ii)两个等位基因编码SEQ ID NO:8222蛋白质序列;或iii)一个等位基因编码SEQ ID NO:8221蛋白质序列并且另一个等位基因编码SEQ ID NO:8222蛋白质序列。
[0069] tenera果实类型的油棕树是至少两种可能性之一的结果:i)一个等位基因编码SEQ ID NO:8220蛋白质序列并且另一个等位基因编码SEQ ID NO:8221蛋白质序列;ii)一个等位基因编码SEQ ID NO:8220蛋白质序列并且另一个等位基因编码SEQ ID NO:8222蛋白质序列。
[0070] 应当认识到SEQ ID NOS:8220、8221,和8222为代表序列,并且不同的个体棕榈可能具有这样的氨基酸序列:由于,例如自然变异,该氨基酸序列相对于SEQ ID NOS:8220、8221,和8222具有一个或更多个氨基酸变化,
[0071] pisifera和dura SHELL等位基因之间的一个或更多个多态性可用于确定棕榈或其它植物的壳表型。例如,当该多态性为共显性(可以不依赖于其它等位基因进行检测),那么:
[0072] 仅存在dura SHELL等位基因表示该植物具有或会具有dura壳表型;
[0073] 仅存在pisifera SHELL等位基因表示该植物具有或会具有pisifera壳表型;并且[0074] 存在pisifera SHELL等位基因和dura SHELL等位基因表示该植物具有或会具有tenera壳表型。
[0075] SEQ ID NO:922和923代表与SHELL基因序列自身内的SNP对应的SNP(单核苷酸多态性)
[0076] 然而,紧邻SHELL基因的基因组区域也有利于确定棕榈植物是否可能会表现出特殊的壳表型。由于与SHELL基因遗传连锁,邻近SHELL位点的多态性仍预示壳表型,即使准确度随与SHELL位点的距离的增加而下降。SEQ ID NO:8218提供包括SHELL基因的棕榈基因组的约3.4MB的基因组区域。表A提供在SEQ ID NO:8218内识别的多于8200个SNP的列表。小规模选择表A中的SNP,相对SHELL位点进行遗传作图。表A基于选定的作图标记提供各SNP的估算的预测值。因此,作为例子,SEQ ID NO:1表示准确预测壳表型83%次的SNP。也就是说,使用SEQ ID NO:1的SNP作为遗传标记,100次中有83次可以正确地预测棕榈植物的壳表型。因此,即使物理距离明显远离棕榈染色体上的SHELL位点,多态性标记仍能相对准确预测植物的壳表型。在一些实施例中,该多态性标记在SHELL基因的1,10,20,50,100,200,500,
1000kb内(例如,对应SEQ ID NO:8219的基因)。
[0077] 因此,提供检测对应SEQ ID NO:8218的棕榈基因组区域内的一个或多个多态性标记的方法。例如,这些方法有益于预测棕榈植物的壳表型。表A提供了多于8200个特定的多态性,但是应当意识到,表A中所示的多态性仅为对应SEQ ID NO:8218的基因组区域内的多态性。根据需要可以识别另外的多态性并且,该另外的多态性可用于预测棕榈植物的壳表型。这些另外的多态性将包含于在此描述的方法中。此外,应该意识到SEQ ID NO:8218为代表序列,并且不同的个体棕榈的对应的基因组区域由于,例如,自然变异,可以相对于SEQ ID NO:8218具有一个或多个氨基酸变化。然而,如本文其它地方所述,识别对应SEQ ID NO:8218的基因组区域可以用比对程序等轻易地确定。
[0078] 在此提供的核酸序列通过核苷酸测序产生,并且间或包括一个或多个连续的″N″。这些连续的N表示在估计尺寸的序列组装中的间隙。序列中N的精确数目是估值(例如,100个N可以仅表示30个碱基)。N可以为任何碱基,并且在基因组中可能是重复序列。
[0079] 检测特定的多态性标记可以通过本领域中已知的用于在多态位点检测序列的方法来实现。例如,可使用对SNP和/或微卫星标记的存在进行基因分型的标准技术,比如基于荧光的技术(Chen,X.等人,Genome Res.9(5):492-98(1999)),利用PCR、LCR、巢式PCR(Nested PCR)和用于核酸扩增的其它技术。可用于SNP基因分型的特定的商业方法包括但不限于:TaqManTM基因型分析和SNPlex平台(Applied Biosystems)、凝胶电泳(Applied Biosystems)、质谱分析(例如,来自Sequenom的MassARRAY系统)、微测序方法、实时PCR、Bio-Plex系统(BioRad)、CEO和SNPstream系统(Beckman)、阵列杂交技术(例如,Affymetrix GeneChip、Perlegen)、BeadArray技术(例如,Illumina GoldenGate和Infinium分析)、阵列标签技术(例如,Parallele),以及基于核酸内切酶的荧光杂交技术(Invader;Third 
Wave)。一些可用的阵列平台,包括Affymetrix SNP Array 6.0和Illumina CNV370-Duo以及1M BeadChips,包含以某些拷贝数变异为标签的SNP。
[0080] 在一些实施例中,通过测序技术检测多态性标记。所得的关于个体植物的序列信号识别序列范围中的特定的核苷酸。对于SNP,关于单个独特的序列位点的序列信息足以识别在该特定的SNP处的等位基因。对于包括多于一个核苷酸的标记,关于包含多态性位点的个体的核苷酸的序列信息识别该个体的具体位点的等位基因。
[0081] 技术人员知晓用于获得核酸序列的各种方法,并且所有这些方法有益于实施本发明。桑格测序是众所周知的用于产生核酸序列信息的方法。已经研发了用于获得大量序列数据的最新的方法,并且根据需要也可考虑将这些方法用于获得植物的序列信息。这些方法包括焦磷酸测序技术(Ronaghi,M.等人Anal Biochem 267:65-71(1999);Ronaghi,等人,Biotechniques 25:876-878(1998)),,例如,454焦磷酸测序(Nyren,P.,等人Anal Biochem 208:171-175(1993)),Illumina/Solexa测序技术(http://www.illumina.com;see also Strausberg,R L,等人Drug Disc Today 13:569-577(2008)),以及(2008)寡核苷酸连接和检测支持平台 (SOLiD)技术,(Applied  Biosystems ,http ://
www.appliedbiosystems.com);Strausberg,R L,等人Drug Disc Today 13:569-577
(2008)。
[0082] 可以在来自含有核酸(例如,DNA,RNA)的植物的任何类型的生物样品上执行多态性检测方法。该方法的一个特别的优点是在田中栽培前可以预测幼小植物的壳表型。在一些实施例中,从已经萌芽小于1、2、4、6个月或小于1、2、3、4或5年的植物获得样品。在一些实施例中,从i)dura和pisfera棕榈之间杂交;ii)tenera棕榈自交;iii)具有tenera壳表型的两株植物之间杂交;iv)dura和tenera棕榈之间杂交;以及v)tenera和pisfera棕榈之间杂交产生该植物。因为这些杂交不是100%有效的,所以这些杂交导致一些比例的种子或植物不会在将来产生具有tenera壳表型的种子或植物(假设i),并且观察到的tenera棕榈的观察值不符合预期的孟德尔分离定律(ii,iii&iv)。通过检验由试图杂交产生的种子或植物,可以减少或消除来自为栽培而种植的材料的非tenera污染种子或植物(可选地丢弃那些预测为dura和/或pisifera的植物)。可替换地,基于其预测的壳表型,可以识别并分离植物,从而能根据需要,例如,为了以后育种的目的,选择并在田间栽培纯dura和tenera树。
[0083] III.转基因植物
[0084] 如在此所述,已经发现棕榈基因控制壳表型。因此,在一些实施例中,提供已经调节SHELL多肽的表达的植物。dura和pisifera等位基因之间的杂合体自然产生更多所需的壳表型(tenera,具有小于2mm厚的壳)。
[0085] 已发现pisifera SHELL等位基因在该基因编码蛋白质的MADS box结构域的、在转录调节中起作用的部分包含错义突变。因此,tenera表型可能由相比dura植物下降的SHELL蛋白质水平引起,其中dura植物具有两个拷贝的活性蛋白质。因此,在一些实施例中,提供活性SHELL蛋白质水平相比dura植物下降的植物。例如,可以利用基因抑制技术,包括但不限于siRNA技术产生这些植物,从而减少但不消除活性SHELL蛋白质的内源SHELL基因的表达(例如,在dura和tenera的背景下)。
[0086] 可替换地,异源表达盒(即转基因)可以导入到pisifera中,其中该表达盒将SHELL的表达控制到比SHELL天然启动子更低的水平。这可以,例如,通过将突变的SHELL启动子可操作地连接至编码SHELL多肽的多聚核苷酸,从而削弱启动子的“强度”,或者通过将比SHELL天然启动子更弱的异源启动子可操作地连接至编码SHELL多肽的多聚核苷酸,而实现。
[0087] 可替换地,tenera表型可能由涉及如下的蛋白质机制产生:非DNA结合的pisifera类SHELL蛋白质与全功能型SHELL(同源二聚体)或其它MADS-box家族成员(异源二聚体)的蛋白质相互作用。因此,在一些实施例中,提供异源表达具有功能性M、I,和K结构域和非功能性C-(MADS-box)结构域的SHELL多肽的植物。M、I、K,和C结构域在,例如:Gramzow and Theissen,2010 Genome Biology 11:214-224一文中有描述并且在本文描述的棕榈序列中可以识别相应的结构域。通过表达具有如下活性蛋白质的这种蛋白质:蛋白质相互作用结构域但非功能性DNA结合结构域,与修饰的SHELL蛋白质相互作用的蛋白质会通过生物作用除去,从而导致壳厚度下降。因此,例如,在植物(例如,棕榈植物,例如,dura)中的异源启动子的控制下,可以表达在此描述的pisifera等位基因,从而导致壳厚度的下降。
[0088] A.抑制或阻抑基因表达
[0089] 本发明提供通过降低编码SHELL多肽的内源核酸分子的表达控制棕榈(例如,油棕,椰子,或椰枣)或其它植物中的壳性状的方法。例如,在转基因植物中,靶向SHELL基因产物,或其片段,或SHELL mRNA,或其片段的核酸分子,或反义RNA、siRNA、microRNA、或其dsRNA构建体可以可操作地连接至外源调节元件,其中构建体的表达抑制内源SHELL的表
达。
[0090] 许多方法可用于抑制植物的基因表达。例如,可以便利地使用反义技术。为了实现该目的,克隆来自所需基因的核酸片段并将其可操作地连接至启动子,从而转录RNA的反义链。接着,将表达盒转化到植物中,产生RNA反义链。在植物细胞中,已经表明反义RNA通过阻止编码感兴趣的蛋白质的mRNA聚集抑制基因表达,参见,例如Sheehy等人,Proc.Nat.Acad.Sci.USA,85:8805-8809(1988);Pnueli等人,The Plant Cell 6:175-186(1994);以及Hiatt等人,U.S.专利号4,801,340。
[0091] 转化到植物中的反义核酸序列会与至少一部分内源基因或被抑制基因基本一致。但是,该序列无须完全一致以抑制表达。因此,仅编码一部分SHELL编码序列的反义或正义核酸分子可用于生产SHELL表达受到抑制的植物。可以设计本发明的载体,使得抑制效果应用于显示出与目标基因同源或基本同源的基因家族内的其它蛋白质,或可替换地,使得其它家族成员基本不受抑制。
[0092] 对于反义抑制,导入序列相对初级转录产物或完全加工的mRNA也无须是全长的。通常,更高的同源性可用于补偿较短序列的使用。此外,导入序列无须具有相同的内含子或外显子结构,并且非编码片段的同源性可能同样有效。在一些实施例中,可以使用与内源SHELL mRNA有至少,例如,5、20、2530、50、100、200个或更多个连续的核苷酸(多达mRNA全长)基本一致的序列,或其互补物。
[0093] 催化性RNA分子或核酶也可用于抑制SHELL基因的表达。可以将核酶设计成与几乎任何靶RNA特异性配对并且在特定位置裂解磷酸二酯骨架,从而在功能上使靶RNA灭活。在进行这种裂解时,核酶本身不发生变化,并且因此能够循环使用并裂解其它分子,使之成为真正的酶。反义RNA中含有的核酶序列使其具有RNA裂解活性,从而提高构建体的活性。
[0094] 已经识别许多类别的核酶。一类核酶衍生自植物中能够自裂解并复制的许多小环状RNA。RNA或单独复制(类病毒RNA)或随辅助病毒(卫星RNA)一起复制。例子包括来自鳄梨日斑类病毒(avocado sunblotch viroid)的RNA和来自烟草环斑病毒、紫花苜蓿短暂条纹病毒、绒毛烟草斑驳病毒、茛菪斑驳病毒和地下三叶草斑驳病毒的卫星RNA。Haseloff et al.Nature,334:585-591(1988)一文描述了靶RNA特异性核酶的设计和使用。
[0095] 抑制的另一种方法是正义抑制(也称为共抑制)。导入核酸相对启动子正向配置的表达盒,已证明是一种有效的阻断靶基因转录的方法。使用该方法调节内源基因的表达的例子参见,Napoli等人,The  Plant  Cell  2:279-289(1990);Flavell,Proc.Natl.Acad.Sci.,USA 91:3490-3496(1994);Kooter和Mol,Current Opin.Biol.4:
166-171(1993);以及美国专利号5,034,323,5,231,020,和5,283,184。
[0096] 通常,只要抑制基因表达,就会出现一些导入序列的转录。该效果可能出现于本身不含编码序列、而仅含有内含子或与内源序列的初级转录物中存在的序列同源的非翻译序列的导入序列。导入序列通常会与要被抑制的内源序列基本一致。最小一致性一般大于约65%,但较高的一致性对内源序列的表达能够发挥更有效的抑制作用。在一些实施例中,一致性水平多于约80%或约95%。根据反义调节,该效果可以应用于展示同源或基本同源的相似的基因家族内的任何其它蛋白质,并且因此,靶向的内源基因区域将依赖于是否希望抑制或避免抑制其它基因家族成员。
[0097] 对于正义抑制,表达盒中的导入序列相对于初级转录物或完全加工的mRNA而言,不需要完全一致,也不需要全长。优选避免同时产生一些过表达的植物。比全长序列短的更高一致性的序列补偿了长的、一致性较低的序列。此外,导入序列无须具有相同的内含子或外显子结构,并且非编码片段的一致性同等有效。正常地,使用上述记录的大小范围的、用于反义调节的序列。
[0098] 还可以通过RNA干扰(RNAi)抑制内源基因的表达,RNA干扰使用具有与靶基因序列一致或相似的序列的双链RNA。在RNAi现象中,当具有与靶基因相同或近似序列的双链RNA被导入细胞中时,插入的外源基因和靶内源基因都受到抑制。所述双链RNA可由两条分离的互补的RNA形成,或可以是一条具有内部互补序列的RNA所形成的双链RNA。虽然还不知道RNAi的详细机制,据估计导入的双链RNA最初裂解成小片段,接着以某些方式成为靶基因的指标,从而降解靶基因。已知RNA在植物中也是有效的(参见,例如Chuang,C.F.&Meyerowitz,E.M.,Proc.Natl.Acad.Sci.USA 97:4985(2000);Waterhouse等人,
Proc.Natl.Acad.Sci.USA 95:13959-13964(1998);Tabara等人,Science 282:430-431(1998))。例如,为了抑制编码蛋白质的DNA的表达,利用RNAi,其为具有编码该蛋白质的DNA的序列的双链RNA,或其基本相似的序列(包括那些通过基因工程改造而不翻译蛋白的序
列)或其片段,导入感兴趣的植物中。接着,可以针对与靶蛋白相关的表型对所得的植物进行筛选和/或通过监测用于转录编码所述蛋白的稳态RNA水平来进行筛选。虽然用于RNAi的基因无须与靶基因完全一致,但其可以与靶基因至少70%、80%、90%、95%或更加一致。参见,例如,公布号为2004/0029283的美国专利。与靶基因不相关且位于感兴趣的基因的特异性序列远端、带有茎环结构的编码RNA分子的构建体也可用于抑制靶基因表达。参见,例如,公布号为2003/0221211的美国专利。
[0099] RNAi多核苷酸可包括全长靶RNA或与靶RNA的片段相对应。在一些实例中,所述片段含有不到100、200、300、400、500、600、700、800、900或1000个与靶序列对应的核苷酸。此外,在一些实施例中,这些片段至少为,例如50、100、150、200或更长的核苷酸。在一些实例中,用于RNAi的片段应至少与在有机体的其它蛋白中不出现的靶蛋白区大体相似,或可选择与其它有机转录物尽可能不相似,例如,通过分析公众可获得的序列数据库而比较序列进行选择。
[0100] 将瞬时和稳定转染中不断表达siRNA的表达载体改造成表达小发夹RNA,其在体内加工成能够进行基因特异性沉默的siRNA分子(Brummelkamp等人,Science 296:550-553(2002),以及Paddison,等人,Genes&Dev.16:948-958(2002))。Hammond等人,Nature Rev Gen 2:110-119(2001),Fire等人,Nature 391:806-811(1998)以及Timmons和Fire Nature 395:854(1998)更详细地描述了由双链RNA引起的转录后基因沉默。
[0101] 本领域技术人员应认识到,使用基于特异性核苷酸序列的技术(例如,反义或正义抑制,siRNA、microRNA技术等),可以用单条正义或反义转录物抑制同源基因家族。例如,如果正义或反义转录物设计成含有基因家族中保守的序列,则可以抑制基因家族的多个成员。相反,如果目标是仅抑制同源基因家族中的一个成员,那么正义或反义转录物应靶向在家族成员之间差异最大的序列。
[0102] 抑制内源性植物基因表达的另一种方法是重组表达抑制靶标(例如,SHELL基因)的microRNA。人工microRNA为单链RNA(例如,在18-25个单体单元之间,通常为21个单体单元),其通常不存在于植物中,并且由内源性miRNA前体加工而来。根据植物miRNA目标选择的决定因子设计人工microRNA的序列,使得人工microRNA特异性沉默其预期的靶基因,并且Schwab等人,The Plant Cell 18:1121-1133(2006)一文以及设计在此描述的这些
microRNA的基于互联网的方法概括地描述了该序列。同样参见:公布号为2008/0313773的美国专利。
[0103] B.用本发明的核酸增强基因表达
[0104] 编码SHELL多肽(包括但不限于与SEQ ID NO:8220、8221,或8222基本一致的多肽,或具有功能性M、I,和K结构域以及非功能性C结构域的SHELL多肽,该多肽被表达时控制壳厚度)全长或活性部分的核酸序列可用于制备增强,或提高SHELL基因表达的表达盒。当需要基因过表达时,可使用来自不同物种的预期的SHELL基因降低潜在的正义抑制效果。
[0105] 本领域周知的若干种方法中的任何一种可用于增加植物的SHELL活性。可以以任何器官作为目标,比如,枝条营养器官/结构(例如,叶子、茎和块茎)、根、花和花器官/结构(例如,苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实。可替换地,可以组成性地表达SHELL基因(例如,使用CaMV 35S启动子)。
[0106] 技术人员将认识到,如同其它蛋白质,由本发明的基因编码的多肽具有该执行不同功能的不同结构域。因此,只要表达该蛋白质的所需的功能性结构域,该基因序列就无须是全长的。
[0107] III.制备重组载体
[0108] 在一些实施例中,为了在上述技术中使用分离的序列,制备适于植物细胞转化的重组载体。用于转化多种高等植物物种的技术是众所周知的,并描述于科技文献中。参见,例如,Weising等人Ann.Rev.Genet.22:421-477(1988)。编码所需多肽的DNA序列,例如,编码全长蛋白质的cDNA序列,优选与转录和翻译起始调控序列结合,该起始调控序列指导转化植物的目标组织中的基因序列的转录。
[0109] 例如,对于过表达,可以采用植物启动子片段,该植物启动子片段引导基因在再生植物的所有组织中表达。这些启动子在此称为“组成型”启动子,并且在大多数环境条件以及发育或细胞分化状态下是有活性的。组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录起始区,来自根癌农杆菌T-DNA的1′-或2′-启动子,以及来自技术人员知晓的各种植物基因的其它转录起始区。
[0110] 可替换地,该植物启动子可以指导本发明的多聚核苷酸在特异组织(组织特异性启动子)中或可以在更严格的环境控制下(诱导型启动子)的表达。在发育控制下的组织特异性启动子的例子包括仅在特定组织,比如,果实、种子,或花中起始转录的启动子。可影响诱导型启动子转录的环境条件实例包括缺氧条件、升高的温度或光照的存在。
[0111] 如果想要得到正确的蛋白表达,应包括编码区的3′端的多腺苷酸区。该多腺苷酸区可来自天然基因、来自各种其它植物基因,或来自T-DNA。
[0112] 含有来自本发明的基因的序列(例如,启动子或编码区域)的载体能可选地包括植物细胞中具有可选择的表型的标记基因。例如,该标记可以编码抗微生物剂(biocide)抗性,特别是抗生素抗性,比如卡那霉素、G418、博来霉素、潮霉素抗性,或除草剂抗性,比如绿黄隆(chlorosluforon)或Basta抗性。
[0113] 提供可操作地连接至启动子的SHELL核酸,在一些实施例中该启动子能驱动植物中SHELL编码序列的转录。该启动子可以是,例如,来自植物或病毒。该启动子可以是,例如,组成型活性,诱导型或组织特异性。在构建本发明的重组表达盒、载体、转基因时,可选择不同启动子,并用于差异指导基因表达,例如,在植物或动物的一些或全部组织中。在一些实施例中,通过分析与在此描述的SHELL基因对应的基因组克隆的5′序列识别所需的启动子。
[0114] V.转基因植物的生产
[0115] 本发明的DNA构建体可以通过各种常规技术导入到所需的植物寄主中。例如,利用技术如电穿孔以及植物细胞原生质的显微注射,可以将DNA构建体直接引入植物细胞的基因组DNA中,或利用轰击法,如DNA微粒轰击,可以将DNA构建体直接引入植物组织中。可替换地,DNA构建体可以与适合的T-DNA旁侧区结合并导入常规的根癌农杆菌宿主载体中。在当细胞受到细菌侵染时,根癌农杆菌宿主的侵入功能将指导构建体和相邻标记,插入到植物细胞DNA中。
[0116] 已经描述了各种棕榈转化方法。参见,例如,Masani and Parveez,Electronic Journal of Biotechnology Vol.11 No.3,July 15,2008;Chowdury et al.,Plant Cell Reports,Volume 16,Number 5,277-281(1997)。
[0117] 显微注射技术是本领域熟知的,且完整地描述于科技文献中。Paszkowski et al.EMBO J.3:2717-2722(1984)描述了利用聚乙二醇沉淀导入DNA构建体。Fromm et 
al.Proc.Natl.Acad.Sci.USA 82:5824(1985)描述了电穿孔技术。Klein et al.Nature 
327:70-73(1987)描述了轰击转化技术。
[0118] 科学文献详细地描述了根癌农杆菌介导的转化技术,包括解毒(disarming)和使用双元载体。参见,例如Horsch et al.Science 233:496-498(1984),以及Fraley et al.Proc.Natl.Acad.Sci.USA 80:4803(1983)。
[0119] 可培养由任何转化技术获得的转化的植物细胞以使再生成为具有转化的基因型的整株植物,因此获得了所需的表型。此类在再生技术依赖于组织培养生长培养基中的特定植物激素的控制,可选地依赖于与所需核苷酸序列一起导入的抗微生物剂和/或除草剂标记。Evans et al.,Protoplasts Isolation and Culture,Handbook of Plant Cell Culture,pp.124-176,MacMillilan Publishing Company,New York,1983;以及Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRC Press,Boca Raton,1985描述了从培养的原生质体再生的植物。再生还可以由植物愈伤组织、外植体、器官或其一部分获得。Klee et al.Ann.Rev.of Plant Phys.38:467-486(1987)概括地描述了这种再生技术。
[0120] 本发明的核酸可用于使几乎任何植物具有所需的形状。因此,本发明使用了大量植物,包括以下属的物种,天冬属、颠茄属、燕麦属、芸苔属、柑桔属、西瓜属、辣椒属、黄瓜属、南瓜属、胡萝卜属、草莓属、大豆属、花属、向日葵属、萱草属、大麦属、天仙子属、莴苣属、亚麻属、黑麦草属、番茄属、苹果属、木薯属、墨兰属、苜蓿属、烟草属、稻属、黍属(Panieum)、狼尾草属、鳄梨属、豌豆属、属、李属、萝卜属、黑麦属、千里光属、白芥属、茄属、高梁属、胡芦巴属、小麦属、葡萄属、豇豆属和玉蜀黍属。具有壳的植物,以及已经在本发明中使用的植物包括但不限于双子叶植物和单子叶植物,单子叶植物包括但不限于棕榈。
[0121] 实施例
[0122] 以下提供的实施例用于说明,但不限制所要保护的发明。
[0123] i.实施例1.植物材料、DNA提取和限制性内切酶消化。
[0124] 用于产生遗传连锁图谱的作图家族从高碘值(IV)的来自MPOB的尼日利亚种质资源库的tenera棕榈,T128的自交获得(Rajanaidu,1990)。利用受控的自花授粉产生作图家族。最初在马来西亚的多个地点,包括在兰莪州班吉(Bangi,Selangor)的MPOB-UKM研究站(MPOB-UKM Research Station)、在登嘉楼(Terengganu)的Ulu Paka研究站(Ulu Paka Research Station)、在彭亨州(Pahang)的Keratong研究站(Keratong Research 
Station)、在沙巴州(Sabah)的Lahad Datu研究站(Lahad Datu Research Station)、霹雳州安顺市的联合种植公司(United Plantations,Teluk Intan,Perak)以及在彭亨州而连突(Jerantut,Pahang)的FELDA研究站(FELDA Research Station)种植共241株棕榈。在241株棕榈中,240株仍然可用于标记和表型分析。
[0125] 从个体棕榈中收集未打开的叶样品(心叶),并立即在液氮下冷冻,然后储存在-80℃直到制备DNA。从叶样品提取DNA,并利用Doyle和Doyle(1990)描述的方法纯化。
[0126] Singh等人,2009对标准RFLP分析进行了描述。在该研究中所使用的RFLP探针为从根据Cheah等人(1996)描述的在前构建的各种cDNA文库(黄化幼苗、中果皮、内核和根)获得的互补DNA克隆。来自花消减文库(Cheah和Rajinder,1998)的cDNA克隆也用于筛选作图群体。
[0127] 随机从各文库挑取cDNA克隆。利用柱纯化,以及Qiagen-tip 20(Qiagen)按制造商所描述,从单个克隆制备质粒DNA。使用溴化乙锭板确定所制备的质粒的浓度。
[0128] 1ug质粒DNA用10U合适的限制性内切酶进行3小时的限制性消化,以释放插入DNA,从而检测DNA插入物的存在。将五分之一的负载缓冲液,FOG加入到消化的混合物中,并且通过1.5%琼脂糖凝胶电泳分离片段。选择插入物大小大于500碱基对(bp)的cDNA克隆,以筛选其检测作图群体中的RFLP的能力。
[0129] 从选定的质粒根据聚合酶链反应(PCR)扩增DNA片段获得用于作图的探针。以冷冻甘油保持含选定的探针的细菌克隆,储存在-80℃。
[0130] 如Singh等人,2009所述,标记DNA探针,用于RFLP分析。
[0131] ii实施例2.简单重复序列(SSR)分析和SNP分析
[0132] 基本按Singh等人,2009所述进行SSR分析。SSR引物来源如下:i)Singh等人,2007描述的SSR富集文库,ii)也在作图群体上试验的公开的微卫星引物对(Billotte等人,2005),以及iii)从MPOB自身的已表达序列标志(EST)库和基因组序列获得的SSR引物也用于图谱构建。
[0133] 利用Illumina iSelect Infinium II分析查询包括4,451个SNP的OPSNP3 SNP集。用GenCall软件(Illumina San Diego,加利福尼亚)完成对各SNP位点的自动等位基因呼
叫。利用Genome Studio软件(2010.3版)分析SNP基因分型数据。
[0134] 个体RFLP、SSR和SNP位点作为共显性标记评分,并且对于该自花授粉杂交,对以1∶2∶1比率分离的位点进行评分。一些RFLP探针和SSR引物揭示等位基因难以确定的复杂结构。对与这种情况,对分离条带单独评分为缺失或存在。
[0135] 以下表2描述了从RFLP、SSR、SNP和AFLP标记的作图家族中观察到的2种不同类型的分离模式。
[0136] iii.表2描述了从RFLP、SSR、SNP和AFLP标记的作图家族中观察到的2种不同类型的分离结构。
[0137]
[0138] 实施例3:确定并评估作图家族中的果实形式
[0139] 在本研究中,识别壳基因是有益的。评分的单基因性状为果实形式。对田中的成熟花束进行性状评估。
[0140] 对从登录号为T128的尼日利亚tenera的受控自花授粉得到并且在遍及马来西亚的种植园中生长了20年的所有240 F1子代的果实形式的表型进行评分(Rajanaidu等人,
1989)。油棕树在开放的种植园中生长成熟,因肥力、产量和环境的变化,使得难以对一些样品的果实形式进行准确的表型分型。从每株棕榈收获若干果实,并且利用既定标准确定壳厚度和果实形式。
[0141] 为了确定果实形式,利用锋利的刀子将单个果实切成相等的两半,对壳进行目测并且根据Corley&Tinker,2003和Hartley 1988分类如下:
[0142] dura:厚壳(2-8mm),无纤维环
[0143] tenera:薄壳(0.5-3mm),壳周围有纤维环
[0144] pisifera:无壳
[0145] 在大多数情况下,纤维环的存在足以区分dura和tenera的果实形式。有经验的油棕培植者有助于性状的评估。
[0146] 为了评估研究中使用的果实形式的表型数据的准确性,我们回顾2003年和2012年之间进行的460次表型呼叫。在此阶段,进行多达三个独立的尝试,以直观地确定339株棕榈的果实形式,其中240株来自用于绘制SHELL的T-128自交种群,并且99株来自可用表型重新分型数据的不同种群。在该数据中,培植者不确定果实形式的表型的不确定呼叫进行了26次(或占总表型测定的5.7%)。
[0147] 表3列举了作图家族中观察到的表型特征的分离数据。
[0148] iv表3:分析棕榈的果实形式
[0149]
[0150] #进行基因分型的棕榈总数和所观察到的果实类型的棕榈数量之间不一致,因为两株棕榈不能准确地进行基因分型。
[0151] 该研究中所用的作图家族的壳基因性状符合预期的孟德尔比率(dura,tenera和pisifera果实形式分别为1∶2∶1)。对壳基因位点的图谱上的数据的其它三个报告((Mayes等人,1997;Moretszohn等人,2000以及Bilotte等人,2005)没有在其研究所采用的作图家族中指示性状是否满足孟德尔比率。
[0152] v.实施例4.图谱构建和单基因性状评估
[0153] 在构建遗传图谱中,除了200个RFLP和SSR标记之外,对由240株棕榈组成的子代,通过Infinium iSelect Assay(Illumina)从油棕基因组序列获得的4,451 SNP标记进行基因分型。利用Joinmap ver.4.0计算机程序(Ooijen,2006)对从尼日利亚tenera棕榈T128的自花授粉获得的240株可用的子代棕榈进行图谱构建。该油棕为异系繁殖(out-breeding)物种,并且,如此,可以预期其基因组高度杂合。因此,可以预期来自自花授粉杂交的子代棕榈表现得像F2种群。
[0154] 然而,在图谱构建中,首选确定标记的“相位”,或者处于结合状态,或者处于排斥状态。出于这个原因,创建两组基因型数据,其中一组与另一组相反,以解释T128自交F2种群中的相位差。排除显示出严重的失真(P<0.0001)的标记和具有10%以上的缺失数据的标记。两组基因型数据以≤0.2的重组频率分组。选择十八个节点创建18个用于计算连锁群的起始组。
[0155] 基于最大似然算法计算连锁并且整理位点。没有标记表现出严重失真(P<0.0001)。在P<0.05所观察到的少数失真标记是明显的。必要时,从进一步分析中移除这些标记。识别最近邻应力(nearest neighbour stress,N.N.应力)值>2(cM)的标记并且从分析中排除。也确定并移除导致连锁不足的标记。构建的T128共显性图谱由16组组成。观察到的连锁群数目与油棕的单倍染色体数目相匹配(Maria等人,1995)。
[0156] 构建一致性图谱之后,shell置于连锁群7上(图1)并且连锁群与Billotte e等人,(2005)公开的比较表明shell位于预期区域内。更重要的是,该壳基因的侧面有两个SSR标记,一边为sPSc00119(约10cM),另一边为sPSc00091(约5cM)。
[0157] SHELL基因先前已绘制成离最接近的分子标记4.7cM和9.8cM(Billotte等人,2005;Mayes等人,1997;Moretzsohn等人,2000),已被证明在识别指定的大型基因组、长繁殖时间具有很大的挑战性,以及对油棕榈实验种群进行表型分型的困难,这广泛分散在不同的种植园中。为了帮助识别壳基因,非常谨慎对如上所述的单基因性状进行表型分型。随后我们利用油棕基因组序列确定壳基因。
[0158] 实施例5:全基因组测序和组装,连锁群与基因组框架比较,纯合子作图和候选基因评估
[0159] 在454XL下一代测序平台(454/Roche)上对AVROS Pisifera棕榈进行高覆盖度测序。从DNA片段文库和从一系列复杂的接头文库(或跨步文库(jumping libraries))产生序列reads(Sequence reads),其中reads端跨越大小范围为0.75kb至>30kb的片段。用产生油棕基因组的参考序列的Newbler assembler(Roche 454,Bradford,CT)组装序列reads。
识别含有绘制在壳间隔区中的标记的组装的参考序列的框架。从用与产生参考序列相同的AVROS Pisifera构建BAC文库,从10倍BAC文库构建BAC物理图谱。还在3730测序平台(Life Technologies)上利用标准Sanger测序从文库中的各BAC产生BAC末端序列。用Newbler 
assembler将BAC末端序列组装成参考基因组。选择跨越SHELL间隔区的BAC克隆的最短贴瓦路径(minimum tiling path),用454 XL技术以高覆盖度对该贴瓦路径中的BAC克隆作为库进行测序。重新组装参考基因组,包括原454全基因组鸟枪序列数据、BAC库序列数据,和所有所有的BAC末端序列。产生改进的框架覆盖度和跨越壳间隔区的框架长度。两个系谱用于纯合子作图研究。第一系谱使用43株个体AVROS pisifera棕榈(源自非洲扎伊尔)。此外,对总计14株AVROS pisifera棕榈进行独立测序,同时剩余29株棕榈的DNA聚集在一起用于深度测序(库1)。第二系谱为来自尼日利亚tenera棕榈T128自交的子代棕榈。来自尼日利亚自交棕榈的30株pisifera棕榈的DNA也聚集在一起并且测序(库2)。在库3中,来自17株尼日利亚dura棕榈和20株尼日利亚tenera棕榈的DNA聚集在一起并且测序。在HISEQ 2000
(Illumina)上产生全基因组鸟枪测序数据。个体树和树的库分别以20和40倍原始序列覆盖度测序。读取来自每株树和每个库的个体reads以绘制到形成上述组装的参考基因组的序列框架中。
[0160] 随后,通过序列相似性将连锁群7上的SNP标记绘制到3.4Mb的组装的Scaffold 43(p3-sc00043)。图1展示了对应含有SHELL基因的连锁群7的框架。连锁群上的标记的顺序对应框架上的标记的物理顺序,为构建的遗传图谱提供可信度。我们预测该壳基因最可能包含在Scaffold 43(p3_sc00043)中,该框架含有最高可能性的间隔区。从高信息量的pisifera物理图谱中选择对应Scaffold 43的BAC重叠群的贴瓦路径并测序。从对应
Scaffold 43的改进的组装序列设计另外50个SNP分析。
[0161] 同样从框架p3-sc00191、p3-sc00203和p3-sc02216设计30个另外的SNP标记,其也与连锁群7结合。也在来自尼日利亚T128自交种群的240株棕榈上对这80个SNP标记(称为SNPE)利用Sequenom iPlex平台进行基因分型。在试验的80个SNPE SNP标记中,63
(78%)是多态的。
[0162] 另外的63个SNP基因型并入上述图谱中,使得最终的共显性遗传连锁图谱由828个标记[722个SNP(包含SNPE)、103个SSR、2个RFLP标记以及连锁群16中的shell组成(图2)。
[0163] 保持在连锁群7上的Shell(图2)连同63个SNPE标记从选定的框架展开。连锁群7的最后大小为172.2cM,两个相邻标记之间平均为1.2cM。
[0164] 在连锁群7中成功绘制壳基因位点,这次其侧面为2个SNP标记,称为SNPE00039,SNPE00037(约3cM),各在一边(图2)。表4展示了在作图家族中,对于两个标记,对性状的预测性都为约95%。复查单一标记数据,识别重组断点,表明这个基因位于Scaffold 43的450Kb的间隔区。
[0165] 表4:在作图家族中连锁至壳基因位点的SNP标记
[0166]
[0167] 接着,我们利用AVROS系谱以及全基因组重测序进行纯合子作图(图3)。在该技术中,候选基因在纯合子近交个体中表现为具有低多样性的区域(Gschwend等人,1996;Lander和Botstein,1987)。针对14株个体pisifera棕榈的基因组进行测序,基因组覆盖度为20×(Illumina HISEQ 2000),并且另外29株pisifera油棕的DNA作为库进行测序,覆盖度为40×(库1)。将个体reads绘制到组装的pisifera参考基因组的序列框架,并且最高可能性的SNP位于pisifera Build 3(p3-sc00043)的框架43上。在14条基因组序列中,SNP沿着框架集中成超过10Kb的窗口并且绘制在图谱位置。该框架利用NCBI BLAST相似性搜索工具通过与拟南芥和水稻基因组的公共数据库比较在计算机上进行基因注释。针对假定功能与pisifera和dura品系之间的核酸和氨基酸变化,以及其它物种中的氨基酸变化,筛选在来自遗传图谱的预测的间隔区内具有最高纯合性的基因。在基因组中呼叫SNP,并且对
Scaffold 43中的SNP评分。得到的纯合子区域(homozygosity plot)为局部极小的200kb
(集中在p3-sc00043的400,000bp周围,图4A)。这个200Kb的区域含有约30个已被注释的基因,其中只有5个是完全纯合的,并且仅有一个是位于含有SHELL基因的基因间隔区(图4B)。
这个基因编码拟南芥SHP1、SHP2和STK的直系同源基因(ortholog),已知该直系同源基因影响果实发育(Ferrandiz等人,2000;Liljegren等人,2000)。
[0168] 例如,拟南芥SHP1,SHP2和FRUITFULL(FUL)为MIKCc类的II型MADS-box蛋白质,并且形成控制内果皮分化的转录因子的网络。在十字花科中,内果皮包括木质化细胞,木质化细胞分离荚片和子房(Dinneny和Yanofsky,2005)并控制心皮脱落(Dinneny和Yanofsky,2005)。在拟南芥shp1 shp2双突变体中不能区分内果皮导致成熟时不开裂的果荚碎裂
(Liljegren等人,2000;Pinyopich等人,2003),而ful心皮的叶肉细胞由于SHP异位表达变得木质化,并且当充满种子时随机爆开(Dinneny和Yanofsky,2005;Gu等人,1998)。有趣的是,番茄中的SHP直系同源基因控制果肉在内果皮中膨胀(Vrebalov等人,2009),而在桃子中,FUL和SHP的直系同源基因与分裂的果核的形成有关,桃子也是核果(Tani等人,2007)。
SHP蛋白质结合至DNA作为同源二聚体或异源二聚体(Huang等人,1996),并且高度保守的MADS结构域参与和DNA结合及二聚化(Immink等人,2010)。
[0169] 来自22个不同的油棕文库的10,916,126条RNA-seq reads的分析显示仅159条reads与油棕SHELL基因匹配,且所有的这159条reads仅在4个文库中存在:开花一天后的整个小花文库、开花后长果核的10周文库和15周文库、开花后长中果皮的15周文库。这些文库对应壳发育阶段(Hartley,1988;Bhasker和Mohankumar,2001)。PCR扩增子测序(参见实施例6)识别Deli dura(ShDeliDura)的的SHELL直系同源基因和分别来自刚果与尼日利亚的
AVROS(shAVROS)和T128(shMPOB)pisifera单体型的SHELL直系同源基因之间的等位基因差异(图5)。shMPOB中与pisifera果实形式相关的DNA序列变化导致保守DNA结合结构域和二聚化结构域中亮氨酸转变为脯氨酸,而shAVROS中与pisifera果实形式相关的DNA序列变化导致赖氨酸转变为天冬酰胺,仅移除两个氨酸(图6)。这个高度保守赖氨酸残基参与核定位以及通过MADS-box蛋白质与DNA直接结合(Huang等人,1996;Immink等人,2010),而脯氨酸替换后在这个位置则仅有两个氨基酸残基的N端,其将破坏参与MADS二聚化和DNA结合的α螺旋结构(Immink等人,2010)(图7)。另外的336株棕榈的分析在已建立的表型标准中验证这些等位基因。这包括将4株pisifera棕榈的shMPOB的性状通过基因渗入转至携带shAVROs等位基因的tenera中。测序验证这4株棕榈是异等位基因,表明这两个等位基因相互补充失败,从而确认基因的身份。在油棕中,转基因互补实验是不可能的,但在番茄类似的实验已经证实SHP基因的重要性,例如,在肉质果实中调节中果皮厚度(Verbalov等人,2009)。因此,本发明所公开的油棕SHELL基因的DNA序列的改变会对SHELL蛋白质的功能有明显影响,从而导致果实类型的表型。
[0170] 为进一步探索油棕(E.guineensis)种群中的分离现象,由379株棕榈组成的多样性的植株组中产生SHELL基因外显子1序列,该379株棕榈代表从以下收集的9种不同的野生油棕种群:安哥拉(Rajanaidu等人,2000)、马达加斯加(Rajanaidu等人,2000)、尼日利亚(Hartley,1988)、坦桑尼亚(Rajanaidu等人,2000)以及在过去50年前收集的110,00个品种(110,000-accession)的种子库子集(Rajanaidu等人,2000)(同样参见实施例5)。我们发现所有棕榈的外显子1中携带shDeliDura、shAVROS或shMPOB等位基因(图5)。Tenera棕榈因其较高的油产量在西非已被选为前殖民文化,并且是目前油棕繁育的根基(Rajanaidu等人,2000)。
我们在SHELL中所检测到的突变可以解释tenera棕榈展现的较高的产量和显著的单基因杂种优势(Beirnaert和Vanderweyen,1941)。这是因为,等位基因不仅会破坏DNA结合,而且破坏二聚化(Huang等人,1996)。来自无壳AVROS(shAVROS)和T128(shMPOB)pisifera果实形式的非功能性SHELL蛋白质与来自厚壳Deli dura的功能性SHELL或其它MADS box蛋白质
(ShDeliDura)的二聚化预期会降低异源二聚体以及同源二聚体的功能活性(Huang等人,
1996),导致在杂合子中观察到薄壳tenera表型。单个位点的超显性解释番茄杂交产量类似地显着增加的原因(Krieger等人,2010),并提出了转录因子之间的异源二聚化来解释玉米的杂种优势(Birchler等,2003)。
[0171] 实施例6.SHELL基因测序
[0172] 起初,对来自T128自交作图种群的12株棕榈的SHELL基因的8个外显子进行DNA测序。对作图家族的所有棕榈以及用于纯合子作图的AVROS pisifera棕榈的该基因的外显子
1进行测序。此外,也对表5中列举的棕榈的外显子进行测序。
[0173] 表5用于SHELL外显子1DNA测序的另外的棕榈样品
[0174]
[0175] 1在符号‘x’左边的棕榈表示母本,而在符号‘x’右边的棕榈表示父本。
[0176] 2在上述列举的种群中,种群1的母本为棕榈T128,棕榈T128为自花授粉以产生在该研究中用于图谱构建的种群。
[0177] 3针对壳基因将上述种群分为1-5。
[0178] 基于pisifera基因组参考序列设计PCR引物,用于扩增整个SHELL外显子1(SEQ ID NO:8237):
[0179]TTTTGATCTATGGAAATTAATAAGTCAATATGTCAGTATGTGAAGGTCTAGGCCATGTTAGTCCCATCATTTCATTTATAGTTTAGATGATGATTTTTtCTTTGTTCTTGGCAATATTCTAGACCAACTTCAGCAGACAGAGGTGAAAGAGAGATCATGGGTAGAGGAAAGATTGAGATCAAGAGGATCGAGAACACCACAAGCCGGCAGGTCACTTTCTGCAAACGCCGAAATGGACTGCTGAAGAATGCTTATGAGTTGTCTGTCCTTTGTGATGCTGAGGTTGCCCTTATTGTCTTCTCCAGCCGGGGCCGCCTCTATGAGTACGCCAATAACAGGTATGCTTTGATGACGCCTTCTCTTCCTTCGCTCATATCAAGTTAATTTTATGGCTTCATTTGTTCTATGGCCAAGCCAAATTCTTTTTAAAGTTCTAGAATGTTAATGATGGTAGTTTTGCTCCTCTTCAATTTATTT
[0180] 已证实引物序列在pisifera参考基因组中是唯一的,并且避免任何相同的多态性核苷酸。5’M13正向序列标签添加至外显子1正向PCR引物(TTGCTTTTAATTTTGCTTGAATACC;SEQ  ID  NO:8238)中。5’M13反向序列标签添加至外显子1反向PCR引物
(TTTGGATCAGGGATAAAAGGGAAGC;SEQ ID NO:8239)中。从基因组DNA中扩增SHELL外显子1,开始从来自12株油棕树,随后从总计336株(148株tenera,100株pisifera和86株dura以及两株不能进行表型呼叫的棕榈)油棕样品的DNA扩增。以20ng基因组DNA在标准的PCR扩增条件下进行PCR扩增。扩增产物用核酸外切酶I和虾碱性磷酸酶处理,以除去未结合的引物和脱氧核苷酸。在ABI 3730仪器上利用M13正向作为引物以标准条件对每份扩增产物的等分试样测序。每份扩增产物在正向测序两次。每份扩增产物的等分试样用M13反向作为引物另外测序。每份扩增产物在反向测序两次。
[0181] 所有的测序数据与pisifera基因组参考序列比对。分析数据以确定在鉴定为与pisifera果实类型相关的两个SNP位置各自的基因型。
[0182] 在SEQ ID NO:922的SNP位置,已发现dura树为纯合子T(T/T),在SHELL蛋白质的对应位置编码亮氨酸。在相同的核苷酸位置,pisifera树为纯合子T/T(如果来自扎伊尔品系)或纯合子C/C(如果来自尼日利亚品系),在SHELL蛋白质的对应位置分别编码亮氨酸或脯氨酸。因此,从包括来自刚果的pisifera杂交中获得的tenera树在相同的位置应该为纯合子T/T,而从包括来自尼日利亚的pisifera杂交中获得的tenera树在相同的位置应该为杂合子C/T。
[0183] 在SEQ ID NO:923的SNP位置,dura树为纯合子A/A,在SHELL蛋白质的对应位置编码赖氨酸。在相同位置,pisifera树为纯合子A/A(如果来自尼日利亚品系)或纯合子T/T(如果来自扎伊尔品系),在SHELL蛋白质的对应位置分别编码赖氨酸或天冬酰胺。此外,由于扎伊尔和尼日利亚来源的品系的贡献,在SEQ ID NO:922的SNP位置,pisifera树可以为杂合子C/T,并且在SEQ ID NO:923的SNP位置可以为杂合子A/T。因此,由包括尼日利亚来源的pisifera的杂交获得的tenera树在SEQ ID NO:923的SNP位置应该是纯合子A/A,而由包括扎伊尔来源的pisifera的杂交获得的tenera树在相同位置应该是杂合子A/T。
[0184] 因此,如果由尼日利亚来源的pisifera参与的杂交获得,那么在SEQ ID NO:922的SNP位置tenera棕榈为杂合子(T/C,其中来自dura的T等位基因在对应的氨基酸位置编码亮氨酸,而来自pisifera的C等位基因在相同的氨基酸位置编码脯氨酸),并且在SEQ ID NO:923的SNP位置tenera棕榈为纯合子(A/A)(其中该两个等位基因都编码赖氨酸)。相反地,如果由扎伊尔来源的pisifera参与的杂交获得,那么在SEQ ID NO:922的SNP位置tenera棕榈为纯合子T/T(其中该两个等位基因“T”都编码亮氨酸),并且在SEQ ID NO:923的SNP位置tenera棕榈为杂合子(A/T,其中dura来源的“A”等位基因编码赖氨酸,并且pisifera来源的“T”等位基因在相同的氨基酸位置编码天冬酰胺)。
[0185] 对作图家族的所有棕榈以及纯合子作图中所用的AVROS pisifera棕榈的SHELL的8个外显子进行DNA测序。由于育种试验中的污染,14株测序的pisifera棕榈中的一株
AVROS MPOB
(TP10)证明是扎伊尔(sh )和尼日利亚(sh )单倍型的杂合子并且不用于纯合子分析。
基于pisifera基因组参考序列设计PCR引物以扩增整个SHELL外显子1。SHELL特异性引物序列为TTGCTTTTAATTTTGCTTGAATACC(外显子1上游的正向引物;SEQ ID NO:8238)和
TTTGGATCAGGGATAAAAGGGAAGC(外显子1下游的反向引物;SEQ ID NO:8239)。引物序列确定在pisifera参考基因组中是唯一的,以避免任何相同的多态性核苷酸。5’M13正向序列标签(GTTTTCCCAGTCACGACGTTGTA;SEQ ID NO:8240)添加至外显子1正向PCR引物。5’M13反向序列标签(AGGAAACAGCTATGACCAT;SEQ ID NO:8241)添加至外显子1反向引物。从基因组DNA中扩增SHELL外显子1,并且利用20ng纯化的基因组DNA在标准PCR扩增条件下进行PCR扩增。扩增产物用核酸外切酶I和虾碱性磷酸酶处理,以除去未结合的引物和脱氧核苷酸。在ABI 
3730仪器上利用M13正向作为引物以标准条件对每份扩增产物的等分试样测序。每份扩增产物的等分试样在正向测序两次。每份扩增产物的等分试样用M13反向作为引物另外测序。
每份扩增产物在反向测序两次。所有的测序数据与pisifera基因组参考序列比对。分析数据以确定在鉴定为与pisifera果实形成相关的两个SNP位置各自的基因型。
[0186] 我们对来自T-128作图种群的336株个体棕榈的SHELL外显子1测序,该样品用于构建纯合子图谱,并且是与高等品系(advanced line)杂交的棕榈的集合(100株pisifera,148株tenera,86株dura以及2株具有模糊的表型)。323(96.7%)株棕榈的SHELL基因型与其表型一致,并且11(3.3%)株棕榈具有不一致的表型,反映种植中表型分型的准确性(参见上文)。也对从尼日利亚(shMPOB)和扎伊尔(shAVROS)之间的杂交(Felda AA和MPOB 0.305)获得的所有4株pisifera棕榈的SHELL外显子1测序,并且正如所预测的,该SHELL外显子1证明为异源等位基因。还发现另外3株pisifera棕榈为异源等位基因,包括TP10,其已经完全测序并且证明是AVROS系谱的污染物(参见上文)。其它2株异源等位基因棕榈可能受到类似污染。
[0187] 对11株明显不一致的树进行表型分型的第二次尝试并且重新测序,从而能对其中9株树的果实类型重新评估。1株棕榈的第二次表型呼叫与预测的基因型一致,而7株棕榈的第二次表型呼叫是不明确的,并且1株棕榈保持原来的表型。将该棕榈从新进行基因分型并且证明具有一致的基因型。考虑到果实形式的表型分型误差被认为超过5%(参见上文),剩下的9株棕榈(或占进行基因分型的种群的2.7%)原本已经进行错误的表型分型,这是合理的,强调需要一种更准确地预测果实形式的分子检测方法。该假设在可获得单倍型的9株棕榈中的6中得到证实,因为单倍型与基因型而非表型一致,排除了以重组作为不一致的解释。通过错误进行表型分型的棕榈类似地解释紧密围绕SHELL的图谱扩展。即,最靠近绘制的shell位点的4个SNP标记(参见图2)围绕我们识别为SHELL的基因,但所有都具有9/238
“重组体”,包括9株错误进行表型分型的棕榈中的6株。
[0188] 综上,分别基于有问题的果实类型分类或从田中非计划中的树采集样品(大约5%),2%至3%的不一致率在不正确的表型分型或基因分型的比率内。此外,不能进行表型呼叫的2株棕榈通过SHELL基因型预测为pisifera。这与描述一些pisifera棕榈不能够产生成熟的花束——从这两株棕榈中观察到的性状,并且是不能确定果实形式的原因,的报道一致。
[0189] 在壳形成的最早阶段,在1和5WAA之间的果实上进行原位杂交(Singh等人,submitted)。在厚壳的(Dura)和无壳的(pisifera)果实形式的中果皮中检测到均匀但微弱的杂交信号,但是仅在Dura型的发育果核的外层中检测中很强的信号,这与SHELL Shell的功能是一致的。
[0190] 因此,本发明中公开的油棕SHELL基因中的DNA序列的变化将无疑对SHELL蛋白质的功能有影响,从而导致果实类型的表型。
[0191] 表A:在含有SHP1的基因组区域SEQ ID NO:8218中识别的SNP的表
[0192]
[0193]
[0194]
[0195]
[0196]
[0197]
[0198]
[0199]
[0200]
[0201]
[0202]
[0203]
[0204]
[0205]
[0206]
[0207]
[0208]
[0209]
[0210]
[0211]
[0212]
[0213]
[0214]
[0215]
[0216]
[0217]
[0218]
[0219]
[0220]
[0221]
[0222]
[0223]
[0224]
[0225]
[0226]
[0227]
[0228]
[0229]
[0230]
[0231]
[0232]
[0233]
[0234]
[0235]
[0236]
[0237]
[0238]
[0239]
[0240]
[0241]
[0242]
[0243]
[0244]
[0245]
[0246]
[0247]
[0248]
[0249]
[0250]
[0251]
[0252]
[0253]
[0254]
[0255]
[0256]
[0257]
[0258]
[0259]
[0260]
[0261]
[0262]
[0263]
[0264]
[0265]
[0266]
[0267]
[0268]
[0269]
[0270]
[0271]
[0272]
[0273]
[0274]
[0275]
[0276]
[0277]
[0278]
[0279]
[0280]
[0281]
[0282]
[0283]
[0284]
[0285]
[0286]
[0287]
[0288]
[0289]
[0290]
[0291]
[0292]
[0293]
[0294]
[0295]
[0296]
[0297]
[0298]
[0299]
[0300]
[0301]
[0302]
[0303]
[0304]
[0305]
[0306]
[0307]
[0308]
[0309]
[0310]
[0311]
[0312]
[0313]
[0314]
[0315]
[0316]
[0317]
[0318]
[0319]
[0320]
[0321]
[0322]
[0323]
[0324]
[0325]
[0326]
[0327]
[0328]
[0329]
[0330]
[0331]
[0332]
[0333]
[0334]
[0335]
[0336]
[0337]
[0338]
[0339]
[0340]
[0341]
[0342]
[0343]
[0344]
[0345]
[0346]
[0347]
[0348]
[0349]
[0350]
[0351]
[0352]
[0353]
[0354]
[0355]
[0356]
[0357]
[0358]
[0359]
[0360]
[0361]
[0362]
[0363]
[0364]
[0365]
[0366]
[0367]
[0368]
[0369]
[0370]
[0371]
[0372]
[0373]
[0374]
[0375]
[0376]
[0377]
[0378]
[0379]
[0380]
[0381]
[0382]
[0383]
[0384]
[0385]
[0386]
[0387]
[0388]
[0389]
[0390]
[0391]
[0392]
[0393]
[0394]
[0395]
[0396]
[0397]
[0398]
[0399]
[0400]
[0401]
[0402]
[0403]
[0404]
[0405]
[0406]
[0407]
[0408]
[0409]
[0410]
[0411]
[0412]
[0413]
[0414]
[0415]
[0416]
[0417]
[0418]
[0419]
[0420]
[0421]
[0422]
[0423]
[0424]
[0425]
[0426]
[0427]
[0428]
[0429]
[0430]
[0431]
[0432]
[0433]
[0434]
[0435]
[0436]
[0437]
[0438]
[0439]
[0440]
[0441]
[0442]
[0443]
[0444]
[0445]
[0446]
[0447]
[0448]
[0449]
[0450]
[0451]
[0452]
[0453]
[0454]
[0455]
[0456]
[0457]
[0458]
[0459]
[0460]
[0461]
[0462]
[0463]
[0464]
[0465]
[0466]
[0467]
[0468]
[0469]
[0470]
[0471]
[0472]
[0473]
[0474]
[0475]
[0476]
[0477]
[0478]
[0479]
[0480]
[0481]
[0482]
[0483]
[0484]
[0485]
[0486]
[0487]
[0488]
[0489]
[0490]
[0491]
[0492]
[0493]
[0494]
[0495]
[0496]
[0497]
[0498]
[0499]
[0500]
[0501]
[0502]
[0503] 参考文献
[0504] Beirnaert,A.and Vanderweyen,R.1941.Contribution a l’etude genetique et biometrique des varieties d’Elaeis guineensis Jacq.Publs.INEAC,Series Ser.Sci.(27):101.
[0505] Bhasker,S.&Mohankumar,C.Association of lignifying enzymes in shell synthesis of oil palm fruit(Elaeis guineensis--dura variety).2001.Indian J 
Exp Biol 39:160-4.
[0506] Billotte,N.,Marseillac,N.,Risterucci,A.M.,Adon,B.,Brotteir,P.,Baurens,F.C.,Singh,R.,Herran,A.,Asmady,H.,Billot,C.,Amblard,P Durrand-Gasselin,T.,Courtois,B.,Asmono,D.,Cheah,S.C.,Rohde,W and Charrier,A.2005.Microsatellite-based high density linkage map in oil palm(Elaeis 
guineensis Jacq.).Theoretical and Applied Genetics 110:754-765.
[0507] Birchler,J.A.,Auger,D.L.&Riddle,N.C.2003.In search of the molecular basis of heterosis.Plant Cell 15:2236-9.
[0508] Cheah,S.C.1996.Restriction Fragment Length Polymorphism(RFLP)in Oil Palm.Project Completion Report No.0011/95,4th July 1996,Malaysian Palm Oil Board(MPOB),Bangi,Malaysia.
[0509] Cheah,S.C.and Rajinder,S.1998.Gene expression during flower development in the oil palm.Project Completion Report No.0057/98,16th July 
1999.Palm Oil Research Institute of Malaysia(PORIM),Bangi,Malaysia.
[0510] Corley,R.H.V.and Tinker,P.B.2003.Care and maintenance of oil palms.In The Oil Palm(4th edition),pp:287-326.Oxford:Blackwell Science.
[0511] Danielsen,F.et al.2009.Biofuel plantations on forested lands:double jeopardy for biodiversity and climate.Conserv Biol 23:348-58.
[0512] Devuyst,A.1953.Selection of the oil palm(Elaeis guineensis)in Africa.Nature 172:685-686.
[0513] Dinneny,J.R.and Yanofsky,M.F.2005.Drawing lines and borders:how the dehiscent fruit of Arabidopsis is patterned.Bioessays 27:42-9.
[0514] Donough,C.R.and Law,I.H.1995.Breeding and selection for seed production at Pamol Plantations Sdn Bhd and early performance of Pamol D x 
P.Planter 71:513-530.
[0515] Doyle,J.J.and Doyle,J.L.1990.Isolation of plant DNA from fresh tissue.FOCUS 12:13-15.
[0516] Ferrandiz,C.,Liljegren,S.J.&Yanofsky,M.F.2000.Negative regulation of the  SHATTERPROOF  genes  by  FRUITFULL  during  Arabidopsis fruit development.Science 289:436-8.
[0517] Godding,R.1930.Observation de la production de palmiers selectionnes a Mongana(Equateur).Bull Arig.Congo belge 21:1263.
[0518] Gschwend,M.et al.1996.A locus for Fanconi ahemia on 16q determined by homozygosity mapping.Am J Hum Genet 59:377-84.
[0519] Gu,Q.,Ferrandiz,C.,Yanofsky,M.F.&Martienssen,R.1998.The FRUITFULL MADS-box gene mediates cell differentiation during Arabidopsis fruit development.Development 125:1509-17.
[0520] Hardon,J.J.,Rao,V.,and Rajanaidu,N.1985.A review of oil palm breeding.In Progress in Plant Breeding,ed G.E.Rusell,pp139-163,Butterworths,UK.
[0521] Hartley,C.W.S.1988.The botany of oil palm.In The oil palm(3rd edition),pp:47-94,Longman,London.
[0522] Huang,H.,Tudor,M.,Su,T.,Zhang,Y.,Hu,Y.,and Ma,H.1996.DNA binding properties of two Arabidopsis MADS domain proteins:Binding Consensus and Dimer Formation.The Plant Cell 8:81-94.
[0523] Immink,R.G.,Kaufmann,K.&Angenent,G.C.2010.The′ABC′of MADS domain protein behaviour and interactions.Semin Cell Dev Biol 21:87-93.
[0524] Jack,P.L.,James,C.,Price,Z.,Rance,K.,Groves,L.,CorleY,R.H.V.,Nelson,S and Rao,V.1998.Application of DNA markers in oil palm breeding.In:1998 International Oil Palm Congress-Commodity of the past,today and future,
September 23-25,1998,Bali,Indonesia.
[0525] Krieger,U.,Lippman,Z.B.&Zamir,D.2010.The flowering gene SINGLE FLOWER TRUSS drives heterosis for yield in tomato.Nat Genet 42:459-63.
[0526] Lander,E.S.and Botstein,D.1987.Homozygosity mapping:a way to map human recessive traits with the DNA of inbred children.Science 236:1567-70.
[0527] Latiff,A.2000.The Biology of the Genus Elaeis.In:Advances in Oil Palm Research,Volume 1,ed.Y.Basiron,B.S.Jalani,and K.W.Chan,pp:19-38,Malaysian Palm Oil Board(MPOB).
[0528] Liljegren,S.J.,Ditta,G.S.,Eshed,Y.,Savidge,B.,Bowman,J.L.,Yanofsky,M.F.2000.SHATTERPROOF MADS-box  genes control seed  dispersal in Arabidopsis.Nature 404:766-770.
[0529] Maria,M.,Clyde,M.M.and Cheah,S.C.1995.Cytological analysis of Elaeis guineensis(tenera)chromosomes.Elaeis 7:122-134.
[0530] Mayes,S.,Jack,P.L.,Marshall,D.F.and Corley,R.H.V.1997.Construction of a RFLP genetic linkage map for oil palm(Elaeis guineensis Jacq.).Genome 40:116-122.
[0531] Moretzsohn,M.C.,Nunes,C.D.M.,Ferreira,M.E.and Grattapaglia,D.2000.RAPD linkage mapping of the shell thickness locus in oil palm(Elaeis 
guineensis Jacq.).Theoretical and Applied Genetics 100:63-70.
[0532] Ooijen,J.W.V.2006.JoinMap 4.0:Software for calculation of genetic linkage maps.In experimental populations.Kyazma B.V.,Wageningen,Netherlands[0533] Pinyopich,A.et al.2003.Assessing the redundancy of MADS-box genes 
during carpel and ovule development.Nature 424:85-8.
[0534] Purseglove,J.W.1972.Tropical Crops.Monocotyledons.Longman,London.pp:607.
[0535] Rajanaidu,N.,Rao,V.,Abdul Halim,H.&A.S.H.,O.1989.Genetic resources:New developments in Oil Palm breeding.Elaeis 1:1-10.
[0536] Rajanaidu,N.1990.Major developments in oil palm(Elaeis guineensis)breeding.In Proceedings of the 12th Plenary Meeting of AETFAT,pp:39-
52.Hamburg,Germany.
[0537] Rajanaidu,N.et al.2000.in Advances in Oil Palm Research(eds.Basiron,Y.,Jalani,B.S.&Chan,K.W.)171-237(Malaysian Palm Oil Board(MPOB),Bangi,Selangor).
[0538] Sambrook,J.,Fritsch,E.F.and Maniatis,T.1989.Molecular cloning:A Laboratory manual,(2nd edition).Cold Spring Harbor Laboratory Press,Cold 
Spring Harbor,N.Y.
[0539] Singh R,Tan SG,Panandam JM,Rahman RA,Ooi LCL,Low ETL,Sharma M,Jansen J and Cheah SC.2009.Mapping quantitative trait loci(QTLs)for fatty acid composition in an interspecific cross of oil palm.BMC Plant Biology 9:114.
[0540] Sousa,J.,Barata,A.V.,Sousa,C.,Casanova,C.C.and Vicente,L.2011.Chimpanzee oil-palm use in southern Cantanhez National Park,Guinea-
Bissau.Am J Primatol 73:485-97.
[0541] Tani,E.,Polidoros,A.N.&Tsaftaris,A.S.Characterization and expression analysis of FRUITFULL-and SHATTERPROOF-like genes from peach(Prunus persica)and their role in split-pitformation.2007.Tree Physiol 27:649-59.
[0542] Vrebalov,J.,Pan,I.L.,Arroyo,A.J.M.,McQuinn,R.,Chung,M.,Poole,M.,Rose,J.,Seymour,G.,Grandillo,S.,Giovannoni,J.,and Irish,V.F.2009.Fleshy fruit expansion and ripening are regulated by the tomato SHATTERPROOF gene TAGL1.The Plant Cell 21:3041-3062.
[0543] Whitmore,T.C.1973.The Palms of Malaya.Longmans,Malaysia,pp:56-58.
[0544] 术语“一”意为“一个或更多”。术语“包括”及其各种变化,比如“包含”以及“含有”在前述为步骤或元件时,意为添加另外的步骤或元件是可选的并且不排除。所有专利、专利申请,以及在该说明书中引用的其它公开的参考材料通过全文引用合并于本文中。
[0545] 典型序列
[0546] SEQ ID NO:1-8217
[0547] 表A中的SNP
[0548] SEQ ID NO:8218
[0549] 包括SHELL基因的遗传区域的~3.4MB的序列
[0550] SEQ ID NO:8219-SHELL位点
[0551]GTGAAGTTTAGATACTACCTGGGTAGCACTATCATCAAGCTGCCATGCATTGCACTCATTTTAAATTGAGATGACTCAAATGAGTGCTATGTGTCTCCAAAATTATAGATTTACAACTATTAATTAATGTTTTTAAATTTTAACAAATACGTGCCAACAATCAAAGTAACACATGTCCAATGGGAGTATTTGGACAGGGGTTAGCATCATCTGGCTGCCTGCATGTAAGTCAATATGTATTTAATTTCTAACTATGAACAACTTAATAGACTCAATTGTTATGGTTTTCGTGGCAAAGCTGCAGACGACATGGGCAGACATTATTTTTGCTAGACTAAAGAGCAGAGAGACGATTGACGGGGATTCCATCATGGTGGTAGCCTGATTACATAAACAATTATCATCAGCAGCAGCGCATCTTCTCATTCATGATAGTCAGTGTCAGGGAGCTGCTTTTCTATTGAGATTCGTTATATTTATCGAGAGGTCAATAGCTCTACTGACTGGATGATCTTTTATGTGACTGAGCATATCGGAGAGACGGTGTGGACTAAGATCAAAGATCTTCCTTCGACCTTCAAGAATATTTATTTTTTAATTTTTTTtGGATGTATTCGTATGAATAATCTAGCCTATCAAAAAAAaTAAAGTGACATGTGGCCTGGCACAAAGTCACGTGACCTTGAATTCCAACAAGCATTTTAGATTATAAGCTTACACCATGGGCGAGGGAAGTTTTCCACATTTTCTTGCTACTTCTAGACGCTTGGCATACACTTACATGTCTAACCAAATCTCATAGTAACAGCAAATTGCTTGAAATACAGATTGCTCTATGTCAAATTCTTTAGGCTGCAGTGAGAAAGGAGATAGGCGAAACTGAAGAAGGGGTGGAAAATCTAAAGTTCCATACCACCAGTTCATGCAAACATCACTGGTTGGTCAGCTGACCTCTAACAAGAAAGACTATTCACATGGAGGGATGACCCACTGATGCCCCAAAACAATAATGCAAACAAAGAGAGGGTCGCTCTCTCACTTGAGCAGCGTAGGGATGCCAGTGAGTGCAATAAAGAAGTGGGGACGAGGTATTAGAATTTCGATACATGTGTGCGTGTGTGAGTATCACAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGATTGCATGAAAGTCCTCAGAGTATGGGACATCTCCAAAACCAAGTCCAATATCTAGTGATGGGCTCTTTTATACAAAGAGTGATGCGCAAGAAATAGAAGACATGGAGGTGAGAAGCTTGATCCATGCATGCATGAACATGATGTGAGAGAGACCATGAAGCTGAAGAAAGGTCCATAGCCACAGAGGCAATAAAAGAACATGGTTGGGATGTTAAATCACAGTAAATGGTGAAAAGAACATGGTGCAACTATAAGGGGAACTAGTTTTAGTAGTTCATCTTTTTAGGACCACACCGCAAGGTGGACAGTTGGTGTTACATTTAGTCTCTCTTCATTCTCTTTTAAGGGAAAATGTCATCTAGAGTTTGCAGAAGTTTTGAAGTTTTACAATATCGCTTAATTTAATTCAATTGATGAACAATAATATTTAGTGATTGAAGGTGTGAACTGTAAGGTCACTTGAAATTTAGAGTCTATACACATTGGGAGTTCAAAAIATCTGGTCAATTTTATTAAAATGTATTGTTCCAATATTAAAATTTTCTCGAGTTTTCTTTAAAGGACTCTAGTGTTCCTTTGATCTAAAAACAGTCTAATTTTTTGCTACCACAAATATACTACAGTAGAGGCAAAAAAATCTAGATAACACAAAGGAACAAACAACTTTATGTTTTTAAGCAAGCAAATAAGTACATATTCTTCCAACGTTTTCTCCAAGAACATGATCAATAGTTCAAAATGTTTGTCCCTTGATATTCTTTACAGAAAAAACTCACGGACAATAAGCTTAAATCTTCATGGCCAGTATATTTTGTAATATATGGTGAAACTGGAGTTCAGTTGTTCTACAATCCTAATAAGATCATAGGGGTGCAATTCTTGTGTCCTTACACTTAGGGAAAAAGCTTTATGCCCCAGCTAGAAAGATTATATCGATGGTCCCGGAGGAGTCTTGATTTAGTACATAACTTCTAAATGTGGAGCATCGCCCAGGAAGGAAATATATCCATATTAACAAAGTTTGCAACATTTGGATTGGATGATAGTCCAATGAAGAAAAATTGACCTACTCAACCATGACAATGGAGCTGTCCTCCTAACATGATAAGGACATAGCAACCATACTTTGGTGACATTTTAAAATCATGCAATTACTTCATCATGTTTACCATGGAAAATTACACAAGAAGATGGAAAACATAGCATAGCATTTACCATAAAGAACCATGCATCGTTACGTCATCCAAGCGATTCAGGTGCATGCATGTAGATTTTCCTCTCTTTGATCTATATATATATATATATATATATATATATATATATaTATAtATaNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATATATATATATATATATATATATATATATATCTAACTTAATAACGAAGTCTTATGTATGCTAaGTTTTCCCTTTAGAATACTTGGAAGGCTTGACAGCATGCAATCATTCAATCAAAACAAGAGAGATAATAGATTGTTTCAGAGCTAGGCTTTTGGAACAAGTAAATATAGTAATACAAATAGACAATACAAAAGACAACATTTTTGTTTCCAGAAAACCATTATAGAATTTTCTAAGCCTTTCCCTTCTAATGAGGAACATGTTCATTGCAATGTTAGAGCTATATGACTAACTTGTATAACGGACATGCCACGTTAGCCTTGAGTGATCTTGAAATTGTTGAATTAGTCCAACAAATACGACTATTTGCTGACGCCTAGCCCAAATAAAACAGAATTAACATGCAGTCTAGTCTGAATTAGTGGCTTCCACTAAGGATTAGAATGTTTCTCCTAACTATAGAGCAAGAAGACCTCTTGTATTTAGCAATGTTATCCAAGCTGGTCGTTATTATTCCTCTAGAATTGGCTCCCACTGATCAGCTACCAAAGTTAGTCCACAGCACATAGTCCCAAACATGTCATTAGGTTTACCATAAATTTAGTATTTCTTGGTAAATAGAGGCAAACTTGCTGACTGTTCATGCAATTAAGTTACCTTGACATATGTGATGCATTAATTACATGCAAAGAAACCATCTATCATTTGGAGCTTATACTGGAAATTGAATTTCCCGAGAGAATCTATATATTCATATTCGTTCATCCCTCGATTGTATTTTCAAGAAAAGATTTGAATTTTAGGCAACATACCTTTTTCTCTATTGGTCTTAATTTTTTACATTTCCAACTACTTAATGATATGATTCAGATACATAGGGTTTCTACCCATTTTTCTTGAAAAGAAAaGAAGGAAAGGAAAATCCAATAGAATTTACAGTGCATTGTTGAATCTGCCTAATCTGAACCATGACTTTAAAAaAAaAAaAaaGAAGAAGAAGAAGTTTCTGGCTACATTTTTATATCAGCTTATAATTAGTTTTTATTAATAGTACTCACCAGGAAAAGTGTAAATATTAATTGTTCTTATGTATTATTGCTTTTCTTAGTGTTTTTCTGTTAGGAAAACAAAAGAAACTTGAAATTGCACTAACTACAAGTATAAAAATGAAAAAAGGTAAGGCCAATGTTAGAGAGCACTAAGGCTTCATGGTATAACCTTCAAAAGTTGTGATGGATACAATACCATAGGTATTTGTTCTTGCTAGCCATAAAAATATACAAGCATATGAGGGTAGCACATGGTAAGTAGACACAAGGTATATTTATCTTCATGATATCACTACAATAACCTGATGATATGGTGATGATGTTATCCATAACCTTATCAATAATTTGGTTTTGATTTTCTACAAACAGGGATGTGTTTTtATTCTTTTtGAaTAtATATATATATATATATATATATATATATATAAaGAAAAAAaaCCTTGGCACCGGTAGGGCATCATGTTAATTAACAGACATGAIAATGTAGTACTAAAAGCTACATCTAATATAATTGTACTTTTACTAACTTGATGTGAAACTTAAAATTGTATTGCTTGGGATCACCACTTTATGTTGCACCACTTTTGTGTGTTCTTGAGCATATCTGCGCATATCCTCTTTCACTCGCATTATTTAGATATTAAGTGCAAACATTTAAGAACCAGTTATCCTTGAAAGACATTTGAGACTGCATGAATGCCATCAGATTTCTTGGCCAATGGAATGAAGCAGGAATGGATGTAATGTGATGTACGTGGGTAGAAGGGACAGCGTTAACATGAAACATGTGGAAGTTTTAATATTTTGAGAAGAGAIACATGCAAGTTACAAAAAAAaTTAAAAAaGAACATACAAAAAAAAaCTATTTATAGATGAAAGAAATGAAAAGAAAGAAAAaCTTTAAAAGAAaGAAAAAAAaCTTTAAAATACACCGCAACGATTAATTTCTTATTCACCATGTCACCTCTTCTATGAATAACGAATCAAGAAAAGATCTGTGGCAGGTATTGCCAAGCCAAGCTTCAATAAGGTTTTGTTACTTCTAGAATCCAAACTCCCTTGACCTCATAGTTATGCGAGAGTCTAGTCTATTCATTACTTAATTCCCCCACCTAACCCTAATCTGAGAAGGAATTATTATGGCTTGGGGAGATCACGTGCGGAGGAGGCGCCACCGATCGTTTTCACTTTACCGCGCGCTTTTCAGTCCTAGCAGTGCCCCCCCAGTCCCCACCACTTCCCTGTCAACTGCTCCACCGCAACCTCTCAATCTCCTAACAATCACTCCAATAACGACAAAATGATGGAGCTAACCCATGACATTTTATATCGAAGATATAGTAGCACAAACTCCATCCGGCGGTACAGCTTACCCAGCCAACCCACCCTCCACTCTTTAAGAGGAAACCCACATATCCGATGCCAATTGCATGCAGTGGAAAGAGAGAGAGAGAGAGAGCGCTGAGCTCCCTTCTTTTCCCTCGGAATTTGCGGTGTTGGACTTCACCTTCTCTTCCGGCGTGGAAGCTGAGTTCCCGGAGTGGTAGTTTTTTCCTTTTtTTTTTTTttGAGAACAATTTCTGTCTTTCTTTCTTTCTTTGTTGTTTCGGCTtTTTtGATATTTGTTTCCTTTCTTGAGGAATAGTTTTTATGATAATACCGGAATTGGGGGTTGCTAGAAATCGTGAGGTGTCATTGTTATAGGTTTTTTTTTTttGCTGGATCTTCGGCGATCTTTTTGCTGATATTATCCGTTTTTAACGATCGGAACGTTGGTTGCGTCACCAACAAAATGCGACTTTGTTCTCGCTTCTCGCTAGATTTGCTCCACGAAAACAGTAGCTTTGTCGGATCGGATCGTTTGCTCCATGTCTAGTTTTTAGGGTTATCTTTTCACATGTTCTTGAATATATCTTTGTCAAGaaaAAaaAAAAAAaCTTTaCCTTTTGTTCTATAACAAAAATCTTTTCTTCCACGTATTTTGGTTGCCCTAGTTtTTtCTTTTTTTtGTTTGTTTGTATTTGTTAGAGAATCGAGATTTGAGCCGTACATCTCGTTCATAAACTGTTTCATTTGTCAGAATTTAAAGAAACTAAACTTCACGTATGCATCGTTATCCATTTGTCATGATCTTGTCTCATGAATATATGTATTCTGTTCTTGTCTTCGCCTTAATTtTTTTCTCACTTTCTTTTCCGAACCCTAACCCATTCAAAGTTCCCACCTTTTCTCTCTTACTTGCTTTCATGTTTTTTtCCTTTTttTTTTtGTTGCTTTTAATTTTGCTTGAATACCTTTTGATCTATGGAAATTAATAAGTCAATATGTCAGTATGTGAAGGTCTAGGCCATGTTAGTCCCATCATTTCATTTATAGTTTAGATGATGATTTtTTCTTTGTTCTTGGCAATATTCTAGACCAACTTCAGCAGACAGAGGTGAAAGAGAGATCATGGGTAGAGGAAAGATTGAGATCAAGAGGATCGAGAACACCACAAGCCGGCAGGTCACTTTCTGCAAACGCCGAAATGGACTGCTGAAGAATGCTTATGAGTTGTCTGTCCTTTGTGATGCTGAGGTTGCCCTTATTGTCTTCTCCAGCCGGGGCCGCCTCTATGAGTACGCCAATAACAGGTATGCTTTGATGACGCCTTCTCTTCCTTCGCTCATATCAAGTTAATTTTATGGCTTCATTTGTTCTATGGCCAAGCCAAATTCTTTTTAAAGTTCTAGAATGTTAATGATGGTAGTTTTGCTCCTCTTCAATTTATTTGCTTCCCTTTTATCCCTGATCCAAATGGTTTtTTTCTTATTTAAAATTACCCTTTCAAATTATCACATTTAATTCAGCTTTTATTATTATTATTATTGCTATGAGATTAGTTTGTTGTTAAGATTCTATATAGGAAGGAATGATCAAGTGATCATTACTTTATGTAGTAAGAAATTAACAAGCAAAAGCAGCGTGCTTGGTCTTACCATGAGGATAGAGGAAGAGTTTTACCTTGACTAGGGCAACTAAAAAGGGTTTGAGTTTTGCCTAACATTCTTGTTATATGAATTCGATCTGTACACGACTTACTACTCTGGTATTAGAACGTATGTACTAAGAAGTTTTCTTGGGATGGAAAGAAAGAAATAGTGAAGTAAATCTTATTAATTTGTCTTTACATGTTCTTCTCATATTTTCTCATACTCTTTTCTTATGTTCAGACTTACACCGAAAAATTAAGATGGATGATATTATGTTCTTGGTATAGGATTTCTTTTCCGACGTACCAATGTTTTGTTAAGGAAACTTTGTAGTTGACTTTTCGATTATAATATTTTCCAAAGGACTCCACGAAATGGTAACATCTCCAGTCGTTTCAATAAACTTCCGATCATATTATGGGTTTGCATTTAAGGTTTTCTTCTTCCCTTCGCTTCCTCTTTGCCTTTGCCTTTCTCGTGTTACACTTCTGGCTCGTCAATCTGCAGTACTCTCTAGCCATCTCTCTCTCTCTCCATCCACccaccCCCCCCCcCCCcAAaCAACACACACACCCTCCCACCCTGTGCAACTAATTCCGACAAAATAAGGGTCTCCCATTGTTAGAGCACCTCCTGTATGGACTGCATTCTAAAGATACGGGAAAATGAGCCAGATATCTATTCATCAATCATTTAGTAGAGTCTCTAAGGTTCCTTTTTAAAACTGTCTTGAACCGGCTTTTGCACAAAGAGCACCACTCCCTTTATTTATAAGTTGAACCTTCCTGAAAGCTAACTTGGGTTTCAGCTTTCACTGTTCAAGTAAGTCATAAAGTTTTTCTGGTCATTAAACCTTGTGATATGGAGATGGAAACTGCTTTTCTCCCTGCCGGATTTCTCTTCTGGTGCTAAGCGGCTAAAACCCATCATCCATGTCTGCCTTCCTCTTTTATGGGTAGTTGCTGGACTTCGGACACCGGTGAAGGATGAAGGCTCTTTGTGATTGGTTATGAGATATTTCTTGGGCCCCGTGCCTTTGCTGTCATTCCCCACAACTCGGTGGCCATCATAGCTTTTTTGTTAGCTTTCGTCCTTACAAATTCCTCTCTGGTTCTTTCTTTCACCTTTTCATGCATTTAGCTTCATTGTCAACATCAAGGGAACACAGACCGGAAGAAGAGCAAGAAGAACCCAATCAAGACTGGATTTTACAAATCACCAAaaAAAAAAAAaGACTGGATTTTACTCGACGACGCTGCAGTCTTCTCTGCTCTCACTCAATTAAAATAGGAACAAGGAAAATGTAGATATTTTTtCCCTtTTCGTTATGATAATTATAATCTAAGAAAGATTTTAAAAGCTTACTGTAATCATCTCATGTTCAACTATTGTGTTGCACCCAACGAAATTTCTGTGTGCCTCATGACGAGCATTACCTTTCCATGGTTCTGACACGACATTGCATACTAGATTTTACTGTGTACGTAAAAAAGCACTGCATGACATCATCTCTATTCTTCTTCTTCATtCCCttTtTTTtTTTTTTtGGTAATATCTATTCTTCTTTAATGTCCTCTCTGATAACTGGTCTTATGTACAGGTACATCTTTACAAGCCTTCCGAGAGAAIATGAATGCGTATTTTCTGCAACCGAGTATATTCTACAAATAAAATGTTAGAGATTGTCTCGAACTGGTATACAAGCACATTCCTGTACGTGTTGACATGAAAGAAGCATAGATCAGACAAAAATAATAGTACGTGACAAAGATCATAAAGGGACTACAACATTAGGAGGGCTACAATTAATAATAACAACGGGAGCAACTAGCAGTGTATACGGTTCAGACCAGATCAGTTTAGAGTTATTTTTGGAACCGAGCTGACTTAGTTGTTTTTCTAAAGCCTAAATTGAAAGAGAAACCGATTCAACCTGATCCGAAATACTCGATTTGGTTTCATTCAGTTTATTTGGGTTGATGTTCCATAGTTTGGGCTACATTGATTGCACTAAGTCTAAATATAAAAATTTCATTTTATATAGAATTGATGTTCAATGGACCGGACTAAGTTTAAACATATAAAAATATTTAAATTTTGAAATATATATGTACATATACACATGTAGGTCGGGTAGGTTTAAATATAGATACTTACATATAAATGGATTGGGTCTGGTTGGGTCAATGCGAGTCTGCTTAAATATATATATACATATGGGCTAGGTCAAATCAGGTTAGTTTATATATATATATATATATGTGTATGTGTGTGTATCGGATTTGTTGGTTTGCACTGATTTTCTAAAAAaTAAAATCGAAATCGAATCAAATTTTTTCTGTTCAAGAGTATCTCAAACTAATTTTTAaAAAAAAAAaTGATATAACTAGATCAAAAAAGACCGATTTGAATAGGCACTTTATGATTTTGTCACTTTTTTGTATACCTCTACGAGCAACAATAATAGAAACAATAATAACAATTGTAATAATCAATATAAAAATTATTAATAGTAATTAaAAAATATATACAAAATTTTTGCAAGCATTCAAGTGGACACAAATCAAAGGGCACTAATGCATTCATAAAAGGTTGCTAGCTTTGATCCATGGTAGCATCGTGTATCCTGAATCATTTGTAGGTTAATTGAAACCTCCTAAATTGCATTTTAAATAAAAATAGCATGCATTTTATGAAGATAACCTTACTATTATTAGGTAATAAGGTTGTTAAATTCTAACCTAATTAATATCTCCTAATTAAGAGATAATAGTTGTGGTGGAAACGAGATGGAGAGAAAGCACTTCATCTCTCATCTTTCCTCTCTAAATAACATTTCACTAAGAGATTTAATTATTGGATCAAGGCTAGCCAGTTTGTTATCTtTTTTTGTTCTAGAAGTGTTGACCTTTTACCATTTCTCATATGAAAAAAAaCATTATCTAAGAAGAATAAATTATTATGATCATGAGGAGAGAGAAGGGGTGTTAAGGTTATTGGATTAAAATCAAACTGATTAGAGGACCTTGTTTGCTATTATAAACCCATGACAACAATCAATATGCACTAAAGTTTTGGTATAATAAGTTATCATCAAGGGCCAAAAAGGATTAACTCGAGAACACAAGCATACAATTTAACATCGTACATAGATAAATTCAATTTAGGAGGTAATTATTGATGTATATGCTTAGACAAGAAGAAAGTATAGAAAGTAAGGAAAATTGCTTGAATGATTTAGAAGTGCATAAATATAATCTAAATTTGAGGAGTCTTATTTATATTTTGAGAATTAGAAAGGGGGAGAAAATTGAACAAAACTTTGATAAATTGATTGTAAGAATTTTCAAACCTTAAAGCGAAAGTGATAGTGAAGTGGAACCATTAACCATAATTTGATATTAAAAGGTTATCTATATTCATTAATATCATtTTTTTAAATTATTGTATATATTTTTTGGGAGGAAAATTATGTTCTTTAAAAGTTAGATTGGTTTCGTACTTATCATAAATGATAAATGATCTGAATTTAGTTTGAAAATTATTTGACATATAACCTTTGATAAGAAATTACATATTAGGATTTTATGGTTTACTGTCATATAGTTCTTTGTTTTGTATTTATTTAACTTTGACCATAAATGATTTGAAGTCAAGATACTTTAATTCTAGCCTCCCCATCAACATGTTGATGGCTTATGATTTTtATTTTTtATAACATTTATTTTTATCTATAATATTTTTCATTATTAATTTAATGAAAGTGGATTACACGACATCTAACTTATATTTTTGAAAATAGAGAATGATATGGTATACTATTTTGAACATGTTCAGAAATTAGAATCTTATTATTGTTTTCATAAATTTAAAATATTATACTTGTCAATATGAAACATATTAAAAATGATCTAAAATATtTTTTAAAATTTAAATGTCATAGGTTTGAAAAATTCTTACTTGTAAATATATGATTTGTAACTAAATATTTTTAATGGCATGATATTATTTTCTAATTCCATCAAAGATCTAGAACCTTTCAAATTAGTTGAACTTAGATACGTGTTTTAATATGTCTTAATCAAGATCAACAATTTGACTTCTTATTTTATATGATATATGGTATATTCTCACTTGATGCATCTGTAAGAAAATTTAAAATTCTTTTATTTTATTTTATATATGTGTCAATACTATAATTCTTGATTATATGGATTTCTAGTACACTTAGATTGTGATTGTTGTTTGGCATTGGAAGATCGAGACAATTAATACCATAAGTGGGATATATACTTGCTTAACCCAACATTAAACCAAAATCACCTCTCGACAATCACACAAGGACAAGTGTACTCAAGATAAACATGGATTGTCAAGATATAATATAAGAATAATAAATCATGTATATAATTTtTTTTCATCTACAAACTTCTCTTCTTTCTCTTAATTTAGTATATAACTTCCATACCAATAGATTACtTTTTATTTGACCCAAAAATCAATTTAACCTTTTGTTTTtAATTTAATCCTTTGTCTTCTTAAATGACTCAGCTTGTAATTTAAATATATCATTACTTATGCAGTAATGTCCATTTGTTGTAAATAAATATTTGGCAATAGAAGAAATACTATAAGGTCAAAAAATATAAACAGGACAATGAAGCATTTCGTATAGTCTATTATAAATGTAGAATGAAACATAATAGGCTTTTCATTTGATCTATAATTAAATATAATTATCAAATATCAAAATTAATGTACCAATTTATGAGACATCAATATTATAAAGGGATACTAAGAAACTAACGAGAGTACACTGATCAAGAAATGTGATCGACCAGTGAGGCATGTTGTTTATAAATTAATTAGACACGTTTTCAATTTATGAGAATTTGTATTCAAATATTTATAATTGATAAATGGATCACTTTTTATTTGCTCTTTATATTTAGACTCCAAAIAGTGCTGTAAGAGAaAAAAATTTGAAAAAaTAATTTATATTTTCAaAAAAAATATTTTTATCAATTTTCATTACCATAAAaAAAGATCGAAAATAAAATTAAGAAAGAATGAGATAAGTTTGATAATTTTAGACATCCGCTTGCATAATAGTTCATGTTTAATATTAATTTATCACTGAGAATGCAAAAATATATAAAATTTTTAATTAAGCTTTGCTACATATAATTATTATATATCACTTACATAAATGATTTGATTAAATATTTTTAAAATTTTAATCTAATTTTTAATTGCATAGATATCTATTGCAGTAATTTTCCTCTAAATAATAAATTAAACTAAGAAAATAAAAAATATTTAATAACAATTGGAATATACTTATCAATCCTATAAGAATAATTCCTGTAAAACTCCATCCATTTAACTTGCATCATGCATCATTTATTTTTTTATTTTtAATCATTTAGAAATTTAAAATCAAAATTCAACTTTTATAGATTTATTAGAATGCATGGAATGATTTCATAAATGTTGCATTGTACTAAAAGAATTTATGATAATCTATACAAGTCAAGCATTTAAATTACTTATTATACTTTACAATAGTAAACTACCTTTTGAGCAAAATGGTGGTAACCCATCATAATATGTCATATGATAAATAAAATGAAGTACAAGGCTAGATAAAGAAGGGGGACAGAAAGAGAGATATAGGGCTCCCGAGCTTAAGCAACCAAGCAATTCAATATAGTTGCAACCAATAAAATCCGATATGAGCAAATATAAATATAACTCACTAAAAGCCCAAAATACACCCAATAAGCCCAGGTAACCACTAGCCCAAACATAATGGCCTACTAAGTTTGAATTTTAAAGTTTAAGTCTTTGCCCATTCACCACCTCTACCTTCCAAGCTCTAATTATTTTAATGCCATTGCAAATCATCATGTCTTCTCTTCTTCTAATTTGGTGTACTATCATTTTCAATGTATTGCAACTCTATTGCCAATCGATGCTCCTCCAAGGCATCTCTCAAGATCTCATTTGGCTCTATTGCGCTACCACTACCATCCATCCTATTACTCTCTAGATCAATATCAAAATTAATGCAGCTCTTTTCTCGATACTTTTTGCATCATCATCTCACTCCATCATCACAGTCTATACTTGTTATTTGGAGCCTATGCTTGCTACTATATTGTGACCTCAATATTACAATCTCTACTTGTTACCACTCAATGTCCATGCCCATCTTCCATGAAAGCTACTTGGCAAACAATCCTAATAGGTTCCAAAAAACCCCACAGCTAAGGACTAAACACACAACCACACAGGTTCTCTTATACTCTCTTTATTTAGATTCAAATCTACATACTAGGCTAAGAGTCCAATTCTAGTCAAACTGAATCATAAACATCATAATCAATCCATGGTCAACTCCAACCATTTATGAAGCATAAGATCTTATCTAAAAAAAaTCAACCAAAAGTTATTATTTGGCTTCCTTATCCCTATATAAGTATCTAAATATCCTTTGTGTACAACCAATATCAAATAAAATACATGCTTGTGCGGAGATCCTCACAAAAATATTTAGCAAAATAATCCTATCAATGTTGTTAGGATTGATGTTGAGTCATAAATCATATATATAGTGGATTGGATTAGATTCATCATCGATCGAATTATAGATCATTAGATCTTTTTGAATTATTTAAGATTTTTAAAATATACAAGAAATGCAAAAATTAAAAGTATAAGATGAATATAGAATTGATGAATAAAGAACCAAAAAATATACTGAACTAAAAGAGAGAGTATGTTGGCTTAACCAATTGTAGCAAGGTAGAAACCCCACTATGGTATGTATAACATAAGAAAGACCGTTATTAAAAGAGAAACAGATGCAAATCACTTTATTCTAAGATTAAAAAIACTATCTTAGCTAGCTACTTTAAGGATACAACTTTTACACATTCACTCACAAATCCTAGAGATTTAGCAAAAGAGAAAAGAGAGAAAAAAGAGGAAAGGCAAGGGAAGAATAGTTCCTATAATAGAATTTTCACTAGTTAATAACTCAAGTATCTCTAGGATGACTACAAGAGTAGCTCCAATAGGATATTTGTAGGTAATATATAGGAACTCAATTCTTAAACTTTTCAATGTGGGATTCCAAATTTCATTCTAACTCCAATAATTGTAATGCAAATTTTTCTAACAACATCAAAAGTTATTAACAATAAACTCATAACAATTAAAACTTTTCAAAATTTATTAATATCAAACTCTCCTAACTTAGACAAAAAATGGATAGAAAAATAAGTAATCATAAAAAAaCTAGTTGACCCAAGTTTATAGGATTTGAGACCTATGTAGCCTAAACCTATAACCCATGTGGTTAGAACCCACGATCTATGTTGTTAGGACTTGCAACCCGCTCTAGCATCACATACATTTAAGAAATCTAATTTGCTTCCTTATAAGTTCATATATATGGAATGTCTAATAAACAAATATTGTGCCTGATTATTCAAGATCTATATTTGTACCATCTGCCAATTAATTATCATTTTATTTAGAATGTGGTTAAAAAATATAAAAATTTCTCTTTTAAGTCCATAAACTCCAATACTATATTAGTTACCTTACTAACCAAGATCTAGAAATAATTTAAAATCTATAAAATTTAATGAATTATAGAAATTGGACTACATAATCCATAATATGACATTAAATTCTAATTTCTTAATAGATAATGATTCAAAGATAAGGTCCGGATTGTTTATGGCCATTTTATCTAGATTGTAAGATGCATAACTTGAATGATAAGATTTTAACAACAATAGCTCCTATTAAAAaTTAAAAAAaTATTTCTTATATAGTTATCATAAAAGGTGGTAATCAAGTCATATTATATTTATCAAAGCACTGTCTAAGCAATAGCTACATGATACTCTATAGTATCTAAGCACTATTCTCATTATCTTTATTTCTCTTTTTAAAATTTAGTGAGATGGTTGCATTGCCTCCATCTATGACTTAAATTTTTGGATAACAAAGCCATATCTATTAAGTTTCTTTAATGAACATATTTTGGCTCAAGTCCATTAGGATAAAAATCTTTTAGAGAGCATGAAAATTATATGGTTAGAAAATGTTACTAAAGGTGATTTCATATGATTCTTAATGTCTAAAATAGTGTTTAACTTTCTTTTCTCTATTTTTAGTAACCAATGTCAACAACCTTAATGAAGCACTTGAAAAGATCGTCTCCTTAATAATTTATATTGTAAGTTTAAATTTTAGTTCCTTGAACTATTGATAACTAATTGTTACTTCAGTAACTCATCAAACTATTTTTAATAATTCTCTCCATGATTCTCTTACATGTCCTTTTAAAATGCAACATGATATATCAATATGCTTTTCTATTAGACAATTCAACTTCTAATTATGAGTAATTAAATATATAATTTTTATTAAAATGGATCTAATTTTTTTTGGTTTGGCAACTCTTTTGTTCAGCATAAGATCAACAATTGATAGGTACAAGAAGGCATGTGCCAACAGTTCAAACTCAGGTGCCACCATAGAGATTAATTCTCAAGTAAGAAAGACATGGCAATTTAATCTAAAATAGATTTCTCTGAAGTCCATATATTTTTGCCTCATATGCTTATCAGTTAAAATTCTTCATGCTCATAAAGGCATAAAAGCAAGTCAGTAAATTATTTGTACAGTTGATCTTTTTGTTGTTTGTTCATAGCCTTACATGTATCTTTGAATATTTTGTTGATATATTGATTGCACAGATTTTTTTtCTTATTTCCATTGATTGTTGCTTTTCTTGGATATATTTGATAGGTTTGATTGAGAATAGTGGATTAAGGTGGTTTACAACCTTTCTTTGAGAGTTGTAAGGGTGTAAAGGGCTAGATCTACTAAGAGATGAGGGTGATGATACTACTAACTATTAAGACTATGTCGGAGTCCTTTTTCTTATGGATAACATATATTTGAAGTTGTCATTCCTTATAATGTAAGAGGTAATGAAAAGATTTTTCTTGCAAATTAGAATCACTTTGCATCAACTCCAATACTTTTCTTTATGCTAATAAGGTAGTGAATTTTAGTGATATCGTCTAGGAATGATTCAACTAATACCTCATTGCTTTTGAACCATAATTGCTTTTCCTCTATTTTCTTTTTTTtCATTTCAATCATATTTGTTATGGTGTAGGAGGGAAGGTATCATTAATCCCATATTAGTTGTGAGTCAAGGAGGACTCTGAAGGAACTACCCATCCTACATGAGGTGCTTTTTGGATTGAAATCCAAAGGGATAAAATTTTGAGACCTATGAGCCAAAACGGACAATACGTAATAGCCGAGCCATGAGCTCTTGGTTGCAACAGTGGCACACTAGGAAAGGAATCACCCTTATGACTGTGGGATCCCTCTCATCCGTACACAAACTCCTTGACTGGAGGGCGGTAATAAAATAAAGATGATGGTACCTTCCGTCTATCCATAGACTTCTTCTTGACTGGGGGCTATATTGTGGCGTAGGAAGGAGGGCATCATTAGTCCCACATTAATTATGAATTAAAAGGCTGGGACTCTAACTTATATAGGAAGGAAACACTCATCCTACATAAGGTGTCTTTTGGATTGAAATTCAAAGAGACAATCATGAGGCCCATGGGCAAAAACGGACAATACTTCACATGCCAAGCCATGAGCTCTTAATCATAATAGTGGAGGGAGGGCATCATTAGTCTCATATTGGTTGTAAATCAAAGAAGATCCTAGCTTATATGGGATGGGACCTTTTCTTCTCTGTGACGCCCCATGCCATGTCAATCAAAGATCGAAGTGGATAATACCTCACATATACAAGAACGGAGATCAATCTACCCGAGCCATGAGCCCTTGACTGCAATATTGATGTGCCAGATAAGGGACCTCCCCTACGACTGTGGGGCCTATCCCTCTGTACATAGACTCTTCCTTGATTATAGAGCTATATTATGGTGTAAGAGGGAGGACATCATTAATCTTACATAGGTTGTGAGTTAAGAGAGACTCTGATTTATATGAAATGGAATCTTCTCTCCTCTGTGAGGTCCCATATCATAGTGGCTAAAGATCGAAACGAATAATACATCACATATGCGGGAGTGCAGACTGACCCATCTGAGCCATAGGCTAACAATATTATCATAGAATCATGATTTGTAGTGAGCATTCATCTACTATTTTTTTtCCAGAACTCATTTCAATTTATCTCAATTTTCATGTTTTAAAAGAAGGATAGATCTTGCCCAATAATACATATAATATTTATGAAAGTCCTATGAAAGCCTTATTGTAGTCAGAAAACAAGGTCAAAAATACATTCTAGTCTATGGTTGAGAACTTCAACCAATTGACTACGTTGCCTGAATGTTCAAAAGAATTCAATAGTTCAATCAACAAATAGAGATGGGATCATATCATCTTTTtATTTCATCAATTTTGCTGAATGATATCTATAATATATATGTGCCTTCGCTCTAAAAATCTTTGGCCTAAGTTCAGATTTATGATAGCAACTCTTCAAAAAaCCAAAAaTTGTGATGACAACTGTTGCCTAGGCGACATGTAAGTGGTTAAGATTGAAAACTCTAAAATAGAGTGCAGCTACTCTAGGTAAAAGATCACTGACATAGACATACATCAAAGTTCGTCTGCTCCTTAATTATTTCTTTTACTAAAGTAGATGTTGAATCATAGGCGAACAATACTACTGAACAATACATATTTCTTGCATACATTGGCTTGACTATTAGTGCTATGCACTCTAGGTTCATTTATACTTCACAAGAGTTTTTATTTGTTTGCCAACATCAAATTTCATGCAATCAAAAACACAACTTGCAGAAAAAATGAATAAGAGTTAAGTAAAAGGACCTAATTATCATAAGCTATGGAAGACAAGACAAGGGATACTGCCATTGATACTCTTAGTAAAATAGTGTTATAAGTGATAGTAATAGCAATATGAAGAAAAGTATGAAAGAACTAGTTTTTTCTTAAAAGAGTATGAAATGCATACAAGTTGCGGTATCATTTGTGAAAGAGAAAGTATTTTCTTTTATTTACGTTTAGTCAAAACCATATTTATTTGTTATAGCTGATCCCTGAAATTTCATAACTCACACCAATTGGCATGATGTTATTAGCTTAGATTTGCCATTATACCGCCATTGGTAAGAACAAAATGCCCTCAATACCAAAATAAACTGCATTTGCAAGTTATTTGAAAGAAGTGCAACTCTATTATTGTGGCATGTTAACGAGCTTTTCTATAATTTGAATTTTTTGTACCGTCTATGATGGTTATCAAATTGTATAACGAAGGCAAAAAACTATGGCTAAATGATTCGTTTTTATGAATTATTGTATGCTACTCATGCTATACTTTGTTTGTTTCATCATGATCATTACCTGCAAATCATCTACTCGCATGATACAGCTACGCATTTGTCACATTCCGAACCTAGCATCTGGGTCAGCCATGCGATGGCCTCATATTCCCTAAGGCAAGGCTCTAAAGAATATACAAAGTCTTAACTTCTTTACATCCTCAAAATCACATGAGCACTATTGATATCAATTTAAAATAAATATTTTTAATTAATAAATACCAAACTTTATACAATTTATAGAACTCAAGTATCTGATTGGTGTTGATAATGCTCCATCTAATTAATTCCTTCAATCTTGATCTCAACTATAACCAAAAATACATATATCCTATGACTCTTAAAAAGAAAaGGAAAAGAGGAGATGTAAGCTTTACAATCCAATAAGAATTTTCACACACCAACACTAATATAATAATAATAAATAAaAAATAAGTAATAGTTGTTACTCTTATAAGTCTTCTGTCACAAGATACCATAATAATAAAACATGCAAAGAAAGTACATCTTTTTATATAATAAATCATATTAAATACTTTTCTCAATTTATAGTTACTGGATTCGATAATATTTAGGTACTCGACACTGAACTATCACAATCATGTTTCTGGCTCATGGCAAGATATCGACATAGTGGCTAGTCTCCTAAACTATCACAATCATATTTTTGATCAGTGGTAGGATATCAACATGATGGCTAATCTAGAGGGCCATATGTGCTTAACTCTGACTACTACAGCTAGATTTTCAATCTATGATCAGACACTAATAAAGTAGCTtATCTAAAGGATTATAAGTGCTCAATTCTAAACTATCATAATCACATTTTCAGATTACGGTAAGGATCAATATAGTGGCTTATCACACAGACTACCACAACTATATTTCCAGCTTGTGGTGGGGCATCAACAATATTAATAGCCTAAAGCACCACAACCCACTATTCAGTTACACAATTCAATTAACAATTCAAGATCAIACTCTTTTGTAAAATTCAATACACAAGATTATCGAAACTACTCAAGTTAGGATTAGTGATATATGATACATAACTTCATACAGATCTCTCTCTATATATATGTATGTATATATGTATGTGTGTTTGTATACATACAATTAACAAATAAGCACATAGCATGCAACTATCAAAAATCATATAAATCAAAATCACTATGCACAAAATAATTGTTATATAAATAGATGATCAATGTCTAGAAATTTTTCGCTCTACGTACTGATGACAAACTTGGTTATAACTATTTATTAGTCCATGCCTAGCATGTCCAATCAATCAATATAATTTCAGTTCATCCTGAATCAACCATTAGCATAAAAATTAAATAACTTATTGCCAGTGTTTTAATTTCAAAGCTCTAATATTCGAATTAATCTTACTTTTAATTTCTCTATACTTTCTAATTAAAAATTACATAATTAAATAAAAAATTTGGATTTTATCTTGACTATAAACTAGAGCATAAAATCCCTTGCTCAGTATTTCTTAATTGGATGATTGGTCCCATCCAAAATCAAAATCAATAATTAGAAAGAGCCATAAAATGGTTATCATCGATGGTAGAAAATTTAGAAGAAGAATATAGCTAGTCGAATAATAGCATCTGGCAACCTAAGTGGGTCAGGTCTGGCTGATTTAGCTGGTTATTCATGAATACAACAAAGATCATCTATGATAGATTTTGAGGTTGCTTGATCAAGACCAAGGTGGAGAAAGGCAATGCTAGTAGCATCCAGTGACTAGTGTTAGCCCAATATACATAATCCAAATGATTAGTCTACAAATCAAAAGCCAAATTATAGCTCAATAGGAATTTGGTGATGATAAAATCAAACAATGCTTAGCAGGGTCGGGTTTGGAGTTAACTATTATACAGAACAAGTCCAAAACCTTCTTCTAGGATCAACATAGGGTCTACTATCAAGTCTTCAAAATCCATCTTTTTTtCTtCTTTTTtATCCCTAAATATAAGAAGAGAGAGAAAAAGATAGAGGAAGAAAGCTGGTAGAAAGAGATGTGAGAGAGAAGGGAGAAAAAaaGAACAAACCAAATCTCTCTCTTTCTCTCTTCATTATCTTCTTTCTTCAAAAAGGGGATTTTCCCCTTTCTCCCTCTCTTTCTCCTAGCGGATGGCTAAGGCCAGCAGTCTATGGTGGTGTCTAGTGGTGAAGATGCGATGGCCGCAGTGCTACAGCGATGGCAGTTGTCGGTTGGTAGTGGTAGTGGGCGATCCAATAGAAAGAAAAGGAAATCAAAACAAAATAGAAAAAGAAGCCTTGCTTTGATATGATAAGAAGACTACAAGGTGGTCAGCGGTAATGACAAGCATCCGCATTAGCTTAACCTCTTATGATAGTTGCAAAGGCAATAATAGCCACAGTGGCTGACGGTGGATAAACTAAAGAAAACAGAAGGTCCTTAGTGCGGCAACATCCGACGGTCTTCCAAGAAGATTTCAGCCAATGATGGCTGTATGAAAATAaAAAaGAAaAAAaGGTACCAATAAGATGGGAGGCCACGATGCCTCGATCATCTCTAATGATGGCGTGACCATGGTTGTGCCAAAACTTtTTTTTCCTATCTTTCCAGTGATATGATCAATTGATCACTGATCAATACAGTGGAAGCTTGGCTTTATAAATGATGGAGGCTAGGGTTTTCTAGCCTCCGATGAGTTGGAGAAGGAGCCAGAGTCAAACTCTTTCTTCGACTCAAATAGGGGAAGGGAAGGTCTTTCCTTCCTTCCCATTGTTTCTTGGGCTTGATGAGATTTTTATTTTAGAAAAATTTCAAGCCTCTACAACCATATGAAATCATAATGTCAAAGCTAGAAAAGGAGATCTATGCCATAATATTCCAATTCCAAGCCTAATCAAAGAACCATCAATCCATTAACACTAACTTTAAGATACCTAAGTTCTCCCTAGCATTATCTATGGTAAGAAAATCTATTAATTAAAATTGCATAATTATATCTAAATCAGTCAAAGAACAAATAATATTCTCTCTTTCTTTATCAAAATTATACTCCTTTACCAGGAAACTAATTCGAATCTTCCATAATATCTTTTGGATCAAAGAATTAATGTATTTAATTAGTTTCAAAATAACTCAAACCATCACACTTCTGCTATACACTCTAATCTAAATCCATCGATTCCTCTGGGTTGACTAGGTGAATTCTAACAAAATACCGCTTAATATCGGAACCAAGAAGATCCAAAATTTTAACTTAAGGCAAACTAGAACAAAACTTTTGCATCTTTTTATCCTTACAAAATCTTGAGCATACCACATCAAAAGTAAACCTTGAGCCACTATCCATGTTTGAAGCATGACATAAGCTTCGCCATCCTCTCAAAACTTAATAACTCTAGATAAATTTAAATTAATCCTGACTTCTCTAACAGTTCAATTAGACTATCAAGATCACCTTTTCTCTTGGAAAGTTAACTCAAAATTCTAACAAGTTAGAAAACTCTAAATCAACATTCTTATTAACTTGTTTATTTTTtATAGAGCTTCGTTCACTACAATTCTTAGTATCAATCGACAAACCACATGAACGCCCCTTATATGTTAGACATATACAAGTCCACCAGAATCAATTTCTCTACTCAATTAAATATCGATAGCAAGATACTATAGACCTGCTCATAAGCCTAACTCTGATTAGAATTTAACACATCCAACTATCTCCAACAAATATAAGAAAGACCAAGTAAGCTGATCTAAAGATGATAATTTAAATTATCAAAGATTCTACCAAGATGCATATCTCATATCCAATTGATAAAATCTAATCCATTAATAGAATCAAACATACTTTTCTTTTACATGCCAGTTTCATATATGATCTTCTTATAGGTTTGATTCTCGAAGAATGTTTATTTTTAACACTATGTAATTCTTTCTTAGGCCATATCCTAAACAACTTGCTAGTAAAGTCTAAAATTTTAATGATCAAACAATTAATAATAAAaTTAAAAAaGTTATTATGATCTCCCCCTATATTAAGTTTAGAATTTCAAAAATATCTAAGTGACAATTGAGCAAGTACACACAGCATAACACAATCTACCAATATATCATACTTTATTCTAGGGTCTACAGCTCCTATACTTAGGTCAAATCTTACTTATTGAAATTAGAGACATAACTTATCCATTCCTTTTGTACTCATAATATGCCAAGTCTTATGCATAAATTTTTATCATAATGCTTAGTGAGCTTAAACCTGAGCTTTGAATCTATTTCTACTATGTACATTACATCCCTAGTGATCACAACTTTAAGTTCAAATATCAATTAAGTTATAATCCCTAATAATCATAACCTAGCTCTGACACTACTTTGTCATATCTCGATCCCAGCATCTGGATTGGCCACATGATGGCCGTATACTTTCTAGGACAAGATCCTAAAGAATATGCAAGATTTTAAATTCATTACAATCTTAAAATCCCATGAGTACTATTGATCTGAATTCAAAATGAATATTACACATTAACAAATACCAAACCTTGTATAATTTATAAAATTTGATCATCTGATTGGTATTGATGATATTCCATCTAATCAATTCTTTCAACCTTGATCCCACCTATAGTAAAATACATATATCCTATTACTCTGAAAATGAAAAGAAAGATGTGAGCTTCATAGATCAGTAAGAATTTTCACACATCAATATTAATATAATAATAAATAAAAAaTTATCAATAGTTATTACTCATATAAATCTCATACAATAGGATATCACGATCATAAAATATATATAAAAAAaTATATTTTTTtGTATAATAAATCACATCAAATACTTTTCTCAATTTATAGTGTATCAGATCCTATAATATTTAGGTGCTAGGCTCTAAATTATTACAACTATATTTTCCACTCATGGCATGACATCGACATAGTGGCTAATCTCGTGGACTATCACAATCACATTTTTAGCATGAGGTTGGACATAAGCATAGTGGCTAATCTAGAGGGTCATAAGTGCTCAACTCTGACTACCACAATCATATTTATAGTCCATATTGGGATATCAATAAAATGGCTAGTTCAGAAAACTACAAGTACTCAACTCTAAACTATCATAACCATTTTCTAGCCCATAATGATGCATCAACAAAATAGCAAGCCTAGAGCACCACAATCCACCATTCAAGGACACAATTCAATTAATAATTTAAGATCATATTTCTTTGTAAAATTTAATACATAAAATTACCAAAACCACTCAAGTTGGGATAAGTGACATGTGATATATAACTTTATACAGAATCATATATATACTTAAGAAATAAATGTATAGCATATAACTATCAAAAACTATATAGATCAAAATCATTAATTCACAAAAATAATTTTTATATAAATAGATGATTATTATCCAGAAATTCTTATCTCTACTAATGACAAACTCGGTTACAACTATTTTCTTGTCCATGCCTAATATATCCAACCAATCAACATAATTCCAACTCATCCTTAATCAACCATTAGCATAaAAAATAAATAAATTACTCATAGTGTTTTAATTTCAAAGCTTTAATATCCAAATTAATCTTAAATCTAATTTTTTtGTACTTTCTAATTTAAAATTATATAATTAAATAAGAAATTAAGATTTTATCTTGACTTGTAAACTAAAGCATAACATTTCTTGCTTTGCATTTTCTTATTGGGATGATTGCTCTCATCCAAAATCAAAACCAACAATCAAAAAAaGCTATAAAATAGTTATTGTCGATGGTGGAAAACTTAGAAGAAGAACAGTTGGTCGAATAATAACATCCGATGGCCCAAGTGGGTTTGATCTAGATGCCTTAGCTAGTGATTCAAGAATATGACAAAGATCGTCTATGATGGGTTTCGTGGTTACTTGATCAAGATCAAGGTGAAGAAGGGCAAGATTAGTAGGATCCAATGACCAGTGTCAGCCCATCTAGGTGATCCAAATGATTAATCTATAATTAAGAGCCAAATTATAGCTCAATAGAAATTTGGCGATGATAAAATCCAACAATGCCCGGCAAGAGTCGGGTTAGGAGTGAACAATTATAGAGCAAACCTAGAATCTTCTTTTGGGATCAACCTAGGGTCTACCATCAAGTCTTCTAAATCTATCTTTCTTtCTTTTTTTTTtATGCCTAAATCCAAGAAGAGAGATAACAATAAAGGGAGAATGTAGAGAGAGATGTGAGAGAGGGAAGAACAAATCGAATCTCTCTCTCTCTTCCTTGTCTTCTTTCTTCAAATAGAAGATTTTCCTTTCTCCCTCTCGTCCTCCAAACATGGCAGTGGATGGCTGAGGCCAATAGCCTGCGATGGCATCCAACAGTGAAGAGGCGACAACCCCAGTAGCAACAATGATGGCAGCTGGTGGCAGCAGTGGGCAATCGGATATAAAGAAGAAGAAAATCAAAGCAAAATAAGGCAAGAGGCCTTGCTTTGATCCAATGAAGAGGACTTCAAGGTAATCGGTAGCAATGGTAAGCATCTGCACCAGCTCAACCTTTGGTAATGGTCGCAATGGCAATAATGGCCATGGTGGCCAATGGTGGATGAATCAAAGAAAATAGGGGATCCTTGGTGCGGCAAGATCTAATGGTCTTTCAAGAAGATCTTAGCCAACAATGGCTACACGAGGATAGGAAGGAAGGAGAGAAAGTGCCCATGAGATGGGAGGCGATGCCTCATCTCCTATGATGGTTCAACCACGATTGGGCTAAAACTTTTtTCTCCTCCTTTTTtGACAATGCAATCAATTGATTTCTCAATAGAATGGAAGCTCAGCTTTATAGACAATGGAGGCTAAGGTTTCCTAGCATCCAATGAGTTTGAGAAGAAGCAGGAGTCGGACTCCTTCGACTCAAACAAAGGAAAGGAAGGTCTTTCCTTCCTTCCTATTGTTTCTTGGGCTTGATTTTGGGCCTATTTCGATGATGGGCTGGGTAGGGTATCACAACAGTTTTGTTTCTAAATTGTCATTATCAGGAAGAGTAATTCTTTGTACACCACATTCGATGTAGAAAAACTGCACCACTCCGCCTAATTGAGCCACATATAACCACCACTTTTCAATGTAATTTAGTATTCGCAATTCTGCTTTtTTTTTTGAAATTTTGAATGGCAAAAATGTCCATCCTCTTTTAAAAAAATATGATATCTTATGGCCATATTATAATATCCTGCAATCAAATTATGATTTCTTATATACAGAAAGTTATAATTTGACCACAGGATGTCATAAGAAAGGGGTGGACATTTTCATCATTTAAAAaTTTTtAAATTTTtAATAATGAAAATGTCCTTtCCTTTTtATGACTTTTGGAAGAAAAaTTATGACATCCTATGTGTATTAAGACATAATTTGACCGCAAAATGTCAIAATTTTTTtAAAAAaGGATAAGCATTTTCATCATGCAAAATTTCAAAAGAAAAAGCAGAAATGCGGATATTAAATACACATTGGAAAACGGTGCATTACATGACTCAATCAGATGGCGCGGTGCATTTTTTCTACACCAAGTGCGGTGTACAAAGAATTTCTCTTACTAGGAAATATCTTGAGTCTAGACCGGCCCATTTGTCATTTAGACCAATCAAGGACTATGAATTTTGGTCCATAATAAGTATGAGATCGTCATGGGATTGAAAAAGATGGGAAATAACTCCTCAGTTTGCCCCTTGACAGCTCACAATTCTTCAAATAATAGCATAAATCATTTTTTGAATCATCAAATTTATTACATTTTAGCCTTTTAGAAGAAACCAATGCTATCCATATAAAAGGTATTTGTTTTCTATTAATGTCATTGCACTAATGAAGACAGCTTCAGCAAAGATAGAGCAGAAATCCTTTAAATTTTGTAAGATTCATTTGATCATCTTGAATTTTCTTTGATGATGTGGTTGCAGCAATACTATCAGCAGGAATCAGCAAAGTTGCGCCACCAGATACAGATTTTACAAAATGCAAACAGGTGAACCTCAAACTTAGATCAGAACTGATTGGTCTCAAATACAATGTATATGCATTTTCAAAGCTTAAGATTATGTCTTACCATGATTCCTAATCTACCACCTCTACCTTTCAGGCACTTAATGGGTGAAGCTTTGAGCACTCTGACTGTAAAGGAGCTCAAGCAACTCGAAAACAGACTTGAAAGAGGTATCACACGGATCAGATCGAAGAAGGTAATCTGCATCTATATTTTCTTCAAACTGAGATCTTCATATTGCCACCAGCACATGGCTTATCTGAAGTACATGATTATTAATCATGAAACATCATGCTATGCAGCATTGAAAAGGGAAATCATTGTGGTTCACAGGTGGGGGTAGAGCATGTAAGATACGATGGGATCTAAAAATCGAGTCAATATAAATAAGTGTAATTTGTATTCTGTTCTGCCCCCAGAAATCAGCATAGGCACCATGATGCATGTACCATCACCTAATAATATGCAACTTCAGAATTTTTTGGCCCATCCAGCTCTTTAATTTGATTTTTGATGCATCTCATTGTTTTTTtCGCATCAGCATGAGCTGTTGTTTGCAGAGATCGAGTATATGCAGAAAAGGGTAATATTCTAAACTTATTCCCTGCAACTTAATTCAAAGTATTGATTTCTTTCATTCATGTCTCCCTCTGAGTGGTTCTTTGTTGTTGAACTGTAGGAAGTAGAACTCCAAAATGACAATATGTACCTCAGAGCTAAGGTATCAATGAGAACAAAACTCTCTTCCTTGTCCTTGTCTGCTATTTCTTTCTGATATAAACAAAAGAAATGGATATCATATTCGTAAAATATTTGATATCATCTATCATGCTTTTAGACTTATATGTGGTACTAGCATGGAGCCAAATTAIATGCATTTTCAIATGTTTAGAATGCATGACTAACGAAACAGTGACTTATGTTTAAAATGCATTTTCTCATTGATCAAATTTTTTTTtACATACTGTTGAATTTAACAGAGGAGAATAGTTTCCAAGAGATATTACAAAACAAGAGTTTATTTGTATTTGCTTGTCTTCAAGAAATGAATTCAGCTCCACTAGTGGTAATCATGTGGTCATCATCCATAGTGGCCTGTATGGCATGGCATAAAAACTAGGTGAGATTGTAAACAATCTTCATGATGATAGTATATATACATAGAACATTGAGCCTTTGTGTGGAGGCTCATCTGAAAATTAGTCATATCTGAATGAGAACCAGATTGATGGACCGTTTGAATCAAGAGATAGGACAAGCAATACTCGAAAAAGTGCCTTAGTTACAGCCCAAATTCTGGATTGCTGATTTCTCTATTTATCGATGCACCAACACCCTTCATGGGCAAGAATATTGTTTAAATCAGTGTTGCATTTGACTTCAAACCTCTAACATCTCAACAACCATAACTGAAGCCCCTTCAAAGCTAAAATGCCTGTTAATTTGTTCTTCACAAAGAAAATGGCATTTTTTCCTAGATGTCCATACCGATACTAACGGTATTTTGGAGGCTTGATGATGTGCTAATGACACTTTGGATTCCTCAAAGAAATGGCTCCTCTGCTCCATCTCGGTCACAAGTCTCTAAAATTTTCACTTGTTGTTTCCATTGATTCTATTTCTTTATATTTTATTTAGATCTTCACAGACACAGTCTCAAAGTAGCAAGGTGGCATCTACATTCTTATTTCTCACTTCAAAATTTTTGGTGTTCTCAGATAGCAGAGAATGAGCGAGCACAGCAAGCAGGTATTGTGCCGGCAGGGCCTGATTTTGATGCTCTTCCAACGTTTGATACCAGAAACTATTACCATGTCAATATGCTGGAGGCAGCACAACACTATTCACACCATCAAGACCAGACAACCCTTCATCTTGGATATGAAATGAAAGCTGATCCAGCTGCAAAAAATTTACTTTAAGTATGTCGCTGCTTGTTAATGACATGTTCTAATAACATAGGCTACAAGACCTGTACTCTTACTGATAAAGGTGTGTTAGAAGACTTGTCTGATTTCTATATTCCTAATATCAArAGACATGTTAGTGTGCCTTAATTTGTCTTGATTTCAGTAATATTTTGCAGATTGGAAGAAAAAGCACTTTTTTATTCATAGAAGTTCTCTCCACCAACCATCATCTATTGAGTAGATCAGAGTAGCATAAATGACATGTGTATGCATATCCTAGAGCTATAATTGACATGCCAAATGAAAAACCTAAAATGCTGAAAGGAATCTCCACAATTATGGAGGAATTAGTACTTCTTAGACCACGAAGCTAAAACTAGATCTGCAATCCTCATAAAGAATGGCTACCCCCTACTGCCGAGTGTCACCAAAACATTATTGAAGTTGCTAAGCCAAGCCCTCAAAGTTCTCTTTTGCTATGTTTCTCCCCAGCTGCGAGCTTTTGATTTTGTTGCTTCTTCAAAGATCATGTACATGTAAGTGGTTTCTTTTGCTGCTGTCTCTCGGATCTTTTTGCGTGATGCATATAGGCCTGGTAGATCACCAAAACCAGACTCGCCATTTGTGTAAGTCCAGGTTTTCCAGTAGTCCTGTGATTCTTGCCTCCAGCTAATGCTTTAGCAGACCATTGCAAGCAAATCTCTGTCAGCAACTATATGGTCACTTGGAGTAGATGGATATTAAACATGCTTGTCTTTTTGCTTATAGCCTTCAATTTATTTGATATTATAGTATTAACCCAAGCTCAAGCTCGACTCGATGAAAAATAGACAAAACTCGAGTTGAGCTTGAATATCAATGGAGTTATACTCGAGTTCGAGATCAAGTCTTAGCTTACTAATAAGATATATATATATATATATATATATATATATATATACAAACTCAAATAGGCTCATAAGTTTTTtAAACTGAGTATCCTGTTATTCAAGGTTGATAATAATCGAGTTGAGTCAAGCTTGAATAGTTTATAAGCAACTTTGACTCATTTGTATACATCGTAAGCTTCTAAAGATAGCCATAAGAGATCAGAGATGTCCATGCCTGTGGTACCAACCTATGGTAAGCATTAAGGAGGGTGGTACCAACCTATCGGCTGAAGTTTCGTTGGTGAATGTTAATTTTTGCAAATCTCTAACACTATAATATAAAAATCTCTAGGATCTTACATGGTCAAAAATGGTTGTAGACGTTATATGCTAAATAATGTGTTGTTGTCCATGTCAGGATCTAATGAAGAATAACCACTTGTTTTGTTGTGAGAATCTAATCAGTGTAGTGCTATACAAGCCAATGATCTGTATTTAATTAGCTCCCAGTTGCTAGATGGAATCGTACTAAAGTTTTTTTTTTttGGATTGAAGGTACTAAAGCATTTAAAAaTAAAAAaTTTCTCACAATCCGGCATTAGCTTAGTTGGTAGAGCAGAGGACTTTAGTTGGTATTAATCAGCAATCACTAGGTCGCAGGTTTGAATTCGGCAAGTTAGATTTTTTAAATTAAATGCCAATTATTTGTAGTTTTTtCTAAACAATTTGACACTATTTTTCAAAATTATGCAAGACAAAAATTGAAAAATTCCAAGGTGTCATGTTATCCTTTAAAATTTTTACATCATAAACTTTAAATTATAATTTACAAATATTTATTTCATTTACAACAACAGAACATATAGCATGAGAAGAATTATGCAAAAGAATAACTAAGAATTTCTGATAAAATATACACCTTTTTCTGACCCCAATTTATATCACTAAATTCAAAGATGAGGATTATGCAATGTTGGAGCTAGTATGGCTGAAAATCTAACATCCTTGCTAAGCATTTCTGCTTTAGGAAGGCTAATATTCTTGAAAAAaCAAAaTAATTGGCTTGGGGTTTAAGACAGCTTCAAACTGGGAGTGGCTTACATGTATACAATCAGAACTACTATAAAAGCCATGGAAGCAGGATGGGAAAAAaGAAAATGATTTAGTAATTTTTTATTTATATTTAATTTTTTTttATTAAGCTATCAACTATTTCCCTAAATATCATAAGACCCACATCAAAGCTATTAAAAACAAATAAAGGTTTTGCATCAATGTATTGGGTACATCCCAATCTTATTTCTCAAAAATGTTTTTGTGTCAACACATCTAACAATATCATTGTCAAACTTTTATATAAAGCACCTACTACACAAGCTATACTACACTCTGCAAGTTAAACCCATTTATTTATCAATTTTCTGCCAAATTATTTATTAATTATTTAAACAAAAAaTTTAAATTACTATAATGCTAAACAATTTTATAGCTACTTAAAAGAAGCATGTTCGGTTGCTAAACTATCTCACTTGCACAIATCTTCCGTATACTTTATATCATTCCAAATTTTTTTCATAGGACTTATTTGGACAATCGGGAAACATGTTTTCTTTACTATGAAATTGCATTCAAGAGTATTGACAAATCCCATTGTCTTTTTtATTACTAAATATGCATTTTGTATGCTCATATACTAGTACATAAATCTATTGGTTTTTtATTCTCTTGGTTAGTATAAATTGACTATCTCAAGATAGCAATTAATATGTATTATATTATTCAATACTTTTAATCTTGCCTTTGCTATGCCGCTTTTAGTTTCTTTAATATTAAATATCAAATGAAATGATAACTAATCTCATTTTAGTGATATTGCCTGACATTTTGATATCCTATTCTTCAATATCACTTGAGATATCAAGATATCTTGACTATTTAAGATCTATTTTCTATTGAAATGAAGGTAAATTGGTATGTTGGTTTGTCTTGGTTAGAAATGAATTTGAGACTTAAAATTTCAATAGAATTTGATGAATGATTTAACCTGAATATATAAAAACAGCACGCAAGTTAGCTGATATTCATCCTTTTGATCTTGTTTCAAATTATTTATCGGGATAATTGATATTTATGTATTTATAAAACAATATTACAGGTAAGAGAAATCAAAATACAATGATTCACTCCACATTCCTATCCTCCACATCCAAAACTCCTCAAAATTAAAACCAAACTCTAAAATGCTCTCTATATATTAAAATTTCAATGTAGCTTTTGATAATGTTATAAAAATAGTTGTTTTGATATAAATGGTTGTTGAAGCTCATATGGATGATCCCTTAGAAACTGGAGTGTATTATAAATGATCGTTGAAGCTCGTATGGATGATCCCTTAGAAACTGGAGTGTATTATAAATGATCGTTGAAGCTCGTATGGATGAGTCCTTAGAAATTGATATAAGAAATATTATTTCCTTCAAATGAAAAATATTATTCCCTTGGTAAATAAATAAGAAATTATTATTTCTTTTGTAAATAAATGAAAAATATTATTTTtCTTTATAATTTAGATTAAAAATCTATAAAAGAGCTTGGAATGAAATGAGAATTGTTGCGGCCAACTCTCCGTCGCCTGTCGCCGGTAACGAGCACCCGCAAGACAGCATCCACATAGACCGAATTGATGTCCGACGAAGACCCTCCGATGCTTAAGTCAGATAAGGAAGTTGATGAACAATAATTTTTGAATGTAGAAAGTAGCAGAGTTCTGGCCCTGAGATGGCTTACCAGTACTGCTCACTTAACCCCTTTTTATAGATGCTTTTGATGTAACCGTCGAGCACATAGTCCCACTTTTTATGACGCTAAATTATCGGGCCATAAATATAAAATTAATGAGGCGTTAATTCTCCTTAATAGCCGTGACACACAGTTGATAACCGTTTGTGACGGTTATGATATGTTGAGCAGATTAGCCGATCATATATCGGTAGAACCGACTATATGTCGGTAGAATCTATGAGCGACCATCGGCTAGTAGTTCTGTTATGCCGACGGTCTAAGTCATTCACTGTCGATCGGTAGTAGTCGAATCATTAGTCGGTCAGCCGATAGTAAGTCGGCGCGGTTCGCTCAGTCGGTCGATGAAGAGTCAGAACTGCATGTTCAACCGATATGCAGTTGGAGTCGTGGTGACCAAAGTCTGAGGTCGGTCAGTTTACCCCAACAGTTACCCCCACTCTCAAAGTCCAAGGTGAACCGACGTGTATATTGTCACGTAGTTCGTCATATTAGATGAAGGGAGTTATTTCTATCATATCGAACCTCGATTTTGATGTCGCTTTCTTCGAGATATGGGCGATCGACTGCTTTGTCGTTGTGGCGGATACGGTCATCTTTAAACTGTCACACTAATCAGACGATTCGGTATCAGTTGTCAGTGTCAGACATCATTTTGGAAAATCAATTCGACGTCGGATGATATGATTCTGACAAATAGATTTGTGCCATATGTCTGAATGTTATTGGGTCGGATCTGTTTACGCGGATTAGGATGACGTGGCTCGATCTGGGGCAAATACGTCGAACCATCTGATTAATGGTCGGTCTAGATGTTGCCACATGTCACATCTGATAAATTTTCGATTCAATCACCTTCATCTCCACTGTTGAGGGATCCTATATATATAGGATCGCTCTCAACCAAACTTCTACTTTTCATTTTATCTTTCTTGGTGCCGAAACTCTGTCGGACAGTCGTCCCAACGTCTGAGGTTGTTATTTTCGTCTTTTTCAGATCAAGTTTCTGTCTTTTCTTGAGTCCTTTTTCTTTCAGAATCTCCGTCTTCTTTAGAATCTTGTCTCTTATGGCTAGGACTTCTTCTTGGGACGGTCGGTTGGAGAATCCGACTGACGAATCTCAATCAGATCCAGAGGTTGAGGTTTCTTCACTTTTGGAGTCAAAIATCGAGCAGCTTCAGGAACAGTATTGTATCCCGGAGCAGTTTCAGCTTTTTGCCCCTAGGGCTGATGGTCGGATGAATATCCCTTTTTTGGGCCAGGTGGCCTTCTATGTCGAAGATTTTCGAGTGGATCTTCGATTTTTGATTTTAAAATTTATCCGAAATATTTTGGATTACTACGGACTTTGTCTGGCTCAGCTGGCACCGAACTTGATCTGGCTGGTAATTAGTTTTGCCTTGTTGTGTCAGTTGCTACCGACTAAACCTCGTCCTTCTCTTTTTCGAGTTTTCTTCATCCTCCGACCTCATCCGAAGATCCGAGGGTGGTGGTTCTTCAACCCTCGAAAAGATTTTTCTtTTATTACTGATCTTCTATCATCCATTCATAGATGGAAGAATCAATTCTTCTTCGCTTCCTCTACCCTTCCTTGGGGTTTTCCTTCTCGTTGGAGCGATCTACGAACTGATTGCACGACAACAGCCGAGTAGAGATTGACGATCGGGAGGACTTCCATTGACTGAAAGACATGACGGTCCTGGCACAGAAGGAGCTTGTGAACGAACAGACCCTTTATGATGCCGACCTTAGTTCGATTGCCCGATTAGATATAGTACAGTCGGTCGGTTATTTCGGACTTTACTTTTCTTTTACTTGTTTAGTTGTACTGACTTCTATTGTAATTGCAGCCATGTAGCCGAGGGTGCGAGTGTCGAGCATCGATATTTGTCAGCACGCTGCCAGGAAGAGGGCAGCGTCCGAGGTTGGACCTTCTCGACCATCGATGAGGCATCATACTTTGGTGCAAGTTCGAGCGGCACTAGCTTCAGTCGTCGCTTCAATGCCGACTGAGGAACCCGATGCTCCATCTGCATCGGTTCCTGAGCCGATCCCGATACTATCAGCCCCGACAGTGCTCCCTGCTGCATCATCCGAAGAAAGGGTGGCAAGGAGAACTGCCGAAGCACCATCGGTAGTTCCATCAATTGAGGAGGTTTGGGTCAGGGCTGGAGAATCTGAACAATCTGTGGCTGCGCCAGTTGCTCCTTCAGCTGGGGCGCAGTCGAGTTCAAGTTTTCCCTCGCTTTCGAACATGGGACTGCCGGCAAGGGATCGGGGGAAAGCTCTGGTGACTTCGACGGAAGATGCAGCATCGGAGGGCTACACGGTTCACTTCGACCTTCAAGTACCTGATGATAAATTGACCCTGGCCAATCCGACATTGGCCAAGCGACTGTGCCAAGCCGCTCTTCCTTCGCTTTATCAGGAGCATCGAAAGAAACGGACAGTGGCCGAGATGTTTTCATCCTTTTACTTGATGATAATTAGGGTAAGTTTCTTTTCTTCTTTTTTtCTTTTTTTtAACCTAA
[0552] SEQ ID NO:8220预测的SHELL蛋白质序列
[0553] [dura]
[0554]MGRGKIEIKRIENTTSRQVTFCKRRNGLLKkAYELSVLCDAEVALIVFSSRGRLYEYANNSIRSTIDRYKKACANSSNSGATIEINSQYYQQESAKLRHQIQILQNANRHLMGEALSTLTVKELKQLENRLERGITRIRSKKHELLFAEIEYMQKREVELQNDNMYLRAKIAENERAQQAA
[0555] SEQ ID NO:8221预测的SHELL蛋白质序列
[0556] [pisifera,扎伊尔等位基因;shAVROS]
[0557] MGRGKIEIKRIENTTSRQVTFCKRRNGLLKNAYELSVLCDAEVALIVFSSRGRLYEYANNSIRSTIDRYKKACANSSNSGATIEINSQYYQQESAKLRHQIQILQNANRHLMGEALSTLTVKELKQLENRLERGITRIRSKKHELLFAEIEYMQKREVELQNDNMYLRAKIAENERAQQAA
[0558] SEQ ID NO:8222预测的SHELL蛋白质序列
[0559] [pisifera,尼日利亚等位基因;shMPOB]
[0560]MGRGKIEIKRIENTTSRQVTFCKRRNGLPKKAYELSVLCDAEVALIVFSSRGRLYEYANNSIRSTIDRYKKACANSSNSGATIEINSQYYQQESAKLRHQIQILQNANRHLMGEALSTLTVKELKQLENRLERGITRIRSKKHELLFAEIEYMQKREVELQNDNMYLRAKIAENERAQQAA。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈