首页 / 专利库 / 生物工程 / 调控序列 / 具有增强的产量相关性状的植物和用于产生该植物的方法

具有增强的产量相关性状的植物和用于产生该植物的方法

阅读:988发布:2023-02-05

专利汇可以提供具有增强的产量相关性状的植物和用于产生该植物的方法专利检索,专利查询,专利分析的服务。并且本 发明 一般地涉及分子 生物 学领域并涉及用于相对于 对照 植物 增强植物中产量相关性状、尤其用于增加植物产量和/或早期萌发势的方法。更具体地,本发明涉及用于增强产量相关性状的方法,其包括修饰编码HAL3多肽、MADS15多肽、PLT转录因子多肽、基本/螺旋-环-螺旋(bHLH)转录因子或SPL15转录因子的核酸的表达。本发明还提供了用于本发明方法的构建体。,下面是具有增强的产量相关性状的植物和用于产生该植物的方法专利的具体信息内容。

1. 用于相对于对照植物增强植物中产量相关性状的方法,其包括优先增加编码HAL3多肽的核酸在植物苗中的表达,和任选地选择具有增加的产量的植物。
2. 根据权利要求1的方法,其中所述增加的表达通过导入遗传修饰, 优选在编码HAL3多肽的基因的基因座内导入遗传修饰来实现。
3. 根据权利要求2的方法,其中所述遗传修饰通过T-DNA激活、 TILLING和同源重组的任何一种或多种方法实现。
4. 根据权利要求2的方法,其中所述遗传修饰通过T-DNA激活、 TILLING和同源重组的任何一种或多种方法实现。
5. 根据权利要求1的方法,其中所述增加的表达通过导入并在植物中 表达编码HAL3多肽的核酸来实现。
6. 根据权利要求5的方法,其中所述编码HAL3蛋白质的核酸由在表 A中给出的任何一种核酸SEQ ID NO或其部分,或能够与在表A中给出 的任何一种核酸SEQ ID NO杂交的序列代表。
7. 根据权利要求5的方法,其中所述编码HAL3蛋白质的核酸编码在 表A中给出的任一核酸SEQ ID NO的直向同源物或旁系同源物。
8. 根据权利要求1至7任一项的方法,其中所述增强的产量相关性状 包含增加的产量和/或早期萌发势。
9. 根据权利要求8的方法,其中所述增加的产量是增加的种子产量。
10. 根据权利要求9的方法,其中所述增加的种子产量是下列一种或 多种:a)增加的种子生物量;b)增加的收获指数;和c)增加的(饱满)种子数。
11. 根据权利要求9的方法,其中所述种子产量的增加相对于对照植 物是至少10%。
12. 根据权利要求5至11任一项的方法,其中所述编码HAL3蛋白 质的核酸有效连接苗特异性启动子,优选有效连接p扩展蛋白启动子。
13. 根据权利要求5至12任一项的方法,其中所述编码HAL3蛋白质的核酸是植物来源的,优选来自双子叶植物,还优选来自十字花科植物, 更优选来自拟南芥属,最优选来自拟南芥。
14. 通过根据任一前述权利要求的方法可获得的植物或其部分,包括 种子,其中所述植物或其部分包含编码HAL3多肽的重组核酸。
15. 构建体,其包含:(a) 编码HAL3多肽的核酸;(b) 能够驱动(a)的核酸序列优先在植物的苗组织中表达的一种或多 种调控序列;和任选地(c) 转录终止序列。
16. 根据权利要求15的构建体,其中所述一种或多种调控序列至少 是苗特异性启动子,优选是p扩展蛋白启动子。
17. 根据权利要求15或16的构建体的用途,用于相对于对照植物增 强植物中产量相关性状,优选地用于增加产量和/或萌发势。
18. 根据权利要求17的用途,其中所述产量是增加的种子产量。
19. 根据权利要求17的用途,其中所述萌发势是早期萌发势。
20. 用根据权利要求15或16所述的构建体转化的植物、植物部分或 植物细胞。
21. 用于产生相对于对照植物具有增强的产量相关性状的转基因植 物的方法,所述方法包括:(i) 导入并优先增加编码HAL3多肽的核酸在植物的苗组织中的表达;和(ii) 在促进植物生长和发育的条件下培育植物细胞。
22. 相对于对照植物具有增强的产量相关性状的转基因植物,所述增 强的产量相关性状由于优先增加HAL3多肽在苗中的表达而产生。
23. 根据权利要求14、 20或22的转基因植物,其中所述植物是作物 植物或单子叶#_物或谷物,如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、 高粱和燕麦。
24. 根据权利要求14、 20、 22或23任一项的植物的可收获部分,其中所迷可收获部分优选地是种子,
25.获部分的产物。
26. 编码HAL3多肽的核酸用于增强植物中产量相关性状的用途,其 中所述核酸有效连接苗特异性启动子。
27. 根据权利要求26的用途,其中所述产量相关性状包含种子产量 和/或早期萌发势。
28. 用于增强植物中产量相关性状的方法,其包括调节、优选增加编 码MADS15蛋白质的核酸在植物中的表达。
29. 根据权利要求28的方法,其中所述MADS15蛋白质包含任何一 种或多种以下基序:SEQIDNO:48、 SEQIDNO:49、 SEQ IDNO:50、 SEQ ID脆51。
30. 根据权利要求28至29的方法,其中所述受调节的表达通过 T-DNA激活标签、TILLING、位点定向诱变、定向进化或同源重组的任 何一种或多种方法实现。
31. 根据权利要求28至29任一项的方法,其中所述受调节的表达通 过导入并在植物中表达编码MADS15蛋白质的核酸而实现,并且其中所述 MADS15蛋白质的基酸序列包含任何一种或多种以下基序:SEQ ID NO:48、 SEQIDNO:49、 SEQIDNO:50、 SEQIDNO:51。
32. 根据权利要求31的方法,其中所述编码MADS15蛋白质的核酸 是在表D中给出的任何一种核酸SEQ ID NO或其部分,或是能够与在表 D中给出的任何一种核酸SEQ ID NO杂交的序列。
33. 根据外又利要求31的方法,其中所述编码MADS15蛋白质的核酸 编码在表D中给出的任一核酸SEQ ID NO的直向同源物或旁系同源物。
34. 根据权利要求28至33任一项的方法,其中所述增强的产量相关 性状是根生物量。
35. 根据权利要求31至34任一项的方法,其中所述编码MADS15 蛋白质的核酸有效连接组成型启动子、优选GOS2启动子。
36. 根据杈利要求31至35任一项的方法,其中所述编码MADS15 蛋白质的核酸是^:物来源的,优选来自单子叶植物,还优选来自禾本科, 更优选来自稻属,最优选来自稻。
37. 通过根据权利要求28至36任一项的方法可获得的植物或其部 分,包括种子,其中所述植物或其部分包含编码MADS15蛋白质的重組核 酸。
38. 构建体,其包含:(a) 编码MADS15蛋白质的核酸,其中所述MADS15蛋白质的氨基 絲列包含任何一种或多种以下基序:SEQIDNO:48、 SEQ ID NO:49、 SEQIDNO:50、 SEQIDNO:51;(b) 能够驱动(a)的核酸序列表达的一种或多种调控序列;和任选地(c) 转录终止序列。
39. 根据3又利要求38的构建体,其中所述一种或多种调控序列至少 是组成型启动子,优选GOS2启动子。
40. 根据权利要求38或39的构建体的用途,用于产生相对于对照植 物具有增强的产量相关性状、尤其增加的根产量的植物。
41. 用根据权利要求38或39的构建体转化的植物、植物部分或植物 细胞。
42. 用于产生相对于对照植物具有增强的产量相关性状的转基因植 物的方法,所述方法包括:(i) 导入并在植物中表达编码MADS15蛋白质的核酸,其中所述 MADS15蛋白质的氨基酸序列包含任何一种或多种以下基序:SEQ ID NO:48、 SEQIDNO:49、 SEQIDNO:50、 SEQIDNO:51;和(ii) 在促进植物生长和发育的条件下培育植物细胞。
43. 相对于对照植物具有增加的产量的转基因植物或来自所述转基 因植物的转基因植物细胞,所述增加的产量因编码MADS15蛋白质的核酸 的增加的表达而产生,其中所述MADS15蛋白质的氨基酸序列包含任何一 种或多种以下基序:SEQIDNO:48、 SEQIDNO:49、 SEQIDNO:50、 SEQID NO:51。
44.image see original document page 6
45. 根据权利要求37、 41或43的转基因植物,其中所述植物是作物 植物或单子叶植物或谷物,如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、 高粱和燕麦,或来自所述转基因植物的转基因植物细胞。
46. 根据权利要求44的植物的可收获部分,其中所述可收获部分优 选是根。获部分的产物。
47. 编码MADS15蛋白质的核酸在增强植物内产量相关性状中的用 途,其中所述MADS15蛋白质的氨基酸序列包含任何一种或多种以下基 序:SEQIDNO:48、 SEQIDNO:49、 SEQIDNO:50、 SEQIDNO:51。
48. 根据权利要求47的用途,其中所述增强的产量相关性状是相对 于对照植物增加的根生物量。
49. 用于相对于合适的对照植物增强植物中产量相关性状的方法,其 包括优先降低内源性MADS15基因在所述植物中的表达。
50. 根据权利要求49的方法,其中所述MADS15蛋白质包含任何一 种或多种以下基序:SEQIDNO:114、 SEQIDNO:115、 SEQIDNO:116、 SEQ ID NO:117。
51. 根据权利要求49或50的方法,其中所述降低的表达通过基因表 达的RNA介导的下调实现。
52. 根据权利要求51的方法,其中所述RNA介导的下调通过共抑制 实现。
53. 根据权利要求51的方法,其中所述RNA介导的下调通过使用反 义MADS15核酸序列实现。
54. 根据权利要求49或50的方法,其中所述降低的表达使用 MADS15基因或其片段的反向重复序列实现,所述反向重复序列优选能够 形成发夹结构。
55. 根据权利要求49或50的方法,其中使用对MADS15核酸有特异性的核酶实现所述降低的表达。
56. 根据权利要求49或50的方法,其中通过插入诱变实现所述降低 的表达。
57. 根据权利要求49至56任一项的方法,其中所述内源性MADS15 基因是如植物中以其天然形式发现的MADS15基因或是随后导入植物的 分离的MADS15核酸。
58. 才艮据权利要求57的方法,其中所述导入的MADS15核酸有效连 接組成型启动子,优选GOS2启动子。
59. 根据权利要求57或58的方法,其中所述导入的MADS15核酸 来自植物来源或人工来源,优选其中用与内源性MADS15基因同源的 MADS15核酸转化植物,更优选地其中来自单子叶植物的MADS15核酸 序列用于转化单子叶植物,还更优选地其中来自禾本科的MADS15序列 用于转化至禾本科植物内,最优选地其中来自稻的MADS15核酸序列用于 转化稻植物。
60. 根据权利要求59的方法,其中所述来自稻的MADS15核酸序列 包含SEQ ID NO:109 (OsMADS15)的足够长度的基本上连续的核苷酸,或 包含编码OsMADS15(SEQ ID NO:110)的直向同源物或旁系同源物的核酸 序列的足够长度基本上连续的核苷酸。
61. 根据权利要求60的方法,其中OsMADS15的所述直向同源物或 旁系同源物由SEQ ID NO:147、 SEQ ID NO:149、 SEQ ID NO:151、 SEQ ID NO:153、 SEQIDNO:155、 SEQIDNO:157、 SEQ ID NO:159和SEQ ID NO:161代表。
62. 根据权利要求60或61的方法,其中编码OsMADS15(SEQ ID NO:110)的直向同源物或旁系同源物的核酸序列的所述基本上连续的核苷 酸是来自由SEQIDNO:146、 SEQIDNO:148、 SEQIDNO:150、 SEQ ID NO:152、 SEQIDNO:154、 SEQIDNO:156、 SEQ ID NO:158和SEQ ID NO:160所代表的核酸序列的基本上连续的核苷酸。
63. 根据权利要求49至62任一项的方法,其中所述增强的产量相关性状包含增加的产量,优选增加的种子产量和/或增加的生物量。
64. 根据权利要求63的方法,其中所述增加的种子产量选自下列一 种或多种:a)增加的种子生物量(种子重量);b)增加的每林植物花数;和 c)增加的(饱满)种子数。
65. 通过根据权利要求49至64任一项的方法可获得的植物或其部 分,包4舌种子,其中所述才直物或其部分包含重组MADS15核酸。
66. 构建体,其包含:(i) 能够使内源性MADS15基因沉默的MADS15核酸;(ii) 能够驱动(a)的核酸序列表达的一种或多种调控序列;和任选地(iii) 转录终止序列。
67. 根据权利要求66的构建体,其中所述一种或多种调控序列至少 是组成型启动子,优选GOS2启动子。
68. 根据权利要求66或67的构建体的用途,用于产生相对于对照植 物具有增强的产量相关性状、尤其增加的种子产量和/或生物量的植物。
69. 用根据权利要求66或67的构建体转化的植物、植物部分或植物 细胞。
70. 用于产生相对于对照植物具有增强的产量相关性状的转基因植 物的方法,所述方法包才舌:(i) 导入并在植物中表达能够使内源性MADS15基因沉默的MADS15(ii) 在促进植物生长和发育的条件下培育植物细胞。
71. 相对于对照植物具有增强的产量相关性状的转基因植物或来自 所述转基因植物的转基因植物细胞,所述增强的产量相关性状因编码 MADS15蛋白质的核酸的降低的表达而引起,其中所述MADS15蛋白质 的氨基酸序列包含任何一种或多种以下基序:SEQ ID NO:114、 SEQ ID NO:115、 SEQIDNO:116、 SEQIDNO:117。
72. 根据权利要求65、 69或71的转基因植物,或来自所述转基因植 物的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
73.根据权利要求72的植物的可收获部分,其中所述可收获部分优 选是种子。获部分的产物。÷
74.
75. 编码MADS15的核酸用于增强植物中产量相关性状的用途,其 中所述MADS15蛋白质的氨基酸序列包含任何一种或多种以下基序:SEQ IDNO:114、 SEQIDNO:115、 SEQIDNO:116、 SEQIDNO:117。
76. 根据权利要求75的用途,其中所述增强的产量相关性状包含增 加的种子产量。
77. 用于相对于合适的对照植物增加植物产量的方法,其包括增加编 码PLT转录因子多肽的核酸在植物中的表达,和任选地选择具有增加的产 量的植物。
78. 用于相对于对照植物增加植物中非生物胁迫抗性的方法,其包括 增加编码PLT转录因子多肽的核酸在植物中的表达,和任选地选择具有增 加的非生物胁迫抗性的植物。
79. 根据权利要求78的方法,其中所述增加的非生物胁迫抗性是相 对于对照植物增加的营养摄取效率。
80. 根据权利要求77至79任一项的方法,其中通过导入并在植物、 植物部分或植物细胞中表达编码PLT转录因子多肽的核酸来实现所述增 口的表达。
81. 根据权利要求80的方法,其中所述编码PLT转录因子的核酸是 在表l中给出的任何一种核酸SEQ ID NO或其部分或是能够与在表l中 给出的任何一种核酸SEQ ID NO杂交的序列。
82. 根据权利要求80的方法,其中所述编码PLT转录因子的核酸编 码在表D中给出的任一核酸SEQIDNO的直向同源物或旁系同源物。
83. 根据权利要求77、 80、 81和82任一项的方法,其中所述增加的 产量是增加的种子产量。
84. 根据权利要求83的方法,其中所述种子产量选自以下一种或多 种:a)增加的种子生物量;b)增加的每林植物花数;c)增加的(饱满)种子数; d)增加的种子饱满率;e)增加的收获指数;f)增加的千粒重(TKW); g)增 加的种子面积;h)增加的种子长度;和i)增加的种子宽度。
85. 根据权利要求80至84任一项的方法,其中所述核酸有效连接组 成型启动子、优选GOS2启动子。
86. 根据权利要求80至84任一项的方法,其中所述编码PLT转录 因子多肽的核酸是植物来源的,优选来自双子叶植物,还优选来自十字花 科,更优选来自拟南芥属,最优选来自拟南芥。
87. 通过根据权利要求77至86任一项的方法可获得的植物或其部 分,包括种子,其中所述植物或其部分包含编码PLT转录因子多肽的核酸, 其中所述核酸有效连接组成型启动子。
88. 构建体,其包含:(i) 编码PLT转录因子多肽的核酸;(ii) 能够驱动(i)的核酸序列表达的一种或多种调控序列;和任选地(iii) 转录终止序列。
89. 根据权利要求88的构建体,其中所述组成型启动子是GOS2启 动子。
90. 根据权利要求88或89的构建体的用途,用于产生相对于对照植 物具有增加的产量、尤其增加的种子产量和/或增加的非生物胁迫抗性的植 物。
91. 用根据权利要求88或89的构建体转化的植物、植物部分或植物 细胞。
92. 用于产生转基因植物的方法,所述转基因植物具有增加的产量和 /或增加的非生物胁迫抗性,其中所述方法包括:(i) 导入并在植物细胞中表达编码PLT转录因子多肽的核酸;和(ii) 在促进植物生长和发育的条件下培育植物细胞。
93. 相对于对照植物具有增加的产量和/或增加的非生物胁迫抗性的转基因植物或来自所述转基因植物的植物细胞,所述增加的产量和/或增加的非生物胁迫抗性由编码PLT转录因子多肽的核酸的增加的表达产生。
94. 根据权利要求87、 91或93的转基因植物,或来自所述转基因植 物的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,如 稻、玉米、小麦、大麦、栗、黑麦、黑小麦、高粱和燕麦。
95. 根据权利要求94的植物的可收获部分,其中所述可收获部分优 选是种子。获部分的产物。
96 image see original document page 11
97. 编码PLT转录因子多肽的核酸的用途,或PLT转录因子多肽的 用途,用于相对于对照植物增加非生物胁迫抗性和/或用于提高植物产量、 尤其种子产量。
98. 用于增强植物中产量相关性状的方法,其包含调节植物中编码 bHLH转录因子的核酸的表达,其中所述bHLH转录因子由SEQ ID NO 213、 SEQ ID NO 215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO 225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种或前述任一 种的直向同源物或旁系同源物代表。
99. 根据权利要求98的方法,其中所述受调节的表达通过T-DNA激 活标签、TILLING或同源重组的任何一种或多种方法实现。
100. 根据权利要求98的方法,其中所述受调节的表达通过导入并在 植物中表达编码bHLH转录因子的核酸实现,其中所述bHLH转录因子由 SEQ ID NO 213、 SEQ ID NO 215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO 225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的 任一种或前述SEQ ID NO任一种的直向同源物或旁系同源物代表。
101. 才艮据外又利要求98至100任一项的方法,其中所述增强的产量相 关性状是早期萌发势。
102. 根据才又利要求100的方法,其中所述核酸有效连接组成型启动子、 优选GOS2启动子。
103. 根据权利要求100至102任一项的方法,其中所述核酸是根据 SEQIDNO:212、 SEQ ID NO:214、 SEQ ID NO:216、 SEQ ID NO:218、 SEQIDNO:220、 SEQIDNO:222、 SEQ ID NO:224、 SEQ ID NO:226和 SEQIDNO:228、 SEQIDNO:296、 SEQ ID NO:298、 SEQ ID NO:300的 任一种核酸序列的部分或等位变体或剪接变体或能够与根据SEQ ID NO:212、 SEQIDNO:214、 SEQ ID NO:216、 SEQ ID NO:218、 SEQ ID NO:220、 SEQIDNO:222、 SEQIDNO:224、 SEQ ID NO:226和SEQ ID NO:228、 SEQ ID NO:296、 SEQIDNO:298、 SEQ ID NO:300的任一种的 核酸序列杂交的序列,其中所述部分、等位变体、剪接变体或杂交序列编 码bHLH转录因子。
104. 根据权利要求98至103任一项的方法,其中所述编码bHLH转 录因子的核酸是;f直物来源的,优选来自单子叶植物,还优选来自禾本科, 更优选来自稻属,最优选来自稻。
105. 通过根据权利要求98至104任一项的方法可获得的植物或其部 分,包括种子,其中所述植物或其部分包舍编码bHLH转录因子的核酸。
106. 分离的多肽,其包含:(i) 由SEQ ID NO:297、 SEQ ID NO:299和SEQ ID NO:301的任一种所代表的氨基酸序列;(ii) 氨基酸序列,其(a)以递增优选顺序与由SEQIDNO:297、 SEQ ID NO:299和SEQ ID NO:301代表的任何一种氨基酸序列具有至少50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%或更高的序列同一性,和(b)具有bHLH结构域;(iii) 在以上(i)或(ii)中给出的任一氨基,列的衍生物。
107. 分离的核酸分子,其包含:(i) 由SEQ ID NO:296、 SEQ ID NO:298和SEQ ID NO:300的任一种所代表的核酸;(ii) 由SEQ ID NO:296、 SEQ ID NO:298和SEQ ID NO:300的任一种 所代表的核酸的互补序列;(iii)编码bHLH转录因子的核酸,所述bHLH转录因子(a)以递增优 选的顺序与由SEQ ID NO:297、 SEQ ID NO:299和SEQ ID NO:301的任 何一种所代表的氨基酸序列具有至少50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%或更高的序列同一性, 并具有(b)bHLH结构域。
108. 构建体,其包含:(a) 编码bHLH转录因子的核酸,所述bHLH转录因子由SEQ ID NO 213、 SEQ ID NO 215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO 225、 SEQIDNO:297、 SEQIDNO:299、 SEQ ID NO:301的任一种或任一前述 SEQ ID NO的直向同源物或旁系同源物代表;(b) 能够驱动(a)的核酸序列表达的一种或多种调控序列;和任选地(c) 转录终止序列。
109. 根据^5C利要求108的构建体,其中所述一种或多种调控序列至少 是组成型启动子,优选GOS2启动子。
110. 根据^l利要求108或109的构建体的用途,用于产生相对于对照 植物具有增强的产量相关性状、尤其增强的早期萌发势的植物。
111. 用根据权利要求108或109的构建体转化的植物、植物部分或植 物细胞。
112. 用于产生相对于对照植物具有增强的产量相关性状的转基因植 物的方法,所述方法包括:(a) 导入并在植物中表达编码bHLH转录因子的核酸,所述bHLH转 录因子由SEQ ID NO 213、 SEQ ID NO 215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO 225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种或任一前述SEQ ID NO的直向同源物或旁系同源物代 表;和(b) 在促进植物生长和发育的条件下培育植物细胞。
113. 相对于对照植物具有增加的产量的转基因植物,或来自所述转基 因植物的转基因植物细胞,所述增加的产量由编码bHLH转录因子的核酸的增加的表达产生,其中所述bHLH转录因子由SEQ ID NO 213、 SEQ ID NO 215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO 225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种或任一前述SEQ ID NO的直向同源物或旁系同源物代表。
114. 根据权利要求105、 111或113的转基因植物,或来自所述转基 因植物的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物, 如稻、玉米、小麦、大麦、栗、黑麦、黑小麦、高粱和燕麦。
115. 根据权利要求114的植物的可收获部分,其中所述可收获部分优 选是种子。收获部分的产物。
116.根据权利要求114的植物和/或根据权利要求115的植物的收获部分的产物。
117. 编码bHLH转录因子的核酸在增强植物中产量相关性状中的用 途,其中所述bHLH转录因子由SEQIDN0 213、 SEQ ID NO 215、 SEQ IDNO:217、 SEQIDNO:219、 SEQ ID NO 225、 SEQIDNO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种或任一前述SEQ ID NO的直向同源物或旁系同源物代表。
118. 根据权利要求117的用途,其中所述增强的产量相关性状是早期萌发势。
119. 用于相对于合适的对照植物增加植物中产量的方法,其包括增加 编码SPL15转录因子多肽的核酸在植物中的表达,和任选地选择具有增加 的产量的植物。
120. 根据权利要求119的方法,其中通过T-DNA激活、TILLING、 位点定向诱变、定向进化和同源重组的任何一种或多种方法实现所述增加 的表达。
121. 根据权利要求119的方法,其中通过导入并在植物中表达编码 SPL15转录因子多肽的核酸实现所述增加的表达。
122. 根据权利要求121的方法,其中所述编码SPL15转录因子的核酸 是在表N中给出的任何一种核酸SEQ ID NO或其部分,或是能够与在表N中给出的任何一种核酸SEQ ID NO杂交的序列。
123. 根据权利要求121的方法,其中所述编码SPL15转录因子的核酸 编码在表N中给出的任一核酸SEQ ID NO的直向同源物或旁系同源物。
124. 根据权利要求119至123任一项的方法,其中所述增加的产量是 增加的种子产量。
125. 权利要求124的方法,其中所述增加的种子产量包含下列一种或 多种:a)增加的地上部分生物量b)增加的每林植物花数;c)增加的种子产 量;d)增加的(饱满)种子数;e)增加的千粒重(TKW);和f)增加的收获指数。
126. 根据权利要求121至125任一项的方法,其中所述核酸有效连接 组成型启动子,优选连接HMGB (高速泳动族B)启动子或GOS2启动子, 进一步优选地连4妾稻HMGB启动子或稻GOS2启动子。
127. 才艮据4又利要求121至126任一项的方法,其中所述编码SPL15 转录因子多肽的核酸是植物来源的,优选来自双子叶植物,进一步优选来 自十字花科,最优选来自拟南芥。
128. 通过^^艮据权利要求119至127任一项的方法可获得的植物或其部 分,包括种子,其中所述植物或其部分包含编码SPL15转录因子的重组核 酸。
129. 构建体,其包含:(a) 编码SPL1S转录因子多肽的核酸;(b) 能够驱动(a)的核酸序列表达的一种或多种调控序列;和任选地(c) 转录终止序列。
130. 根据权利要求129的构建体,其中所迷一种或多种调控序列至少 是组成型启动子,优选HMGB启动子或GOS2启动子。
131. 根据权利要求129或130的构建体的用途,用于产生相对于对照 植物具有增加的产量的植物。
132. 用根据权利要求129或130的构建体转化的植物、植物部分或植 物细月包。
133. 用于产生相对于对照植物具有增加的产量的转基因植物的方法, 所述方法包4舌:(a) 导入并在植物细胞中表达编码SPL15转录因子多肽的核酸;和(b) 在促进植物生长和发育的条件下培育植物细胞。
134. 相对于对照植物具有增加的产量的转基因植物,所述增加的产量 由编码SPL15转录因子的核酸的增加的表达产生。
135. 根据权利要求128、 132或134的转基因植物,或来自所述转基 因植物的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物, 如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
136. 才艮据权利要求135的植物的可收获部分,其中所述可收获部分优 选是种子。
137. 来自根据权利要求135的植物和/或根据权利要求136的植物的可 收获部分的产物。
138. 编码SPL15转录因子多肽的核酸的用途,用于相对于对照植物增 加植物中的产量。
139. 根据权利要求138的用途,其中所述增加的产量是增加的种子产量。

说明书全文

具有增强的产量相关性状的植物和用于产生该植物的方法

发明一般地涉及分子生物学领域并涉及用于通过调节编码GRP(生

长相关蛋白)的核酸在植物中表达而改进多种植物生长特征的方法。本发明

还涉及具有编码GRP的核酸的受调节表达的植物,其中所述植物相对于 对应野生型植物或其它对照植物具有改良的生长特征。本发明还提供用于 本发明方法中的构建体。

持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效 率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受 欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一 般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,其可 能不总是导致从亲代植物中传递的所希望性状。分子生物学进展已经允许 人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物 质(一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类 技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能

具有特殊经济意义的性状是增加的产量。产量通常定义为来自作物的 经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量 直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、 种子产生、叶衰老等。根发育、养分摄入量、胁迫耐受性和早期萌发势(early vigor)也可以是决定产量的重要因素。优化前述因素因而可以对增加作物 产量有贡献。

种子产量是特别重要的性状,因为众多植物的种子对人与动物营养是 重要的。作物如玉米、稻、小麦、油菜和大豆占超过一半的人类总热量摄 入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用众多类型代谢物的来源。种子含有 胚(新苗和新根的起源)和胚乳(萌发期间及幼苗早期生长期间用于胚生长的 营养来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正 在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们 合成为贮藏大分子以灌满籽粒。

对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现 代稻育种计划在温带和热带稻品种上的重要目标。长根在栽稻中对于正 确土壤固定是重要的。在将稻直接播种至被淹没田地的情况下,以及在植 物必须从水中迅速出苗的情况下,较长的苗与萌发势相关。在实施条播的 情况下,较长的中胚轴和胚芽鞘对于良好出苗是重要的。将早期萌发势人 工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发

势已经限制了基于玉米带种质(Corn Belt germplasm)的玉米(Zea mayes L.)

杂种在欧洲大西洋地区的引种。

又一个重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围 作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过 50。/。(Wang等、Planta (2003) 218:1-14)。非生物胁迫可以由干旱、盐度、 极端温度、化学毒性和化胁迫引起。提高植物对非生物胁迫耐受性的能 力将在世界范围对农民是极大经济优势并且会允许在不利条件期间及在作 物栽培否则是不可能的陆地上栽培作物。

作物产量因而可以通过优化前述因素之一而增加。

取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。 例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部 分可能是希望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数 可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其它参 数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增 加的种子大小或是增加的种子数目。

增加植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植 物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号途径。

现已发现可以通过调节植物中的编码GRP(生长相关蛋白)的核酸在植

物中表达而改进植物中的多种生长特征。GRP可以是如下蛋白之一: MADS盒转录因子(OsMADS15)、 PLT转录因子、bHLH转录因子、SPL15 转录因子和耐盐蛋白(HAL3)。 背景

耐盐蛋白

细胞中的众多酶过程需要辅酶A(CoA或CoASH)的参与。辅酶 A(CoASH)本身是高度极性的分子,由与t磷酸泛酸(4-phosphopantethenic acid)(维生素B5)连接并因此与(5-巯基乙胺连接的腺苷3',5,-二磷酸构成。 游离SH基可以被酯化,这取决于CoA参与的过程。已经在细菌、动物和 植物中阐明CoA合成的途径。在植物中,CoA前体4'-磷酸泛酰半胱酸 (PPC)至4'-磷酸泛酰巯基乙胺的转化由黄素蛋白4'-磷酸泛酰半胱氨酸脱羧 酶(PPCDC或HAL3, Kupke等J. Biol. Chem. 276, 191卯-19196, 2001)催 化。编码HAL3蛋白质的基因可以是一个小基因家族的部分:拟南芥 (Arabidopsis)基因组包含2个同种型(AtHAL3a和AtHAL3b ; Espinoza-Ruiz等Plant J. 20, 529-539, 1999),在烟草中存在3种HAL3基 因(Yonamine等丄Exp. Bot. 55, 387-395, 2004),而在稻中HAL3是单拷贝 基因。有人提出AtHAL3和其它HAL3蛋白质作为三聚体发挥作用,每个 单体具有结合的黄素单核苷酸(FMN)(Albert等Structure 8, %1-%9, 2000)。推测FMN辅因子在产生4'-磷酸泛酰巯基乙胺的氧化还原反应中 发挥作用。

然而HAL3蛋白质的分子功能没有得到充分阐述。HAL3蛋白质显示 与涉及耐盐性酵母SIS2蛋白质(Ferrando等,Mol. Cell. Biol. 15, 5470-5481)的同源性。异位表达HAL3的植物或植物细胞显示改进的盐、 渗透压或锂胁迫耐受性(Espinoza-Ruiz等,1999; Yonamine等,2004)。报 道称BY2细胞中的烟草HAL3a过量表达导致胞内脯氨酸含量增加,这可 能对耐盐表型有贡献(Yonamine等,2004)。此外,过量表达AtHAL3a的拟南芥植物比野生型植物表现更快的生长速率(Espinoza-Riiiz等,1999)。 证实AtHAL3b蛋白质与细胞周期蛋白CDKB1:1相互作用(WO 00/36124), 因而推测AtHAL3b对于赋予植物盐胁迫耐受性并对于盐胁迫条件下增加 植物生长速率有用。现已惊奇地发现优先增加编码HAL3多肽的核酸在扩 展组织中表达产生了相对于对照植物而具有增加的产量的植物,其中所述 产量增加与对照植物相比至少是10%。

转录因子

转录因子通常定义为与顺式调节元件(例如增强子,TATA盒)结合并 且与RNA聚合酶结合下能够激活和/或抑制转录的蛋白质。拟南芥基因组 编码至少1533种转录调节物,这占其估计基因总数的〜5.9Vo(Riechmaim 等,2000 (Science笫290巻,2105-2109))。

MADS 15

MADS盒基因构成参与酵母、植物和动物发育的多个方面的真核转录 调节物的大基因家族。MADS盒基因编码负责与其靶基因调节区中特定盒 的DNA结合作用的强烈保守的MADS结构域。该基因家族可以划分成两 个主要系,I型和II型。II型基因又名MIKC型蛋白质,指它们拥有的以 下4个功能性结构域(图5, (Jack,PlantMol.Biol. 46,515-520, 2001)):

用于DNA结合的MADS,约60个氨基酸(高度保守),位于蛋白质的 氨基末端;

间插结构域I(保守性较低),参与MAI)S 二聚体的选择性形成; 蛋白结构域K(很保守),负责二聚化;

羧基端区C(序列和长度可变),参与转录激活或参与形成多聚转录因 子复合体

已经在拟南芥中鉴定超过100个MADS盒基因,并且已经将它们以系 统发生方式归类成12种进化枝,每种进化枝具有与MADS共有序列的特 定偏离(Thiessen等J Mol. Evol. 43, 484-516, 1996). OsMADS15属于 SQUA进化枝(就SQUAMOSA而言,其来自金鱼草(Antirrhinum majus))。参考由Coen和Meyerowitz在1991年提出的ABC花器官身份特化模型(Nature 353, 31-7)而将SQUA进化枝的基因归类为A功能器官 身份基因。除OsMADS15之外,稻OsMADS14、OsMADS18和OsMADS20 也是SQUA进化枝的部分。

SQUA进化枝在双子叶植物被细分成2个亚组,即API和FUL亚进 化枝(在其中OsMADS15聚簇)。这些亚进化枝基本上在它们各自蛋白质的 羧基端处的特定氨基酸基序上是趋异的(Litt和Irish, Genetics 165, 821-833, 2003)。除了存在特定的API氨基酸基序之外,双子叶植物API进化枝相 关性蛋白质通常在其羧基端包含法尼基化基序(这个基序是CAAX,其中C 是半胱氨酸,A通常是脂族氨基酸并且X是曱硫氨酸、谷氨酰胺、丝氨酸、 半胱氨酸或丙氨酸)。在单子叶植物中,SQUA进化枝蛋白质被细分成两个 主要的组,其可以基于该蛋白质最后15个氨基酸范围内的保守羧基端基序 区分:LPPWMLS(例如OsMADS15、 SEQ ID NO:117)和LPPWMLR (例 如OsMADS18)。与SQUA进化枝的双子叶植物序列相反,SQUA进化枝 的单子叶植物序列在其羧基端没有法尼基化基序。

推测OsMADS15与其它蛋白质复合发挥作用以控制器官形成。然而, 迄今没有鉴定到具有可见表型的突变体;除在WO 01/14559 (EP1209232, US6,995,302)中提供的数据之外,没有提供涉及OsMADS15的异位表达或 下调表达的实-验数据。在本公开中,以有义方向表达OsMADS15的转基 因荞麦(Fagopyrum esculentum)才直物显示增力口的分才支,而表达反义构建体 的转基因植物具有减少的生长和受抑制的分枝。用有义构建体转化的大叶 落地生根(Kalanchog daigremontiana)在根周围存在叶发育,这被视为分 枝增加的指标。作者声称就花发育和这些花的结构而言没有观察到变化。 OsMADS15在拟南芥中的直向同源物是无APETALA1 (AP1)。 API的异 位表达导致开花时间减少,并且API突变体显示延迟的开花并具有异常 花。

PLT

AP2(apetala2)/ERF(乙烯应答性应答元件结合因子)家族包含了具有至 少一个高度保守性DNA结合结构域-AP2结构域的转录因子。AP2结构域最初在APETALA2 (AP2)(—种参与发育程序如分生组织身份调节和花器 官特化的拟南芥蛋白质(Jofuku等,(1994) Plant Cell 6, 1211-1225))中描述。 将AP2/ERF蛋白质基于它们是否含有一个(ERF亚家族)或2个(AP2亚家 族)DNA结合结构域而划分成亚家族(图12)。已经在拟南芥(Arabidopsis thaliana)基因组中鉴定到超过140种AP2/ERF基因(Reichmann等(2000) Science 2卯:2105-2110),其中高达18种AP2/ERF基因属于AP2亚家族 (Kim等(2006) Mol Bio Evol 23(1): 107-120)。

已经^正实由Plethora 1 (PLT1)和Plethora 2 (PLT2)基因(统称为PLT 基因)编码的两种拟南芥AP2亚家族转录因子多肽对于干细胞特别在根分 生组织中的特化及维持是必需的。在RT-PCR分析中,PLT转录物主要在 根内检测到,表明PLT表达与根身份密切相关。在拟南芥胚内的异位性 PLT表达诱导顶端域同源异型转换成根干细胞、根或下胚轴(Aida等(2004) Cell 119:109-120)。

美国专利申请2004/0045049和国际专利申请WO03/013227提供了编 码拟南芥PLT1转录因子(在该申请中称作G1793)的核酸序列。与野生型 对照相比,报道称G1793(使用CaMV 35S启动子)在拟南芥中的过量表达 导致子叶形态改变、植物整体尺寸轻微减少和瘦花序(可能具有异常花)。 G1793过量表达者比对照植物产生更多的种子油。提供了编码潜在的大豆 (Glycine max)直向同源物、稻(Oryza sativa)直向同源物和玉蜀黍(Zea mays) 直向同源物的核,列。

国际专利申请WO 03/002751提供了编码PLT多肽的大豆核酸序列, 其与通过基因概括分析(由DNA微阵列)鉴定的玉米核酸序列具有序列相 似性。

国际专利申请WO 05/075655提供与拟南芥PLT基因具有序列相似 性的稻及玉蜀黍核酸序列。 b肌H

性/螺旋-环-螺旋(bHLH)蛋白质是作为二聚体与特定DNA靶位点 结合并且已经在非植物性真核生物中充分表征为多种生物学过程中重要调节成分的转录因子超家族。bHLH家族的区别性特征是由大约60个氨基酸 构成的二分结构域。这种二分结构域由与共有的六核苷酸E盒相结合的 DNA结合基本区域和与由可变环区隔开的两个a-螺旋构成。所述两个a-螺旋促进二聚化,允许不同家族成员间形成同二聚体和异二聚体。尽管 bHLH结构域是进化保守的,然而除这个结构域之外,进化枝之间存在4艮 少序列相似性。

Bailey等,2003 (The Plant Cell,第15巻,2497-2501)报道在拟南芥中 检测到的bHLH基因总数是162种,这使得bHLH基因成为拟南芥中最 大的转录因子家族;报道称稻基因组含有131种bHLH基因(Buck和 Atchley, 2003 (J. Mol. E第56巻:742-750))。 Hdm等,2003 (Mol. Biol. E第 20巻(5):735-747)从拟南芥中基于结构相似性鉴定了 bHLH基因的12个 亚家族。

报道称已经表征的来自植物的bHLH蛋白质在花色素苷生物合成、植 物光敏素信号作用、球蛋白表达、果实开裂、心皮及表皮发育中有作用(Buck 和Atchley, 2003)。

SPL

鳞部启动子结合蛋白样(SPL)转录因子多肽是共有长度约80个氨基酸 残基的高度保守性DNA结合结构域(DBD)的结构多样的蛋白质(Kldn等 (1996) Mol Gen Genet 259: 7-16; Cardon等(1999) Gene 237:91-104)。 革巴基因启动子内的SPL转录因子DNA共有序列结合位点是 5,-TNCGTACAA-3,,其中N代表任意碱基。在SPL DBD内部存在10个 保守的半胱氨酸(Cys)或组氨酸(His)残基(见图23),其中8个残基是结合 对于SPL特异性锌指三级结构形成所必需的2个锌离子的锌配位残基 (Yamasaki等(2004) J Mol Biol 337: 49-63)。 SPL DBD内的第二个保守性 特征是二分核定位信号。在DBD之外,在整个植物界内大多数编码SPL 转录因子多肽的核酸序列中找到 一个微RNA(miRNA)輩巴基序(miRl56)(在 编码区中或在3, UTR)(Rhoades等(2002) Cell 110: 513-520)。 miRNA通 过引导编码SPL的mRNA降解或通过翻译抑制以转录后方式调控SPL基因表达。

Riechmami等(Science 290: 2105-2109, 2000)报道了拟南芥中的16种 SPL转录因子多肽,它们自身之间的序列相似性很低(除了前述特征之外), 推导的SPL多肽的大小是131-927个氨基酸。不过,在这种植物的SPL家 族中检测到共有更高序列同源性的SPL转录因子多肽对(Cardon等 (1999))。

已经证实迄今表征的SPL转录因子多肽(仅存在于植物中)在植物发 育、尤其在花发育中发挥作用。报道称过量表达SPL3转录因子多肽的转 基因植物开花更早(Cardon等(1997) Plant J 12: 367-377)。

在欧洲专利申请EP1033405中,提供了 SPL15转录因子多肽的核酸 序列和推导的多肽序列。

在国际专利申请WO03013227中,提供了核酸序列(和推导的多肽序 列;内部参考号G2346),其编码SPL15转录因子多肽的部分,然而距离 SPL15转录因子的羧基末端38个氨基酸。组成型过量表达修饰的SPL15 转录因子(或G2346)多肽的转基因拟南芥植物具有轻微扩大的子叶。在发 育晚期,报道称这种植物没有显示与对照植物一致的差异。 发明简述

现已惊奇地发现优先增加编码HAL3多肽的核酸在扩张组织中表达产 生了相对于对照植物具有增强的产量相关性状、尤其增加的早期萌发势和 增加的种子产量的植物,其中种子产量增加与对照植物相比至少是10%。

根据本发明的另 一个实施方案,提供相对于对照植物增强产量相关性 状、尤其增加才直物早期萌发势和增加植物的种子产量的方法,其包括优先 增加编码HAL3多肽的核酸在植物扩张组织中的表达。

现已惊奇地发现调节编码MADS15多肽的核酸的表达产生了相对于 对照植物具有增强的产量相关性状、尤其增加的产量的植物。

根据一个实施方案,提供相对于对照植物增加植物产量的方法,其包 括增加编码MADS15多肽的核酸在植物中表达。增加的产量包含增加的营 养性生物量,4旦不包含增加的种子产量。根据另一个实施方案,本发明提供相对于对照植物增加植物产量的方

法,包括降低内源性MADS15多肽的水平和/或活性。增加的产量包含更 高的种子产量,^L不包含增加的营养性生物量。

现已惊奇地发现增加编码PLT转录因子多肽的核酸表达产生了相对 于对照植物具有增强的产量相关性状、尤其增加的产量的植物。

根据又一个实施方案,提供相对于对照植物增加植物产量的方法,包 括增加编码PLT转录因子多肽的核酸在植物中的表达。

的表达产生了相对于对照植物具有增强的产量相关性状的植物。适于增强 植物中产量相关性状的特定类的bHLH转录因子在下文详细描述。

才艮据又一个实施方案,本发明提供相对于对照植物增强植物中产量相 关性状的方法,包括调节编码特定类的bHLH转录因子的核酸在植物中的 表达。

现已惊奇地发现增加编码SPL15转录因子多肽的核酸在植物中的表达 产生了相对于对照植物具有增强的产量相关性状、尤其增加的产量的植物。

根据又一个实施方案,本发明提供相对于对照植物增加植物中产量的 方法,包括增加编码SPL15转录因子多肽的核酸在植物中的表达。 定义

多肽/蛋白质

术语"多肽"和"蛋白质"在本文中可互换使用并且指处于任意长度聚合 形式中的氨基酸。

多核苷*核^V核酸序列/核苷酸序列

术语"多核苷酸"、"核酸序列"、"核苷酸序列"、"核酸"在本文中可互 换使用并且指处于任意长度聚合形式中的核苷酸,即核糖核苷酸或脱氧核 糖核苷酸或这二者组合。

对照植物

选择合适的对照植物是实验设置的惯用部分并且可以包括对应的野生 型植物或无目的基因的对应植物。对照植物一般是与待评估植物相同的植物物种或甚至是相同的变种。对照植物也可以是待评估植物的失效合子。 如本文中所用的"对照植物"不仅指整林植物,还指植物部分,包括种子及 种子部分。 同源物

蛋白质的"同源物"包括这样的肽、寡肽、多肽、蛋白质及酶,它们相 对于非修饰的上述蛋白质具有氨基酸置换、缺失和/或插入并且与所述肽、 寡肽、多肽、蛋白质及酶来源的非修饰蛋白质具有相似生物学活性和功能 活性。

缺失指从蛋白质中移除一个或多个氨基酸。

插入指一个或多个氨基酸残基在蛋白质中预定位点内的导入。插入可 以包含单个或多个氨基酸的氨基端融合和/或羧基端融合以及序列内插入。

通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合更小,约i-io

个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交 系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组

氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢 叶酸还原酶、Tag'lOO表位、 c-myc 表位、FLAG⑧-表位、lacZ、 CMP(4丐 调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。

置换指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏 a-螺旋结构或P-折叠结构的倾向)的其它氨基酸替换蛋白质的氨基酸。氨基 酸置换一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功 能性约束;插入通常会是约l-10个氨基酸残基级别。氨基酸置换优选地是 保守性氨基酸置换。保守性置换表是本领域众所周知的(见例如 Creighton(1984) Proteins. W.H. Freeman and Company和下表1)。

表l:保守性氨基酸置换的实例

table see original document page 26

A
table see original document page 27

氨基酸置换、缺失和/或插入可以使用本领域众所周知的肽合成技术如

固相肽合成法等或通过重组DNA操作而轻易地进行。用于操作DNA序列 以产生蛋白质的置换、插入或缺失变体的方法是本领域众所周知的。例如, 用于在DNA中的预定位点处产生置换突变的技术是本领域技术人员众所 周知的并且包4舌M13诱变法、T7-Gen体外诱变法(USB, Clevdaand, OH)、 QuickChange位点定向诱变法(Stratagene, San Diego, CA)、 PCR-介导的 位点定向诱变或其它位点定向诱变法。 衍生物

"衍生物"包括这样的肽、寡肽、多肽,其中与天然存在形式的蛋白质(如 目的蛋白)的氨基酸序列相比,它们包含以非天然存在的氨基酸残基对氨基 酸的置换或非天然存在的氨基酸残基的添加。蛋白质的"衍生物"也包含这 样的肽、寡肽、多肽,其中与多肽的天然存在形式的氨基酸序列相比,它 们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、 硫酸盐化等)氨基酸残基或非天然的改变氨基酸残基。与衍生物所来源的氨 基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合 的一个或多个非氨基酸取代基或添加(例如报道分子或其它配体),如为促 进检测该衍生物而结合的报道分子,和与天然存在的蛋白质的氨基酸序列 相对比的非天然存在的氨基酸残基。

直向同源物/旁系同源物

直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因,而直向同源物是来自 不同生物的起源于物种形成的基因。 结构域

术语,,结构域"指沿进化相关蛋白质的序列比对结果而在特定位置处保 守的一组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动,然 而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能 方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列 中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽 是否属于先前已鉴定的多肽家族。

基序/共有序列/标签

术语"基序"或"共有序列"或"标签"指在进化相关蛋白质的序列中的短 保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的 部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域 之外)。

杂交

如本文中所定义的术语"杂交"是其中基本上同源的互补核苷酸序列相 互复性的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处 于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖

(Sepharose )珠或任何其他树脂的情况下发生。杂交过程也可以在互补性 核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平 版印刷术固定至例如酸玻璃支持物(后者称作核酸阵列或微阵列或称作 核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学

级结构。

术语"严格性"指在其中发生杂交的条件。杂交的严格性受条件如温度、 盐浓度、离子强度和杂交緩冲液组成影响。通常,将低严格性条件选择为 在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30。C。中等严 格性条件是此时温度低于Tm约20。C并且高严格性条件是此时温度低于Tm约10°C。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相 似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并 性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条 件以鉴定此类核酸分子。

Tm是在确定的离子强度及pH时的温度,在所述温度下50%的靶序 列与完全匹配的一笨针杂交。Tm取决于溶液条件和探针的碱基组成及长度。 例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16。C直至 32。C获得最大杂交速率。 一价阳离子在溶液中的存在降低了两条核酸链间 的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度 是明显的(对于更高浓度,这种效应可以忽略)。曱酰胺降低DNA-DNA和 DNA-RNA双链体的解链温度,每百分数曱酰胺降低0.6-0.7。C,并且添加 50%曱酰胺允许在30-45°C进行杂交,虽然杂交速率会降低。碱基对错配 降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说, 每%碱基错配Tm下降约1。C。取决于杂交分子的类型,Tm可以使用下 列等式计算:

1) DNA-DNA杂交分子(Meinkoth和Wahl, Anal. Biochem., 138: 267-284, 1984):

Tm= 81.5。C + 16.6xloglO【Na+ja + 0.41x%【G/Cbl — 500x【Lc卜l — 0,61x%甲酰胺

2) DNA-RNA或RNA-RNA杂交分子

Tm= 79.8 + 18.5(loglO[Na+ja)+ 0.58(%G/Cb)+ 11.8(%G/Cb)2胃 820/Lc

3) 寡DNA或寡RNAd杂交分子: 对于<20个核苷酸:Tnv=2(ln)

对于20-35个核苷酸:Tm= 22+1.46(ln)

a或对于其它一价阳离子,但是仅在0.01-0.4 M范围内是精确的。 b仅对于。/oGC在30%-75%范围内是精确的。 c L =双链体的长度(以碱基对计)。说 dOligo,寡核苷酸;ln,引物的有效长度-2x(G/C数)+(A/T数)。

可以众多已知技术的任何一种控制非特异性结合,例如用含蛋白质的 溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交緩冲液并且 用RNA酶处理。对于非同源性探针, 一系列杂交可以通过改变以下条件 之一进行:(i)渐进地降低复性温度(例如从68。C至42。C)或(ii)渐进地降低 甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和 将维持或改变严格性条件的多种参数。

除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除 去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关 键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越 高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格 性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂 交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更 严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或 改变严格性条件的多种参数。

例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂 交条件包括在65。C于lxSSC中或在42。C于lxSSC和50%曱酰胺中杂 交,随后在65°C于0.3xSSC中洗涤。用于长度大于50个核苷酸的DNA 杂交分子的中等严格性杂交条件的实例包括在55°C于4xSSC中或在40。C 于6xSSC和50。/。甲酰胺中杂交,随后在50。C于2xSSC中洗涤。杂交分 子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比

NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含 5xDenhardt试剂、0.5-1.0%SDS、 100 jig/ml变性的片段化鲑精DNA、 0.5% 焦磷酸钠。

为了定义严格性水平的目的,可以参考Sambrook等(2001) Molecular Cloning: a laboratory manual, 第三版Cold Spring Harbor Laboratory Press, CSH, New York或参考Current Protocols in Molecular Biology,John Wiley & Sons, N.Y.(1989和每年更新版本)。 剪接变体

如本文中所用的术语"剪接变体"包含其中已经切除、替换、移位或添 加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变 体。此类变体将是其中基本上保留了蛋白质的生物学活性的一种变体;这 可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自 然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领

^戈众所周知的(见例如Foissac和Schiex, BMC Bioinformatics. 2005; 6: 25)。

等位变体

等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。 等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。 INDEL的尺寸通常小于100bp。 SNP和INDEL形成在大部分生物的天然 存在性多态性林系中序列变体的最大集合。

基因改组/定向进化

基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或 选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体 (Castle等,(2004) Science 304(5674):1151-4;美国专利5,811,238和 6,395,547)。

调节元件/调控序列/启动子

术语"调节元件"、"调控序列,,和"启动子,,均在本文中可互换使用并且

在广义上意指能够实现与之连接的序列表达的调节性核酸序列。术语"启动 子,,一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其它蛋 白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从典 型的真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没

或以組织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增 强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35盒序列和/或-10盒转录调节序列。术语"调节元件,,也包 含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分 子或衍生物。

"植物启动子"包含介导编码序列区段在植物细胞中表达的调节元件。 因此,植物启动子不需要是植物来源的,而是可以源自病毒或微生物,例 如来自侵袭植物细胞的病毒。"植物启动子,,也可以源自植物细胞,例如来 自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这 也适用于其它"植物"调节性信号,如"植物"终止子。用于本发明方法中的 核苷酸序列的启动子上游可以由一个或多个核苦酸置换、插入和/或缺失而

受到修饰,但不干扰启动子、可读框(ORF)或3'调节区如终止子或远离ORF 的其它3'调节区的功能性或活性。启动子的活性还有可能因^务饰该启动子 的序列或由更活跃的启动子、甚至来自异源生物的启动子彻底替换该启动 子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含 合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达 模式表达基因。

为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可 以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织 的表达水平和才莫式而进行分析。合适的公知报道基因包括例如P-葡糖酸 糖苷酶或ji-半乳糖苷酶。启动子活性通过测量p-葡糖醛酸糖苷酶或P-半乳 糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动 子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。 备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自 显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996 Genome Methods 6: 986-994),通过定量mRNA水平或通过将本发明方法中所用 核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。 通常"弱启动子"意指驱动编码序列在低水平上表达的启动子。"低水平"意 指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000 转录物的水平上。相反,"强启动子"驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。

有效连接

如本文中所用的术语"有效连接"指启动子序列与目的基因之间功能性 地连接,以至于启动子序列能够启动目的基因转录。 组成型启动子

"组成型启动子"指在生长和发育的大部分、但不必全部阶段期间和在 大部分环境条件下在至少一个细胞、组织或器官内有转录活性的启动子。

下表2给出组成型启动子的实例。 表2:组成型启动子的实例

table see original document page 33

超级启动子 WO 95/14098

G盒蛋白质 WO 94/12015

遍在启动子

遍在启动子在生物基本上所有组织或细胞内有活性。 发育调节性启动子

有活性。

诱导型启动子

诱导型启动子在应答化学品(综述见Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48: 89-108)、环境刺激或物理刺激时具有受诱导 或增加的转录启动,或可以是"胁迫诱导性的",即当植物暴露于多种胁迫 条件时受到激活,或是"病原体诱导性的",即当植物暴露于多种病原体时 受到激活。

器官特异性/组织特异性启动子

器官特异性或组织特异性启动子是能够优先在某些器官官或组织如 叶、根、种子组织等内启动转录的启动子。例如,"根特异性启动子"是在 植物根中优势地具有转录活性的启动子,在植物的任何其它部分内基本上 无活性,尽管在植物的这些其它部分内允许任何泄露表达。能够仅在某些

细胞中启动转录的启动子在本文中称作"细胞特异的"。

如本文中所定义的绿色组织特异性启动子是主要在绿色組织中具有转 录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的 这些其它部分内允许任何泄露表达。显示。

表3:绿色组织特异性启动的实例

基因 表达 参考文献

玉米正磷酸二激酶 叶特异性 Fukavama等,2001(orthophosphate dikinase)

玉米磷酸烯醇式丙酸羧化酶 叶特异性 Kausch等,2001

稻磷酸烯醇式丙酮酸羧化酶 叶特异性 Liu等,2003

稻Rubisco小亚基 叶特异性 Nomura等,2000

稻P扩展蛋白EXBP9 苗特异性 WO 2004/070039

木豆(Pigeonpea)Rubisco小亚基 叶特异性 Panguluri等,2005

豌豆RBCS3A 叶特异性

组织特异性启动子的另一个实例是分生组织特异性启动子,其主要在 分生性组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽 管在植物的这些其它部分内允许任何泄露表达。

终止子

术语"终止子"包括这样的调控序列,其是在转录单位末端的DNA序 列,发出对初级转录物进行3,加工并多聚腺苷化以及终止转录的信号。终 止子可以衍生自天然基因、来自多种其它植物基因或来自T-DNA。待添加 的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自其它植 物基因或较不优选地来自任何其它真核基因。

调节

术语,,调节"就表达或基因表达而言意指这样的过程,其中表达水平与 对照植物相比因所述基因的表达而改变,优选地,表达水平增加。原先未 受调节的表达可以是结构RNA(rRNA、 tRNA)或mRNA的任何类型表达, 随后是翻译。术语"调节活性"应当意指本发明核酸序列或所编码蛋白质的 表达的任何变化,这导致植物增加的产量和/或增加的生长。

增力口的表达/过量表达

如本文中所用的术语,,增加的表达"或"过量表达"意指对于原有野生型 表达水平是额外的任何形式表达。

在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们 包括例如,由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。 可以在非异源形式的多核苷酸的适宜位置(一般是上游)内导入作为启动子或增强子元件的分离核酸,以便上调编码目的多肽的核酸的表达。例如,

内源性启动子可以通过突变、缺失和/或置换而在体内改变(见Kmiec,美 国专利号5,565,350; Zarling等,PCT/US93/03868),或可以将分离的启动 子以相对于本发明基因的正确方向及距离导入植物细胞,以便控制基因表 达。

若需要多肽表达,通常希望在多核苷酸编码区的3,末端包括多聚腺苷 化区。多聚腺苷化区可以来自天然基因、来自多种其它植物基因或来自 T-DNA。待添加的3,末端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因 或备选地来自另 一植物基因或更不优选来自任何其它真核基因。

内含子序列也可以添加至5'非翻译区(UTR)或部分编码性序列的编码 序列上,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在 植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及 蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(l卵8) Mol. Cellbiol. 8: 4395-4405; Callis等(1987)Gens Dev 1: 1183-1200)。基因表 达的此类内含子增强作用一般在位于转录单位5'末端附近时最强烈。使用 玉米内含子Adhl-S内含子1、 2和6、 Bronze-l内含子是本领域已知的。 对于一般信息,见:《玉米手册》,第116章,编者Freding和Walbot, Springer, N,Y.(1994)。

内源基因

本文中提及的"内源"基因不仅仅指如在植物中以其天然形式(即没有 任何人类干预)存在的所讨论基因,还指处于分离形式的随后(再)导入植物 (转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因 的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降 低。

降低的表达

本文中提及的"降低或基本去除,,意指内源基因表达和/或多肽水平和/ 或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以 递增优选顺序是至少10%、 20%、 30%、 40%或50%、 60%、 70%、 80%、85%、 90%,或95%、 96%、 97%、 98%、 99%或更多的降低。

为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够 长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、 19、 18、 17、 16、 15、 14、 13、 12、 11、 IO个或更少的核苷酸,或者该长 度可以多至整个基因(包括5,和/或3,UTR,部分或全体)。基本上连续的核 苷酸片段可以来自编码目的蛋白的核酸(靶基因)或来自能够编码目的蛋白 的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的 核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上 连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50% 、 60%、 70%、 80%、 85%、卯%、 95%、 96%、 97%、 98%、 99%、 100% 的序列同 一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低 或基本去除内源基因表达的多种方法所需的。

表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低

或基本去除内源基因表达的优选方法是在植物中导入并表达这样的遗传构 建体,其中核酸(在此情况下是来自目的基因或任何核酸的一段基本上连续

的核苷酸序列,其中所述的任何核酸能够编码任何一种目的蛋白的直向同 源物、旁系同源物或同源物)克隆至所述的遗传构建体内作为由间隔区(非 编码性DNA)隔开的(部分或完全的)反向重复序列。

在这种优选的方法中,使用核酸或其部分(在此情况下是从目的基因或 从任何核酸中^t生的一段基本上连续的核苷酸序列,其中所述的任何核酸 能够编码目的蛋白的直向同源物、旁系同源物或同源物)的反向重复序列 (优选能够形成发夹结构),通过RNA介导的沉默作用而降低或基本上去除 内源基因的表达。反向重复序列在包含调控序列的表达载体中克隆。非编 码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多 接头等)位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录 后,形成具有(部分或完全)自身互补结构的嵌合RNA。这种双链RNA结 构称作发夹RNA(hpRNA)。hpRNA由植物加工成为siRNA,其被掺入RNA 诱导性沉默复合物(RISC)中。RISC进一步切开mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。对于其它一般细节,见例如 Grierson等(1998) WO 98/53083; Waterhouse等(1999) WO 99/53050)。

本发明方法的实施不依赖在植物中导入并表达其中克隆入核酸作为反 向重复序列的遗传构建体,而是几种公知"基因沉默,,方法的任何一种或多 种可以用来实现相同的效果。

一种用于降低内源基因表达的如此方法是RNA介导的基因表达沉默 (下调)。沉默作用在这种情况下由基本上与内源性靶基因相似的双链RNA 序歹'J(dsRNA)在植物中触发。这种dsRNA被植物进一步加工成约20到约 26个核苷酸,称作短干扰性RNA(siRNA)。 siRNA被掺入RNA诱导性沉 默复合物(RISC)内,其中所述的RISC进一步切割内源性靶基因的mRNA 转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。优选地, 双链RNA序列对应于耙基因。

RNA沉默方法的另 一个实例包括以有义方向导入核酸序列或其部分 (在此情况下是从目的基因或从任何核酸中衍生的 一段基本上连续的核苷 酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或 同源物)至;f直物内。"有义方向"指与其mRNA转录物同源的DNA序列。因 而将向植物中导入该核酸序列的至少一个拷贝。这种额外的核酸序列会降 低内源基因表达,产生已知为共抑制作用的现象。当核酸序列的几个额外 拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平与共抑制 作用的触发之间存在正相关。

RNA沉默方法的另 一个实例包括使用反义核酸序列。"反义"核酸序列 包含与编码蛋白质的"有义"核酸序列互补,即与双链cDNA分子的编码 链互补,或与mRNA转录物序列互补的核苷酸序列。反义核酸序列优选地 与待沉默的内源基因互补。互补性可以位于基因的"编码区"和/或"非编码 区"内。术语"编码区"指包含被翻译成氨基酸残基的密码子的核苷酸序列 区。术语"非编码区"指分布在编码区两侧的被转录但不翻译成氨基酸的5, 和3,序列(也称作5'和3'非翻译区)。

反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以与整个核酸序列互补(在此情况下是从目的基因或从任何核酸 中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋 白的直向同源物、旁系同源物或同源物),不过也可以是仅与核^列的一

部分(包括mRNA5,和3,UTR)反义的寡核苷酸。例如,反义寡核苷酸序列 可以与围绕编码多肽的mRNA转录物的翻译起点周围的区域互补。合适的 反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、 45、 40、 35、 30、 25、 20、 15或10个核苷酸或更少的核苷酸开始。本发明的反义 核酸序列可以利用本领域已知方法,使用化学合成和酶连接反应而构建。 例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸 或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸被设计旨在增加 分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链 体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖咬取代的核苷酸。

知的核普酸修饰包括甲基化、环化和'加帽'及用类似物(如肌苷)取代一个或 多个天然存在的核苷酸。其它的核苷酸修饰是本领域众所周知的。

(即从插入的核酸中转录的RNA将与目的靶核酸呈反义方向)的表达载体以 生物学方式产生。优选地,反义核酸序列在植物中的产生借助稳定整合的 核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡 核苷酸和终止子。

(in situ)产生)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合, 以便例如通过抑制转录和/或翻译而抑制蛋白质表达。杂交可以通过形成稳 定双链体的常夫见核苷酸互补性所致,或在结合于DNA双链体的反义核酸 序列的情况下,因双螺旋大沟内特异性相互作用所致。反义核酸序列可以 通过转化或在特定组织部位直接注射而导入植物。备选地,反义核酸序列 可以为了革巴向所选择的细胞而受到修饰并且随后系统性施用。例如,对于 系统性施用,细胞表面上的受体或抗原,例如通过连接反义核酸序列至与细胞表面受体 或抗原结合的肽或抗体。反义核酸序列也可以使用本文中所述的载体送递 至细月包内。

根据又一个方面,反义核酸序列是a-异头核酸序列。a异头核酸序列 与互补性RNA形成特定双链杂交分子,其中与惯常b-单元相反,所述链 相互平行(Gaultier等(1987) Nucl Ac Res 15: 6625-6641)。反义核酸序列 也可以包含2'-o-曱基核糖核香酸(Inoue 等(1987) Nucl Ac Res 15, 6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett. 215, 327-330)。

内源基因表达的降低或基本去除也可以使用核酶而进行。核酶是具有 核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链 核酸序列,如mRNA。因此,核酶(例如锤头核酶(在Haselhoff和 Gerlach(1988) Nature 334, 585-591中描述)可以用来催化性地切割编码多 肽的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数 目。可以设计对核酸序列具特异性的核酶(见例如:Cech等美国专利号 4,987,071;和Cech等美国专利号5,116,742)。备选地,对应于核酸序列 的mRNA转录物可以用来从RNA分子库中选出具有特异性核糖核酸酶活 性的催化性RNA(Bartel和Szostak(1993) Science 261, 1411-1418)。核酶 用于才直物中基因沉默的用途是本领域已知的(例如Atkins等(1994) WO 94/00012; Lenne等(1995) WO 95/03404; Lutziger等(2000) WO 00/00619; Prinsen等(1997) WO 97/13865和Scott等(1997) WO 97/38116)。

基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过 如Angell和Baulcombe((1999) Plant J. 20(3): 357-62)、 (Amplicon VIGS WO 98/36083)或Baulcombe(WO 99/15682)及其它人描述的策略而实现。

当在内源基因上存在突变和/或在随后导入植物的分离的基因/核酸上 存在突变时,基因沉默也可以发生。降低或基本去除可以由无功能的多肽 引起。例如,多肽可以与多种相互作用性蛋白质结合; 一个或多个突变和/ 或截短因而可以提供仍能够结合相互作用性蛋白质(如受体蛋白质)但不能表现其正常功能的多肽(如起信号作用的配体)。

另 一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)

互补的核^^列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene, C., Anticancer Drug Res. 6, 569-84, 1991; Helene等,Ann. N.Y. Acad. Sci. 660, 27-36 1992和Maher, L.J. Bioassays 14, 807-15, 1992。

其它方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功 能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。尤 其,可以构思的是人造分子可以用于抑制靶多肽的生物学功能,或用于干 扰乾多肽参与其中的信号途径。

备选地,可以建立筛选程序以鉴定在植物群体中基因的天然变体,其 中所述的变体编码具有降低活性的多肽。此类天然变体也可以用于例如进 行同源重组。

人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA 翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的 主要功能是调节基因表达和/或mRNA翻译。大多数的植物微RNA(miRNA) 与其靶序列具有完全的或接近完全的互补性。然而,存在具有多达5个错 配的天然靶标。它们由切酶家族的双链特异性RNA酶从具有特征性折回 结构的较长的非编码性RNA中加工而来。在加工时,它们通过与RNA诱 导性沉默复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合 体。MiRNA充当RISC的特异性成分,因此它们与细胞质中的靶核酸(大 多是mRNA)碱基配对。后续的调节事件包括靶mRNA切割和破坏和/或翻 译抑制。miRNA过量表达的作用因此在靶基因降低的mRNA水平上得到 反映。

通常21个核苷酸长度的人工微RNA(amiRNAs)可以遗传改造以特异 性地负调节单个或多个目的基因的基因表达。植物微RNA靶的选择的决 定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用 来辅助设计特定的amiRNA, Schwab R, 2005。用于设计并产生amiRNA 及其前体的便利工具也是公众可获得的,Schwab等,2006。为最佳性能,用于降低内源基因在植物中表达的基因沉默技术需要使 用来自单子叶才直物的核酸序列以转化单子叶植物,和使用来自双子叶植物 的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸 序列导入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,

的植物物种。只要内源性靶基因与待导入的核酸之间存在相当大的同源性 就足够了 。

上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法 的实例。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例 如通过利用合适启动子而实现降低内源基因在整林植物或在其部分中的表 达。

选择标记(基因)/报道基因

"选择标记"、"选择标记基因"或"报道基因"包括向细胞赋予表型的任 何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明 的核酸构建体所转染或转化的细胞。这些标记基因能够通过一 系列不同原 理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素耐药性或除 草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的实例 包括赋予抗生素耐药性的基因(如使新霉素和卡那霉素磷酸化的叩tll或使

潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素四环素、氯霉素、 氨节青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟 素的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta⑧抗性的bar; 提供草甘膦抗性的ar0A或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲 类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一 源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗 性)。目视标记基因的表达导致形成颜色(例如j5-葡糖醛酸糖苷酶、GUS或 P-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萦光素/萤光素酶系统)或 荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。 技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来

DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用

的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述 之一)的基因连同目的基因一起导入宿主细胞。这些标记可以在其中这些基 因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择 标记的核酸分子可以导入宿主细胞中,与在包含编码本发明多肽或本发明 方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用导入的 核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的 细月包存活而其它细l包死亡)。

因为一旦已经成功导入了核酸,则转基因宿主细胞中不再需要或不希 望有标记基因,尤其抗生素耐药性基因和除草剂抗性基因,因此用于导入 核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。 一种 如此方法称作共转化法。共转化法使用同时用于转化的两种载体, 一种载 体携带本发明的核酸而另 一种载体携带标记基因。高比例的转化体接受,

或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农 杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即 侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行 杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因 用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶 来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转 化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细 胞的基因组并丟失。在其它更多情况下,转座子跳至不同位置。在这些情 况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或 促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的 优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Crel 是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之 间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组 系统是HIN/HIX、 FLP/FRT和REP/STB系统(Tribble等,丄Biol. Chem.,275, 2000: 22255-22267; Velmurugan等,J. Cell Biol., 149, 2000: 553-566)。

有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法 自然也可以应用至微生物如酵母、真菌或细菌。 转基因的/转基因/重组

为本发明目的,"转基因的"、"转基因"或"重组"就核酸序列而言意指 包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表 达盒或载体转化的生物,这些构建均通过重组方法产生,其中

编码用于本发明方法中的蛋白质的核*列,或

与本发明核酸序列有效连接的遗传调控序列,例如启动子,或 a)和b)

不处于其天然遗传环境中或已经通过遗传操作方法修饰,修饰有可能 采用例如置换、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。 天然遗传环境理解为意指来源植物中的天然基因组基因座或染色体基因座

或在基因组文;^中存在。在基因组文库的情况下,核酸序列的天然遗传环 境优选地得到l呆留,至少部分地得以保留。该环境分布在核酸序列的至少

一侧并且具有至少50 bp,优选至少500 bp,特别优选至少1000bp,最优 选至少5000 bp的序列长度。天然存在的表达盒-例如核酸序列的天然启 动子与编码本发明方法中所用多肽的对应核酸序列的天然存在的组合,如 上文所定义-在这种表达盒通过非天然的合成("人工")方法(如诱变处理)而 受到修饰时,变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。

为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的 核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同 源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发 明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相 对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到 修饰。转基因^f尤选地理解为意指本发明核酸在基因组中的非天然基因座内 表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。 转化

如本文中所提及的术语"导入"或"转化"包括外源性多核苷酸转移至 宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过 器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可 以从中再生整林植物。选择的具体组织将取决于可用于并且最适于正进行 转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、 子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、 腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组 织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持,例 如作为质粒。备选地,多核苷酸可以整合至宿主基因组内。产生的转化植 物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。

外来基因转化至植物基因组内称作转化。植物物种的转化现在是相当 常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因导 入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述 的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电

穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰 击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法 可以选自用于原生质体的/聚乙二醇法(Krens, F.A.等,(1982) Nature 296, 72-74; Negrutiu I等(1987) Plant Mol Biol 8: 363-373);原生质体的 电穿孔法(ShillitoR,D.等(1985)Bio/Techno13, 1099-1102);对植物材料的 微量注射法(Oossway A等,(1986) Mol. Gen Genet 202: 179-185); DNA 或RNA涂布的粒子轰击法(Klein TM等,(1987) Nature 327: 70)、(非整 合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆 菌介导的转化法产生。有利的转化方法是在植物中(inplanta)的转化法。 为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植 物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植 物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent, Plant J.(1998)16, 735-743)。用于农杆菌介 导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述 的那些方法:欧洲专利申请EP 1198985 Al, Aldemita和Hodges(Planta 199: 612-617, 1996); Chan等(Plant Mol Biol 22(3): 491-506, 1993), Hiei等(Plant J 6(2): 271-282, 1994),其公开内容在本文中引入作为参考, 如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat. Biotechnol 14(6): 745-50, 1996)或Frame等(Plant Physiol 129(1): 13-22, 2002)描述,其^〉开内容在本文中如充分所述那样引入作为参考。所述方法 通过举例方式进一步由B. Jenes等,Techniques for Gene Transfer,在: Transgenic Plants, 第1巻,Engineering and Utilization, 编者S.D. Kung 和R. Wu, Academic P腦(1993)128画143及在Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42(1991)205-225)中描述。待表达的核酸或构建 体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体, 例如pBinl9(Bevan等,Nud. Acids Res. 12(1984)8711)。由这种载体转化 的农杆菌随后可以按照已知方式用于转化植物,例如作为才莫型使用的植物, 如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物,例如

烟草植物,通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在 合适的培养基内培育。植物通过根癌农杆菌的转化例如由HM"gen和

Willmitzer在Nucl. Acid Res.(1988)16, 9877中描述或尤其从F.F, White, Vectors for Gene Transfer in Higher Plants; 在Transgenic Plants, 第1 巻,Engineering and Utilization, 编者S.D. Kung和R. Wu, Academic Press, 1993,第15-38页中获知。

除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植

物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转 化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥 种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物 受到转化并且因此是转基因的【Feldman, KA和Marks MD(1987) Mol Gen Genet 208: 274-289; Feldmami K(1992)。在:编者C Koncz, N-H Chua和J Shell, Methods in Arabidopsis Research. Word Scientific, Singapore, 第274-289页j。替代性方法基于反复去掉花序并使莲座叶丛中心中的切除 部位与转化的农杆菌温育,因而转化的种子同样可以在较晚的时间点获得

(Chang(1994) Plant J. 5: 551-558; Katavic(1994) Mol Gen Genet, 245: 363-370)。然而,尤其有效的方法是改良的真空渗入法,如"花浸染"法。 在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理

[Bechthold, N(1993)。 C R Acad Sci Paris Life Sci, 316: 1194-1199】,而

在"花浸染法"的情况下,正在发育的花组织与表面活性剂处理的农杆菌混 悬液短暂温育【CIough, SJ和Bent, AF(1998) The Plant J. 16, 735-743】。 在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如 上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化 是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基 因经花粉流动险。叶绿体基因组的转化一般通过已在Klaus等,2004 [Nature Biotechnology 22(2), 225-229j中示例性加以展示的方法实现。简 而言之,待转化的序列连同选择标记基因一起克隆至与叶绿体基因組同源 的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。 已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在 基础研究和植物生物技术中的转基因质体(Transgenic plastids in basic research and plant biotechnology). J Mol Biol. 2001年9月21日;312(3): 425-38或Maliga, P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformation technology ) . Trends Biotechnol. 21, 20-28。进一步生物技术进展最近已经以无标记质体转化体 的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因 产生(Klaus等,2004, Nature Biotechnology 22(2), 225-229)。 T-DNA激活标签化

T-DNA '激活标签化(Hayashi等Science(1992)1350-1353)涉及在目的

基因的基因组区域内或基因编码区上游或下游10 kb处以如此结构插入 T-DNA(通常舍有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达 的调节作用遭到破坏并且该基因处在新导入的启动子控制下。启动子一般

嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌 感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所导入启 动子的基因的改良表达,产生的转基因植物表现显性表型。 TILLING

TILLING(基因组内定向诱导的局部损伤)是用于产生和/或鉴定核酸 诱变技术,其中所述的核酸编码具有修饰表达和/或活性的蛋白质。 TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在 强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动 子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的 活性。TILLING将高密度诱变与高通量筛选方法组合。 一般在TILLING 中遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methods in

Arabidopsis Research, Koncz C, Chua NH, Schell J, Singapore编辑, World Scientific Publishing Co,第16—82页;Feldmann等,(1994)在 Meyerowitz EM, Somerville CR编辑,Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY,第137 172页;Lightner J 和Caspar T(1998)在J Martinez-Zapater, J Salinas编者,Methods on Molecular Biology第82巻.Humana Press, Totowa, NJ,第91-104页); (b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和复性以允许形 成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检 测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测 序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000) Nat Biotechnol 18: 455-457;综述见Stemple(2004) Nat Rev Genet 5(2): 145-50)。

同源重组允许选择的核酸在基因组中于确定的所选择位置内导入。同 源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓 (Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅

同源重组对模式植物(Offringa等(1990)EMBO J 9(10): 3077-84)而且对作物植物例 如稻(Terada等(2002) Nat Biotech 20(10): 1030-4; Iida和Terada(2004) Curr Opin Biotech 15(2): 132-8)进行了描述。 产量

术语"产量"通常意指经济价值的可测量结果, 一般与指定作物、与面 积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接

对产量有贡献,或实际产量是对于某作物和一年的每英亩产量,这通过总 产量(包括收获的和评估的产量)除以种植的英亩数而确定。 早期萌发势

早期萌发势(尤其在植物生长早期期间活跃、健康、良好平衡的生长) 可以因植物适应性增加而产生,其原因在于例如植物更好地适应其环境(即 优化能源的使用和苗与根之间的分配)。具有早期萌发势的植物也显示增加 的幼苗存活和更好的作物建立,这往往导致高度均匀的田(作物整齐地生 长,即大多数才直物在基本上相同的时间上达到发育的各阶段)和往往更好及 更高的产量。因而,早期萌发势可以通过多种因子如千粒重、萌发百分数、 出苗百分数、幼苗生长、幼苗高度、根长度、根及苗生物量和众多其它因 素而确定。

增加/改善/增强

术语"增加,,,,,改善"或"增强"是可互换的并且应当在本申请含义上指 与如本文中定义的对照植物相比至少5%、 6%、 7%、 8%、 9%或10%、 优选至少15%或20%、更优选地25%、 30%、 35%或40%更多的产量 和/或生长。

种子产量

增加的种子产量本身可以表现为下列一种或多种指标:a)种子生物量 (种子总重量)增加,这可以基于单粒种子和/或每林植物和/或每公项或每英 亩;b)每林植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率 (其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述 为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的

种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。 种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,

种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子

宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因

改良的结构而出现。 植物

如本文中所用的术语"植物"包含整林植物、植物的祖先及后代和植物 部分,包括种子、枝条、茎、叶、根(包括块茎)、花和组织及器官,其中 每种所提及对象包含目的基因/核酸。术语"植物"也包含植物细胞、悬浮培 养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同 样每种提及的对象包含目的基因/核酸。

特别用于本发明方法中的植物包括属于植物界(Viridiplantae )超家 族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的祠用或饲 料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Acer spp.)、猕猴 杉匕属物种(Actinidia spp,)、 -火蔡属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、 草属物种(Agropyron spp.)、 匍旬剪股颖 (Agrostis stolonifera)、葱属物种(Allhmi spp.)、苋属物种(Amaranthus spp.)、欧洲海 滨草 (Ammophila arenaria)、 凤梨(Ananas comosus)、 番篇枝属物种 (Annona spp.)、芽菜(Apium graveolens)、落花生属物种(Arachis spp.)、木 波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种 (Avena spp.)(侈寸^口燕、麦(Avena sativa)、 野燕、麦(Avena fatua)、 比赞燕、麦 (Avena byzantina)、 Avena fatua var. sativa、 杂种燕麦(Avena hybrida)、 阳杉匕(Averrhoa carambola)、 箣竹属(Bambusa sp.)、 冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种 (Brassica spp.)(例如欧洲油菜(Brassica napus)、 芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、 蔓青(turnip rape)】)、Cadaba farinosa、 茶(Camellia sinensis), 美人蕉(Canna indica)、 大麻(Cannabissativa)、辣椒属物种(Capsicum spp.)、 Carex elata、番木瓜(Carica papaya)、 大果4艮虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花 (Carthamus tinctorius)、 栗属物种(Castanea spp.)、 美洲木(Ceiba pentandra)、 苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、 西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Coeos spp.)、 咖啡属物种(Coffea spp.)、芋头(CoIocasia esculenta)、非洲梧桐属物种(Cola spp,)、 黄麻属(Corchorus sp.)、 芫荽(Coriandrum sativum)、 榛属物种 (Corylus spp.)、 山楂属物种(Crataegus spp.)、 番红花(Crocus sativus)、 南 瓜属物种(Cucurbita spp.)、香瓜属物种(Cuc謹is spp.)、菜蓟属(Cynara spp. 净勿种)、胡萝卜(Daucus carota)、 山虫皇属物种(Desmodium spp.)、龙目艮 (Dimocarpus longan)、薯蕷属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、秀卑属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油棕Elaeis (oleifera))、糝子(Eleusine coracana)、蔑茅属 (Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属(Eucalyptus sp.)、红仔果 (Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、 7K青冈属物种(Fagus spp.)、苹状羊茅(Festuca amndinacea)、无花果(Ficus carica)、金桔属物种 (Fortunella spp.)、草莓属物种(Fragaria spp.)、杏(Ginkgo biloba)、大豆 属(Glycine spp.)(例如大豆、大豆(Soja hispida)或大豆(Soja max))、陆地棉 (Gossypi腿hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocailis fulva)、木槿属物种(Hibiscus spp.)、大 麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、 甘薯(Ipomoea batatas)、核杉&属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种 (Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Lin應usitatissim腿)、篇枝 (Litchi chinensis)、百脉才艮属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、 羽扇豆属物种(Lupinus spp.)、 Luzula sylvatica、番痴属(Lycopersicon spp.) (例如番痴(Lycopersicon esculentum 、 Lycopersicon lycopersicum 、 Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种 (Mahis spp.)、 凹纟彖金虎尾(Malpighia emarginata)、 油果(Mammeaamericana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果 (Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、 薄荷属物种(Mentha spp.)、 芒(Miscanthus sinensis)、 苦瓜属物种 (Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属 物种(Nicotiana spp.)、木犀揽属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、足豆属物种(Ornithopus spp.)、稻属(Oryza spp.)(例如稻、阔叶稻 (Oryza latifolia))、 稷(Panicum miliaceum)、 柳枝稷(Panicum virgatum)、 鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种 (Pennisetum sp.)、絝梨属物种(Persea spp.)、芽菜(Petroselinum crispum)、 藹草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phle腿 pratense)、刺蔡属物种(Phoenix spp.)、南方,苹(Phragmites australis)、酸 浆属物种(Physalis spp.)、 ;j^属物种(Pinus spp.)、阿月浑子(Pistacia vera)、 3宛豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物 种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎 属物种(Quercus spp.)、 萝卜 (Raphanus sativus)、 波叶大黄(Rheum rhabarbarum)、茶薦子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬 钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种 (Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(SoIanum spp.)(例如马铃 薯(Solan腿tuberosum)、 红痴(Solan画integrifoli画)或番痴(Solan腿 lycopersicum))、 两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、 蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆 (Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Tr羅um spp.)、 Triticosecale rimpaui 、 小麦属(Triticum spp.)(例如普通小麦 (Triticum aestivum)、石更4立小麦(Triticum durum)、 圆片主小麦(Triticum turgidum)、 Triticum hybernum、 马卡小麦(Triticum macha)、普通小麦 (Triticum sativ腿)或普通小麦(Tritic薩vulgare))、小金莲花(Tropaeolumminus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccini腿spp.)、野碗 豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡 萄属物种(Vitis spp.)、玉蜀黍、Zizania palustris、奉属物种(Ziziphus spp.)

等等。 发明详述

HAL3详述

#4居本发明的第一实施方案,提供相对于对照植物增加植物产量的方

法,包括优先增加编码HAL3多肽的核酸在植物扩张组织中的表达。

在此之后"用于本发明方法中的蛋白质"的任何引用意指如本文中所定 义的HAL3多肽。在此之后"用于本发明方法中的核酸"的任何引用意指能 够编码如此HAL3多肽的核酸。待导入植物(并且因而用于实施本发明方法 中)的核酸是编码现在所述类型蛋白质的任一核酸,下文又称作"HAL3核 酸"或"HAL3基因"。

"参考"、"参考植物"、"对照"、"对照植物"、"野生型"或"野生型植物"

尤其是这样的细胞、组织、器官、植物或其部分,其不是根据本发明方法 产生的。因此,术语"野生型"、,,对照,,或"参考,,是可相互交换的并且可以 是未根据本文中所述的本发明方法加以修饰或处理的植物的细胞或 一部 分,如细胞器或組织、或植物。因此,用作野生型、对照或参考的植物的 细胞或部分如细胞器或者植物尽可能地对应于细胞、植物或其部分,并且

同。因此,将野生型、对照或参考相同地或尽可能相同地处理,也即仅如 此条件或特性可以不同,其中所述的条件或特性不影响所测试特性的品质。 换句话说,这意味野生型指这样的植物(l)其携带基因或等位基因的未改变 或未调整形式,或指(2)用于得到本发明方法所产生植物的起始材料/植物。

相似的条件下进行。术语"相似的条件"意指全部条件,例如培养条件或生 长条件、分析条件(如緩冲液组成、温度、底物、病原体林系、浓度等)在 待比较的实验之间保持相同。"参考"、"对照"或"野生型"优选是这样的对象,例如细胞器、细胞、 组织、植物,其未根据本文中所述的本发明方法加以调整、修饰或处理并 且在任何其它特性上尽可能与本发明的主题相似。参考、对照或野生型在 其基因组、转录物组、蛋白质组或代谢物组上尽可能与本发明的主题相似。 优选地,术语"参考-"、"对照-"或"野生型-"的细胞器、细胞、组织或植物 涉及这样的细胞器、细胞、组织或植物,其与本发明细胞器、细胞、组织

或植物或其部分遗传上几乎相同,优选95%,更优选98%、甚至更优选 99.00%、尤其99.10%、 99.30%、 99.50%、 99.70%、 99.90%、 99.99%、

99. 999%或更高,最优选地,"参考"、"对照"或"野生型"优选地是这样的 对象,例如细月包器、细胞、组织或植物,其与根据本发明方法使用的植物、 细胞、细胞器在遗传上相同,除核酸分子或由所述核酸分子编码的基因产 物根据本发明方法受到改变、调整或修饰之外。

当对照、参考或野生型仅因不是本发明方法的主题而相异于本发明的 主题,故不能提供对照、参考或野生型的情况下,对照、参考或野生型可 以是这样的植物,其中对活性调节的原因赋予如在实施例下所述的代谢物 增力口。

涉及多肽的活性在细胞、组织、细胞器、器官或生物或其部分中的增 加与对照、参考或野生型相比优选地达到至少5%、优选至少10%或至少 15%、特别优选至少20%、 25%、 30%或更高,极特别优选是至少40%、 50%或60%,最优选是至少70%或更高。

术语"增加的产量"意指植物的一个或多个部分的生物量(重量)增加,

产生的增加是超过对应野生型植物的产量至少10%。

尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于对 照植物的种子产量具有增加的种子产量的植物。

术语"表达"或"基因表达"意指因特定一种或多种基因转录所致的表型 性状出现。术语"表达"或"基因表达"尤其意指一种或多种基因转录成结构 RNA(rRNA、 tRNA)或mRNA,随后mRNA翻译成蛋白质。此过程包才舌DNA转录、加工得到的mRNA产物及mRNA产物翻译成有活性的蛋白质。 本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明 方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量 的植物。在本文中的"定义"部分中更详细地描述了术语"产量"和"种子产 量"。

在本文中对增强的产量相关性状的参考意指植物的一个或多个部分的

获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对 于合适的对照植物的种子产量具有增加的种子产量的植物。

以玉米为例,产量增加可以表现为下列一种或多种指标:每公项或英 亩植物数的增加、每抹植物穗数的增加、行数的增加、每行粒数、粒重、 千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种 子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现 为下列一种或多种指标的增加:每公项或英亩植物数、每抹植物圆锥花序 数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原 圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以 种子总数并乘以100)、千粒重的增加及其它。

根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具 有增加的种子产量的植物。因而根据本发明,提供相对于对照植物的种子 产量增加植物中种子产量的方法,所述方法包括优先增加编码HAL3多肽 的核酸在苗组织、优选在植物苗的扩张组织中的表达。

由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生

长速率,这些^i物有可能在其生活周期中的对应阶段上表现增加的生长速

率(在其生活周期的至少部分期间)。

增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性 的,或可以基本上遍及整抹植物。具有增加的生长速率的植物可以具备较 短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物 已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时 间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个

阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期 期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植 物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似 的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进 一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其 它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足 够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米 植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相 同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物 的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以 生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野 生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区 域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。 若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲

线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50M最大 尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等 等。

根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具 有增加的生长速率的植物。因而根据本发明,提供相对于增加植物生长速 率的方法,所述方法包括调节表达、优选增加本文中所定义的编码HAL3 多肽的核酸在#_物中的表达。

与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁 迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴 露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另 一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的 胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于

40%、 35%或30%,优选小于25%、 20%或15%,更优选小于14%、 13%、 12%、 11%或10%或更低。由于农业实践(灌溉施肥杀虫剂处理)上的 进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导 的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物 性和/或非生物性(环境)胁迫。非生物性胁迫可以因干旱或水涝、厌氧胁迫、 盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物性胁迫 可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗 透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些 胁迫。

产生相对于对照植物而具有增加的产量的植物。如在Wang等 (Planta(2003)218: l-14)中报道,非生物性胁迫导致不利地影响植物生长及 生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已 知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133: 1755-1767) 描述了干旱胁迫与高盐度胁迫间极高程度的"串话"。例如,干旱和/或盐化 作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随 高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白 变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应 答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。 如本文中所用的术语"非胁迫"条件是允许植物最佳生长的环境条件。本领 域技术人员清楚对于给定地点的正常土壤条件和气候条件。

本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在 非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发 明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量 的方法,所述方法包括增加编码HAL3多肽的核酸在植物中表达。营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而 根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,

所述方法包括增加编码HAL3多肽的核酸在植物中的表达。营养缺乏可以 因营养物的缺乏或过量所致,所述营养物例如是氮、磷酸盐及其它含磷化 合物、、钩、镉、镁、锰、等。

根据本发明的第二优选特征,本发明方法的实施产生相对于对照植物 具有增加的植物萌发势的植物,尤其在植物发育早期(在稻和玉米的情况 中一般是萌发后3周、4周,这在物种与物种之间会不同),导致早期萌发 势。因而根据本发明,提供用于增加植物早期萌发势的方法,所述方法包 括调节、优选增加编码HAL3多肽的核酸在植物中的表达。优选地,幼苗 萌发势的增加通过表达在苗特异性启动子控制下的编码HAL3多肽的核酸 而实现。还提供用于产生相对于对照植物而具有早期萌发势的植物的方法, 所述方法包括调节、优选增加编码HAL3多肽的核酸在植物中的表达。

早期萌发势也可以因植物适应性增加而产生,其原因在于例如植物更 好地适应其环境(即优化能源的使用和苗与根之间的分配)。具有早期萌发 势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀 的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的 各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过多种因子如 千粒重、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根及 苗生物量和众多其它因素而确定。

本发明方法有利地适用于任何植物。

特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤 其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、 树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实 例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和 烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优 选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、 黑小麦、高粱和燕麦。其它有利的植物选自菊科(Asteraceae)如向日葵属(Helianthus)、万寿 菊属例如物种向日葵【向日葵(sunflower)j、香叶万寿菊(Tagetes lucida)、 万寿菊(Tagetes erecta)或细叶万寿菊(Tagetes tenuifolia)【Marigold】、十字 花科(Brassicaceae)如芸苔属(Brassica)、拟南芥属(Arabadopsis)例如物种欧 洲油菜、芜芜青【卡诺拉油菜、油菜、蔓青j或拟南芥。豆科(Fabaceae)如大 豆属例如物种大豆、大豆(Soja hispida)或大豆(Soja max)[大豆j。亚麻牙牛 (Linaceae)如亚麻属(Linum)例如物种亚麻[亚麻(flax、 linseed)】;禾本科如 大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高粱属(Sorghum)、 稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Triticum)例如物种大麦[大麦j;黑 麦【rye]、燕麦、野燕麦、比赞燕麦、Avena fatua var. sativa、杂种燕麦[oat]、 两色蜀黍【高粱、粟j、稻、阔叶稻[稻j、玉蜀黍【玉米、玉米j、普通小麦、 硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)[小麦、面包小麦、普通小麦l;茄科 (Solanaceae)如茄属(Solanum)、番茄属(Lycopersicon)例如马铃薯[马铃薯】、 番痴(Lycopersicon esculentum、 Lycopersicon lycopersicum、 Lycopersicon pyriforme 、 Solarium integrifolium或 Solanum lycopersicum)[西红柿 (tomato)j。

如本文中所定义地术语"HAL3多肽"指属于超家族HFCD(同源寡聚 体含黄素的Cys脱羧酶;Kupke丄Biol.Chem. 276, 27597-27604, 2001)

的黄素蛋白。这些蛋白质共有黄素结合基序、保守的活性部位残基,并且 是三聚体酶或十二聚体酶。HAL3蛋白质优选地从氨基端至羧基端包含(i) 底物结合螺旋、(ii)插入性His基序、(iii)PXMNXXMW基序和(iv)底物识 别夹(图1)。预测这四个结构域参与底物结合,插入性ffis基序包含参与活 性部位的保守His残基,而底物识别夹内的序列可以在序列和长度方面一 定程度可变(Blaesse等,EMBOJ. 19, 6299-6310, 2000)。结构特征(i)-(iv) 也在Kupke等(2001)中描述,其公开内容在本文中引入作为参考。 一般, HAL3多肽能够结合FMN辅因子。

底物结合螺旋一般包含于具有以下共有序列(SEQ ID NO:6)的序列基序1内:

(k/R)pr(v/I)(I/l)laa(s/T)gsva(a/S)(画/V)kf(g/E/A/S)(n/S/I)l(c/V/A)(h/R/ G)(c/S/I)(f/L)(t/S/C)(e/D/Q)wa(e/D)v(r/K)av(v/A/S)。

插入性His基序、PXMNXXMW基序和底物识别夹是具有以下共有序 列(SEQ ID NO:7)的序列基序2的部分:

vlhielr(r/K/Q)wad(WI/A)(l/M)(v/I)iaplsantl(g/A)kiagg(l/M)cdnlltc(i/V)( i/V),d(y/F)(t/S/N/D/K)kp(l/F/M/I)f(WA)apamnt(l/F)mw(n/s/T)npft(e/S/Q /A)(r/k)h(l/F/I)(xl)(X2)(l/i/m)(d/n/s)(e/l/q)(l/m)g(i/v/L)(t/s/a/i)l(i/v)pp(i/v/t)( k/t/s)k(r/t/k)lacgd(y/h)g(n/t)gam(a/s)e

其中Xl可以是任一的氨基酸,优选地XI是l、 V、 E、 H、 D、 M、 I 或Q之一,并且其中X2可以是任一氨基酸,优选X2是S、 L、 T、 A或 V之一。

这些基序形成蛋白质中一个更大保守区的部分,作为实例,拟南芥 HAL3a的保守区作为SEQ ID NO:8给出。用于本发明方法中的HAL3多 肽以递增优选顺序与由SEQ ID NO:8代表的保守区具有至少65%、 70%、 75%、 80%、 85%、卯%或95%的序列同一性。

HAL3蛋白质中如在SEQ ID NO:8中例举并包含上文所述特征(i)至(iv) 的保守区包括可以使用专数据库加以鉴定的黄素蛋白结构域,所述数 据库为例如SMART(Schultz等(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864 ; Letunic等(2002) Nucleic Acids Res 30 , 242-244)、 InterPro(Mulder等,(2003) Nucl. Acids. Res. 31, 315-318)、 Prosite(Bucher 和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序 列解释中的功能.(在)ISMB-94;第二届分子生物学智能系统国际会议文集. Altman R., Brutlag D., Karp P., Lathrop R., Searls D.编辑,第53-61 页,AAAIPress , Menlo Park; Hulo 等,Nucl. Acids. Res. 32 : D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1): 276-280(2002))。这种FMN结合结构域(Pfam条目PF02441, InterPro条 目IPR003382)—般存在于黄素蛋白酶内。术语"结构域"和"基序"在上文的"定义"部分内定义。

SEQ ID NO:2中如SEQ ID NO:8所代表的保守区也可以使用如本文 中以上所述的用于比对序列用于比较的方法在其它HAL3蛋白质中鉴定出 来。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用 BLAST ,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称 作"期望,,值)以显示严格性较低的匹配。以这种方式,可以鉴定几乎精确的 短匹配,包括^床守基序1和2(SEQ ID NO:6和7),或任何位置上具有一个 或多个保守性改变的匹配。

HAL3多肽(至少以其天然形式)及它们的同源物通常催化4'-磷酸泛酰 半胱氨酸脱羧为4'-磷酸泛酰巯基乙胺,这是辅酶A生物合成中的一个步 骤,该反应可以在生物化学分析法中测试;备选地,HAL3活性可以通过 用dfp突变大肠杆菌(E. coli)菌抹的互补试验测定(K叩ke等2001; Yonamine等2004)。该酶也能够使泛酰半胱氨酸脱羧成为泛酰半胱胺 (pantothenoylcysteamine)。此夕卜,该蛋白质参与对才直物赋予盐胁迫耐受性 和渗透胁迫耐受性,其中所述特性可以用于HAL3的生物测定法。

(由SEQIDNO:l编码的)SEQ ID NO:2是HAL3多肽的实例,其中所 述的HAL3多肽从氨基端至羧基端包含以下特征:(i)底物结合螺旋、(ii) 插入性His基序、(iii)PXMNXXMW基序和(iv)底物识别夹;并且以递增优 选顺序与SEQ ID N():8所代表的保守区具有至少65%、 70%、 75%、 80%、 85%、 90%或95。/。序列同一性。包含特征(i)至(iv)的HAL3多肽的其它实 例在下文实施例部分的表A中给出。

HAL3多肽的同源物也可以用来实施本发明的方法。同源物(或同源蛋 白质)可以使用本领域众所周知的惯用技术如通过序列比对轻易地鉴定。用 于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、 BESTFIT、 BLAST、 FASTA和TFASTA。GAP使用Needleman和Wunsch 的算法((1970) J Mol Bioi 48:443-453)以找到使匹配数最大化并使空位数最 小化的两个完整序列的比对。BLAST算法(Altschul等(1990) J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分

6析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获 得的。同源物可以使用ClustaFW多重序列比对算法(1.83版本)例如以默认 配对比对参数和以百分数计的评分方法轻易地鉴定。相似性和同一性的全 局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定 (Campanella等,BMC Bioinfo醒tics. 2003 Jul 10; 4: 29, MatGAT:使用 蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工 编辑以优化保守基序之间的比对,如本领域技术人员显而易见。

序列同一性值可以使用上文提及的程序,使用默认参数在整个保守结 构域(如上文所述)或在全长的核酸或氨基酸序列上确定。

同源物也包括直向同源物和旁系同源物。直向同源物和旁系同源物可 以通过开展所谓交互性blast搜索而容易地找到。这可以通过第一 BLAST 进行,其中所述的第一 BLAST包括提交查询序列(例如SEQ ID NO:l或 SEQ ID NO:2)用于针对任何序列数据库(如公众可用的NCBI数据库)的 BLAST搜索。当从核苷酸序列开始时,可以使用BLASTN或TBLASTX(使 用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或 TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛 选结果和非筛选结果的全长序列以针对来自生物的序列进行第二次 BLAST搜索(反向BLAST),其中查询序列来自所述的生物(其中在查询序 列是SEQ ID NO:l或SEQ ID NO:2的情况下,第二次BLAST因而将针 对拟南芥序列)。随后比较第一和第二 BLAST搜索的结果。若来自第一次 BLAST的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁 系同源物;若高阶位命中不源自与查询序列衍生的物种相同的物种,则鉴 定到直向同源物。优选的直向同源物是AtHAL3a(SEQ ID NO:2), A沮AL3b(SEQ ID NO:10)的直向同源物或A但AL3b的长形式(SEQ ID NO:40)。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或 换句话说,此命中被偶然发现的几率越低)。E-值的计算是本领域众所周知 的。在大家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助 显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。除了 E-值外,比较结杲也由同一性百分数记分。同一性百分数指两个所比较的核酸(或多 肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。优选地,

HAL3多肽同源物与如SEQ ID NO:2所代表的未修饰HAL3多肽以递增优 选顺序具有至少60%、 70%、 80%、 85%、 90%、 95%、 96%、 97%、 98% 或99%或更高的序列同一性或相似性(功能同一性)。优选地,HAL3多肽 同源物由如表A中提及的序列代表。

用于本发明方法中的HAL3多肽可以是SEQIDNO:2的衍生物。"衍 生物"包括这样的肽、寡肽、多肽,其与蛋白质的天然存在形式的氨基^ 列(如在SEQ ID NO:2中所述的氨基酸序列)相比,包含非天然存在的氨基 酸残基对氨基酸的置换或非天然存在的氨基酸残基的添加。如由表A中所 列序列代表的蛋白质衍生物是适用于本发明方法中的其他实例。

编码HAL3多肽的核酸的实例包括但不限于由表A中列出的序列所代 表的那些核酸。编码HAL3多肽的核酸的变体可以适用于本发明方法中。 合适的变体包括编码HAL3多肽的核酸和/或能够与编码HAL3多肽的核 酸/基因杂交的核酸的部分。其它变体包括编码HAL3多肽的核酸的剪接变 体和等位变体。

如本文中所定义的术语"部分"指编码多肽的一段DNA,其中所述的多 肽从氨基端至羧基端包含下列特征:(i)底物结合螺旋、(ii)插入性His基序、 (iii)PXMNXXMW基序和(iv)底物识别夹;并且与由SEQ ID NO:8代表的 保守区以递增优选顺序具有至少65%、 70%、 75%、 80%、 85%、 90%或 95%的序列同一性。

部分可以例如通过对编码HAL3多肽的核酸产生一个或多个缺失而制 备。所述的部分可以以分离的形式加以使用或它们可以与其它编码性(或非 编码性)序列融合,以便例如产生结合几种活性的蛋白质。当与其它编码序 列融合时,翻译时产生的所得多肽可以比对HAL3部分所预测的多肽更 大。优选地,所述的部分编码这样的多肽,其具有与SEQ ID NO:2的HAL3 多肽基本上相同的生物学活性。该部分一般是至少50、 100、 150或200 个核苦酸长度、优选至少250、 300、 350或400个核苷酸长度、更优选至少450、 500、 550、 600或650个核苷酸长度。

优选地,所述的部分是由表A中列出的序列所代表的核酸的部分。最 优选地,此部分是如SEQ ID NO:l所代表的核酸的部分。

术语"片段"、"序列的片段"或"序列的部分"、"部分"或"其部分"意指 所提及的原始序列的截短序列。截短序列(核酸序列或蛋白质序列)可以在 长度上大幅地变化;最小尺寸是具有足够尺寸的序列以对序列提供所提及 的原始序列的至少相当功能和/或活性或与本发明的或本发明方法中所用 的核酸分子在严格条件下杂交,而最大尺寸并非关键的。在一些应用中, 最大尺寸通常基本上不大于对原始序列提供想要的活性和/或功能而需要 的尺寸。相当的功能意指原始序列至少40%、45%或50%、优选至少60%、 70%、 80%或90%或更高的功能。

编码用于本发明方法中的HAL3多肽的核酸的另一种变体是能够在降 低的严格性条件下、优选在严格条件下与从如本文中先前所定义核酸中衍 生的探针杂交的核酸,其中杂交序列编码从氨基端至羧基端包含下列特征 的多肽:(i)底物结合螺旋、(ii)插入性His基序、(iii)PXMNXXMW基序和 (iv)底物识别夹;并且与由SEQ ID NO:8代表的保守区以递增优选顺序具 有至少65%、 70%、 75%、 80%、 85%、 90%或95%的序列同一性。

优选地,杂交序列是能够与如由表A中列出的序列所代表的核酸(或与 从其中衍生的揮:针)或与任一种这些序列(靶序列)的一部分杂交的序列。最 优选地,杂交序列能够与SEQ ID NO:l(或与从其中衍生的探针)杂交。探 针通常小于700 bp或600 bp长度、优选小于500、 400 bp、 300 bp、 200 bp 或100 bp长度。通常,用于DNA-DNA杂交(如DNA印迹)的探针长度在 100与50 bp之间变化,而在用于DNA-DNA杂交(如在PCR扩增中)的探 针中的杂交区域通常少于50个核苷酸但超过10个核苷酸长度,它们优选 地是15、 20、 25、 30、 35、 40、 45或50 bp长度。

HAL3多肽可以由剪接变体编码。如本文中所用的术语"剪接变体"包 含如此核酸序列的变体,在所述的核酸序列中已经切下、替换、移位或添 加所选择的内含子和/或外显子,或其中内含子已经被缩短或加长。此类变体将是其中保留蛋白质的基本生物学活性的变体,这可以通过选择性地保 留蛋白质的功能性区段而实现。此类剪接变体可以在自然界中找到或可以 人工产生。用于产生此类剪接变体的方法是本领域众所周知的。

优选的剪接变体是编码HAL3多肽的核酸的剪接变体,其中所述的 HAL3多肽从氨基端至羧基端包含(i)底物结合螺旋、(ii)插入性His基序、 (iii)PXMNXXMW基序和(iv)底物识别夹;并且与由SEQ ID NO:8代表的 保守区以递增优选顺序具有至少65%、 70%、 75%、 80%、 85%、卯%或 95%的序列同一性。

编码包含如本文中以上所定义特征的HAL3多肽的核酸的其它优选剪 接变体是如表A中列出的任何一种序列所代表的核酸的剪接变体。最优选 是如SEQ ID N():l所代表的核酸序列的剪接变体。

HAL3多肽也可以由编码多肽的核酸的等位变体编码,其中所述的多 肽从氨基端至羧基端包含(i)底物结合螺旋、(ii)插入性His基序、 (iii)PXMNXXMW基序和(iv)底物识别夹;并且与由SEQ ID NO:8代表的 保守区以递增优选顺序具有至少65%、 70%、 75%、 80%、 85%、 90%或 95%的序列同一性。

编码包含如本文中以上所定义特征的HAL3多肽的核酸的优选等位变 体是如表A中列出的任何一种序列所代表的核酸的等位变体。最优选是如 SEQ ID NO:l所代表的核酸序列的等位变体。

定向进化(或基因改组作用)也可以用来产生编码HAL3多肽的核酸的 变体。位点定向诱变可以用来产生编码HAL3多肽的核酸的变体。几种方 法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology. Wiley编辑)。

编码HAL3多肽的核酸可以来自任何自然来源或人工来源。核酸可以 根据其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修 饰。HAL3核酸优选地来自植物,还优选来自双子叶植物,更优选来自十 字花科,该核酸最优选地来自拟南芥。

编码HAL3多肽的核酸的增加的表达、优先在植物苗中增加的表达可通过导入遗传修饰(优选地在HAL3基因的基因座中)而实施。如本文中所 定义的基因的基因座意指这样的基因组区域,其包括目的基因和编码区上 游或下游IOKB。

遗传修饰可以例如通过以下方法的任一种(多种)导入:T-DNA激活法、 TILLING和同源重组法(如在"定义"部分中描述)或通过引入并且优先增加 编码HAL3多肽的核酸在植物的扩张組织中表达而导入。在导入遗传修饰 后,随后进行任选步骤,即选择编码HAL3因子多肽的核酸优先在扩张组 织中增加的表达,其中增加的表达产生具有增加的产量的植物。

T-DNA激活标签化产生因靠近所导入启动子的基因的改良表达而表 现显性表型的转基因植物。待导入的启动子可以是能够增加编码HAL3多 肽的核酸优先在植物的扩张组织中表达的任一启动子。

也可以使用TILLING(基因组内定向诱导的局部损伤)技术在编码 HAL3多肽的基因的基因座内导入遗传修饰。携带此类突变变体的植物优 先在扩张性植物组织中具有编码HAL3多肽的核酸的增加的表达。

T-DNA激活法和TILLING是能够产生遗传修饰(包括优先增加编码 HAL3多肽的核酸在植物的扩张组织中表达)的技术实例。

本发明的作用也可以使用同源重组法再现。待靶向的核酸优选地是控 制编码HAL3多肽的核酸在植物中天然表达的区域。对于苗中表达特异性 的弱启动子被导入这个区域,部分地替换该区域或基本上完全替换它。

用于导入遗传修饰(所述遗传修饰在这种情况下不需要位于HAL3基 因的基因座内)的优选方法是导入并在植物苗中优先表达编码如本文中以 上所定义的HAL3多肽的核酸。待导入植物的核酸可以是全长核酸或可以 是如本文中前述定义的部分或杂交序列或另一种核酸变体。

本发明方法依赖于编码HAL3多肽的核酸优先在植物苗组织中、优选 在营养枝的细胞扩张带中增加的表达。

本发明还提供遗传构建体和载体以促进导入和/或在苗中、优选在植物 苗的扩张组织中优先表达用于本发明方法中的核酸序列。

因而,提供基因构建体,其包含:编码如上文所定义的HAL3多肽的核酸;

与(i)的核酸有效连接的 一种或多种调控序列,其中至少 一种是苗特异 性启动子。

本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组 DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的 细胞中表达目的基因的可以商购的载体。本发明因而提供如上文所定义的 基因构建体在本发明方法中的用途。

植物用包含目的序列(即编码HAL3多肽的核酸)的载体转化。技术人 员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载

体上存在的遗传元件。目的序列与一种或多种调控序列(至少与启动子)有

效连接。

通常已知在植物中有功能的合适启动子。它们可以采取组成型或诱导 型启动子的形式。合适的启动子可以使多细胞真核生物中的发育特异性和/ 或组织特异性表达成为可能;因此可以在植物中有利地使用叶-、根-、花-、 种子-、气孔-、块茎-或果实特异性启动子。

可用于植物中的不同植物启动子是这样的启动子,例如USP、 LegB4-、 DC3启动子或来自芽菜(parsley)的遍在蛋白启动子。

为在植物中表达,如上所述,核酸分子必须与合适启动子有效连接或 包含此启动子,该启动子使基因在正确的时间点上并以细胞或组织特异性 方式表达。可用的启动子是组成型启动子(Benfey等,EMBO J. 8(1989)2195-2202),如源自植物病毒的那些组成型启动子,如35S CAMV(Franck等,Cell 21(1980)285-294)、 19S CaMV(见also US 5352605 和WO 84/02913)、 34S FMV(Sanger等,Plant. Mol. Biol., 14, 1990: 433-443)、,菜遍在蛋白启动子或如在US 4,962,028中描述的植物启动子 如Rubisco小亚基启动子或植物启动子PRPl [Ward等,Plant. Mol, Biol. 22(1993)】、SSU、 PGELl 、 OCS【Leisner(1988)Proc Natl Acad Sci USA 85(5): 2553-2557]、 lib4、 usp、 mas【Comai(1990) Plant Mol Biol 15(3): 373-381]、 STLS1、 ScBV(Schenk(1999) Plant Mol Biol 39(6): 1221-1230)、B33、 SAD1或SAD2(flax启动子,ain等,Crop Science, 39(6)、 1999: 1696-1701)或nos【Shaw等(1984) Nucleic Acids Res. 12(20): 7831-7846j。

组成型植物启动子的其它实例是甜菜V-ATP酶启动子(WO 01/14572)。合 成的组成型启动子实例是超级启动子(WO 95/14098)和从G-盒中衍生的启 动子(WO 94/12015)。根据需要,还可以进一步使用化学诱导型启动子,比 较EP-A388186、 EP-A 335528、 WO 97/06268。本发明蛋白质在植物中 的稳定组成型表达可以是有利的。然而若在收获前的晚期表达是有利的, 则本发明多肽的诱导型表达是有利的,因为代谢性操作可以导致植物生长 迟緩。

也可以通过化学诱导型启动子促进植物基因的表达(综述,见Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48: 89-108)。当需要以 时间特异性方式表达基因时,化学诱导型启动子是特别适用的。此类启动 子的实例是水杨酸诱导型启动子(WO 95/19443)和脱落酸-诱导型启动子 (EP 335 528)、四环素-诱导型启动子(Gatz等(1992) Plant J. 2, 397-404)、 环己醇-或乙醇-诱导型启动子(WO 93/21334)或如本文中所述的其它化学 诱导型启动子。

其它的合适启动子是对生物性胁迫或非生物性胁迫条件反应的那些启 动子,例如病原体资导型PRP1基因启动子(Ward等,Plant. Mol. Biol. 22(1993)361-366)、番茄热诱导型hsp80启动子(US 5,187,267)、马铃薯寒冷 诱导型a-淀粉酶启动子(WO 96/12814)或伤口诱导型pinll启动子(EP-A-O 375 091)或如本文中所述的其它启动子。

优选的启动子尤其是在组织及器官中、在种子细胞如胚乳细胞及发育 胚的细胞中引起基因表达的那些启动子。合适的启动子是油菜的油菜籽蛋 白基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等, Mol Gen Genet, 1991, 225(3): 459-67)、拟南芥油质蛋白启动子(WO 98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US 5,504,200)、芸莒 属植物(Brassica)Bce4启动子(WO 91/13980)、豆类arc5启动子、胡萝卜 DcG3启动子或豆科植物(Legumin)B4启动子(LeB4; Baeumlein等,1992,Plant Journal, 2(2): 233-9)和导致在单子叶植物如玉米、大麦、小麦、黑 麦、稻等内的种子特异性表达的启动子。有利的种子特异性启动子是蔗糖 结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和油菜籽蛋白启动子。必 须加以考虑的合适启动子是大麦lpt2或lptl基因启动子(WO 95/15389和 WO 95/23230)和在WO 99/16890中描述的启动子(来自大麦的大麦醇溶蛋 白基因、稻的谷蛋白基因、稻的水稻素基因、稻的谷醇溶蛋白基因、小麦 的麦醇溶蛋白基因、小麦的谷蛋白基因、玉米的玉米醇溶蛋白基因、燕麦 的谷蛋白基因、高粱kasirin基因和黑麦的棵麦醇溶蛋白基因的启动子)。 其它合适的启动子是Amy32b、 Amy 6-6和Aleurain [US 5,677,474】、 Bce4(油菜)[US5,530,149j、大豆球蛋白(大豆)[EP 571 741J、磚酸烯醇式丙 酮酸羧化酶(大豆)【JP06/62870j、 ADR12-2(大豆)【WO 98/08962j、异柠檬酸 裂合酶(油菜)[US 5,689,040j或a-淀粉酶(大麦)【EP 781 849j。可用于在植物 中表达基因的其它启动子是叶特异性启动子,如在DE-A 19644478中描述 的那些启动子或光调节启动子如,例如豌豆petE启动子。

其它合适的植物启动子是胞质溶胶FBP酶启动子或马铃薯ST-LSI启 动子(Stockhaus等,EMBOJ. 8, 1989, 2445)、大豆磷酸核糖基焦磷酸酰 胺转移酶启动子(GenBank登录号U87999)或在EP-A-0 249 676中描述的 节特异性启动子。

在优选的实施方案中,编码HAL3多肽的核酸序列与苗特异性启动子 有效连接。苗特异性启动子指能够驱动目的基因在植物营养枝组织中表达 的任一启动子。优选地,苗特异性启动子能够优先驱动目的基因在营养枝 的扩张组织中,即在营养枝的细胞扩张带中表达。在本文中对"优先"驱动 在苗中表达的引用意指驱动与苗特异性启动子有效连接的任一序列在营养 枝的细胞扩张带中表达,以至于基本上排除在植物内其它部位中驱动表达, 除了因泄露性启动子表达所致的任何残留表达之外。苗特异性启动子可以 天然启动子或合成的启动子。

优选地,苗特异性启动子是从p-扩展蛋白基因中分离的启动子,如稻 P扩展蛋白EXBP9启动子(WO 2004/070039),如SEQ ID NO:5代表,或与稻卩扩展蛋白启动子具有相似强度的启动子和/或与稻|3扩展蛋白启动子 具有相似表达模式的启动子(即功能等效的启动子)。

应当明白本发明的适用性不限于编码由SEQ ID NO:l代表的HAL3 多肽的核酸,同时本发明的适用性也不限于由p扩展蛋白启动子驱动时编 码HAL3多肽的核酸的表达。

任选地, 一种或多种终止子序列(也是调控序列)可以在导入植物的构 建体中使用。额外的调节元件可以包括转录增强子以及翻译增强子。本领 域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。 本领域技术人员会知道或可以轻易地获得此类序列。

本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/ 或复制的复制序列起点。 一个实例是当需要将遗传构建体在细菌细胞中维 持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但 不限于fl-ori和colEl。

其它调控序列(除启动子、增强子、沉默子、内含子序列、3, UTR和 /或5, UTR区之夕卜)可以是蛋白质和/或RNA稳定元件。

为检测和/或选择如在序列方案中描述及在本发明方法中使用的核酸 序列的成功转移,使用标记基因(二报道基因)是有利的。这些标记基因能够 通过一系列不同原理而鉴定核酸分子的成功转移,例如借助荧光、发光或 在人眼睛可觉察的光的波长范围内通过目测鉴定、通过除草剂抗性或抗生 素耐药性、通过所谓营养标记(营养缺陷标记)或抗营养性标记、通过酶分 析法或通过植物激素。可以提及的此类标记的实例是GFP(=绿色荧光蛋 白);萤光素/萤光素酶系统、p-半乳糖苷酶与其有色底物例如X-Gal、对例 如咪唑啉酮、草甘膦、膦丝菌素或磺脲类的除草剂抗性、对例如博来霉素、 潮霉素、链霉素、卡那霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、 遗传霉素(G418)、壮观霉素或杀稻瘟素等的抗生素耐药性、营养标记如对 甘露糖或木糖的利用或抗营养性标记如对2-脱氧葡萄糖的抗性。这个名单 仅代表少数的可能标记。技术人员非常熟悉此类标记。取决于生物和选择 方法,优选不同的标记。本发明也包括通过本发明方法可获得的植物。本发明因而提供通过本 发明方法可获得的植物、植物部分或其植物细胞,其中植物或其部分或细

胞包含在苗特异性启动子控制下的编码HAL3多肽的核酸转基因。

本发明也提供用于产生相对于对照植物具有增加产量的转基因植物的 方法,包括在^1物苗中导入并优先表达编码HAL3多肽的核酸。

宿主植物对于本发明方法中所用的核酸或载体、表达盒或构建体或载 体而言原则上有利地是能够合成本发明方法中所用多肽的所有植物。

更具体地,本发明提供用于产生具有增加产量的转基因植物的方法, 所述方法包括:

在植物苗中导入并优先表达编码HAL3多肽的核酸;和

在促进植物生长和发育的条件下培育植物细胞。

核酸可以直接导入植物细胞或导入植物本身(包括导入组织、器官或植 物的任何其它部分)。根据本发明的优选特征,核酸优选地通过转化导入植 物。

外来基因至#_物基因组内的转移称作转化。在进行转化时,用于转化

转化。为了选^转化的植物,在转化中获得的植物材料原则上接受i择条 件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述 方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。 又一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在 消毒之后),使得仅转化的种子可以生长成植物。其它有利的转化方法(尤 其用于植物)是技术人员已知的并且在下文中描述。

通常在转^^后,对植物细胞或细胞群体选择一种或多种标记的存在, 其中所述的标i己由与目的基因一起共转移的植物可表达的基因编码,随后 将转化的材料再生成整林植物。

如所提及,用本发明表达载体转化的农杆菌也可以以本身已知的方式 用于转化植物如实验植物例如拟南芥或作物植物,例如谷物、玉米、燕麦、 黑麦、大麦、小麦、大豆、稻、棉花、甜菜、油菜、向日葵、亚麻(flax)、大麻(hemp)、马铃薯、烟草、番茄、胡萝卜、灯笼椒(bellpepper)、油菜、 木薯(tapioca、 cassava)、 竹芋(arrow root)、 万寿菊、苜莆、莴苣(Iettuce) 和多种树、坚果植物和藤本植物物种,特别是含油的作物植物如大豆、花 生(peanut)、蓖麻(castor-oil Plant)、向曰葵、玉米、棉花、亚麻、油菜、

椰子、油椰、红花或可可豆,例如通过在农杆菌溶液中浸泡擦伤的叶或叶 段并且随后在合适培养基内培育它们。

除了转化体细胞(随后必须再生成完整植物)之外,还有可能转化植

物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转 化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥 种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物 受到转化并且因此是转基因的IFeldman, KA和Marks MD(1987) Mol Gen Genet 208: 274-289; Feldmann K(1992)。在:编者C Koncz, N-H Chua 和J Shell, Methods in Arabidopsis Research. Word Scientific, Singapore, 第274-289页j。替代性方法基于反复去掉花序并使莲座叶丛中心中的切除 部位与转化的农杆菌温育,因而转化的种子同样可以在较晚的时间点获得

(Chang(1994) Plant J. 5: 551-558; Katavic(1994) Mol Gen Genet, 245: 363-370)。然而,尤其有效的方法是改良的真空渗入法,如"花浸染"法。 在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理

[Bechthold, N(1993)。 C R Acad Sci Paris Life Sci, 316: 1194-U99j,而

在"花浸染法,,的情况下,正在发育的花组织与表面活性剂处理的农杆菌混 悬液短暂温育[Clough, SJ和Bent, AF(1998) The Plant J. 16, 735-743】。 在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如 上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化 是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基 因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004 [Nature Biotechnology 22(2), 225-229J中示例性加以展示的方法实现。简 而言之,待转化的序列连同选择标记基因 一起克隆至与叶绿体基因组同源 的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在 基础研究和植物生物技术中的转基因质体(Transgenic plastids in basic research and plant biotechnology). J Mol Biol. 2001年9月21日;312(3): 425-38或Maliga, P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformation technology ) . Trends Biotechnol. 21, 20-28。进一步生物技术进展最近已经以无标记质体转化体 的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因 产生(Klaus等,2004, Nature Biotechnology 22(2), 225-229)。

通过技术人员熟悉的所有方法可以再生遗传修饰的植物细胞。合适的 方法可以见S.D. Kung和R. Wu, Potrykus或H6fgen和Willmitzer的上述 出版物。

在DNA转移和再生后,推测的转化植物可以例如使用Southern分析 对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新 导入DNA的表达水平可以使用Northern和/或Western分析或定量PCR 进行监测,全部技术是本领域内普通技术人员众所周知的。

产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经 典育种技术。例如,第一代(或Tl)转化植物可以进行自交以产生纯合的第 二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。

产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非 转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞); 转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化 的根状茎)。

本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞 或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已 经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整抹植物

代相同的基因型特征和成表型特征。

本发明也包括宿主细胞,其含有编码HAL3多肽的分离的核酸。本发明优选的宿主细胞是植物细胞。

本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、 茎、根茎、块茎和球茎。本发明进一步涉及衍生自、优选直接衍生自这种 植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀 粉或蛋白质。

本发明也包括编码HAL3多肽的核酸的用途和HAL3多肽的用途,用 于在本发明方法中增加如上文所定义的植物产量。

编码HAL3多肽的核酸或HAL3多肽可以用于育种程序中,其中鉴定 到可以遗传地与HAL3基因连接的DNA标记。所述的核^/基因或HAL3 多肽可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程 序中用来选择具有本发明方法中如上文所定义的增加产量的植物。

HAL3核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种 育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而导入等 位基因变异;备选地,该程序可以从非人为引起的所谓"自然"起源的一组 等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于 选择所讨论及导致增加产量的序列的优异等位变体的步骤。 一般通过监测 含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温 室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植 物与另 一种植物杂交。这可以用来例如产生目标表型特征的组合。

编码HAL3多肽的核酸也可以用作探针以便对基因进行遗传作图或物 理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。 此类信息可以用于植物育种中,以便开发具有想要表型的株系。HAL3核 酸的这种用途^f义需要具有至少15个核苷酸长度的核酸序列。HAL3核酸可 以用作限制性片,殳长度多态性(RFLP)标记。限制性消化的植物基因组DNA 的Southern印迹(Sambrook J, FHtsch EF和Maniatis T(1989) Molecular Cloning, A Laboratory Manual)可以用HAL3核酸4笨测。产生的结合图式 随后可以使用计算机程序如MapMaker(Lander等(1987) Genomics 1: 174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中 所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分 离被标出并用来计算HAL3核酸在使用这个群体先前所获得的遗传图中的 ^f立置(Botstein等(1980) Am.丄Hum.Genet. 32: 314-331)。

在Bernatzky和Tanksley(1986) Plant Mol. Biol.Reporter 4: 37-41中 描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物 描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作 图。例如,F2互交群、回交群、随才几交配群、邻近纯^^系和其它个体群体 可以用于作图。此类方法学是本领域技术人员众所周知的。

所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见 Hoheisel等在:Non-mammalian Genomic Analyasis: A Practical Guide, Academic press 1996,第319-346页及其中引用的参考文献)。

在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991) Trends Genet.7: 149-154)中使用。尽管当前的FISH作图法 支持使用大型克隆(几个kb至几百个kb;见Laan等(1995) Genome Res. 5: 13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核 酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)丄Lab. Clin. Med 11: 95-96)、 PCR扩增片段的多态性(CAPS; Sheffield等(1993) Genomics 16: 325-332)、等位基因特异性连接(Landegren等(1988) Science 241: 1077-1080)、核普酸延伸反应(Sokolov(1990) Nucleic Acid Res. 18: 3671)、放射杂交作图(Walter等(1997)Nat.Genet. 7: 22-28)和Happy作图 法(Dear和Cook(1989) Nucleic Acid Res. 17: 6795-6807)。对于这些方法, 使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的 引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR 遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交 叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。

本发明方法产生具有如前文所述的增加产量的植物。这种增加的产量也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生 物性胁迫和生物性胁迫的耐受性、调节多种构造性特征和/或生物化学特征 和/或生理学特征的性状。

上调的MADS15的详述

现已惊奇地发现调节编码MADS15多肽的核酸在植物中的表达产生 了相对于对照植物具有增强的产量相关性状的植物。在下文详细描述了适 于增强植物中产量相关性状的特定类的MADS15多肽。

本发明提供了相对于对照植物增强植物中产量相关性状的方法,其包 括调节编码MADS15多肽的核酸在植物中的表达。

在此之后"用于本发明方法中的蛋白质"的任何引用意指如本文中所定 义的MADS15多肽。在此之后"用于本发明方法中的核酸"的任何引用意指 能够编码这种MADS15多肽的核酸。

用于调节(优选增力口)编码用于本发明方法中的蛋白质的核酸表达的优 选方法是在植物中导入并表达编码如下文所定义的用于本发明方法中的蛋 白质的核酸。

类型蛋白质的任一核酸,下文又称作"MADS15核酸"或"MADS15基因"。 如本文中所定义的术语"MADS15多肽"指属于如Adam等(J. Mol. E 第62巻,15-31)所阐明的FUL样MADS盒蛋白质的组的蛋白质。FUL样 MADS盒蛋白质是SQUAMOSA亚家族的部分并具有典型的MIKCc构 造:在氨基端的MADS结构域(M),接着是参与二聚化的间插结构域(I), 高度保守的角蛋白结构域(K)和负责结合相互作用性蛋白质或转录激活的 在羧基端的可变结构域(C)(De Bodt等Trends in Plant Science 8, 475-483)。

植物MADS15多肽也可以因某些保守基序的存在而得到鉴定。这些保 守基序的存在可以使用如上文所述的用于比对序列用于比较的方法进行鉴 定。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用 BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作"期望"值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。

一旦通过这些基序的存在鉴定了 MADS15多肽,本领域技术人员可以容易 地得到编码包含有关基序的多肽的相应核酸,并使用该核酸的足够长度的 连续核苷酸来实施任何一种或多种上文所述的基因沉默方法(用于降低或 基本去除内源性MADS15基因表达)。

通常,基序1至4至少之一的存在应当足以鉴定任一查询序列为 MADS15,然而优选地存在至少基序1和2。所提供的共有序列以序列表 中给出的单子叶植物序列为基础。本领域技术人员会十分清楚若(例如来自 双子叶植物的)其它序列或不同序列用于比较,则共有序列可以存在一定的 变化。

位于MADS结构域内的基序l(SEQ 1D NO:48):

L(E/D)R。

优选地,这种保守序列基序1具有以下序列

R)M(D/E)(R/K)ILER,

最优选地,保守序列基序1具有以下序列:

LLKKAHEISVLCDAEVAAIVFSPKGKLYEYATDS腹DKILER 位于K结构域内的基序2(SEQ ID N():49):

LMGE

优选地,这种保守序列基序2具有以下序列: KLKAK(V/I)E(A/T)(L/I)QK(S/C)(Q/H)(魔)HLMGE 更优选地,这种保守序列基序2具有以下序列: KLKAKIETIQKCHKHLMGE

任选地,MADS15多肽或其同源物可以在C结构域中包含基序3和/ 或基序4:基序3(SEQ ID NO:50):

Q(P/Q/V/A)QTS(S/F)(S/F)(S/F)(S/F)(S/C/F)(F/M) 基序4(SEQ ID NO:51): (G/A/V/L)(L/P)XWMX(S/H)

其中在基序4中的X残基可以是任一氨基酸,不过优选是L、 P或H; 并且其中第二X残基可以是任一氨基酸,不过优选是V或L。

备选地,C-结构域(在角蛋白结构域后开始,即在SEQIDNO:44中的 R175处)可以以增加的谷氨酰胺出现率为特征(通常是3.93%,这里至少是 8.77%,最大26.73%),此外,丙氨酸、脯氨酸和/或丝氨酸的含量也可以 增力口(分别高于7.8%、 4.85%和6.89%)。

另外提出的、用于本发明方法中的优选MADS15蛋白质至少包含对应 于SMART结构域SM00432(Pfam PF00319)的氨基端MADS结构域,随 后是与Pfam中定义为PF01486的K盒区对应的角蛋白结构域,更优选地, MADS15蛋白质在其MADS结构域内具有保守标签SEQ ID NO:48并且在 其K-结构域中具有保守标签SEQIDNO:49,最优选地,MADS15蛋白质 具有在SEQ ID NO:44中给出的序列。

在下文实施例8的表D中给出了用于本发明方法中的蛋白质和编码该 蛋白质的核酸的实例。

还用于本发明方法中的是在表D中给出的任何一种氨基酸序列的同源物。

还用于本发明方法中的是在表D中给出的任何一种多肽的衍生物或任 一前述SEQ ID NO的直向同源物或旁系同源物。优选衍生物是SEQ ID NO:44的衍生物。表D中所给出多肽的衍生物是可以在本发明方法中适用

中衍生的非修饰蛋白质相似的生物学活性及功能活性。

本发明通过用由SEQ ID NO:43代表的编码多肽序列SEQ ID NO:44

的稻核酸序列转化植物加以说明,然而,本发明的实施不限于这些序列。 本发明方法可以使用编码用于本发明方法中如本文中所定义的蛋白质的任何核酸有利地进行,所述核酸包括直向同源物和旁系同源物,如在表D中

给出的任一核酸序列。在表D中给出的氨基酸序列可以视为由SEQ ID NO:44代表的MADS15多肽的直向同源物和旁系同源物。

直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易 地找到。这通常涉及第一 BLAST,其中所述的第一 BLAST包括提交查询 序列(例如使用表D中列出的任一序列)用于针对任一序列数据库(如公众可 用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时, 一般使用 BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时, 可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选 BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物 的序列进行反向BLAST(第二 BLAST),其中查询序列来自所述的生物(其 中在查询序列是SEQ ID NO:43或SEQ ID NO:44的情况下,第二 BLAST 因而将针对稻序列)。随后比较第一和第二 BLAST搜索的结果。若来自第 一 BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种, 反向BLAST随后理想地产生查询序列作为最高命中,则鉴定到旁系同源 物;若第一 BLAST的中的高阶位命中不源自与查询序列从其中衍生的物 种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查 询序列,则鉴定到直向同源物。

高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句 话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。 除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比 较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。 在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显 示相关基因的聚类和以便鉴定直向同源物和旁系同源物。

表D给出由SEQ ID NO 44代表的MADS15蛋白质的直向同源物和旁 系同源物的实例。其它直向同源物和旁系同源物可以使用上文所述的 BLAST方法而轻易地鉴定。

本发明的蛋白质因保守MADS结构域和/或角蛋白结构域的存在而是可鉴定的(图5中显示)。存在用于鉴定结构域的专业数据库,如

SMART(Schultz等(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic等(2002) Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003) Nucl. Acids. Res. 31, 315-318)、 Prosite(Bucher和Bairoch(1994),用于生

物分子序列基序的广义图谱语法及其在自动化序列判读中的功 能.(在)ISMB-94;第二届分子生物学智能系统国际会i义文集.Altman R., BrutlagD., Karp P., Lathrop R., Searls D.编辑,第53-61页,AAAIPress, Menlo Park; Hulo等,Nucl. Acids. Res. 32: D134画D137,(2004))或 Pfam(Bat画n等,Nucleic Acids Research 30(1): 276-280(2002))。用于计 算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上 获得(由瑞士生物信息学研究所拥有(Gasteiger等,ExPASy:用于深入认识 和分析蛋白质的蛋白组学服务器,Nucleic Acids Res. 31: 3784-3788(2003))。 结构域也可以使用常规技术如通过序列比对而鉴定。用于比对序列用 于比较的方法是本领域众所周知的,此类方法包括GAP、 BESTFIT、 BLAST、 FASTA和TFASTA。 GAP使用Needleman和Wunsch算法((1970) J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完 整序列的全局性(即覆盖完整序列的)比对。BLAST算法(Altschul等(1"0) J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的 统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中 心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83 版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似 性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法 之一而确定(Campanella等,BMC Bioinformatics. 2003 Jul 10; 4: 29. MatGAT:用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以 进行细微手工编辑以优化保守基序之间的比对,如本领域技术人员显而易 见。此外作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域 (如MADS结构域或角蛋白结构域或上文所定义的基序之一)。使用上文提 及的程序,使用默认参数,针对整个核酸序列或氨基酸序列和/或针对选择的结构域或保守基序测定了在下文实施例10中显示为百分数的序列同一 性值。

另外,MADS15蛋白质也可以因能够或不能够结合DNA及与其它蛋 白质相互作用而是可鉴定的。DNA结合活性及蛋白质-蛋白质相互作用可 以使用本领域众所周知的技术而轻易地在体外或在体内确定。用于DNA 结合活性的体外测定法的实例包括:使用已知MADS盒DNA结合结构域 的凝胶阻滞分析(West等(1998) Nucl Acid Res 26(23): 5277-87),或酵母单杂 交分析。用于蛋白质-蛋白质相互作用的体外测定法的实例是酵母双杂交分 析(Fields和Song(1989) Nature 340:. 245-6)。已知与OsMADS15相互作用 的蛋白质包括其它MADS蛋白质(如参与开花信号作用复合体的那些 MADS蛋白质)、受体样激酶如Clavatal和Clavata2、 Erecta、 BRI1或 RSK。其它细节在实施例13中提供。

编码用于本发明方法中的蛋白质的核酸无需是全长核酸,因为本发明 方法的实施不依赖使用全长核酸序列。在实施本发明方法中适用的核酸实 例包括在表D中给出的核酸序列,但不限于这些序列。核酸变体也可以用 于实践本发明方法。核酸变体的实例包括编码本发明方法中所用蛋白质的 核酸的部分、与编码本发明方法中所用蛋白质的核酸杂交的核酸、编码本 发明方法中所用蛋白质的核酸的剪接变体、编码本发明方法中所用蛋白质 的核酸的等位变体和通过基因改组作用而获得的编码本发明方法中所用蛋 白质的核酸的变体。现在将描述术语"部分、杂交序列、剪接变体、等位 变体和基因改《且"。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达在表D中给出的任何一种核酸序列的一部分或编码表D中给 出的任何一种氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一 部分。

用于本发明方法中的部分编码属于核酸的定义范围的多肽,其中所述 的核酸编码用于本发明方法中并具有与表D中给出的氨基酸序列相同的生 物学活性的蛋白质。优选地,此部分是在表D中给出的任何一种核酸的部分。该部分一般具有至少400个连续核苷酸长度、优选至少600个连续核 苷酸长度、更优选至少700个连续核苷酸长度并且最优选至少800个连续 核苷酸长度,其中所述的连续核苷酸是在表D中给出的任何一种核酸序列。 最优选地,该部分是核酸SEQ ID NO:43的部分。优选地,该部分编码包 含如本文中所定义的(任何一种或多种)MADS结构域和角蛋白结构域的氨 基酸序列。

编码如本文中所定义的MADS15蛋白质的核酸的部分可以例如通过 对该核酸产生一种或多种缺失而制备。所述的部分可以以分离的形式加以 使用或它们可以与其它编码性(或非编码性)序列融合,以便例如产生组合 几种活性的蛋白质。当与其它编码序列融合时,翻译时产生的所得多肽可 以比对MADS15蛋白质部分所预测的多肽更大。

用于本发明方法中的另 一种核酸变体是能够在降低的严格性条件下、 优选在严格条件下与编码如本文中所定义的MADS15蛋白质的核酸杂交, 或与如本文中所定义的部分杂交的核酸。

用于本发明方法中的杂交序列编码具有MADS结构域和/或角蛋白结 构域(见图6的比对结果)并且具有与MADS15蛋白质基本相同的生物学活 性的多肽,其中所述的MADS15蛋白质由表D中给出的任一氨基,列 代表。该杂交序列一般具有至少400个连续核苷酸长度、优选至少600个 连续核苷酸长度、更优选至少700个连续核苷酸长度并且最优选至少800 个连续核苷酸长度,其中所述的连续核苷酸是在表D中给出的任何一种核 酸序列。优选地,杂交序列是能够与表D中给出的任一核酸杂交或与任一 这些序列的一部分杂交的序列,其中所述的一部分如上文所定义。最优选 地,杂交序列能够与如SEQIDNO:43所代表的核酸或与其部分杂交。优 选地,杂交序列编码包含任何一种或多种如本文中所定义的基序或结构域 的氨基酸序列。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达能够与表D中给出的任何一种核酸杂交的核酸,或包括在植 物中导入并表达这样的核酸,其能够与编码在表D中给出的任一核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。

用于本发明方法中的另 一种核酸变体是编码如上文所定义的MADS15 蛋白质的剪接变体。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达在表D中给出的任何一种核酸序列的剪接变体,或如此核酸 的剪接变体,其中所述的核酸编码在表D中给出的任一氨基酸序列的直向 同源物、旁系同源物或同源物。

优选的剪4妄变体是由SEQ II) NO:43代表的核酸的剪接变体或编码 SEQ ID NO:44的直向同源物或旁系同源物的核酸的剪接变体。优选地, 由所述剪接变体编码的氨基酸序列包含任何一种或多种如本文中所定义的 基序或结构域。

用于实施本发明方法中的另一种核酸变体是编码如上文所定义的 MADS15蛋白质的核酸的等位变体。用于本发明方法中的等位变体具有与 SEQ IDNO:44的MADS15蛋白质基本上相同的生物学活性。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达在表D中给出的任何一种核酸的等位变体,或包括在植物中 导入并表达如此核酸的等位变体,其中所述的核酸编码在表D中给出的任 一氨基酸序列的直向同源物、旁系同源物或同源物。

优选地,该等位变体是SEQ ID NO:43的等位变体或编码SEQ ID NO:44的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等 位变体编码的氨基酸序列包含任何一种或多种如本文中所定义的基序或结 构域。

用于本发明方法中的又一核酸变体是通过基因改组作用而获得的核酸 变体。基因改组作用或定向进化也可以用来产生编码如上文定义的 MADS15蛋白质的核酸的变体。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达在表D中给出的任何一种核酸序列的变体,或包括在植物中 导入并表达如此核酸的变体,其中所述的核酸编码在表D中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中变体核酸通过基因改 组作用而获得。

优选地,通过基因改组作用而获得的变体核酸编码包含任何一种或多 种如本文中所定义的基序或结构域的氨基酸序列。

另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现

位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology. Wiley编辑)

编码MADS15蛋白质的核酸可以衍生自任何自然来源或人工来源。核 酸可以根据其天然形式就组成和/或基因组环境方面通过人类有意操作而 加以修饰。优选地,编码MADS15的核酸来自植物,还优选来自单子叶植 物,更优选来自禾本科、该核酸最优选地来自稻。

在本文中对MADS15蛋白质的任何引用因而意指如上文定义的 MADS15蛋白质。编码如此MADS15蛋白质的任何核酸适用于实施本发 明方法。

植物或其部分包含编码如上文定义的MADS15蛋白质的核酸转基因。

本发明还提供遗传构建体和载体以促进在植物中导入和/或表达用于 本发明方法中的核酸序列。该基因构建体可以插入适于转化至植物内并适 于在转化的细胞中表达目的基因的载体,其中所述载体可以通过商业途径 获得。本发明也提供如本文中所定义的基因构建体在本发明方法中的用途。

更具体地,本发明提供构建体,其包含

编码如上文定义的MADS15蛋白质的核酸;

能够驱动(a)的核酸序列表达的 一种或多种调控序列;和任选地

转录终止序列。

植物用包含目的序列的载体转化(即编码如上文定义的MADS15多肽 的核酸)。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主 细胞而必须于载体上存在的遗传元件。目的序列与一种或多种调控序列(至 少与启动子)有效连接。有利地, <壬何类型的启动子可以用来驱动核酸序列的表达。 启动子可以是组成型启动子;备选地,启动子可以是诱导型启动子,

即具有对化学品应答时受诱导或增加的转录启动或胁迫诱导型启动子或病

原体诱导的启动子。

额外或备选地,启动子可以是器官特异性或组织特异性启动子,或启

动子可以是遍在启动子,或启动子可以是发育调节性的。另外,启动子可

以是器官特异性或组织特异性或细胞特异性的。

优选地,MADS15核酸或其变体与组成型启动子有效连接。优选的组

成型启动子是基本上遍在表达的组成型启动子。启动子还优选地从植物、

更优选从单子叶植物中得到。最优选使用GOS2启动子(例如来自稻,SEQ ID NO:47或SEQ ID NO:108)。应当明白本发明的适用性不限于由SEQ ID NO:43代表的MADS15核酸,同时本发明的适用性也不限于在GOS2启 动子驱动时MADS15核酸的表达。也可以用来驱动MADS15核酸表达的 其它组成型启动子或功能性等效启动子的实例在"定义"部分中显示。

任选地, 一种或多种终止子序列可以在导入植物的构建体中使用。额 外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知 道可以在实施本发明中适用的终止子序列和增强子序列。本领域技术人员 会知道或可以轻易地获得此类序列。

也可以向5,非翻译区(UTR)或在编码序列中添加内含子序列以增加在 胞浆中积累的成熟信息的量。

其它调控序列(除启动子、增强子、沉默子、内含子序列、3, UTR和 /或5, UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人 员会知道或可以轻易地获得此类序列。

本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/ 或复制的复制起点序列。 一 个实例是当需要将遗传构建体在细菌细胞中维 持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但 不限于fl-ori和coIEl。些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传 构建体可以任选地包含选择标记基因。

本发明也提供相对于对照植物产生具有增强的产量相关性状的转基因

植物的方法,包括在植物中导入并表达编码如上文所定义的MADS15蛋白 质的任何核酸。

更具体地,本发明提供用于产生具有增加产量的转基因植物的方法, 所述方法包括:

在植物或才直物细胞中导入并表达MADS15核酸或其变体;和

在促进植物生长和发育的条件下培育植物细胞。

核酸可以直接导入植物细胞或导入植物本身(包括导入组织、器官或植 物的任何其它部分)。根据本发明的优选特征,核酸优选地通过转化导入植 物。

遗传修饰的植物细胞可以通过技术人员熟悉的所有方法加以再生。合 适的方法可以在S.D. Kung和R. Wu, Potrykus或H6fgen和Willmitzer

的前述出版物中找到。

通常在转一f匕后,对植物细胞或细胞群体选择一种或多种标记的存在, 其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将 转化的材料再生成整林植物。为选择转化的植物,在转化中获得的植物材 料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。 例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷 雾进行合适的选择处理。又一种可能性包括在使用合适选择剂的琼脂平板 上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。

备选地,对转^:的植物筛选选择标记(如上文所述的那些选择标记)的存在。

在DNA转移和再生后,推测的转化植物可以例如使用Southern分析 对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新 导入DNA的表达水平可以使用Northern和/或Western分析监测,全部技 术是本领域内普通技术人员众所周知的。

产生的转>化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或Tl)的转化植物可以进行自交并选择纯合

的第二代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步

产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非 转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞); 转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化 的才艮茎)。

本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞 或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已 经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整抹植物

代相同的基因型特征和/或表型特征。

本发明也包括宿主细胞,其含有编码如上文所定义的MADS15蛋白质 的分离核酸。本发明优选的宿主细胞是植物细胞。

宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体 而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。

本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、 茎、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种 植物的可收获部分中的产物,如千燥颗粒或粉末、油、脂肪及脂肪酸、淀

粉或蛋白质。

根据本发明的优选特征,受调节的表达是增加的表达。

如上文提及,用于调节(优选增加)编码MADS15蛋白质的核酸表达的 优选方法是在才直物中导入并表达编码MADS15蛋白质的核酸;然而实施所 述方法的作用即增强产量相关性状也可以使用众所周知的其它技术实现。 下文是对这些技术中某些的描述。

一种这样的技术是T-DNA激活标签化。产生的转基因植物因靠近所 导入启动子的基因的修饰表达而表现显性表型。

本发明的作用也可以使用TILLING技术(基因组内定向诱导的局部损伤)或通过同源重组而再现。

在本文中对增强的产量相关性状的参考意指植物的一个或多个部分的

获)部分。

以玉米为例,产量增加可以表现为下列一种或多种指标:每公项或英 亩植物数的增加、每林植物穂数的增加、行数的增加、每行粒数、粒重、 千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种 子数除以种子总数并乘以IOO)及其它。以稻为例,产量增加本身可以表现 为下列一种或多种指标的增加:每公项或英亩植物数、每林植物圓锥花序 数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原 圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以 种子总数并乘以100)、千粒重的增加及其它。

在具体的实施方案中,此类可收获部分是根,而本发明方法的实施产 生相对于合适对照植物的根生长,具有增加的根生长的植物。根发育是植 物生长和作物产量的关键性决定因素,因为根是从环境中提取营养物的主 要通道。

增加的根产量可以例如本身表现为下列 一种或多种指标:a)增加的根 生物量数量(因而可以通过设定某个阈值而在厚根与薄根之间作出区分)、 b)增加的平均根直径、c)增加的根总生物量和d)增加的根生物量苗生物量 比。为本发明的目的,应当理解术语"根生长"包含在单子叶植物和双子叶 植物中在不同发育期上构成根系的不同部分的生长的全部方面。将理解的 是根的增强的生长可以因根的一个或多个部分(包括主根、侧根、不定根等) 的增强的生长所致,它们均处于本发明的范围内。

由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生 长速率,这些#_物有可能在其生活周期中的对应阶段上表现增加的生长速 率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个 或多个部分(包括种子)是特异性的,或可以基本上遍及整抹植物。具有增 加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子 的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、 生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在 植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发 生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。 生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收 获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速 率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获 稻植物,随后"f番种并收获其它稻植物,全部稻植物均在一个常规生长时段 内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种 的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯 或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情 况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的 增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率

物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季) 的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生

长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是: T-Mid(植物达到其50%最大尺寸所花费的时间)和T-卯(植物达到其50% 最大尺寸所花费的时间),等等。

根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具 有增加的生长速率的植物。因而根据本发明,提供相对于增加植物生长速 率的方法,所迷方法包括调节表达、优选增加本文中所定义的编码MADS15 蛋白质的核酸在植物中的表达。

与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁 迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴 露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另 一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的

对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低d、于 40%、 35%或30%,优选小于25%、 20%或15%,更优选小于14%、 13%、 12%、 11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的 进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导 的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物 性和/或非生物性(环境)胁迫。非生物性胁迫可以因干旱或水涝、厌氧胁迫、 盐胁迫、化学毒性、氧化胁迫和热、寒冷或水冻温度所致。非生物性胁迫 可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗 透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些 胁迫。

尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以 产生相对于对照植物而具有增加的产量的植物。如在Wang等 (Planta(2003)218: l-14)中报道,非生物性胁迫导致不利地影响植物生长及 生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已 知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133: 1755-1767) 描述了干旱胁迫与高盐度胁迫间极高程度的"串话"。例如,干旱和/或盐化 作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随 高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白 变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应 答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。 如本文中所用的术语"非胁迫"条件是允许植物最佳生长的环境条件。本领 域技术人员清楚对于给定地点的正常土壤条件和气候条件。

本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在 非胁迫条件下或在轻^f鼓干旱条件下培育的植物增加的产量。因而根据本发 明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量 的方法,所述方法包括增加编码MADS15多肽的核酸在植物中表达。营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而 根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,

所述方法包括增加编码MADS15多肽的核酸在植物中的表达。营养缺乏可 以因营养物的缺乏或过量所致,所述营养物例如是氮、磷酸盐及其它含磷 化合物、钾、钙、镉、镁、锰、铁和硼等。

在本发明优选的实施方案中,产量和/或生长速率的增加根据本发明方 法在非胁迫条件下出现。

本发明方法有利地适用于任何植物。

特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤 其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、 粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作 物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、 马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘 蔗。更优选地,才直物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、 黑麦、黑小麦、高粱和燕麦。

本发明也包^^编码本文中所述MADS15蛋白质的核酸的用途和这些 MADS15蛋白质的用途,用于增强植物中的产量相关性状。

编码本文中所述MADS15蛋白质的核酸或MADS15蛋白质本身可以 用于育种程序中,其中鉴定到可以遗传地与编码MADS15的基因连接的 DNA标记。所述的核酸/基因或MA1)S15蛋白质本身可以用来定义分子标 记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明 方法中如上文所定义的增强的产量相关性状的植物。

编码MADS15蛋白的核酸/基因的等位变体也可以用于标记辅助的育 种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱 变处理而导入等位基因变异;备选地,该程序可以从非人为引起的所谓"自 然,,起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR 法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异 等位变体的植物与另 一种植物杂交。这可以用来例如产生目标表型特征的 组合。

编码MADS15蛋白的核酸也可以用作探针以便对基因进行遗传作图

或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的 标记。此类信息可以用于植物育种中,以便开发具有想要表型的抹系。编

码MADS15蛋白的核酸的这种用途仅需要具有至少15个核苷酸长度的核 #列。编码MADS15蛋白的核酸可以用作限制性片段长度多态性(RFLP) 标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J, Fritsch EF和Maniatis T(1989) Molecular Cloning, A Laboratory Manual) 可以用编码MADS15蛋白的核酸探测。产生的结合图式随后可以使用计算 机程序如MapMaker(Lander等(1987) Genomics 1: 174-181)进行遗传分析

以构建遗传图。此外,该核酸可以用来^:测含有经限制性内切核酸酶处理

的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具 有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编 码MADS15蛋白的核酸在使用这个群体先前所获得的遗传图中的位置 (Botstein等(1980) Am. J. Hum.Genet. 32: 314-331)。

在Bernatzky和Tanksley(1986) Plant Mol. Biol.Reporter 4: 37-41中 描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物 描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作 图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体 可以用于作图。此类方法学是本领域技术人员众所周知的。

所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见 Hoheisel等在:Non-mammalian Genomic Analyasis: A Practical Guide, Academic press 1996,第319-346页及其中引用的参考文献)。

在另一实施方案中,核酸^:针可以在直接荧光原位杂交(FISH)作图法

(Trask(1991) Trends Genet.7: 149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995) Genome Res. 5: 13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核 酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)丄Lab. Clin. Med 11: 95-96)、 PCR扩增片段的多态性(CAPS; Sheffield等(1993) Genomics 16: 325-332)、等位基因特异性连接(Landegren等(1988) Science 241: 1077-1080)、核苷酸延伸反应(Sokolov(1990) Nucleic Acid Res. 18: 3671)、放射杂交作图(Walter等(1997)Nat.Genet. 7: 22-28)和Happy作图 法(Dear和Cook(1989) Nucleic Acid Res. 17: 6795-6807)。对于这些方法, 使用 一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的 引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR 遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交 叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。

本发明方法产生具有增强的产量相关性状的植物,如前文所述。这些 性状也可以与经济有利的其它性状组合,如其它的产量增强性状、对其它 非生物性胁迫和生物性胁迫的耐受性、调节多种构造特征和/或生物化学特 征和/或生理学特征的性状。

下调的MADS15的详述

现已惊奇地发现降低内源性MADS15多肽的水平和/或活性产生了相 对于对应野生型才直物而具有增强的产量相关性状、尤其增加产量的植物。 本发明因而提供相对于对照植物增强产量相关性状、尤其用于增加植物产 量的方法,其包括降低内源性MADS15多肽的水平和/或活性。在本文中 对"对照植物"的引用意指其中内源性MADS15多肽的活性未降低的对应 野生型植物。

量、尤其增加的种子产量和/或增加的生物量的植物。

如本文中所定义的术语"增加的产量"意指植物的一个或多个部分的生部分。

尤其,此类可收获部分包括营养性生物量和/或种子,并且本发明方法 的实施产生相对于对照植物的产量而具有增加的产量(在营养性生物量和/ 或种子方面)的植物。

以玉米为例,产量增加可以表现为下列一种或多种指标:每公项或英 亩植物数的增加,每林植物穂数的增加、行数的增加、每行粒数、粒重、 千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种 子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现 为下列一种或多种指标的增加:每公项或英亩植物数、每抹植物圆锥花序 数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原 圓锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以 种子总数并乘以100)、千粒重的增加及其它。

种子产量的增加也可以表现为种子大小和/或种子体积的增加。这可以 增加种子中物质(如油、蛋白质和糖类)的数量或改变其组成。

根据优选的特征,本发明方法的实施产生具有增加的产量、尤其增加 的生物量和/或种子产量的植物。因而根据本发明,提供用于增加植物产量 的方法,所述方法包括优选通过下调MADS15基因或其同源物的表达而降 低MADS15多肽或其同源物的活性水平。

由于本发明的转基因植物具有增加的产量,因而相对于对应野生型植 物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的 生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物 的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整抹植物。 具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可

以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成 熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期 萌发势、生长速率、开花时间和种子成熟速度。生长速率的增加可以在植 物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发 生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收 获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速 率充分地增加,可以允许进一步播种相同植物物种的种子(例如^"种并收获 稻植物,随后^"种并收获其它稻植物,全部稻植物均在一个常规生长时段 内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种 的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯 或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情 况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的

增加(因任何特定#:物可以生长并收获的次数(如在一年中)增加)。生长速率

物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季) 的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生

长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是: T-Mid(植物达到其50%最大尺寸所花费的时间)和T-卯(植物达到其50% 最大尺寸所花费的时间),等等。

本发明方法的实施产生具有增加的生长速率的植物。因而根据本发明, 提供相对于对照植物增加植物生长速率的方法,所述方法包括优先降低内 源性MADS15基因在植物中的表达水平和/或活性。

与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁 迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴 露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另 一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的 胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的 对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于 40%、 35%或30%,优选小于25%、 20%或15%,更优选小于14%、 13%、 12%、 11%或10%或更4氐。由于农业实践(灌溉、施肥、杀虫剂处理)上的 进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导 的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物性胁迫可以因干旱或水澇、厌氧胁迫、 盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物性胁迫 可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗 透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些 胁迫。

尤其,本发明的方法可以在非胁迫条件下或在轻;f款干旱条件下实施以 产生相对于对照植物而具有增加的产量的植物。如在Wang等 (Planta(2003)218: l-14)中报道,非生物性胁迫导致不利地影响植物生长及 生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已 知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133: 1755-1767) 描述了干旱胁迫与高盐度胁迫间极高程度的"串话"。例如,干旱和/或盐化 作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随 高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白 变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应 答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。 如本文中所用的术语"非胁迫"条件是允许植物最佳生长的环境条件。本领 域技术人员清楚对于给定地点的正常土壤条件和气候条件。

非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发 明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量 的方法,所述方法包括降低内源性MADS15基因在植物中表达。

营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而 根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法, 所述方法包括降低编码MADS15多肽的核酸在植物中的表达。营养缺乏可 以因营养物的缺乏或过量所致,所述营养物例如是氮、磷酸盐及其它含磷 化合物、钾、钩、镉、镁、锰、铁和硼等。在本发明优选的实施方案中,产量和/或生长速率的增加根据本发明方 法在非胁迫条件下出现。

本发明方法有利地适用于任何植物。

特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤 其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、 树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实 例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和 烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优 选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、 黑小麦、高粱和燕麦。

在本文中对内源性MADS15蛋白质在植物中水平"降低"的引用意指 相对于对应野生型植物中存在的内源性MADS15蛋白质水平,内源性 MADS15蛋白质在蛋白质浓度上的降低或基本去除内源性MADS15蛋白 质。这种降低或基本去除可以导致植物中降低的或基本上消除的MADS15 蛋白质活性。

在本文中对才直物中内源性MADS15蛋白质活性的"降低,,的引用意指 相对于野生型#_物中存在的内源性MADS15蛋白质活性水平,MADS15 蛋白质活性的降低或内源性MADS15蛋白质活性的基本去除。

优选地,内源性MADS15蛋白质水平和/或活性的降低通过下调内源 性MADS15基因的表达而获得。

本文中提及的"内源性"MADS1基因不仅仅指如植物中以其天然形式 (即没有人类任何干预)存在的MADS15基因,还指随后导入植物的分离的 MADS15基因。例如,含有MADS15转基因的转基因植物可以遭遇 MADS15转基因表达的降低或基本去除和/或内源性MADS15基因表达的 降低或基本去除。

内源性MADS15基因表达的这种降低(或基本去除)可以使用几种公知 的基因沉默方法的任何一种或多种而实现。如本文中所用,表达的"基因沉

默"或"下调"指MADS15基因表达和/或MADS15多肽水平和/或MADS15多肽活性的降低或基本去除。

用于降低或基本去除内源MADS15基因表达的一种如此方法是RNA 介导的基因表达下调(RNA沉默作用)。沉默作用在这种情况下通过植物中 基本上与靶MADS15基因同源的双链RNA序列(dsRNA)触发。这种 dsRNA进一步由植物加工成约20-约26个核苷酸,称作短干扰性 RNA(siRNA)。 siRNA被掺入RNA诱导性沉默复合物(RISC)内,其中所述 的RISC切割MADS15靶基因的mRNA转录物,因而降低或基本上消除 待翻译成MADS15蛋白质的MADS15 mRNA的数目。

RNA沉默方法的 一个实例包括向植物导入处于有义方向的编码序列 或其部分。这种额外的基因或其部分会使内源性MADS15基因沉默,产生 称作共抑制作用的现象。当几个额外拷贝导入植物时,MADS15基因表达 的降低会更明显,因为高转录物水平与共抑制作用的触发之间存在正相关。

RNA沉默方法的另 一个实例包括使用反义MADS15核酸序列。

这种反义核酸可以使用表达载体以生物学方式产生,所述表达载体中, 核酸已经以反义方向亚克隆(即从插入的核酸中转录的RNA将与目的乾核 酸呈反义方向,这将在以下小节中描述)。优选地,反义核酸在植物中的产 生借助稳定整合的转基因而发生,其中所述的转基因包含有效用于在植物 中组成型表达的启动子、反义寡核苷酸和终止子。

用于通过RNA沉默作用降低或基本去除内源性MADS15基因表达的 优选方法是使用表达载体,其中MADS15基因或其片段作为由间隔区(非 编码性DNA)隔开的(部分或完全的)反向重复序列加以克隆。

在又一个实施方案中,内源性MADS15表达的降低或基本去除可以 通过使用核酶而获得。例如,可以构建四膜虫(Tetrahymena)L-19IVSRNA 的衍生物,其中活性部位的核苷酸序列与编码MADS15的mRNA中待切 割的核苷酸序列互补。

若在内源性MADS15基因上存在突变和/或在随后导入植物的分离的 MADS15基因上存在突变,则基因沉默也可以通过插入诱变实现。MADS15 蛋白质活性的降低或基本去除可以由无功能的MADS15引起。例如,MADS15与多种相互作用性蛋白质结合;在MADS15的MADS盒内的一 种或多种突变和/或截短作用因而可以提供这样的MADS15蛋白质:其仍 能够结合相互作用性蛋白质,但是不能表现作为转录因子的正常功能。

另一种基因沉默的方法是靶定核苷酸序列,其与MADS15基因的调节 区(例如MADS15启动子和/或增强子)互补以形成阻止MADS15基因在革巴 细胞中转录的三螺旋结构。

又一种基因沉默的方法由Hiratsu等(PIant J. 34, 733-739, 2003)描述。 这种方法不依赖与靶标基因的序列同源性,但是包括使用转录的基因融合 物中的抑制序列结构域,并且已经用来改良有农学意义的性状(Fujita等, Plant Cell 17, 3470-3488, 2005和Mitsuda at al., Plant Cell 17, 2993-3006, 2005)。 一般,在编码能够积极地影响靶定基因表达的蛋白质(如转录激活 蛋白)的基因与编码抑制结构域的核苦酸片段之间产生核苷酸嵌合融合物。

当表达所述嵌合基因融合物时,被靶定基因的表达受到抑制,通常以显性 失活方式受抑制。抑制结构域是本领域众所周知的,例如在一些AP2和锌 指转录因子内存在的EAR基序。基于抑制结构域的方法非常适于克服所 选的植物物种中被靶定基因的基因冗余性。

上文所述是用于基因沉默(用于降低或基本去除内源性MADS15基因 表达)的多种方法的实例。本发明方法依赖于降低内源性MADS15基因在 植物中的表达。例如,本领域技术人员将轻易地能够调整用于基因沉默的 前述方法,以至于通过使用适宜的启动子而在整抹植物或在其部分中实现 基因沉默。

应当指出本发明的精髓在于当降低或基本去除植物中内源性MADS15 基因表达时所发现的有利且令人惊奇的结果,并且不限于用于如此降低或 基本去除内源性MADS15蛋白质活性的任何具体方法。MADS15多肽的 活性也可以通过导入遗传修饰(优选地在MADS15基因的基因座内)而降 低或消除。如本文中所定义的基因的基因座意指这样的基因组区域,其包 括目的基因和编码区上游或下游10 kb。

遗传修饰可以例如通过下列方法的任一种(或多种)而导入:T-DNA失活法、TILLING,位点定向诱变法、定向进化法、同源重组法。在导入遗 传修饰后,开展选择MADS15多肽的降低的活性的步骤,其中活性的降低 得到具有增加的产量的植物。

T-DNA失活标签法包括在目的基因的基因组区域中或基因编码区的 上游或下游10kb以如此结构插入T-DNA,以至于该T-DNA抑制耙定基 因的表达。通常,由靶定基因的天然启动子对靶定基因表达的调节作用受 到破坏。T-DNA随机插入植物基因组,例如通过农杆菌感染,并导致在所 插入T-DNA附近的基因表达的下调。产生的转基因植物因靠近所导入 T-DNA的基因受抑制的表达而表现表型。

也可以使用TILLING(基因组内定向诱导的局部损伤)技术在 MADS15基因的基因座内导入遗传修饰。

法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology, Wiley编辑)。

定向进化也可以用来产生MADS15核酸的变体。这由反复DNA穿梭,

物学活性的MADS15多肽的MADS15核酸变体或其变体组成(Castle等, (2004) Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。

T-DNA激活法、TILLING,位点定向诱变法和定向进化法是能够产 生新等位基因和MADS15变体的技术实例。

本发明的作用也可以使用同源重组法而再现。待靶定的核酸可以是用 来替换内源基因的编码无活性蛋白质或具有降低活性的蛋白质的等位基 因,或者可以除所述内源基因之外又导入,并且需要被靶向至MADS15基 因的基因座。

其它方法,如^f吏用针对内源性MADS15的抗体以抑制该MADS15在 植物中的功能,或干扰MADS15参与其中的信号途径,将是技术人员众所 周知的。备选地,可以建立筛选程序以鉴定MADS15基因的天然变体,其 中所述的变体具有降低的MADS15活性,或无MADS15活性。此类天然变体也可以用于本发明的方法中。

为最佳性能,用于降低或基本去除内源性MADS 15基因表达的基因沉 默技术需要使用来自单子叶植物的MADS15核酸序列以转化至单子叶植 物内。优选地,来自任何给定植物物种的MADS15核酸导入同 一个物种内。 例如,将来自稻的MADS15核酸(它应当是全长MADS15序列或片段)转 化至稻植物。MADS15核酸不需要导入相同植物品种。

在本文中对"MADS15基因,,或"MADS15核酸,,的引用意指聚合形式 的任一长度的双链或单链的脱氧核糖核苷酸聚合物或核糖核苷酸聚合物, 或其类似物,它们具有天然核糖核苷酸的本质特征,因为它们可以以以类 似于天然存在的多核苷酸的方式与核酸杂交。"MADS15基因"或"MADS15 核酸"指编码MADS15的基因的进行基因沉默的足够长度的基本上连续的 核苷酸;所述长度可以短至20个或更少核苷酸。编码(功能性)蛋白质的基 因不是以上讨i仑的用于降低或基本去除MADS15内源基因表达的多种方 法所需的。

本发明方法可以使用MADS15基因/核酸的基本上连续的核苷酸的足 够长度进行,其中所述长度可以由20个或更少核苷酸组成,这些核苷酸可 以来自MADS15基因/核酸的任何部分,如在MADS15基因家族中非常保 守的或编码下文所述保守基序之一的编码区的5'末端。

MADS15基因是本领域众所周知的,并且用于本发明方法中的 MADS15基因是在Moon等(Plant Physiol. 120, 1193-1204, 1999)中描述 的植物MADS15基因/核酸的基本上连续的核苷酸。

其它MADS15基因/核酸序列也可以用于本发明方法中,并且可以轻 易地由本领域^支术人员鉴定。MADS15多肽可以因存在几个公知特征(见下 文)的一个或多个而鉴定。当答定到MADS15多肽时,本领域技术人员可 以使用惯用技术而容易地得出相应的编码核酸,并使用该核酸的足够长度 的连续核苷酸来实施任何一种或多种上文所述的基因沉默方法。

如本文中所定义的术语"MADS15多肽或其同源物,,指属于如Adam等 (J. Mol. E第62巻,15-31 )所阐明的FUL样MADS盒蛋白质的组的蛋白质。FUL样MADS盒蛋白质是SQUAMOSA亚家族的部分并具有典型的 MIKCc构造:在氨基端的MADS结构域(M),接着是参与二聚化的间插结 构域(I),高度保守的角蛋白结构域(K)和负责结合相互作用性蛋白质或转录 激活的在羧基端的可变结构域(C)(De Bodt等Trends in Plant Science 8, 475-483)。

植物MADS15多肽也可以因某些保守基序的存在而得到鉴定。这些保 守基序的存在可以使用如上文所述的用于比对序列用于比较的方法进行鉴 定。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用 BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称 作"期望"值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。 一旦通过这些基序的存在鉴定了 MADS15多肽,本领域技术人员可以容易 地得到编码包含有关基序的多肽的相应核酸,并使用该核酸的足够长度的 连续核苷酸来实施任何一种或多种上文所述的基因沉默方法(用于降低或 基本去除内源性MADS15基因表达)。

通常,基序1至4至少之一的存在应当足以鉴定任一查询序列为 MADS15,然而优选地存在至少基序1和2。所提供的共有序列以序列表 中给出的单子叶植物序列为基础。本领域技术人员会十分清楚若(例如来自 双子叶植物序列)其它序列或不同序列用于比较,则共有序列可以存在一定 的变化。

位于MADS结构域内的基序l(SEQ ID NO:114):

L(E/D)R。

优选地,这种保守序列基序1具有以下序列

R)M(D/E)(R/K)ILER,

最优选地,保守序列基序1具有以下序列:

LLKKAHEISVLCDAEVAAIVFSPKGKLYEYATDS腹DKILER位于K结构域内的基序2(SEQ ID NO:115): LMGE

优选地,这种保守序列基序2具有以下序列:

KLKAK(V學(A/T)(L/I)QK(S/C)(Q/H)(跳)HLMGE

更优选地,这种保守序列基序2具有以下序列:

KLKAKIE環KCHKHLMGE

任选地,MADS15多肽或其同源物可以在C结构域中包含基序3和/ 或基序4:

基序3(SEQ ID NO:116):

Q(P/Q/V/A)QTS(S/F)(S/F)(S/F)(S/F)(S/C/F)(歷) 基序4(SEQ ID NO:117):

(G/A/V/L)(L/P)XWMX(S/H)

其中在基序4中的X残基可以是任一氨基酸,不过优选是L、 P或H; 并且其中第二X残基可以是任一氨基酸,不过优选是V或L。

备选地,C-结构域(在角蛋白结构域后开始,即在SEQ ID NO:llO中 的R175处)可以以增加的谷氨酰胺出现率为特征(通常是3.93%,这里至少 是8.77%,最大26,73%),此外,丙氨酸、脯氨酸和/或丝氨酸的含量也可 以增加(分别高于7.8%、 4.85%和6.89%)。

另外提出的、用于本发明方法中的优选MADS15蛋白质至少包含对应 于SMART结构域SM00432(Pfam PF00319)的氨基端MADS结构域,随 后是与Pfam中定义为PF01486的K盒区对应的角蛋白结构域,更优选地, MADS15蛋白质在其MADS结构域内具有保守标签SEQ ID NO:114并且 在其K-结构域中具有保守标签SEQ ID NO:115,最优选地,MADS15蛋 白质具有在SEQID NO:110中给出的序列。

如上文定义的同源物可以使用本领域众所周知的惯用技术如通过序列 比对而轻易鉴定;OsMADS15的同源物可能已经在多个植物物种中命名, 因而基因/蛋白质名称不应当用于鉴定直向同源物或旁系同源物。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、 BLAST、 FASTA和TFASTA。 GAP使用Needleman和Wunsch的算法 ((1970) J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的 两个完整序列的比对。BLAST算法(AItschul等(19卯)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分 析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获 得的。同源序列可以使用ClustalW多重序列比对算法(1.83版本)例如以默 i人配对比对参数和以百分数计的评分方法轻易地鉴定。可以进行细孩i手工 编辑以优化保守基序之间的最佳比对(见下文),如本领域技术人员显而 易见。

MADS15蛋白质中的多个结构性结构域可以使用专业化数据库例如 SMART(Schultz等(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic等(2002) Nucleic Adds Res 30 , 242-244)、 InterPro(MuIder等,(2003) Nucl. Acids. Res. 31, 315-318; )、 Prosite(Bucher和Bairoch(1994),用于 生物分子序列基序的广义图谱语法及其在自动化序列判读中的功 能.(In)lSMB-94;第二届分子生物学智能系统国际会i义文集.Altman R., BrutlagD., Karp P., LathropR., Searls D.编辑,第53-61页,AAAIP腦, Menlo Park; Hulo等,Nucl. Acids. Res. 32: D134-D137,(2004》或 Pfam(Bateman等,Nucleic Acids Research 30(1): 276-280(2002))加以鉴定。

另外,MADS15蛋白质也可以因能够结合DNA及与其它蛋白质相互 作用而是可鉴定的。I)NA结合活性及蛋白质-蛋白质相互作用可以使用本 领域众所周知的^支术而轻易地在体外或在体内确定。用于DNA结合活性 的体外测定法的实例包括:使用已知MADS盒DNA结合结构域的凝胶阻 滞分析(West等(1998) Nucl Acid Res 26(23): 5277-87),或酵母单杂交分析。 用于蛋白质-蛋白质相互作用的体外测定法的实例是酵母双杂交分析 (Fields和Song(1989) Nature 340: 245-6)。已知与OsMADS15相互作用的 蛋白质包括其它MADS蛋白质(如参与开花信号作用复合体的那些MADS 蛋白质)、受体样激酶如Clavatal和Clavata2、 Erecta、 BRI1或RSK。因而一旦利用 一种或几种如上所述特征而鉴定MADS15多肽,本领域 技术人员可以容易地得到编码所述多肽的相应核酸,并使用该核酸的足够 长度的连续核苷酸来实施任何一种或多种上文所述的基因沉默方法(用于

降低或基本去除内源性MADS15基因表达)。

优选用于本发明方法中的是SEQ ID NO:109(OsMADS15)的足够长度 的基本上连续的核苷酸,或使用如此核酸序列的足够长度的基本上连续的 核苷酸,其中所述的核酸序列编码OsMADS15(SEQ ID NO:109)的直向同 源物或旁系同源物。在下表D中提供OsMADS15的此类直向同源物和旁 系同源物的实例。OsMADS15的近亲同源物由SEQ ID NO:147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171和173代表的蛋白

质。'、 、。5义、…1'、 、、、

blast搜索而容易地找到。这可以通过第一 BLAST进行,其中所述的第一 BLAST包括将查询序列(例如SEQ ID NO:l()9或SEQ ID NO:110)针对任 一序列数据库(如^^众可用的NCBI数据库)进行BLAST搜索。当从核苷酸 序列开始时,可以使用BLASTN或TBLASTX(使用标准默认值),并且当 从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。 任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序 列以针对来自生物的序列进行反向BLAST搜索(第二 BLAST),其中查询 序列从所述的生物中衍生(其中在查询序列是SEQ ID NO:109或SEQ ID NO:110的情况下,第二 BLAST因而将针对稻序列)。随后比较第一和第 二 BLAST搜索的结果。若来自第一 BLAST的高阶位命中源自与查询序列 从其中衍生的物种相同的物种,则鉴定到旁系同源物;若高阶位命中不源 自与查询序列从其中衍生的物种相同的物种,则鉴定到直向同源物。高阶 位命中是具有^氐E-值的那些命中。E-值越低,评分越显著(或换句话说,此 命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。在大型 家族的情况下,可以使用ClustaIW,随后使用邻接树法以便帮助显示相关 基因的聚类和以^^鉴定直向同源物和旁系同源物。MADS15基因/核酸的基本上连续的核苷酸的来源可以是任一植物来 源或人工来源。为最佳性能,用于降低或基本去除内源性MADS15基因表 达的基因沉默技术需要使用来自单子叶植物的MADS15序列以转化至单 子叶植物内。优选地,将来自禾本科的MADS15序列转化入禾本科植物。 还优选地,来自稻的MADS15核酸(它应当是全长MADS15序列或片段) 转化进入稻植物。MADS15核酸不需要导入相同的植物品种。最优选地, 来自稻的MADS15核酸是SEQ ID NO:109(OsMADS15)的足够长度的基本 上连续的核苷酸或如此核酸序列的足够长度的基本上连续的核香酸,其中 所述的核酸序列编码OsMADS15(SEQ ID NO:109)的直向同源物或旁系同 源物。如上文提及,本领域技术人员会充分了解什么将构成旨在开展上文 所定义任一基因沉默方法的基本上连续的核苷酸的足够长度,这种长度可 以在一些情况下是20个或更少的基本上连续的核苷酸。

本发明还提供遗传构建体和载体以促进导入和/或表达用于本发明方 法中的核苷酸序列。

因而,提供这样的基因构建体,其包含能够驱动有义和/或反义 MADS15核,列在植物中表达以至于使内源性MADS15基因在植物中 沉默的一种或多种调控序列;并且任选地包含转录终止序列。优选地,调 控序列是组成型启动子和遍在启动子。

用于基因沉默的优选构建体是包含MADS15基因或其片段的反向重 复序列(其优选能够形成发夹结构)的构建体,其中所述的反向重复序列处 在组成型启动子控制下。

因而,本发明提供了构建体,其包含:

能够形成发夹结构的MADS15核酸;

能够驱动(a)的核酸序列表达的一种或多种调控序列;和任选地 转录终止序列。

本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组 DNA技术产生。该基因构建体可以插入适于转化至植物内并适于在转化的 细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发明因而提供如上文所定义的基因构建体在本发明方法中的用途。

目的序列与能够在植物中增加表达的一种或多种调控序列(至少与启 动子)有效连接。

有利地,任何类型的启动子可以用来驱动核酸序列的表达。启动子可 以是诱导型启动子,即在应答于发育性、化学性、环境性或物理性刺激时 具有受诱导或增加的转录启动。额外或备选地,启动子可以是组织优选性 启动子或细胞优选性启动子,即能够优先在某些组织如叶、根、种子组织 等内或甚至在特定细胞中启动转录的启动子。仅能够在某些组织或细胞中 启动转录的启动子在本文中分别称作"组织特异性"或"细胞特异性"。

优选地,MADS15核酸或其功能性变体有效地与组成型启动子连接。 优选地,该启动子是遍在启动子并且主要在整林植物范围内表达。优选地, 能够使核酸优先在整抹植物范围内表达的组成型启动子具有与GOS2启动 子相当的表达谱。更优选地,该组成型启动子具有与稻GOS2启动子相同 的表达谱,最优选地,能够使核酸优先在整林植物范围内表达的启动子是 来自稻的G()S2启动子(SEQ IDNO:113或SEQ IDNO:174)。应当明白本 发明的适用性不限于由SEQ ID NO:109代表的MADS15核酸,同时本发 明的适用性也不限于在GOS2启动子驱动时表达MADS15核酸。用于本发 明方法中的替代性组成型启动子是高速泳动族蛋白启动子(PR00170, WO2004070039中的SEQ ID NO:40)。也可以用来驱动MADS15核酸表达 的其它组成型启动子的实例在"定义"部分中显示。

任选地, 一种或多种终止子序列可以在导入植物的构建体中使用。额 外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知 道可以在实施本发明中适用的终止子序列和增强子序列。本领域技术人员 会知道或可以轻易地获得此类序列。

本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/ 或复制的复制起点序列。 一个实例是当需要将遗传构建体在细菌细胞中维 持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但 不限于fl-ori和colEl 。遗传构建体可以任选地包含选择标记基因。本发明也包括通过本发明方法可获得的植物,包括植物部分,其中所 述的植物相对于对照植物具有增加的产量并且具有降低的或基本上去除的

内源性MADS15基因表达。

本发明还提供相对于对照植物产生具有增加的产量的转基因植物的方

法,其中所述转基因植物具有降低的或基本上去除的内源性MADS15基因 表达。

更具体地,本发明提供用于产生具有增加的种子产量的转基因植物的 方法,所述方法包4舌:

在植物、植物部分或植物细胞中导入并表达基因构建体,所述的基因 构建体包含能够优先驱动MADS15核酸序列的反向重复序列在植物中表 达以至于使内源性MADS15基因在植物中沉默的一种或多种调控序列;和

在促进植物生长和发育的条件下培育所述植物、植物部分或植物细胞。

优选地,导入植物的构建体是包含MADS15基因或其片段的(部分或 完全)反向重复序列(其优选能够形成发夹结构)的构建体。

根据本发明的优选特征,该构建体通过转化而导入植物。

通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在, 其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将 转化的材料再生成整抹植物。

在DNA转移和再生后,推测的转化植物可以例如^f吏用Southern分析 对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新 导入DNA的表达水平可以4吏用Northern和/或Western分析或定量PCR 进行监测,全部技术是本领域内普通技术人员众所周知的。

产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或 经典育种4支术。例如,第一代(或Tl)转化植物可以进行自交以产生纯合的 第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。

产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非 转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞); 转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。

本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞 或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已 经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整林植物

后代相同的基因型特征和/或表型特征。

本发明也扩展至植物的可收获部分,如种子和来自、优选直接来自这 种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、 淀粉或蛋白质。

本发明也包含MADS15核酸用于降低或基本去除植物中内源性 MADS15基因表达以增加如上文所定义的植物种子产量的用途。

编码本文中所述MADS15蛋白质的核酸或MADS15蛋白质本身可以 用于育种程序中,其中鉴定到可以遗传地与编码MADS15的基因连接的 DNA标记。所述的核酸/基因或MADS15蛋白质本身可以用来定义分子标 记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明 方法中如上文所定义的增强的产量相关性状的植物。

编码MADS15蛋白的核酸/基因的等位变体也可以用于标记辅助的育 种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱 变处理而导入等位基因变异;备选地,该程序可以从非人为引起的所谓"自 然,,起源的一組等位变体开始。随后进行等位变体的鉴定,例如通过PCR 法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。 一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选 择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异 等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的 组合。

编码MADS15蛋白的核酸也可以用作探针以便对基因进行遗传作图 或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的 标记。此类信息可以用于植物育种中,以便开发具有想要表型的抹系。编码MADS15蛋白的核酸的这种用途仅需要具有至少15个核苷酸长度的核 ^列。编码MADS15蛋白的核酸可以用作限制性片段长度多态性(RFLP) 标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J, Fritsch EF和Maniatis T(1989) Molecular Cloning, A Laboratory Manual) 可以用编码MADS 15蛋白的核酸探测。产生的结合图式随后可以使用计算 机程序如MapMaker(Lander等(1987) Genomics 1: 174-181)进行遗传分析 以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理 的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具 有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编 码MADS15蛋白的核酸在使用这个群体先前所获得的遗传图中的位置 (Botstein等(1980) Am. ,J. Hum.Genet. 32: 314-331)。

在Bernatzky和Tanksley(1986) Plant Mol. Biol.Reporter 4: 37-41中 描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物 描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作 图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体 可以用于作图。此类方法学是本领域技术人员众所周知的。

所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见 Hoheisel等在:Non-mammalian Genomic Analyasis: A Practical Guide, Academic press 1996,第319-346页及其中引用的参考文献)。

在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991) Trends Genet.7: 149-154)中使用。尽管当前的FISH作图法 支持使用大型克隆(几个kb至几百个kb;见Laan等(1995) Genome Res. 5: 13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核 酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)丄Lab. Clin. Med 11: 95-96)、 PCR扩增片段的多态性(CAPS; Sheffield等(1993) Genomics 16: 325-332)、等位基因特异性连接(Landegren等(1988) Science 241: 1077-1080)、核香酸延伸反应(Sokolov(1990) Nucleic Acid Res. 18:3671)、放射杂交作图(Walter等(1997)Nat.Genet. 7: 22-28)和Happy作图 法(Dear和Cook(1989) Nucleic Acid Res. 17: 6795-6807)。对于这些方法, 使用 一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的 引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR 遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交 叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。

本发明方法产生具有增强的产量相关性状的植物,如前文所述。这些 性状也可以与经济有利的其它性状组合,如其它的产量增强性状、对其它 非生物性胁迫和生物性胁迫的耐受性、调节多种构造特征和/或生物化学特 征和/或生理学特征的性状。

PLT的详述

现已惊奇地发现增加编码PLT转录因子多肽的核酸表达产生相对于 对照植物具有增强的产量相关性状、尤其增加的产量的植物。

根据本发明,提供相对于对照植物用于增加植物产量的方法,包括增 加编码PLT转录因子多肽的核酸在植物中的表达。

如本文中所定义的术语"增加的产量"意指植物的一个或多个部分的生 部分。

尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于对 照植物的种子产量具有增加的种子产量的植物。

以玉米为例,产量增加可以表现为下列一种或多种指标:每公项或英 亩植物数的增加,每林植物穗数的增加、行数的增加、每行粒数、粒重、 千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种 子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现 为下列一种或多种指标的增加:每公项或英亩植物数、每林植物圆锥花序 数、每圆锥花序小穂数、每圆锥花序花(小花)数(其表达为饱满种子数对原 圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。

才艮据本发明的优选特征,本发明方法的实施产生相对于对照植物具有 增加的种子产量的植物。因而根据本发明,提供相对于对照植物的种子产 量用于增加植物中种子产量的方法,所述方法包括增加编码PLT转录因子 多肽的核酸在植物中的表达。

由于本发明的转基因植物具有增加的产量,因而相对于对应野生型植 物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的 生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物 的 一个或多个部分(包括种子)是特异性的,或可以基本上遍及整抹植物。 具有增加的生长速率的植物甚至可以表现早开花。生长速率的增加可以在 植物生活周期中的一个或多个阶段上或在整个植物生活周期期间发生。增

苗时增加的幼苗萌发势)。生长速率的增加可以改变植物的收获周期,允许 植物较晚播种和/或较早收获,否则这将不可能。若生长速率充分地增加, 可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播 种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若 生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种 并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适 植物)。从相同的^^艮茎中收获额外次数在 一 些作物植物的情况中也是可能 的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特 定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以 允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培

育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境 条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以

通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达 到其50 %最大尺寸所花费的时间)和T-90(植物达到其50 %最大尺寸所花费 的时间),等等。

本发明方法的实施产生具有增加的生长速率的植物。因而根据本发明,提供用于增加植物生长速率的方法,所述方法包括增加编码PLT转录因子 多肽的核酸在植物中的表达。

与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁 迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴 露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另 一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的 胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的 对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于

40%、 35%或30%,优选小于25%、 20%或15%,更优选小于14%、 13%、 12%、 11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的 进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导 的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物 性和/或非生物性(环境)胁迫。非生物性胁迫可以因干旱或水涝、厌氧胁迫、 盐胁迫、化学毒性、氧化胁迫和热、寒冷或水冻温度所致。非生物性胁迫 可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗 透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些 胁迫。

尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以 产生相对于对照植物而具有增加的产量的植物。如在Wang等 (Planta(2003)218: l-14)中报道,非生物性胁迫导致不利地影响植物生长及 生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已 知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133: 1755-1767) 描述了干旱胁迫与高盐度胁迫间极高程度的"串话"。例如,干旱和/或盐化 作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随 高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白 变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应 答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语,,非胁迫,,条件是允许植物最佳生长的环境条件。本领 域技术人员清楚对于给定地点的正常土壤条件和气候条件。

本发明方法的实施赋予在非胁迫条件下或在轻微干旱条件下培育的植 物相对于在相当的条件下培育的对照植物增强的产量相关性状。因而根据 本发明,提供用于增强在非胁迫条件下或在轻微干旱条件下培育的植物中 产量相关性状、尤其用于增加产量的方法,所述方法包括增加编码PLT转 录因子多肽的核酸在植物中的表达。

本发明方法有利地适用于任何植物。

特別用于本发明方法中的植物包括属于植物界超家族的全部植物,尤 其单子叶植物和双子叶植物,包括飼用或饲料豆类、观赏植物、粮食作物、 树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实 例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和 烟草。培育用于油料生产的常见作物植物的实例包括大豆、向日葵、棉花、 卡诺拉油菜、花生或椋榈。培育用于淀粉生产的常见作物植物的实例包括 稻、小麦、大麦、玉米或马铃薯。还优选地,植物是单子叶植物。单子叶 植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、 小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。

如本文中所定义的术语"PLT转录因子多肽"指以递增优选顺序与

SEQIDNO:191所代表的AP2结构域具有至少70。/0、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%或99%序列同 一性的任一多肽。

优选地,选择的PLT转录因子多肽是在其天然遗传环境下基本上在植 物的根(地下部分)中表达的PLT转录因子多肽。

还优选地,PLT转录因子多肽包含一种基序,不过优选地同时包含如 SEQ ID NO:192 PK(V/L)(A/E)DFLG所代表的基序1和如SEQ ID NO:209 (V/L)FX(M/V)WN(D/E)所代表的基序2,其中X可以是任一氨基酸;优选 地基序2具有SEQ ID NO:193的序列(V/L)F(T/S/N)(M/V)WN(D/E)。

与SEQ ID NO:191所代表的AP2结构域递增优选顺序包含至少70%、 75%、 80%、 85%、卯%、 95%、 96%、 97%、 98%或99%序列同一性的PLT转录因子多肽的实例是由实施例部分的表1中给出的序列代表的蛋白

质。优选的实例由SEQIDN():176和SEQIDNO:178^表。

PLT转录因子多肽中的AP2结构域可以使用专业化数据库例如 SMART(Schultz等(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic等(2002) Nucleic Acids Res 30, 242-244) 、InterPro(Mulder等,(2003) Nucl. Acids. Res. 31, 315-318)、 Prosite(Bucher和Bairoch(1994),用于生 物分子序列基序的广义图谱语法及其在自动化序列判读中的功 能.(In)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R., BrutlagD., KarpP., LathropR., SearlsD.编辑,第53-61页,AAAIPress, Menlo Park; Hulo等,Nucl. Acids. Res. 32: D134-D137,(2004))或 Pfam(Bateman等,Nucleic Acids Research 30(1): 276-280(2002))加以鉴定。 PLT转录因子的AP2结构域包含两个重复序列Rl和R2,每个重复序列 长约68个氨基酸并且由接头区隔开(图13)。

如SEQ U) NO:191所代表的AP2结构域可以使用如上文所述的用于 比对序列用于比较的方法进行鉴定。在一些情况下,可以调整默认参数以 调节搜索法的严格性。例如使用BLAST,可以提高用于报告针对数据库序 列的匹配的统计显著性阈值(称作"期望,,值)以显示严格性较低的匹配。以 这种方式,可以鉴定几乎精确的短匹配,包括如SEQ ID NO:192所代表的 基序1和如SEQ ID NO:209所代表、优选如SEQ ID NO:193所代表的基 序2。

同源蛋白质)V以使用本领:或众所周知的惯用l支术如通过序列比^/而轻^ 地鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包 括GAP、 BESTFIT、 BLAST、 FASTA和TFASTA。 GAP 4吏用Needleman 和Wunsch算法((1970) J Mol Biol 48:443-453)以找到使匹配数最大化并使 空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(19卯)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的 统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)

以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。可以进行 细微手工编辑以优化保守基序之间的比对,如本领域技术人员显而易见。 同源物也包括直向同源物和旁系同源物。直向同源物和旁系同源物可

以通过开展所谓交互性blast搜索而容易地找到。这可以通过第一 BLAST 进行,其中所述的第一 BLAST包括查询序列(例如SEQ ID NO:175、 SEQ ID NO:176、 SEQ ID NO:177或SEQ ID N():178)针对任一序列数据库(如 公众可用的NCBl数据库)进行BLAST搜索。当从核苷酸序列开始时,可 以使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开 始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以歸 选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自 生物的序列进行反向BLAST搜索(第二 BLAST),其中查询序列从所述的 生物中衍生(其中在查询序列是SEQ ID NO:175、 SEQ ID NO:176、 SEQ ID NO:177或SEQ ID NO:178的情况下,第二 BLAST因而将针对拟南芥序 列)。随后比较第一和第二 BLAST搜索的结果。若来自第一 BLAST的高 阶位命中源自与查询序列从其中衍生的物种相同的物种,则鉴定到旁系同 源物;若高阶位命中不源自与查询序列从其中衍生的物种相同的物种,则 鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评 分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是 本领域众所周知的。在大型家族的情况下,可以使用ClustaIW,随后使用 邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源 物。除了 E-值外,比较结果还由同一性百分数记分。同一性百分数指两个 所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸) 数目。PLT转录因子多肽同源物以递增优选顺序与如SEQ ID NO:176或 SEQ ID NO:178所代表的未修饰PLT转录因子多肽具有至少25%、 30%、 40%、 50%、 60%、 70%、 80%、 85%、 90%、 95%、 96%、 97%、 98% 或99%或更高的序列同一性或相似性(功能同一性)。 一般认为PLT转录因 子多肽同源物之间在AP2结构域以外的同一性百分数很低。优选地,PLT转录因子多肽同源物包含这样的AP2结构域,其以递增优选顺序与SEQ ID NO:191所代表的AP2结构域具有至少70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%或99%的序列同一性。还优选地,PLT转录因子 多肽同源物如由SEQ ID NO:180、 SEQ ID NO:182、 SEQ ID NO:184、 SEQ IDNO:186、 SEQ ID NO:188、 SEQ ID NO:200和SEQ ID NO:202代表。 PLT多肽可以是SEQ ID NO:176或SEQ ID NO:178的衍生物。"衍生 物"包括这样的肽、寡肽、多肽,它们与天然存在形式的蛋白质(如在SEQ ID NO:176或SEQIDNO:178中显示的一种蛋白质)的氨基酸序列相比,包含 以非天然存在的氨基酸残基对氨基酸的置换或非天然存在的氨基酸残基的 添加。SEQ ID NO: 180、 SEQ ID NO: 182、 SEQ ID NO: 184、 SEQ ID NO:186、 SEQIDNO:188、 SEQ ID NO:200和SEQ ID NO:202的衍生物 是可以在本发明方法中适用的又一些实例,前提是它们具有相同或相似的 生物学活性。

另外,PLT转录因子多肽(至少以其天然形式)一般具有DNA结合活性 和激活结构域。本领域技术人员可以使用惯用技术和方法而容易地确定激 活结构域的存在和DNA-结合活性。与PLT转录因子多肽(例如在转录复合 体中)相互作用的蛋白质可以使用对于本领域技术人员而言的标准技术容 易地加以鉴定。

编码PLT转录因子多肽的核酸的实例括但不限于由SEQ ID NO:175、 SEQIDNO:177、 SEQ ID NO:179、 SEQlDNO:181、 SEQ I關O:亂 SEQ ID NO:185、 SEQ ID NO:187、 SEQ ID N():199和SEQ ID NO:201

的任一种所代表的那些核酸。编码PLT转录因子多肽的核酸的变体可以适 用于本发明方法中,前提是它们具有提供相同或相似的生物学活性。合适 的变体包括编码PLT转录因子多肽的核酸和/或能够与编码PLT转录因子 多肽的核酸/基因杂交的核酸的部分。其它变体包括编码PLT转录因子多 肽的核酸的剪接变体和等位变体。

如本文中所定义的术语"部分"指编码多肽的一段DNA,其中所述的多 肽以递增优选顺序与SEQ ID NO:191所代表的AP2结构域包含至少70%、75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%或99%的序列同 一性。 该部分也可以包含一种基序,不过优选地同时包含如SEQ II) NO:192所代 表的基序1和如SEQIDNO:209所代表的基序2;优选地,基序2具有如 SEQ ID NO:193所代表的序列。

部分可以例如通过对编码PLT转录因子多肽的核酸产生一个或多个 缺失而制备。所述的部分可以以分离的形式使用或它们可以与其它编码性 (或非编码性)序列融合,以便例如产生结合几种活性的蛋白质。当与其它 编码序列融合时,翻译时产生的所得多肽可以比对PLT转录因子部分所预 测的多肽更大。优选地,所述的部分编码这样的多肽,其具有与SEQ ID NO:176和SEQ ID N():178的PLT转录因子多肽基本上相同的生物学活 性。

优选地,所述部分是由实施例的表I中列出的任何一种序列所代表的 核酸的部分。最优选地,此部分是如SEQ ID NO:175和SEQ ID NO:177 所代表的核酸的部分。

编码用于本发明方法中的PLT转录因子多肽的核酸的另一种变体是

能够在降低的严格性条件下、优选在严格条件下与从如上文所定义核酸衍 生的探针杂交的核酸,其中杂交序列编码这样的多肽,其以递增优选顺序 与SEQ ID NO:191所代表的AP2结构域包含至少70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%或99%的序列同一性。杂交序列也可以包 含任一种基序,不过优选地同时包含如SEQ ID NO:192所代表的基序1和 /或如SEQ ID NO:209所代表、优选如SEQ 1D NO:193所代表的基序2。

优选地,该杂交序列是这样的序列,其能够与由实施例的表I中列出 的任何一种序列所代表的核酸(或来自其的探针)杂交,或与任一前述序 列(靶序列)的部分杂交。最优选地,杂交序列能够与SEQIDNO:175或与 SEQ ID NO:177(或与从其中衍生的探针)杂交。探针通常小于1000 bp长 度、优选小于500 bp长度。通常,对于DNA-DNA杂交(如Southern印迹) 的揮_针长度是在100与50 bp之间变化,而杂交区域在用于DNA-DNA杂 交(如在PCR度。

PLT转录因子多肽可以由剪接变体编码。如本文中所用的术语"剪接 变体,,包含如此核酸序列的变体,在所述的核酸序列中已经切除、替换、代 替或添加所选择的内含子和/或外显子,或其中内含子已经缩短或加长。此 类变体将是其中保留蛋白质的主要生物学活性的变体,这可以通过选择性 地保留蛋白质的功能性区段而实现。此类剪接变体可以在自然界中找到或 可以人工产生。用于产生此类剪接变体的方法是本领域众所周知的。

优选的剪接变体是编码PLT转录因子多肽的核酸的剪接变体,其中所 述的PLT转录因子多肽以递增优选顺序与SEQ ID NO:191所代表的AP2 结构域包含至少70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98% 或99。/。的序列同一性。该剪接变体也可以包含任一种基序,不过优选地同 时包含如SEQ ID NO:192所代表的基序1和/或如SEQ ID NO:209所代表、 优选如SEQ ID NO:193所代表的基序2。

编码包含如上文所定义特征的PLT转录因子多肽的核酸的其它优选 剪接变体是由实施例的表I中列出的任何一种序列所代表的核酸的剪接变 体。最优选是如SEQ II) N():175和SEQ ID NO:177所代表的核酸序列的 剪接变体。

PLT转录因子多肽也可以由编码多肽的核酸的等位变体编码,其中所 述的多肽以递增优选顺序与SEQ ID NO:191所代表的AP2结构域包含至 少70%、 75%、 80%、 85%、卯%、 95%、 96%、 97%、 98%或99%的序 列同一性。该等位变体也可以包含任一种基序,不过优选地同时包含如 SEQ ID N():192所代表的基序1和/或如SEQ ID NO:209所代表、优选如 SEQ ID NO:193所代表的基序2。

编码包含如上文所定义特征的PLT转录因子多肽的核酸的优选等位 变体是由实施例的表I中列出的任何一种序列所代表的核酸的剪接变体。 最优选是如SEQ 1D NO:175和SEQ ID N():177所代表的核酸序列的等位 变体。

编码PLT转录因子多肽的核酸表达的增加导致升高的对应mRNA水平或多肽水平,这可以等同于升高的PLT转录因子多肽活性;或该活性也 可以在多肽水平无变化时、甚至在多肽水平降低时升高。当例如通过产生 比野生型多肽具有更高活性的突变形式而改变多肽的固有特性时,这种情 况可以出现。

定向进化(或基因改组)可以用来产生编码PLT转录因子多肽的核酸的 变体。这由反复DNA穿梭,随后适当筛选和/或选择以产生编码PLT转录

分组成(Castle et al" (2004) Science 304(5674): 1151-4;美国专利5,811,238 和6,395,547)。

位点定向诱变可以用来产生编码PLT转录因子多肽的核酸的变体。几 种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Cmrent Protocols in Molecular Biology. Wiley编辑》

定向进化和位点定向诱变是能够产生编码PLT转录因子多肽的核酸 的变体的技术实例,其中所述的PLT转录因子多肽具有用于实施本发明方 法的改良活性。

编码PLT转录因子多肽的核酸可以来自任何自然来源或人工来源。核 酸可以就组成和/或基因组环境方面通过人类有意操作而从其天然形式修 饰。PLT转录因子核酸优选来自植物,优选来自双子叶植物,还优选来自 十字花科,更优选来自拟南芥属,该核酸最优选来自拟南芥。

本发明方法依赖于编码PLT转录因子多肽的核酸在植物中增加的表 达。此核酸可以是全长核酸或可以是如前文所定义的部分或杂交序列或另 一种核酸变体。

本发明方法依赖于编码PLT转录因子多肽的核酸在植物中增加的表达。

本发明也提供遗传构建体和载体以促进在植物中导入和/或表达用于 本发明方法中的核酸序列。

因而,提供了基因构建体,其包含: 编码如上文所定义的PLT转录因子多肽的核酸;一种或多种调控序列,其中至少 一种是中等强度的组成型启动子。 本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组

DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的 细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发 明因而提供如上文所定义的基因构建体在本发明方法中的用途。

植物用包含目的序列的栽体(即编码PLT转录因子多肽的核酸)转 化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞 而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列 (至少与启动子)连接。

编码PLT转录因子多肽的核酸或其变体有效连接组成型启动子、优选 中等强度的组成型启动子。组成型启动子在生长及发育的大部分、但非全 部阶段期间有转录活性并且基本上以中等水平遍在地表达。启动子强度和/ 或表达模式可以如在"定义,,部分中所述分析。启动子强度和/或表达模式可 以例如与充分表征的苗优选的参考启动子如Cab27启动子(弱表达, GenBank AP004700)或推测的原叶绿素酸酯还原酶启动子(强表达, GenBankAL606456)的启动子强度和/或表达模式比较。优选地,用于本发 明方法中的启动子来自植物、还优选来自单子叶植物,最优选的是使用 GOS2启动子(来自稻)(SEQ ID NO:194或备选地SEQ ID NO:210)。应当 明白本发明的适用性不限于由SEQ ID NO:175或SEQ ID NO:177代表的

因子多肽的核酸的表达。也可以用来驱动编码PLT转录因子多肽的核酸表 达的其它组成型启动子的实例在"定义"部分中显示。

任选地, 一种或多种终止子序列(也是调控序列)可以在导入植物的构 建体中使用。额外的调节元件可以包括转录增强子以及翻译增强子。本领 域才支术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。 其它调控序列(除启动子、增强子、沉默子、内含子序列、3, UTR和/或5, UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知 道或可以轻易地获得此类序列。本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/ 或复制的复制起点序列。 一个实例是当需要将遗传构建体在细菌细胞中维 持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但

不限于fl-ori和colEl。遗传构建体可以任选地包含选择标记基因。

本发明也包括通过本发明方法可获得的植物。本发明因而提供通过本 发明方法可获得的植物、植物部分或其植物细胞,其中所述的植物或其部 分或细胞包含编码在组成型启动子、优选非病毒性组成型启动子控制下的 PLT转录因子多肽的核酸转基因。

本发明也提供相对于对照植物产生具有增加的产量的转基因植物的方 法,包括在植物中导入并优先表达编码PLT转录因子多肽的核酸。

更具体地,本发明提供用于产生具有增加的产量的转基因植物的方法, 所述方法包括:

在植物中导入并表达编码PLT转录因子多肽的核酸;和

在促进植物生长和发育的条件下培育植物细胞。

核酸可以直接导入植物细胞或导入植物本身(包括导入组织、器官或植 物的任何其它部分)。根据本发明的优选特征,核酸优选地通过转化而导入 植物。

通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在, 其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将 转化的材料再生成整抹植物。

在DNA转移和再生后,推测的转化植物可以例如使用Southern分析 对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新 导入DNA的表达水平可以使用Northern和/或Western分析或定量PCR 进行监测,全部技术是本领域内普通技术人员众所周知的。

产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或 经典育种技术。例如,第一代(或T1)转化植物可以进行自交以产生纯合的 第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。

产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);

转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化 的根状茎)。

本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞 或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已 经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整抹植物

后代相同的基因型特征和/或表型特征。

本发明也包括宿主细胞,其含有分离的编码PLT转录因子多肽的核 酸。本发明优选的宿主细胞是植物细胞。

本发明也扩展至植物的可收获部分,如不限于种子、叶、果实、花、 茎、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植 物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉 或蛋白质。

本发明也包括编码PLT转录因子多肽的核酸的用途和PLT转录因子 多肽的用途,用于在本发明方法中增加如上文所定义的植物产量。

编码PLT转录因子多肽的核酸增加的表达可以通过导入遗传修饰(优 选地在PLT转录因子基因的基因座内)而实施。如本文中所定义的基因的 基因座意指这样的基因组区域,其包括目的基因和编码区上游或下游10 kb。

此遗传修饰可以例如通过如上文所述之一的备选方法导入,例如通过 下列方法的任一种(或多种):T-DNA激活法、TILLING和同源重组法。 在导入遗传修饰后是对编码PLT转录因子多肽的核酸增加的表达进行选 择的任选步骤,其中增加的表达产生具有增加的产量的植物。

T-DNA激活标签化产生因靠近所导入启动子的基因的修饰表达而表 现显性表型的转基因植物。待导入的启动子是能够增加编码PLT转录因子 多肽的核酸在植物中表达的中等强度的组成型启动子。

也可以使用TILLING(基因组内定向诱导的局部损伤)技术在编码PLT转录因子多肽的基因座内导入遗传修饰。

本发明的效果也可以使用同源重组再现。将待导入的核酸(其可以是编

码如前文所定义的PLT转录因子多肽或其变体的核酸)靶向至PLT基因的 基因座。待靶向的核酸可以是是用来替换内源基因的改进的等位基因,或 者可以除所述内源基因之外而导入。

T-DNA激活法、TILLING和同源重组是能够产生遗传修饰(包括增加 编码PLT转录因子多肽的核酸在植物中的表达)的技术实例。

编码PLT转录因子多肽的核酸,或PLT转录因子多肽可以用于育种程 序中,其中鉴定到可以遗传地与PLT转录因子基因连接的DNA标记。所 述的核^7基因或PLT转录因子多肽可以用来定义分子标记。这种DNA或 蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定 义的增加产量的植物。

PLT转录因子核酸/基因的等位变体也可以用于标记辅助的育种程序 中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变性处 理而导入等位基因变异;备选地,该程序可以从非人为造成的所谓"自然" 起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。 此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一 般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选 择。可以在温室中或田间监测生长性能。其它任选步骤包括使其中优异等 位变体被鉴定的植物与另 一种植物杂交。这可能用来例如产生目标表型特 征的组合。

编码PLT转录因子多肽的核酸也可以用作为探针以便对基因进行遗 传作图或物理作图,它们作为所述基因的一部分及用作与那些基因连的 性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的林 系。PLT转录因子核酸的这种用途仅需要具有至少15个核苷酸长度的核 ,列。PLT转录因子核酸可以用作限制性片段长度多态性(RFLP)标记。 限制性消化的植物基因组DNA的DNA印迹(Sambrook J, Fritsch EF和 Maniatis T(1989) Molecular Cloning, A Laboratory Manual)可以用PLT转录因子核酸探测。产生的结合图式随后可以使用计算机程序如

MapMaker(Lander等(1987) Genomics 1: 174-181)进行遗传分析以构建遗 传图。此外,该核酸可以用来探测含有一组个体的限制性内切核酸酶处理 的基因组DNA的NDA印迹,其中所述的一组个体代表具有确定的遗传杂 交的亲代和后代。DNA多态性的分离被标出并用来计算PLT转录因子核 酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980) Am. J. Hum.Genet. 32: 314-331)。

在Bernatzky和Tanksley(1986) Plant Mol. Biol.Reporter 4: 37-41中 描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物 描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作 图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体 可以用于作图。此类方法学是本领域技术人员众所周知的。

所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见 Hoheisel等在:Non-mammalian Genomic Analyasis: A Practical Guide, Academic press 1996,第319-346页及其中引用的参考文献)。

在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991) Trends Genet.7: 149-154)中使用。尽管当前的FISH作图法 支持使用大型克隆(几个kb至几百个kb;见Laan等(1995) Genome Res. 5: 13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核

酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989) J. Lab. Clin. Med 11: 95-96)、 PCR扩增片段的多态性(CAPS; Sheffield等(1993) Genomics 16: 325-332)、等位基因特异性连接(Landegren等(1988) Science 241: 1077-1080)、核苷酸延伸反应(Sokolov(1990) Nucleic Acid Res. 18: 3671)、放射杂交作图(Walter等(1997)Nat.Genet.7: 22-28)和Happy作图 法(Dear和Cook(1989) Nucleic Acid Res. 17: 6795-6807)。对于这些方法, 使用 一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的 引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核•列的区域内作图交

叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。 本发明方法产生具有增加的产量的植物,如前文所迷。这种增加的产

量也可以与经济有利的其它性状组合,所述性状如如其它的产量增强性状、

对其它非生物性胁迫和生物性胁迫的耐受性、调节多种构造性特征和/或生

物化学特征和/或生理学特征的性状。 对bHLH的详述

表达产生了相对于对照植物具有增强的产量相关性状的植物。在下文详细 描述适用于增强植物中产量相关性状的特定类的bHLH转录因子。

本发明提供相对于对照植物增强植物中产量相关性状的方法,包括调 节编码特定类bHLH转录因子的核酸在植物中的表达。

用于调节(优选增加)编码bHLH转录因子的核酸的表达的优选方法是 在植物中导入并表达编码如下文进一步定义的特定类的bHLH转录因的核 酸。

类型的bHLH转录因子的任何核酸。如本文中所定义的bHLH转录因指由 SEQIDNO:213、 SEQ ID NO:215、 SEQ IDNO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299和SEQ ID NO:301 的任一种所代表的多肽。本发明通过用由SEQ ID NO:212所代表的编码多 肽SEQ ID NO:213的稻序列转化植物而加以说明。来自稻的SEQ ID NO:215(由SEQ ID NO:214编码)和来自稻的SEQ ID NO:217(由SEQ ID NO:216编码)是SEQ ID NO:213的多肽的旁系同源物。来自拟南芥的SEQ ID NO:219(由SEQ ID NO:218编码)和来自拟南芥的SEQ ID NO:225(由 SEQ ID NO:224编码)是SEQ ID NO:213的多肽的直向同源物。来自拟南 芥的SEQ ID NO:221(由SEQ ID NO:220编码)和来自拟南芥的SEQ ID NO:223(由SEQ ID NO:222编码)是SEQ ID NO:218和SEQ ID NO:219的 变体。直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易 地找到。这一般涉及第一 BLAST,其中所述的笫一 BLAST包括查询序列 (例如SEQ ID NO:212、 SEQ ID NO:213、 SEQ ID NO:214、 SEQ ID NO:215、 SEQ ID NO:216、 SEQ ID NO:217、 SEQ ID NO:218、 SEQ ID NO:219、 SEQ ID NO:224或SEQ ID NO:225)针对任一序列数据库(如公众 可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时, 一般使 用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时, 可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以篩选 BLAST结果。随后将筛选结果和非篩选结果的全长序列针对来自生物的序 列进行反向BLAST搜索(第二BLAST),其中查询序列来自所述的生物(其 中在查询序列是SEQ ID NO:212、 SEQ ID NO:213、 SEQ ID NO:214、 SEQ IDNO:215、 SEQ ID NO:216或SEQ ID NO:217的情况下,第二 BLAST 因而将针对稻序列;其中在查询序列是SEQIDNO:218、 SEQIDNO:219、 SEQ ID NO:224或SEQ ID NO:225的情况下,第二 BLAST因而将针对拟 南芥序列)。随后比较第一和第二次BLAST搜索的结果。若来自第一 BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,那么 反向BLAST随后理想地产生查询序列作为最高命中,则鉴定到旁系同源 物;若第一次BLAST中的高阶位命中不源自与查询序列从其中衍生的物 种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查 询序列,则鉴定到直向同源物。

高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句 话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。 除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比 较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。 优选地,评分大于50,更优选大于100;并且优选地,E-值小于e-5,更优 选小于e-6。对直向同源物和旁系同源物鉴定的详述实例分别在本文实施例 31和实施例30中给出。在大型家族的情况下,可以使用ClustalW,随后 使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。

通过以上所提及BLAST方法获得的直向同源物的实例是来自蒺藜苜 蓿(Medicago truncatula)的SEQ ID NO:227(由SEQ ID NO:226编码)和来 自大麦(Horderum vulgare)的SEQ ID NO:229(由SEQ ID NO:228编码)。 其它直向同源物和旁系同源物可以使用上文所述BLAST方法并按照在实 施例部分中给出的方法而轻易地鉴定。

SEQ ID NO:297、 299和301所代表的蛋白质是迄今未知的。因而, 本发明也提供迄今未知的bHLH转录因子和编码bHLH转录因子的核酸。

根据本发明的又一个实施方案,因而提供分离的核酸分子,其包含:

由SEQ ID NO:296、 SEQ ID NO:298和SEQ ID NO:300的4壬一种所 代表的核酸;

由SEQ ID NO:296、 SEQ ID NO:298和SEQ ID NO:300的任一种所 代表的核酸的互补序列;

编码bHLH转录因子的核酸,其中所述的bHLH转录因子具有(a)以 递增优选顺序与SEQ ID NO:297、 SEQ ID NO:299和SEQ ID NO:301的 任一种所代表的氨基酸序列至少50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%或更高的序列同一性, 并(b) bHLH结构域。

根据本发明的又一个实施方案,因而提供分离的多肽,其包含:

由SEQ ID NO:297、 SEQ ID NO:299和SEQ ID NO:301的任一种所 代表的氨基酸序列;

氨基酸序列,其(a)以递增优选顺序与SEQ ID NO:297、 SEQ ID NO:2"和SEQ ID NO:301的任一种所代表的氨基酸序列具有至少50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%或更高的序列同一性,并(b)具有bHLH结构域;

在以上(i)或(ii)中给出的任一氨基#列的衍生物。

由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQIDNO:221、 SEQ I關0:223、 SEQ IDNO:225、 SEQ IDNO:227、 SEQ ID NO:229、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种所代表的多肽或任一前述SEQ ID NO的直向同源物或旁 系同源物均包含bHLH结构域。

bHLH结构域是本领域众所周知的并且可以轻易地由本领域技术人员 鉴定。这个家族由bHLH标签结构域定义,其中所述的bHLH标签结构 域由60个左右的氨基酸构成,有两个功能明显不同的区域。位于该结构域 氨基末端的碱性区域参与DNA结合并且由15个左右的氨基酸构成,具有 大量碱性残基。在羧基末端的HLH区域作为二聚化结构域发挥作用并且 主要包含形成两个两性螺旋的疏水残基,所述螺旋由序列及长度可变的环 区所隔开。

bHLH结构域可以使用用于比对序列用于比较的方法进行鉴定。在一 些情况下,可以调整默认参数以调节搜索法的严格性。例如使用BLAST, 可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作"期望" 值)以显示严格性较低的匹配。以这种方式,可以鉴定几乎精确的短匹配。

用于比对序列用于比较的方法是本领域众所周知的,此类方法包括 GAP、 BESTFIT、 BLAST、 FASTA和TFASTA。 GAP使用Needleman 和Wunsch算法((1970) J Mol Biol 48:443-453)以找到使匹配数最大化并使 空位数最小化的两个序列(覆盖整个序列的)的全局比对。BLAST算法 (Altschul等(1990) J Mol Biol 215:403-10)计算序列同 一性百分数并执行对 两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过 国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多 重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方 法而轻易地鉴定。可以进行细微手工编辑以优化保守基序之间的比对,如 本领域技术人员显而易见。

存在用于鉴定结构域的专业化数据库。bHLH转录因子中的bHLH结 构域可以使用例如SMART(Schultz等(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic等(2002) Nucleic Acids Res 30, 242-244)、 InterPro(Mulder等,(2003) Nucl. Acids. Res. 31, 315-318)、 Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序 列判读中的功能.(In)ISMB-94;第二届分子生物学智能系统国际会议文集. Altman R., Bmtlag D., Karp P., Lathrop R., Searls D.编辑,第53-61 页,AAAIPress , Menlo Park; Hulo等,Nucl. Acids. Res, 32: D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1): 276-280(2002))加以鉴定。HLH结构域结构在InterPro数据库中被命名为 IPR001092和IPR011598;在Pfam数据库中命名为PF00010;在SMART 数据库中命名为SM00353并且在PROSITE中命名为PS50888。另外,在 图18中显示的比对结果突出显示了用于本发明方法中的bHLH转录因子 的bHLH结构域。

由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种所代表的多肽或任一前述SEQ ID NO的直向同源物或旁 系同源物一般在保守的bHLH结构域之外显示巨大的序列偏离。

图19a是显示上文所述bHLH型蛋白质的整体相似性和同一性(粗体) 的矩阵。即^更同一性似乎是相对低的,然而具有落在矩阵所示范围内的序 列同一性的多肽可以视为任一 SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219或SEQ ID NO:225的直向同源物或旁系同源物; 这可以由上文所述的交互性BLAST方法证实。 一般,编码用于本发明方 法中的bHLH转录因子的核酸以递增优选顺序与由SEQ ID NO:213、 SEQ IDNO:215、 SEQ ID NO:217、 SEQ ID NO:219或SEQ ID NO:225的任一 种所代表的bHLH转录因子具有至少13%、 15%、 20%、 25%、 30%、 35%、 40%、 45%、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%或更高的序列同 一性。

图19b中描述的矩阵显示在bHLH结构域内的相似性和同一性(粗体), 其中该值当然比考虑全长蛋白质时是更高的。 一般,编码用于本发明方法 中的bHLH转录因子的核酸具有这样的bHLH结构域,其以递增优选顺序 与由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219或SEQ ID NO:225的任一种所代表多肽的bHLH结构域具有至少25%、 30%、 35%、 40%、 45%、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、卯%、 95%或更高序列同一性。

称作5-9-13构型的氨基酸模式可以在bHLH结构域的碱性区域内的 三个位置上找到(见Hdm等,2003(Mol. Biol. E第20巻(5): 735-747)的图 4和本文中的图18,其中3个指向上方的箭头显示所述构型)。由SEQID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQIDNO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种所 代表的多肽或任一前述SEQ ID NO的直向同源物或旁系同源物优选地在 bHLH结构域内、 一般在该结构域的碱性区域内包含K/R ER构型、更优 选RER构型。该构型的存在不是实施本发明方法的前提,因而在K/RER 构型中的一些变异是可接受的。拟南芥bHLH多肽根据结构相似性被分成 十二个亚家族(见Heim等,2003的图4)。 IX组的成员构成具有RER构 型的bHLH多肽。另外,VI组的一个成员包含RER构型。

由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种所代表的多肽或任一前述SEQ ID NO的直向同源物或旁 系同源物也可以包含(除bHLH结构域和任选地K/R ER 5-9-13基序之外, 优选RER基序)命名为PFB26111(见Pfam数据库)的结构域。该结构域也 示于图18。

通常,编码(如上文定义的)bHLH转录因子的核酸用于本发明方法中, 其中所述的bHLH转录因子具有bHLH结构域并且以递增优选顺序与由 SEQIDNO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQIDNO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299或SEQ ID NO:301 的任一种所代表的任何一种多肽的PFB26111结构域(见图18)具有至少 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%或更高 的序列同一性。

编码由SEQIDNO:213、 SEQIDNO:215、 SEQIDNO:217、 SEQ IDNO:219、 SEQIDNO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任一种所代表的多肽或任一前述SEQ ID NO的直向同源物或旁 系同源物的核酸不需要是全长核酸,因为本发明方法的实施不依赖使用全 长核酸序列。在实施本发明方法中适用的核酸的实例包括但不限于由SEQ IDNO:212、 SEQIDNO:214、 SEQIDNO:216、 SEQIDNO:218、 SEQ ID NO:220、 SEQ ID NO:222、 SEQ ID NO:224、 SEQ ID NO:226、 SEQ ID NO:228、 SEQ ID NO:296、 SEQ ID NO:298,和SEQ ID NO:300的任一种 所代表的那些核酸。核酸变体也可以在实施本发明方法中使用。此类核酸 变体的实例包括编码如本文中所定义的bHLH转录因子的核酸的部分、编 码如本文中所定义的bHLH转录因子的核酸的剪接变体、编码如本文中所 定义的bHLH转录因子的核酸的等位变体和通过基因改组作用而获得的编 码如本文中所定义bHLH转录因子的核酸的变体。现在将描述术语"部分、 剪接变体、等位变体和基因改组"。

编码如本文中所定义的bHLH转录因子的核酸的部分可以例如通过对 该核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使 用或它们可以与其它编码性(或非编码性)序列融合,以便例如产生结合几 种活性的蛋白质。当与其它编码序列融合时,翻译时产生的所得多肽可以 比对bHLH转录因子部分所预测的多肽更大。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达编码由任一 SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301所代表bHLH转录因子的核酸的部分,或表达 编码任一前述SEQ ID NO的直向同源物、旁系同源物或同源物的核酸的 部分。

用于本发明方法中的部分编码这样的多肽,其具有(如上文所述 的)bHLH结构域并且与SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301任一个所代表或任一前述SEQ ID NO的直向同源物或旁系同源物所代表的bHLH转录因子具有基本上相同的生物学活 性。该部分一般具有至少150个连续核苷酸长度、优选至少300个连续核 苷酸长度、更优选至少400个连续核苷酸长度并且最优选至少500个连续 核普酸长度。优选地,该部分是如SEQIDNO:212、 SEQIDNO:214、 SEQ IDNO:216、 SEQIDNO:218、 SEQIDNO:220、 SEQIDNO:222、 SEQ ID NO:224、 SEQ ID NO:226、 SEQ ID NO:228、 SEQ ID NO:296、 SEQ ID NO:298,和SEQIDNO:300任一种所代表的核酸的部分。最优选地,该部 分是如SEQ ID NO:212所代表的核酸的部分。

用于本发明方法中的另 一种核酸变体是能够在降低的严格性条件下、 优选在严格条件下与编码如本文中所定义的bHLH转录因子的核酸杂交, 或与如本文中所定义的部分杂交的核酸。

用于本发明方法中的杂交序列编码这样的多肽,其具有(如上文所述 的)bHLH结构域并且与由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301任一个代表的bHLH转录因子具有基本上相同 的生物学活性或与任一前述SEQ ID NO的直向同源物或旁系同源物所代 表的bHLH转录因子具有基本上相同的生物学活性。该杂交序列一般具有 至少150个连续核苷酸长度、优选至少300个连续核苷酸长度、更优选至 少400个连续核苷酸长度并且最优选至少500个连续核苷酸长度。优选地, 该杂交序列是能够与由SEQ ID NO:212、 SEQ ID NO:214、 SEQ ID NO:216、 SEQ ID NO:218、 SEQ ID NO:220、 SEQ ID NO:222、 SEQ ID NO:224、 SEQ ID NO:226、 SEQ ID NO:228、 SEQ ID NO:296、 SEQ ID NO:298,和SEQ ID NO:300所代表的任一核酸杂交或与任一前述序列的一 部分杂交的序列,其中所述的一部分如上文定义。最优选地,杂交序列能 够与如SEQ ID NO:212所代表的核酸杂交或与其部分杂交。

才艮据本发明,提供用于增强植物中产量相关性状的方法,其包括在植 物中导入并表达能够与编码由SEQIDNO:213、 SEQIDNO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ IDNO:299、 SEQ ID NO:301任一个所代表bHLH转录因子的核酸杂交的核 酸,或包括在植物中导入并表达能够与编码任一前述SEQ ID NO的直向 同源物、旁系同源物或同源物的核酸杂交的核酸。

用于本发明方法中的另 一种核酸变体是编码如上文所定义的bHLH转 录因子的剪接变体。

根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物 中导入并表达编码由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQIDNO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301任一个所代表bHLH转录因子的核酸的剪接变体,或编码 任一前述SEQ ID NO的直向同源物、旁系同源物或同源物的核酸的剪接 变体。

优选的剪接变体是编码由SEQIDNO:213、 SEQIDNO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301任一个所代表bHLH转录因子的核酸的剪接变 体,或是编码4壬一前述SEQ ID NO的直向同源物或旁系同源物的核酸的 剪接变体。还优选由SEQIDNO:212、 SEQIDNO:214、 SEQIDNO:216、 SEQIDNO:218、 SEQ ID NO:220、 SEQIDNO:222、 SEQ ID NO:224、 SEQIDNO:226、 SEQ ID NO:228、 SEQIDNO:296、 SEQ ID NO:298,和 SEQ ID NO:300的任一种所代表的核酸的剪接变体。最优选如SEQ ID NO:212所代表的核酸的剪接变体。

用于实施本发明方法中的另一种核酸变体是编码如上文所定义的 bHLH转录因子的核酸的等位变体。

根据本发明,提供用于增强植物中产量相关性状的方法,其包括在植 物中导入并表达编码由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301任一个所代表bHLH转录因子的核酸的等位变 体,或包括在植物中导入并表达编码任一前述SEQ ID NO的直向同源物、 旁系同源物或同源物的核酸的等位变体。等位变体可以是编码由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301任一个所代表bHLH转录因子的核酸的等位变 体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的核酸的 等位变体。还优选由SEQIDNO:212、 SEQIDNO:214、 SEQIDNO:216、 SEQIDNO:218、 SEQ I關0:220、 SEQ ID NO:222、 SEQ IDNO:224、 SEQIDNO:226、 SEQ ID NO:228、 SEQIDNO:296、 SEQ ID NO:298和 SEQ ID NO:300的任一种所代表的核酸的等位变体。最优选如SEQ ID NO:212所代表的核酸的等位变体。

用于本发明方法中的又一核酸变体是通过基因改组作用而获得的核酸 变体。基因改组或定向进化也可以用来产生编码如上文定义的bHLH转录 因子的核酸的变体。

根据本发明,提供用于增强植物中产量相关性状的方法,其包括在植 物中导入并表达编码由SEQ ID NO:213、 SEQ ID NO:215、 SEQ ID NO:217、 SEQ ID NO:219、 SEQ ID NO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301 4壬一个所代表的bHLH转录因子的核酸的变体, 或包括导入并表达编码任一前述SEQ ID NO的直向同源物、旁系同源物 或同源物的核酸的变体,其中所述的核酸通过基因改组作用而获得。

另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现 位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology. Wiley编辑)。

还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:213、SEQ IDNO:215、 SEQIDNO:217、 SEQIDNO:219、 SEQIDNO:225、 SEQ ID NO:297、 SEQ ID NO:299、 SEQ ID NO:301的任何一种氨基酸序列所代表 的同源物或任一前述SEQ ID NO的直向同源物或旁系同源物。

还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:213、 SEQ IDNO:215、 SEQIDNO:217、 SEQIDNO:219、 SEQIDNO:225、 SEQ ID NO:297、 SEQIDNO:299、 SEQ ID NO:301的任何一种氨基酸序列所代表的衍生物或任一前述SEQ ID NO的直向同源物或旁系同源物。SEQ ID NO:215、 SEQIDNO:217、 SEQ ID NO:219、 SEQ ID NO:221、 SEQ ID NO:223、 SEQ ID NO:225、 SEQ ID NO:227和SEQ ID NO:229、 SEQ ID NO:297、 SEQIDNO:299、 SEQ ID NO:301的衍生物是可以在本发明方法 中适用的又一些实例。

另夕卜,bHLH转录因子(至少以其天然形式)一般具有DNA结合活性和 激活结构域。本领域技术人员可以使用惯用工具和技术容易地确定激活结 构域的存在和DNA-结合活性。

可以根据就组成和/或基因组环境方面通过人类有意操作而对天然形式加 以修饰。优选地,编码bHLH转录因子的核酸来自植物,还优选来自单子 叶植物,更优选来自禾本科、该核酸最优选地来自稻。

在本文中对bHLH转录因子的任一引用因而意指如上文定义的bHLH 转录因子。编码所述bHLH转录因子的任一核酸在实施本发明方法中适用。

胞)。该植物或其部分包含编码如上文定义的bHLH转录因子的核酸转基 因。

本发明还提供遗传构建体和载体以促进在植物中导入和/或表达用于 本发明方法中的核酸序列。

因而,提供基因构建体,其包含: 编码如上文所定义的bHLH型转录因子的任一核酸; 与(i)的核酸有效连接的 一种或多种调控序列。

本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组 DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的 细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发 明因而提供如上文所定义的基因构建体在本发明方法中的用途。

植物用包含目的序列的栽体(即编码bHLH型转录因子的核酸)转 化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列 (至少与启动子)连接。

有利地,任何类型的启动子(不论是天然的或合成的)可以用来驱动核 酸序列的表达。启动子可以是诱导型启动子,即在应答于发育性、化学性、 环境性或物理性刺激时具有受诱导或增加的转录启动。启动子可以是组织 特异性启动子,即能够优先在某些组织如叶、根、种子组织等内启动转录 的启动子。

才艮据本发明的一个优选特征,编码bHLH型转录因子的核酸有效地与 组成型启动子连接。组成型启动子在生长和发育的大部分、但实际上并非 全部阶段期间有转录活性并且基本上遍在地表达。该组成型启动子优选地 是GOS2启动子,更优选地,该组成型启动子是稻GOS2启动子,该组成 型启动子还优选地由基本上与SEQ ID NO:230或SEQ ID NO:233相似的 核酸序列代表,该组成型启动子最优选地如SEQ ID NO:233所代表。

应当明白本发明的适用性不限于编码由SEQ ID NO:212代表的bHLH 转录因子的核酸,同时本发明的适用性也不限于由GOS2启动子驱动时编 码bHLH转录因子的这种核酸的表达。也可以用来实施本发明方法的其它 组成型启动子的实例在"定义"部分中显示。

任选地, 一种或多种终止子序列(也是调控序列)可以在导入植物的构 建体中使用。额外的调节元件可以包括转录增强子以及翻译增强子。本领 域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。 本领域技术人员会知道或可以轻易地获得此类序列。

本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/ 或复制的复制起点序列。 一个实例是当需要将遗传构建体在细菌细胞中维 持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但 不限于fl-ori和colEl。其它调控序列(除启动子、增强子、沉默子、内含 子序列、3, UTR和/或5, UTR区之夕卜)可以是蛋白质和/或RNA稳定化元 件。遗传构建体可以任选地包含选择标记基因。

本发明也提供相对于对照植物产生具有增强的产量相关性状的转基因植物的方法,包括在植物中导入并表达编码如上文所定义的bHLH型转录 因子多肽的任一核酸。

更具体地,本发明提供用于产生具有增强的产量相关性状的转基因植 物的方法,所述方法包括:

在植物细胞中导入并表达编码(如本文中所定义的)bHLH型转录因子 的核酸;和

在促进植物生长和发育的条件下培育植物细胞。

核酸可以直接导入植物细胞或导入植物本身(包括导入组织、器官或植 物的任何其它部分)。根据本发明的优选特征,核酸优选地通过转化而导入 植物。

通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在, 其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将 转化的材料再生成整林植物。

在DNA转移和再生后,推测的转化植物可以例如使用Southern分析 对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新 导入DNA的表达水平可以4吏用Northern和/或Western分析或定量PCR 进行监测,全部技术是本领域内普通技术人员众所周知的。

产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或 经典育种技术。例如,第一代(或T1)转化植物可以进行自交以产生纯合的 笫二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。

产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非 转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞); 转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化 的根状茎)。

本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞 或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已 经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整林植物 的后代,唯一要求是后代显示出与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。

本发明也包括宿主细胞,其含有分离的编码如上文所定义的bHLH转 录因子的核酸。本发明优选的宿主细胞是植物细胞。

本发明也扩展至植物的可收获部分,如不限于种子、叶、果实、花、 茎、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植 物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉 或蛋白质。

根据本发明的优选特征,受调节的表达是增加的表达。

如上文提及,用于调节(优选增加)编码bHLH转录因子的核酸表达的 优选方法是在植物中导入并表达编码bHLH转录因子的核酸;然而实施所 述方法的效果,即增强产量相关性状也可以使用众所周知的其它技术而实 现。下文是对这些技术中某些的描述。

一种这样的技术是T-DNA激活标签化。产生的转基因植物因靠近所 导入启动子的基因的修饰表达而表现表型。本发明的作用也可以使用 TILLING(基因组内定向诱导的局部损伤)技术而再现。本发明的作用也可 以使用同源重组法再现。

在本文中对术语"增强的产量相关性状"的引用意指植物的一个或多个 部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地 下(可收获)部分。

尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于对 照植物的种子产量具有增加的种子产量的植物。

以玉米为例,产量增加可以表现为下列一种或多种指标:每公项或英 亩植物数的增加,每林植物穗数的增加、行数的增加、每行粒数、粒重、 千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种 子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现 为下列一种或多种指标的增加:每公项或英亩植物数、每林植物圆锥花序 数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原 圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以IOO)、千粒重的增加及其它。

由于本发明的转基因植物具有增加的产量,因而相对于对应野生型植 物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的 生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物

的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整林植物。 具有增加的生长速率的植物甚至可以表现早开花。生长速率的增加可以在

植物生活周期中的一个或多个阶段上或在整个植物生活周期期间发生。增 加的生长速率在植物生活周期中的早期期间可以反映增强的萌发势(在出 苗时增加的幼苗萌发势)。生长速率的增加可以改变植物的收获周期,允许 植物较晚,燔种和/或较早收获,否则这将不可能。若生长速率充分地增加, 可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播 种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若 生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种 并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适 植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能

的。改变;fct物的收获周期可以导致每英亩的年生物量产量的增加(因任何特 定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以 允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培 育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境 条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以 通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达 到其50 %最大尺寸所花费的时间)和T-90(植物达到其50 %最大尺寸所花费 的时间),等等。

与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁 迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴 露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另 一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的 胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于

40%、 35%或30%,优选小于25%、 20%或15%,更优选小于14%、 13%、 12%、 11%或10。/。或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的 进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导 的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物 性和/或非生物性(环境)胁迫。非生物性胁迫可以因干旱或水涝、厌氧胁迫、 盐胁迫、化学毒性、氧化胁迫和热、寒冷或水冻温度所致。非生物性胁迫 可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗 透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些 胁迫。

尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以 产生相对于对照植物而具有增加的产量的植物。如在Wang等 (Planta(2003)218: l-14)中报道,非生物性胁迫导致不利地影响植物生长及 生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已 知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133: 1755-1767) 描述了干旱胁迫与高盐度胁迫间极高程度的"串话"。例如,干旱和/或盐化 作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随 高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白 变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应 答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。 如本文中所用的术语"非胁迫"条件是允许植物最佳生长的环境条件。本领 域技术人员清楚对于给定地点的正常土壤条件和气候条件。

本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在 非胁迫条件下或在轻孩史干旱条件下培育的植物增加的产量。因而根据本发 明,提供用于增加在非胁迫条件下或在轻微干旱条件下培育的植物中产量 的方法,所述方法包括增加编码bHLH转录因子的核酸在植物中的表达。

本发明方法的实施产生在营养缺乏条件下、尤其在氮缺乏条件下培育的相对于在相当条件下培育的合适对照植物具有增加产量的植物。因而根 据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所

述方法包括增加编码MADS15多肽的核酸在植物中的表达。营养缺乏可以 因营养物的缺乏或过量所致,如氮、磷酸盐及其它含磷化合物、钾、钙、 镉、镁、锰、铁和硼等。

根据本发明的优选特征,本发明方法的实施产生的这样的植物,其相 对于对照植物而具有增加生长速率,导致早期萌发势,尤其在植物发育早 期(在稻和玉米的情况下一般在萌发后3周,但是这将依物种而不同)。因 而根据本发明,提供用于增加植物生长速率的方法,所述方法包括调节、 优选增加编码bHLH转录因子的核酸在植物中的表达。本发明因而也提供 相对于对照植物用于获得具有早期萌发势的植物的方法,所述方法包括调 节、优选增加编码bHLH转录因子的核酸在植物中的表达。

早期萌发势也可以因相对于对照植物增加的植物适应性引起或表现为 相对于对照植物增加的植物适应性,其原因在于例如植物更好地适应其环 境(即更能够对付多种非生物性或生物性胁迫因素)。具有早期萌发势的植 物也显示出作物更好的建立(作物整齐地生长,即大多数植物在基本上相同 的时间上达到发育各阶段),并显示更好的生长和往往更好的产量。因而, 早期萌发势可以通过多种因子如幼苗生长速率、千粒重、萌发百分数、出 苗百分数、幼苗高度、根长度和苗生物量和众多其它因素而确定

本发明方法有利地适用于任何植物。

特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤 其单子叶植物和双子叶植物,包括饲用或祠料豆类、观赏植物、粮食作物、 树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实 例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和 烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优 选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、 黑小麦、高粱和燕麦。其中早期萌发势是特别希望的性状的植物包括稻、 玉米、小麦、向日葵、高粱。肽的用途,用于增强产量相关性状。

编码bHLH转录因子多肽的核酸或bHLH转录因子本身可以用于育种 程序中,其中鉴定到可以遗传地与编码bHLH转录因子的基因连接的DNA 标记。所述的核^/基因或bHLH转录因子本身可以用来定义分子标记。这 种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中 如上文所定义的增加产量的植物。

编码bHLH转录因子的核^/基因的等位变体也可以用于标记辅助的 育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作 诱变性处理而导入等位基因变异;备选地,该程序可以从非人为造成的所 谓"自然"起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过

PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的 步骤。 一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而 实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括使其中 优异等位变体^L鉴定的植物与另 一种植物杂交。这可以用来例如产生目标 表型特征的组合。

编码bHLH转录因子的核酸也可以用作为探针以便对基因进行遗传作 图或物理作图,它们作为所述基因的一部分的基因及用作与那些基因连锁 的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的 林系。编码bHLH转录因子的核酸的这种用途仅需要具有至少15个核苷 酸长度的核酸序列。编码bHLH转录因子的核酸可以用作限制性片段长度 多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹 (Sambrook J, Fritsch EF和Maniatis T(1989) Molecular Cloning, A Laboratory Manual)可以用编码bHLH转录因子的核酸探测。产生的结合 图式随后可以使用计算机程序如MapMaker(Lander等(1987) Genomics 1: 174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经 限制性内切酶核酸处理的一组个体的基因组DNA的DNA印迹,其中所述 的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码bHLH转录因子的核酸在使用这个群体先前所获得的 遗传图中的位置(Botstein等(1980) Am. J. Hum.Genet, 32: 314-331)。

在Bernatzky和Tanksley(1986) Plant Mol. Biol.Reporter 4: 37-41中 描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物 描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作 图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体 可以用于作图。此类方法学是本领域技术人员众所周知的。

所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见 Hoheisel等在:Non-mammalian Genomic Analyasis: A Practical Guide, Academic press 1996,第319-346页及其中引用的参考文献)。

在另 一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991) Trends Genet.7: 149-154)中使用。尽管当前的FISH作图法 支持使用大型克隆(几个kb至几百个kb;见Laan等(1995) Genome Res. 5: 13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核 酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989) J. Lab. Clin. Med 11: 95-96)、 PCR扩增片段的多态性(CAPS; Sheffield等(1993) Genomics 16: 325-332)、等位基因特异性连接(Landegren等(1988) Science 241: 1077-1080)、核苷酸延伸反应(Sokolov(1990) Nucleic Acid Res. 18: 3671)、放射杂交作图(Walter等(1997)Nat,Genet.7: 22-28)和Happy作图 法(Dear和Cook(1989) Nucleic Acid Res. 17: 6795-6807)。对于这些方法, 使用 一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的 引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR 遗传作图的方法中,可能必须鉴定在对应于当前核,列的区域内作图交 叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。

本发明方法产生具有增强的产量相关性状的植物,如前文所述。这些 性状也可以与经济有利的其它性状组合,所述性状如如其它的产量增强性 状、对其它非生物性胁迫和生物性胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。

对SPL15的详述

现已惊奇地发现增加编码SPL15转录因子多肽的核酸在植物中表达产 生了相对于对照植物而具有增强的产量相关性状、尤其具有增加的产量的 植物。因而,本发明提供相对于对照植物增加植物中产量的方法,包括增

加编码SPL15转录因子多肽的核酸在植物中的表达。

导入并表达编码SPL15转录因子多肽的核酸。

如本文中所定义的术语"SPL15转录因子多肽"指这样的多肽,其从氨 基端至羧基端包含:(i)如SEQIDNO:276所代表的基序1;并且(ii)以递增 优选顺序与SEQ ID NO:277所代表的SPL DBD有至少65%、 70%、 75%、 80%、 85%、 90%、 95%或98%的序列同一性;以及(iii)如SEQ ID NO:278 所代表的基序2。

基序1内最保守的氨基酸是XLXFGXXXYFX,而基序2内内最保守 的氨基酸是DSXXALSLLSX(其中X是对于每个位置不同的氨基酸的特定 子集,如在SEQIDNO:276和SEQIDNO:277中所示)。允许在基序1和 基序2内的任一位置上的一个或多个保守性改变,和/或在任一位置上的一 个、两个或三个非保守性改变。

此外,SPL15转录因子多肽可以包含下列任何一个或两个:(a)处于SPL DBD之前的富含G/S的序列;和(b)在该多肽羧基末端的W(S/T)L三肽。

如上文所定义的SPL15转录因子多肽的实例如在SEQ ID NO:235中 代表,其中所述的SPL15转录因子多肽从氨基端至羧基端包含:(i)如SEQ ID NO:276所^表的基序1;并且(ii)以递增优选顺序与SEQ ID NO:277所 代表的SPL DBD有至少65%、 70%、 75%、 80%、 85%、 90%、 95%或 98。/。序列同一性;和(iii)如SEQ ID NO:278所代表的基序2;并且额外地 包含:(a)处于SPLDBD之前的富含G/S的序列;和(b)在该多肽羧基末端 的W(S/T)L三肽。其它的此类实例由SEQ ID NO:237、 SEQ ID NO:239、SEQIDNO:241、 SEQIDNO:243、 SEQIDNO:245、 SEQ ID NO:247、 SEQIDNO:249、 SEQIDNO:251、 SEQ ID NO:253、 SEQ ID NO:255、 SEQIDNO:257、 SEQ ID NO:259、 SEQIDNO:261、 SEQ ID NO:263、 SEQIDNO:283、 SEQIDNO:285、 SEQ ID NO:287的任一种代表或任一 前述SEQ ID NO的直向同源物或旁系同源物代表。本发明通过用编码多 肽SEQ ID NO: 235的由SEQ ID NO: 234代表的拟南芥序列转化植物而加 以说明。来自拟南芥的SEQ ID NO:237(由SEQ ID NO:236编码)是多肽 SEQ ID NO:235的旁系同源物。SEQ ID NO:239(由SEQ ID NO:238编码, 来自Aquilegia formosa x Aquilegia pubescens)、 SEQ ID NO:241(由SEQ ID NO:240编码,来自陆地棉)、SEQ ID NO:243(由SEQ ID NO:242编码, 来自牵牛(Ipomoea nil))、 SEQ ID NO:245(由SEQ ID NO:244编码,来自 莴苣)、SEQ ID NO:247(由SEQ ID NO:246编码,来自苹果(Malus domestica))、 SEQ ID NO:249(由SEQ ID NO:248编码,来自蒺藜苜蓿)、 SEQ ID NO:251(由SEQ ID NO:250编码,来自Nicotiana bentamiana)、 SEQ ID NO:253(由SEQ ID NO:252编码,来自稻)、SEQ ID NO:255(由 SEQ ID NO:254编码,来自稻)、SEQ ID NO:257(由SEQ ID NO:256编码, 来自马铃薯)、SEQIDNO:259(由SEQIDNO:258编码,来自葡萄)、SEQ ID NO:261(由SEQ ID NO:260编码,来自玉蜀黍)、SEQ ID NO:263(由SEQ IDNO:262,玉蜀黍)、SEQ ID NO:283(由SEQIDNO:282,芜青(B腦ica rapa ) )、 SEQ ID NO:285(由SEQ ID NO:284,大豆)和SEQ ID NO:287(由 SEQ ID NO:286,美洲山杨(Populus tremuloides))是多肽SEQ ID NO:235 的直向同源物。

直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易 地找到。这一般涉及通过第一 BLAST进行,其中所述的第一 BLAST包括 查询序列(例如SEQ ID NO:234或SEQ ID NO:235)针对任何序列数据库 (如公众可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时, 可以使用BLASTN或TBLASTX(使用标准默认值),并且当从多肽序列开 始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后将筛选结果和非筛选结果的全长序列针对来自生物 的序列进行反向BLAST搜索(第二 BLAST),其中查询序列来自所述的生 物(其中在查询序列是SEQ ID NO:234或SEQ ID NO:235的情况下,第 二 BLAST因而将针对拟南芥序列)。随后比较第一和第二 BLAST搜索的 结果。若来自第一 BLAST的高阶位命中源自与查询序列从其中衍生的物 种相同的物种,反向BLAST随后理想地产生查询序列作为最高命中,则 鉴定到旁系同源物;若高阶位命中不源自与查询序列从其中衍生的物种相 同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序 列,则鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越 低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的 计算是本领域众所周知的。除了 E-值外,比较结果还由同一性百分数记分。 同 一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相 同核苷酸(或氨基酸)数目。对直向同源物和旁系同源物鉴定的详述实例在 实施例41中给出。在大型家族的情况下,可以使用ClustalW,随后使用 邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源 物。在图22中,SPL15转录因子多肽的旁系同源物和直向同源物聚类在一 起。

由SEQ ID NO:237、 SEQ ID NO:239、 SEQ ID NO:241、 SEQ ID NO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQ ID NO:251、 SEQ IDNO:253、 SEQ ID NO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQ ID NO:261、 SEQ ID NO:263、 SEQ ID NO:283、 SEQ ID NO:285、 SEQ ID NO:287的任一种所代表的多肽或任一前述SEQ ID NO 的直向同源物或旁系同源物均包含以递增优选顺序与SEQ ID NO:277所 代表的SPL15DBD具有至少65%、 70%、 75%、 80%、 85%、 90%、 95% 或98%序列同一性的SPL DBD。

SPL DBD是本领域众所周知的并且可以轻易地由本领域技术人员鉴 定。SPLDBD可以使用用于比对序列进行比较的方法鉴定。用于比对序列 进行比较的方法包括GAP、 BESTFIT、 BLAST、 FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970) J Mol Biol 48:443-453)以找到

使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法 (Altschul等(1990) J Mol Biol 215:403-10)计算序列同 一性百分数并执行对 两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过 国家生物技术信息中心可获得的。同源物可以使用例如在京都大学生物信 息学中心(Kyoto University Bioinformatics Center)的GenomeNet月艮务 器上可获得的ChistalW多重序列比对算法(1.83版本),用默认配对比对参 数和以百分数计的评分方法而轻易地鉴定。可以进行细微手工编辑以优化 保守基序之间的比对,如本领域技术人员显而易见。图23和24中所示的 比对结果凸显SPL15转录因子多肽中的SPL DBD。优选地,用于本发明 方法中的SPL15转录因子多肽包含以递增优选顺序与SEQ ID NO:277所 代表的SPL15DBD具有至少65%、 70%、 75%、 80%、 85%、 90%、 95% 或98%序列同一性的SPL DBD。

在一些情况下,可以调整默认参数以调节搜索法的严格性。例如使用 BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称 作"期望,,值)以显示严格性较低的匹配。以这种方式,可以鉴定几乎精确的 短匹配。以这种方式可以鉴定如SEQ ID NO:276所代表的基序1和如SEQ ID NO:278所代表的基序2,其中所述的基序均包含于在用于本发明方法 中的SPL15转录因子多肽内(图24)。允许在基序1和基序2内的任一位置 上的一个或多个保守性改变,和/或在任一位置上的一个、两个或三个非保 守性改变。同样可以鉴定在该多肽羧基末端的W(S/T)L三肽(图24)。

还存在用于鉴定结构域的专业数据库。在SPL15转录因子多肽中的 SPL DBD可以使用例如SMART(Schultz等(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic等(2002) Nucleic Acids Res 30, 242-244;由 德国海德堡的EMBL拥有)、InterPro(Mulder等,(2003) Nucl. Acids. Res. 31, 315-318;由英国的欧洲生物信息研究所(EBI)拥有)、Prosite(Bucher 和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序 列判读中的功能.(In)ISMB-94;笫二届分子生物学智能系统国际会议文集.AIt廳n R., Brutlag D., Karp P., Lathrop R., Searls D.编辑,第53-61 页,AAAIPress , Menlo Park; Hulo等,Nucl. Acids. Res. 32: D134-D137,(2004))、作为一项服务向科学界提供的ExPASy蛋白质组服务 器(由瑞士的瑞士生物信息学研究所(SIB)拥有)或Pfam(Bateman等, Nucleic Acids Research 30(1): 276-280(2002),由英国的Sanger研究所拥 有)加以鉴定。SPL DBD在InterPro数据库中命名为IPR004333,在Pfam 数据库中命名为PF03110并且在PROSITE数据库中命名为PS51141。

另外,也可以轻易地鉴定处于SPL DBD之前的富含G/S的序列的存 在(图24)。为确定多肽结构域是否富含特定的氨基酸,主要氨基酸组成(%) 可以使用来自ExPASy服务器的软件程序、尤其ProtParam工具 (Gasteiger E等(2003)ExPASy:用于深入认识和分析蛋白质的蛋白组学服 务器.Nucleic Acids Res 31: 3784-3788)加以计算。目的蛋白的组成随后可 以与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(%)比较。在 Swiss-Prot蛋白质序列数据库中,平均Gly(G)含量和平均Ser(E)含量均是 6.9%(合计达13.8%)。作为实例,处于SEQ ID NO:235的SPL DBD之前 的富含G/S的序列含有14.5 %的G和25.5 %的S(合计达40%)。如本文 中所定义,富含G/S的序列具有这样的合并G和S含量(就。/。而言),其高 于在Swiss-Prot蛋白质序列数据库内的蛋白质平均氨基酸组成(就%而言) 中存在的合并G和S含量。G和S均属于极小氨基酸类别。

编码由SEQIDNO:235、 SEQIDNO:237、 SEQIDNO:239、 SEQ ID NO:241、 SEQ IDNO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQ IDNO:251、 SEQ ID NO:253、 SEQ ID NO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQ ID NO:261、 SEQ ID NO:263、 SEQ ID NO:283、 SEQIDNO:285、 SEQ ID NO:287的任一种所代表多肽或任一前 述SEQ ID NO的直向同源物或旁系同源物的核酸不必是全长核酸,因为 本发明方法的实施不依赖使用全长核酸序列。在实施本发明方法中适用的 核酸的实例包括但不限于由SEQ ID NO:234、 SEQ ID NO:236、 SEQ ID NO:238、 SEQ ID NO:240、 SEQ ID NO:242、 SEQ ID NO:244、 SEQ IDNO:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQ ID NO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ ID NO:258、 SEQ ID NO:260、 SEQ ID NO:262、 SEQ ID NO:282、 SEQ ID NO:284和SEQ ID NO:286的任一种 所代表的那些核酸。核酸变体也可以在实施本发明的方法中使用。此类变 体的实例包括天然存在的或通过DNA操作获得的核酸的部分、剪接变 体、等位变体。

部分可以例如通过对编码如上文所定义的SPL15转录因子多肽的核酸 产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它 们可以与其它编码性(或非编码性)序列融合,以便例如产生结合几种活性 的蛋白质。当与其它编码序列融合时,翻译时产生的所得多肽可以比对 SPL15转录因子部分所预测的多肽更大。用于本发明方法中的部分编码(如 上文所述的)SPL15转录因子多肽,其中所述多肽具有与任一 SEQ ID NO:235、 SEQ ID NO:237、 SEQ ID NO:239、 SEQ ID NO:241、 SEQ ID NO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQ ID NO:251、 SEQIDNO:253、 SEQ ID NO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQ ID NO:261、 SEQ ID NO:263、 SEQ ID NO:283、 SEQ ID NO:285、 SEQ ID NO:287所代表或任一前述SEQ ID NO的直向同源物或 旁系同源物所代表的SPL15转录因子多肽基本上相同的生物学活性。部分 的实例可以包括这样的核苷酸,其编码以递增优选顺序与SEQIDNO:277 所代表的SPLDBD具有至少65%、 70%、 75%、 80%、 85%、卯%、 95% 或98%序列同一性的如SEQ ID NO:276所代表的基序1,和如SEQ ID NO:278所代表的基序2。部分可以额外地包括编码富含G/S的序列或 W(S/T)L三肽的核苷酸(但不必是编码在富含G/S的序列和W(S/T)L三肽 之间的氨基酸序列的核苷酸)。所述的部分一般是至少250个核苷酸长度、 优选至少500个核苷酸长度、更优选至少750个核苷酸长度并且最优选至 少1000个核苷酸长度。优选地,所述部分是如SEQIDNO:234、 SEQ ID NO:236、 SEQ ID NO:238、 SEQ ID NO:240、 SEQ ID NO:242、 SEQ ID NO:244、 SEQ ID NO:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQ IDNO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ ID NO:258、 SEQ ID NO:260、 SEQIDNO:262、 SEQIDNO:282、 SEQ ID NO:284和SEQ ID NO:286的任一种所代表的核酸的部分。最优选地,该部分是如SEQ ID NO:234所代表的核酸的部分。

用于本发明方法中的另 一种核酸变体是能够在降低的严格性条件下、 优选在严格条件下与编码如本文中所定义的SPL15转录因子多肽的核酸杂 交,或与如本文中所定义的部分杂交的核酸。

用于本发明方法中的杂交序列编码这样的多肽,其从氨基端至羧基端 包含:(i)如SEQ ID NO:276所代表的基序1;并且(ii)以递增优选顺序与 SEQ ID NO:277所代表的SPL DBD有至少65%、 70%、 75%、 80%、 85%、 90%、 95%或98%序列同一性;和(iii)如SEQ ID NO:278所代表基序2, 并且与SEQ ID NO:235、 SEQ ID NO:237、 SEQ ID NO:239、 SEQ ID NO:2"、 SEQIDNO:243、 SEQ ID NO:245、 SEQ IDNO:247、 SEQ ID NO:249、 SEQ ID NO:251、 SEQ ID NO:253、 SEQ IDNO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQIDNO:261、 SEQ ID NO:263、 SEQ ID NO:283、 SEQ ID NO:285、 SEQ ID NO:287任一个所代表或任一前述SEQ ID NO的直向同源物或旁系同源物所代表的SPL15转录因子多肽具有基本 上相同的生物学活性。所述杂交序列一般是至少250个核普酸长度、优选 至少500个核苷酸长度、更优选至少750个核苷酸长度并且最优选至少 1000个核苷酸长度。优选地,所述杂交序列是能够与由SEQIDNO:234、 SEQIDNO:236、 SEQ ID NO:238、 SEQ ID NO:240、 SEQ ID NO:242、 SEQIDNO:244、 SEQ ID NO:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQIDNO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ IDNO:258、 SEQIDNO:260、 SEQIDNO:262、 SEQIDNO:282、 SEQ ID NO:284和 SEQ ID NO:286代表的任一核酸杂交或与任一前述序列的部分杂交的序 列,其中所述的部分如上文定义。最优选地,所述杂交序列能够与SEQ ID NO:234或与其部分杂交。

用于本发明方法中的另 一种核酸变体是编码如上文所定义的SPL15转录因子多肽的剪接变体。

优选的剪接变体是编码由SEQIDNO:235、 SEQIDNO:237、 SEQ ID NO:239、 SEQIDNO:241、 SEQ IDNO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQ ID NO:251、 SEQ ID NO:253、 SEQ ID NO:255、 SEQ I關0:257、 SEQ ID NO:259、 SEQ ID NO:261、 SEQ ID NO:263、 SEQ ID NO:283、 SEQ ID NO:285,或SEQ ID NO:287任一个所 代表的SPL15转录因子多肽的核酸的剪接变体,或是编码任一前述SEQ ID NO:234、 SEQ ID NO:236、 SEQ ID NO:238、 SEQ ID NO:240、 SEQ ID NO:242、 SEQ ID NO:244、 SEQ ID NO:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQIDNO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ ID NO:258、 SEQ ID NO:260、 SEQ ID NO:262、 SEQ ID NO:282、 SEQ ID NO:284和SEQ ID NO:286的直向同源物或旁系同源物的核酸的剪接变 体。最优选如SEQ ID NO: 234所代表的核酸的剪接变体。

用于实施本发明方法的另一种核酸变体是编码如上文所定义的SPL15 转录因子多肽的核酸的等位变体。

等位变体可以是编码由SEQ ID NO:235、 SEQ ID NO:237、 SEQ ID NO:239、 SEQ ID NO:241、 SEQ ID NO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQIDNO:251、 SEQ ID NO:253、 SEQ ID NO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQ ID NO:261、 SEQ ID NO:263、 SEQIDNO:283、 SEQ ID NO:285,或SEQ ID NO:287任一个所 代表的SPL15转录因子多肽的核酸的等位变体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的核酸的等位变体。还优选由SEQ ID NO:234、 SEQ ID NO:236、 SEQ ID NO:238、 SEQ ID NO:240、 SEQ ID NO:242、 SEQ ID NO:244、 SEQ ID NO:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQ ID NO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ ID NO:258、 SEQ ID NO:260、 SEQ ID NO:262、 SEQ ID NO:282、 SEQ ID NO:284和SEQ ID NO:286的任一种所代表的核酸的等位变体。最优选如 SEQ ID NO: 234所代表的核酸的等位变体。用于本发明方法中的又一核酸变体是通过基因改组作用而获得的核酸

变体。基因改组或定向进化也可以用来产生编码如上文定义的SPL15转录 因子多肽的核酸的变体。

另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现 位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology. Wiley(编辑))。

还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:235、 SEQ IDNO:237、 SEQIDNO:239、 SEQIDNO:241、 SEQIDNO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQ ID NO:251、 SEQ ID NO:253、 SEQ ID NO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQ ID NO:261、 SEQIDNO:263、 SEQ ID NO:283、 SEQ ID NO:285、 SEQ ID NO:287所代表的的任何一种氨基酸序列的同源物或任一前述SEQ ID NO 的直向同源物或旁系同源物。

还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:235、SEQ IDNO:237、 SEQIDNO:239、 SEQIDNO:241、 SEQIDNO:243、 SEQ ID NO:245、 SEQ ID NO:247、 SEQ ID NO:249、 SEQIDNO:251、 SEQ ID NO:253、 SEQ ID NO:255、 SEQ ID NO:257、 SEQ ID NO:259、 SEQ ID NO:261 SEQ IDNO:263、 SEQ ID NO:283、 SEQ ID NO:285、 SEQ ID NO:287代表的的任何一种氨基酸序列的衍生物或任一前述SEQ ID NO的 直向同源物或旁系同源物。"衍生物"包括这样的肽、寡肽、多肽,它们与 蛋白质(如在SEQ ID NO:235中给出的)的天然存在形式的氨基^列相 比,包含以非天然存在的氨基酸残基对氨基酸的置换或非天然存在的氨基 酸残基的添力口。

另夕卜,SPL15转录因子多肽(至少以其天然形式)一般具有DNA结合活 性和激活结构域。本领域技术人员可以使用惯用工具和技术而容易地确定 激活结构域的存在和DNA-结合活性。

编码SPL15转录因子多肽的核酸可以来自任何自然来源或人工来源。 核酸可以根据其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。编码SPL15转录因子多肽的核酸优选地来自植物,还优选来

自双子叶植物,更优选来自十字花科,该核酸最优选来自拟南芥。

在本文中对SPL15转录因子多肽的任一引用意指如上文定义的SPL15 转录因子肽。编码如此SPL15转录因子多肽的任何核酸适用于实施本发明 的方法。

本发明还提供遗传构建体和载体以促进在植物中导入和/或表达用于 本发明方法中的核酸序列。

因而,提供基因构建体,其包含: 编码如上文所定义的SPL15转录因子多肽的核酸; 与(i)的核酸有效连接的一种或多种调控序列。

本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组 DNA4支术构建。该基因构建体可以插入适于转化至植物内并适于在转化的 细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发 明因而提供如上文所定义的基因构建体在本发明方法中的用途。

植物用包含目的序列的载体(即编码SPL15转录因子多肽的核酸)转 化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞 而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列 (至少与启动子)连接。

酸序列的表达。:动子可以是诱导型启动子,、即-应答于;育性、化学性: 环境性或物理性刺激时具有受诱导或增加的转录启动。启动子可以是组织 特异性启动子,即能够优先在某些组织如叶、根、种子组织等内启动转录 的启动子。

根据本发明,编码SPL15转录因子多肽的核酸与组成型启动子有效连 接。该组成型启动子优选地是HMGB(高速泳动族B)启动子,更优选地, 该组成型启动子是稻HMGB启动子,该组成型启动子还优选地由与SEQ ID NO:279基本上相似的核酸序列代表,该组成型启动子最优选地如SEQ ID NO:279或SEQ ID NO:294所代表。应当明白本发明的适用性不限于编码由SEQ ID NO:234所代表的 SPL15转录因子多肽的核酸,同时本发明的适用性也不限于由HMGB启 动子驱动时编码SPL15转录因子多肽的这种核酸的表达。也可以用来实施 本发明方法的其它组成型启动子的实例在"定义"部分中显示。

用于增加核酸或基因或基因产物表达的额外调节元件可以包括转录增 强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的 终止子序列和增强子序列。其它调控序列(除启动子、增强子、沉默子、内 含子序列、3, UTR和/或5, UTR区之夕卜)可以是蛋白质和/或RNA稳定化 元件。本领域:汰术人员会知道或可以轻易地获得此类序列。任选地, 一种 或多种终止子序列(也是调控序列)可以在导入植物的构建体中使用。

也可以向5,非翻译区(UTR)或部分编码性序列的编码序列添加内含子 序列以增加在胞浆中积累的成熟信息的数量。

本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/ 或复制的复制起点序列。 一个实例是当需要将遗传构建体在细菌细胞中维 持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但 不限于fl-ori和colEl。

该遗传构建体可以任选地包含选择标记基因。

本发明也提供相对于对照植物产生具有增加的产量的转基因植物的方 法,其包括在^:物中导入并表达编码如上文所定义的SPL15转录因子多肽

的核酸。

更具体地,本发明提供相对于对照植物产生具有增加的产量的转基因

植物的方法,所述方法包括:

在植物细^^中导入并表达编码SPL15转录因子多肽的核酸;和

在促进植物生长和发育的条件下培育植物细胞。

核酸可以直接导入植物细胞或导入植物本身(包括导入组织、器官或植 物的任何其它部分)。根据本发明的优选特征,核酸优选地通过转化而导入 植物。

通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将 转化的材料再生成整抹植物。

在DNA转移和再生后,推测的转化植物可以例如使用Southern分析 对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新 导入DNA的表达水平可以使用Northern和/或Western分析或定量PCR 进行监测,全部技术是本领域内普通技术人员众所周知的。

产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或 经典育种^支术。例如,第一代(或T1)转化植物可以进行自交以产生纯合的 第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。

产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非 转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞); 转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化 的根状茎)。

本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞 或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已 经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整林植物

后代相同的基因型特征和/或表型特征。

本发明也包括宿主细胞,其含有编码如上文所定义的SPL15转录因子 多肽的分离的核酸。本发明优选的宿主细胞是植物细胞。

本发明也扩展至植物的可收获部分,如不限于种子、叶、果实、花、 茎、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植 物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉 或蛋白质。

如上文提及,用于增加编码SPL15转录因子多肽的核酸表达的优选方 法是在植物中导入并表达编码SPL15转录因子多肽的核酸;然而实施所述 方法的效果即增加产量也可以-使用众所周知的其它技术实现。下文是对这 些技术中某些的描述。一种这样的技术是T-DNA激活标签化。产生的转基因植物因靠近所 导入启动子的基因的修饰表达而表现表型。本发明的作用也可以使用 TILLING(基因组内定向诱导的局部损伤)技术而再现。本发明的作用也可 以使用同源重组法再现。

如本文中所定义的"增加的产量"意指植物的一个或多个部分的生物量

分。 、、、;p p " , p 、

尤其,此类可收获部分包括营养性生物量和/或种子,并且本发明方法 的实施产生了相对于对照植物的产量具有增加的产量的植物(营养性生物 量和/或种子中)。

以玉米为例,产量增加可以表现为下列一种或多种指标:每公项或英 亩植物数的增加,每林植物穂数的增加、行数的增加、每行粒数、粒重、 千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种 子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现 为下列一种或多种指标的增加:每公项或英亩植物数、每林植物圆锥花序 数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原 圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以 种子总数并乘以100)、千粒重的增加及其它。

由于本发明的转基因植物具有增加的产量,因而相对于对应野生型植 物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的 生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物 的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整林植物。 具有增加的生长速率的植物甚至可以表现早开花。生长速率的增加可以改

变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能。 若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播 种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规 生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同 植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作 物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生 物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增

培育转基因植物,因为;培育作物的区域限制往往由栽种时节(早季)或在 收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这 类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类

参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物 达到其50%最大尺寸所花费的时间),等等。

才艮据本发明的优选特征,本发明方法的实施产生相对于对照植物而具 有增加的生长速率的植。因而根据本发明,提供用于增加植物生长速率的 方法,

与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁 迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴 露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另 一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的 胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的 对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于 40%、 35%或30%,优选小于25%、 20%或15%,更优选小于14%、 13%、 12%、 11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的 进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导 的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物 性和/或非生物性(环境)胁迫。非生物性胁迫可以因干旱或水澇、厌氧胁迫、 盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物性胁迫 可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗 透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些 胁迫。尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以

产生相对于对照植物而具有增加的产量的植物。如在Wang等 (Planta(2003)218: l-14)中报道,非生物性胁迫导致不利地影响植物生长及 生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已 知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133: 1755-1767) 描述了干旱胁迫与高盐度胁迫间极高程度的"串话"。例如,干旱和/或盐化 作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随 高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白 变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应 答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。 如本文中所用的术语"非胁迫"条件是允许植物最佳生长的环境条件。本 领域技术人员清楚对于给定地点的正常土壤条件和气候条件。

本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在 非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发 明,提供用于增加在非胁迫条件下或在轻微干旱条件下培育的植物中产量 的方法,所述方法包括增加编码MADS15多肽的核酸在植物中的表达。

本发明方法的实施产生在营养缺乏条件下、尤其在氮缺乏条件下培育 的相对于在相当条件下培育的合适对照植物具有增加产量的植物。因而根

据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所 述方法包括增加编码MADS15多肽的核酸在植物中的表达。营养缺乏可以 因营养物的缺乏或过量所致,如氮、磷酸盐及其它含磷化合物、钾、钩、 镉、镁、锰、^铁和硼等。

本发明方法有利地适用于任何植物。

特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤 其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、 树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实 例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优 选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、 黑小麦、高粱和燕麦。

本发明也包括通过本发明方法可获得的植物。本发明因而提供植物、 通过本发明方法从此类植物中可获得的部分和细胞,其中所述的植物或部

分或细胞包含编码如上文定义的SPL15转录因子多肽的核酸转基因。

本发明也包括编码SPL15转录因子多肽的核酸在与对照植物中的产量 相比而增加植物中产量的用途。

一种如此用途涉及增加植物的产量,其中所述产量如上文所定义。产 量可以尤其包括一种或多种以下指标:增加的地上部分生物量、增加的每 圆锥花序的花数、增加的种子产量、增加的种子总数、增加的饱满种子数、 增加的千粒重(TKW)和增加的收获指数。

编码SPL15转录因子多肽的核酸可以用于育种程序中,其中鉴定到可 以遗传地与编码SPL15转录因子多肽的基因连接的DNA标记。编码SPL15 转录因子多肽的核酸可以用来定义分子标记。这种标记随后可以在育种程 序中用来选择具有增加的种子产量的植物。编码SPL15转录因子多肽的核 酸可以例如是如SEQ ID NO:234、 SEQ ID NO:236、 SEQ ID NO:238、 SEQ IDNO:240、 SEQIDNO:242、 SEQIDNO:244、 SEQ I關0:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQ ID NO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ ID NO:258、 SEQ ID NO:260、 SEQ ID NO:262、 SEQ ID NO:282、 SEQ ID NO:284和SEQ ID NO:286的任一种所代表的核酸。

种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱 变性处理而导入等位基因变异;备选地,该程序可以从非人为造成的所谓 "自然"起源性的一组等位变体开始。随后进行等位变体的鉴定,例如通过 PCR法。此后是用于选择所讨论的及导致增加种子产量的序列的优异等位 变体的步骤。 一般通过监测含有所讨论序列的不同等位变体的植物的生长 性能而实施选择,其中所述的等位变体例如是SEQ ID NO:234、 SEQ IDNO:236、 SEQ ID NO:238、 SEQ ID NO:240、 SEQ ID NO:242、 SEQ ID NO:244、 SEQ ID NO:246、 SEQ ID NO:248、 SEQ ID NO:250、 SEQ ID NO:252、 SEQ ID NO:254、 SEQ ID NO:256、 SEQ ID NO:258、 SEQ ID NO:260、 SEQIDNO:262、 SEQIDNO:282、 SEQ ID NO:284和SEQ ID

NO:286任一种的不同等位变体。可以在温室中或田间监测生长性能。其它 任选步骤包括使其中优异等位变体被鉴定的植物与另一种植物杂交。这可 以用来例如产生目标表型特征的组合。

编码SPL15转录因子多肽的核酸也可以用作为探针以便对基因进行遗 传作图或物理作图,所述探针作为所述基因的 一部分及用作与那些基因连 锁的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型 的林系。编码SPL15转录因子多肽的核酸的这种用途仅需要具有至少15 个核苷酸长度的核酸序列。编码SPL15转录因子多肽的核酸可以用作限制 性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA 印迹(Sambrook J, Fritsch EF和Maniatis T(1989) Molecular Cloning, A Laboratory Manual)可以用编码SPL15转录因子多肽的核酸探测。产生的 结合图式随后可以使用计算机程序如MapMaker(Lander等(1987) Genomics 1: 174-181)进行遗传分析以构建遗传图。此外,该核酸可以用 来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的DNA印 迹,其中所述的一组个体代表具有确定遗传杂交的亲代和后代。DNA多态 性的分离被标出并用来计算编码SPL15转录因子多肽的核酸在先前使用这 个群体获得的遗传图中的位置(Botstein等(1980) Am. J. Hum.Genet. 32: 314-331)。

在Bernatzky和Tanksley(GENETICS 112 (4): 887-898, 1986)中描述

了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述 了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。 例如,F2互交群、回交群、随机交配群、邻近纯合系(NIL)和其它个体群 体可以用于作图。此类方法学是本领域技术人员众所周知的。

所述核酸4罙针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis: A Practical Guide, Academic press 1996,第319-346页及其中引用的参考文献)。

在另 一 实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991) Trends Genet.7: 149-154)中使用。尽管当前的FISH作图法 支持使用大型克隆(几个kb至几百个kb;见Laan等(1995) Genome Res. 5: 13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核 酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989) J. Lab, Clin. Med 11: 95-96)、 PCR扩增片段的多态性(CAPS; Sheffield等(1993) Genomics 16: 325-332)、等位基因特异性连接(Landegren等(1988) Science 241: 1077-1080)、核苷酸延伸反应(Sokolov(1990) Nucleic Acid Res. 18: 3671)、放射杂交作图(Walter等(1997)Nat.Genet. 7: 22-28)和Happy作图 法(Dear和Cook(1989) Nucleic Acid Res. 17: 6795-6807)。对于这些方法, 使用 一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的 引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR 遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交 叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。

本发明方法产生具有如前文所述的增加产量的植物。这些性状也可以 与经济上有利的其它性状组合,如其它的产量增加性状,对其它非生物性 胁迫和生物性胁迫的耐受性,调节多种构造性特征和/或生物化学特征和/ 或生理学特征的性状。

附图描述

本发明现在将参考下列附图进行描述,其中:

图1代表AtHAL3a多肽的示意性结构,其从氨基端至羧基端包含(i) 底物结合螺i走(加单下划线)、(ii)插入His基序(加双下划线)、 (iii)PXMNXXMW基序(加虚线)和(iv)底物识别夹(加波浪下划线)。HAL3 蛋白质的氨基末端和羧基末端不是非常保守的。图2显示了双元载体pEXP::HAL3,其用于在卩扩展蛋白启动子控制 下的拟南芥HAL3核酸在稻中增加的表达。

图3显示来自拟南芥AtHAL3b(At—NP—973994)、两色蜀黍(Sb)、拟 南芥AtHAL3a(Ath0218)、陆地棉(Cg)、大麦(Hv)、稻(Os)、葡萄(Vitis vinifera)(Vv)、大豆(Gm)、马铃薯(St)、玉蜀黍(Zm)和松(Pg)的多种HAL3 序列的多重比对。

图4详述用于实施本发明方法中的序列的实例:SEQIDNO:l和SEQ IDNO:2代表AtHA13a的核^列和蛋白质序列。SEQ ID NO:3和SEQ ID NO:4是用来分离AtHAL3基因的正向引物和反向引物的序列。SEQ ID NO:5是用于本发明方法中的卩扩展蛋白启动子的序列。SEQIDNO:9至 SEQ ID NO:42代表用于本发明方法中的或用于分离对应全长序列的全长 或部分的DNA/蛋白质序列的实例。在一些情况下,序列从EST序列汇编, 具有较次的测序质量。因此,可以预期一些核酸置换。

图5(A)显示MADS15蛋白质的结构域结构,(B)代表具有MADS结构 域(粗体字)和角蛋白结构域(斜体字)的SEQ ID NO:44的序列。间插结构位 于MADS结构域与角蛋白结构域之间,而C-结构域位于角蛋白结构域的 羧基端。

图6显示多种MADS15蛋白质的多重比对结果。星号表示相同的氨 基酸,冒号代表高度保守性置换,点代表保守性较低的置换。

图7显示用于增加稻中在GOS2启动子控制下的编码稻MADS15蛋白 质的核酸表达的双元载体。

图8详述用于实施本发明方法中的序列的实例。

图9是全长OsMADS15多肽的示意性表示。显示了常见结构域(M, MADS; I,间插结构域;K,角蛋白K盒区;C,可变的羧基端区),在该 示意图以上和以下的线显示参与DNA结合、二聚化以及参与同相互作用 性蛋白质多聚化的蛋白质区域。

图10显示^f吏用在组成型启动子(GOS2)控制下的发夹构建体,用于稻 中MADS15 RNA沉默作用的双元载体pGOS2::MADS15hp。图11详述用于实施本发明方法中或用于分离此类序列中的序列实例。

序列来自公共EST汇编,具有较次的测序质量。因此,可以预期到少数 核酸置换。当这些核酸序列编码全长MADS15多肽时,起始密码子(ATG) 和终止密码子界定了核酸序列。然而,5'和3,UTR也可以用于实施本发明 方法。

图12显示才艮据存在的结构域对AP2/ERF转录因子多肽的示意性分 类:具有两个AP2重复序列的AP2亚家族和仅有一个AP2重复序列的ERF 亚家族。ERF亚家族进一步细分成转录因子,它们包含B3结构域以及AP2 重复序歹'J(称作RAV),或不包含AP2重复序列。PLT转录因子多肽属于 具有两个AP2重复序列的AP2亚家族。

图13代表PLT转录因子多肽结构的示意性说明。AP2结构域包含由 接头区隔开的两个AP2重复序歹'j(加框标出)。加框标出核定位信号(NLS)、 基序1 PK(V/L)(A/E)DFLG和基序2(V/L)FX(M/V)WN(D/E)的大致位置。

图"是与(来自下表4的)其它APZ结构域转录因子多肽相比,(来自 表4的)PLT转录因子多肽序列的比对结果。加框标出核定位信号(NLS)、 基序1 PK(V/L)(A/E)DFLG和基序2(V/L)FX(M/V)WN(D/E)。相同残基加 括号标记,保守性残基加灰色背景。

table see original document page 164

Zc3irm AP2

AY109146.1

玉蜀黍

图15是与来自具有增加的PLT转录因子多肽表达的转基因植物的40 粒种子相比,来自对照植物(左侧)的40粒种子的照片。

图16显示双元载体pGOS2::PLT,其用于增加稻中在GOS2启动子 控制下的稻PLT转录因子核酸的表达。

图17详述用于实施本发明方法的序列(SEQ ID NO:175至SEQ ID NO:188)的实例。还给出了用于分离对应全长序列的部分序列(SEQ ID NO:189和SEQ ID NO:l卯)。

图18显示如本文中所定义的bHLH转录因子的比对结果。序列使用 来自Vector NTI软件包(InforMax, Bethesda, MD)的AlignX程序进行比 对。多重比对用空位开口罚分10和空位延伸0.01进行。需要时,实施细 微手工编辑以便更好地定位一些保守区。bHLH结构域在实心框内显示, PFB26111结构域在虛线框内显示。还通过三个向上的箭头指示5-9-13构 型(K/RER)。单个向下箭头指示用于识别E-盒的谷氨酸残基。

图19显示来自多个物种的bHLH转录因子间的相似性和同一性的矩 阵.同一性百分数以粗体字显示。图19a是在全长序列上的矩阵并且图 19b是仅在bHLH结构域上的矩阵。在实施例34中提供更多细节。

图20显示双元载体pGOS2::bHLH,其用于增加稻中在GOS2启动子 控制下的编码稻bHLH转录因子的核酸的表达。

图21详迷用于实施本发明方法的序列的实例。

图22是使用(在京都大学生物信息学中心GenomeNet服务器上 的)CLUSTAL W(1.83)和默认值(Blosum 62作为权重矩阵,空位开口罚分 10;空位延伸罚分0.05)对全部拟南芥SPL转录因子多肽和SPL15转录因 子多肽的直向同源物作多重序列比对后的邻接法树输出。拟南芥SPL15 转录因子多肽与其它SPL15转录因子多肽的直向同源物和旁系同源物聚 类,如花括弧所示。

图23显示SPL15转录因子多肽的直向同源物和旁系同源物的DNA-结合结构域(DBD)的比对结果。序列使用来自Vector NTI软件包 (InforMax, Bethesda, MD)的AlignX程序进行比对。多重比对用空位开 口罚分10和空位延伸0.01进行。加框标出参与锌离子结合的保守Cys和 His残基。对二分核定位信号(NLS)加下划线。

图24是SPL15转录因子多肽直向同源物和旁系同源物的比对结果。 序列使用来自Vector NTI软件包(InforMax, Bethesda, MD)的AlignX程 序进行比对。多重比对用空位开口罚分10和空位延伸0.01进行。需要时, 实施细微手工编辑以便更好地定位一些保守区。从氨基端至羧基端加框标 出三个主要特征性结构域并且确定为基序1、 SPLDNA结合结构域和基序 2。此外,处于SPL DBD之前的富含G/S的序列用Xs标记并且还加框标 出在该多肽羧基末端处的W(S/T)L三肽。

图25显示了双元载体pHMGB::SPL15,其用于增加稻中在HMGB 启动子控制下的编码SPL15转录因子多肽的拟南芥核酸的表达。

图26详述了用于实施本发明方法中的序列的实例。

实施例

本发明现在将参考仅作为说明的下列实施例加以描述。下列实施例不 意图彻底定义或限制本发明范围。

DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001) Molecular Cloning: a laboratory manual, 第三版Cold Spring Harbor Laboratory Press, CSH, New York)中或Ausubel等(1994), Current Protocols in Molecular Biology, Current Protocols第l和2巻中描述的标 准方法进行。用于植物分子工作的标准材料和方法在由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的 R.D.D. Croy的Plant Molecular Biology Labfax(1993)中描述。

实施例部分A: HAL3

实施例l:鉴定与本发明方法中所用核酸序列相关的序列 使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等 (1990) J. Mol. Biol. 215: 403-410;和Altschul等(1997) Nucleic Acids Res.25: 3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中 所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长 cDNA、 EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列 数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性 的区域。例如,对本发明核酸所编码的多肽使用TBLASTN算法,釆用默 认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示, 并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生 的概率(E-值越低,命中的显著性越高)。除了 E-值外,比较还通过同一性 百分数进行记分。同 一性百分数指两个所比较核酸(或多肽)序列之间在特 定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默 认参数以调节搜索法的严格性。例如可以增加E-值以显示严格性较小的匹 配。以这种方式,可以鉴定短的几乎精确的匹配。

表A提供与本发明方法中所用核酸序列相关的核酸序列列表。

表A: HAL3多肽的实例:

table see original document page 167

table see original document page 168

在一些情况下,相关序列已经由研究所如基因组研究所(TIGR)试验性 汇编并向公众公开。真核生物基因直向同源物(EGO)数据库可以用来此类 的相关序列,这可通过关键词搜索通过使用BLAST算法利用目的核酸或 多狀序列进行。

实施例2:克隆本发明方法中所用核酸序列

本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗 cDNA文库(在MV Sport 6.0内;Invitrogen, Paisley, UK)作为模板进行 扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50 plPCR混合物 中的200 ng模板进行PCR。所用的引物是prm00957(SEQ ID NO:3;有义,

起始密码子为粗体字:

5, aaaaagcaggctcacaatggagaatgggaaaagagac 3,) 和prm00958(SEQ ID NO:4;反义,互补: 5, agaaagctgggttggttttaactagttccaccg 3,),

其中所述引物包括用于Gateway重组的AttB位点。扩增的PCR片 段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP 反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的"进入克隆,,pHAL3。质粒pDONR201作为Gateway⑧技术 的部分从Invitrogen购买。

实施例3: 表达载体构建

进入克隆pHAL3随后在LR反应中与pEXP(—种用于稻转化的目的 载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物 选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的核 酸序列发生LR体内重组的Gateway盒。用于苗特异性表达的稻p扩展蛋 白启动子(SEQ ID NO:5)位于这种Gateway盒的上游。

在LR重组步骤后,将产生的表达载体pEXP::HAL3(图2)转化至农杆 菌菌林LBA4044并随后转化至稻植物内。

实施例4:作物转化

含有表达载体的转化的农杆菌独立地用来转化稻植物。将稻的日本栽 培品种Nipponbare的成熟干燥种子脱壳。通过在70。/。乙醇中温育一分钟, 随后在2%HgC12中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施 消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌 发。在黑暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养 基上增殖。2周后,愈伤組织通过在同一种培养基上传代培养另外2周而 繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共 培育(以增强细胞分裂活性)。

含有表达载体的农杆菌菌林LBA4404用于共培育。农杆菌接种在含有 适宜抗生素的AB培养基上并在28°C培养3日。随后将细菌收集并重悬在 液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将 愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转 移至固化的共培育培养基上并且在黑暗中于25。C温育3日。共培育的愈 伤组织在黑暗中于28°C在选择剂存在下于含有2,4-D的培养基上培育4 周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至 再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。 将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温 室中培育。

将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证 T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物 用于收获Tl种子。种子随后在移植后3-5月收获。本方法以超过50 %的 比率产生单一基因座转化体(Aldemita和Hodgesl996, Chan等1993, Hiei 等1994)。

玉米转化

玉米的转化才艮据对Ishida等(1996. Nature Biotech 14745-50)描述方法

的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可 操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的 杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使 用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的 长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并 且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、 随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养板在25。C于光照下培养2-3周, 或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 小麦转化

小麦的转化用Ishida等Ishida等(1996) Nature Biotech 14(6):745-50

描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品 种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植 物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、 随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养平板在25。C于光照下培养2-3 周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25。C培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 大豆转化

根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大 豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种 Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体 外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚 轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根 癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。 将再生的苗切下并置于苗伸长培养基上。将长度不超过lcm的苗置于生根 培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐 受的并含有单拷贝T-DNA插入物的植物中产生T1种子。

油菜籽/卡i若^立油菜转化

使用5-6曰龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且 根据Babic等(1998, Plant Cell Rep 17:183-188)转化。商业栽培品种 Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它 品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具 有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植 体的切口端浸入细菌混悬液而接种。外植体随后在含有3 mg/1 BAP、 3% 蔗糖、0.70/。植物琼脂(Phytagar)的MSBAP-3培养基上在23。C, 16小时光 照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3 mg/lBAP、头孢遂肟、羧千青霉素或特美汀(300mg/l)的MSBAP-3培养基 上持续7日,并且随后在含头孢噻肟、羧节青霉素或特美汀和选择剂的 MSBAP-3培养基上培养,直至苗再生。当苗具有5—10mm长度时,将苗 切下并转移至苗伸长培养基(含0.5 mg/1 BAP的MSBAP-0.5)。将长度大约 2cm的苗转移至用于根诱导的生根培养基(MSO)。将生才艮的苗移植至温室 的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产 生T1种子。苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839—847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生 植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选 自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与 A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业 苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中 (Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的 根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839—847) 或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288 mg/LPro、 53 mg/ L硫代脯氨酸、4.35 g/ L K2S04和100 jim乙酰丁香酮的SH诱导 培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基 (Murashige和Skoog, 1962)中洗涤并平板接种在不含乙酰丁香酮而含有合 适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数 周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖 的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基 上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐 受性并含有单拷贝T-DNA插入物的植物中产生Tl种子。

实施例5: 评价方法

5.1评价准备

产生大约30个独立的TO稻转化体。原代转化体从组织培养箱转移至 温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对 转基因的存在/不存在以3:l比例分离。对于这些事件中的每一事件,通过 监测目视标记表达而选择含有转基因的大约10林T1幼苗(杂合子和纯合子) 和缺少转基因的大约10林T1幼苗(失效合子)。转基因植物和对应的失效 合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下 28。C和在黑暗中220C以及相对湿度70%。

4个Tl事件在T2世代中按照如用于Tl世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数 字成像箱数次。在每一时间点上,对每林植物从至少6个不同角度拍摄数

字图像(2048xl536像素,1600万颜色)。 5.2统计学分析:t检验和F检验

使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整 体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施 F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整 体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对 于F检验设置在5。/。概率水平上。显著性F检验值标示基因作用,意味着 不仅仅基因的存在或位置才造成表型上的差异。

为检查基因在事件中的作用,即林系特异性作用,使用来自转基因植 物和对应的无效植物的数据集在每个事件内进行t检验。"无效植物"或"无 效分离子"或"失效合子"是以与转基因植物相同的方式受到处理,但是转基 因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。 用于t检验的显著性的阈值设置在10%概率水平上。 一些事件的结果可以

高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位 置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用

在本文中又称作"基因的林系作用"。p-值通过t-值与t-分布比较或备选地 通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作 用不存在)是正确的概率。 实施例6: 评价结果

将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干 燥箱内在37。干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。 使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满 粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。

种子总产量(种子总重量)通过称量从植物中收获的全部饱满粒而测量。每 林植物种子总数通过计数从植物中收获的壳粒数目而测量。收获指数(HI) 在本发明中定义为种子总产量与地上部分面积(mm"之间的比,乘以系数106。如本发明中定义的每圆锥花序的总花数是种子总数与成熟主圆锥花序 的数目之间的比率。如本发明中定义的种子饱满率是饱满种子数对种子(或 小花)总数的比例(表述为%)。

如表B中所示,与对照植物相比,种子产量、饱满种子数和收获指数 在转基因植物中增加,该转基因植物优先在苗中表达编码HAL3多肽的核 酸。

表B显示T1世代中与对照植物相比,从转基因事件事件中计算的以 百分数为单位的平均产量增加(种子总重量)、饱满种子数增加和收获指数 增力口。

表B

参数 %增加p-值

种子总重量 14 0.0072 饱满种子数 15 0.0052 收获指数 10 0.0093

实施例7:早期萌发势评价结果

早期萌发势通过计数来自地上植物部分中区别于背景的像素的总数而 确定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过 校正转化成物理表面值(平方亳米表示)。下文所述的结果针对萌发后3周 的植物。

在Tl世代7个事件的六个事件中见到植物早期萌发势(如由地上部分 面积确定),与对照植物相比,转基因幼苗的地上部分面积整体增加27%。 在T2世代中进一步评估这些Tl事件中的4个事件,并且与对照植物相比, 这四个事件均引起转基因幼苗的地上部分面积增加,与对照植物相比,转

基因幼苗的地上部分面积整体增加33%。还证实所述结果是统计学显著 的,来自F-检验的p-值低于0.0001(T2世代),表明所见的作用可能是因为 转基因而不是因基因的位置或林系作用所致,见表C。表c

参数 %增加p-值

早期萌发势 33 0.0000 实施例部分B:上调的MADS15

实施例8:鉴定与SEQ ID NO: 43和SEQ ID NO: 44相关的序列

使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等 (19卯)J. Mol. Biol. 215: 403-410;和Altschul等(1997) Nucleic Acids Res. 25: 3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中 所维护的那些序列内鉴定到SEQ ID NO:43相关的(全长cDNA、 EST或基 因组)序列和/或与SEQ ID NO:44相关的蛋白质序列。该程序用来通过核酸 序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到 序列间具有局部相似性的区域。对由SEQ ID NO:43编码的多肽^f吏用 TBLASTN算法,釆用默认设置和过滤以忽略低复杂性序列抵消。分析的 结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映 特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了 E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较 核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在 一些情况下,可以调整默认参数以调节搜索法的严格性。

除了可在NCBI获得的公众可用核酸序列之外,还按照如上文所述的 相同方法搜索专利性序列数据库。

表D提供与如SEQ ID NO:43所代表的核酸序列和SEQ ID NO:44所 代表的蛋白质序列相关的核酸序列和蛋白质序列列表。

表D:与用于本发明方法中的核酸序列(SEQIDNO:43)相关的核, 列以及对应的推导多肽。

名称 来源生物 SEQ ID NO: 数据库检索号

nucl/蛋白质名称 来源生物 SEQIDNO:数据库检索号

nucl/蛋白质

table see original document page 176

名称

m8

FD腿ADS3

MADS15

TvFL2

TvFLl

SQUA1 A1FL

来源生物

大麦

稻 稻

紫露草

(Tradescantia virginiana)

紫露草 紫露草

油標(Maeis guineensis)

葱属

SEQ ID NO: nucl/蛋白质

帰l

92/93 94/95 96/97

98/99 100/101 102/103 104/105

数据库检索号

CAB97354 AAL09473 AAL09473 AAP83415

AAP83414 AAP83416 AAQ03221 AAP83362

DOMADS2 Dendrobi腿grex

106/107

AAF13261

实施例9: 相关多肽序列的比对

来自Vector NTI(Invitrogen)的AlignX基于进行性比对的流行Clustal 算法(Thompson等(1997) Nucleic Acids Res 25: 4876-4882; Chenna等 (2003), Nucleic Acids Res 31: 3497-3500)。可以使用邻接聚类算法构建系 统发生树。默认值是空位开口罚分IO,空位延伸罚分O.l并且选择的权重 矩阵是Blosum 62(若比对多肽)。

在图6.中显示使用在鉴定实施本发明方法中所用多肽中相关的多肽的 多重序列比对结果。

实施例10:用于实施本发明方法的多肽序列之间全局同一性百分数的

计算

使用本领域可获得的方法之一 MatGAT(矩阵全局比对工具)软件 (BMC Bioinformatics. 2003 4: 29. MatGAT:使用蛋白质序列或DNA序列 产生相似性/同一性矩阵的应用.Campanella JJ, Bitincka L, Smalley J;软件由Ledion Bitincka所有)确定用于实施本发明方法的全长多肽序列之 间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白 质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers 和Miller全局比对算法(空位开口罚分12和空位延伸罚分2)执行一系列逐 对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结 果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性 在对角分界线的上半部分中显示。 比较中所用的参数是:

记分矩阵:Blosum62 笫一空位:12 延伸空位:2

多肽序列(排除部分多肽序列)全长上的全局相似性和同 一性软件分析 结果在表E中显示。同一性百分数在对角线之上给出并且相似性百分数在 对角线之下给出。

与SEQIDNO:44相比,用于实施本发明方法的多肽序列之间的同一 性百分数可以低到40 %氨基酸同一性。表E:多肽序列全长上的全局相似性和同一性的MatGAT结果

table see original document page 179

table see original document page 180

实施例11:鉴定在用于实施本发明方法的多肽序列内包含的结构域 蛋白质家族、结构域和位点集成资源(Integrated Resouce of Protein Families, Domain and Site, InterPro)数据库是基于文本和序列的搜索的 通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所

信息以得到蛋白质标签。合作数据库包括SWISS-PROT、 PROSITE、 TrEMBL、 PRINTS、 ProDom和Pfam、 Smart和TIGRFAMs。 Interpro 驻留于英国的欧洲生物信息研究所。

InterPro扫描如SEQ ID NO:44所代表的多肽序列的结果在表F中。 表F:如SEQ ID NO:44所代表的多肽序列的InterPro扫描结果

table see original document page 181

实施例12: 用于实施本发明方法的多肽序列的拓朴学预测(亚细胞定 位,跨膜.,,)

TargetPl.l预测真核蛋白质的亚细胞定位。位置分配是基于任何氨基 端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌 途径信号肽(SP)。作为最终预测基础的记分并不实际是概率,并且它们未 必合为一体。然而,具有最高记分的位置根据TargetP是最有可能的,并 且记分之间的关系(可靠性类别)可以是预测的肯定性的 一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务 器上维护。

对于预测含有氨基端前序列的序列,也可以预测潜在的切割位点。

选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预 定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。

如SEQ ID NO:44所代表的多肽序列的TargetP 1.1分析的结果在表 G中显示。已经选择"植物"生物组,未定义临界值并且需要转运肽的预测 长度。如SEQ ID NO:44所代表的多肽序列的亚细胞定位可以是细胞质或 核,未预测到转运肽。

表G:如SEQ ID NO:44所代表的多肽序列的TargetP 1.1分析

table see original document page 182

众多其它算法可以用来执行此类分析,包括:

在丹麦技术大学(Technical University of Denmar)月良务器上驻留的 ChloroPl.l;

在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia)的月艮 务器上驻留的蛋白质Prowler亚细胞定位预测程序(Protein Prowler Subcellular Localisation Predictor)笫1.2版;

在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University of Alberta,Edmonton, Alberta, Canada )的服务器上驻留的PENCE Proteme Analyst PA-GOSUB 2.5;

在丹麦技术大学服务器上驻留的TMHMM。 实施例13: 与用于实施本发明方法的多肽序列相关的分析法 Lim等(PMB44, 513-527, 2000)描述了可以适用于MADS15的用于 测量蛋白质-蛋白质相互作用的两种分析法。在酵母双杂交分析法中, MADS1的截短形式(包含完整MADS盒、I-结构域和K-结构域,但是缺少 C-结构域的羧基端部分)用作^秀斜以测试与MADS15的相互作用。在体外 下拉分析法中,产生了 GST以及融合GST的MADS1蛋白质并将它们固 定在谷胱甘肽Sepharose4B上。树脂结合的GST/GST-MADS1与35S-标 记的MADS15蛋白质或其片段混合。在洗涤后,将相互作用性蛋白质洗脱 并通过SDS-PAGE进行分析。本领域技术人员会理解MADS15蛋白质可 以在双杂交筛选中用作诱辨或也可以固定在谷胱甘肽树脂上。此外根据本 发明方法使用时,MADS15蛋白质将导致稻中增加的根产量(测量为根生物 量对苗生物量的增加的比例)。

实施例14: 克隆如SEQ ID NO: 43所代表的核酸序列 稻MADS15基因通过PCR,使用稻幼苗cDNA文库(Invitrogen, Paisley, UK)作为模板而扩增。将提取自幼苗的RNA逆转录后,将cDNA 克隆至pCMV Sport 6.0。库的插入序列平均大小是1.5 kb并且克隆的最初 数目是1.59x107 cfu量级。在6x1011 cfu/ml的第一轮扩增后测定原始滴度 是9.6x105 cfu/ml。在质粒提取后,将200 ng模板用于50 jalPCR混合物中。 将引物prm06892(SEQIDNO:45;有义,起始密码子为粗体字,AttBl位 点为斜体:5'-ggggacaagtttgtacaaaaaagcaggcttaaaca atgggcgggggaaggt-3,)和 prm06893(SEQ ID NO:46 ;反义,互补,AttB2位点为斜体字: 5'-ggggaccactttgtacaagaaagctgggtttggccgacgacgacgac-3,)用于PCR扩增, 其中所述引物包括用于Gateway重组的AttB位点。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。还使用标准方法扩增并纯化约915 bp的PCR 片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的"进入克 隆",pMADS15。质粒pDONR201作为Gateway⑧技术的部分从Invitrogen购买。

实施例15: 使用如SEQ ID NO:43所代表核酸序列构建表达载体

进入克隆pMADS15随后在LR反应中与pGOS2 (—种用于稻转化的 目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的: 植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目 的核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2 启动子(SEQIDNO:108,备选地,SEQ ID NO:47是同样有用的)位于这种 Gateway盒的上游。

在LR重组步骤后,产生的表达载体pGOS2::MADS15(图7)根据本领 域众所周知的方法转化至农杆菌菌林LBA4044中。

实施例16:才直物转化

稻转化

含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种 Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后 在2%HgC12中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。 消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑 暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。 2周后,愈伤組织通过在同一种培养基上传代培养另外2周而繁殖或增殖。 胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细 胞分裂活性)。

含有表达载体的农杆菌菌林LBA4404用于共培育。农杆菌接种在含有 适宜抗生素的AB培养基上并在28°C培养3日。随后将细菌收集并重悬在 液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将 愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转 移至固化的共培育培养基上并且在黑暗中于25。C温育3日。共培育的愈 伤组织在黑暗中于28。C在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至 再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。

将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其 中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温 室中培育。

将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证 T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物 用于收获Tl种子。种子随后在移植后3-5月收获。本方法以超过50 %的 比率产生单一基因座转化体(Aldemita和Hodgesl996, Chan等1993, Hiei 等1994)。

玉米转化

玉米的转化根据对Ishida等(1996. Nature Biotech 14745-50)描述方法

的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可 操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的 杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使 用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的 长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并 且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、 随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养板在25。C于光照下培养2-3周, 或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 小麦转化

小麦的转化用Ishida等Ishida等(1996) Nature Biotech 14(6):745隱50

描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品 种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植 物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪

唑啉酮,但可以使用多种选择标记)。培养平板在25。C于光照下培养2-3 周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25°C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 大豆转化

根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大 豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种 Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体 外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚 轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根 癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。 将再生的苗切下并置于苗伸长培养基上。将长度不超过lcm的苗置于生根 培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐 受的并含有单拷贝T-DNA插入物的植物中产生Tl种子。

油茱籽/卡诺拉油菜转化

使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且 根据Babic等(1998, Plant Cell Rep 17:183-188)转化。商业栽培品种 Westar(AgricuIture Canada)是用于转化的标准品种,但是也可以使用其它 品种。对卡诺拉油茱种子作表面消毒以便体外播种。从体外幼苗中切下具 有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植 体的切口端浸入细菌混悬液而接种。外植体随后在含有3 mg/1 BAP、 3% 蔗糖、0.7。/。植物琼脂(Phytagar)的MSBAP-3培养基上在23。C, 16小时光 照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3 mg/lBAP、头孢噻肟、羧千青霉素或特美汀(300 mg/l)的MSBAP-3培养基 上持续7日,并且随后在含头孢噻肟、羧爷青霉素或特美汀和选择剂的 MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗 切下并转移至苗伸长培养基(含0.5 mg/1 BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MSO)。将生根的苗移植至温室 的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产 生T1种子。 苜蓿转化

苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839—847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生 植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选 自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与 A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业 苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中 (Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的 根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839—847) 或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288 mg/L Pro、 53 mg/ L硫代脯氨酸、4.35 g/ L K2S04和100 乙酰丁香酮的SH诱导 培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基 (Murashige和Skoog, 1962)中洗涤并平板接种在不含乙酰丁香酮而含有合 适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数 周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖 的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基 上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐 受性并含有单拷贝T-DNA插入物的植物中产生Tl种子。

实施例17: 表型评价方法

17.1评价准备

产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至 温室用于生长和收获T1种子。留下6个事件,其中所述事件的T1后代对 转基因的存在/不存在以3:l比例分离。对于这些事件中的每一事件,通过

和缺少转基因的大约10林T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下

28。C和在黑暗中22。C以及相对湿度70%。

4个Tl事件在T2世代中按照如用于Tl世代的相同评价方法作进一 步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数 字成像箱数次。在每一 时间点上,对每林植物从至少6个不同角度拍摄数 字图《象(2048xl536像素,1600万颜色)。

17.2统计分析:F-检验

使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整 体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施 F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整 体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对 于F检验设置在5"/。概率水平上。显著性F检验值标示基因作用,意味着 不仅仅基因的存在或位置才造成表型上的差异。

为检查基因在事件中的作用,即株系特异性作用,使用来自转基因植 物和对应的无效植物的数据集在每个事件内进行t检验。"无效植物,,或"无 效分离子"或"失效合子"是以与转基因植物相同的方式受到处理,但是转基 因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。 用于t检验的显著性 的阈值设置在10%概率水平上。 一些事件的结果可以 高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位 置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用 在本文中又称作"基因的林系作用"。p-值通过t-值与t-分布比较或备选地 通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作 用不存在)是正确的概率。

17.3测量的参数

从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间点上, 对每林植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜 色)。

植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角

度拍摄的画面进行平均化并且通过校正转化成以平方mm 表达的物理表面 值。实聪r证实以这种方式测量的地上部分植物面积与地上植物部分的生物 量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测 量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分面积。根生物 量的增加表述为根总生物量(测量为在植物寿命期间所观察到的根的最大 生物量)的增加;或表述为根/苗指数(测量为在根和苗的活跃生长时期中根 生物量与苗生物量之间的比率)的增加。

实施例18:转基因植物的表型评价结果

在如上所述对植物分析时,本发明人发现与缺少MADS15转基因的植 物相比,用MADS15基因构建体转化的植物具有更高根产量,其表达为根 /苗指数。所述增加在Tl中是9.4。/。(p-值0.0207)并且在T2中为25.7%(p-值0.0002)。 p-值显示所述的增加是显著性的。

实施例部分C:下调的MADS15

MADS15相关序列的鉴定和表征也参见实施例8至13。

实施例19:基因克隆

稻MADS15基因通过PCR,使用稻幼苗cDNA文库(Invitrogen, Paisley, UK)作为模板而扩增。将提取自幼苗的RNA逆转录后,将cDNA 克隆至pCMV Sport 6.0。库的插入序列平均大小是1.5 kb并且克隆的最初 数目是1.59x107 cfu量级。在6x1011 cfu/ml的第一轮扩增后测定原始滴度 是9.6x105 cfu/ml。在质粒提取后,将200 ng模板用于50 plPCR混合物中。 将引物prm06892(SEQ ID NO:lll;有义,起始密码子为粗体字,AttBl 4立点为斜体:5,-ggggacaagtttgtacaaaaaagcaggcttaaacaatggg cgggggaaggt-3,) 和prm06893(SEQ ID NO:112;反义,互补,AttB2位点为斜体字: 5'-ggggaccactttgtacaagaaagctgggtttggccgacgacgacgac-3,)用于PCR扩增, 其中所述引物包括用于Gateway重组的AttB位点。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。还使用标准方法扩增并纯化约915 bp的PCR 片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间发夹构建体与pDONR201质粒发生体内重组以产生根据Gateway命名的"进入克 隆",pMADS15hp。质粒pDONR201作为Gateway®技术的部分从 Invitrogen购买。

实施例20: 载体构建

进入克隆pMADS15hp随后在LR反应中与p01519(—种用于反向重 复序列构建体的目的载体)一起使用。这种栽体在T-DNA边界内含有作为 功能元件的:植物选择标记;篩选标记表达盒和意图用于LR体内重组以 至于来自进入克隆的目的序列作为反向重复序列整合的Gateway盒。用于 组成型表达的稻GOS2启动子(SEQIDNO:174,备选地,SEQIDNO:113 是同样有用的)位于这种Gateway盒的上游。

在LR重组步骤后,产生的具有反向重复序列的表达载体(图IO)转化 至农杆菌菌林LBA4044并且随后转化至稻植物。

实施例21: 4直物转化

稻转化

含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种 Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后 在2%HgC12中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。 消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑 暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。 2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。 胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细 胞分裂活性)。

含有表达载体的农杆菌菌林LBA4404用于共培育。农杆菌接种在含有 适宜抗生素的AB培养基上并在28°C培养3日。随后将细菌收集并重悬在 液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将 愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转 移至固化的共培育培养基上并且在黑暗中于25°C温育3日。共培育的愈 伤组织在黑暗中于28°C在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至

再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。 将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其 中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温 室中培育。

将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证 T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物 用于收获Tl种子。种子随后在移植后3-5月收获。本方法以超过50 %的 比率产生单一基因座转化体(Aldemita和Hodgesl996, Chan等1993, Hiei 等1994)。

玉米转化

玉米的转化根据对Ishida等(1996. Nature Biotech 14745-50)描述方法

的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可 操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的 杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使 用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的 长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并 且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、 随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养板在25。C于光照下培养2-3周, 或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 小麦转化

小麦的转化用Ishida等Ishida等(1996) Nature Biotech 14(6):745画50

描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品 种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植 物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪

唑啉酮,但可以使用多种选择标记)。培养平板在25。C于光照下培养2-3 周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25°C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 大豆转化

根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大 豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种 Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体 外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚 轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根 癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。 将再生的苗切下并置于苗伸长培养基上。将长度不超过lcm的苗置于生根 培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐 受的并含有单拷贝T-DNA插入物的植物中产生T1种子。

油菜籽/卡诺拉油菜转化

使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且 根据Babic等(1998, Plant Cell Rep 17:183-188)转化。商业栽培品种 Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它 品种。对卡诺拉油茱种子作表面消毒以便体外播种。从体外幼苗中切下具 有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植 体的切口端浸入细菌混悬液而接种。外植体随后在含有3 mg/1 BAP、 3% 蔗糖、0.7。/。植物琼脂(Phytagar)的MSBAP-3培养基上在23。C, 16小时光 照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3 mg/lBAP、头孢噻肟、羧千青霉素或特美汀(300 mg/l)的MSBAP-3培养基 上持续7日,并且随后在含头孢噻肟、羧千青霉素或特美汀和选择剂的 MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗 切下并转移至苗伸长培养基(含0.5 mg/1 BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MSO)。将生根的苗移植至温室 的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产 生T1种子。 苜蓿转化

苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839—847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生 植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选 自栽培品种Rangelander(Agriculture Canada)或长口 Brown DCW与A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业 苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中 (Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的 根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839—847) 或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288 mg/LPro、 53 mg/ L硫代脯氨酸、4.35 g/ L K2S04和100 乙酰丁香酮的SH诱导 培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基 (Murashige和Skoog, 1962)中洗涤并平板接种在不含乙酰丁香酮而含有合 适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数 周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖 的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基 上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐 受性并含有单拷贝T-DNA插入物的植物中产生Tl种子。

实施例22:对以稻GOS2启动子控制下的MADS15反向重复序列所 转化植物的评价方法

产生大约15-20个独立T0稻转化体。将原代转化体从组织培养箱转 移至温室用于生长并收获Tl种子。留下反向重复序列构建体的8个事件, 其中所述事件的Tl后代对转基因的存在/不存在以3:1比例分离。对于这 些事件中的每一事件,通过监测目视标记表达而选择到含有转基因的大约 10林T1幼苗(杂合子和纯合子)和缺少转基因的大约10林T1幼苗(失效合子)。将选棒的Tl植物转移至温室。每个植物接受唯一的条形码标签以明 确地将表型分型数据与对应的植物联系起来。选择的Tl植物在10cm直径 花钵中的土壤上于下列环境设置下培育:光周期=11.5小时,日光密度= 30,000 lux或更高,昼间温度-28。C或更高,夜间温度-22。C,相对湿度= 60-70%。转基因植物和对应的失效合子在随机位置上并排培育。使植物从 播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每林植物从 至少6个不同角度拍摄数字图像(2048xl536像素,1600万颜色)。

植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字 图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角 度拍摄的画面进行平均并且通过校正转化成由平方mm表示的物理表面 值。实-验证实以这种方式测量的地上部分植物面积与地上植物部分的生物 量相关。Areamax是在植物已经达到其最大叶生物量的时间点上地方部分 面积。

将成熟的主要圆锥花序收获、计数、装袋、加条形码标记并且随后在 干燥箱内在37。干燥3日。随后将圆锥花序脱粒并且收集全部种子。使用 吹气装置分开饱满粒与空粒。在分离后,随后使用市售计数机对两个种子 批次计数。弃去空粒。饱满粒在分析天平上称重并且种子的横截面积使用 数字成像法测量。这种方法产生以下的种子相关参数集合:

每个圆锥花序的花数是估计植物上每个圆锥花序小花的平均数目的参 数,该参数来自种子总数除以笫一个圆锥花序数。最高圆锥花序以及垂直 排列时与最高圆锥花序重叠的全部圆锥花序被视为第一圆锥花序并以手工 方式计数。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产 量(种子总重量)通过称量从植物中收获的全部饱满粒而测量。每林植物种 子总数通过计数从^i物中收获的壳粒数目而测量并且对应于每林植物的小 花数目。使用图像分析软件,这些参数以自动化方式来自数字图像并通过 统计学分析。使用由两个主要部分(称量装置和成像装置及与之连接的用于 图像分析的软件)构成的定制仪器测量各个种子参数(包括宽度、长度、面 积、重量)。使用对非平衡设计作出校正的双因子ANOVA(方差分析)作为统计模 型用于植物表型特征的总体评价。对用所述基因转化的全部事件的全部植 物的全部测量参数实施F检验。实施F检验以检查基因对于全部转化事件 的作用并验证基因的整体作用(又称作"基因全局作用")。若F检验的值显 示该数据是显著的,则可以得出存在"基因,,作用的结论,意味着不仅仅基 因的存在或位置才造成所述作用。对于F检验,用于真实全局基因作用的 显著性的阈值设置在5%概率水平。

为检查基因在事件中的作用,即林系特异性作用,使用来自转基因植 物和对应的无效植物的数据集在每个事件内进行t检验。"无效植物,,或"无 效分离子"或"失效合子"是以与转基因植物相同的方式受到处理,但是转基 因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。 用于t检验的显著性的阈值设置在10%概率水平上。 一些事件的结果可以 高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位 置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用 在本文中又称作"基因的林系作用"。p-值通过t-值与t-分布比较或备选地 通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作 用不存在)是正确的概率。

实施例23: 测量反向重复序列构建体转化体的产量相关参数:

在如上所述对种子分析时,本发明人发现与缺少MADS15转基因的植 物相比,用发夹MADS15基因构建体转化的植物具有更高种子产量,其表 达为饱满种子数、种子总重量、种子总数和每个圆锥花序的花数,而用有 义MADS15基因构建体转化的植物显示相反的效果。p-值显示所述的增加 是显著的。

对Tl世代中的植物所获得的结果在表H中汇总,该结果代表全部测 试抹系的均值:

表H:

%差异 p-值%差异 p-值

饱满种子数 +122 o,oo(

种子总重量 +112 o,oo(

种子总数 +27 o,oo(

每个圆锥花序的+25 o,oo(

花数

实施例部分D: PLT

实施例24 :鉴定与本发明方法中所用核酸序列相关的序列 使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等 (1990) J. Mol. Biol. 215: 403-410;和Altschul等(1997) Nucleic Acids Res. 25: 3389-3402)在国家生物技术信息中心(NCBI)的Entrez核普酸数据库中 所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长 cDNA 、 EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列 数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性 的区域。例如,对本发明核酸所编码的多肽使用TBLASTN算法,采用默 认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示, 并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生 的概率(E-值越低,命中的显著性越高)。除了 E-值外,比较还通过同一性 百分数进行记分。同 一性百分数指两个所比较核酸(或多肽)序列之间在特 定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默 认参数以调节搜索法的严格性。例如可以增加E-值以显示严格性较小的匹 配。以这种方式,可以鉴定短的几乎精确的匹配。

下表I提供与本发明方法中所用核酸序列相关的核酸序列列表。

表I:与本发明方法中所用核酸序列相关的核酸序列

名称 核酸SEQ 多肽 NCBI检索号 来源生物

table see original document page 197

table see original document page 198

在一些情况下,相关序列已经由研究所如基因组研究所(TIGR)试验性 汇编并向公众公开。真核生物基因直向同源物(EGO)数据库可以用来此类 的相关序列,这可通过关键词搜索通过使用BLAST算法利用目的核酸或 多肽序列进行。

实施例25: 克隆用于本发明方法中的核酸序列

本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥cDNA文 库(在MV Sport 6.0内;Invitrogen, Paisley, UK)作为模板而扩增,其中 所述的cDNA文库从提取自不同组织的RNA开始而产生。在标准条件下 使用Hifi Taq DNA聚合酶,利用在50 plPCR混合物中的200 ng模板进行 PCR。用来扩增SEQ ID NO:175(PLTl)的引物是prm08180(SEQ ID NO:195;有义,起始密码子为粗体,AttBl位点是斜体字:5,

prm08181(SEQ ID NO:196;反义,互补,AttB2位点是斜体字:5,

(7C7GG^ CC4 CT7TGTJ CA4 G扁G

CTGGC?7TCCTTGTTTACTCATTCCACA 3,),其中所述引物包括用于 Gateway重组的AttB位点。用来扩增SEQ ID NO:177(PLT2)的引物是 prm08182(SEQIDNO:197;有义,起始密码子为粗体字,AttBl位点是斜 体 字 : 5,

ACTGGCTC 3')和prm08183 (SEQ ID NO:198;反义,互补,AttB2位点 是 斜 体 字 : 5,

GGG04CC4CT7TGn^4 O^GCTWGTTCATCTTTTATTCATTCCACA3,),

扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法 的第一步骤即BP反应,在此期间PCR片段与pDONR201质粒发生体内 重组以产生根据Gateway命名的"进入克隆",对于SEQ ID NO:175是 pPLTl并且对于SEQ ID NO:177是pPLT2。质粒pDONR201作为 Gateway⑧技术的构成部分从Invitrogen购买。

实施例26: 表达载体构建

进入克隆pPLTl和pPLT2随后在LR反应中与用于稻转化的目的载 体一起使用。第一个载体在T-DNA边界内含有作为功能性元件的:植物 选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核 酸序列发生LR体内重组的Gateway盒。稻组成型启动子即GOS2启动子 (SEQ ID NO:210,备选地,SEQ ID NO:194是同样有用的)位于这种 Gateway盒的上游。

第二个载体在T-DNA边界内含有相同功能性元件:植物选择标记; 筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生 LR体内重组的Gateway盒。用于分生组织中表达的稻启动子即MT启动 子(SEQ ID NO:211)(PRO0126)位于这种Gateway盒的上游。

在LR重组步骤后,将产生的表达载体即pGOS2::PLTl、 pGOS2::PLT2、 pMT::PLTl和pMT::PLT2(图16显示带GOS2启动子的 构建体)独立地转化至农杆菌菌林LBA4044并随后转化至稻植物。允许转 化的稻植物生长并随后对下文所述参数进行检验。

实施例27:作物转化

含有表达载体的转化的农杆菌独立地用来转化稻植物。将稻的日本栽 培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟, 随后在2%HgC12中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施 消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌 发。在黑暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养 基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共

培育(以增强细胞分裂活性)。

含有表达载体的农杆菌菌林LBA4404用于共培育。农杆菌接种在含有 适宜抗生素的AB培养基上并在28。C培养3日。随后将细菌收集并重悬在 液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将 愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转 移至固化的共培育培养基上并且在黑暗中于25°C温育3日。共培育的愈 伤组织在黑暗中于28°C在选择剂存在下于含有2,4-D的培养基上培育4 周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至 再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。 将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其 中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温

室中培育。

对于一个构建体,产生大约35个独立T0稻转化体。将原代转化体从 组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数 后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获Tl种子。种 子随后在移植后3-5月收获。本方法以超过50 %的比率产生单一基因座转 化体(Aldemita和Hodges1996, Chan等1993, Hiei等1994)。

玉米转化

玉米的转化才艮据对Ishida等(1996. Nature Biotech 14745-50)描述方法

的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可 操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的 杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使 用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的 长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并 且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、 随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养板在25。C于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 小麦转化

小麦的转化用Ishida等Ishida等(1996) Nature Biotech 14(6):745-50

描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品 种Bobwhite。不成熟胚与含有表达栽体的根癌农杆菌共培育并且转基因植 物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、 随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养平板在25。C于光照下培养2-3 周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 大豆转化

才艮据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大 豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种 Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体 外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚 轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根 癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。 将再生的苗切下并置于苗伸长培养基上。将长度不超过lcm的苗置于生根 培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐 受的并含有单拷贝T-DNA插入物的植物中产生T1种子。

油菜籽/卡诺拉油菜转化

使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且 根据Babic等(1998, Plant Cell Rep 17:183-188)转化。商业栽培品种 Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它 品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植

体的切口端浸入细菌混悬液而接种。外植体随后在含有3 mg/1 BAP、 3% 蔗糖、0.7。/。植物琼脂(Phytagar)的MSBAP-3培养基上在23°C, 16小时光 照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3 mg/lBAP、头孢瘗肟、羧千青霉素或特美汀(300mg/l)的MSBAP-3培养基 上持续7日,并且随后在含头孢噻肟、羧千青霉素或特美汀和选择剂的 MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗 切下并转移至苗伸长培养基(含0.5 mg/1 BAP的MSBAP-0.5)。将长度大约 2cm的苗转移至用于根诱导的生根培养基(MSO)。将生根的苗移植至温室 的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产 生T1种子。 苜蓿转化

苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839-847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生 植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选 自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与 A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业 苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中 (Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的 根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847) 或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288 mg/ L Pro、 53 mg/ L石克代脯氨酸、4.35 g/ L K2S04和100 jim乙酰丁香酮的SH诱导 培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基 (Murashige和Skoog, 1962)中洗涤并平板接种在不含乙酰丁香酮而含有合 适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数 周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖 的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基 上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有羊拷贝T-DNA插入物的植物中产生T1种子。

实施例28: 表型评价方法 28.1评价准备 在正常生长条件下的评价

原代转化体从组织培养箱转移至温室用于生长和收获Tl种子。留下6 个事件,其中所述事件的Tl后代对转基因的存在/不存在以3:1比例分离。 对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的 大约10林T1幼苗(杂合子和纯合子)和缺少转基因的大约10林T1幼苗(失 效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件 是短日照(12小时光照),在光线下28°C和在黑暗中22。C以及相对湿度 70%。

在降低的氮可用性下的评价

稻植物在除营养液外的正常条件下于盆栽土壤中培育。花钵从移植至 成熟期间用含有氮(N)浓度降低的特定营养液浇灌,通常7-8次或更少次数。 培育的其余期间(植物成熟、种子收获)与不在非生物性胁迫下培育的植物 相同。

28.2统计分析:F-检验

使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整 体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施 F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整 体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对 于F检验设置在5。/o概率水平上。显著性F检验值标示基因作用,意味着 不仅仅基因的存在或位置才造成表型上的差异。

为检查基因在事件中的作用,即林系特异性作用,使用来自转基因植 物和对应的无效植物的数据集在每个事件内进行t检验。"无效植物,,或"无 效分离子"或"失效合子"是以与转基因植物相同的方式受到处理,但是转基 因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显箸性的阈值设置在10%概率水平上。 一些事件的结果可以 高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位 置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用 在本文中又称作"基因的林系作用"。p-值通过t-值与t-分布比较或备选地

通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作

用不存在)是正确的概率。

28.3测量的参数 生物量相关参数测量

从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间点上, 对每林植物从至少6个不同角度拍摄数字图像(2048xl536像素,1600万颜 色)。

植物地上部分面积(或叶生物量、最大面积)通过计数在来自植物地上 部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点 上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达 的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物 部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时 间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分面 积。根生物量的增加表述为根总生物量(测量为在植物寿命期间所观察到的 根的最大生物量)的增加;或表述为根/苗指数(测量为在根和苗的活跃生长 时期中根质量与苗质量之间的比率)的增加。

种子相关的参数测量

将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干 燥箱内在37。干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。 使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满 粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。

种子总产量通过称量从植物中收获的全部饱满粒而测量。每林植物种子总 数通过计数从植物中收获的壳粒数目而测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与 地上部分面积(mm"之间的比,乘以系数106。如本发明中定义的每圆锥花 序的总花数是种子总数与成熟主圆锥花序的数目之间的比率。如本发明中 定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。

实施例29:转基因植物的表型评价结果

29.1在组成型启动子控制下表达PLT1或PLT2核酸序列的于正常生 长条件下培育的转基因植物的表型评价结果

对正常生长条件下所培育PLT1和PLT2转基因稻植物的Tl种子的 TKW测量结果在表J中以绝对值(平均的事件)和作为与野生型植物相比 的百分数显示。与野生型种子相比,观察到含有两者之一的构建体的转基 因种子在TKW方面的明显增加。

表J :对正常生长条件下所培育PLT1和PLT2转基因植物的Tl种 子的TKW测量的结果。

table see original document page 205

使用由两个主要部分(称量装置和成像装置及与之结合的用于图像分 析的软件)构成的定制仪器测量各个种子参数(包括宽度、长度、面积、重量)。

对PLT1和PLT2转基因稻植物的Tl种子的种子面积和种子长度测 量的结果在表K中以绝对值(平均的事件)和作为与野生型植物相比的百分 数显示。与野生型种子相比,观察到含有任一构建体的转基因种子在种子 面积和种子长度方面的明显增加。

表K :对正常生长条件下所培育PLT1和PLT2转基因植物的Tl种 子的种子面积和种子长度测量的结果

table see original document page 206

29.3在分生组织特异性启动子控制下表达PLT2核酸序列的在正常生 长条件下培育的转基因植物的表型评价结果

对正常生长条件下所培育PLT2转基因稻植物的Tl种子的TKW测 量的结果在表M中以绝对值(平均的事件)和作为与野生型植物相比的百分 数显示,其中所述的PLT2转基因稻植物表达在分生组织特异性启动子控 制下的PLT2核酸序列。与野生型种子相比,观察到含有构建体的转基因种子在TKW方面的明显增加。

表M :对正常生长条件下所培育PLT2转基因植物的Tl种子的TKW 测量的结果,其中所述的PLT2转基因稻植物表达在分生组织特异性启动 子控制下的PLT2核酸序列。

table see original document page 207

实施例部分E: bHLH

实施例30:鉴定稻中SEQ ID NO:213的bHLH的旁系同源物 使用SEQID2,利用BLASTP算法搜索稻基因组中的旁系同源物,其 中所述的BLASTP算法用来针对给定蛋白质序列数据库执行蛋白质查询 序列的相似性搜索。所查询的蛋白质数据库对应于包含59,712个序列; 27,051,637个总字母的MIPS研究所的稻蛋白组-MIPS稻数据库(MOsDB)。 结果根据如从最高记分和最低E-值所确定的最高相似性进行排序。鉴定到 与SEQID NO:2旁向同源的bHLH蛋白质序列的命中具有至少50的记分 和低于e-05的E-值。下文显示在查询序列与从头鉴定的旁系同源物之间的 配对比对结果。查询:SEQID 2

最小 总数 最高概率

产生高记分区段对的序列: 记分 P(N) N

9629 .m00093 l蛋白质螺旋-环. -螺旋 DNA- -结合结构域,.., 1132 1. ■ 3e- 1

9629 .m00090 l蛋白质螺旋-环. -螺旋 DNA- -结合结构域,,.. 305 5, ,7e- 28 1

9630 .m01262 l蛋白质螺旋-环. -螺旋 D船- -结合结构域,... 189 1, ,le- ■15 1

9629 .m07159 l蛋白质螺旋-环 -螺旋 -结合结构域,,.. 112 3, ,Ae- 05 1

〉9629.m0OQ93i蛋白质螺旋-环-螺旋 DNA-结合结构域,推测性 长度=225

记分=1132(403.5命中),期望值=1.3e-115, P = 1.3e-115 同一性=224/224(100%),阳性=224/224(100%)

查询:

61

Sbjct: 61

120

120

查询:

181

Sbjct: 181

224

224

〉9529.m00090l蛋白质螺旋-环-螺旋 DNA-结合结构域,推测性 长度=363

记分=305 (112 . 4命中),期望值=5.7e_28, P = 5.7e-28 同一性=87/230(37%),阳性=126/230(54%)TSSSG G +++++ ERK+ + E+ RR MKGLC+KL+SL工P + H S

Sbjct: 18 TSSSGSGASS----TAAAAAAERKEMERRRRQDMKGLCVKLASLIP-----KEHCSMSKM 68

查询: 7 9 SSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGR工DELKKRKQQ----------------AA 122

+ + S TQL L++AAAYIK+LK R+DEL ++ AA

查询: 12 3 ALTTSTSNGGGGGMPVVEVRCQDGTLDVVVVSEAIRE------------ERERAVRLHEV 170

A STS GGGG ++ VV V + ++E R V+ H+V

I VLEEEGA++++A+FS+ +YT++S+A SRIG++ASR+S RLR L

〉9630.iu01262 |蛋白质螺^走-环-螺:旋 DNA-结合结构域,推测性 长度=211

记分=189(71.6命中),期望值=l.le-15, P = l.le-15 同一性=66/214(30%),阳性=102/214(47%)

S+GGGGGGG K +RK E+ RR M L L SL+ +A P + +S S + Sbjct: 7 SAGGGGGGG--------KPDRKTTERIRREQMNKLYSHLDSLVRSAPPTVNS工PSHSNSN 58

查询: 8 0 SSSPPSSTK------EAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ——AAALTTSTSN 130

S + A T+ D L AA YI + Q + R+D L+ + + K++ +S + S +

G G P VEV+ L ++ + A + H + +E+ G +V FS

Sbjct: 119 GAGAATAAAPEVEVQHLGSGLHAILFTGAPPTD——GASFHRAVRAVEDAGGQVQNAHFS 175

查询: 18 8 VVGDK工FYTLHSGALCSRIGLDASRVSHRLRNLL 221

V G K YT+H+ G++ RV RL+ +

Sbjct: 17 6 VAGAKAVYT工HAM工GDGYGG工E—RVVQRLKEAI 207实施例31:鉴定拟南芥中SEQIDNO:213的bHLH的直向同源物 使用SEQIDNO:2,利用BLASTP算法搜索拟南芥基因组中的直向同 源物,其中所述的BLASTP算法用来针对给定蛋白质序列数据库执行蛋白 质查询序列的相似性搜索。所查询的蛋白质数据库对应于包含26,735个序 列;11,317,104个总字母的MIPS研究所的拟南芥蛋白组-MIPS拟南芥数 据库(MAtDB)。结果根据如从最高记分和最低E-值所确定的最高相似性进 行排序。鉴定到与SEQID NO:2直向同源的bHLH蛋白质序列的命中具有 至少50的记分和低于e-05的E-值。下文显示在查询序列与从头鉴定的直 向同源物之间的配对比对结果。查询:SEQID 2

数据库: /home/data/bl as t/orgs_sets/ arabi 26,735个序歹'j; 11, 317, 104个总字母

产生高记分性区段对的序列:

记分

最小 总数 高概率

P(N)

Atlgl0585未知蛋白质 At4g20970假设的蛋白质 At4g25410推观'J的蛋白质

At5g51780推测的bHLH转录因子(bHLH036) At5g51790推观'J的蛋白质

180 4 , .5e-15 1

149 8 , ,7e-12 1

118 2 , ,0e-06 1

105 1 . ,5e-05 1

110 1 , ,5e-05 1

〉Atlgl0585未知蛋白质 长度=122

记分=180(68,4命中),期望值=4.5e-15, P = 4.5e-15 同一性=38/119(31%),阳性=72/119(60%)

查询:

Sbjct:

106

QLK ++ LK+ + K+

+ R +D T + + +

+ R V -L刚KR——V

165

58

查询:

166

224

LHE + +

EEEGA+V++A+

D+ YT+ SRIG+D SR+ R+R ++ Y

Sbjct:

59

117

〉At4g2097C3 "f艮^殳的蛋白质 长度=167

记分=149(57.5命中),期望值=8,7e-12, P = 8.7e-12 同一性=49/171(28%),阳性=86/171(50^)

十 S ++RK VEKNRR+ MK L 十L SL+P HH ST + P EA Sbjct: 8 TGQSRSVDRKTVEKNRRMQMKSLYSELISLLP--------HHSSTEPLTLP-DQLDEAAN 58

查询:

Sbjct:

93

59

QLDHLEQAAAYIKQLKGRI—

-DELKKRKQQ-AAALTTSTSNGGGGGMPVVEVRCQDGTL 148 L+K ++++++S +P +E++ + G++

-ETGSI 117

查询: 14 9 DVVVVSEAIREERERAVRLHEVIGVLEEE-GAEVV肌SFSVVGDK工FTTLH 198

+ + ++ E E+I VL EE GAE+ +A +S+V D +F+TLH

Sbjct: 118 FHIFLVTSIi----EHKFWCEIIRVLTEELGAEITHAGYSIVDDAVFHTLH 164实施例32:鉴定来自蒺藜苜蓿的bHLH

待解决问题是查询序列(来自蒺藜苜蓿的SEQ ID NO:227)是否是根据 本文中所用定义的bHLH多肽。将SEQ ID NO:227与MIPS研究所的拟 南芥蛋白组数据库进行比较。

使用BLASTP 2.0MP-WashU算法实施比较,其中所述算法针对给定 的蛋白质序列数据库执行蛋白质查询序列的相似性搜索(参考文献:Gish, W.(1996-2002))。在比较中所用的参数是E值:10;临界记分(S2): 56。

所查询的蛋白质数据库对应于包含26,735个序列的MIPS研究所拟南 芥蛋白质组(数据库:/home/data/blast/orgs—sets/arabi 26,735个序列; 11,317,104总字母)。结果根据如从最高记分和最低E-值所确定的最高相似 性进行排序。所鉴定的首个命中(在比对结果中加下划线)对应于SEQ ID NO:225(At4g20970),表明该序列是根据本文中所用定义的bHLH多肽。 下文显示来自苜蓿(Medicago)的查询序列与从头鉴定的bHLH之间的配对 比对结果。

BLASTP 2.0MP-WashU [2002年9月22日】[decunix4.0-ev56-I32LPF64 2002-09-09T17: 45: 09】

查询=SEQ ID NO: 227 (140字母)

数据库:/h ome/data/blast/orgs—sets/arabi

26,735个序歹iJ; 11, 317, 104个总字母。 搜索.…10.…20.…30……40….50……60……70,…80….90….100%完成

最小 总数 高概率

产生高记分性区段对的序列s: 记分 P(N) N

At4g20970假设的蛋白质_248 2 . 8e-22 1

At5g517 8 0推观'J的bHLH转录因子(bHLH03 6) 103 6. 5e-07 1

Atlgl0585未知蛋白质 100 1.4e-06 1

At4g25400推测的bHLH转录因子(bHLHl 18) 99 7.3e-06 1〉At4g2097Q "f艮iS:的蛋白质 长度=167

记分=248(92.4命中),期望值=2.8e-22, P = 2.8e-22 同一性=52/123(42%),阳性=82/123(66%)

查询: 7 EA工SVPDQLKEATNYIKKLQ工NLEK顺EKKNFLLG——工QRPN------VNLNRNQKMGL 57

E +++PDQL EA NY工KKLQ+N+EK +E+K L+ +++ N V+ + + +

查询: 58 KSPKIKIQQIGLVLEVVLITGLESQFLFSETFRVLHEE-GVDIVK1ASYKVNEDSVFHS工H 116

K PK工+工Q十G + + L+T LE +F+F E RVL EE G +工+A Y + +D+VFH+ + H

查询: 117 CQV 119

C+V

Sbjct: 165 CKV 167

实施例33:鉴定与本发明方法中所用核酸序列相关的序列 使用bHLH序歹'j(核苷酸(全长cDNA、 EST或基因组的)或蛋白质(全 长或部分多肽))来利用数据库序列搜索工具,如基本局部比对工具 (BLAST)(Altschul等(1990) J. Mol. Biol. 215: 403-410;和Altschul等(1997) Nucleic Acids Res. 25: 3389-3402)在国家生物技术信息中心(NCBI)的 Entrez核苷酸数据库内维护的那些序列中鉴定其它bHLH核苷酸或蛋白 质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计 算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,使用 由SEQ ID NO:213编码的多肽作为针对nr(无冗余:(数据库:全部 GenBank+EMBL+DDBJ+PDB序列(但是无EST、 STS、 GSS、环境样本 或相0、 1或2HTGS序列),3,819,973个序列;16,928,533,343个总字母) 数据库序列的查询,使用TBLASTN算法,采用默认设置和过滤程序以忽 略低复杂性序列。分析的结果(下文显示)通过配对比较加以显示,并根据几 率评分(E-值)排序,其中该评分反映特定比对结果因偶然而存在的概率(E-值越低,命中显著性越大)。除了 E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内 的相同核苷酸(或氨基酸)数目。

在数据库上鉴定BHLH蛋白质的产生至少50的记分和等于或低于 e-05的E-值的命中。

记分 E

产生显著性比对结果的序列: (比特)值 gi|55765745|ref)NM—183508.2|稻(日本栽培种-gro 440 le-121

gi|42821746|dbj|AK109432.2|稻(日本栽培种-g... 440 le-121

gi|55769744|ref]XM—549862.11 稻(日本栽培种-gro 247 le-105

gi|58530787|dbj|AP008207.1|稻(日本栽培种-g… 263 2e-68

gi|17385651|dbj|AP002845.3|稻(日本栽培种-g... 263 2e-68

gi|32980356|dbj|AK070332.1|稻(日本栽培种-g,., 251 9e-65

gi|34894135|ref|NM—183504.1| 稻(日本栽培种-gro 137 3e-30

gi|15293050|gb|AY050959.1|拟南芥未知蛋白质 80.1 6e-16

gi|79340923|ref|NM_100934.2| 拟南芥转录… 87.8 2e-15

gi|58531195|dbj|AP008214.1|稻(日本栽培种-g… 51.6 4e-13

gi|42408246|dbj|AP004557.3| 稻(日本栽培种-g… 51.6 4e-13

gi|42408168|dbj|AP004376.3|稻(日本栽培种-g... 51.6 4e-13

gi|22328837|ref]NM_118215.2|拟南芥DNA结合... 78.2 le-12

gi)7268888|emb(AL1615542|ATCHWV54拟南芥DNA chr 77.8 2e-12

gi|5262774|emb|AL080282.1|ATT13K14 拟南芥DNA c… 77.8 2e-12

gi|50906596|ref|XM—464787.11稻(日本栽培种-gro 77.0 3e-12

实施例34: 确定bHLH转录因子之间的全局相似性和同一性 bHLH多肽之间的全局相似性百分数和同一性百分数使用本领域可 MatGAT软件(BMC Bioinformatics, 2003 4: 29. MatGAT:使用蛋白质序 列或DNA序列产生相似性/同一性矩阵的应用.Campanella JJ, BitinckaL, Smalley J)加以确定。MatGAT软件产生针对DNA序列或蛋白质序列 的相似性/同一性矩阵,无需数据的预比对。该程序执行一系列配对比对, 计算相似性和同一性并且随后将结果置于距离矩阵中。

比较中所用的参数是:

记分矩阵:Blosum62 第一空位:12 延伸性空位:2

结果在图19a中显示。

实施例35:确定在bHLH多肽中的bHLH结构域之间的全局相似性 和同一性

bHLH结构域使用SMART软件(Schultz等(1998)iVoc 7Vfl" tAS^ 95, 5857-5864; Letunic等(2006) Nucl"V34, D257-D260) 作图。Smart软件可通过EMBL研究所(欧洲分子生物学实验室(EMBL) 获得。

下文给出所用bHLH结构域的序列。

hv一bh:lh

os—np—908393—bhlh

〇S—NP_908397.1 BHLH KGRIDE

〇s_XP—464787.1 BHLH AEYIRQTQERVDM AT1G10585—bHLH

nlrekdrrmrmkhlfsilsshvsptrklpvphlidqatsymiqlkenvny At4g20970—bHLH在bHLH多肽的bHLH结构域之间全局相似性百分数和同 一性百分数 使用在实施例34中描述的软件和参数确定。 结果在图19b中显示。

实施例36: 克隆本发明方法中所用核酸序列

本发明方法中所用的核酸序列通过PCR,使用定制的稻幼苗cDNA文 库(Invitrogen, Paisley, UK)作为模板而扩增。在标准条件下使用Hifi Taq DNA聚合酶,利用在50 plPCR混合物中的200 ng模板进行PCR。所用 的引物是prm06808(SEQIDNO:231;有义,起始密码子为粗体字,AttBl 位 点 是 斜 体 字 : 5,-

ggggacaagtttgtacaaaaaagcaggcttaaacaatgaagagcaggaagaacagc 3,) 和 prm06809(SEQ ID NO:232;反义,互补,AttB2位点是斜体字:5, ggggaccactttgt織agaaagctgggtgcagagtg纖gagtggtgtg 3,),其中所述的《1物 包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法 予以纯化。随后实施Gateway方法的第 一 步骤,即BP反应,在此期间PCR 片段与pDONR201质粒发生体内重组以产生根据Gateway命名的"进入克 隆",pbHLH。质粒pDONR201作为Gateway⑧技术的构成部分从 Invitrogen购买。

实施例37:表达载体构建

进入克隆p076随后在LR反应中与pGOS2 (—种用于稻转化的目的 载体)使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择 标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的核^ 列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子 (SEQ ID NO:233,备选地,SEQ ID NO:230是同样有用的)(内部参考号 PR0129)位于这种Gateway盒的上游。

在LR重组步骤后,将产生的表达载体pGOS2::bHLH(图20)转化至 农杆菌菌林LBA4044并随后转化至稻植物。

实施例38: 植物转化

稻转化含有表达载体的农杆菌独立地用来转化稻植物。将稻的日本栽培种

Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后 在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。 消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑 暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。 2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。 胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细 胞分裂活性)。

含有表达载体的农杆菌菌林LBA4404用于共培育。农杆菌接种在含有 适宜抗生素的AB培养基上并在28°C培养3日。随后将细菌收集并重悬在 液体共培育培养基中至密度(OD6。o)约1。将混悬液随后转移至培养m并将 愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转 移至固化的共培育培养基上并且在黑暗中于25。C温育3日。共培育的愈 伤组织在黑暗中于28°C在选择剂存在下于含有2,4-D的培养基上培育4 周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至 再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。 将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其 中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温 室中培育。

对于一个构建体,产生大约30个独立T0稻转化体。将原代转化体从 组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数 后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获Tl种子。种 子随后在移植后3-5月收获。本方法以超过50 %的比率产生单一基因座转 化体(Aldemita和Hodges1996, Chan等1993, Hiei等1994)。

玉米转化

玉米的转化才艮据对hhida等(1996, Nature Biotech 14745-50)描述方法 的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可 操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使

用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的 长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并 且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、 随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养板在25。C于光照下培养2-3周, 或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25°C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 小麦转化

小麦的转化用Ishida等Ishida等(1996) Nature Biotech 14(6):745-50

描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品 种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植 物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、 随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养平板在25。C于光照下培养2-3 周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 大豆转化

根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大 豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种 Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体 外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚 轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根 癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至逸择培养基。 将再生的苗切下并置于苗伸长培养基上。将长度不超过lcm的苗置于生根 培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有羊拷贝T-DNA插入物的植物中产生Tl种子。 油菜籽/卡诺拉油菜转化

使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且 根据Babic等(1998, Plant Cell Rep 17:183-188)转化。商业栽培品种 Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它 品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具 有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植 体的切口端浸入细菌混悬液而接种。外植体随后在含有3 mg/1 BAP、 3% 蔗糖、0.7。/。植物琼脂(Phytagar)的MSBAP-3培养基上在23。C, 16小时光 照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3 mg/lBAP、头孢噻肟、羧节青霉素或特美汀(300 mg/l)的MSBAP-3培养基 上持续7日,并且随后在含头孢噻肟、羧千青霉素或特美汀和选择剂的 MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗 切下并转移至苗伸长培养基(含0.5 mg/1 BAP的MSBAP-0.5)。将长度大约 2cm的苗转移至用于根诱导的生根培养基(MSO)。将生根的苗移植至温室 的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产 生Tl种子。

苜蓿转化

苜贛的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839—847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生 植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选 自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业 苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中 (Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的 根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839—847) 或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288 mg/ L Pro、 53 mg/ L碌u代脯氨酸、4.35 g/ L K2S04和100 乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige 和Skoog, 1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和 合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体 细胞胚转移至不含生长调节剂、不含抗生素而含有50 g/ L蔗糖的BOi2Y 发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。 将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含 有单拷贝T-DNA插入物的植物中产生Tl种子。

实施例39: 评价方法

39.1评价准备

产生大约30个独立的T0稻转化体。原代转化体从组织培养箱转移至 温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对 转基因的存在/不存在以3:1比例分离。对于这些事件中的每一事件,通过 监测目视标记表达而选择含有转基因的大约10林T1幼苗(杂合子和纯合子) 和缺少转基因的大约10林T1幼苗(失效合子)。转基因植物和对应的失效 合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下 28。C和在黑暗中22。C以及相对湿度70%。

4个Tl事件在T2世代中按照如用于Tl世代的相同评价方法作进一 步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数 字成像箱数次。在每一时间点上,对每林植物从至少6个不同角度拍摄数 字图像(2048xl536像素,1600万颜色)。

39.2统计分4斤:t检验和F-检验

使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整 体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施 F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整 体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对 于.F检验设置在5%概率水平上。显著性F检验值标示基因作用,—意味着 不仅仅基因的存在或位置才造成表型上的差异。

为检查基因在事件中的作用,即林系特异性作用,使用来自转基因植物和对应的无效植物的数据集在每个事件内进行t检验。"无效植物"或"无 效分离子"或"失效合子"是以与转基因植物相同的方式受到处理,但是转基 因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。

用于t检验的显著性的阈值设置在10。/。概率水平上。 一些事件的结果可以

高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位 置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用 在本文中又称作"基因的林系作用"。p-值通过t-值与t-分布比较或备选地

通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作 用不存在)是正确的概率。 实施例40: 评价结果

早期萌发势通过计数来自地上植物部分中区别于背景的像素总数而确 定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校 正转化成由平方mm表示的物理表面值。下文所述的结果针对萌发后3周 的植物。

在Tl世代7个事件中的6个事件中见到植物早期萌发势(如由地上部 分面积确定),同时与对照植物相比,转基因幼苗的地上部分面积总体增加 22%。在T2世代中进一步评估这些Tl事件中的4个事件,并且与对照植 物相比,全部这四个事件均引起转基因幼苗的地上部分面积增加,与对照 植物相比,转基因幼苗的地上部分面积总体增加13%。还证实所述结果是 统计学显著的,来自F-检验的p-值是0.0007(T2世代),表明所见的效果可 能是因为转基因而不是因基因的位置或林系作用所致。

实施例部分F: SPL15

实施例41:鉴定与本发明方法中所用核酸序列相关的序列 使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等 (1990) J. Mol. Biol. 215: 403-410;和Altschul等(1997) Nucleic Acids Res. 25; 3389-3402)在国家生物技术信息中心的EntrezL核苷酸数据库中所维护 的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA 、 EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。

对本发明核酸所编码的多肽使用TBLASTN算法,采用默认设置和过滤以 忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评 分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越 低,命中的显著性越高)。除了 E-值外,比较还通过同一性百分数进行记分。 同 一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相 同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索 法的严格性。

表N:与用于本发明方法中的核酸序列(SEQ ID NO:234)相关的核酸序

table see original document page 222

table see original document page 223

table see original document page 224

实施例42: 确定SPL15转录因子之间的全局相似性和同一性,及SPL15转录因子的SPL DBD。

SPL15转录因子之间的全局相似性百分数和同 一性百分数4吏用本领域 可获得的方法之一 MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics. 2003 4: 29. MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩 P车的应用.Campanella JJ, BitinckaL, SmalleyJ;软件由Ledion Bitincka 所有)加以确定。MatGAT软件产生针对DNA序列或蛋白质序列的相似性 /同一性矩阵,无需数据的预比对。使用Myers和Miller全局比对算法(空 位开口罚分12和空位延伸罚分2),该程序执行一系列配对比对,使用例如 Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵 中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的 上半部分中显示。SEQIDNO:235的序列在矩阵中显示为第5号。 比较中所用的参数是:

记分矩阵:Blosum62

第一空位:12

延伸性空位:2

在表O中显示针对SPL15转录因子多肽全长的全局相似性和同一性 的软件分析结果。同一性百分数在对角线之上给出并且相似性百分数在对 角线之下给出。在SPL15转录因子旁系同源物和直向同源物间的同 一性百 分数范围是30-70%,反映所述旁系同源物和直向同源物间在SPL DBD之 外的相对低的序列同一性保守。

表O:用于在SPL15转录因子多肽全长上的全局相似性和同一性的 MatGAT结果。

table see original document page 225

table see original document page 226

表P:针对SPL15转录因子多肽的SPL DBD的全局相似性和同一性的 MatGAT结果。

针对SPL15转录因子多肽的SPL DBD的全局相似性和同一性

table see original document page 227

实施例43: 克隆本发明方法中所用核酸序列

DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001) Molecular Cloning: a laboratory manual, 第三版Cold Spring Harbor Laboratory Press, CSH, New York)中或Ausubel等(1994), Current Protocols in Molecular Biology, Current Protocols第1和2巻中描述的标 准方法进行。用于4直物分子工作的标准材料和方法在由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的 R.D.D. Croy的Plant Molecular Biology Labfax(1993)中描述。本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥混合组织 cDNA文库(在MV Sport 6.0内;Invitrogen, Paisley, UK)作为模板而扩 增。在标准条件下使用HifiTaqDNA聚合酶,利用在50 ^tl PCR混合物中 的200 ng模板进行PCR。所用引物是prm07277(SEQ ID NO:280;有义, 起始密码子为粗体字,AttBl位点是小写字体:5,-

和prm07278(SEQ ID NO:281;反义,互补AttB2位点是小写字体:5, ggggaccactttgtacaagaaagctgggtTGATGAAGATCTTAAAAGGTGA 3,),其 包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法 予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR 片段与pDONR201质粒发生体内重组以产生根据Gateway命名的"进入克 隆",pSPL15。质粒pDONR201作为Gateway⑧技术的构成部分从 Invitrogen购买。

实施例44: 表达载体构建

进入克隆p13075随后在LR反应中与p06659(—种用于稻转化的目 的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植 物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的 核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻HMGB 启动子(SEQ ID NO:294)位于这种Gateway盒的上游。备选地,由SEQ ID NO:46代表HMGB启动子是同样有用的。相似的构建体用在组成型的 GOS2启动子(SEQ ID NO:295)控制下的SPL15编码序列产生。

在LR重組步骤后,将产生的表达载体pHMGB::SPL15(图26)或 pGOS2::SPL15转化至农杆菌菌林LBA4044并且随后转化至稻植物。

实施例45: 植物转化

稻转化

含有表达载体的转化的农杆菌用来转化稻植物。将稻的日本栽培种 Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后 在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑 暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。 2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。 胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细 胞分裂活性)。

含有表达载体的农杆菌菌林LBA4404用于共培育。农杆菌接种在含有 适宜抗生素的AB培养基上并在28。C培养3日。随后将细菌收集并重悬在 液体共培育培养基中至密度(OD6QG)约1。将混悬液随后转移至培养皿并将 愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转 移至固化的共培育培养基上并且在黑暗中于25。C温育3日。共培育的愈 伤组织在黑暗中于28。C在选择剂存在下于含有2,4-D的培养基上培育4 周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至 再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。 将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其 中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温 室中培育。

对于一个构建体,产生大约35个独立T0稻转化体。将原代转化体从 组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数 后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获Tl种子。种 子随后在移植后3-5月收获。本方法以超过50 。/。的比率产生单一基因座转 化体(Aldemita和Hodges1996, Chan等1993, Hid等1994)。

玉米转化

玉米的转化根据对Ishida等(1996. Nature Biotech 14745-50)描述方法

的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可 操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的 杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使 用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的 长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、 随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪

唑啉酮,但可以使用多种选择标记)。培养板在25。C于光照下培养2-3周, 或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 小麦转化

小麦的转化用Ishida等Ishida等(1996) Nature Biotech 14(6):745-50

描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品 种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植 物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、 随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪 唑啉酮,但可以使用多种选择标记)。培养平板在25。C于光照下培养2-3 周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25。C培养 2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受 的并含有单拷贝的T-DNA插入物的植物中产生Tl种子。 大豆转化

才艮据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大 豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种 Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体 外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚 轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根 癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。 将再生的苗切下并置于苗伸长培养基上。将长度不超过lcm的苗置于生根 培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐 受的并含有单拷贝T-DNA插入物的植物中产生Tl种子。

油菜籽/卡诺拉油菜转化

使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998, Plant Cell Rep 17:183-188)转化。商业栽培品种 Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它 品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具 有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植 体的切口端浸入细菌混悬液而接种。外植体随后在含有3 mg/1 BAP、 3% 蔗糖、0.7。/。植物琼脂(Phytagar)的MSBAP-3培养基上在23。C, 16小时光 照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3 mg/lBAP、头孢噻肟、羧节青霉素或特美汀(300 mg/l)的MSBAP-3培养基 上持续7日,并且随后在含头孢噻肟、羧节青霉素或特美汀和选择剂的 MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗 切下并转移至苗伸长培养基(含0.5 mg/1 BAP的MSBAP-0.5)。将长度大约 2cm的苗转移至用于根诱导的生根培养基(MSO)。将生根的苗移植至温室 的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产 生T1种子。 苜蓿转化

苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839—847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生 植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选 自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与 A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业 苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中 (Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的 根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839—847) 或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288 mg/ L Pro、 53 mg/ L石危代脯氨酸、4.35 g/ L K2S04和100 乙酰丁香酮的SH诱导培 养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige 和Skoog, 1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和 合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50 g/ L蔗糖的BOi2Y 发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。 将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含 有单拷贝T-DNA插入物的植物中产生Tl种子。

实施例46: 评价方法

46.1评价准备

产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至 温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对 转基因的存在/不存在以3:1比例分离。对于这些事件中的每一事件,通过 监测目视标记表达而选择含有转基因的大约10林T1幼苗(杂合子和純合子) 和缺少转基因的大约10林T1幼苗(失效合子)。转基因植物和对应的失效 合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下 28。C和在黑暗中22。C以及相对湿度70%。

5个Tl事件在T2世代中按照如用于Tl世代的相同评价方法作进一 步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数 字成像箱数次。在每一时间点上,对每林植物从至少6个不同角度拍摄数 字图像(2048xl536像素,1600万颜色)。

早期萌发势是萌发后3周的植物(幼苗)地上部分面积。根生物量的增 加表达为根总生物量(测量为在植物寿命期间所观察到的根最大生物量) 的增加;或表述为根/苗指数(测量为根和苗的活跃生长时期中根质量和苗 质量之间的比例)的增加。

46.2统计分冲斤:F-检-验

使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整 体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施 F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整 体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对 于F检验设置在5。/。概率水平上。显著性F检验值标示基因作用,意味着 不仅仅基因的存在或位置才造成表型上的差异。为检查基因在事件中的作用,即林系特异性作用,使用来自转基因植 物和对应的无效植物的数据集在每个事件内进行t检验。"无效植物"或"无 效分离子"或"失效合子"是以与转基因植物相同的方式受到处理,但是转基 因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。

用于t检验的显著性的阈值设置在10%概率水平上。 一些事件的结果可以

高于或低于这个阔值。这基于如此假设,即基因可能仅在基因组中某些位 置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用 在本文中又称作"基因的抹系作用"。p-值通过t-值与t-分布比较或备选地

通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作 用不存在)是正确的概率。 实施例47: 评价结果

植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字 图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角 度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面 值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物 量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点。

将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干 燥箱内在37。干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。 使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满 粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。

种子总产量通过称量从植物中收获的全部饱满粒而测量。每林植物种子总 数通过计数从植物中收获的壳粒数目而测量。从计数的饱满种子数及其总 重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与 地上部分面积(mm"之间的比,乘以系数106。如本发明中定义的每圆锥花 序的总花数是种子总数与成熟主圆锥花序的数目之间的比率。如本发明中 定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。

如在表Q至表W中所示,与合适的对照植物相比,地上部分生物量、 每个圆锥花序的花数、种子产量、种子总数、饱满种子数、千粒重(TKW)和收获指数在编码SPL15转录因子多肽的核酸的表达增加的转基因植物中 增加。显示了来自T1和T2世代的结果。

表Q显示具有地上部分生物量增加的转基因事件的数目、这种增加的 百分数以及这种增加根据F-检验的统计关联性。

表Q:在编码SPL15转录因子多肽的核酸表达增加的转基因稻的Tl 和T2世代中具有地上部分生物量增加的转基因事件的数目、这种增加的 百分数和F-检验的P值。

table see original document page 234

表R显示具有每个圆锥花序花总数增加的转基因事件的数目、这种增 加的百分数以及这种增加根据F-检验的统计关联性。

表R:在编码SPL15转录因子多肽的核酸表达增加的转基因稻的Tl 和T2世代中具有每个圆锥花序花数增加的转基因事件的数目、这种增加 的百分数和F-检l^的P值。

table see original document page 234

表s显示具有种子总产量(种子总重量)增加的转基因事件的数目、这 种增加的百分数以及这种增加根据F-检验的统计关联性。

表S:在编码SPL15转录因子多肽的核酸表达增加的转基因稻的Tl 和T2世代中具有种子产量增加的转基因事件的数目、这种增加的百分数 和F-检-验的P值。

table see original document page 235

表V在编码SPL15转录因子多肽的核酸表达增加的转基因稻的Tl和 T2世代中具有收获指数增加的转基因事件的数目、这种增加的百分数和 F-检验的P值。

table see original document page 236

表W显示具有千粒重(TKW)增加的转基因事件的数目、这种增加的 百分数以及这种增加根据F-检验的统计关联性。

表W:在编码SPL15转录因子多肽的核酸表达增加的转基因稻的Tl 和T2世代中具有千粒重(TKW)增加的转基因事件数、这种增加的百分数 和F-检-验的P值。

table see original document page 236

实施例48:对组成型启动子控制下表达SEQ ID NO:234的转基因植 物的表型评价结果

表X中给出了对表达组成型GOS2启动子控制下的用于实施本发明方 法中的核•列的转基因稻植物的评价结果。还显示转基因植物和对应的 失效合子之间的差异百分数。

与对照植物(在这种情况下,失效合子)相比,表达用于实施本发明方 法中的核酸序列的转基因植物具有增加的早期萌发势和增加的TKW。

表X:对表达强组成型GOS2启动子控制下的用于实施本发明方法的 核酸序列的Tl世代转基因稻植物的评价结果。

table see original document page 237

标题 发布/更新时间 阅读量
肝脏特异性转录调控序列及其应用 2020-05-11 964
表达调控序列 2020-05-11 395
新的人细胞内吞调控蛋白、其编码序列及用途 2020-05-12 336
新的人细胞周期调控蛋白、其编码序列及用途 2020-05-12 588
MAR序列调控弱启动子构建高效表达载体的方法 2020-05-13 589
一种肝脏高效表达调控序列及其应用 2020-05-11 618
水稻散穗基因PAC1调控序列及分子标记应用 2020-05-12 440
一种基于时间序列的调控全业务统一建模方法 2020-05-12 842
一种淋巴组织特异性基因表达调控序列 2020-05-13 241
牙鲆原始生殖细胞Nanos3基因的调控序列及其应用 2020-05-12 242
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈