首页 / 专利库 / 作物管理 / 环境胁迫 / 非生物胁迫 / 具有增强的产量相关性状的植物及其制备方法

具有增强的产量相关性状的植物及其制备方法

阅读:1040发布:2020-11-16

专利汇可以提供具有增强的产量相关性状的植物及其制备方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及具有改良性质的 植物 ,其中 钙 网蛋白、BET-1样多肽、DUS1样多肽、ES43样多肽、HON5样多肽或GSA1多肽的表达被修饰。该改良的性质可以是增强的产量。,下面是具有增强的产量相关性状的植物及其制备方法专利的具体信息内容。

1.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码网蛋白多肽的核酸的表达。
2.权利要求1的方法,其中所述钙网蛋白多肽包含一个或多个下列基序:
(i)基序3:PXXIXDPXXKKPEXWDD(SEQ ID NO:246),
(ii)基序4:GXWXXXXIXNPXYK(SEQ ID NO:247),
(iii)基序5:E[VL]WQVK(SEQ ID NO:248),
(iv) 基 序 6:TLV[FL]QFSVKHEQKLDCGGGY[MV]KLLSGDV DQKKFGG[DE]TPYSIMF
GPDICGY(SEQ ID NO:249),其代表CRT1/2组的典型CRT植物多肽;
(v)基序7:TPYS[LF]MFGPD[IL]CGTQTKKLH[VL]ILSYQGQNYPIKKDL[QE]CETDKL TH[FV]YTFI(SEQ ID NO:250),其代表CRT3组的典型CRT植物多肽;
(vi) 基 序 8:N[HY][LP]IKK[DE][VL]PCETD[QK]LTH[VF]YTFI[LI]RPDA[TS]
YSILIDN[VR]E[KR][QE][TS]GS[LM]Y[TS]DWD[IL]L(SEQID NO:251),其代表植物界的典型CRT多肽;
(vii)基序9:QKKFGGDTPYSIMFGPDICGY[SQ]TKK[VL]H[AV]I(SEQ ID NO:252),其代表真核生物来源的典型CRT多肽,
(viii)与基序(i)至(vii)的任一个具有至少50%、51%、52%、53%、54%、55%、
56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的全序列同一性的基序;
其中“X”表示任何基酸并且其中括号“[ ]”之间指示的氨基酸表示在该位置上的可选氨基酸。
3.权利要求1或2的方法,其中所述经调节的表达通过在植物中引入和表达编码钙网蛋白多肽的核酸来实现。
4.权利要求1至3的任一项的方法,其中所述编码钙网蛋白多肽的核酸编码表A2中所列的任一蛋白质、或为这样的核酸的部分、或为能够与这样的核酸杂交的核酸。
5.权利要求1至4的任一项的方法,其中所述核酸序列编码表A2所给出的任何蛋白质的直向同源物或旁系同源物。
6.任何前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量、增加的种子产量。
7.权利要求1至6的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
8.权利要求1至6的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状。
9.权利要求3至8的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
10.权利要求1至9的任一项的方法,其中所述编码钙网蛋白多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自茄科,更优选来自茄属,最优选来自番茄。
11.可通过权利要求1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码钙网蛋白多肽的重组核酸。
12.构建体,其包含:
(i)编码如权利要求1或2中定义的钙网蛋白多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
13.权利要求12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.权利要求12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
15.利用权利要求12或13的构建体转化的植物、植物部分或植物细胞。
16.用于产生相对于对照植物具有增加的产量,优选增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求1或2中定义的钙网蛋白多肽的核酸;和
(ii)促进植物生长和发育的条件下培养所述植物细胞。
17.相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码权利要求1或2中定义的钙网蛋白多肽的核酸的被调节的表达而产生。
18.权利要求11、15或17的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜、或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
19.权利要求18的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
20.从权利要求18的植物和/或从权利要求19的植物的可收获部分得到的产品。
21.编码钙网蛋白多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
22.分离的钙网蛋白核酸分子,其选自:
(i)SEQ ID NO:116、130、140、198和228的任一个所示的核酸;
(ii)SEQ ID NO:116、130、140、198和228的任一个所示的核酸的互补序列;
(iii)编码SEQ ID NO:117、131、141、199和229的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQID NO:117、131、141、199和229的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其按照递增的优选次序与表A2的任何核酸序列具有至少30%、31%、32%、
33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、
48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、
63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、
78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(v)与(i)至(iv)的核酸分子在严格杂交条件下杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码钙网蛋白多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:117、131、
141、199和229的任一个所示的氨基酸序列以及表A2中任何其他氨基酸序列具有至少
50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、
65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、
80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
23.分离的钙网蛋白多肽,其选自:
(i)SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列;
(ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列以及表A2中任何其他氨基酸序列具有至少50%、51%、52%、53%、
54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、
69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、
84%、855%、86%、87%、88%、89%、0%、91%、92%、93%、94%、95%、96%、97%、98%、或
99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
(iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
24.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码BET1样多肽的核酸的表达,其中所述BET1样多肽包含CC结构域,所述CC结构域为:
(i)如SEQ.ID NO:97所示的;和/或
(ii)优选与由SEQ ID NO 98所示的CC结构域具有至少50%、51%、52%、53%、54%、
55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、
70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性。
25.权利要求24的方法,其中所述CC结构域包含下列基序的一个或多个:
(i)基序1:G(W/Y)CD(E/K)(SEQ ID NO:99);
(ii)基序2:EGF(SEQ ID NO:100)。
26.权利要求24或25的方法,其中所述调节的表达通过向植物中引入和表达编码
BET1样多肽的核酸来实现。
27.权利要求24至26的任一项的方法,其中所述编码BET1-样多肽的核酸编码表A1
所列的任一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
28.权利要求24至27的任一项的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
29.权利要求24至28的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,例如增加的生物量和/或增加的种子产量。
30.权利要求24至29的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
31.权利要求24至29的任一项的方法,其中在干旱胁迫和/或氮缺乏条件下获得所述增强的产量相关性状。
32.权利要求26至31的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
33.权利要求24至32的任一项的方法,其中所述编码BET1样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自禾本科,更优选来自玉蜀黍属,最优选来自玉蜀黍。
34.可通过权利要求24至33的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码BET1样多肽的重组核酸。
35.构建体,其包含:
(a)编码如权利要求1或2中定义的BET1样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
36.权利要求35的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
37.权利要求35或36的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
38.利用权利要求35或36的构建体转化的植物、植物部分或植物细胞。
39.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求24或25中定义的BET1样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
40.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码权利要求
24或25中定义的BET1样多肽的核酸的被调节的表达而产生。
41.权利要求34、38或40的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜、或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
42.权利要求41的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
43.从权利要求41的植物和/或从权利要求42的植物的可收获部分得到的产品。
44.编码BET1样多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
45.分离的核酸分子,其选自:
(i)SEQ ID NO:11和95的任一个所示的核酸;
(ii)SEQ ID NOs:11和95的任一个所示的核酸的互补序列;
(iii)编码SEQ ID NO:12和96的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQ ID NO:12和96的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其按照递增的优选次序与表A1的任何核酸序列具有至少30%、31%、32%、
33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、
48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、
63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、
78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
(vi)编码BET1样多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:12和96
的任一个所示的氨基酸序列以及表A1中任何其他氨基酸序列具有至少50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
46.分离的多肽,其选自:
(i)SEQ ID NO:12和96的任一个所示的氨基酸序列;
(ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:12和96的任一个所示的氨基酸序列以及表A1中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、
56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
(iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
47.用于相对于对照植物增强植物的产量相关性状的方法,其包括增加编码tRNA二氢尿苷合酶1样(DUS1L)多肽的核酸序列在植物中的表达,所述DUS1L多肽包含(i)具有InterPro登录号IPR001269的tRNA-二氢尿苷合酶结构域;(ii)具有InterPro登录号IPR013785的缩酶型TIM桶结构域;和(iii)具有InterPro登录号IPR018517的tRNA二氢尿苷合酶保守位点,和任选地选择具有增强的产量相关性状的植物。
48.权利要求47的方法,其中所述DUS1L多肽包含(i)按照递增的优选次序与SEQ ID NO:294所示的tRNA-二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、
85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
49.权利要求48的方法,其中所述DUS1L多肽还包含按照递增的优选次序与SEQ ID NO:259所示的多肽至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、
85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
50.权利要求47至49的任一项的方法,其中所述DUS1L多肽按照递增的优选次序与本文中表A3所给出的任何多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、
70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
51.权利要求47至50的任一项的方法,其中所述DUS1L多肽能够在功能上补充在tRNA二氢尿苷合酶活性上有缺陷的大肠杆菌菌株,从而增加tRNA二氢尿苷含量。
52.权利要求47至51的任一项的方法,其中所述编码DUS1L多肽的核酸序列由表A3
所给出的任一SEQ ID NO核酸序列所示,或为其部分、或为能够与表A3所给出的任一SEQ ID NO核酸序列或其互补序列杂交的序列。
53.权利要求47至52的任一项的方法,其中所述核酸序列编码表A3所给出的任何SEQ ID NO多肽序列的直向同源物或旁系同源物。
54.权利要求47至53的任一项的方法,其中所述增加的表达通过:T-DNA激活标记、TILLING或同源重组的任一个或多个实现。
55.权利要求47至54的任一项的方法,其中所述增加的表达通过在植物中引入和表达编码DUS1L多肽的核酸序列来实现。
56.权利要求47至55的任一项的方法,其中所述增加的产量相关性状是如下的一个或多个:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
57.权利要求47至56的任一项的方法,其中所述产量相关性状在养分可利用率减小的条件下,特别是氮可利用率减小的条件下生长的植物中相对于对照植物增加。
58.权利要求47至57的任一项的方法,其中所述核酸序列有效地连接至组成型启动子。
59.权利要求的方法58,其中所述组成型启动子是GOS2启动子,优选来自稻的GOS2启动子,最优选如SEQ ID NO:295所示的GOS2序列。
60.权利要求47至59的任一项的方法,其中所述编码DUS1L多肽的核酸序列来自植
物,更优选来自单子叶植物,更优选来自禾本科,最优选所述核酸序列来自甘蔗。
61.可通过权利要求47至60的任一项的方法获得的植物、其部分(包括种子)或植物细胞,其中所述植物、其部分或细胞包含编码DUS1L多肽的分离的核酸转基因。
62.分离的核酸分子,其选自:
(i)SEQ ID NO:264或SEQ ID NO:292所示的核酸序列;
(ii)如SEQ ID NO:264或SEQ ID NO:292所示的核酸序列的互补序列;
(iii)编码DUS1L多肽的核酸序列,所述多肽按照递增的优选次序与如SEQ ID NO:
265或SEQ ID NO:293所示的多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、
65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性。
63.分离的多肽,其选自:
(i)如SEQ ID NO:265或SEQ ID NO:293所示的多肽序列;
(ii)多肽序列,所述多肽序列按照递增的优选次序与如SEQ ID NO:265或SEQ ID NO:
293所示的多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、
80%、85%、90%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性;
(iii)上文(i)或(ii)所给出的任何多肽序列的衍生物。
64.结构域,其包含:
(a)权利要求47至53或62的任一项中定义的编码DUS1L多肽的核酸序列;
(b)能够驱动(a)的核酸序列的表达的一个或多个控制序列;和任选地
(c)转录终止序列。
65.权利要求64的构建体,其中所述控制序列是组成型启动子。
66.权利要求64的构建体,其中所述组成型启动子是GOS2启动子,优选来自稻的GOS2启动子,最优选如SEQ ID NO:295所示的GOS2序列。
67.权利要求64至66的任一项的构建体在用于制备相对于对照植物具有增强的产量相关性状的植物的方法中的用途,所述增强的产量相关性状是如下的一个或多个:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
68.利用权利要求64至66的任一项的构建体转化的植物、植物部分或植物细胞。
69.用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,其包括:
(i)向植物、植物部分或植物细胞中引入和表达如权利要求47至53或62的任一项中定义的编码DUS1L多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。
70.相对于对照植物具有增强产量相关性状的转基因植物,或源自所述转基因植物的转基因植物细胞或转基因植物部分,所述增强的产量相关性状因权利要求47至53或62的任一项中定义的编码DUS1L多肽的分离核酸序列的增加表达而产生。
71.权利要求61、68或70的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜、或单子叶植物或谷类植物例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、甘蔗和燕麦。
72.权利要求71的植物的包含编码DUS1L多肽的分离核酸序列的可收获部分,其中所述可收获部分优选是种子。
73.从权利要求71的植物和/或从权利要求72的植物的可收获部分得到的产品。
74.如权利要求47至53或62的任一项中定义的编码DUS1L多肽的核酸序列在增强产
量相关性状中的用途,所述增强的产量相关性状包括如下的一个或多个:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
75.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码ES43样多肽的核酸的表达,其中所述ES43样多肽包含BAH结构域和PHD结构域。
76.权利要求75的方法,其中所述ES43样多肽包含具有按照递增的优选次序与SEQ ID NO:374(SEQ ID NO:299的BAH结构域)的氨基酸序列或与SEQ ID NO:375(SEQ ID NO:299的PHD结构域)的氨基酸序列至少50%、51%、52%、53%、54%、55%、56%、57%、58%、
59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、
74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列的结构域。
77.权利要求75或76的方法,其中所述调节的表达通过向植物中引入和表达编码
ES43样多肽的核酸来实现。
78.权利要求75至77的任一项的方法,其中所述编码ES43样多肽的核酸编码表A4所列的任一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
79.权利要求75至78的任一项的方法,其中所述核酸序列编码表A4中所给出的任何蛋白质的直向同源物或旁系同源物。
80.权利要求75至79的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
81.权利要求75至80的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
82.权利要求75至80的任一项的方法,其中在干旱胁迫和/或氮缺乏条件下获得所述增强的产量相关性状。
83.权利要求75至82的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
84.权利要求75至83的任一项的方法,其中所述编码ES43样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
85.可通过权利要求75至84的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ES43样多肽的重组核酸。
86.构建体,其包含::
(a)编码如权利要求75或76中定义的ES43样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
87.权利要求86的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
88.权利要求86或87的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
89.利用权利要求86或87的构建体转化的植物、植物部分或植物细胞。
90.用于产生相对于对照植物具有增加的产量,尤其是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(a)向植物中引入和表达编码如权利要求75或76中定义的ES43样多肽的核酸;和
(b)在促进植物生长和发育的条件下培养所述植物细胞。
91.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码权利要求
75或76中定义的ES43样多肽的核酸的被调节的表达而产生。
92.权利要求85、89或91的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜、或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
93.权利要求92的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
94.权利要求18的植物和/或从权利要求93的植物的可收获部分得到的产品。
95.编码ES43样多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
96.分离的核酸分子,其选自:
(i)SEQ ID NO:308、370和372的任一个所示的核酸;
(ii)SEQ ID NO:308、370和372的任一个所示的核酸的互补序列;
(iii)编码如SEQ ID NO:309、371和373的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQ ID NO:309、371和373的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其按照递增的优选次序与表A4的任何核酸序列具有至少30%、31%、32%、
33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、
48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、9%、60%、61%、62%、
63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、
78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
(vi)编码ES43样多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:309、371和373的任一个所示的氨基酸序列以及表A4中任何其他氨基酸序列具有至少50%、51%、
52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、
67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、
82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
97.分离的多肽,其选自
(i)SEQ ID NO:309、371和373的任一个所示的氨基酸序列;
(ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:309,371和373的任一个所示的氨基酸序列以及表A4中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、
55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、
70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
(iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
98.相对于对照植物增强植物的产量相关性状的方法,包括在植物中调节编码HON5样多肽的核酸的表达,其中所述HON5样多肽包含组蛋白H1/H5结构域(Pfam:PF00538;
Interpro:IPR005818)和至少2个,优选2、3、4、5、6或7个AT钩结构域(Pfam:PF02178;
InterPro:IPR000637)。
99.权利要求98的方法,其中所述HON5样多肽包含一个或多个下列基序:
(i) 基 序 I(SEQ ID NO:411);Y[ASK]EMI[YC]TAI[AGT]AL[KN][ED][PK]DGSS[KR]RAI[AS][KR]YIERA[YF][TP][GD]LP[PS]AH[SD][AD]LLTHHLK[RT]L[KR]
(ii)基序II(SEQ ID NO:412):GLLV[ML]VK[KH]SYKL[AP][RS]S
(iii)基序III(SEQ ID NO:413):SA[PS][PQS]GQKRGRGRPPKPK其中括号之间的氨基酸代表在该位点上的可选氨基酸。
100.权利要求98或99的方法,其中所述调节的表达通过向植物中引入和表达编码
HON5样多肽的核酸来实现。
101.权利要求98至100的任一项的方法,其中所述编码HON5样多肽的核酸编码表A5所列的任一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
102.权利要求98至101的任一项的方法,其中所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
103.权利要求98至102的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,例如增加的收获指数和/或增加的种子产量。
104.权利要求98至103的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
105.权利要求98至103的任一项的方法,其中在干旱胁迫、盐胁迫和/或氮缺乏条件下获得所述增强的产量相关性状。
106.权利要求100至105的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
107.权利要求98至106的任一项的方法,其中所述编码HON5样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨属,最优选来自毛果杨。
108.可通过权利要求98至107的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码HON5样多肽的重组核酸。
109.构建体,其包含:
(i)编码如权利要求98或99中定义的HON5样多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
110.权利要求109的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
111.权利要求109或110的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的收获指数和/或增加的种子产量的植物的方法中的用途。
112.利用权利要求109或110的构建体转化的植物、植物部分或植物细胞。
113.用于产生相对于对照植物具有增加的产量,特别是增加的收获指数和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求98或99中定义的HON5样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
114.相对于对照植物具有增加的产量,特别是增加的收获指数和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码要求98或99中定义的HON5样多肽的核酸的被调节的表达而产生。
115.根据权利要求108、112或114的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜或、单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
116.权利要求115的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
117.从权利要求115的植物和/或从权利要求116的植物的可收获部分得到的产品。
118.编码HON5样多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或收获指数中的用途。
119.分离的核酸分子,其选自:
(i)SEQ ID NO:393和395的任一个所示的核酸;
(ii)SEQ ID NO:393和395的任一个所示的核酸的互补序列;
(iii)编码SEQ ID NO:394和396的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQ ID NO:394和396的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其按照递增的优选次序与表A5的任何核酸序列具有至少30%、31%、32%、
33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、
48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、
63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、
78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
(v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
(vi)编码HON5样多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:394和396的任一个所示的氨基酸序列以及表A5中任何其他氨基酸序列具有至少50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
120.分离的多肽,其选自:
(i)SEQ ID NO:394和396的任一个所示的氨基酸序列;
(ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:394和396的任一个所示的氨基酸序列以及表A5中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、
56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
(iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
121.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码
GSA1多肽的核酸的表达,其中所述GSA1多肽包含结构域1至3的一个或多个:
结 构 域 1:VPS[IV]EMVRFVNSGTEAC[ML][GS][VA]LRL[AM]RA[FY]TGREK[IV][IL]
KFEGCYHGHAD[PS]FLVK
结 构 域 2:SPVRAFKSVGGQP[IV]V[FI]D[SR]VKG[SA][HRY][MA]WD[IV]DGN[EK]Y[IV]DYVGSWGPAIIGHADD
结 构 域 3:AQEYFGITPD[LV]TT[LM]GK[IV]IGGGLPVGAYGG[RK][RK][ED]
IMEMVAPAGPMYQAGTLS
或按照递增的优选次序与结构域1至3的任一个或多个具有至少50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的全序列同一性的结构域。
122.权利要求121的方法,其中所述调节的表达通过向植物中引入和表达编码GSA1多肽的核酸来实现。
123.权利要求121或122的方法,其中所述编码GSA1多肽的核酸编码表A6所列的任
一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
124.权利要求121至123的任一项的方法,其中所述核酸序列编码表A6中所给出的任何蛋白质的直向同源物或旁系同源物。
125.权利要求121至124的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
126.权利要求121至125的任一项的方法,其中在干旱胁迫条件下获得所述增强的产量相关性状
127.权利要求121至126的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
128.权利要求121至127的任一项的方法,其中所述编码GSA1多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨柳科,更优选来自杨属,最优选来毛果杨。
129.可通过权利要求121至128的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GSA1多肽的重组核酸。
130.构建体,其包含:
(i)编码如权利要求1中定义的GSA1多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
131.权利要求130的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
132.权利要求130或131的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
133.利用权利要求130或131的构建体转化的植物、植物部分或植物细胞。
134.用于产生相对于对照植物具有增加的产量,尤其是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求120中定义的GSA1多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
135.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码权利要求
120中定义的GSA1多肽的核酸的被调节的表达而产生。
136.权利要求129、133或135的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜或、单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
137.权利要求136的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
138.从权利要求136的植物和/或从权利要求137的植物的可收获部分得到的产品。
139.编码GSA1多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。

说明书全文

具有增强的产量相关性状的植物及其制备方法

技术领域

[0001] 本发明一般地涉及分子生物学领域,涉及通过调节植物中编码BET1样多肽的核酸的表达来增强产量相关性状的方法。本发明还涉及具有经调节的BET1样多肽编码核
酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于实施本发明方法的构建体。
[0002] 本发明一般地涉及分子生物学领域,涉及通过调节植物中编码CRT(网蛋白)的核酸的表达来改善多种植物生长特征的方法。本发明还涉及具有经调节的钙网蛋白编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有改善的生长特征。本发明还提供了迄今未知的钙网蛋白核酸、多肽和可以用于本发明方法的构建体。
[0003] 本发明一般地涉及分子生物学领域,涉及通过增加植物中编码tRNA二氢尿苷合酶1样(DUS1L)多肽的核酸序列的表达来增强多种植物产量相关性状的方法。本发明还涉
及具有增加的DUS1L多肽编码核酸序列表达的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明此外还涉及核酸序列、包含所述核酸序列的核酸构建体、载体和植物。
[0004] 本发明一般地涉及分子生物学领域,涉及通过调节植物中编码ES43样多肽的核酸的表达来增强产量相关性状的方法。本发明还涉及具有经调节的ES43样多肽编码核酸
表达的植物,所述植物相对于对应的野生型植物或其他对照植物具有改善的生长特征。本发明还提供供迄今未知的ES43样核酸和多肽和可以用于本发明方法的构建体。
[0005] 本发明一般地涉及分子生物学领域,涉及用于增强植物中多种经济学重要的产量相关性状的方法。更具体地,本发明涉及通过调节植物中编码HON5样多肽的核酸的表达来增强产量相关性状的方法。本发明还涉及具有经调节的编码HON5样多肽的核酸的表达
的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明还提供了迄今未知的HON5样编码核酸和可以用于实施本发明方法的包含所述核酸的构建体。
[0006] 本发明一般地涉及分子生物学领域,涉及通过调节植物中编码谷酸-1-半转氨酶(GSA1)多肽的核酸的表达来增强植物产量相关性状的方法。本发明还涉及具有经调节的GSA1编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有
增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。

背景技术

[0007] 不断增长的世界人口和逐渐减少的农业可用耕地推动了提高农业效率研究之势。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特征的植物。然而,此类选育技术有若干缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常含有异质的遗传组分,这些异质的遗传组分可能不总是导致期望的性状自亲本植物传递。分子生物学的进展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般为DNA或RNA的形式)以及随后将遗传物质引入植物。此类技术有能输送具有多种改良
的经济、农业或园艺性状的作物或植物。
[0008] 具有特别经济利益的性状是增加的产量。产量通常定义为作物的可测量的具有经济价值的产出。这可以以数量和/或质量的方式进行定义。产量直接取决于若干因素,例如器官的数量和大小、植物构造(例如,分枝的数量)、种子生产、叶子衰老等等。根的发育、营养吸收、胁迫耐受性和早期活力也可以是决定产量的重要因素。因此优化上述因素可以促进作物产量的增加。
[0009] 种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、芸苔(canola)和大豆等作物占人类总卡路里摄取量的一半以上,或是通过对种子本身的直接消耗,或是通过对饲养自加工的种子的肉类产品的消耗。它们也可以是工业加工中所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(萌发期和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及
许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳可以同化糖类、油类和蛋白质的代谢前体,将其合成为贮存高分子,以充盈籽粒。
[0010] 对于饲料作物如苜蓿、青贮谷物和干草,植物生物量为产量。在粮食作物中,许多产量替代参数(proxy)被使用。其中主要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座(rosette)直径、叶长、根长、根质量、分蘖数和叶数。许多物种在给定的发育阶段在植物不同部分的大小之间维持保守的比例。利用这些比速增长关系可以从这些尺寸测量结果中的一个外推至另一个(如Tittonell等2005 Agric Ecosys & Environ
105:213)。早期发育阶段时的植物大小通常将与发育后期的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二,因此很可能在同期增重更多(Fasoula & Tollenaar2005 Maydica 50:39)。这还不包括植物为最初实现该较大大小所已经具有的微环境或遗传优势的潜在延续。对于植物大小和生长速率,存在着强遗传组分(如ter Steege等2005 Plant Physiology 139:1078),因此对于许多不同基因型,植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003
Theoretical Applied Genetics 107:679)。由此,可以使用标准环境作为田间作物在不同地点和时间所遭遇到的多样动态环境的替代。
[0011] 对于许多作物而言,另一重要的性状是早期活力。提高早期活力是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于栽稻的土壤锚固至关重要。在直接向涝地里播种稻米的情况下,以及在植物必须迅速透水出苗的情况下,较长的枝条均与活力有关。在进行条播的情况下,较长的中胚轴和胚芽鞘对于优良的出苗至关重要。改造植物早期活力的能力在农业上将具有极其重要的意义。例如,一直以来早期活力弱限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍,Zea mays L.)杂交种。
[0012] 收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和粮食产量之间通常能够获得比较稳靠的相关性(例如Rebetzke等2002 CropScience 42:739)。这些程序固有地联系在一起,因为大多数粮食生物量取决于植物叶
和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.
Iowa State University Press,68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005Agric Ecosys &
Environ105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和养分可利用率以及光强度标准化。不过,因不良授粉(由缺乏力或昆虫导致)或因空间不足以让成熟根或冠层生长等等而对产量造
成的人为局限性,会限制这些受控环境在测试产量差异中的应用。因此,在培养室或温室中在标准条件下测量早期发育阶段的植物大小,是指示潜在遗传产量优势的标准方法。
[0013] 再一重要的性状为提高的非生物胁迫耐受性。非生物胁迫是全世界作物损失的主要原因,使大多数主要作物植物平均产量降低50%以上(Wang等,Planta(2003)218:
1-14)。非生物胁迫可以因为干旱、盐度、极端温度、化学毒性、营养物(大量元素和/或微量元素)的过剩或不足、辐射及氧化胁迫引起。提高非生物胁迫植物耐受性的能力将对全世界农场主带来重大的经济利益,并将使人们能够在否则将不可能进行作物栽培的地区和不利条件下进行作物栽培。
[0014] 因此通过优化上述因素之一可以增加作物产量。
[0015] 视最终用途而定,对某些产量性状的修饰可能优于对其他产量性状的修饰。例如,对于诸如饲料或木材生产或者生物燃料源等应用,可能期望植物营养部分的增加,而对于诸如面粉、淀粉或油料生产等应用,可能特别期望种子参数的增强。即便是在种子参数之中,取决于应用,一些参数也可能优于其它参数。多种机制可以促成增加的种子产量,无论是以增加的种子大小还是以增加的种子数量的形式。
[0016] 增强植物产量(种子产量和/或生物量)的一种方法可以是修饰植物的内在生长机制,如细胞周期或者参与植物生长或防御机制的多种信号传递路径。
[0017] 发明概述
[0018] 现已发现,可通过在植物中调节BET1样多肽编码核酸在植物中的表达来改善植物的多种产量相关性状。
[0019] 现还已发现,可通过在植物中调节钙网蛋白(CRT多肽)编码核酸在植物中的表达来改善多种生长特征。
[0020] 现还已发现,可以通过增加编码tRNA二氢尿苷合酶1样(DUS1L)多肽的核酸序列在植物中的表达,相对于对照植物而增强植物的多种产量相关性状。增强的产量相关性状包括如下一种或多种:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
[0021] 现还已发现,可通过在植物中调节ES43样多肽编码核酸在植物中的表达来改善多种生长特征。
[0022] 现还已发现,可通过在植物中调节HON5样多肽编码核酸在植物中的表达来改善多种产量相关性状。
[0023] 现还已发现,可通过在植物中调节GSA1多肽编码核酸在植物中的表达来改善多种生长特征。
[0024] 背景
[0025] 1.BET1样多肽
[0026] Gregorio Hueros等 人(Plant Cell,第7 卷,747-757,6/1995 Am.Soc.Plant Physiol.)公开了从传粉后10天(DAP)的玉米胚乳mRNA制备的cDNA库分离的cDNA克隆,BET1(代表:基部胚乳转移层(basal endosperm transfer layer))。BET1 mRNA被证实编码7-kD细胞壁多肽。该mRNA和蛋白质在其分布上都限制于基部胚乳转移层中并且不
在植物的其他部位表达。BET1表达始于第9DAP,在第12至16DAP达到最大值,并且在第
16DAP后下降。BET1多肽的初始积累到第16DAP时达到平台并且之后下降,到第20DAP时
变得不可检测。针对BET1蛋白产生的抗体与多种分子量比BET1单体大的多肽反应。大多
数此类多肽存在于胞质溶胶级分中并且发现于非基细胞胚乳提取物中,但3种多肽表现为基细胞(basal cell)特异的。该结果和彻底提取的细胞壁材料与BET1抗体的反应性表明
该蛋白质的一部分以共价结合形式沉积在细胞外基质中。已经提出BET1蛋白在转移细胞
(transfer cell)的结构特化中起作用。此外,BET1为该胚乳区域的发育提供了一种新型分子标志物。
[0027] 2.钙网蛋白多肽
[0028] 钙在植物和动物的多个信号转导途径中起着主要作用。细胞质钙浓度被严格调控在100-200nM,但在亚细胞细胞器中发现在微摩尔和毫摩尔范围内的较高水平。在植物中钙也是微量营养物。
[0029] 钙网蛋白(CRT)(参与ER(内质网)Ca2+(钙)-ATP酶的调节的蛋白质)发现于所有真核细胞中。归档的哺乳动物的研究已阐明CRT蛋白的结构和许多关键生理功能,
包括通过结合钙来控制细胞粘着和信号转导以及对蛋白质折叠和翻译后修饰的质量控制
(Michalak.Biochem J.2009417(3):651-66)。
[0030] CRT蛋白在结构上的特征在于3个独特的结构域:球状中性N-结构域、富含脯氨酸的P-结构域和多酸的C-结构域。CRT还具有N末端信号肽序列和在C结构域中的ER
2+
滞留基序。P-结构域负责高亲和力(Kd 1.6微摩尔的量级)和低容量Ca 结合,而C-结
2+
构域负责低亲和力(Kd 0.3-2mM的量级)和高容量Ca 结合。CRT多肽包括N末端信号序
列和C-结构域中的ER滞留基序。在P-结构域内,存在2种类型的在各种动物物种之间高
度保守的三重重复基序。然而,C-结构域不如CRT的其他结构域保守。P-结构域的“延伸臂(extended arm)”的尖端上的4个氨基酸残基在CRT的伴侣蛋白功能中是至关重要的。
2+
C-结构域参与ER腔中Ca 贮存(Michalak.Biochem J.1992,285(Pt 3):681-92.)。
[0031] 在植物中,CRT蛋白与它们的动物对应物共有相同的结构特征和相似的Ca2+结合蛋白。系统发生研究揭示植物CRT落入2个进化相关组,所谓的CRT1/2和CRT3。CRT1/2通常定位在细胞的胞间连丝。已提出植物CRT在再生、向重力性、信号转导和胁迫耐受性的调节中起作用(Christensen等.2008,Plant Cell Physiol.49(6):912-924)。
[0032] BrCRT1(来自芜菁(Brassica rapa)的CRT),当在转基因烟草植物中表达时,显示在外观、开花时间或在土壤中长至成熟时的种子产量上无明显的表型差异,并显示幼苗的微弱生长抑制(Jin等人.2005 Transgenic Res.14(5):619-26)。
[0033] 3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[0034] 在翻译中,转运RNA是中心衔接分子,因为其在物理上连接信使RNA的遗传信息、和正确排序的氨基酸向正在生长的多肽链的添加。tRNA的结构特征之一是存在大量转录后修饰的RNA基。二氢尿苷是原核生物和真核生物中最丰富的修饰tRNA碱基之一。其与尿苷相异仅在于尿苷的碳-碳双键的还原(非芳族碱基),并且几乎只见于tRNA的D环中的优选位点上,tRNA的D环还可包含变化数目的二氢尿苷残基(Bishop等.(2002)277(28):
25090-25095)。二氢尿苷的最可能的化学作用是增强tRNA的构象灵活性,从而提高翻译效率。
[0035] 已在酿酒酵母(Saccharomyces cerevisiae)和大肠杆菌(E.coli)中鉴定了催化尿苷至二氢尿苷的修饰的二氢尿苷合酶(DUS)酶家族(Bishop等,同上)。DUS包括离散的
基因家族(大肠杆菌中3个成员YjbN、YhdG和YohI,酵母中至少4个成员YML080w或DUS1、
YNR015w、YLR405w和YLR401c),从而允许基于序列同源性提出来自其他物种的推定DUS基因。已在例如人、黑猩猩、狗、奶、小鼠、鸡、斑鱼、果蝇、蚊子、线虫(C.elegans)、稻和恶性疟原虫(P.falciparum)中发现此类同源物。在拟南芥基因组中,至少3个基因已被鉴定为潜在编码DUS酶(AT3G49640、AT4G38890、AT5G67220或DUS1样)。这些基因之一编码与
DUS1酶更高相似的多肽,从而被称为DUS1样(DUS1L)酶。
[0036] 在国际申请WO 02/66660“Method for identifying herbicidally activesubstances”中,描述了编码DUS1L多肽(SEQ ID NO:84)的核酸序列和包含该序列的构建体。缺乏该基因产物的转基因植物在拟南芥的胚胎期呈现显著延迟的生长和/或完全受阻的生长。该发明涉及所述基因和由其编码的基因产物用于发现新型除草剂的用途。
[0037] 令人惊讶地,现已发现增加编码如本文中定义的DUS1L多肽的核酸序列在植物中的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
[0038] 根据一个实施方案,提供了用于在植物中相对于对照植物增强产量相关性状的方法,其包括增加编码如本文中定义的DUS1L多肽的核酸序列在植物中的表达。增强的植物产量相关性状包括如下一项或多项:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
[0039] 4.ES43样多肽
[0040] BAH(bromo-adjacent homology)家族包括蛋白质例如真核生物DNA(胞嘧啶-5)甲基转移酶、起点识别复合体1(Orc1)蛋白以及参与转录调控的几种蛋白质。BAH结构域似乎用作专事基因沉默的蛋白质间相互作用模,如例如由其在酵母Orc1p内与沉默信息调节剂Sir1p的相互作用所表明的。BAH模块从而可能通过连接DNA甲基化、复制和转录调控而起重要作用(FEBS Lett.1999 Mar 5;446(1):189-93)。
[0041] PHD结构域是蛋白质锌指结构域,折叠成交插型的锌指,螯合2个Zn离子,类似于RING和FYVE结构域(Pascual等.J Mol Biol2000;304:723-729)。锌指(Znf)结构域是结合一个或多个锌原子的相对小的蛋白质基序,通常包含多个指状突出物,形成与其靶分子的串联接触。其结合性质取决于指结构域和指间接头的氨基酸序列以及指的高级结构和数目。通常Znf结构域成簇存在,此时指可具有不同的结合特异性。存在许多在序列和结构上都不同的Znf基序超家族。它们,甚至在同类成员之间,显示出相当大的结合模式的多样性(例如一些结合DNA,其他结合蛋白),这提示Znf基序是已进化出特化功能的稳定支
架。例如,含Znf蛋白质在基因转录、翻译、mRNA运输、细胞骨架组织、上皮发育、细胞粘着、蛋白质折叠、染色质重塑和锌感知中起作用。锌结合基序是稳定结构,并且它们在结合它们的靶后极少经历构象变化。
[0042] 作为在核蛋白质中发现的C4HC3锌指样基序的PHD(同源域)锌指结构域被认为参与染色质介导的转录调控。PHD指基序使人想到C3HC4型RING指,但与之不同(Aasland
等,Trends Biochem Sci.1995Feb;20(2):56-9)。
[0043] 已描述了许多包含BAH和PHD指结构域两者的植物蛋白。例如Balery的ES43蛋白(Speulman和Salamini Plant Sci.106,91-98(1995)、拟南芥的SHL(Mussig等.Mol Gen Genet.2000 Nov;264(4):363-70)和EBS( 等.Plant Cell.2003 Jul;15(7):
1552-62)。EBS已经被暗示在转录阻遏复合物中,该复合物调节染色质结构并且是抑制短日照时的开花起始所必需的。EBS的过表达引起拟南芥植物的早期开花( 等.2003)。
[0044] 5.HON5样多肽
[0045] 高迁移率组(High-mobility-group)(HMG)蛋白是小的且相对丰富的染色质结合蛋白,在生物化学上被确定为通常约30KDa的小蛋白,具有相对高比例的碱性和酸性氨基酸,并且能够溶解在稀高氯酸或三氯乙酸中。
[0046] 植物和动物具有在称为AT-hook的共有基序的基础上相似的HMG蛋白家族,AT-hook是优先识别且结合具有某些结构特征(例如由富含AT的DNA赋予的结构特征)的
DNA的结构域。因为这些蛋白质识别染色质和/或DNA结构(例如由富含AT的DNA赋予的
结构)而非特定DNA序列,因此它们被称为构造转录因子。
[0047] 关于动物HMGA家族功能的大量可用信息已被推论至AT-hook蛋白的植物HMG-I/Y家族。
[0048] 在植物中,已鉴定了两组染色体HMG蛋白,即HMGA家族(通常包含4个A/T hookDNA结合基序),和HMGB家族(包含单个HMG盒DNA结合结构域)。植物和动物AT-hook蛋
白都结合DNA小沟中的AT丰富区段,诱导DNA弯曲,从而在基因表达的调控中发挥作用。通过和谐地组织多种蛋白质-蛋白质和蛋白质-DNA相互作用,HMGA蛋白帮助形成高级转录
因子复合物,从而调节基因表达(Klosterman等;Plant Science 162(2002)855_866)。
[0049] 概述
[0050] 1.BET1样多肽
[0051] 令人惊讶地,现已发现,调节BET1样多肽编码核酸的表达可以产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
[0052] 根据一个实施方案,提供了用于相对于对照植物增加植物产量的方法,其包括调节BET1样多肽编码核酸在植物中的表达。
[0053] 2.钙网蛋白多肽
[0054] 令人惊讶地,现已发现,调节钙网蛋白多肽编码核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
[0055] 根据一个实施方案,提供了用于相对于对照植物增强植物的产量相关性状的方法,其包括调节钙网蛋白多肽编码核酸在植物中的表达。
[0056] 3.ES43样多肽
[0057] 令人惊讶地,现已发现,调节ES43样多肽编码核酸的表达可以产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
[0058] 根据一个实施方案,提供了用于相对于对照植物增强植物的产量相关性状的方法,其包括调节ES43样多肽编码核酸在植物中的表达。
[0059] 4.HON5样多肽
[0060] 令人惊讶地,现已发现,调节HON5样多肽编码核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
[0061] 根据一个实施方案,提供了用于相对于对照植物增强植物的产量相关性状的方法,其包括调节HON5样多肽编码核酸在植物中的表达。
[0062] 5.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[0063] 令人惊讶地,现已发现,调节GSA1多肽编码核酸的表达可以产生相对于对照植物具有增强的产量相关性状,特别是(增加的种子产量)的植物。
[0064] 根据一个实施方案,提供了用于相对于对照植物增强植物的产量相关性状的方法,其包括调节GSA1多肽编码核酸在植物中的表达。
[0065] 定义
[0066] 定义
[0067] 多肽/蛋白质
[0068] 术语“多肽”和“蛋白质”在文中可互换使用,是指通过肽键连接起来的、任意长度的氨基酸的聚合物
[0069] 多核苷酸/核酸/核酸序列/核苷酸序列
[0070] 术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在文中可互换使用,是指任何长度的无支链形式的核苷酸聚合物,所述核苷酸可以为核糖核苷酸或脱氧核糖核苷酸或者两者的组合。
[0071] 同源物
[0072] 蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入,并且与其源自的未修饰蛋白质具有相似的生物活性和功能活性。
[0073] 缺失是指从蛋白质中除去一个或多个氨基酸。
[0074] 插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括N-末端和/或C-末端融合,以及单个或多个氨基酸的序列内插入。一般,氨基酸序列内的插入将小于N-或C-末端的融合,约1到10个残基左右。N-或C-末端融合蛋白或肽的实例包括
在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、 表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白质
C表位和VSV表位。
[0075] 取代是指蛋白质中的氨基酸用具有相似特性(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向)的其他氨基酸替换。氨基酸取代一般是单残基的取代,但是视施加于多肽上的功能性限制而定也可以是成簇取代,并且可以是1到
10个氨基酸;插入通常在大约1到10个氨基酸残基的数量级。氨基酸取代优选为保守氨
基酸取代。保守取代表在本领域公知(参见例如Creighton(1984)Proteins.W.H.Freeman and Company(编辑)和下表1)。
[0076] 表1:保守氨基酸取代的实例
[0077]残基 保守取代 残基 保守取代
Ala Ser Leu Ile;Val
Arg Lys Lys Arg;Gln
Asn Gln;His Met Leu;Ile
Asp Glu Phe Met;Leu;Tyr
Gln Asn Ser Thr;Gly
Cys Ser Thr Ser;Val
Glu Asp Trp Tyr
Gly Pro Tyr Trp;Phe
His Asn;Gln Val Ile;Leu
Ile Leu;Val
[0078] 可通过本领域公知的肽合成技术,如固相肽合成法等,或通过重组DNA操作,容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法在本领域公知。例如,本领域的技术人员公知在DNA预定位置进行取代突
变的技术,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其他定点诱变方案。
[0079] 衍生物
[0080] “衍生物”包括肽、寡肽、多肽,与蛋白质如目的蛋白质的天然形式的氨基酸序列相比,其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白质的“衍生物”还包括肽、寡肽、多肽,与多肽的天然形式的氨基酸序列相比,其可以包括天然改变的(糖基化、酰基化、异戊烯化、磷酸化、肉豆蔻酰化、硫酸化等)或非天然改变的氨基酸残基。衍生物与其源自的氨基酸序列相比,还可以包括一个或多个非氨基酸取代或添加,例如共价或非共价地结合于氨基酸序列的报告分子或其他配体,例如与氨基酸序列结合以有利于其检测的报告分子,以及相对于天然蛋白质的氨基酸序列而言非天然的氨基酸残基。此外,“衍生物”还可以包括天然形式的蛋白质与标签肽(tagging peptide)例如FLAG、HIS6或硫氧还蛋白的融合物(关于标签肽的综述,参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
[0081] 直向同源物/旁系同源物
[0082] 直向同源物和旁系同源物涵盖用于描述基因的祖先关系的进化概念。旁系同源物为相同物种内的基因,其起源自祖先基因的复制;而直向同源物为来自不同生物体的基因,其通过物种形成起源,并且也源自于共同的祖先基因。
[0083] 结构域、基序/共有序列/标签序列(Signature)
[0084] 术语“结构域”是指在进化相关蛋白质的序列比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构域”通过在蛋白质同源物家族的比对序列中其高度的保守性而鉴定,其能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。
[0085] 术语“基序”或“共有序列”或“标签序列”是指进化相关蛋白质序列中短的保守区域。基序常常是结构域的高度保守的部分,但也可以包括仅仅部分的结构域,或者可以是位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。
[0086] 存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic 等 (2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder 等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher 和
Bairoch(1994),A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation.(In)ISMB-94;第二届分
子生物学智能系统国际会议记录(Proceedings 2nd International Conference on
Intelligent Systems for Molecular Biology)Altman R.,Brutlag D.,Karp P.,
Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)) 或 者Pfam(Bateman 等,Nucleic Acids Research 30(1):
276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋
白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute of Bioinformatics)
(Gasteiger等ExPASy:the proteomics server for in-depth protein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
[0087] 为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:
443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的
比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMC Bioinformatics,10:29.2003 Jul 10;4:29.MatGAT:
an application that generates similarity/identity matrices using protein or DNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。
对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
[0088] 交互BLAST
[0089] 通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自
查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0090] 分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
[0091] 杂交
[0092] 本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的核酸都处在溶液中。杂交过程也能够这样进行,即互补核酸之一固定于基质,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也能够这样进行,即其中互补核酸之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者通过例如照相平板印刷术固定在例如质玻璃支持物上(后者称为核酸阵列或微阵列,或称为核酸芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸中的发夹结构或其它二级结构。
[0093] 术语“严格性”是指进行杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常,在确定的离子强度和pH,对于特定序列而言,低严格条件选择为比热解链温度(Tm)低大约30℃。中等严格条件为温度比Tm低20℃,而高严格条件为温度比Tm低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相
似性的杂交序列。不过,由于遗传密码的简并性,核酸可以在序列上有偏差而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸分子。
[0094] Tm是在确定的离子强度和pH值时,50%的靶序列与完美匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度特异性杂交。在低于Tm值大约16℃到32℃获得最大杂交速率。在杂交溶液中存在一价阳离子会减少两核
酸链之间的静电排斥作用,从而促进杂交体形成;当钠浓度不超过0.4M时,这一作用明显(对于更高的浓度,此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA
双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃进行,尽管
这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。取决于杂交体的类型,Tm值可以利用下列公式计算:
[0095] 1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
[0096] Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺
[0097] 2)DNA-RNA或RNA-RNA杂交体:
[0098] Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
[0099] 3)寡DNA或寡RNAd杂交体:
[0100] <20个核苷酸:Tm=2(ln)
[0101] 20-35个核苷酸:Tm=22+1.46(ln)
[0102] a或用于其它一价阳离子,但是仅在0.01-0.4M范围内准确。
[0103] b仅对于在30%到75%范围内的%GC是准确的。
[0104] cL=双链体的碱基对长度。
[0105] d寡,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
[0106] 非特异性结合可以通过许多已知技术中的任一种来控制,例如用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以通过改变如下条件之一来进行一系列杂交:(i)逐渐降低退火温度(例如从68℃降至42℃),或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。熟练技术人员知晓可以在
杂交过程中改变而保持或者改变严格条件的各种参数。
[0107] 除杂交条件外,杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般,适用于核酸杂交测定或基因扩增检测操作的适宜严格条件如上文所示设置。也可以选择更高或更低的严格条件。熟练技术人员知晓可以在洗涤过程中改变从而保持或者改变严格条件的各种参数。
[0108] 例如,长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在1×SSC中于65℃杂交或者在1×SSC和50%甲酰胺中于42℃杂交,接着在0.3×SSC中于65℃洗涤。
长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4×SSC中于50℃杂交或
者在6×SSC和50%甲酰胺中于40℃杂交,接着在2×SSC中于50℃洗涤。杂交体的长度
是杂交核酸的预期长度。当已知序列的核酸进行杂交时,杂交体的长度可以通过比对序列并鉴定本文所述的保守区域来确定。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和
洗涤溶液可以另外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml片段化的变性鲑精DNA、0.5%焦磷酸钠。
[0109] 为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.(1989及年度更新资料)。
[0110] 剪接变体
[0111] 本文所用的术语“剪接变体”包括这样的核酸序列变体,其中选择的内含子和/或外显子已被切除、替换、置换或添加,或者其中内含子已被缩短或增长。这样的变体基本上保持了蛋白质的生物活性;这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人工的。预测和分离这类剪接变体的方法是本领域众所周知的(参见例如Foissac和Schiex(2005)BMC Bioinformatics 6:25)。
[0112] 等位基因变体
[0113] 等位基因或等位基因变体为位于相同的染色体位置的给定基因的可选形式。等位基因变体包括单核苷酸多态性(SNP),以及小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。在大多数生物体的天然多态性品系中SNP和INDEL形成最大的一组序列
变体。
[0114] 内源基因
[0115] 本文述及“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经人为干预),而且指随后(重新)引入到植物中的分离形式的所述基因(或基本上同源的核酸/基因)(转基因)。例如,含有这样的转基因的转基因植物可遭遇该转基因表达的实质性
下降和/或该内源基因表达的实质性下降。该分离的基因可从生物体分离或可以例如通过化学合成进行人造。
[0116] 基因改组/定向进化
[0117] 基因改组或定向进化是重复进行DNA改组以及继之的适当筛选和/或选择,以产生编码具有修饰生物活性的蛋白质的核酸或其部分的变体(Castle等(2004)Science
304(5674):1151-4;美国专利5,811,238和6,395,547)。
[0118] 构建体
[0119] 另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
[0120] 本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)
在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
[0121] 为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因可从转基因细胞将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
[0122] 调控元件/控制序列/启动子
[0123] 术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用,取其广义,是指能够影响与之相连的序列表达的调控性核酸序列。术语“启动子”通常是指位于基因转录起点上游的核酸控制序列,其参与识别和结合RNA聚合酶及其他蛋白质,由此指导有效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包括对于精确的转录起始是必需的TATA盒,带或不带CCAAT盒序列),以及其他调控元件(即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。该术语还包括经典原核生物基因的转录调控序列,在此情况下可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也涵盖合成的融合分子或衍
生物,其赋予、激活或增强细胞、组织或器官中核酸序列分子的表达。
[0124] “植物启动子”包括可以介导编码序列区段在植物细胞中表达的调控元件。因此,植物启动子不必是植物来源的,还可来源于病毒或微生物,例如来自攻击植物细胞的病毒。“植物启动子”还可来源于植物细胞,例如,来源于待用欲在本发明方法中表达的以及本文所述的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子。
位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰,而不干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离ORF的其他3’调控区的功能或活性。此外,还可以通过修饰启动子的序列而增加其活性,或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表达,核酸分子必须,如上文所述的那样,有效连接于或者包含适宜的启动子,所述启动子将在恰当的时间点以所需的空间表达模式表达所述基因。
[0125] 为鉴定功能上等同的启动子,可以例如通过将候选启动子与报告基因有效连接、测定所述报告基因在植物多种组织中的表达水平和模式,来分析候选启动子的启动子强度和/或表达模式。公知的适宜报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活来测定启动子活性。然后可以将该
启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。可
选地,可以利用本领域公知的方法,如Northern印迹(RNA分析)结合放射自显影图的密
度计量分析、定量实时PCR或RT-PCR(Heid等,1996 Genome Methods 6:986-994),通过定量mRNA水平或者将本发明方法所用核酸的mRNA水平与持家基因如18S rRNA的mRNA水平
进行比较,来测定启动子强度。通常,“弱启动子”表示驱动编码序列低水平表达的启动子。
“低水平”表示每个细胞约1/10,000个转录物到约1/100,000个转录物、到约1/500,0000个转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者说每个细胞约1/10个转录物到约1/100个转录物、到约1/1000个转录物。一般,“中等强度启动子”表示以低于强启动子的水平,尤其是以在所有情况下都低于在35S CaMV启动子控制下所获得水平的水平,驱动编码序列表达的启动子。
[0126] 有效连接
[0127] 本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
[0128] 组成型启动子
[0129] “组成型启动子”是指在生长和发育的大多数但不必然是所有阶段,在大多数环境条件下,在至少一种细胞、组织或器官中具有转录活性的启动子。下表2a给出了组成型启动子的实例。
[0130] 表2a:组成型启动子的实例
[0131]
[0132] 遍在启动子
[0133] 遍在启动子基本上在生物体所有的组织或细胞中都有活性。
[0134] 发育调控型启动子
[0135] 发育调控型启动子在某些发育阶段或在经历发育改变的植物部分有活性。
[0136] 诱导型启动子
[0137] 诱导型启动子响应化学品(综述参见Gatz 1997,Annu.Rev.Plant Physiol.Plant Mol.Biol.,48:89-108)、环境或物理刺激而诱导或增加转录起始,或者可以是“胁迫诱导型”,即当植物接触多种胁迫条件时被激活,或者是“病原体诱导型”,即当植物接触多种病原体时被激活。
[0138] 器官特异性/组织特异性启动子
[0139] 器官特异性或组织特异性的启动子是能够在某些器官或组织(如叶、根、种子组织等)中优先起始转录的启动子。例如,“根特异性启动子”是主要在植物根中,基本上排除在植物的任何其他部分中,具有转录活性的启动子,但仍允许在这些其他植物部分中的任何渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。
[0140] 根特异性启动子的实例列于下表2b。
[0141] 表2b:根特异性启动子的实例
[0142]
[0143]
[0144] 种子特异性启动子主要在种子组织中,但不必仅在种子组织中(渗漏表达的情况下),具有转录活性。种子特异性启动子可以在种子发育和/或萌发期间具有活性。种子特异性启动子可以是胚乳/糊粉层/胚特异性的。种子特异性启动子(胚乳/糊粉层/胚
特异性的)的实例列于下表2c至表2f中。种子特异性启动子的更多实例在Qing Qu和
Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,其公开内容作为参考并入本文,如同充分阐述的那样。
[0145] 表2c:种子特异性启动子的实例
[0146]
[0147]
[0148] 表2d:胚乳特异性启动子的实例
[0149]
[0150]
[0151] 表2e:胚特异性启动子的实例
[0152]基因来源 参考文献
稻OSH1 Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
KNOX Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
PRO0151 WO 2004/070039
PRO0175 WO 2004/070039
PRO005 WO 2004/070039
PRO0095 WO 2004/070039
[0153] 表2f:糊粉特异性启动子的实例
[0154]
[0155] 如文中所定义的绿色组织特异性启动子是主要在绿色组织中,基本上排除在任何其他植物部分中,具有转录活性的启动子,但仍允许在这些其他植物部分中的任何渗漏表达。
[0156] 可以用来实施本发明方法的绿色组织特异性启动子的实例示于下表2g。
[0157] 表2g:绿色组织特异性启动子的实例
[0158]
[0159] 组织特异性启动子的另一实例是分生组织特异性启动子,其主要在分生组织中,基本上排除在任何其他植物部分中,具有转录活性,但仍允许在这些其他植物部分的任何渗漏表达。可以用来实施本发明方法的绿色分生组织特异性启动子的实例示于下表2h。
[0160] 表2h:分生组织特异性启动子的实例
[0161]
[0162] 终止子
[0163] 术语“终止子”包括这样的控制序列,其为位于转录单位末端的DNA序列,发送初级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多种其他植物基因、或T-DNA。例如,待加入的终止子可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。
[0164] 可选择标记(基因)/报告基因
[0165] “可选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因,其中该表型在细胞中的表达有利于鉴定和/或选择经本发明的核酸构建体转染或转化的细胞。这些标记基因通过一系列不同的原理使得能够鉴定核酸分子的成功转移。适宜的标记可以选自赋予抗生素或除草剂抗性、引入新的代谢性状或允许可视选择的标记。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或
磷酸化潮霉素的hpt,或赋予抗例如博来霉素、链霉素四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基因(例如提供抗 抗性的bar;提供抗草甘膦抗性的aroA或gox,或赋予抗例如咪唑啉、膦丝
菌素或磺胺脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖作为唯一
碳源的manA,或有关木糖利用的木糖异构酶,或抗营养标记如对2-脱氧葡萄糖的抗性)。可视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶GUS,或β-半乳糖苷酶及其有
色底物,例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍
生物)。这仅仅是一小部分可能标记的名单。技术人员熟悉此类标记。取决于生物体和选择方法,优选不同的标记。
[0166] 已知对于核酸在植物细胞中的稳定或瞬时整合,取决于所用的表达载体和所用的转染技术,仅少数细胞可以摄入该外来DNA,以及,如果期望的话,整合进其基因组。为鉴定并选择这些整合体,通常将编码可选择标记(例如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够在例如突变体中使用,所述突变体中原有的这些基因例如通过常规方法缺失而没有功能。此外,编码可选择标记的核酸分子可与编码本发明多肽的或用于本发明方法的序列包含在同一个载体中,或者在分开的载体中引入宿主细胞。已经稳定转染了所引入的核酸的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。
[0167] 由于一旦成功引入了核酸后将不再需要或不期望转基因宿主细胞中存在标记基因,特别是抗生素和除草剂抗性基因,所以根据本发明用于引入核酸的方法最好采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸,而第二个携带标记基因。很大比例的转化体接收或者对于植物而言(高达40%或以上的转化体)含有两个载体。对于农杆菌
转化,转化体通常只接收载体的一部分,即被T-DNA侧翼包围的序列,其通常是表达盒。随后可通过杂交从转化植物中除去标记基因。在另一种方法中,利用整合在转座子中的标记基因与期望的核酸一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸构建体来瞬时或稳定转化转化体。在有些情况下(约10%),一旦
成功进行了转化,转座子会跳离宿主细胞基因组并丢失。在另外一些情况下,转座子会跳至不同的位置。在这些情况下,必须通过杂交以消除标记基因。在微生物学领域,已经研发了使得可以或便于检测此类事件的技术。另一有利的方法有赖于所谓的重组系统;其优势在于可以免除杂交消除。最著名的这类系统是称为Cre/lox系统的系统。Cre1为重组酶,其切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦转化成功后,其会因Cre1重组酶的表达而得以切除。其他重组系统有HIN/HIX、FLP/FRT和REP/STB系统
(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,
2000:553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
[0168] 转基因的/转基因/重组
[0169] 出于本发明的目的,就例如本发明的核酸序列、含有所述核酸序列的表达盒、基因构建体或载体、或用所述核酸序列、表达盒或载体转化的生物体而言,“转基因的”、“转基因”或“重组”是指所有这些构建体通过重组方法产生,其中:
[0170] (a)编码可用于本发明方法的蛋白质的核酸序列,或
[0171] (b)有效连接于本发明核酸序列的遗传控制序列,例如启动子,或
[0172] (c)(a)和(b)
[0173] 不存在于其天然遗传环境中,或者已通过重组方法修饰,该修饰可以采取的形式为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为原始植物中天然的基因组或染色体座位或者存在于基因组文库之中。在基因组文库的情况下,优选保持、至少是部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列的一侧,长度至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp。当天然存在的表达盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天
然启动子之间的天然组合——经非天然的合成(“人工”)方法例如诱变处理而被修饰时,此表达盒变成转基因表达盒。合适的方法描述在例如,US 5,565,350或WO 00/15815中。
[0174] 因此,如上文所述,用于本发明目的的转基因植物应理解为指:在所述植物的基因组中,本发明方法中所用的核酸不在其天然基因座上,其中所述核酸可以进行同源或异源表达。不过,正如所提到的那样,转基因也表示:尽管在植物基因组中根据本发明的或本发明方法中所用的核酸在其天然位置上,但是所述序列已相对于天然序列而被修饰,和/或天然序列的调控序列已被修饰。转基因优选理解为表示:根据本发明的核酸在基因组中非天然的座位上表达,即同源表达,或者优选发生核酸的异源表达。优选的转基因植物在文中述及。
[0175] 调节
[0176] 与表达或基因表达相关的术语“调节”是指与对照植物相比,所述基因表达的表达水平被改变的过程,其中表达水平可增加或降低。原始未调节的表达可以是结构RNA(rRNA、tRNA)或随后进行翻译的mRNA的任何类型的表达。术语“调节活性”应理解为本发明核酸序列或编码蛋白质的任何表达改变,该改变导致植物产量增加和/或生长增加。
[0177] 表达
[0178] 术语“表达”或“基因表达”是指特定基因或特定基因构建体的转录。术语“表达”或“基因表达”特别地是指基因(一个或多个)或基因构建体至结构RNA(rRNA、tRNA)或mRNA的转录,有或无后者至蛋白质的随后翻译。该过程包括DNA的转录和所获得的mRNA产物的加工。
[0179] 增加的表达/过表达
[0180] 如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任何形式的表达。
[0181] 增加基因或基因产物表达的方法在本领域有充分的文献记载,且包括,例如由适当的启动子驱动的过表达、转录增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸引入非异源形式的多核苷酸的适当位置(一般是上游),从而上调编码目的多肽的核酸序列的表达。例如,可以通过突变、缺失和/或取代,在体内改变内源启动子(见Kmiec,US5,565,350;Zarling等,WO9322443),或者可以将分离的启动子在相对于本发明基因的适当方向和距离引入植物细胞中,从而控制基因的表达。
[0182] 如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。
[0183] 也可以在5’非翻译区(UTR)或部分编码序列的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。已显示,在植物和动物表达构建体的转录单位中纳
入可剪接内含子,可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和
Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Genes Dev.1:1183-1200)。通常内含子放置在转录单位5’末端附近时,增强基因表达的作用最大。玉蜀黍内含子Adh1-S内含子1、2和6,Bronze-1内含子的使用是本领域公知的。一般信息请参见The Maize
Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
[0184] 降低的表达
[0185] 本文述及“降低的表达”或者表达“减小或基本上消除”应理解为表示,内源基因表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述减小或基本上消除按照递增的优选顺序为,与对照植物相比,减小至少10%、20%、30%、40%或50%、60%、70%、
80%、85%、90%或95%、96%、97%、98%、99%或更多。
[0186] 为减小或基本上消除植物中内源基因的表达,需要一段足够长度的、基本上连续核苷酸的核酸序列。为进行基因沉默,这可以少至20、19、18、17、16、15、14、13、12、11、10或更少的核苷酸,可选地,这可以多至完整的基因(包括部分或完整的5’和/或3’UTR)。此基本上连续的核苷酸链可以源自编码目的蛋白质的核酸(靶基因),或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸链能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸链按照递
增的优选顺序与靶基因(有义链或反义链)50%、60%、70%、80%、85%、90%、95%、96%、
97%、98%、99%、100%序列相同。对于本文所讨论的用于减小或基本上消除内源基因表达的各种方法而言,编码(功能性)多肽的核酸序列并非必需的。
[0187] 减小或基本上消除表达可以利用常规工具和技术来实现。减小或基本上消除内源基因表达的一个优选方法是通过向植物中引入和表达基因构建体,其中,核酸(在此情况中,源自目的基因、或者源自能够编码任一目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)以被间隔子(非编码DNA)分隔开的、(部分或完全地)反向重复的形式克隆在该构建体中。
[0188] 在这样的优选方法中,利用核酸或其部分(在此情况中,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)的反向重复(优选能够形成发夹结构),通过RNA介导的沉默,实现减小或基本上消除内源基因的表达。将该反向重复序列克隆进包含控制序列的表达载体中。非编码DNA核酸序列(间隔子,例如基质附着区片段(MAR)、内含子、多接头等)位于形成该反向重复的两个反向核酸之间。该反向重复序列转录后,形成具有(部分或完全)自我互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。hpRNA被植物加工成可以整合入RNA诱
导的沉默复合物(RISC)中的siRNA。RISC进而切割mRNA转录物,从而显著减少待翻译成多肽的mRNA转录物的数量。关于其他一般细节,参见例如Grierson等(1998)WO 98/53083;
Waterhouse等(1999)WO 99/53050)。
[0189] 本发明的方法的实施不依赖于向植物中引入和表达其中以反向重复形式克隆了核酸分子的基因构建体,而是可以使用几种公知的“基因沉默”法中的任一个或多个来实现相同的效应。
[0190] 用于减小内源基因表达的一个这样的方法是RNA介导的基因表达的沉默(下调)。在该情况下沉默在植物中由双链RNA序列(dsRNA)触发,所述双链RNA序列基本上与靶内
源基因相似。该dsRNA被植物进一步加工成称为短干扰RNA(siRNA)的大约20至大约26
个核苷酸。siRNA整合入RNA诱导的沉默复合物(RISC),该复合物切割内源靶基因的mRNA
转录物,从而实质性减少待翻译成多肽的mRNA转录物的数量。优选,双链RNA序列相应于靶基因。
[0191] RNA沉默法的另一实例包括以有义取向,向植物中引入核酸序列或其部分(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)。“有义取向”是指与其mRNA转录物同源的DNA序列。从而至少一个拷贝的核酸序列被引入植物。该额外的核酸序列将减小内源基因的表达,从而产生称为共抑制的现象。如果将几个额外拷贝的核酸序列引入植物,则基因表达的减小将更明显,因为在高转录水平与共抑制的触发之间存在正相关。
[0192] RNA沉默法的另一实例包括使用反义核酸序列。“反义”核酸序列包含这样的核苷酸序列,所述核苷酸序列与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补或与mRNA转录物序列互补。反义核酸序列优选与待沉默的内源基因互补。互补性可位于基因的“编码区”和/或“非编码区”中。术语“编码区”是指包含将翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”是指连接在编码区侧翼的5′和3′序列,其可被转录但不被翻译成氨基酸(也称为5′和3′非翻译区)。
[0193] 可根据沃尔森和克里克碱基配对法则设计反义核酸序列。反义核酸序列可与整个核酸序列(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)互补,但也可以是仅对核酸序列的部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。适宜的反义寡核苷酸序列的长度在本领域内是已知的并且可以开始于长大约50、45、40、35、30、25、20、15或10个核苷酸或更少。可使用本领域内已知的方法,使用化学合成和酶促连接反应,构建根据本发明的反义核酸序列。例如,反义核酸序列(例如,反义寡核苷酸序列)可使用天然存在的核苷酸或各种修饰核苷酸来化学合成,所述修饰核苷酸经设计用以增加分子的生物学稳定性或增加反义与有义核酸序列之间形成的双链体的物理稳定性,例如可使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸序列的修饰核苷酸的实例在本领域是公知的。已知的核苷酸修饰包括甲基化、环化和“加帽”和用类似物例如肌苷对一个或多个天然存在的核苷酸的取代。核苷酸的其他修饰在本领域是公知的。
[0194] 可使用已将核酸序列以反义取向(即,从插入的核酸转录的RNA针对目的靶核酸是反义取向)亚克隆入其中的表达载体,生物学地产生反义核酸序列。优选,植物中,通过稳定地整合的包含启动子、有效连接的反义寡核苷酸和终止子的核酸构建体,产生反义核酸序列。
[0195] 用于在本发明的方法中进行沉默的核酸分子(无论引入植物的还是原位产生的)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,从而例如通过抑制转录和/或翻
译来抑制蛋白质的表达。杂交可通过常规核苷酸互补性以形成稳定的双链体或者,例如在结合DNA双链体的反义核酸序列的情况下,通过双螺旋的大沟中的特定相互作用而产生。
可通过转化或在特定组织位置直接注射,将反义核酸序列引入植物。可选地,可修饰反义核酸序列以靶向选择的细胞,然后全身性施用。例如,为了进行全身性施用,可以修饰反义核酸序列,以便其特异性结合选择的细胞表面上表达的受体或抗原(例如,通过将反义核酸序列连接至结合细胞表面受体或抗原的肽或抗体)。还可使用本文中描述的载体将反义核酸序列递送至细胞。
[0196] 根据另一个方面,反义核酸序列是α-异头物核酸序列。α-异头物核酸序列与互补RNA形成特定的双链杂交体,其中与常见的b单元(b-units)不同,链走向彼此平行
(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列还可包含2′-o-甲基
核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue
等(1987)FEBS Lett.215,327-330)。
[0197] 还可使用核酶减少或基本上消除内源基因的表达。核酶是具有核糖核酸酶活性的催化性RNA分子,该分子能够切割与其具有互补区的单链核酸序列例如mRNA。因此,核酶(例如,锤头核酶(Haselhoff和Gerlach(1988)Nature 334,585-591)中描述的)可用
于催化切割编码多肽的mRNA转录物,从而显著减少待翻译成多肽的mRNA的数量。可设计
具有对于核酸序列的特异性的核酶(参见例如:Cech等美国专利号4,987,071;和Cech等
美国专利号5,116,742)。可选择地,可以使用相应于核酸序列的mRNA转录物,从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,
1411-1418)。核酶用于在植物中进行基因沉默的用途在本领域是已知的(例如,Atkins
等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;
Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
[0198] 基因沉默还可以通过插入诱变(例如,T-DNA插入或转座子插入)或通过Angell和Baulcombe((1999)Plant J 20(3):357-62)、(Amplicon VIGS WO 98/36083)或Baulcombe (WO 99/15682)等所述的策略来实现。
[0199] 如果在内源基因上存在突变和/或在随后引入植物的分离基因/核酸上存在突变,那么基因沉默也可发生。减少或基本上消除可通过非功能性多肽引起。例如,多肽可能结合多种相互作用的蛋白质;因此,可以通过一个或多个突变和/或截短,提供仍然能够结合相互作用的蛋白质(例如受体蛋白)但不能展示其正常功能(例如信号转导配体)的多
肽。
[0200] 进行基因沉默的另一个方法是通过用与基因的调控区(例如启动子和/或增强子)互补的核酸序列来打靶以形成三螺旋结构,所述结构阻止基因在靶细胞中的转录。参见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,
27-361992;和Maher,L.J.Bioassays14,807-15,1992。
[0201] 其他方法,例如应用针对内源多肽的抗体在植物原位(in planta)抑制其功能、或干扰多肽所参与的信号传递通路,对于技术人员是公知的。特别地,可预期人造分子可用于抑制靶多肽的生物功能,或用于干扰其中靶多肽参与的信号转导途径。
[0202] 可选择地,可设置筛选程序以鉴定植物群体中基因的天然变体,该变体编码具有减少的活性的多肽。这样的天然变体也可用于例如进行同源重组。
[0203] 人工和/或天然微小RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源miRNA为单链小RNA,一般长度19-24个核苷酸。它们主要用于调控基因表达和/或mRNA
翻译。大多数植物microRNA(miRNA)具有与其靶序列完全或几乎完全的互补性。然而,存在具有达到5个错配的天然靶。miRNA利用Dicer家族的双链特异性RNA酶从具有特征性
折回结构的更长的非编码RNA加工而来。一旦加工后,它们通过结合RNA诱导的沉默复合
物(RISC)的主要成分Argonaute蛋白,而掺入到RNA诱导沉默复合物中。MiRNA充当RISC
的特异性组件,因为它们与细胞质中的靶核酸(大多数为mRNA)碱基配对。随后的调控事
件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的效应常反映为靶基因的
降低的mRNA水平。
[0204] 人工微小RNA(amiRNA)一般长度21个核苷酸,可以特异地遗传改造以负调控单个或多个目的基因的基因表达。植物微小RNA靶标选择的决定因素在本领域公知。已经定义了靶标识别的经验参数,并且可用来辅助设计特异性amiRNA(Schwab等,(2005)Dev Cell8:517-527,2005)。设计和生成amiRNA及其前体的便利工具也是公众可获得的(Schwab等,(2006)Plant Cell 18(5):1121-1133,2006)。
[0205] 为优化性能,用来减小植物中内源基因表达的基因沉默技术需要应用来自单子叶植物的核酸序列转化单子叶植物,而使用来自双子叶植物的核酸序列转化双子叶植物。优选,将来自任何给定植物物种的核酸序列引入到相同物种中。例如,来自稻的核酸序列转化到稻植物中。然而,待引入的核酸序列来源于与其待引入的植物相同的植物物种并非是绝对必需的。内源靶基因与待引入的核酸之间基本上同源就足够了。
[0206] 上文描述了减小或基本上消除植物中内源基因表达的多种方法的实例。本领域技术人员将能够容易地调整上述沉默方法,以便例如通过应用适当的启动子而实现内源基因在整株植物或其部分中的表达减小。
[0207] 转化
[0208] 本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。能够随后通过器官发生或者胚胎发生进行克隆增殖的植物组织都可以使用本发明的遗传构建体转化,并从其再生整个植物。具体的组织选择将因可用于和最适于待转化的具体物种的克隆增殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可以将多核苷酸瞬时地或稳定地引入宿主细胞,并且可以,例如作为质粒以非整合的状态维持。可选地,其可以整合进入宿主基因组。得到的转化植物细胞可以接着以本领域技术人员已知的方式再生为转化的植
物。
[0209] 外来基因转移进入植物基因组中称为转化。植物物种的转化目前是一种相当常规的技术。有利地,可以使用若干转化方法的任一种向适当的祖先细胞引入目的基因。可以利用公开的转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化方法包括应用脂质体、电穿孔、增加游离DNA摄取的化学物质、直接向植物注射DNA、粒子枪轰击、用病毒或花粉转化和微粒轰击。方法可以选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,(1882)Nature 296,72-74;Negrutiu I.等,(1987)Plant Mol.Biol.8:
363-373);原生质体的电穿孔法(Shillito R.D.等,(1985)Bio/Technol 3,1099-1102);
植物材料的显微注射(Crossway A.等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击(Klein T.M.等,(1987)Nature 327:70);用(非整合型)病毒感染,等等。
优选通过农杆菌介导的转化,产生转基因植物,包括转基因作物植物。有利的转化法是植物原位转化。为此,可以例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。已经证明,根据本发明尤为有利的是使转化的农杆菌悬液作用于完整植株或至少花原基。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。
农杆菌介导的稻转化方法包括公知的稻转化方法,例如在任一如下文献中描述的那些:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(Plant J.6(2):271-282,1994),其公开内容并入本文作为参考,如同充分阐述的那样。至于玉米转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996) 或Frame等 (Plant Physiol.129(1):13-22,2002) 中所述,其公开内容并入本文作为参考,如同充分阐述的那样。作为举例说明,所述方法还由B.Jenes 等,Techniques for Gene Transfer,在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将
待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的
方式利用由这样的载体转化的农杆菌来转化植物,例如模式植物,像拟南芥属植物(拟南芥(Arabidopsis thaliana)在本发明范围内不视为作物植物);或者作物植物,例如烟
草植物,例如通过将擦伤的叶子或切碎的叶子浸在农杆菌溶液中,然后在合适的培养基中培养之。通过根癌农杆菌的植物转化由例如, 和Willmitzer在Nucl.Acid Res.
(1988)16,9877中描述,或者尤其可以参见F.F.White,Vectors for Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页。
[0210] 除了转化之后不得不再生为完整植株的体细胞,还可以转化植物分生组织的细胞,特别是可以发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,用农杆菌处理拟南芥的种子,并从发育中的植物获得种子,其中一定比例的植物被转化因而是转基因的[Feldman,KA和Marks MD(1987).Mol Gen Genet 208:274-289;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。可选的方法基于花序的反复去除以及莲座中心切割部位与转化农杆菌一起进行的孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,特别有效的方法是改良的真空浸润法,如“浸花法”(floral dip)。对于拟南芥的真空浸润,减压下用农杆菌悬液处理完整植株[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而对于“浸花法”,将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough,SJ和Bent,AF(1998).The Plant J.16,
735-743]。在两种情况下均收获一定比例的转基因种子,且可通过在上述选择性条件下培养而将这些种子与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中为母系遗传,从而降低或消除了转基因通过花粉流失的风险。叶绿体基因组的转化通常通过Klaus等,2004[Nature Biotechnology 22(2),225-229]系统展示的方法
实现。简言之,将待转化的序列与可选择的标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体基因组中。质体转化
已在许多不同的植物物种中描述,且综述由Bock(2001)Transgenic plastids in basic research and plant biotechnology.J Mol Biol.2001年9月21日;312(3):425-38或
Maliga,P(2003)Progress towards commercialization of plastid transformation
technology.Trends Biotechnol.21,20-28给出。最近报道了其他生物技术进步,无标记的质体转化体,这可通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology
22(2),225-229)。
[0211] 遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者 和Willmitzer的出版物。
[0212] 通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对可选择标记例如上文所述标记的存在,筛选转化的植物。
[0213] DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普
通技术人员所公知的。
[0214] 产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
[0215] T-DNA激活标记
[0216] T-DNA激活标记(Hayashi等Science(1992)1350-1353)包括将T-DNA[通常含有启动子(也可以是翻译增强子或内含子)]插入在目的基因的基因组区或基因编码区上游
或下游10kb处,从而在构型上使启动子能够指导靶基因的表达。通常破坏天然启动子对靶基因表达的调控,而使基因落入新引入的启动子的控制下。启动子一般包含于T-DNA中。
此T-DNA可以例如通过农杆菌感染而随机插入植物基因组中,并导致所插入T-DNA附近的
基因的表达被修饰。得到的转基因植物由于位于引入的启动子附近的基因的修饰表达而表现出显性表型。
[0217] TILLING
[0218] 术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted Induced Local Lesions In Genomes)的缩写,是一种用于生成和/或鉴定编码具有修饰的表达和/或活性的蛋白质的核酸的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些突
变变体可以在强度、位置或时间(例如,如果突变影响启动子的话)上呈现出修饰的表达。
这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高通量
筛选方法结合在一起。TILLING一般遵循的步骤有:(a)EMS诱变(Redei GP和Koncz C,
(1992)In Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J编辑,新加坡,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)In Meyerowitz EM,Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172页;Lightner J和Caspar T,(1998)InJ Martinez-Zapater,J Salinas编辑,Methods on Molecular Biology,82卷Humana Press,Totowa,NJ,第91-104页);(b)DNA制备和个体合并;(c)目的区域的PCR扩增;(d)变性和退火以形成杂双链体;(e)DHPLC,其中合并物中存在的杂双链体在色谱图上检测为额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。TILLING的方法是本领域公知的(McCallum等(2002)Nat Biotechnol 18:455-457,由Stemple综述(2004)Nat Rev Genet 5(2):145-50)。
[0219] 同源重组
[0220] 同源重组允许向基因组中的规定选定位置引入所选的核酸。同源重组是生物科学中常规用于低等生物体如酵母或剑叶藓(physcomitrella)的标准技术。在植物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10):3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotechnol 15(2):132-8),并且存在无论靶生物种类的通常可应用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
[0221] 产量相关性状
[0222] 产量相关性状包括如下之一或多种:产量、生物量、种子产量、早期活力、绿度指数、增加的生长速率、改善的农艺性状(例如,提高的水利用效率(WUE),氮利用效率(NUE)等)。
[0223] 产量
[0224] 术语“产量”通常表示具有经济价值的可测量产出,其一般是与规定的作物、面积和/或时期相关的。各植物部分基于其数量、大小和/或重量对产量直接做出贡献,或者实际产量是年作物每平方米的产量,用总产量(既包括收获的产量也包括估定的产量)除以种植的平方米来确定。术语植物的“产量”可能与该植物的营养性生物质(根和/或枝条
生物质)、繁殖器官、和/或繁殖体(如种子)相关。
[0225] 以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。在稻中,耐淹性也可以导致增加的产量。
[0226] 早期活力
[0227] “早期活力”是指活跃健康充分均衡的生长(特别是在植物生长的早期阶段),其可以因植物适应性(fitness)增强引起,例如,由于植物更好地适应其环境(即,优化能源资源的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也显示出增加的幼苗存活和更佳的作物齐苗,这往往产生高均匀度的田地(作物以齐整的方式生长,即大多数植物基本上同时达到各发育阶段),以及往往是更优更高的产量。因此,早期活力可以通过测量多种因素来确定,如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长度、根和枝条生物量,等等。
[0228] 增加的生长速率
[0229] 增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如萌发速度、早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映出增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果
生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每平方米年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数增加)。与野生型对
应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周
期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小
的90%所需的时间)等等。
[0230] 胁迫抗性
[0231] 相对于对照植物,产量和/或生长速率的增加可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、
30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉施肥农药处理)的发
展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁迫。
非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。
[0232] 特别地,可在非胁迫条件下或在轻度干旱条件下进行本发明方法以产生相对于对照植物具有增加的产量的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至
少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
[0233] 养分缺乏可以因诸如氮、磷酸及其他含磷化合物、、钙、镁、锰、等养分的缺乏所致。
[0234] 术语盐胁迫不局限于氯化钠(NaCl),而可以是如下之一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等等。
[0235] 增加/提高/增强
[0236] 术语“增加”、“提高”或“增强”可互换,且在本申请意义上表示与文中所定义的对照植物相比,产量和/或生长多出至少3%、4%、5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
[0237] 种子产量
[0238] 增加的种子产量自身可表现为如下一项或多项:a)种子生物量(种子总重量)的增加,这可以是基于单粒种子和/或每植株和/或每平方米的增加;b)每植株花数的增加;
c)增加的(饱满)种子数;d)增加的种子饱满率(其表达为饱满种子数与种子总数的比
率);e)增加的收获指数,其表达为可收获部分如种子的产量除以总生物量的比率;f)增加的千粒重(TKW),这通过计数饱满种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加,并且也可来自胚和/或胚乳大小的增加。
[0239] 种子产量的增加也可表现为种子大小和/或种子体积的增加。此外,种子产量的增加自身也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以导致改变的构造,或可以因改变的构造而发生。
[0240] 绿度指数
[0241] 如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿值相对于红值之比(在RGB模型中用于色度编码)。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在养分可利用度下降的生长条件下,在开花前的末次成像中测量植物绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物绿度指数。
[0242] 标记辅助育种
[0243] 这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增加的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
[0244] 在(遗传作图)中用作探针
[0245] 利用编码目的蛋白质的核酸进行基因的遗传和物理作图仅需要长度至少15个核苷酸的核酸序列。此类核酸可以用作限制性片段长度多态性(RFLP)标记。可以用编码
目的蛋白质的核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,
Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序
MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,可以使用所述核酸探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码目的蛋白质的核酸在先前用此群体所获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
[0246] 有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
[0247] 核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第
319-346页,及其中引用的参考文献)。
[0248] 在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆
(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
[0249] 用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增
片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接
(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
[0250] 植物
[0251] 本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都含有目的基因/核酸。术语“植物”也涵盖植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都含有目的基因/核酸。
[0252] 尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或饲料豆科植物、观赏植物、粮食作物、乔木或灌木,选自包括如下的列表:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍茎剪股颖(Agrostis stolonifera)、葱芹属物种(Allium spp.)、苋属物种
(Amaranthus spp.)、滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)
(如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、簕竹属
物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、
甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(如欧洲油菜(Brassica napus)、
甘蓝型油菜(Brassica rapa ssp.)[芸苔、油菜籽油菜、芜菁])、Cadaba farinosa、大
叶茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒
属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺
(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、
栗属物种(Castanea spp.)、Ceiba pentandra、苦苣(Cichorium endivia)、樟属物种
(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属
物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属物
种(Cola spp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种
(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物
种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(如非洲油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇
子(Eleusine coracana)、埃塞俄比亚画眉草(Eragrostis tef)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp)、红仔果(Eugenia
uniflora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagus spp.)、苇状羊茅
(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草
莓属物种(Fragaria spp.)、杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(如
大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地(Gossypium
hirsutum)、向日葵属物种(Helianthus spp.)(如向日葵(Helianthus annus))、萱草
(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(如
大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴
苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻
(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzula sylvatica)、番茄属物种(Lycopersicon spp.)(如番茄(Lycopersicon esculentum、Lycopersicon
lycopersicum、Lycopersicon pyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、西印度樱桃(Malpighia emarginata)、曼密苹果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、紫花苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、Ornithopus spp.、稻属物种(Oryza spp.)(如稻(Oryza sativa),阔叶稻(Oryza latifolia))、黍糜(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、香芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、梯牧草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus
spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦
(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番柿(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状磨擦禾(Tripsacum dactyloides)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(如小
麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆锥小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、面包小麦(Triticum sativum)、一粒小麦(Triticum monococcum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum
minus)、旱金莲(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种(Ziziphus spp.)等等。
[0253] 对照植物
[0254] 选择适宜的对照植物是实验设置的常规部分,并且可以包括相应的野生型植物或不含目的基因的相应植物。对照植物一般与待评估植物为相同的植物物种,或者甚至为同一品种。对照植物还可以是待评估植物的无效合子。无效合子是因分离而失去转基因的个体。如本文所用的“对照植物”不仅指完整植物,而且还指植物部分,包括种子和种子部分。
[0255] 发明详述
[0256] 现已令人惊讶地发现,在植物中调节编码BET1样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码BET1样多肽的核酸在植物中的
表达和任选地选择具有增加的种子产量的植物。
[0257] 本发明还提供了迄今未知的BET1样编码核酸和BET1样多肽。
[0258] 根据本发明的一个实施方案,从而提供了分离的核酸分子,其选自:
[0259] (i)SEQ ID NOs:11和95的任一个所示的核酸;
[0260] (ii)SEQ ID NOs:11和95的任一个所示的核酸的互补序列;
[0261] (iii)编码SEQ ID NO:12和96的任一个所示的多肽的核酸,优选地作为遗传密码的简并性的结果,所述分离的核酸可从SEQ ID NO:12和96的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0262] (iv)核酸,其按照递增的优选次序与表A1的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0263] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0264] (vi)编码BET1样多肽的核酸,所述多肽按照递增的优选次序与SEQ ID NO:12和96的任一个所示的氨基酸序列或表A1中任何其它氨基酸序列具有至少50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0265] 根据本发明的其他实施方案,还提供了分离的多肽,其选自:
[0266] (i)SEQ ID NO:12和96的任一个所示的氨基酸序列;
[0267] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:12和96的任一个所示的氨基酸序列以及表A1中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0268] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0269] 现已令人惊讶地发现,在植物中调节编码钙网蛋白多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码钙网蛋白多肽的核酸在植物中的表达和任选地选择具有增加的产量相关性状的植物
[0270] 本发明提供了迄今未知的钙网蛋白编码核酸和钙网蛋白多肽。
[0271] 根据本发明的其他实施方案,因而提供了分离的核酸分子,其选自:
[0272] (i)SEQ ID NO:116、130、140、198和228的任一个所示的核酸;
[0273] (ii)SEQ ID NO:116、130、140、198和228的任一个所示的核酸的互补序列;
[0274] (iii)编码SEQ ID NO:117、131、141、199和229的任一个所示的多肽的核酸,优选地作为遗传密码的简并性的结果,所述分离的核酸可从SEQ ID NO:117、131、141、199和229的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0275] (iv)核酸,其按照递增的优选次序与表A2的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0276] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0277] (vi)编码钙网蛋白多肽的核酸,所述多肽按照递增的优选次序与SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列以及表A2中任何其它氨基酸序列具有至
少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、
65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、
80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0278] 根据本发明的其他实施方案,还提供了分离的多肽,其选自:
[0279] (i)SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列;
[0280] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列以及表A2中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0281] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0282] 此外,现已令人惊讶地发现,在植物中增加编码如本文中定义的DUS1L多肽的核酸序列的表达,可产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括在植物中增加编码DUS1L多肽的核酸序列的表达。
[0283] 本发明还提供了迄今未知的编码DUS1L多肽的核酸序列和DUS1L多肽。
[0284] 根据本发明的一个实施方案,从而提供了分离的核酸分子,其选自:
[0285] (i)SEQ ID NO:264或SEQ ID NO:292所示的核酸序列;
[0286] (ii)如SEQ ID NO:264或SEQ ID NO:292所示的核酸序列的互补序列;
[0287] (iii)编码DUS1L多肽的核酸序列,所述多肽按照递增的优选次序与如SEQ IDNO:265或SEQ ID NO:293所示的多肽序列具有至少30%、35%、40%、45%、50%、55%、
60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性。
[0288] 根据本发明的另外的实施方案,也提供了分离的多肽,其选自:
[0289] (i)如SEQ ID NO:265或SEQ ID NO:293所示的多肽序列;
[0290] (ii)多肽序列,所述多肽序列按照递增的优选次序与如SEQ ID NO:265或SEQID NO:293所示的多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、
75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性;
[0291] (iii)上文(i)或(ii)所给出的任何多肽序列的衍生物。
[0292] 此外,现已令人惊讶地发现,在植物中调节编码ES43样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括在植物中调节编码ES43样多肽的核酸的表达和任选地选择具有增加的产量相关性状的植物。
[0293] 本发明还提供了迄今未知的ES43样编码核酸和ES43样多肽。
[0294] 根据本发明的一个实施方案,从而提供了分离的核酸分子,所述分子选自:
[0295] (i)如SEQ ID NO:308、370和372的任一个所示的核酸;
[0296] (ii)SEQ ID NO:308、370和372的任一个所示的核酸的互补序列;
[0297] (iii)编码如SEQ ID NO:309、371和373的任一个所示的多肽的核酸,优选地作为遗传密码的简并性的结果,所述分离的核酸可从SEQ ID NO:309,371和373的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0298] (iv)核酸,其按照递增的优选次序与表A4的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0299] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0300] (vi)编码ES43样多肽的核酸,所述多肽按照递增的优选次序与SEQ ID NO:309、371和373的任一个所示的氨基酸序列以及表A4中任何其他氨基酸序列具有至少50%、
51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、
66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、
81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0301] 根据本发明的其他实施方案,还提供了分离的多肽,其选自:
[0302] (i)SEQ ID NO:309、371和373的任一个所示的氨基酸序列;
[0303] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:309,371和373的任一个所示的氨基酸序列以及表A4中任何其他氨基酸序列具有至少50%、51%、52%、53%、
54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、
69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、
84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或
99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状;
[0304] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0305] 此外,现已令人惊讶地发现,在植物中调节编码HON5样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括在植物中调节编码HON5样多肽的核酸的表达和任选地选择具有增加的产量相关性状的植物。
[0306] 本发明还提供了迄今未知的HON5样编码核酸和HON5样多肽。
[0307] 根据本发明的再一实施方案,因而提供了分离的核酸分子,其选自:
[0308] (i)SEQ ID NO:393和395的任一个所示的核酸;
[0309] (ii)SEQ ID NO:393和395的任一个所示的核酸的互补序列;
[0310] (iii)编码SEQ ID NO:393和395的任一个所示的多肽的核酸,优选地作为遗传密码的简并性的结果,所述分离的核酸可从SEQ ID NO:394和396的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0311] (iv)核酸,其按照递增的优选次序与表A5的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0312] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0313] (vi)编码HON5样多肽的核酸,所述多肽按照递增的优选次序与SEQ ID NO:394和396的任一个所示的氨基酸序列以及表A5中任何其他氨基酸序列具有至少50%、51%、
52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、
67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、
82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0314] 根据本发明的其他实施方案,还提供了分离的多肽,其选自
[0315] (i)SEQ ID NO:394和396的任一个所示的氨基酸序列;
[0316] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:394和396的任一个所示的氨基酸序列以及表A5中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、
55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、
70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0317] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0318] 此外,现已令人惊讶地发现,在植物中调节编码GSA1多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括在植物中调节编码GSA1多肽的核酸的表达和任选地选择具有增强的产量相关性状的植物。
[0319] 用于调节(优选,增加)编码BET1样多肽、或钙网蛋白多肽、或DUS1L多肽、或ES43样多肽、或HON5样多肽、或GSA1多肽的核酸的表达的一个优选方法是,向植物中引入和表达编码BET1样多肽、或钙网蛋白多肽、或DUS1L多肽、或ES43样多肽、或HON5样多肽、或GSA1多肽的核酸。
[0320] 关于BET1样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的BET1样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的BET1样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“BET1样核酸”或“BET1样基因”。
[0321] 关于钙网蛋白多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的钙网蛋白多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的钙网蛋白多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“钙网蛋白核酸”或“钙网蛋白基因”。
[0322] 关于DUS1L多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的DUS1L多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的DUS1L多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类多肽的任何核酸序列,在下文中也称为“DUS1L核酸”或“DUS1L基因”。
[0323] 关于ES43样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的ES43样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的ES43样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“ES43样核酸”或“ES43样基因”。
[0324] 关于HON5样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的HON5样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的HON5样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“HON5核酸”或“HON5基因”。
[0325] 关于GSA1多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的GSA1多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的GSA1多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“GSA1核酸”或“GSA1基因”。
[0326] 如本文中定义的“BET1样多肽”是指包含由SEQ ID No 97定义的CC结构域:C(X1)a C(X2)b(Y)c G(X3)d C(X4)C的任何多肽,其中:
[0327] X1,X2,X3和X4可以是任何氨基酸,
[0328] Y可以是任何氨基酸或无(无氨基酸),
[0329] a意指多至3次X1,
[0330] b意指多至7次X2,
[0331] c意指多至2次Y,
[0332] d意指多至15次X3
[0333] 在本发明的另外的实施方案中,d优选是8、10或11次由X3表示的氨基酸。
[0334] 根据本发明的优选CC结构域是与由SEQ ID NO 98所示的结构域:CRLICSSKGFKDGG WCDESVEHKVCCC具有至少50%、51%、52%、53%、54%、55%、56%、57%、
58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、
73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性的结构域。
[0335] 此外,本发明的另一个优选实施方案涉及包含如上定义的CC结构域和下列基序,基序1和/或基序2,的BET1样多肽:
[0336] 基序1:G(W/Y)CD(E/K)(SEQ ID NO:99);
[0337] 基序2:EGF(SEQ ID NO:100)
[0338] 本发明的最优选实施方案涉及包含如上定义的CC结构域和也如上文中定义的基序1(其存在于SEQ ID NO:2中)的BET1样多肽。
[0339] 在本发明的另一个优选实施方案中,BET1样多肽包含序列例如SEQ ID NO:2:
[0340] SEQ ID NO:2:MAVMKSSTMVALLLAVAILSSLSPCYEAGGCIGKPKKSPPPPRKPYFSSYSEDHQNCRLICSSKGFKDGGWCDESVEHKVCCCSH。
[0341] 可选地,BET1样多肽的同源物按照递增的优选次序与表A1的任何多肽所代表的氨基酸,优选由SEQ ID NO:2所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、
31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、
46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、
61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、
76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守基序。可以使用全局比对算法,例如程序GAP(GCG Wisconsin
Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。
[0342] 钙网蛋白多肽在本领域内是公知的。(Christianssen等2008.Plant CellPhysiol.2008Jun;49(6):912-24)。钙网蛋白多肽通常是指包含具有松散界定的边界的、3个独特的结构和功能结构域:近中性N-结构域、富含脯氨酸的P-结构域和多酸的C-结构
域的任何多肽(图4)。
[0343] 用于本发明的方法的优选钙网蛋白多肽是包含一个或多个下列基序的多肽:
[0344] (i)基序3:PXXIXDPXXKKPEXWDD(SEQ ID NO:246),
[0345] (ii)基序4:GXWXXXXIXNPXYK(SEQ ID NO:247),
[0346] (iii)基序5:E[VL]WQVK(SEQ ID NO:248),
[0347] (iv) 基 序 6:TLV[FL]QFSVKHEQKLDCGGGY[MV]KLLSGDVDQKKFGG[DE]TPYSIMFGPDICGY(SEQ ID NO:249),其代表CRT1/2组的典型CRT植物多肽;
[0348] (v) 基 序 7:TPYS[LF]MFGPD[IL]C GTQTKKLH[VL]ILSYQ GQN YPIKKDL[QE]CETD KLTH[FV]YTFI(SEQ ID NO:250),其代表CRT3组的典型CRT植物多肽;
[0349] (vi) 基 序 8:N[HY][LP]IKK[DE][VL]PCETD[QK]LTH[VF]YTFI[LI]RPDA[TS]YSILIDN[VR]E[KR][QE][TS]GS[LM]Y[TS]DWD[IL]L(SEQ ID NO:251),其代表植物界的典型CRT多肽;
[0350] (vii)基序9:QKKFGGDTPYSIMFGPDICGY[SQ]TKK[VL]H[AV]I](SEQ ID NO:252),其代表真核生物来源的典型CRT多肽,
[0351] (viii)具有与基序列(i)至(vii)的任一个至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、
70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的全序列同一性的基序;
[0352] 其中“X”表示任何氨基酸并且其中括号“[ ]”之间显示的氨基酸表示在该位置上的可选氨基酸。
[0353] 本发明的优选钙网蛋白多肽在N端中包含信号肽和在C端中包含ER滞留信号((H/K)DEL),优选Christianssen等2008中公开的任何信号。
[0354] 本发明的优选多肽按照递增的优选次序是指表A2的任何多肽、表A2所给出的任何钙网蛋白多肽的直向同源物或同源物。
[0355] 可选地,钙网蛋白的同源物按照递增的优选次序与SEQ ID NO:105的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、
38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守基序。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。
[0356] 优选,所述多肽序列,当用于系统发生树例如Christensen等.2008的图1中描述的并且在本文中于图5中再现的系统发生树的构建时,与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b、以及Os_CRT3或At_CRT3多肽的组,优选与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b的组聚类。或者,所述多肽序列,当用于系统发生树,例如实施例2中描述的系统发生树的构建时,与下列系统发生类别:实施例2的类别1-CRT1、2-CRT3、3-藻类,4-动物和5-原生生物中的任一多肽,优选与1-CRT1类聚类。
[0357] 如本文中定义的“DUS1L多肽”是指包含(i)具有InterPro entry IPR001269的tRNA-二氢尿苷合酶结构域;(ii)具有InterPro entry IPR013785的醛缩酶型TIM桶结构
域;和(iii)具有InterPro entry IPR018517的tRNA二氢尿苷合酶保守位点的任何多肽。
[0358] 可选地或额外地,如本文中定义的“DUS1L多肽”是指任何如下多肽,所述多肽包含按照递增的优选次序与SEQ ID NO:294所示的tRNA-二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
[0359] 可选地或额外地,如本文中定义的“DUS1L多肽”是指任何如下多肽序列,所述多肽序列包含按照递增的优选次序与SEQ ID NO:259所示的多肽至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
[0360] 可选地或额外地,如本文中定义的“DUS1L多肽”是指任何如下多肽,所述多肽包含按照递增的优选次序与本文中表A3所给出的任何多肽序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
[0361] 此外,如本文中定义的“DUS1L多肽”可在功能上补充具有tRNA二氢尿苷合酶活性缺陷的大肠杆菌菌株,从而增加tRNA二氢尿苷含量。
[0362] 如本文中定义的“ES43样多肽”是指,包含BAH结构域(Pfam登录号:PF01426)和PHD结构域(Pfam登录号:PF00628)的任何多肽。
[0363] BAH结构域在本领域内是公知的(Callebaut等.FEBS letts1999;446:189-193)。PHD结构域在本领域内是公知的(Aasland R,等.Trends Biochem Sci 1995;20:56-59)。
鉴定BAH结构域和PHD结构域的方法在本领域内是公知的,例如通过参考结构性结构域数
据库和/或序列结构域数据库鉴定。
[0364] 结构数据库的实例:
[0365] ·CATH(Orengo等.(1997).Structure,5,1093-1108;Alison等.Nucleic Acids Research,2009,第37卷)。
[0366] ·DALI(Holm,2008.Bioinformatics 24,2780-2781)
[0367] ·SCOP(Murzin等.J.Mol.Biol.247,536-540;Andreeva等.Nucl.Acid Res.36:D419-D425)
[0368] 序列结构域数据库的实例:
[0369] ·InterPro(Hunters等.2009Nucleic Acids Res.37(数据库期号):D224-228;Quevillon等.2005Nucleic Acids Res.33(Web服务器期号):W116-W120).
[0370] ·Pfam(Finn Nucleic Acids Research(2008)数据库期号36:D281-D288).
[0371] ·SMART(Schultz等.(1998)PNAS 95:5857-5864;Letunic 等 .2004,NAR 32,D142-D144).
[0372] ·NCBI保守结构域数据库(Marchler-Bauer等.Nucleic Acids Res.2007;35(数据库期号):D237-40).
[0373] ·HMM的超家族文库,其是针对所有完成测序的生物的超家族和(超家族和家族)注释的数据库(Gough等.J.Mol.Biol.,313(4),903-919)。
[0374] 关于参考具体蛋白质结构域数据库的方法的进一步描述提供于实施例部分。
[0375] 根据本发明的优选ES43样多肽是包含具有如下氨基酸序列的结构域的多肽,所述氨基酸序列与SEQ ID NO:374(SEQ ID NO:299的BAH结构域)的氨基酸序列或与SEQ
ID NO:375(SEQ ID NO:299的PHD结构域)的氨基酸序列按照递增的优选次序至少50%、
51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、
66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、
81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、或99%序列相同。
[0376] 更优选地,根据本发明的ES43样多肽包含下列蛋白质基序中的任一个或多个:
[0377] (i)基序10:VRVRVRWYY(SEQ ID NO:376);
[0378] (ii)基序11:RPEE(SEQ ID NO:377);
[0379] (iii)基序12:TIEGKC(SEQ ID NO:378);
[0380] (iv)基序13:GDCVLMR(SEQ ID NO:379);
[0381] (v)基序14:YVAR(SEQ ID NO:380);
[0382] (vi)基序15:GAKE(SEQ ID NO:381);
[0383] (vii)基序16:CRFEY(SEQ ID NO:382);
[0384] (viii)基序17:HEAT(SEQ ID NO:383)
[0385] 其他优选ES43样多肽是SEQ ID NO:299所示的ES43样多肽的同源物,优选旁系同源物或直向同源物。
[0386] 优选BAH结构域位于ES43样多肽的N端,而PHD结构域位于C端。
[0387] 可选地,ES43样蛋白的同源物按照递增的优选次序与SEQ ID NO:299的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、
38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守结构域。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法特别有用(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
[0388] 如本文中定义的“HON5样多肽”是指任何如下多肽,所述多肽包含组蛋白H1/H5结构域(Pfam:PF00538;Interpro:IPR005818)和至少2个,优选2、3、4、5、6或7个AT-hook结构域(Pfam:PF02178;InterPro:IPR000637)。
[0389] 组蛋白H1/H5蛋白结构域(Pfam:PF00538;Interpro:IPR005818)在本领域内是公知的。组蛋白H1/H5蛋白结构域可由下列共有序列表示:HPPYAEMIAIAALKEDGSSKAIAKYIERYTGLPPHSALLTHHLKRLKSSGLLVMVKKSYKLAS(SEQ ID NO:411)。该共有序列显示在不同来源的H1或H5蛋白的组蛋白H1/H5结构域中在各位点上最保守(丰富)的残基。本领域技术人员将意识到,在具体的H1多肽中组蛋白H1/H5结构域可与共有序列中所示的不同,然而沿着结构域的总体同源性是保留的。
[0390] 存在于HON5样多肽中的优选组蛋白H1/H5结构域涉及,按照递增的优选次序与SEQ ID NO:410所示的H1/H5组蛋白结构域的共有序列具有至少50%,55%,60%,65%,
70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高的序列同一性的结构域。
再一优选H1/H5组蛋白结构域是存在于表A5的多肽,最优选SEQ ID NO:388中的任一个
H1/H5组蛋白结构域。
[0391] AT-hook结构域(也称为AT-hook基序)在本领域内是公知的。AT-hook是对富含A/T的区域具有偏好的DNA结合基序。该基序见于许多蛋白质中,包括高迁移率组(HMG)蛋白质(Reeves和Beckerbauer.Biochim.Biophys.Acta 151913-292001)。AT-hook结构
域在Interporo数据库中以名称AT-hook,DNA结合,保守位点(Hunter等;2009,Nucleic Acids Res.37数据库期号:D224-228)在索引登录号:InterPro:IPR017956下注册,并在pfam数据库(Finn等.Nucleic Acids Research(2008)数据库期号36:D281-D288)中以名
称“AT-hook基序”在索引登录号PF02178下注册。存在于HON5样多肽中的优选AT-hook
结构域涉及按照递增的优选次序与存在于表A5的多肽,更优选SEQ ID NO:388中的任何
AT-hook基序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、
97%、98%、99%或更高序列同一性的结构域。
[0392] 此外或可选地以及优选地,HON5样多肽包含一个或多个按照递增的优选次序与下列任一基序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、
97%、98%、99%或更高序列同一性的基序:
[0393] 基 序 I:Y[ASK]EMI[YC]TAI[AGT]AL[KN][ED][PK]DGSS[KR]RAI[AS][KR]YIERA[YF][TP][GD]LP[PS]AH[SD][AD]LLTHHLK[RT]L[KR](SEQ ID NO:411)
[0394] 基序II:GLLV[ML]VK[KH]SYKL[AP][RS]S(SEQ ID NO:412)
[0395] 基序III:SA[PS][PQS]GQKRGRGRPPKPK(SEQ ID NO:413)
[0396] 其中括号之间的氨基酸代表在该位置上的可选氨基酸。
[0397] 基序I和基序II通常位于H1/H5结构域内,而基序III通常与AT-hook结构域重叠。
[0398] 可选地,HON5样蛋白的同源物按照递增的优选次序与表A5中任何多肽,优选SEQ ID NO:388所示,的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、
49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、
64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、
79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、或99%的全序列同一性并且优选包含如上定义的基序I、II和III。
[0399] 可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法特别有用(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
[0400] 如本文中定义的“GSA1多肽”是指包含如下之任一或多个的任何多肽:
[0401] 结构 域1:VPS[IV]EMVRFVNSGTEAC[ML][GS][VA]LRL[AM]RA[FY]TGREK[IV][IL]K FEGCYHGHAD[PS]FLVK(SEQ ID NO:487)
[0402] 结 构 域 2:NSPVRAFKSVGGQP[IV]V[FI]D[SR]VKG[SA][HRY][MA]WD[IV]DGN[EK]Y[IV]DYVGSWGPAIIGHADD(SEQ ID NO:488)
[0403] 结 构 域 3:AQEYFGITPD[LV]TT[LM]GK[IV]IGGGLPVGAYGG[RK][RK][ED]IMEMVAP AGPMYQAGTLS(SEQ ID NO:489)
[0404] 或按照递增的优选次序与结构域1至3的任一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、
67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、
82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、或99%的全序列同一性的结构域。
[0405] 可选地,GSA1蛋白的同源物按照递增的优选次序与SEQ ID NO:418所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、
38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守结构域。
[0406] 可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法特别有用(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
[0407] 优选,所述多肽序列,当用于系统发生树例如图17中描述的系统发生树的构建时,与包含SEQ ID NO:418所示的氨基酸序列的GSA1多肽的组聚类而不与任何其他组聚
类。
[0408] 术语“结构域”、“标签序列”和“基序”在本文“定义”部分定义。存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher 和 Bairoch(1994),A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings
2nd International Conference on Intelligent Systems for Molecular Biology)
Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute of Bioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depth protein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
[0409] 关于DUS1L多肽,本文中表A3的多肽的比对示于图9。此比对可以用于鉴定如本文中定义的DUS1L多肽之间最保守的结构域或基序。一个这样的结构域是具有InterPro
entry IPR001269(整合PFAM PF01207entry(图9中由X标记))的tRNA-二氢尿苷合酶
结构域。一个这样的基序是具有InterPro entry IPR018517(整合PROSITE PS01136(图
9中由X标记)的tRNA二氢尿苷合酶保守位点。保守残基在图9中加框标示,特别是在其
他生物中作为关键的广义酸/碱催化剂的Cys残基。
[0410] 为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:
443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的
比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMCBioinformatics,10:29.2003 Jul 10;4:29.MatGAT:an application that generates similarity/identity matrices using protein or DNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。
对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
[0411] 关于DUS1L多肽,本文中实施例3在表C2中描述了SEQ ID NO:259所示的DUS1L多肽与表A3中所列的DUS1L多肽之间的百分数同一性,其可低至32%的氨基酸序列同一
性。在一些情况下,可调整缺省参数来改变搜索的严格性。例如使用BLAST,可增加用于报告与数据库序列的匹配性的统计学显著性阈值(称为“期望”值),以显示不太严格的匹配。
这样,可鉴定到短的几乎完全的匹配。
[0412] BET1样多肽,当根据实施例部分描述的本发明方法在稻中表达时,产生具有增强的产量相关性状,特别是种子产量的植物。
[0413] 此外,BET1样多肽可显示优选的亚细胞定位,通常在细胞核、细胞质、叶绿体或线粒体之一个或多个中。预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类
方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进
步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知
的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
[0414] BET1样多肽优选包含通常位于N端的跨膜信号肽。跨膜信号肽在本领域内是已知的。优选,BET1样多肽优选定位在细胞的膜结构中,最优选在胚乳转移层。确定蛋白质的亚细胞定位的方法在本领域内是公知的。
[0415] 此外,CRT多肽通常具有钙(Ca2+)结合活性。用于测量钙(Ca2+)结合活性的工具2+
和技术在本领域内是公知的。例如,可在蛋白质印迹的45Ca 覆盖(overlays)中或利用
(3H)缓激肽结合测定法和/或如由Christensen等Plant Cell Phys.2008,49(6)912-24
2+ 2+
描述的小鼠胚胎成纤维细胞的荧光Ca 测量试验,测定蛋白质与钙(Ca )的结合。可选地,CRT多肽活性可在如由Christiansen等.2008描述的Atcrt1a突变体的互补中进行测定。
此外,CRT多肽,当根据实施例部分描述的本发明方法在稻中表达时,特别产生具有增强的产量相关性状的植物。
[0416] 关于DUS1L多肽,预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知
的一些算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。使用PSort算法预测的SEQ ID NO:259的亚细胞定位是线粒体区室(参见实施例5)。
[0417] 此外,ES43样多肽通常具有蛋白质-蛋白质间相互作用活性。用于测量蛋白质-蛋白质相互作用活性的工具和技术在本领域内是公知的,例如共免疫沉淀、生物分子荧光互补(BiFC)、荧光共振能量转移(FRET)、Pull-down测定试验、标记转移、酵母双杂交筛选、体内交联、串联亲和纯化(TAP)、化学交联、与敲低结合的定量免疫沉淀(QUICK)、双偏振极化干涉测量技术(DPI)、蛋白质-蛋白质分子对接(docking)、#静态光散射(SLS)、化学交联然后大质量MALDI质谱、SPINE(Strep-蛋白质相互作用实验)和表面等离子体共振术(Wikipedia)。
[0418] 此外,ES43样多肽,当根据如实施例部分描述的本发明方法在稻中表达时,产生具有增强的产量相关性状,特别是增加的种子饱满率的植物。
[0419] 此外,HON5样多肽通常具有DNA结合和/或蛋白质结合活性。用于测量DNA结合、染色质相互作用和/或蛋白质结合活性的工具和技术在本领域内是公知的,包括例如电泳迁移率变动分析、和与常常存在于植物启动子区域中的富A/T区段相互作用的足迹
研究(Gasser 2003,Plant Mol Biol.53(3):281-95及其中的参考文献;Pedersen等.,
1991;Nieto-Sotelo等.1994Plant Cell 6:287-301;Zhang 等.2003Biochemistry 42:
6596-6607;Klosterman 2002Plant Science 162,855-866).
[0420] 此外,HON5样多肽,当根据如实施例部分描述的本发明方法在稻中表达时,产生具有增强的产量相关性状的植物,其中所述增强的产量相关性状特别是如下之任一或多个的增加:种子总重量、饱满种子数、种子饱满率和收获指数的增加。
[0421] 此外,HON5样多肽可显示优选的亚细胞定位,通常在细胞核、细胞质、叶绿体或线粒体之一个或多个中。预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。
从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的一
些算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS 1、SignalP、TMHMM和其他。
[0422] GSA1多肽,当根据如实施例部分描述的本发明方法在稻中表达时,产生具有增强的产量相关性状,特别是增加的种子产量的植物。
[0423] 关于BET1样多肽,本发明以编码SEQ ID NO:2的多肽序列的SEQ ID NO:1所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何BET1样编码核酸或BET1样多肽来实施。
[0424] 编码BET1样多肽的核酸的实例在本文实施例部分表A1中给出。这样的核酸可用于实施本发明的方法。实施例部分表A1所给出的氨基酸序列为SEQ ID NO:2所示BET1样
多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A1中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列
开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)(在查询序列为SEQ ID NO:1或SEQ ID NO:2的情况下,二次BLAST因此将会针对玉米序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事
件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0425] 关于钙网蛋白多肽,本发明以编码SEQ ID NO:105的多肽序列的SEQ ID NO:104所示的核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何钙网蛋白编码核酸或钙网蛋白多肽来实施。
[0426] 编码钙网蛋白多肽的核酸的实例在本文实施例部分表A2中给出。这样的核酸可用于实施本发明的方法。实施例部分表A2所给出的氨基酸序列为SEQ ID NO:105所示钙
网蛋白多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A2中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序
列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)(在查询序列为SEQ ID NO:104或SEQ ID NO:105的情况下,二次BLAST因此将会
针对番茄(Solanum lycopersicum)序列进行)。然后比较一次和二次BLAST的结果。如果
一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导
致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0427] 关于DUS1L多肽,本发明以编码SEQ ID NO:259的多肽序列的SEQID NO:258所示的核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何DUS1L多肽编码核酸来实施。
[0428] 编码DUS1L多肽的核酸序列的实例在本文实施例部分表A3中给出。这样的核酸可用于实施本发明的方法。实施例部分表A3所给出的多肽序列为SEQ ID NO:259所示DUS1L多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A3中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)(在查询序列为SEQ ID NO:258或SEQ ID NO:259的情况下,二次BLAST因此将会
针对甘蔗(saccharum officinarum)序列进行)。然后比较一次和二次BLAST的结果。如
果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST
导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0429] 关于ES43样多肽,本发明以编码SEQ ID NO:299的多肽序列的SEQ ID NO:298所示的核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何ES43样编码核酸或ES43样多肽来实施。
[0430] 编码ES43样多肽的核酸的实例在本文实施例部分表A4中给出。这样的核酸可用于实施本发明的方法。实施例部分表A4所给出的氨基酸序列为SEQ ID NO:299所示ES43
样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A4中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列
开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)(在查询序列为SEQ ID NO:298或SEQ ID NO:299的情况下,二次BLAST因此将会
针对稻序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命
中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0431] 关于HON5样多肽,本发明以编码SEQ ID NO:388的多肽序列的SEQID NO:387所示的核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何HON5样编码核酸或HON5样多肽来实施。
[0432] 编码HON5样多肽的核酸的实例在本文实施例部分表A5中给出。这样的核酸可用于实施本发明的方法。实施例部分表A5所给出的氨基酸序列为SEQ ID NO:388所示HON5
样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A5中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列
开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)(在查询序列为SEQ ID NO:387或SEQ ID NO:388的情况下,二次BLAST因此将会
针对毛果杨(Populus trichocarpa)序列进行)。然后比较一次和二次BLAST的结果。如
果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST
导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0433] 关于GSA1多肽,本发明以编码SEQ ID NO:418的多肽序列的SEQ ID NO:417所示的核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何GSA1编码核酸或GSA1多肽来实施。
[0434] 编码GSA1多肽的核酸的实例在本文实施例部分表A6中给出。这样的核酸可用于实施本发明的方法。实施例部分表A6所给出的氨基酸序列为SEQ ID NO:418所示GSA1
多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A6中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列
开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的
结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次
BLAST)(在查询序列为SEQ ID NO:417或SEQ ID NO:418的情况下,二次BLAST因此将会
针对杨(Populus)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分
值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
[0435] 分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
[0436] 核酸变体也可用于实施本发明的方法。这类变体的实例包括编码实施例部分表A1至A6中给出的任一氨基酸序列的同源物和衍生物的核酸,其中“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有,编码实施例部分表A1至表A6所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
[0437] 可用于实施本发明方法的其他核酸变体包括编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸的部分、与编码BET1样多肽或
钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸杂交的核酸、
编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽
的核酸的剪接变体、编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5
样多肽或GSA1多肽的核酸的等位基因变体,以及通过基因改组获得的编码BET1样多肽或
钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸的变体。术
语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
[0438] 编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。
根据本发明,提供了增强植物的产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A6所给出的任一核酸序列的部分、或者编码实施例部分表A1至A6所给出的任
一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
[0439] 例如,可以通过对核酸进行一个或多个缺失来制备核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了几种活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分预测的大小要大。
[0440] 关于BET1样多肽,可用于本发明方法的部分编码如本文所定义的BET1样多肽,并与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选地,“部分”是实施例部分表A1所给出的任一核酸的部分,或是编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少50,75,100,150,
200或更多个连续核苷酸,该连续核苷酸来自实施例部分表A1所给出的任一核酸序列,或编码实施例部分表A1所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选
“部分”是SEQ ID NO:1的核酸的部分。优选,所述部分编码氨基酸序列的片段,所述氨基酸序列包含结构域CC,优选如上定义的基序1和/或2并且优选与SEQ ID NO:2具有至
少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、
65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、
80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、或99%的序列同一性。
[0441] 关于钙网蛋白多肽,可用于本发明方法的部分编码如本文所定义的钙网蛋白多肽,并与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选,所述部分是实施例部分表A2所给出的任一核酸的部分,或是编码实施例部分表A2所给出的任一
氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选所述部分在长度上为至少
100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000、1150、1200、1250、
1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900或更多个连续核苷酸,所述连续核苷酸来自实施例部分表A2所给出的任一核酸序列、或编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选,所述部分是
SEQ ID NO:104的核酸的部分。优选,所述部分编码氨基酸序列的片段,所述氨基酸序列,当用于系统发生树例如Christensen等.2008的图1中描述的并且在本文中于图5中再
现的系统发生树的构建时,与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b、以及Os_CRT3或At_CRT3多肽的组,优选与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b的组聚类。可
选地,所述部分编码氨基酸序列的片段,所述氨基酸序列,当用于系统发生树,例如实施例2中描述的系统发生树的构建时,与下列系统发生类别中的任一多肽聚类:实施例2的类别
1-CRT1、2-CRT3,3-藻类,4-动物和5-原生生物,优选与类1-CRT1多肽聚类。
[0442] 关于DUS1L多肽,可用于本发明方法的部分编码如本文所定义的DUS1L多肽,并与实施例部分表A3所给出的多肽序列具有基本上相同的生物活性。优选,所述部分是实施例部分表A3所给出的任一核酸序列的部分,或是编码实施例部分表A3所给出的任一多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选所述部分按照递增的优选次序
在长度上为至少700、800、900、1000、1100、1150、1200、1250、1300、1350、1400或更多个连续核苷酸,所述连续核苷酸来自实施例部分表A3所给出的任一核酸序列、或编码实施例部分表A3所给出的任一多肽序列的直向同源物或旁系同源物的核酸序列。优选,所述部分
是编码多肽序列的核酸序列的部分,其中所述多肽序列包含按照递增的优选次序与SEQ ID NO:294所示tRNA二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、85%、
90%、95%、98%、99%或更高的氨基酸序列同一性。更优选,所述部分是编码多肽序列的核酸序列的部分,所述多肽序列包含按照递增的优选次序与SEQ ID NO:259所示DUS1L多肽或与本文中表A3所给出的任何多肽序列至少30%、35%、40%、45%、50%、55%、60%、
65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。最优选,所述部分是SEQ ID NO:258的核酸序列的部分。
[0443] 关于ES43样多肽,可用于本发明方法的部分编码如本文所定义的ES43样多肽,并与实施例部分表A4所给出的氨基酸序列具有基本上相同的生物活性。优选,所述部分是实施例部分表A4所给出的任一核酸的部分,或是编码实施例部分表A4所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选所述部分在长度上为至少100、200、
300、400、500、550、600、650、700或更多个连续核苷酸,所述连续核苷酸为实施例部分表A4所给出的任一核酸序列、或编码实施例部分表A4所给出的任一氨基酸序列的直向同源物
或旁系同源物的核酸。最优选,所述部分是SEQ ID NO:298的核酸的部分。优选,所述部分编码包含BAH结构域或PHD结构域或两者的氨基酸序列的片段。
[0444] 关于HON5样多肽,可用于本发明方法的部分编码如本文所定义的HON5样多肽,并与实施例部分表A5所给出的氨基酸序列具有基本上相同的生物活性。优选,所述部分是实施例部分表A5所给出的任一核酸的部分,或是编码实施例部分表A5所给出的任一氨基
酸序列的直向同源物或旁系同源物的核酸的一部分。优选所述部分在长度上为至少100、
200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、
1900、2000、2100、2200、2300、2400、2500、2600、2700、2800或更多个连续核苷酸,所述连续核苷酸来自实施例部分表A5所给出的任一核酸序列、或编码实施例部分表A5所给出的任
一氨基酸序列的直向同源物或旁系同源物的核酸。最优选,所述部分是SEQ ID NO:387的核酸的部分。优选,所述部分编码包含上文中所列的基序I、II或III的任一个或多个的氨基酸序列的片段。
[0445] 关于GSA1多肽,可用于本发明方法的部分编码如本文所定义的GSA1多肽,并与实施例部分表A6所给出的氨基酸序列具有基本上相同的生物活性。优选,所述部分是实施例部分表A6所给出的任一核酸的部分,或是编码实施例部分表A6所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选所述部分在长度上为至少500、550、600、
650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400或 更多个连续核苷酸,所述连续核苷酸来自实施例部分表A6所给出的任一核酸序列、或编码实施例部分表A6所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选,所述部分是SEQ ID NO:417的核酸的部分。优选,所述部分编码氨基酸序列的片段,其中所述氨基酸序列,当将其用于系统发生树例如图17中描述的系统发生树的构建时,与包含SEQ ID NO:418所示氨基酸序列的GSA1多肽组而非与任何其他组聚类。
[0446] 可以用于本发明方法的另一核酸变体是这样的核酸,所述核酸能够在降低的严格条件下,优选在严格条件下与编码本文中定义的BET1样多肽、或钙网蛋白多肽、或DUS1L多肽、或ES43样多肽或HON5样多肽或GSA1多肽的核酸,或者与本文中定义的部分杂交。
[0447] 根据本发明,提供了增强植物的产量相关性状的方法,包括向植物中引入和表达能够与实施例部分表A1至A6所给出的任一核酸杂交的核酸,或包括向植物中引入和表达能够与编码实施例部分表A1至A6所给出的任何核酸序列的直向同源物、旁系同源物或同
源物的核酸杂交的核酸。
[0448] 关于BET1样多肽,用于本发明方法的杂交序列编码本文中定义的BET1样多肽,所述多肽与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A1所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:1所示的核酸的互补序列或与其部分杂交。
[0449] 可以用于本发明方法的另一核酸变体是编码本文中定义的BET1样多肽的剪接变体,剪接变体如本文中定义。
[0450] 关于钙网蛋白多肽,用于本发明方法的杂交序列编码本文中定义的钙网蛋白多肽,所述多肽与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A2所给出的任一核酸的互补序列杂交,或与这些序列之任
一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:104所示的核酸的互补序列或与其部分杂交。
[0451] 优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于系统发生树例如Christensen等.2008的图1中描述的并且在本文中于图5中再现的系统发生树的构建时,与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b以及Os_CRT3或At_CRT3
多肽的组,优选与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b的组聚类。可选地,所述
杂交序列编码多肽序列,所述多肽序列,当用于系统发生树,例如实施例2中描述的系统发生树的构建时,与下列系统发生类别:实施例2的类别1-CRT1、2-CRT3,3-藻类,4-动物和
5-原生生物中的任一多肽,优选与类别1-CRT1多肽聚类。
[0452] 关于DUSL1多肽,用于本发明方法的杂交序列编码本文中定义的DUS1L多肽,所述多肽与实施例部分表A3所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A3所给出的任一核酸序列或其互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者其中所述杂交序列能够与编码实施例部分表A3所给出的任一多肽序列的直向同源物或旁系同源物的核酸序列或其互补序列杂交。优
选,所述杂交序列能够与编码多肽序列的核酸序列杂交,所述多肽序列按照递增的优选次序包含与SEQ ID NO:294所示的tRNA二氢尿苷合酶结构域至少50%、55%、60%、65%、
70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。更优选,所述杂交序列能够与编码多肽序列的核酸序列杂交,所述多肽序列按照递增的优选次序包含与SEQ ID NO:259所示的DUS1L多肽或与本文表A3所给出的任何多肽序列至少30%、35%、
40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。最优选,所述杂交序列能够与SEQ ID NO:258所示的核酸序列或与其部分杂交。
[0453] 关于ES43样多肽,用于本发明方法的杂交序列编码本文中定义的ES43样多肽,所述多肽与实施例部分表A4所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A4所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A4所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:298所示的核酸的互补序列或与其部分杂交。优选,所述杂交序列编码具有包含BAH或PHD结构域或两个结构域的氨基酸序列的多肽。
[0454] 关于HON5样多肽,用于本发明方法的杂交序列编码本文中定义的HON5样多肽,所述多肽与实施例部分表A5所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A5所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A5所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:387所示的核酸的互补序列或与其部分杂交。优选,所述杂交序列编码具有包含如上的基序I、II或III的任一个或多个的氨基酸序列的多肽。
[0455] 关于GSA1多肽,用于本发明方法的杂交序列编码本文中定义的GSA1多肽,所述多肽与实施例部分表A6所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A6所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A6所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:417所示的核酸的互补序列或与其部分杂交。优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于系统发生树例如图17中描述的系统发生树的构建时,与包含SEQ ID NO:418所示的氨基酸序列的GSA1多肽的组聚类而不与任何其他组聚类。
[0456] 用于本发明的方法的另一个核酸变体是编码上文中定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的剪接变体,剪接变体如本
文中所定义的。
[0457] 根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分表A1至A6所给出的任一核酸序列的剪接变体,或编码实施例部分表A1至A6所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
[0458] 关于BET1样多肽,优选剪接变体是SEQ ID NO:1所示的核酸的剪接变体,或编码SEQ ID NO:2的直向同源物或旁系同源物和/或具有如上文中定义的BET1样多肽的氨基酸序列的任何多肽的核酸的剪接变体。
[0459] 关于钙网蛋白多肽,优选剪接变体是SEQ ID NO:104所示的核酸的剪接变体,或编码SEQ ID NO:105的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列,当用于系统发生树例如Christensen等2008-图1中描述的并且在本文中于图5中再现的系统发生树的构建时,与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b、以及Os_CRT3或At_CRT3多肽的组,优选与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b的组
聚类。可选地,所述剪接变体编码多肽,所述多肽,当用于系统发生树,例如实施例2中描述的系统发生树的构建时,与下列系统发生类别中的任一多肽聚类:实施例2的类别1-CRT1、
2-CRT3,3-藻类,4-动物和5-原生生物,优选与类别1-CRT1多肽聚类。
[0460] 关于DUSL1多肽,优选剪接变体是SEQ ID NO:258所示的核酸序列的剪接变体,或编码SEQ ID NO:259的直向同源物或旁系同源物的核酸序列的剪接变体。优选,所述剪接变体是编码多肽序列的核酸序列的剪接变体,所述多肽序列按照递增的优选次序包含与SEQ ID NO:294所示的tRNA二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。更优选,所述剪接变体是编码多肽序列的核酸序列的剪接变体,所述多肽序列按照递增的优选次序包含与SEQ ID NO:259所示的DUS1L多肽或与本文中表A3所给出的任何多肽序列至少30%、35%、40%、45%、
50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。最优选,剪接变体是SEQ ID NO:258所示的核酸序列或编码SEQ ID NO:259所示的多肽序列的核酸序列的剪接变体。
[0461] 关于ES43样多肽,优选剪接变体是SEQ ID NO:298所示的核酸的剪接变体,或编码SEQ ID NO:299的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列包含BAH或PHD结构域或这两个结构域。
[0462] 关于HON5样多肽,优选剪接变体是SEQ ID NO:387所示的核酸的剪接变体,或编码SEQ ID NO:388的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列包含如上述的基序I、II或III的任一个或多个。
[0463] 关于GSA1多肽,优选剪接变体是SEQ ID NO:417所示的核酸的剪接变体,或编码SEQ ID NO:418的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列,当用于系统发生树,例如图17中描述的系统发生树的构建时,与包含SEQ ID NO:418所示的氨基酸序列的GSA1多肽的组而非与任何其他组聚类。
[0464] 可以用于实施本发明方法的另一种核酸变体是编码上文中定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸的等位基因
变体,等位基因变体如本文中所定义的。
[0465] 根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分表A所给出的任一核酸的等位基因变体,或包括向植物中引入和表达编码实施例部分表A所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位基因变体。
[0466] 关于BET1样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:2的BET1样多肽及实施例部分表A1中描述的任何氨基酸序列具有基本上相同的生物活性。
等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:1的等位基因变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位基因变体。
[0467] 关于钙网蛋白多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:105的钙网蛋白多肽及实施例部分表A2中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:104的等位基因变体,或编码SEQ ID NO:105的直向同源物或旁系同源物的核酸的等位基因变体。优选,由所述等位基因变体编码的氨基酸序列,当用于系统发生树例如Christensen等.2008-图1中描述的并且在本文中于图5中再现的系
统发生树的构建时,与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b、以及Os_CRT3或At_
CRT3多肽的组,优选与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b的组聚类。可选地,
所述等位基因变体编码多肽,所述多肽,当用于系统发生树,例如实施例2中描述的系统发生树的构建时,与下列系统发生类别中的任一多肽聚类:实施例2的类别1-CRT1、2-CRT3,
3-藻类,4-动物和5-原生生物,优选与类别1-CRT1多肽聚类。
[0468] 关于DUSL1多肽,用于本发明方法的等位基因变体与SEQ ID NO:259的DUS1L多肽及实施例部分表A3中描述的任何多肽序列具有基本上相同的生物活性。等位基因变体
天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选地,等位基因变体为多肽序列的等位基因变体,所述多肽序列按照递增的优选次序包含与SEQ ID NO:294所示的tRNA二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、85%、90%、
95%、98%、99%或更高的氨基酸序列同一性。更优选,所述等位基因变体是编码多肽序列的等位基因变体,所述多肽序列按照递增的优选次序包含与SEQ ID NO:259所示的DUS1L多肽或本文中表A3所给出的任何多肽序列至少30%、35%、40%、45%、50%、55%、60%、
65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。最优选,所述等位基因变体是SEQ ID NO:258的等位基因变体或编码SEQ ID NO:259的直向同源物或旁系同源物的核酸序列的等位基因变体。
[0469] 关于ES43样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:299的ES43样多肽及实施例部分表A4中描述的任何氨基酸具有基本上相同的生物活性。
等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:298的等位基因变体,或编码SEQ ID NO:299的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列包含BAH或PHD结构域或这两个结构域。
[0470] 关于HON5样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:388的HON5样多肽及实施例部分表A5中描述的任何氨基酸具有基本上相同的生物活性。
等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:387的等位基因变体,或编码SEQ ID NO:388的直向同源物或旁系同源物的核酸的等位基因变体。优选,由所述等位基因变体编码的氨基酸序列包含如上述的基序I、II或III的任一个或多个。
[0471] 关于GSA1多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:418的GSA1多肽及实施例部分表A6中描述的任何氨基酸具有基本上相同的生物活性。等
位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:417的等位基因变体,或编码SEQ ID NO:418的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于系统发生树,例如图17中描述的系统发生树的构建时,与包含SEQ ID NO:418所示的氨基酸序列的GSA1多肽而非与任何其他组聚类。
[0472] 基因改组或定向进化也可用于产生编码上文所定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸的变体;术语“基因改组”如本文所定义。
[0473] 根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分表A1至A6所给出的任一核酸序列的变体,或包括向植物中引入和表达编码实施例部分表A1至A6所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的
核酸的变体,所述变体核酸通过基因改组获得。
[0474] 关于BET1样多肽,优选通过基因改组获得编码氨基酸序列的变体核酸。
[0475] 关于钙网蛋白多肽,优选地,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于系统发生树例如Christensen等.2008的图1中描述的并且在本文中于图5中再现的系统发生树的构建时,与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b、以及Os_CRT3或At_CRT3多肽的组,优选与At_CRT1a或At_CRT1b、Os_CRT1a或Os_CRT1b的组聚类。可选
地,所述变体核酸编码多肽,所述多肽,当用于系统发生树,例如实施例2中描述的系统发生树的构建时,与下列系统发生类别中的任一多肽聚类:实施例2的类别1-CRT1、2-CRT3,
3-藻类,4-动物和5-原生生物,优选与类别1-CRT1多肽聚类。
[0476] 关于DUSL1多肽,通过基因改组获得的变体核酸序列编码多肽序列,所述多肽序列按照递增的优选次序包含与SEQ ID NO:294所示的tRNA二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。更优选,通过基因改组获得的变体核酸序列编码多肽序列,所述多肽序列按照递增的优选次序包含与SEQ ID NO:259所示的DUS1L多肽或本文中表A3所给出的任何多肽序列至
少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、
99%或更高的氨基酸序列同一性。最优选,通过基因改组获得的核酸序列编码SEQ ID NO:
259所示的多肽序列。
[0477] 关于ES43样多肽,优选地,由通过基因改组获得的变体核酸编码氨基酸序列,优选编码包含BAH或PHD结构域或这两个结构域的蛋白质。
[0478] 关于HON5样多肽,优选地,由通过基因改组获得的变体核酸编码的氨基酸序列包含如上述的基序I、II或III的任一个或多个。
[0479] 关于GSA1多肽,优选地,由通过基因改组获得的变体核酸编码的氨基酸序列,当于系统发生树,例如图17中描述的系统发生树的构建时,与包含SEQ ID NO:418所示的氨基酸序列的GSA1多肽的组而非与任何其他组聚类。
[0480] 此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编辑)。
[0481] 编码BET1样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码BET1样多肽的核酸可以来自植物,更优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸来自玉蜀黍(Zea mays)。
[0482] 编码钙网蛋白多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码钙网蛋白多
肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自茄科(Solanaceae)或来自
杨柳科(Salicaceae),特别是来自杨属(Populus)物种,最优选核酸来自番茄(Solanum
lycopersicum)或来自毛果杨(Populus trichocarpa)。
[0483] 编码DUS1L多肽的核酸序列可以源自任何天然或人工来源。该核酸序列可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。编码DUS1L多肽的核酸序列可以来自藻类。编码DUS1L多肽的核酸序列可以来自植物,更优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸序列来自甘蔗(Saccharum officinarum)。
[0484] 编码ES43样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选编码ES43样多肽的核酸来自植物,更优选来自单子叶植物,更优选来自禾本科,最优选核酸来自稻(Oryza sativa)。
[0485] 编码HON5样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码HON5样多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自杨柳科,最优选核酸来自毛果杨。
[0486] 编码GSA1多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选编码GSA1多肽的核酸来自
植物,更优选来自单子叶植物或双子叶植物,更优选来自杨属。
[0487] 本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
[0488] 本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子,并且本发明方法的实施导致与对照植物的种子产量相比较具有增加的种子产量的植物。
[0489] 以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数(表达为饱满种子数占一级圆锥花序数(primarypanicles)的比率)、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。
[0490] 本发明提供了相对于对照植物增加植物的产量,特别地种子产量的方法,所述方法包括调节编码本文所定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸在植物中的表达。
[0491] 由于本发明的转基因植物具有增强的产量和/或产量相关性状,故,相对于对照植物在其生命周期的相应阶段的生长速率而言,这些植物可能呈现增加的生长速率(至少在其部分生命周期中)。
[0492] 增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映增加的(早期)活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可
能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得;延迟的开
花通常并非作物中的期望性状)。如果生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每英亩年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生
长和收获的次数增加)。与野生型对应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的
环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小的90%所需的时间)等等。
[0493] 根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,本发明提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸在植物中的表达。
[0494] 相对于对照植物而言产量和/或生长速率的增强可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意
义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、
35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁
迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。生物胁迫通常是由病原体,例如细菌、病毒、真菌、线虫和昆虫等引起的胁迫。术语“非胁迫”条件如本文中所使用的是指允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。术语非胁迫条件在本文中涵盖植物接触到的偶尔或日常的轻度胁迫(如本文中所定义),但不包括重度胁迫。
[0495] 特别地,可在非胁迫条件下或在轻度干旱条件下进行本发明方法以产生相对于对照植物具有增加的产量的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至
少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
[0496] 如本文所定义的术语“非生物胁迫”应理解为表示如下之任何一种或多种:水胁迫(由于干旱或过量的水);缺氧胁迫;盐胁迫;温度胁迫(由于热、冷或冰冻温度)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,非生物胁迫是渗透胁迫,选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选,水胁迫是干旱胁迫。术语盐胁迫不局限于氯化钠(NaCl),而可以是由如下一种或多种盐引起的任何胁迫:NaCl、KCl、LiCl、MgCl2、CaCl2等等
[0497] 实施本发明方法产生,在非胁迫条件下或在轻度干旱条件下生长时相对于在相当条件下生长的对照植物具有增加的产量的植物。因此,根据本发明,提供了用于在非胁迫条件下或轻度干旱条件下生长的植物中增加产量和/产量相关性状的方法,所述方法包括调节编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸在植物中的表达。
[0498] 关于DUSL1多肽,实施本发明方法产生,相对于在相当的胁迫条件下生长的对照植物,在非生物胁迫条件下具有增强的产量相关性状的植物。因此,根据本发明,提供了用于在非生物胁迫条件下生长的植物中增强产量相关性状的方法,所述方法包括增加编码DUS1L多肽的核酸序列在植物中的表达。根据本发明的一个方面,非生物胁迫是渗透胁迫,选自如下一种或多种:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
[0499] 非生物环境胁迫的另一实例是植物为生长和发育而需要同化的一种或多种养分的可利用率减小。由于养分利用效率对植物产量和产品质量的强烈影响,有大量化肥倾倒在田间以优化植物生长和品质。植物生产力一般受限于三种主要养分:磷、钾和氮,而这三者中氮通常是植物生长的限速元素。因此,氮(N)是植物生长所需的主要营养素。它
是活细胞中的众多重要化合物(包括氨基酸、蛋白质(酶)、核酸和叶绿素)的组成成分。
1.5%-2%的植物干物质是氮,约合16%的植物总蛋白质。因而,氮利用率是作物植物生长和生产的主要限制因素(Frink等(1999)Proc Natl Acad Sci USA96(4):1175-1180),而且对蛋白质累积和氨基酸组成也具有重大影响。因此,在限氮条件下生长时具有增强的产量相关性状的作物植物具有重大意义。
[0500] 实施本发明方法产生在养分缺乏的条件下、特别是氮缺乏条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在养分缺乏条件下生长的植物中增加产量的方法,所述方法包括调节编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸在植物中的表达。养
分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
[0501] 实施本发明方法产生在盐胁迫的条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在盐胁迫的条件下生长的植物中增加产量的方法,所述方法包括调节编码BET1样多肽或钙网蛋白多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸在植物中的表达。术语盐胁迫不局限于氯化钠(NaCl),而可以是由如下一种或多种盐引起的:NaCl、KCl、LiCl、MgCl2、CaCl2等。
[0502] 本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有有效地连接于在植物中具有功能的启动子上的、编码如上文所定义的BET1
样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸转
基因。
[0503] 本发明还提供遗传构建体和载体,以利于编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸在植物中的引入和/或表达。可
以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体(可
商购获得)中。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
[0504] 更特别地,本发明提供这样的构建体,其含有:
[0505] (a)编码如上文所定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸;
[0506] (b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
[0507] (c)转录终止序列。
[0508] 优选地,编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
[0509] 关于DUS1L多肽,构建体的一个控制序列优选是分离自植物基因组的组成型启动子。植物组成型启动子的一个实例是GOS2启动子,优选来自稻的GOS2启动子,最优选如SEQ ID NO:295所示的GOS2序列。.
[0510] 可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。目的序列将有效连接于一个或多个控制序列(至少连接于启动子)。
[0511] 有利地,可以使用任何类型的天然或合成启动子来驱动核酸序列的表达,但优选启动子是植物来源的。组成型启动子在本发明方法中特别有用,优选组成型启动子也是中等强度的遍在启动子。有关各种启动子类型的定义,参见本文中“定义”部分。
[0512] 关于DUS1L多肽,有利地,可以使用任何类型的天然或合成启动子来增加核酸序列的表达。组成型启动子在本发明方法中特别有用,优选分离自植物基因组的组成型启动子。该植物组成型启动子可以以在所有情况下均比在35S CaMV病毒启动子控制下所获得的水平低的水平驱动编码序列表达。这样的启动子的实例是SEQ ID NO:295所示的GOS2
启动子。
[0513] 关于DUS1L多肽,器官特异性启动子,例如用于在叶、茎、块茎、分生组织、种子中优先表达的启动子,可用于实施本发明方法。发育调控型和诱导型启动子也可用于实施本发明方法。有关各种启动子类型的定义,参见本文“定义”部分。
[0514] 关于BET1样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:1所示的BET1样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的BET1样多肽编码核酸的表达。
[0515] 所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:103基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:103所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
[0516] 任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:103基本上相似的GOS2启动子和编码BET1样多肽的核酸。
[0517] 关于钙网蛋白多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:104所示的钙网蛋白多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的钙网蛋白多肽编码核酸的表达。
[0518] 所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。甚至更优选,组成型启动子为与SEQ ID NO:257基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:257所示。有关组成型启动子的其他实例参见本文中“定义”部分。
[0519] 任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:257基本上相似的GOS2启动子和编码钙网蛋白多肽的核酸的表达盒。
[0520] 关于DUS1L多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:258所示的DUS1L多肽编码核酸序列,而且本发明的实施也不局限于由组成型启动子所驱动的编码
DUS1L多肽的核酸序列的表达。.
[0521] 任选的,可以在引入植物的构建体中使用一个或多个终止子序列。
[0522] 关于ES43样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:298所示的编码ES43样多肽的核酸,而且本发明的实施也不局限于由组成型启动子所驱动的编码ES43样多肽的核酸的表达。
[0523] 所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选,组成型启动子为与SEQ ID NO:386基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:386所示。有关组成型启动子的其他实例参见本文中“定义”部分。
[0524] 任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:386基本上相似的GOS2启动子和编码ES43样多肽的核酸。
[0525] 关于HON5样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:387所示的编码HON5样多肽的核酸,而且本发明的实施也不局限于由组成型启动子所驱动或由根特异性启动子所驱动的编码HON5样多肽的核酸的表达。
[0526] 所述组成型启动子优选是中等强度启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:416基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:416所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
[0527] 任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:416基本上相似的GOS2启动子和编码HON5样多肽的核酸。
[0528] 关于GSA1多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:417所示的编码GSA1多肽的核酸,而且本发明的实施也不局限于由组成型启动子所驱动的编码GSA1多肽的核酸的表达。
[0529] 所述组成型启动子优选是中等强度启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:492基本上相似的核酸序列,最优选组合成型启动子如SEQ ID NO:492所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
[0530] 任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:492基本上相似的GOS2启动子和编码GSA1多肽的核酸。
[0531] 另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
[0532] 本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)
在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
[0533] 为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因,可从转基因细胞中将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
[0534] 已知对于核酸序列在植物细胞中的稳定或瞬时整合,取决于所用的表达载体和所用的转染技术,仅少数细胞可以摄入外来DNA,以及如果期望的话整合进其基因组。为鉴定并选择这些整合体,通常将编码可选择标记(例如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够在例如如下突变体中使用,所述突变体中原有的这些基因例如通过常规方法缺失而丧失功能。此外,编码可选择标记的核酸序列分子可与编码本发明多肽的或用于本发明方法的序列包含在同一个载体中,或者在分开的载体中引入宿主细胞。已经稳定转染了所引入的核酸序列的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。标记基因一旦不再需要,可以从转基因细胞中除去或切除。用于标记基因去除的技术在本领域公知,有用的技术在上文“定义”部分有说明。
[0535] 本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的任何核酸。
[0536] 更具体地,本发明提供了产生具有增强的产量相关性状,特别是增加的(种子)产量的转基因植物的方法,所述方法包括:
[0537] (i)向植物或植物细胞中引入和表达编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸;和
[0538] (ii)在促进植物生长和发育的条件下培养所述植物细胞。
[0539] (i)中的核酸可以为任何能够编码如本文定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸。
[0540] 可以将核酸直接引入植物细胞或植物本身(包括引入植物的组织、器官或任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
[0541] 遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者 和Willmitzer的出版物。
[0542] 通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记例如上文所述标记的存在。
[0543] DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普
通技术人员所公知的。
[0544] 产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
[0545] 本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及其所有的植物部分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与根据本发明方法所产生的亲本呈现相同的基因型和/或表型特征。
[0546] 本发明也包括包含编码上文所定义的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的分离核酸的宿主细胞。根据本发明优选的宿
主细胞是植物细胞。对于根据本发明方法所用的核酸或载体、表达盒或构建体或载体,宿主植物原则上有利地为能够合成本发明方法中所用的多肽的所有植物。
[0547] 本发明方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于植物界超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或牧草豆科植物、观赏植物、粮食作物、乔木或灌木。根据本发明优选的实施方案,植物为作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜籽、亚麻籽(linseed)、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩特小麦(spelt)、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高粱(milo)和燕麦。
[0548] 本发明也延及植物的可收获部分,例如但不限于:种子、叶、果实、花、茎、根、根茎、块茎和球茎,所述可收获部分含有编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的重组核酸。本发明还涉及由这样的植物的可收获部
分衍生的、优选直接衍生的产品,如干丸(pellets)或粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
[0549] 根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
[0550] 如上文所述,调节编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸表达的一个优选方法是,在植物中引入和表达编码BET1
样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸;然
而,实施所述方法的效果,即增强产量相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标记、TILLING、同源重组。这些技术的说明在“定义”部分提供。
[0551] 本发明还包括在增强植物的任一上述产量相关性状中编码如本文所述的BET1样多肽或钙网蛋白多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸的用途,以及这些
BET1样多肽或钙网蛋白多肽或ES43样多肽或HON5样多肽或GSA1多肽的用途。
[0552] 本发明还包括编码如本文所述DUS1L多肽的核酸序列的用途,以及这些DUS1L多肽的用途:用于在正常生长条件下、在非生物胁迫生长条件(优选渗透胁迫生长条件)下、和在养分可利用率减小的生长条件下、优选在氮可利用率减小的条件下,增强植物的任一上述产量相关性状。
[0553] 可以在育种程序中使用编码本文所述的BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸、或所述BET1样多肽或钙网蛋白多肽
或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽本身,其中鉴定可以与编码BET1
样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的基因遗
传连的DNA标记。可以使用所述核酸/基因或所述BET1样多肽或钙网蛋白多肽或DUS1L
多肽或ES43样多肽或HON5样多肽或GSA1多肽本身来定义分子标记。接着可以在育种程
序中使用此DNA或蛋白质标记,以在本发明方法中选择具有如上文所定义的增强的产量相关性状的植物。
[0554] 编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增强的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
[0555] 编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸还可以用作探针,对包含其的基因进行遗传和物理作图,以及用作与这些基因连锁的性状的标记。这样的信息可以在植物育种中使用,以培育具有所期望表型的株系。编码BET1样多肽或钙网蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1
多肽的核酸的这类应用仅需要长度至少15个核苷酸的核酸序列。编码BET1样多肽或钙网
蛋白多肽或DUS1L多肽或ES43样多肽或HON5样多肽或GSA1多肽的核酸可以用作限制性
片段长度多态性(RFLP)标记。可以用POI编码核酸探测限制酶切消化的植物基因组DNA
的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手
册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生
的带型进行遗传分析,以构建遗传图谱。另外,所述核酸可用于探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码BET1样多肽或钙网蛋白多肽或DUS1L多肽
或ES43样多肽或HON5样多肽或GSA1多肽的核酸在先前用此群体所获得的遗传图谱中的
位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
[0556] 有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
[0557] 核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第
319-346页,及其中引用的参考文献)。
[0558] 在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆
(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
[0559] 用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和
Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。
在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
[0560] 本发明方法导致具有如前文所述增强的产量相关性状的植物。这些性状还可以组合其它经济上有利的性状,例如其它产量增强性状、对非生物和生物胁迫的耐受性、对除草剂、杀昆虫剂的耐受性、改变各种构造特征和/或生物化学和/或生理学特征的性状。附图说明
[0561] 现参考以下附图描述本发明,其中:
[0562] 图1显示SEQ ID No:2序列的结构域结构,突出显示保守CC结构域(粗体)和基序1(下划线)。
[0563] 图2显示BET1样多肽的多重比对。
[0564] 图3显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加BET1样编码核酸在稻中的表达。
[0565] 图4显示钙网蛋白多肽的多重比对。在共有序列上指出钙网蛋白多肽的结构特征性元件。
[0566] 图5显示由Christensen等.2008图1A描述的系统发生树。
[0567] 图6显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加钙网蛋白编码核酸在稻(Oryza sativa)中的表达。术语“钙网蛋白”在本图中被用来指表A2的任一核酸
序列,番茄_TA36564或毛果杨_133.107。
[0568] 图7显示由DUS酶催化的化学反应(根据Bishop等.(2002)J Biol Chem277(28):25000-25006)。
[0569] 图8是一般大肠杆菌tRNA的二维描述,显示了D环核苷酸。显示了保守D环碱基(R,嘌呤)。可包含D的位置显示为X并且用箭头酶指出(根据Bishop等.(2002)J Biol
Chem 277(28):25000-25006)。
[0570] 图9显示来自表A3的DUS1L多肽的AlignX(来自Vector NTI 10.3,InvitrogenCorporation)多重序列比对。一个重要的结构域是具有InterPro登录号IPR001269(整合
PFAM PF01207登录号(由X标记))的tRNA二氢尿苷合酶结构域。一个重要的基序是具
有InterPro登录号IPR018517(整合PROSITE PS01136(由X标记,在SEQ ID NO:Sacof_
DUS1L中以粗体显示)的tRNA二氢尿苷合酶保守位点。保守残基加框突显,特别是在其他
生物中作为关键的广义酸/碱催化剂的Cys残基。
[0571] 图10显示双元载体,用于在于植物中具有功能的启动子控制之下增加DUS1L多肽编码核酸序列在稻中的表达。
[0572] 图11显示SEQ ID NO:299所示的ES43样多肽的氨基酸序列,BAH结构域以粗体显示并且PHD结构域以下划线标示。
[0573] 图12显示ES43样的多重比对。
[0574] 图13显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加ES43样编码核酸在稻中的表达。
[0575] 图14显示HON5样多肽的多重比对。HI/H5结构域示于括号之间并且AT hook结构域用矩形标示。
[0576] 图15显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加SEQ ID NO:387所示的HON5样编码核酸在稻中的表达。
[0577] 图16显示GSA1样序列的多重比对。
[0578] 图17显示GSA1样序列的系统发生树。
[0579] 图18显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加GSA1编码核酸在稻(Oryza sativa)中的表达。
[0580] 项目
[0581] 1.BET1样多肽
[0582] 1.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码BET1样多肽的核酸的表达,其中所述BET1样多肽包含CC结构域,所述CC结构域:
[0583] (i)如SEQ.ID NO:97所示;和/或
[0584] (ii)优选与由SEQ ID NO 98所示的CC结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、
69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、
84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或
99%的序列同一性。
[0585] 2.根据项1的方法,其中所述CC结构域包含下列基序中的一个或多个:
[0586] (i)基序1:G(W/Y)CD(E/K)(SEQ ID NO:99);
[0587] (ii)基序2:EGF(SEQ ID NO:100)。
[0588] 3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码BET1样多肽的核酸来实现。
[0589] 4.根据项1至3的任一项的方法,其中所述编码BET1-样多肽的核酸编码表A1所列的任一蛋白质,或是这样的核酸的部分、或是能够与这样的核酸杂交的核酸。
[0590] 5.根据项1至4的任一项的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
[0591] 6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,例如增加的生物量和/或增加的种子产量。
[0592] 7.根据项1至6的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
[0593] 8.根据项1至6的任一项的方法,其中在干旱胁迫和/或氮缺乏条件下获得所述增强的产量相关性状。
[0594] 9.根据项3至8的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
[0595] 10.根据项1至9的任一项的方法,其中所述编码BET1样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自禾本科,更优选来自玉蜀黍属(Zea),最优选来自玉蜀黍。
[0596] 11.可通过根据项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码BET1样多肽的重组核酸。.
[0597] 12.构建体,其包含:
[0598] (a)编码如项1或2中定义的BET1样多肽的核酸;
[0599] (b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
[0600] (c)转录终止序列。
[0601] 13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
[0602] 14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
[0603] 15.利用根据项12或13的构建体转化的植物、植物部分或植物细胞。
[0604] 16.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
[0605] (i)向植物中引入和表达编码如项1或2中定义的BET1样多肽的核酸;和
[0606] (ii)在促进植物生长和发育的条件下培养所述植物细胞。
[0607] 17.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码项1或2中定义的BET1样多肽的核酸的被调节的表达而产生。
[0608] 18.根据项11、15或17的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜、或单子叶植物或谷类植物,例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
[0609] 19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
[0610] 20.从根据项18的植物和/或从根据项19的植物的可收获部分得到的产品。
[0611] 21.编码BET1样多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
[0612] 22.分离的核酸分子,其选自:
[0613] (i)SEQ ID NO:11或95的任一个所示的核酸;
[0614] (ii)SEQ ID NOs:11和95的任一个所示的核酸的互补序列;
[0615] (iii)编码SEQ ID NO:12和96的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQ ID NO:12和96的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0616] (iv)核酸,其按照递增的优选次序与表A1的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0617] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0618] (vi)编码BET1样多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:12和96的任一个所示的氨基酸序列以及表A1中任何其他氨基酸序列具有至少50%、51%、
52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、
67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、
82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0619] 23.分离的多肽,其选自:
[0620] (i)SEQ ID NO:12和96的任一个所示的氨基酸序列;
[0621] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:12和96的任一个所示的氨基酸序列以及表A1中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0622] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0623] 2.钙网蛋白多肽
[0624] 1.用于相对于对照植物增强植物的产量相关性状的方法,其包括调节钙网蛋白多肽编码核酸在植物中的表达。
[0625] 2.根据项1的方法,其中所述钙网蛋白多肽包含一个或多个下列基序:
[0626] (i)基序3:PXXIXDPXXKKPEXWDD(SEQ ID NO:246),
[0627] (ii)基序4:GXWXXXXIXNPXYK(SEQ ID NO:247),
[0628] (iii)基序5:E[VL]WQVK(SEQ ID NO:248),
[0629] (iv) 基 序 6:TLV[FL]QFSVKHEQKLDCGGGY[MV]KLLSGDVDQKKFGG[DE]TPYSIMFGPDICGY(SEQ ID NO:249),其代表CRT1/2组的典型CRT植物多肽;
[0630] (v) 基 序 7:TPYS[LF]MFGPD[IL]CGTQTKKLH[VL]ILSYQGQNYPIKKDL[QE]CETDKLTH[FV]YTFI(SEQ ID NO:250),其代表CRT3组的典型CRT植物多肽;
[0631] (vi)基 序8:N[HY][LP]IKK[DE][VL]PCETD[QK]LTH[VF]YTFI[LI]RPDA[TS]YSILI DN[VR]E[KR][QE][TS]GS[LM]Y[TS]DWD[IL]L(SEQID NO:251),其代表植物界的典型CRT多肽;
[0632] (vii)基序9:QKKFGGDTPYSIMFGPDICGY[SQ]TKK[VL]H[AV]I(SEQ ID NO:252),其代表真核生物来源的典型CRT多肽,
[0633] (viii)具有与基序(i)至(vii)的任一个至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、
70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的全序列同一性的基序;
[0634] 其中“X”表示任意氨基酸并且其中括号“[ ]”之间显示的氨基酸为在该位置上的可选氨基酸。
[0635] 3.根据项1或2的方法,其中所述经调节的表达通过在植物中引入和表达编码钙网蛋白多肽的核酸来实现。
[0636] 4.根据项1至3的任一项的方法,其中所述编码钙网蛋白多肽的核酸编码表A2中所列的任一蛋白质、或为这样的核酸的部分、或为能够与这样的核酸杂交的核酸。
[0637] 5.根据项1至4的任一项的方法,其中所述核酸序列编码表A2所给出的任何蛋白质的直向同源物或旁系同源物。
[0638] 6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,增加的种子产量。
[0639] 7.根据项1至6的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
[0640] 8.根据项1至6的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状。
[0641] 9.根据项3至8的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
[0642] 10.根据项1至9的任一项的方法,其中所述编码钙网蛋白多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自茄科,更优选来自茄属(Solanum),最优选来自番茄。
[0643] 11.可通过项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码钙网蛋白多肽的重组核酸。
[0644] 12.构建体,其包含:
[0645] (i)编码如项1或2中定义的钙网蛋白多肽的核酸;
[0646] (ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
[0647] (iii)转录终止序列。
[0648] 13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
[0649] 14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
[0650] 15.利用根据项12或13的构建体转化的植物、植物部分或植物细胞。
[0651] 16.用于产生相对于对照植物具有增加的产量,尤其是增加的种子产量的转基因植物的方法,其包括:
[0652] (i)向植物中引入和表达编码如项1或2中定义的钙网蛋白多肽的核酸;和
[0653] (ii)在促进植物生长和发育的条件下培养所述植物细胞。
[0654] 17.相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码项1或2中定义的钙网蛋白多肽的核酸的被调节的表达而产生。
[0655] 18.根据项11、15或17的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜,或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
[0656] 19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
[0657] 20.从根据项18的植物和/或从根据项19的植物的可收获部分得到的产品。
[0658] 21.编码钙网蛋白多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
[0659] 22.分离的钙网蛋白核酸分子,其选自:
[0660] (i)SEQ ID NO:116、130、140、198和228的任一个所示的核酸
[0661] (ii)SEQ ID NO:116、130、140、198和228的任一个所示的核酸的互补序列;
[0662] (iii)编码SEQ ID NO:117、131、141、199和229的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQID NO:117、131、141、199和229的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0663] (iv)核酸,其按照递增的优选次序与表A2的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0664] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0665] (vi)编码钙网蛋白多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:117、131、141、199和229的任一个所示的氨基酸序列以及表A2中任何其他氨基酸序列具有至
少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、
65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、
80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0666] 23.分离的钙网蛋白多肽,其选自:
[0667] (i)SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列;
[0668] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:117、131、141、199和229的任一个所示的氨基酸序列以及表A2中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、
68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0669] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0670] 3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[0671] 1.用于相对于对照植物增强植物的产量相关性状的方法,其包括增加编码tRNA二氢尿苷合酶1样(DUS1L)多肽的核酸序列在植物中的表达,所述DUS1L多肽包含(i)具
有InterPro登录号IPR001269的tRNA-二氢尿苷合酶结构域;(ii)具有InterPro登录号
IPR013785的醛缩酶型TIM桶结构域;和(iii)具有InterPro登录号IPR018517的tRNA二
氢尿苷合酶保守位点,和任选地选择具有增强的产量相关性状的植物。
[0672] 2.根据项1的方法,其中所述DUS1L多肽包含:(i)按照递增的优选次序与SEQ ID NO:294所示的tRNA-二氢尿苷合酶结构域至少50%、55%、60%、65%、70%、75%、80%、5%、90%、95%、98%、99%或更高的氨基酸序列同一性。
[0673] 3.根据项2的方法,其中所述DUS1L多肽还包含按照递增的优选次序与SEQ IDNO:259所示的多肽至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、
85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
[0674] 4.根据任何前述项的方法,其中所述DUS1L多肽按照递增的优选次序与本文中表A3所给出的任何多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
[0675] 5.根据任何前述项的方法,其中所述DUS1L多肽可在功能上补充在tRNA二氢尿苷合酶活性上有缺陷的大肠杆菌菌株,从而增加tRNA二氢尿苷含量。
[0676] 6.根据任何前述项的方法,其中所述编码DUS1L多肽的核酸序列由表A3所给出的任一核酸序列SEQ ID NO所示、或为其部分、或为能够与表A3所给出的任一核酸序列或其互补序列杂交的序列。
[0677] 7.根据任何前述项的方法,其中所述核酸序列编码表A3所给出的任何SEQ ID NO多肽序列的直向同源物或旁系同源物。
[0678] 8.根据任何前述项的方法,其中所述增加的表达通过:T-DNA激活标记、TILLING或同源重组中的任一个或多个实现。
[0679] 9.根据任何前述项的方法,其中所述增加的表达通过在植物中引入和表达编码DUS1L多肽的核酸序列来实现。
[0680] 10.根据任何前述项的方法,其中所述增加的产量相关性状是如下的一个或多个:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
[0681] 11.根据任何前述项的方法,其中所述产量相关性状在生长于养分可利用率减小的条件下,特别是氮可利用率减小的条件下的植物中相对于对照植物增加。
[0682] 12.根据任何前述项的方法,其中所述核酸序列有效地连接至组成型启动子。
[0683] 13.根据项11的方法,其中所述组成型启动子是GOS2启动子,优选来自稻的GOS2启动子,最优选如SEQ ID NO:295所示的GOS2序列。
[0684] 14.根据任何前述项的方法,其中所述编码DUS1L多肽的核酸序列来自植物,更优选来自单子叶植物,更优选来自禾本科,最优选所述核酸序列来自甘蔗。
[0685] 15.可根据任何前述项的方法获得的植物、其部分(包括种子)或植物细胞,其中所述植物、其部分或细胞包含编码DUS1L多肽的分离的核酸转基因。
[0686] 16.分离的核酸分子,其选自:
[0687] (i)SEQ ID NO:264或SEQ ID NO:292所示的核酸序列;
[0688] (ii)如SEQ ID NO:264或SEQ ID NO:292所示的核酸序列的互补序列;
[0689] (iii)编码DUS1L多肽的核酸序列,所述多肽按照递增的优选次序与如SEQ IDNO:265或SEQ ID NO:293所示的多肽序列具有至少30%、35%、40%、45%、50%、55%、
60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性。
[0690] 17.分离的多肽,其选自:
[0691] (i)如SEQ ID NO:265或SEQ ID NO:293所示的多肽序列;
[0692] (ii)多肽序列,所述多肽序列按照递增的优选次序与如SEQ ID NO:265或SEQID NO:293所示的多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、
75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性;
[0693] (iii)上文(i)或(ii)所给出的任何多肽序列的衍生物。
[0694] 18.构建体,其包含:
[0695] (a)项1至7或16的任一项中定义的编码DUS1L多肽的核酸序列;
[0696] (b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
[0697] (c)转录终止序列。
[0698] 19.根据项18的构建体,其中所述控制序列是组成型启动子。
[0699] 20.根据项19的构建体,其中所述组成型启动子是GOS2启动子,优选来自稻的GOS2启动子,最优选如SEQ ID NO:295所示的GOS2序列。
[0700] 21.根据项18或20的构建体在用于制备相对于对照植物具有增强的产量相关性状的植物的方法中的用途,所述增强的产量相关性状是如下的一个或多个:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
[0701] 22.利用根据项18至20的任一项的构建体转化的植物、植物部分或植物细胞。
[0702] 23.用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,其包括:
[0703] (i)向植物、植物部分或植物细胞中引入和表达如项1至7或16的任一项中定义的编码DUS1L多肽的核酸序列;和
[0704] (ii)在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。
[0705] 24.相对于对照植物具有增强的产量相关性状的转基因植物,或源自所述转基因植物的转基因植物细胞或转基因植物部分,所述增强的产量相关性状因项1至7或16的任一项中定义的编码DUS1L多肽的分离核酸序列的增加表达而产生。
[0706] 25.根据项15、22或24的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜,或单子叶植物或谷类植物例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、埃塞俄比亚画眉草、甘蔗和燕麦。
[0707] 26.根据项25的植物的包含编码DUS1L多肽的分离核酸序列的可收获部分,其中所述可收获部分优选是种子。
[0708] 27.从根据项25的植物和/或从根据项26的植物的可收获部分得到的产品。
[0709] 28.如项1至7或16的任一项中定义的编码DUS1L多肽的核酸序列在增强产量相关性状中的用途,所述增强的产量相关性状包括如下的一个或多个:增加的地上生物量、增加的每株植物的种子产量、增加的饱满种子数和增加的种子总数。
[0710] 4.ES43样多肽
[0711] 1.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码ES43样多肽的核酸的表达,其中所述ES43样多肽包含BAH结构域和PHD结构域。
[0712] 2.根据项1的方法,其中所述ES43样多肽包含具有按照递增的优选次序与SEQ ID NO:374(SEQ ID NO:299的BAH结构域)的氨基酸序列或与SEQ ID NO:375(SEQ ID NO:299的PHD结构域)的氨基酸序列至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、
74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列的结构域。
[0713] 3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码ES43样多肽的核酸来实现。
[0714] 4.根据项1至3的任一项的方法,其中所述编码ES43样多肽的核酸编码表A4所列的任一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
[0715] 5.根据项1至4的任一项的方法,其中所述核酸序列编码表A4中所给出的任何蛋白质的直向同源物或旁系同源物。
[0716] 6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
[0717] 7.根据项1至6的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
[0718] 8.根据项1至6的任一项的方法,其中在干旱胁迫和/或氮缺乏条件下获得所述增强的产量相关性状。
[0719] 9.根据项3至8的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
[0720] 10.根据权利要求1至9的任一项的方法,其中所述编码ES43样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
[0721] 11.可通过根据项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ES43样多肽的重组核酸。
[0722] 12.构建体,其包含:
[0723] (a)编码如项1或2中定义的ES43样多肽的核酸;
[0724] (b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
[0725] (c)转录终止序列。
[0726] 13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
[0727] 14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
[0728] 15.利用根据项12或13的构建体转化的植物、植物部分或植物细胞。
[0729] 16.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
[0730] (a)向植物中引入和表达编码如项1或2中定义的ES43样多肽的核酸;和
[0731] (b)在促进植物生长和发育的条件下培养所述植物细胞。
[0732] 17.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码项1或2中定义的ES43样多肽的核酸的被调节的表达而产生。
[0733] 18.根据项11、15或17的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜,或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
[0734] 19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
[0735] 20.从根据项18的植物和/或从根据项19的植物的可收获部分得到的产品。
[0736] 21.编码ES43样多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
[0737] 22.分离的核酸分子,其选自:
[0738] (i)SEQ ID NO:308、370和372的任一个所示的核酸;
[0739] (ii)SEQ ID NO:308、370和372的任一个所示的核酸的互补序列;
[0740] (iii)编码如SEQ ID NO:309、371和373的任一个所示的多肽的核酸,优选地作为遗传密码简并性的结果,所述分离的核酸可从SEQ ID NO:309、371和373的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0741] (iv)核酸,其按照递增的优选次序与表A4的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0742] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0743] (vi)编码ES43样多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:309、371和373的任一个所示的氨基酸序列以及表A4中任何其他氨基酸序列具有至少50%、
51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、
66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、
81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0744] 23.分离的多肽,其选自
[0745] (i)SEQ ID NO:309、371和373的任一个所示的氨基酸序列;
[0746] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:309,371和373的任一个所示的氨基酸序列以及表A4中任何其他氨基酸序列具有至少50%、51%、52%、53%、
54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、
69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、
84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或
99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0747] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0748] 5.HON5样多肽
[0749] 1.相对于对照植物增强植物的产量相关性状的方法,包括在植物中调节编码HON5样多肽的核酸的表达,其中所述HON5样多肽包含组蛋白H1/H5结构域(Pfam:
PF00538;Interpro:IPR005818)和至少2个,优选2、3、4、5、6或7个AT hook结构域(Pfam:
PF02178;InterPro:IPR000637)。
[0750] 2.根据项1的方法,其中所述HON5样多肽包含一个或多个下列基序:
[0751] (i)基序I(SEQ ID NO:411):Y[ASK]EMI[YC]TAI[AGT]AL[KN][ED][PK]DGSS[KR]RAI[AS][KR]YIERA[YF][TP][GD]LP[PS]AH[SD][AD]LLTHHLK[RT]L[KR]
[0752] (ii)基序II(SEQ ID NO:412):GLLV[ML]VK[KH]SYKL[AP][RS]S
[0753] (iii)基序III(SEQ ID NO:413):SA[PS][PQS]GQKRGRGRPPKPK
[0754] 其中括号之间的氨基酸为在该位点上的可选氨基酸。
[0755] 3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码HON5样多肽的核酸来实现。
[0756] 4.根据项1至3的任一项的方法,其中所述编码HON5样多肽的核酸编码表A5所列的任一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
[0757] 5.根据项1至4的任一项的方法,其中所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
[0758] 6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,例如增加的收获指数和/或增加的种子产量。
[0759] 7.根据项1至6的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
[0760] 8.根据项1至6的任一项的方法,其中在干旱胁迫、盐胁迫和/或氮缺乏条件下获得所述增强的产量相关性状。
[0761] 9.根据项3至8的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
[0762] 10.根据权利要求1至9的任一项的方法,其中所述编码HON5样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨属,最优选来自毛果杨。
[0763] 11.可通过根据项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码HON5样多肽的重组核酸。
[0764] 12.构建体,其包含:
[0765] (i)编码如项1或2中定义的HON5样多肽的核酸;
[0766] (ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
[0767] (iii)转录终止序列。
[0768] 13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
[0769] 14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的收获指数和/或增加的种子产量的植物的方法中的用途。
[0770] 15.利用根据项12或13的构建体转化的植物、植物部分或植物细胞。
[0771] 16.用于产生相对于对照植物具有增加的产量,特别是增加的收获指数和/或增加的种子产量的转基因植物的方法,其包括:
[0772] (i)向植物中引入和表达编码如项1或2中定义的HON5样多肽的核酸;和
[0773] (ii)在促进植物生长和发育的条件下培养所述植物细胞。
[0774] 17.相对于对照植物具有增加的产量,特别是增加的收获指数和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码项1或2中定义的HON5样多肽的核酸的被调节的表达而产生。
[0775] 18.根据项11、15或17的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜,或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
[0776] 19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
[0777] 20.从根据项18的植物和/或从根据项19的植物的可收获部分得到的产品。
[0778] 21.编码HON5样多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或收获指数中的用途。
[0779] 22.分离的核酸分子,其选自:
[0780] (i)SEQ ID NO:393和395的任一个所示的核酸;
[0781] (ii)SEQ ID NO:393和395的任一个所示的核酸的互补序列;
[0782] (iii)编码SEQ ID NO:394和396的任一个所示的多肽的核酸,优选地作为遗传密码的简并性的结果,所述分离的核酸可从SEQ ID NO:394和396的任一个所示的多肽序列推导而来,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0783] (iv)核酸,其按照递增的优选次序与表A5的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、
47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且还优选地,赋予相对于对照植物增强的产量相关性状;
[0784] (v)核酸分子,其在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状;
[0785] (vi)编码HON5样多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:394和396的任一个所示的氨基酸序列以及表A5中任何其他氨基酸序列具有至少50%、51%、
52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、
67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、
82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0786] 23.分离的多肽,其选自:
[0787] (i)SEQ ID NO:394和396的任一个所示的氨基酸序列;
[0788] (ii)氨基酸序列,其按照递增的优选次序与SEQ ID NO:394和396的任一个所示的氨基酸序列以及表A5中任何其他氨基酸序列具有至少50%、51%、52%、53%、54%、
55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、
70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性,并且优选赋予相对于对照植物增强的产量相关性状。
[0789] (iii)上述(i)或(ii)所给出的任何氨基酸序列的衍生物。
[0790] 6.谷氨酸-1-半醛转氨酶多肽(CSA1多肽)
[0791] 1.相对于对照植物增强植物的产量相关性状的方法,其包括在植物中调节编码GSA1多肽的核酸的表达,其中所述GSA1多肽包含结构域1至3中的一个或多个:
[0792] 结构 域1:VPS[IV]EMVRFVNSGTEAC[ML][GS][VA]LRL[AM]RA[FY]TGREK[IV][IL]K FEGCYHGHAD[PS]FLVK
[0793] 结构 域2:SPVRAFKSVGGQP[IV]V[FI]D[SR]VKG[SA][HRY][MA]WD[IV]DGN[EK]Y[I V]DYVGSWGPAIIGHADD
[0794] 结 构 域 3:AQEYFGITPD[LV]TT[LM]GK[IV]IGGGLPVGAYGG[RK][RK][ED]IMEMVA PAGPMYQAGTLS
[0795] 或按照递增的优选次序与结构域1至3的任一个或多个具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,
67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,
82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,
97%,98%、或99%的全序列同一性的结构域。
[0796] 2.根据项1的方法,其中所述调节的表达通过向植物中引入和表达编码GSA1多肽的核酸来实现。
[0797] 3.根据项1或2的方法,其中所述编码GSA1多肽的核酸编码表A6所列的任一蛋白质,或是这样的核酸的部分或能够与这样的核酸杂交的核酸。
[0798] 4.根据项1至3的任一项的方法,其中所述核酸序列编码表A6中所给出的任何蛋白质的直向同源物或旁系同源物。
[0799] 5.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,例如增加的生物量和/或增加的种子产量。
[0800] 6.根据项1至5的任一项的方法,其中在干旱胁迫条件下获得所述增强的产量相关性状。
[0801] 7.根据项2至6的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
[0802] 8.根据权利要求1至7的任一项的方法,其中所述编码GSA1多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨柳科,更优选来自杨属,最优选来毛果杨。
[0803] 9.可通过根据项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GSA1多肽的重组核酸。
[0804] 10.构建体,其包含:
[0805] (i)编码如项1中定义的GSA1多肽的核酸;
[0806] (ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
[0807] (iii)转录终止序列。
[0808] 11.根据项10的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
[0809] 12.根据项10或11的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
[0810] 13.利用根据项10或11的构建体转化的植物、植物部分或植物细胞。
[0811] 14.用于产生相对于对照植物具有增加的产量,优选增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
[0812] (i)向植物中引入和表达编码如项1中定义的GSA1多肽的核酸;和
[0813] (ii)在促进植物生长和发育的条件下培养所述植物细胞。
[0814] 15.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码项1中定义的GSA1多肽的核酸的被调节的表达而产生。
[0815] 16.根据项9、13或15的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物例如甜菜,或单子叶植物或谷类植物例如稻、玉米、小麦、甘蔗、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
[0816] 17.根据项16的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
[0817] 18.从根据项16的植物和/或从根据项17的植物的可收获部分得到的产品。
[0818] 19.编码GSA1多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。实施例
[0819] 现参考以下实施例描述本发明,所述实施例仅意在举例说明。如下实施例并非旨在完全限定或以其他方式限制本发明的范围。
[0820] DNA操作:除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols第一卷和第二卷的标准方案进
行。用于植物分子工作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific
Publications(UK)出版。
[0821] 实施例1:鉴定与本发明方法所用核酸序列相关的序列
[0822] 利用数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),在例如美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库所保持的序列中,鉴定与本
发明方法中所用的核酸序列相关的序列(全长cDNA、EST或基因组序列)。该程序通过将
核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,在TBLASTN算法中,利用本发明所用的核酸编码的多肽,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核
酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调
整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
[0823] 1.1.BET1样多肽
[0824] 表A1提供了与可以用于本发明方法中的核酸序列相关的核酸序列的列表。
[0825] 表A1:BET1样多肽的实例:
[0826]
[0827]
[0828] 1.2.钙网蛋白多肽
[0829] 表A2提供了与本发明方法中所用的核酸序列相关的核酸序列的列表。
[0830] 表A2:钙网蛋白多肽的实例:
[0831]
[0832]
[0833] 1.3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[0834] 表A3提供了与本发明方法中所用的核酸序列相关的核酸序列的列表。
[0835] 表A3:DUS1L多肽序列和编码核酸序列的实例:
[0836]
[0837] 在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute forGenomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键
词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建的数据库。此外,访问私人数据库(P)已允许鉴定新型核酸和多肽序列。
[0838] 1.4.ES43样多肽
[0839] 表A4提供了与本发明方法中所用的核酸序列相关的核酸序列的列表。
[0840] 表A4:ES43样多肽的实例:
[0841]
[0842] 在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute forGenomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键
词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建的数据库。此外,访问私人数据库(proprietary databases)已允许鉴定新型核酸和多肽序列。
[0843] 1.5.HON5样多肽
[0844] 表A5提供了与本发明方法中所用的核酸序列相关的核酸序列的列表。
[0845] 表A5:HON5样多肽的实例:
[0846]
[0847] 在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute forGenomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键
词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建的数据库。此外,访问私人数据库已允许鉴定新型核酸和多肽序列。
[0848] 1.6.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[0849] 表A6提供了与本发明的方法所用的核酸序列相关的核酸序列的列表。
[0850] 表A6:GSA1多肽的实例:
[0851]
[0852]
[0853] 在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute forGenomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键
词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建的数据库。此外,访问私人数据库已允许鉴定新型核酸和多肽序列。
[0854] 实施例2:比对与本发明方法所用的多肽序列相关的序列
[0855] 2.1.BET1样多肽
[0856] 利用渐近比对的ClustalW 2.0算法(Thompson等.(1997)Nucleic AcidsRes 25:4876-4882;Chenna等.(2003),使用Blosum 62矩阵、10的空位开放罚分、0.2的空位延伸罚分,进行多肽序列的比对。进行微小的手工编辑以进一步优化比对。在图2中比对BET1样多肽。
[0857] 在共有序列上指出高度保守的氨基酸残基。
[0858] 2.2.钙网蛋白多肽
[0859] 利用渐近比对的ClustalW 2.0算法(Thompson等.(1997)Nucleic Acids Res25:4876-4882;Chenna等.(2003),使用标准设置(慢比对,相似性矩阵:Blosum 62(空位开放罚分为10、空位延伸罚分:0.2)),进行表A2的植物来源的多肽序列的比对。进行微小的手工编辑以进一步优化比对。在图4中比对钙网蛋白多肽。在共有序列上指示高度保守的氨基酸残基。
[0860] 植物来源的钙网蛋白多肽的系统发生树复制自Christensen等.2008(图5)。
[0861] 使用Vector NTI(Invitrogen)的AlignX程序 中提供的邻 接聚类算 法(neighbour-joining clustering algorithm),构建表A2的钙网蛋白多肽的系统发生树。
钙网蛋白多肽来源聚类在5个不同的进化枝中:1-CRT1,包括组CRT1/2的植物来源的钙网蛋白多肽;2-CRT3,包括组CRT3的植物来源的钙网蛋白多肽;3-藻类:包括来源于藻类的钙网蛋白多肽;4-动物:包括来源于动物界的钙网蛋白多肽。表B1显示表A2的多肽在不
同进化枝中的分布。
[0862] 表B1:钙网蛋白多肽的系统发生关系
[0863]名称 SEQ ID NO: 进化枝
S.lycopersicum_TA36564 105 1-CRT1
A.formosa_TA9419 107 1-CRT1
A.thaliana_AT1G09210_CRT2 109 1-CRT1
A.thaliana_AT1G56340_CRT1 111 1-CRT1
A.trichopoda_TA1102 113 1-CRT1
B.distachyon_TA448 115 1-CRT1
B.napus_BPS_28478 117 1-CRT1
B.napus_TA20659 119 1-CRT1
B.vulgaris_TA7257 121 1-CRT1
C.annuum_TA4292 123 1-CRT1
C.endivia_TA1106 125 1-CRT1
C.solstitialis_TA9 127 1-CRT1
G.hirsutum_TA20990 129 1-CRT1
G.max_BPS_38275 131 1-CRT1
G.raimondii_TA8857 133 1-CRT1
G.raimondii_TA8860 135 1-CRT1
H.annuus_TA7525 137 1-CRT1
H.argophyllus_TA1300 139 1-CRT1
H.vulgare_BPS_7785 141 1-CRT1
H.vulgare_TA38555 143 1-CRT1
I.nil_TA5002 145 1-CRT1
L.japonicus_TA548 147 1-CRT1
L.serriola_TA711 149 1-CRT1
M.domestica_TA24948 151 1-CRT1
M.truncatula_AC149474 153 1-CRT1
O.basilicum_TA646 155 1-CRT1
O.sativa_Os03g0832200 157 1-CRT1
O.sativa_Os07g0246200 159 1-CRT1
P.persica_TA3474 161 1-CRT1
P.pi naster_TA4383 163 1-CRT1
P.sitchensis_TA20930 165 1-CRT1
P.taeda_TA5639 167 1-CRT1
P.trichocarpa_133.107 169 1-CRT1
P.trichocarpa_729432 171 1-CRT1
P.vulgaris_TA3122 173 1-CRT1
R.communis_U74630 175 1-CRT1
S.bicolor_TA20922 177 1-CRT1
S.bicolor_TA25211 179 1-CRT1
S.habrochaites_TA1435 181 1-CRT1
S.tuberosum_TA24720 183 1-CRT1
T.aestivum_TA50840 185 1-CRT1
T.aestivum_TA74192 187 1-CRT1
V.vinifera_TA38405 189 1-CRT1
W.mirabilis_TA538 191 1-CRT1
Z.mays_TA170881 193 1-CRT1
A.formosa_TA8804 195 2-CRT3
A.thaliana_AT1G08450_CRT3 197 2-CRT3
B.napus_BPS_33882 199 2-CRT3
C.maculosa_TA223 201 2-CRT3
E.esula_TA10075 203 2-CRT3
G.raimondii_TA11257 205 2-CRT3
H.vulgare_TA32081 207 2-CRT3
M.domestica_TA28184 209 2-CRT3
M.truncatula_TA23636 211 2-CRT3
O.sativa_Os01g67054.1 213 2-CRT3
[0864]
[0865]O.sativa_Os05g43170.1 215 2-CRT3
P.patens_164102 217 2-CRT3
P.trichocarpa_VII.148 219 2-CRT3
P.trifoliata_TA7309 221 2-CRT3
S.bicolor_TA24664 223 2-CRT3
T.aestivum_TA53764 225 2-CRT3
V.vinifera_GSVIVT00025039001 227 2-CRT3
Z.mays_BPS_22383 229 2-CRT3
Z.mays_TA15627 231 2-CRT3
C.reinhardtii_TA11983 233 3-藻类
V.carteri_76046 235 3-藻类
D.melanogaster_CRC 237 4-动物
H.sapien_CALR3 239 4-动物
H.sapien_CALRE 241 4-动物
A.anophagefferens_21695 243 5-原生生物
P.tricornutum_41172 245 5-原生生物
[0866] 2.3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[0867] 利用AlignX算法(来自Vector NTI 10.3,Invitrogen Corporation)进行表A3中所有DUS1L多肽序列的多重序列比对。比对的结果示于本申请的图9中。一个重要的结
构域是具有InterPro登录号IPR001269(整合了PFAM PF01207登录号(由X标记))的
tRNA二氢尿苷合酶结构域。一个重要的基序是具有InterPro登录号IPR018517(整合了
PROSITE PS01136(由X标记,在SEQ ID NO:Sacof_DUS1L中以粗体标示)的tRNA二氢尿
苷合酶保守位点。保守残基加框突显,特别是在其他生物中作为关键的广义酸/碱催化剂的Cys残基。
[0868] 2.4.ES43样多肽
[0869] 利用渐近比对的ClustalW 1.8算法(Thompson等.(1997)Nucleic Acids Res25:4876-4882;Chenna等.(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet,空位开放罚分为10、空位延伸罚分:0.2)进行多肽序列的比对。
进行微小的手工编辑以进一步优化比对。在图12中比对ES43样多肽。
[0870] 当观看图11和图12时,表A4的ES43样多肽中BAH和PHD结构域的序列和定位变得显而易见。
[0871] 2.5.HON5样多肽
[0872] 利用Vector NTI(Invitrogen)的AlignX程序提供的渐近比对的ClustalW 2.0算法(Thompson等.(1997)Nucleic Acids Res 25:4876-4882;Chenna等.(2003).Nucleic Acids Res 31:3497-3500),使用标准设置和Blosum 62矩阵、10的空位开放罚分、0.2的空位延伸罚分,进行多肽序列的比对。进行微小的手工编辑以进一步优化比对。在图14中比对HON5样多肽。在共有序列上指示了高度保守的氨基酸残基。指示了H1/H5结构域和
AThook结构域(总共6个)。
[0873] 2.6.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[0874] 利用渐近比对的ClustalW 2.0算法(Thompson等.(1997)Nucleic Acids Res25:4876-4882;Chenna等.(2003),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum
62),空位开放罚分为10、空位延伸罚分:0.2)进行多肽序列的比对。进行微小的手工编辑以进一步优化比对。在图16中比对GSA1多肽。
[0875] 使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建GSA1多肽的系统发生树(图17)。
[0876] 实施例3:计算可以用于实施本发明方法的多肽序列之间的全局同一性百分比
[0877] 3.1.BET1样多肽
[0878] 可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices using
protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion
Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列
的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,
而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算
相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
[0879] 比较所用的参数为:
[0880] 记分矩阵:Blosum 62
[0881] 首个空位:12
[0882] 延伸空位:2
[0883] 多肽序列全长范围的全局相似性和同一性的软件分析结果示于表C1。同一性百分比以粗体示于对角线上方,而相似性百分比示于对角线下方(正面)。
[0884] 与SEQ ID NO:2相比较,可以用于本发明方法的BET1样多肽序列之间的同一性百分比可以低至25%氨基酸同一性(表C1)。
[0885] 表C1:多肽序列全长范围的全局相似性和同一性的MatGAT结果。
[0886]BET1-样多肽 1 17 24 38 41 42 43 44 46
1.M.truncatula_AC169182_39.5_1 32.1 24.4 26.1 26.4 29 22.8 22.8 26.1
17.M.truncatula_AC169182_23.5_1 40.5 21.6 24.2 22 26 23.7 23.7 24.2
24.B.napus_BN06MS42331943.f_k04_1_40488_1 32.1 38.3 23.9 20.4 25 31.6 30.5 23.9
38.T----M---____25296 34.1 41.2 41.2 25 28.9 65.6 66.7 93.3
41.A.thaliana_AT1G56233.1_1 40.2 40.2 43.7 42.5 17.9 17.1 17.1 23.2
42.Z.mays_c57759235gm030403_14494_1 38.2 44.9 40.4 50.6 37.1 30.2 29.2 28.7
43.Z.mays_c62091609gm030403_7698_1 33.7 40.4 46.1 77.5 40.4 51.7 97.8 67
44.Z.mays_DQ245377_1 33.7 40.4 44.9 77.5 40.4 51.7 100 68.1
46.Z.mays_ZM07MC13625_57676372_13595_1 33.7 39.3 39.3 95.5 41.6 50.6 78.7 78.7[0887] 3.2.钙网蛋白多肽
[0888] 可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices using
protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion
Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列
的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,
而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算
相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
[0889] 记分矩阵:Blosum 62
[0890] 首个空位:12
[0891] 延伸空位:2
[0892] 用于实施本发明的方法的钙网蛋白多肽序列之间的同一性百分比可以是低至32%的氨基酸同一性。CRT1/2的钙网蛋白多肽序列之间的同一性百分比通常为至少64%。
CRT3的钙网蛋白多肽序列之间的同一性百分比通常为至少55%。与CRT3的钙网蛋白多肽
序列相比较,CRT1/2组的钙网蛋白多肽序列的百分比同一性通常为至少49%。
[0893] 3.3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[0894] 可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices using
protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软 件 由 Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列
的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,
而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算
相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
[0895] 比较所用的参数为:
[0896] 记分矩阵:Blosum 62
[0897] 首个空位:12
[0898] 延伸空位:2
[0899] 多肽序列全长范围(将部分多肽序列排除在外)的全局相似性和同一性的软件分析结果示于表C2。
[0900] 与SEQ ID NO:259相比较,可以用于实施本发明方法的全长多肽序列之间的同一性百分比可低至32%氨基酸同一性。
[0901]
[0902] 如果比较多肽的最保守的区域,则氨基酸同一性百分比可显著增加。例如,当比较SEQ ID NO:294所示的tRNA二氢尿苷合酶结构域的氨基酸序列与表A3的多肽的各相应结构时,氨基酸同一性百分比显著增加(按照优选次序至少50%、55%、60%、65%、70%、
75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性)。
[0903] 3.4.ES43样多肽
[0904] 可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion
Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列
的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,
而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算
相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
[0905] 比较所用的参数为:
[0906] 记分矩阵:Blosum 62
[0907] 首个空位:12
[0908] 延伸空位:2
[0909] 3.5.HON5样多肽
[0910] 可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion
Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列
的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,
而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算
相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
[0911] 比较所用的参数为:
[0912] 记分矩阵:Blosum 62
[0913] 首个空位:12
[0914] 延伸空位:2
[0915] 表A5多肽序列在全长范围的全局相似性和同一性的软件分析结果示于表C3。
[0916]
[0917] 3.6.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[0918] 可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion
Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列
的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,
而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算
相似性和同一性,然后将结果排列成距离矩阵。
[0919] 比较所用的参数为:
[0920] 记分矩阵:Blosum 62
[0921] 首个空位:12
[0922] 延伸空位:2
[0923] 多肽序列全长范围的全局相似性和同一性的软件分析结果示于表C4。同一性百分比以粗体示于对角线上方,而相似性百分比示于对角线下方(正面)。
[0924] 与SEQ ID NO:418相比较,可以用于本发明方法的GSA1多肽序列之间的同一性百分比可以低至yy%氨基酸同一性。
[0925]
[0926]
[0927]
[0928]
[0929] 还可产生特定结构域的局部比对的MATGAT表或关于特定结构域之间的同一性/相似性百分比的数据。
[0930] 实施例4:鉴定可以用于实施本发明方法的多肽序列所含的结构域
[0931] 4.1.BET1样多肽
[0932] 蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
[0933] SEQ ID NO:2所示的多肽序列的InterPro扫描结果示于表D1中。
[0934] 表D1:
[0935]数据库 名称 在SEQ ID No 2上的氨基酸坐标
TMHMM 跨膜区 10-32
[0936] TMHMM最早由Krogh.J Mol Biol.2001Jan 19;305(3):567-80描述。
[0937] 4.2.钙网蛋白多肽
[0938] 蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
[0939] SEQ ID NO:105所示的多肽序列的InterPro扫描结果示于表D2中。
[0940]
[0941] 当给定的结构域在SEQ ID NO:105的序列中存在超过1次时,在栏“SEQ ID NO:105中的氨基酸坐标”中用“;”分隔各结构域的氨基酸位置;相应地各结构域的e值也同样分隔。如果只显示1个e值,那么意指各结构域具有相同的e值。
[0942] 4.3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[0943] 蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作
数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。
Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
[0944] SEQ ID NO:259所示的多肽序列的InterPro扫描结果示于表D3中。
[0945] 表D3:SEQ ID NO:259所示的多肽序列的InterPro扫描结果
[0946]
[0947]
[0948] TIM桶是由沿着肽主链交替的8个α-螺旋和8个平行β-链组成的保守蛋白质折叠。该结构按磷酸丙糖异构酶(保守的糖酵解酶)命名。TIM桶被认为是α/β蛋白折
叠,因为它们在单个结构域中包括α-螺旋和β-链的交替模式。在TIM桶中,螺旋和链
(通常各8个)形成螺线管,以环形线圈的方式其本身紧密地弯曲缠绕。
[0949] 4.4.ES43样多肽
[0950] Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器托管。为了在ES43样多肽中鉴定推定的BAH和PHD结构域,使用SEQ ID NO:299的氨基酸序列搜索Pfam数据库。
[0951] SEQ ID NO:299所示的多肽序列的pfam扫描结果示于表D4。
[0952] 表D4:SEQ ID NO:299所示的多肽序列的Pfam搜索结果(主登录号)。
[0953]
[0954] 4.5.HON5样多肽
[0955] 蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
[0956] SEQ ID NO:388所示的多肽序列的InterPro扫描结果示于表D5中。
[0957]
[0958] 4.6.谷氨酸-1-半醛转氨酶多肽(GSA1多肽s)
[0959] 蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
[0960] SEQ ID NO:418所示的多肽序列的InterPro扫描结果示于表D6中。
[0961] 表D6:SEQ ID NO:148所示的多肽序列的InterPro扫描结果(主登录号)。
[0962]
[0963] 实施例5:用于实施本发明方法的多肽序列的拓扑学预测
[0964] 5.1.BET1样多肽
[0965] TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指
标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学
(Technical University of Denmark)的服务器维护。
[0966] 对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
[0967] 可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
[0968] 5.2.钙网蛋白多肽
[0969] TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指
标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学
(Technical University of Denmark)的服务器维护。对于经预测包含N末端前序列的序
列,还可预测潜在切割位点。
[0970] 可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
[0971] 许多其他算法可用于实施此类分析,包括:
[0972] ·在丹麦技术大学的服务器上托管的ChloroP 1.1;
[0973] ·在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute forMolecular Bioscience)的服务器上托管的Protein Prowler Subcellular Localisation Predictor 1.2版;
[0974] ·在Edmonton,Alberta,Canada的阿尔伯特大学(Universityof Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB2.5;
[0975] ·在丹麦技术大学的服务器上托管的TMHMM;
[0976] ·PSORT(URL:psort.org)
[0977] ·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
[0978] 5.3.ES43样多肽
[0979] TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指
标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学
(Technical University of Denmark)的服务器维护。
[0980] 对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
[0981] 可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
[0982] 5.4.H
[0983] TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指
标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学
(Technical University of Denmark)的服务器维护。对于经预测包含N末端前序列的序
列,还可预测潜在切割位点。
[0984] 可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
[0985] 许多其他算法可用于实施此类分析,包括:
[0986] ·在丹麦技术大学的服务器上托管的ChloroP 1.1;
[0987] ·在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute forMolecular Bioscience)的服务器上托管的Protein Prowler Subcellular Localisation Predictor 1.2版;
[0988] ·在Edmonton,Alberta,Canada的阿尔伯特大学(University of Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB2.5;
[0989] ·在丹麦技术大学的服务器上托管的TMHMM;
[0990] ·PSORT(URL:psort.org)
[0991] ·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
[0992] 5.5.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[0993] TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。
可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学的服务
器维护。
[0994] 对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
[0995] 可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
[0996] SEQ ID NO:418所示的多肽序列的TargetP 1.1分析结果示于表D7。已选择“植物”生物组,无截断值定义,且转运肽的预测长度被要求。SEQ IDNO:418所示的多肽序列的亚细胞定位被预测为叶绿体,无转运肽被预测。
[0997] 表D7:
[0998]
[0999] 许多其他算法可用于实施此类分析,包括:
[1000] ·在丹麦技术大学的服务器上托管的ChloroP 1.1;
[1001] ·在澳大利亚布里斯班的昆士兰大学分子生物科学学院的服务器上托管的Protein Prowler Subcellular Localisation Predictor 1.2版;
[1002] ·在Edmonton,Alberta,Canada的阿尔伯特大学的服务器上托管的PENCEProteome Analyst PA-GOSUB 2.5;
[1003] ·在丹麦技术大学的服务器上托管的TMHMM;
[1004] ·PSORT(URL:psort.org)
[1005] ·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
[1006] 实施例6:用于实施本发明方法的多肽序列的亚细胞定位预测
[1007] 6.1tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[1008] 用于蛋白质定位的实验性方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。鉴定GRF多肽的亚细胞区室化的这类方法在本领域是公知的。
[1009] 从序列数据进行了蛋白质定位的计算预测。在瑞士生物信息学研究所托管的ExPASy蛋白质组学工具处可以得到一些本领域技术人员公知的算法,例如PSort、
TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM、TMpred等等。
[1010] TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。
可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学的服务
器维护。
[1011] 对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
[1012] 选择了许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
[1013] SEQ ID NO:259所示的多肽序列的TargetP 1.1分析结果示于下表。已选择“植物”生物组,无截断值定义。SEQ ID NO:259所示的多肽序列的亚细胞定位是线粒体。
[1014] 表E1:SEQ ID NO:259所示的多肽序列的TargetP 1.1分析
[1015]长度(AA) 421
叶绿体转运肽 0.026
线粒体转运肽 0.947
分泌途径信号肽 0.008
其他亚细胞靶向 0.075
预测的定位 线粒体
可靠性级别 1
[1016] 用于靶向线粒体的方法在本领域内是公知的,包括线粒体转运肽的使用。线粒体转运肽可用于将任何DUS1L多肽靶向线粒体,该DUS1L多肽可以以其天然形式通常是不靶向线粒体的,或者该DUS1L多肽以其天然形式是通过不同的转运肽(例如,其天然转运肽)而靶向线粒体的。例如,编码蓝细菌(cyanobacterial)或硅藻DUS1L多肽的核酸序列也可适用于本发明的方法,只要所述多肽被靶向线粒体即可。
[1017] 实施例7:与用于实施本发明方法的多肽序列相关的测定法
[1018] 7.1.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[1019] 用于本发明方法的DUS1L多肽(至少其天然形式)通常,但不必然,具有tRNA二氢尿苷合酶(DUS)活性。通常可以,例如在细菌或酵母中,使用体内DUS-互补试验。通常使用已缺失了全部3个DUS基因(D3dus)从而产生无可检测的二氢尿苷的tRNA的大肠杆
菌菌株。因此不含二氢尿苷的该菌株可以用作“零背景”以测试DUS基因在活细胞中催化二氢尿苷形成的能力。通过向该菌株中引入质粒携带的DUS基因,可以测量从该菌株纯化的tRNA中重建的tRNA的二氢尿苷含量(Bishop等.(2002)supra)。
[1020] 通过适应性调整Jacobson和Hedgcoth((1970)Anal Biochem 34,459-469)的方法,也可以进行tRNA二氢尿苷含量的比色法测量。
[1021] 实施例8:用于本发明方法的核酸序列的克隆
[1022] 8.1.BET1样多肽
[1023] 使用客户定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。
[1024] 使用的引物是SEQ ID NO:101所示的第一寡核苷酸(用于有义方向)和SEQ IDNO:102所示的第二寡核苷酸(用于反向互补链,包括用于Gateway重组的AttB位点)。也
使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期
间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,
pBET1_ike。作为 技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
[1025] 含有SEQ ID NO:1的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:103)位于此Gateway盒的上游。
[1026] 在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::BET1-like(图3)转化进农杆菌菌株LBA4044。
[1027] 8.2.钙网蛋白多肽
[1028] 使用定制的番茄或毛果杨幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:
[1029] 对于番茄TA36564:
[1030] SEQ ID NO:253(有义,起始密码子以粗体标示):
[1031] 5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggctactcgacgaatgaaa-3’和 SEQ ID NO:254(反向,互补):
[1032] 5’-ggggaccactttgtacaagaaagctgggttgaatcaaaatgcttggctct-3’,对于毛果杨133.107:
[1033] SEQ ID NO:255(有义,起始密码子以粗体标示):
[1034] 5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgggaaaccctaaaactctc-3’和 SEQ ID NO:256;(反向,互补):
[1035] 5’-ggggaccactttgtacaagaaagctgggtaagagtgcttcctcatcacag-3’其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作
的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所
称的“进入克隆”,pCalreticulin。作为 技术一部分的质粒pDONR201购自英
骏公司。
[1036] 含有SEQ ID NO:104的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:257)位于此Gateway盒的上游。
[1037] 在LR重组步骤之后,根据本领域公知的方法将所产生的表达载体pGOS2::Calreticulin(图6)转化进农杆菌菌株LBA4044。
[1038] 8.3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[1039] 使用从来自不同发育阶段的蕃茄植物的RNA构建的cDNA库作为模板,通过PCR扩增编码SEQ ID NO:2所示的DUS1L多肽序列的甘蔗(Saccharum officinarum)核酸序列。将包括用于Gateway重组的AttB位点的下列引物用于PCR扩增:prm08359(SEQ ID NO:296,有义):5’-ggggacaagtttgtacaaaaaagcaggctta aacaatgccactgcgcc-3’和prm08360(SEQ ID NO:297,反向,互补):5’-ggggaccactttgtacaagaaagctgggtc ctgtca ggcattgc-3’。
[1040] 在标准条件下使用Hifi Taq DNA聚合酶进行PCR。同样利用标准方法,扩增和纯化预期长度(包括attB位点)的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”。作
为 技术一部分的质粒pDONR201购自英骏公司。
[1041] 含有SEQ ID NO:258的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:295)位于此Gateway盒的上游。
[1042] 在LR重组步骤之后,根据本领域公知的方法将所产生的表达载体pGOS2:DUS1L(图10)转化进农杆菌菌株LBA4044。
[1043] 8.4.ES43样多肽
[1044] 使用定制的稻幼苗cDNA库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是SEQ ID NO:384;有义):5’-ggggacaagtttgtacaaaaaagcaggcttaaac aatgg cgaagtcgcgg-3’和(SEQ ID NO:385;
反向,互补):5’-ggggaccactttgtacaagaaagctgggttccaggtgtatctcgtcaatg-3’,其包括用于Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway
操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术
语所称的“进入克隆”pES43-like。作为 技术一部分的质粒pDONR201购自英
骏公司。
[1045] 含有SEQ ID NO:298的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:386)位于此Gateway盒的上游。
[1046] 在LR重组步骤之后,根据本领域公知的方法将所产生的表达载体pGOS2:ES43-like(图13)转化进农杆菌菌株LBA4044。
[1047] 8.5.HON5样多肽
[1048] 使用定制的毛果杨幼苗cDNA库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增编用于本发明的方法的核酸序列。在标准条件下使用Hifi
Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是(SEQ ID
NO:414;有义,起始密码子以粗体标示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatg gacccaccacctcct-3’和(SEQ ID NO:415;反向,互补):5’-ggggaccactttgtacaagaaagctgggtggaacaaattcatgatcctcg-3’,其包括用于Gateway重组的AttB位点。同样利用标准
方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片
段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”pHON5-like。作为
技术一部分的质粒pDONR201购自英骏公司。
[1049] 含有SEQ ID NO:387的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:416)位于此Gateway盒的上游。
[1050] 在LR重组步骤之后,根据本领域公知的方法将所产生的表达载体pGOS2:HON5-like(图15)转化进农杆菌菌株LBA4044。
[1051] 8.6.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[1052] 使用定制的杨树cDNA库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明的方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是(SEQ ID NO:490;有
义,起始密码子以粗体标示):prm(fwd)5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcttctacaatcacagga-3’和(SEQ ID NO:491;反向,互补):prm(rev)5’-ggggaccactttgtacaagaaa gctgggtcaacaatcacacagcgagata-3’,其包括用于Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期
间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”pGSA1。作
为 技术一部分的质粒pDONR201购自英骏公司。
[1053] 含有SEQ ID NO:417的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异性表达的稻GOS2启动子(SEQ ID NO:492)位于此Gateway盒的上游。
[1054] 在LR重组步骤之后,根据本领域公知的方法将所产生的表达载体pGOS2:GSA1(图18)转化进农杆菌菌株LBA4044。
[1055] 实施例9:植物转化
[1056] 稻转化
[1057] 用含表达载体的农杆菌转化稻(Oryza sativa)植物。使梗稻栽培种日本晴(Nipponbare)的成熟干种子脱壳。通过在70%乙醇中孵育1分钟,接着在0.2%HgCl2中
孵育30分钟,接着用无菌蒸馏水洗6次,每次15分钟进行消毒。然后使消毒的种子在含有
2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育四周之后,切下盾片来源
的胚发生愈伤组织,并在相同的培养基中增殖。两周之后,通过在相同培养基中传代培养另外2周来扩增或者增殖愈伤组织。在共培养之前3天,在新鲜培养基上传代培养胚发生愈
伤组织块(以加强细胞分裂活性)。
[1058] 含有表达载体的农杆菌菌株LBA4404用于共培养。农杆菌接种于含有合适抗生素的AB培养基上,并在28℃培养3天。接着收集细菌并悬浮在液体共培养培养基中至光密度(OD600)约为1。接着将悬浮液转移至培养皿,并将愈伤组织浸于悬浮液中15分钟。随
后将愈伤组织在滤纸上沾干,转移至固化的共培养培养基中,并在黑暗中于25℃孵育3天。
在选择剂的存在下,共培养的愈伤组织在含有2,4-D的培养基上于28℃暗培养四周。在此期间,发育出快速生长的抗性愈伤组织岛。将此材料转移至再生培养基并在光照下孵育之后,释放了胚发生潜力,在接下来的四至五周发育出芽。将芽从愈伤组织切下,并在含生长素的培养基中孵育2到3周,将其从培养基转移至土壤。变硬的芽在高湿度和短白昼条件
下在温室中培养。
[1059] 一个构建体产生约35个独立的T0稻转化体。将原代转化体从组织培养室转移到温室。在定量PCR分析验证T-DNA插入物的拷贝数后,只保留对选择剂表现出耐受性的单
拷贝转基因植物用以收获T1种子。在移植后三至五个月收获种子。该方法以超过50%的
比率产生了单基因座转化体(Aldemita和Hodges 1996,Chan等,1993,Hiei等,1994)。
[1060] 实施例10:其他作物转化
[1061] 玉米转化
[1062] 用Ishida等(1996)Nature Biotech 14(6):745-50所述方法的改良方案进行玉米(玉蜀黍)转化。在玉米中转化是基因型依赖性的,并且只有特定的基因型适于转化和再生。近交系A188(明尼苏达大学)或以A188为亲本的杂种是转化供体材料的优良来源,但
是也可以成功使用其它基因型。授粉后约11天(DAP),当未成熟胚的长度是约1至1.2mm
时,从玉米植物收获穗。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植物。切离的胚依次生长在含有选择剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基、和玉米再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到玉米生根培养基上并在25℃孵育2-3周,直到根发育。
将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
[1063] 小麦转化
[1064] 运用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法,进行小麦的转化。栽培种Bobwhite(可从CIMMYT,Mexico(墨西哥)获得)常用来进行转化。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植株。与农杆菌孵育后,胚依次体外生长在含有选择试剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱
导培养基,和再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种
子。
[1065] 大豆转化
[1066] 根据Texas A&M专利US 5,164,310所述方法的改良方案转化大豆。若干商业大豆品种可以通过该方法转化。栽培种Jack(可以得自伊利诺斯种子公司(the Illinois Seed foundation))常用来进行转化。对大豆种子消毒以进行体外播种。从七日龄幼苗中切出下胚轴、胚根和一个子叶。进一步培养上胚轴和剩下的子叶以发育腋结。切离这些腋结并与含有表达载体的根癌农杆菌孵育。在共培养处理后,洗涤外植体并转移到选择培养基中。
切离再生的芽,置于芽伸长培养基中。将长度不超过1cm的芽置于生根培养基中直到发育出根。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
[1067] 油菜籽/芸苔转化
[1068] 利用5-6日龄幼苗的子叶柄和下胚轴作为外植体进行组织培养并根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培种Westar(加拿大农业
(Agriculture Canada))是用作转化的标准品种,但是也可以使用其它品种。对芸苔种子表面消毒以进行体外播种。从体外幼苗中切离附着有子叶的子叶柄外植体,并通过将子叶柄外植体的切割端浸入细菌悬浮液中来接种农杆菌(含有表达载体)。随后外植体在含有
3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基中于23℃、16小时光照培养2天。与农杆菌共培养2天后,将子叶柄外植体转移到含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基中7天,然后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养直到芽再生。当芽长5-10mm时,将其切下并转移到芽伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)中。将约2cm长的芽转移到生根培养基
(MS0)中进行根诱导。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
[1069] 苜蓿转化
[1070] 利用(McKersie等1999Plant Physiol 119:839-847)的方法转化苜蓿(紫花苜蓿(Medicago sativa))的再生克隆。苜蓿的再生和转化是基因型依赖性的,因此需要再生植株。获得再生植株的方法已有描述。例如,这些可以选自栽培种Rangelander(加拿大
农业(Agriculture Canada))或如Brown DCW和A Atanassov(1985.Plant Cell Tissue
Organ Culture 4:111-112)所述的任何其它商业苜蓿品种。可选的,选择RA3品种(威
斯康辛大学(University of Wisconsin))用于组织培养(Walker等,1978 Am J Bot65:
654-659)。子叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847)或LBA4404的过夜培养物进行共培养。外植体在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/LK2SO4和100μm乙酰丁香酮的SH诱导培养基上在黑暗中共培养3天。外植体在半强度Murashige-Skoog培养基(Murashige和Skoog,1962)中
洗涤,并置于相同的SH诱导培养基中,但该培养基不含乙酰丁香酮而含有合适的选择剂和合适的抗生素以抑制农杆菌生长。数周后,体细胞胚转移到不含生长调节剂、不含抗生素、含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半强度Murashige-Skoog培养基
上萌发。生根的幼苗移植到花盆中并在温室中生长。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
[1071] 棉花转化
[1072] 按照US 5,159,135中描述的方法使用根癌农杆菌转化棉花。于3%次氯酸钠溶液中20分钟,对棉花种子表面消毒,并且在具有500μg/ml头孢噻肟的蒸馏水中进行洗涤。
然后将种子转移至具有50μg/ml苯菌灵(benomyl)的SH培养基中进行萌发。从4至6
日龄的幼苗中取出下胚轴,切成0.5厘米的小块,置于0.8%琼脂上。将农杆菌悬浮液(每ml大约108个细胞,从用目的基因和适当的选择标记转化的过夜培养物稀释的)用于接种
下胚轴外植体。在室温和光照下3天后,将组织转移至具有Murashige和Skoog盐和B5
维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l2,4-D、0.1mg/l 6-糠氨基嘌呤(6-furfurylaminopurine)和750μg/mlMgCL2、以及50至100μg/ml头孢噻肟和
400-500μg/ml羧苄青霉素(以杀死残留细菌)的固体培养基(1.6g/l Gelrite)。在2至
3个月(每4至6周进行一次传代培养)后分离单细胞系并且将其在选择培养基上进一步
培养以进行组织扩增(30℃,16小时光周期)。接着将转化的组织在非选择培养基上进一步培养2至3个月以产生体细胞胚。将至少4mm长的健康外貌的胚转移至具有SH培养基(于
细小蛭石中)的试管中,所述培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。将胚在30℃和16小时的光周期下进行培养,将2至3叶期的小植株转移入具有蛭石和营养物
的花盆。植物变硬,然后转移至温室以进一步栽培。
[1073] 实施例11:表型评估方法
[1074] 11.1评估设置
[1075] 产生大约35个独立的T0玉米转化体。原代转化体由组织培养室转移到温室进行生长并收获T1种子。保留其中T1代发生转基因的存在/缺乏的3∶1分离的事件。对于
每一个此类事件,通过监测可视标记的表达,选出大约10个含转基因(杂合子和纯合子)
的T1幼苗、以及大约10个缺少转基因(无效合子)的T1幼苗。转基因植物和相应的无效
合子在随机位置上并排生长。温室条件为短白昼(12小时光照),日间28℃,夜间22℃,相对湿度70%。对在非胁迫条件下生长的植物定期浇水,以确保水和养分是非限制性的以及满足完成生长和发育的植物需要。
[1076] 在一些情况下,按照与T1代相同的评估程序,对T1事件在T2代中进行了进一步的评估,但是每个事件采用了更多的个体。从播种期到成熟期,植物数次通过数码成像箱。
在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6
百万色)。
[1077] 干旱筛选
[1078] 在正常条件下在花盆土中培养来自T1种子的植物,直到进入抽穗期。然后将其转移到“干”区,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培
养的植物相同。如针对在正常条件下生长所详述的那样,记录了生长和产量参数。
[1079] 减小的养分(氮)利用率筛选
[1080] 在除营养液以外为正常的条件下在花盆土中栽培来自6个事件(T2种子)的植物。从植物移植到成熟,用特定的营养液对花盆进行灌溉,所述营养液含有减小的氮(N)含量,通常少7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的
植物相同。如对正常条件下生长所详细描述的那样,记录了生长和产量参数。
[1081] 盐胁迫筛选
[1082] 植物生长在由椰壳纤维和argex(3∶1)制成的基质上。在小植株移植到温室后的头两周期间应用正常营养液。过了头两周之后,向营养液中添加25mM盐(NaCl),直至收获植物。然后测量种子相关参数。
[1083] 11.2统计分析:F检验
[1084] 利用双因素ANOVA(方差分析)作为统计模型,对植物表型特征进行总体评估。对用本发明基因转化的所有事件的所有植株的所有测量参数进行了F检验。进行F检验以检查基因在所有转化事件上的效应,并检验基因的总体效应,亦称为“整体基因效应”。真实整体基因效应的显著性阈值设置为F检验的5%概率水平。显著性F检验值指示存在基因效
应,这意味着引起表型上差异的不仅仅是基因的存在或位置。
[1085] 在进行了重叠事件的两个实验的情况下,进行组合分析。这可以用于检查效应在两个实验中的一致性,并且如果确是如此的话,积累来自两个实验的证据以增加结论的可靠性。所使用的方法是考虑数据的多层次结构(即实验-事件-分离子)的混合模型法。通过将似然比检验与卡方分布相比较来获得P值。
[1086] 11.3测量的参数
[1087] 生物量相关参数测量
[1088] 从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
[1089] 植物地上面积(或者说叶生物量)通过计数数码图像中区别于背景的地上植物部分的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。该地上面积是在植物达到其最大叶生物量的时间点测量的面积。
早期活力是萌发后三周的植物(幼苗)地上面积。根生物量增加表达为根总生物量(测量
为在植物一生中观察到的最大根生物量)的增加;或者表达为根/枝条指数(测量为在根
和枝条活跃生长期中根生物量和枝条生物量之间的比值)的增加。
[1090] 通过计数区别于背景的地上植物部分的像素总数,测定了早期活力。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。下面描述的结果是针对萌发后3周的植物的。
[1091] 种子相关参数测量
[1092] 收获成熟的一级圆锥花序(primary panicles)、计数、装袋、贴上条形码标记,然后在烤箱中于37℃干燥三天。随后使圆锥花序脱粒,收集并计数所有的种子。使用鼓风装置使饱满谷壳和空壳分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数,确定饱满种子数。通过称重从植物收获的所有饱满谷壳来测量种子总产量。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明2 6
中定义为种子总产量和地上面积(mm)之间的比值再乘以因子10。每圆锥花序的花总数
在本发明中定义为种子总数与成熟一级圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
[1093] 实施例12:转基因植物的表型评估结果
[1094] 12.1.BET1样多肽
[1095] 在T2代中表达包含SEQ ID NO:1中的最长开放阅读框的核酸的转基因稻植物在非胁迫条件下的评估结果在下文呈现。关于转基因植物的产生的详细内容参见前面的实施例。
[1096] 在非胁迫条件下转基因稻植物的评估结果在下文呈现。在每株植物的种子总产量(totalwgseeds)、每株植物的饱满种子数(nrfilledseed),、每株植物的种子总数
(nrtotalseed)、每株植物的种子饱满率(fillrate)以及收获指数(harvestindex)上,观察到了大于5%的增加(表F1)。
[1097] 表F1:非胁迫条件
[1098]
[1099] 在T1代中表达根据SEQ ID NO:1的BET1样核酸的转基因稻植物在干旱胁迫条件下的评估结果在下文呈现。对于每株植物的地上总生物量(AreaMax)、每株植物的种子总数(nrtotalseed)以及每株植物的种子饱满率(fillrate)观察到了增加(表F2)。
[1100] 表F2:干旱筛选
[1101]
[1102] 12.2.钙网蛋白多肽
[1103] 在T1代中转化了包含SEQ ID NO:104中的最长开放阅读框的核酸并表达该核酸的转基因稻植物在非胁迫条件下的的评估结果在下文呈现。关于转基因植物的产生的详细内容参见前面的实施例。
[1104] 对于种子总产量(totalwgseeds)、饱满种子数(nrfilledseed)、饱满率(fillrate)、每圆锥花序的花数(flowerperpan)、收获指数(harvestindex)以及种子总数(nrtotalseed),观察到了至少5%的增加(表F3)。
[1105] 表F3:
[1106]参数 总体
totalwgseeds 22.5
nrfilledseed 17.4
fillrate 10.6
flowerperpan 15.4
harvestindex 20.4
nrtotalseed 7.9
[1107] T1代中转化了包含SEQ ID NO:168中的最长开放阅读框的核酸并且表达该核酸的转基因稻植物在非胁迫条件下的评估结果在下文呈现(表F4)。关于转基因植物的产生
的详细内容参见前面的实施例。
[1108] 对于饱满率(fillrate)观察到了至少5%的增加。
[1109] 表F4:
[1110]参数 总体
fillrate 11.3
[1111] 12.3.tRNA二氢尿苷合酶1样多肽(DUS1L多肽)
[1112] 在限氮条件下生长的、在组成型启动子控制下表达编码SEQ ID NO:259所示的DUS1L多肽的核酸序列的T2代转基因稻植物的评估结果在下文呈现。
[1113] 在地上生物量、每株植物的种子产量、饱满种子数和种子总数上有显著的增加。
[1114] 表F5:在用于组成型表达的启动子控制下表达编码SEQ ID NO:259所示的DUS1L多肽的核酸序列的T2代转基因稻植物的评估结果。
[1115]
[1116] 12.4.ES43样多肽
[1117] 、在T2代中表达包含SEQ ID NO:298中的最长开放阅读框的核酸的转基因稻植物在非胁迫条件下的评估结果在下文中呈现。关于转基因植物的产生的详细内容参见前面的实施例(表F6)。
[1118] 表F6:
[1119]
[1120] 饱满率计算为植物的圆锥花序中饱满种子数占种子数的比例(表示为百分比)。
[1121] 12.5.HON5样多肽
[1122] 在T2代中表达包含SEQ ID NO:387中的最长开放阅读框的核酸的转基因稻植物在非胁迫条件下的评估结果在下文中呈现。关于转基因植物的产生的详细内容参见前面的实施例。
[1123] 在非胁迫条件下转基因稻植物的评估结果在下文呈现(表F7)。对于种子总产量(totalwgseeds)、饱满种子数(nrfilledseed),、饱满率(fillrate)、收获指数
(harvestindex)观察到了超过5%的增加,对于千粒重观察到至少2.5%的增加。
[1124] 表F7:
[1125]
[1126] 12.6.谷氨酸-1-半醛转氨酶多肽(GSA1多肽)
[1127] 表达包含SEQ ID NO:417中的最长开放阅读框的核酸的T1和T2代转基因稻植物在干旱胁迫条件下的评估结果在下文中呈现。
[1128] T1:
[1129]参数 总体
种子总重量 20.9
饱满率 26.3
收获指数 22.7
饱满种子数 22.6
[1130] T2:
[1131]参数 总体
种子总重量 59.7
饱满率 55.8
收获指数 59.9
千粒重 5.7
饱满种子数 50.6
每圆锥花序的花数 14.5
GravityY Max 6.4
粗根Max 5.0
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈