通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子专利检索-异基因细胞生物学专利检索查询-专利查询网

通过微阵列分析鉴定的甘蓝型油菜 种子特异性启动子

阅读：181发布：2023-03-07

专利汇可以提供通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子专利检索，专利查询，专利分析的服务。并且提供了利用获自甘蓝型油菜的基因调控元件在植物细胞和/或植物组织中表达转基因的构建体和方法。，下面是通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子专利的具体信息内容。

权利要求

1.一种基因表达盒，其包含与转基因可操作连接的启动子，其中该启动子包含在严格条件下与多核苷酸探针杂交的多核苷酸，所述多核苷酸探针包含SEQ ID NO:1的互补物的至少90％的序列同一性。
2.权利要求1的基因表达盒，其中该多核苷酸与SEQ ID NO:1具有至少90％序列同一性。
3.权利要求1的基因表达盒，其中该多核苷酸包含内含子。
4.权利要求3的基因表达盒，其中该内含子与选自下组的内含子具有至少90％的序列同一性：水稻肌动蛋白内含子、玉米泛素内含子、和拟南芥(Arabadiopsis thaliana)泛素
10内含子。
5.权利要求1的基因表达盒，其中该多核苷酸包含5′-非翻译区。
6.权利要求1的基因表达盒，其中该可操作连接的转基因编码多肽或小RNA。
7.权利要求1的基因表达盒，其中该转基因选自下组：杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、和选择标志物转基因。
8.权利要求1的基因表达盒，其进一步包含3′非翻译区。
9.权利要求8的基因表达盒，其中该3′非翻译区与SEQ ID NO:2具有至少90％序列同一性。
10.一种重组载体，其包含权利要求1的基因表达盒。
11.权利要求10的重组载体，其中该载体选自下组：质粒、粘粒、细菌人工染色体、病毒、和噬菌体。
12.一种转基因细胞，其包含权利要求1的基因表达盒。
13.权利要求12的转基因细胞，其中该转基因细胞是转基因植物细胞。
14.一种转基因植物，其包含权利要求13的转基因植物细胞。
15.权利要求14的转基因植物，其中该转基因植物是单子叶植物或双子叶植物。
16.权利要求15的转基因植物，其中该双子叶植物选自下组：拟南芥属(Arabidopsis)植物、烟草植物、大豆植物、卡诺拉植物、和棉花植物。
17.一种转基因种子，其来自权利要求14的转基因植物。
18.权利要求1的基因表达盒，其中所述启动子是组织优先启动子。
19.权利要求1的基因表达盒，其中所述组织优先启动子是胚珠或种子组织优先启动子。
20.权利要求1的基因表达盒，其中该启动子包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。
21.一种转基因细胞，其包含在严格条件下与多核苷酸探针杂交的合成多核苷酸，所述多核苷酸探针包含与SEQ ID NO:1的互补物的至少90％的序列同一性。
22.权利要求21的转基因细胞，其中该合成多核苷酸与SEQ ID NO:1具有至少90％序列同一性。
23.权利要求21的转基因细胞，其中该合成多核苷酸包含内含子。
24.权利要求21的转基因细胞，其中该内含子与选自下组的内含子具有至少90％的序列同一性：水稻肌动蛋白内含子、玉米泛素内含子、和拟南芥泛素10内含子。
25.权利要求21的转基因细胞，其中该合成多核苷酸包含5′非翻译区。
26.权利要求21的转基因细胞，其中该转基因细胞是转基因植物细胞。
27.权利要求26的转基因细胞，其中该转基因植物细胞是通过植物转化方法产生的。
28.权利要求27的转基因细胞，其中该植物转化方法选自下组：土壤杆菌介导的转化法、生物射弹转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。
29.一种转基因植物，其包含权利要求26的转基因植物细胞。
30.权利要求29的转基因植物，其中该转基因植物是单子叶植物或双子叶植物。
31.权利要求30的转基因植物，其中该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。
32.一种转基因种子，其来自权利要求29的转基因植物。
33.权利要求21的转基因细胞，其中该启动子是组织优先启动子。
34.权利要求21的转基因细胞，其中该组织优先启动子是胚珠或种子组织优先启动子。
35.权利要求21的转基因细胞，其中该合成多核苷酸包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。
36.一种纯化的多核苷酸序列，其中该纯化的多核苷酸序列包含在严格条件下与下述多核苷酸探针杂交的多核苷酸，该多核苷酸探针包含与SEQ ID NO:1的互补物的至少90％的序列同一性。
37.权利要求36的纯化的多核苷酸序列，其中该纯化的多核苷酸与SEQ ID NO:1具有至少90％序列同一性。
38.权利要求36的纯化的多核苷酸序列，其中该纯化的多核苷酸包含内含子。
39.权利要求36的纯化的多核苷酸序列，其中该内含子与选自下组的内含子具有至少
90％的序列同一性：水稻肌动蛋白内含子、玉米泛素内含子、和拟南芥泛素10内含子。
40.权利要求36的纯化的多核苷酸序列，其中该纯化的多核苷酸包含5′非翻译区。
41.权利要求36的纯化的多核苷酸序列，其中该纯化的多核苷酸序列与转基因可操作连接。
42.权利要求41的可操作连接的转基因，其中该可操作连接的转基因编码多肽或为小RNA。
43.一种基因表达盒，其包含权利要求41的与转基因可操作连接的纯化的多核苷酸序列，该序列与3′-非翻译区可操作连接。
44.权利要求43的基因表达盒，其中该3′非翻译区与SEQ ID NO:2具有至少90％序列同一性。
45.权利要求43的基因表达盒，其中该转基因选自下组：杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、和选择标志物转基因。
46.一种重组载体，其包含权利要求43的基因表达盒。
47.权利要求46的重组载体，其中该载体选自下组：质粒载体、粘粒载体、和BAC载体。
48.一种转基因细胞，其包含权利要求43的基因表达盒。
49.权利要求48的转基因细胞，其中该转基因细胞是转基因植物细胞。
50.一种转基因植物，其包含权利要求49的转基因植物细胞。
51.权利要求50的转基因植物，其中该转基因植物是单子叶植物或双子叶植物。
52.权利要求51的转基因植物，其中该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物、和棉花植物。
53.一种转基因种子，其来自权利要求50的转基因植物。
54.权利要求36的纯化的多核苷酸序列，其中该纯化的多核苷酸序列促进转基因的组织优先表达。
55.权利要求54的纯化的多核苷酸序列，其中该纯化的多核苷酸序列促进转基因的胚珠或种子组织优先表达。
56.权利要求36的纯化的多核苷酸序列，其中该纯化的多核苷酸序列包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。
57.一种在转基因植物中表达异源编码序列的方法，该方法包括：
用基因表达盒转化植物细胞，所述基因表达盒包含与异源编码序列可操作连接的多核苷酸序列，所述多核苷酸序列包含与SEQ ID NO:1的至少90％序列同一性，所述异源编码序列与3′-非翻译区可操作连接；
分离包含该基因表达盒的经转化的植物细胞；
使该经转化的植物细胞再生为转基因植物；和，
获得转基因植物，其中该转基因植物包含含有SEQ ID NO:1的多核苷酸序列的基因表达盒。
58.权利要求57的方法，其中该多核苷酸序列包含内含子。
59.权利要求58的方法，其中该内含子与选自下组的内含子具有至少90％的序列同一性：水稻肌动蛋白内含子、玉米泛素内含子、和拟南芥泛素10内含子。
60.权利要求57的方法，其中该多核苷酸序列包含5′非翻译区。
61.权利要求57的方法，其中该异源编码序列选自下组：杀虫抗性编码序列、除草剂耐受性编码序列、氮利用效率编码序列、水分利用效率编码序列、营养品质编码序列、DNA结合编码序列、和选择标志物编码序列。
62.权利要求57的方法，其中转化植物细胞是植物转化方法。
63.权利要求62的方法，其中该植物转化方法选自下组：土壤杆菌介导的转化法、生物射弹转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。
64.权利要求57的方法，其中该转基因植物是单子叶转基因植物或双子叶转基因植物。
65.权利要求64的方法，其中该双子叶转基因植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物、和棉花植物。
66.一种转基因种子，其来自权利要求57的转基因植物。
67.权利要求57的方法，其中该异源编码序列在组织中优先表达。
68.权利要求57的方法，其中该异源编码序列在胚珠或种子组织中表达。
69.权利要求57的方法，其中该多核苷酸序列包含SEQ ID NO:1的核苷酸1-1483的序列。
70.一种分离包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列的方法，该方法包括：
鉴定包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；
产生多个寡核苷酸引物序列，其中所述寡核苷酸引物序列与所述包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列结合；
用选自所述多个寡核苷酸引物序列的寡核苷酸引物序列从DNA样品扩增所述包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列，和，
分离所述包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列。
71.权利要求70的方法，其中该分离的多核苷酸序列包含内含子。
72.权利要求71的方法，其中该内含子与选自下组的内含子具有至少90％的序列同一性：水稻肌动蛋白内含子、玉米泛素内含子、和拟南芥泛素10内含子。
73.权利要求70的方法，其中该分离的多核苷酸序列包含5′非翻译区。
74.权利要求70的方法，其中该分离的多核苷酸序列与转基因可操作连接。
75.权利要求74的方法，其中该可操作连接的转基因编码多肽。
76.一种基因表达盒，其包含与SEQ ID NO:1具有至少90％序列同一性的多核苷酸序列，该多核苷酸序列与转基因可操作连接，其中该转基因与3′-非翻译区可操作连接。
77.权利要求76的基因表达盒，其中该转基因选自下组：杀虫抗性编码序列、除草剂耐受性编码序列、氮利用效率编码序列、水分利用效率编码序列、营养品质编码序列、DNA结合编码序列、和选择标志物编码序列。
78.权利要求76的基因表达盒，其中该3′非翻译区与SEQ ID NO:2具有至少90％序列同一性。
79.一种重组载体，其包含权利要求76的基因表达盒。
80.权利要求79的重组载体，其中该载体选自下组：质粒载体、粘粒载体、和BAC载体。
81.一种转基因细胞，其包含权利要求76的基因表达盒。
82.权利要求81的转基因细胞，其中该转基因细胞是转基因植物细胞。
83.一种转基因植物，其包含权利要求82的转基因植物细胞。
84.权利要求83的转基因植物，其中该转基因植物是单子叶植物或双子叶植物。
85.权利要求84的转基因植物，其中该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物、和棉花植物。
86.一种转基因种子，其来自权利要求83的转基因植物。
87.权利要求76的方法，其中该分离的多核苷酸序列包含SEQ ID NO:1的核苷酸1-1483的序列。
88.一种制造包含与SEQ ID NO:1的至少90％序列同一性的合成多核苷酸序列的方法，该方法包括：
鉴定包含SEQ ID NO:1的多核苷酸序列；
分离包含SEQ ID NO:1的多核苷酸序列；
定义多个包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；
合成包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；和，
制造包含与SEQ ID NO:1的至少90％序列同一性的合成多核苷酸序列。
89.权利要求88的方法，其中该合成包括：
鉴定包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；
产生多个寡核苷酸引物序列，其中所述寡核苷酸引物序列与包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列结合；
连接所述多个寡核苷酸引物序列以合成包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列。
90.权利要求88的方法，其中该合成多核苷酸序列包含内含子。
91.权利要求90的方法，其中该内含子与选自下组的内含子具有至少90％的序列同一性：水稻肌动蛋白内含子、玉米泛素内含子、和拟南芥泛素10内含子。
92.权利要求1的基因表达盒，其中该多核苷酸具有。
93.权利要求88的方法，其中所述合成多核苷酸序列包含5′非翻译区。
94.权利要求88的方法，其中所述合成多核苷酸序列与转基因可操作连接。
95.权利要求93的方法，其中所述可操作连接的转基因编码多肽。
96.一种基因表达盒，其包含权利要求93的与转基因可操作连接的包含与SEQ ID NO:1的至少90％序列同一性的合成多核苷酸序列，所述转基因与3′-非翻译区可操作连接。
97.权利要求95的基因表达盒，其中该转基因选自下组：杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、和选择标志物转基因。
98.权利要求95的基因表达盒，其中该3′非翻译区与SEQ ID NO:2具有至少90％序列同一性。
99.一种重组载体，其包含权利要求95的基因表达盒。
100.权利要求98的重组载体，其中该载体选自下组：质粒载体、粘粒载体、和BAC载体。
101.一种转基因细胞，其包含权利要求95的基因表达盒。
102.权利要求100的转基因细胞，其中该转基因细胞是转基因植物细胞。
103.一种包含权利要求101的转基因植物细胞的转基因植物。
104.权利要求102的转基因植物，其中该转基因植物是单子叶植物或双子叶植物。
105.权利要求103的转基因植物，其中该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物、和棉花植物。
106.一种转基因种子，其来自权利要求102的转基因植物。
107.权利要求88的方法，其中该合成多核苷酸序列包含SEQ ID NO:1的核苷酸1-1483的序列。

说明书全文

通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子

[0001] 优先权声明

[0002] 本申请要求2015年1月6日提交的主题为“BRASSICA NAPUS SEED SPECIFIC PROMOTERS IDENTIFIED BY MICROARRAY ANALYSIS”的美国临时专利申请系列号62/100,394的申请日的利益，将此专利完整并入本文。
发明领域

[0003] 本发明一般而言涉及植物分子生物学领域，更具体地说，涉及转基因在植物中的表达领域。

[0004] 背景

[0005] 许多植物物种能够被转基因转化，以引入农艺学上期望的性状或特征。得到的转基因植物物种被开发和/或修饰为具有特定的期望性状。通常，期望的性状包括例如，提高营养价值质量，增加产量，赋予抗虫性或抗病性，增加干旱和胁迫耐受性，提高园艺质量(例如，着色和生长)，赋予除草剂耐受性，使得能够从植物生产在工业上有用的化合物和/或材料，和/或使得能够生产药物。

[0006] 通过植物转化技术来生产包含叠加在单个基因组基因座处的多个转基因的转基因植物物种。植物转化技术的结果是，转基因被导入植物细胞中，回收在植物基因组中含有转基因的稳定整合拷贝的能育转基因植物、并且后续通过植物基因组的转录和翻译而表达转基因，从而生成具有期望性状和表型的转基因植物。然而期望有这样的机制，能够产生高表达被构建为性状堆叠(trait stack)的多个转基因的转基因植物物种。

[0007] 同样，期望有这样的机制，能够在植物的特定组织或器官内表达转基因。例如，可以借助土传病原体，用病原体抗性基因转化植物基因组，使得病原体抗性蛋白在植物根内强表达，从而增加植物对感染的抵抗力。或者，可以在处于特定的生长或发育阶段(例如细胞分裂或伸长)的植物组织中表达转基因。此外，可以在植物的叶和茎组织中表达转基因。

[0008] 本文中描述了甘蓝型油菜ACC OX基因启动子调控元件、含有甘蓝型油菜ACC OX基因启动子调控元件的构建体/载体、以及利用甘蓝型油菜ACC OX基因启动子调控元件的方法。

[0009] 概要

[0010] 本文公开了用于在植物细胞和/或植物组织中表达转基因的序列、构建体和方法。在一个实施方案中，本公开涉及包含与转基因可操作连接的启动子的基因表达盒，其中该启动子包含在严格条件下与这样的多核苷酸探针杂交的多核苷酸，该多核苷酸探针包含与SEQ ID NO:1的互补物的至少90％序列同一性。在进一步的实施方案中，该启动子包含与SEQ ID NO:1具有至少90％序列同一性的多核苷酸。在另外的实施方案中，启动子包含含有内含子的多核苷酸。在其他实施方案中，所述内含子与水稻肌动蛋白内含子、玉米泛素内含子或拟南芥泛素10内含子具有至少90％序列同一性。在一个实施方案中，启动子包含含有
5′非翻译区的多核苷酸。在其他实施方案中，所述可操作连接的转基因编码多肽或小RNA。
在后续的实施方案中，所述转基因选自下组：杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、和选择标志物转基因。在又另一个实施方案中，所述基因表达盒进一步包含3′-非翻译区。在一个实施方案中，该3′-非翻译区包含与SEQ ID NO:2具有至少90％序列同一性的多核苷酸。在一个实施方案中，重组载体包含所述基因表达盒。在实施方案的一个另外的方面，该重组载体选自下组：
质粒、粘粒、细菌人工染色体、病毒、和噬菌体。在一个实施方案中，转基因细胞包含所述基因表达盒。在该实施方案的一个后续的方面，该细胞是转基因植物细胞。在一个实施方案中，转基因植物包含所述转基因植物细胞。在该实施方案的一个另外的方面，该转基因植物是单子叶植物或双子叶植物。在该实施方案的其他方面，该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。在一个实施方案中，从转基因植物获得转基因种子。在一个后续的实施方案中，该启动子是组织优先启动子。在一个另外的实施方案中，该组织优先启动子是胚珠或种子组织优先启动子。在一个实施方案中，该种子组织优先启动子是胚乳组织优先启动子。在又另一个实施方案中，启动子包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。

[0011] 在一个实施方案中，本公开涉及包含在严格条件下与多核苷酸探针杂交的合成多核苷酸的转基因细胞，所述多核苷酸探针包含SEQ ID NO:1的互补物的至少90％序列同一性。在一个另外的实施方案中，该合成多核苷酸与SEQ ID NO:1具有至少90％序列同一性。在另外的实施方案中，合成多核苷酸包括含有内含子的多核苷酸。在其他实施方案中，所述内含子与水稻肌动蛋白内含子、玉米泛素内含子或拟南芥泛素10内含子具有至少90％序列同一性。在一个实施方案中，该合成多核苷酸包含5′非翻译区。在一个另外的实施方案中，该转基因细胞是转基因植物细胞。在后续的实施方案中，该转基因植物细胞是通过植物转化方法产生的。在一个另外的实施方案中，植物转化方法选自下组：土壤杆菌介导的转化法、生物射弹转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在一个实施方案中，转基因植物包含所述转基因植物细胞。在一个另外的实施方案中，该转基因植物是单子叶植物或双子叶植物。在其他实施方案中，该单子叶植物选自下组：玉米植物、水稻植物、和小麦植物。在该实施方案的其他方面，该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。在一个实施方案中，从转基因植物获得转基因种子。在一个另外的实施方案中，该启动子是组织优先启动子。在一个另外的实施方案中，该组织优先启动子是胚珠或种子组织优先启动子。在一个实施方案中，该种子组织优先启动子是胚乳组织优先启动子。在另一个实施方案中，该合成多核苷酸包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。

[0012] 在一个实施方案中，本公开涉及纯化的多核苷酸启动子，其中该启动子包含在严格条件下与这样的多核苷酸探针杂交的多核苷酸，所述多核苷酸探针包含SEQ ID NO:1的互补物的至少90％序列同一性。在进一步的实施方案中，所述纯化的多核苷酸启动子与SEQ ID NO:1具有至少90％序列同一性。在另外的实施方案中，所述纯化的多核苷酸启动子包含含有内含子的多核苷酸。在其他实施方案中，所述内含子与水稻肌动蛋白内含子、玉米泛素内含子或拟南芥泛素10内含子具有至少90％同一性。在一个实施方案中，所述纯化的多核苷酸启动子包含5′非翻译区。在另一个实施方案中，该纯化的多核苷酸与转基因可操作连接。在后续的实施方案中，所述可操作连接的转基因编码多肽或者是小RNA。在一个实施方案中，基因表达盒包含与转基因可操作连接的纯化的多核苷酸序列，其与3′-非翻译区可操作连接。在一个实施方案中，该3′-非翻译区包含与SEQ ID NO:2具有至少90％序列同一性的多核苷酸。在另一个实施方案中，所述转基因选自下组：杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、和选择标志物转基因。在一个实施方案中，重组载体包含所述基因表达盒。在另外的实施方案中，重组载体选自下组：质粒载体、粘粒载体和BAC载体。在一个实施方案中，转基因细胞包含所述基因表达盒。在一个后续的实施方案中，该转基因细胞是转基因植物细胞。在一个实施方案中，转基因植物包含所述转基因植物细胞。在一个另外的实施方案中，该转基因植物是单子叶或双子叶植物。在又另外的实施方案中，所述单子叶植物选自玉米植物、小麦植物、和水稻植物。在该实施方案的其他方面，该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。在一个实施方案中，从转基因植物获得转基因种子。在后续的实施方案中，该纯化的多核苷酸序列促进转基因的组织优先表达。在一个另外的实施方案中，该组织优先启动子是胚珠或种子组织优先启动子。在一个实施方案中，该种子组织优先启动子是胚乳组织优先启动子。在其他实施方案中，所述纯化的多核苷酸包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。

[0013] 在一个实施方案中，本公开涉及一种在转基因植物中表达异源编码序列的方法，该方法包括：

[0014] a)用包含与异源编码序列可操作连接的多核苷酸序列的基因表达盒转化植物细胞，所述多核苷酸序列包含与SEQ ID NO:1的至少90％序列同一性，所述异源编码序列与3′-非翻译区可操作连接；

[0015] b)分离包含该基因表达盒的转化的植物细胞；

[0016] c)使该转化的植物细胞再生为转基因植物；和

[0017] d)获得转基因植物，其中该转基因植物包含含有SEQ ID NO:1的多核苷酸序列的基因表达盒。

[0018] 在另外的实施方案中，该多核苷酸序列包含内含子。在其他实施方案中，所述内含子与水稻肌动蛋白内含子、玉米泛素内含子或拟南芥泛素10内含子具有至少90％序列同一性。在一个实施方案中，该多核苷酸序列与SEQ ID NO:1具有至少90％序列同一性。在一个另外的实施方案中，该异源编码序列选自下组：杀虫抗性编码序列、除草剂耐受性编码序列、氮利用效率编码序列、水分利用效率编码序列、营养品质编码序列、DNA结合编码序列、和选择标志物编码序列。在一个另外的实施方案中，利用植物转化方法转化植物细胞。在又另一个实施方案中，植物转化方法选自下组：土壤杆菌介导的转化法、生物射弹转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在其他实施方案中，所述转基因植物是单子叶转基因植物或双子叶转基因植物。在其他实施方案中，所述单子叶植物选自玉米植物、小麦植物、和水稻植物。在一个实施方案中，从转基因植物获得转基因种子。在该实施方案的其他方面，该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。在一个另外的实施方案中，该异源编码序列优先在组织中表达。在一个另外的实施方案中，该组织优先启动子是胚珠或种子组织优先启动子。在一个实施方案中，该种子组织优先启动子是胚乳组织优先启动子。在其他实施方案中，所述多核苷酸包含SEQ ID NO:1的核苷酸1-1483的序列。

[0019] 在一个实施方案中，本公开涉及分离包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列的方法，该方法包括：

[0020] a)鉴定包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；

[0021] b)产生多个寡核苷酸引物序列，其中所述寡核苷酸引物序列与包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列结合；

[0022] c)用选自多个寡核苷酸引物序列的寡核苷酸引物序列从DNA样品扩增包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列，和

[0023] d)分离包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列。

[0024] 在另外的实施方案中，该多核苷酸序列包含内含子。在其他实施方案中，所述内含子与水稻肌动蛋白内含子、玉米泛素内含子或拟南芥泛素10内含子具有至少90％序列同一性。在一个实施方案中，该多核苷酸序列包含5′非翻译区。在一个另外的实施方案中，包含与SEQ ID NO:1的至少90％序列同一性的分离的多核苷酸序列与转基因可操作连接。在一个另外的实施方案中，所述可操作连接的转基因编码多肽。在一个实施方案中，基因表达盒包含与转基因可操作连接的包含与SEQ ID NO:1具有至少90％序列同一性的多核苷酸序列，其中该转基因与3′-非翻译区可操作连接。在一个实施方案中，该3′-非翻译区包含与SEQ ID NO:2具有至少90％序列同一性的多核苷酸。在一个另外的实施方案中，该转基因选自下组：杀虫抗性编码序列、除草剂耐受性编码序列、氮利用效率编码序列、水分利用效率编码序列、营养品质编码序列、DNA结合编码序列、和选择标志物编码序列。在一个实施方案中，重组载体包含所述基因表达盒。在一个另外的实施方案中，该载体选自下组：质粒载体、粘粒载体和BAC载体。在一个实施方案中，转基因细胞包含所述基因表达盒。在一个另外的实施方案中，该转基因细胞是转基因植物细胞。在一个实施方案中，转基因植物包含所述转基因植物细胞。在一个另外的实施方案中，该转基因植物是单子叶植物或双子叶植物。在一个另外的实施方案中，该单子叶植物选自下组：玉米植物、小麦植物、和水稻植物。在一个实施方案中，从转基因植物获得转基因种子。在该实施方案的其他方面，该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。在其他实施方案中，所述分离的多核苷酸包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。

[0025] 在一个实施方案中，本公开涉及制造包含与SEQ ID NO:1的至少90％序列同一性的合成多核苷酸序列的方法，该方法包括：

[0026] a)鉴定包含SEQ ID NO:1的多核苷酸序列；

[0027] b)分离包含SEQ ID NO:1的多核苷酸序列；

[0028] c)确定多个包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；

[0029] d)合成包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；和

[0030] e)制造包含与SEQ ID NO:1的至少90％序列同一性的合成多核苷酸序列。

[0031] 在一个另外的实施方案中，该合成包括：

[0032] a)鉴定包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列；

[0033] b)产生多个寡核苷酸引物序列，其中所述寡核苷酸引物序列与包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列结合；

[0034] c)连接所述多个寡核苷酸引物序列，以合成包含与SEQ ID NO:1的至少90％序列同一性的多核苷酸序列。

[0035] 在另外的实施方案中，所述合成的多核苷酸序列包含内含子。在其他实施方案中，所述内含子与水稻肌动蛋白内含子、玉米泛素内含子或拟南芥泛素10内含子具有至少90％序列同一性。在一个实施方案中，所述合成的多核苷酸序列包含5′非翻译区。在一个另外的实施方案中，所述合成的多核苷酸序列包含与SEQ ID NO:1的至少90％序列同一性，其与转基因可操作连接。在又另一个实施方案中，所述可操作连接的转基因编码多肽。在一个实施方案中，基因表达盒包含与转基因可操作连接的包含与SEQ ID NO:1的至少90％序列同一性的合成多核苷酸序列，所述转基因与3′-非翻译区可操作连接。在一个实施方案中，该3′-非翻译区包含与SEQ ID NO:2具有至少90％序列同一性的多核苷酸。在又另一个实施方案中，所述转基因选自下组：杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、和选择标志物转基因。在一个实施方案中，重组载体包含所述基因表达盒。在另外的实施方案中，重组载体选自下组：质粒载体、粘粒载体和BAC载体。在一个实施方案中，转基因细胞包含所述基因表达盒。在一个另外的实施方案中，该转基因细胞是转基因植物细胞。在一个实施方案中，转基因植物包含所述转基因植物细胞。在一个另外的实施方案中，该转基因植物是单子叶或双子叶植物。在其他实施方案中，所述单子叶植物选自下组：玉米植物、小麦植物、和水稻植物。在该实施方案的其他方面，该双子叶植物选自下组：拟南芥属植物、烟草植物、大豆植物、卡诺拉植物和棉花植物。在一个实施方案中，从转基因植物获得转基因种子。在其他实施方案中，所述合成的多核苷酸包含SEQ ID NO:1的核苷酸1-1483的多核苷酸序列。

[0036] 在一个实施方案中，构建体包括包含SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子的基因表达盒。在一个实施方案中，基因表达盒包含与转基因或异源编码序列可操作连接的具有SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子。在一个实施方案中，基因表达盒包含与转基因可操作连接的具有SEQ ID NO:2的甘蓝型油菜ACC OX基因3′-UTR。在一个实施方案中，基因表达盒包含与启动子可操作连接的具有SEQ ID NO:2的甘蓝型油菜ACC OX基因3′-UTR。在一个另外的实施方案中，基因表达盒包含与具有SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子可操作连接的具有SEQ ID NO:2的甘蓝型油菜ACC OX基因3′-UTR。在一个实施方案中，基因表达盒包含与转基因或异源编码序列可操作连接的具有SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子。在一个实施方案中，基因表达盒包含至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、或更多个转基因。

[0037] 在一个实施方案中，基因表达盒独立地包含：a)SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子，和b)SEQ ID NO:2的甘蓝型油菜ACC OX基因3′-UTR。

[0038] 本文中公开了使用SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子和SEQ ID NO:2的3′-UTR培育表达转基因的植物的方法。本文中还公开了使用SEQ ID NO:1的甘蓝型油菜ACC OX基因启动子和SEQ ID NO:2的3′-UTR培养表达转基因的植物组织和细胞的方法。在一个实施方案中，本文中公开的方法包括在植物叶和茎中的组织特异性基因表达。

[0039] 在一个实施方案中，基因表达盒包括从甘蓝型油菜ACC OX基因获得的启动子多核苷酸序列SEQ ID NO:1。

[0040] 附图简述

[0041] 图1显示了pDAB113904的质粒图。

[0042] 图2显示了pDAB9381的质粒图。

[0043] 图3是转基因拟南芥植物组织中黄色荧光蛋白表达模式的显微镜图像。小图F中提供的图像显示了在拟南芥植物组织的根内YFP蛋白的表达，其由甘蓝型油菜ACC OX启动子驱动并以如pDAB113904中所述的3′UTR调控元件终止。小图G中提供的图像显示了在其他植物组织例如茎生叶、花、花柄、种子、和花中YFP蛋白的表达，其由甘蓝型油菜ACC OX启动子驱动并以如pDAB113904中所述的3′UTR调控元件终止。茎生叶、花、花柄、种子和花组织中YFP蛋白的表达在多拷贝事件中观察到。小图H中提供的图像显示了YFP蛋白的早期胚珠表达，定位于胚乳，由甘蓝型油菜ACC OX启动子驱动并以如pDAB113904中所述的3′UTR调控元件终止。

[0044] 实施本发明的模式

[0045] 定义

[0046] 如本文中使用的，冠词“一个(a)”、“一种(an)”和“该(the)”包括复数指称，除非根据上下文另外清楚且无歧义地另有所指。

[0047] 如本文中使用的，术语“回交”是指其中育种者使杂交后代与亲本之一杂交，例如，第一代杂种F1与F1杂种的亲本基因型之一杂交的过程。

[0048] 如本文中使用的，术语“内含子”是指包含在基因(或表达的感兴趣核苷酸序列)中的被转录不被翻译的任何核酸序列。内含子包括表达的DNA序列之内的非翻译核酸序列、以及从所述DNA序列转录的RNA分子中的相应序列。

[0049] 本文中描述的构建体还可以含有增强翻译和/或mRNA的稳定性的序列，如内含子。这样的内含子的实例是拟南芥组蛋白变体的基因II的第一内含子或任何其他公知的内含子序列。内含子可与启动子序列联合用于增强翻译和/或mRNA的稳定性。

[0050] 如本文中使用的，术语“5′非翻译区”或“5′-UTR”是指前mRNA或成熟mRNA的5′端中的非翻译区段。例如，在成熟mRNA上，5′-UTR一般在其5′端上包含7-甲基鸟苷帽并涉及许多过程，如剪接、多腺苷酸化、mRNA朝向细胞质输出、翻译机器对mRNA的5′端的识别、以及保护mRNA免于降解。

[0051] 如本文中使用的，术语“3′非翻译区”或“3′-UTR”是指前mRNA或成熟mRNA的3′端中的非翻译区段。例如，在成熟mRNA上，这个区域包含多聚(A)尾并且已知其在mRNA稳定性、翻译起始、和mRNA输出中具有多种作用。

[0052] 如本文中使用的，术语“多腺苷酸化信号”是指存在于mRNA转录物中的核酸序列，当存在多聚(A)聚合酶时，所述核酸序列允许转录物在例如位于多聚(A)信号的下游的10到30个碱基的多腺苷酸化位点上被多腺苷酸化。许多多腺苷酸化信号在本领域是已知的，并可用于本发明。示例序列包括AAUAAA及其变体，正如描述于Loke J.等人，(2005),Plant Physiology 138(3)；1457-1468。

[0053] 如本文中使用的，术语“分离的”是指这样的生物学组分(包括核酸或蛋白质)，其已经从该组分所天然存在的生物细胞中的其他生物学组分(即，其他染色体和染色体外的DNA)分离。

[0054] 如本文中使用的，关于核酸分子的术语“纯化的”并不要求绝对的纯度(比如同质的制备物)；而是说明序列相对于其在天然细胞环境中时更纯(与天然水平相比，这个水平例如就浓度或基因表达水平而言应当至少高2-5倍)。DNA分子可以直接地获自总基因组DNA或获自总基因组RNA。另外，cDNA克隆并非天然存在，而是优选地经由部分纯化的、天然存在的物质(通过逆转录酶聚合酶逆转录的信使RNA)的操作获得。从mRNA构建cDNA文库涉及合成物质(cDNA)的创建。通过携带该cDNA文库的细胞的克隆选择，可从该合成文库纯化单独的cDNA克隆。因此，包括从mRNA构建cDNA文库和纯化独特的cDNA克隆的过程导致天然信息的大约106倍纯化。同样，可将启动子DNA序列克隆到质粒中。这样的克隆并非天然存在，而是优选地经由部分纯化的、天然存在的物质(比如基因组DNA文库)的操作获得或直接从基因组DNA获得。因此，在这些技术中有利于至少一个数量级、优选两个或三个数量级、更优选四个或五个数量级的纯化。

[0055] 类似地，“纯化”表示在组分DNA序列中已经发生化学或功能变化。已经“纯化的”核酸分子和蛋白质包括通过标准纯化方法纯化的核酸分子和蛋白质。术语“纯化的”还包括通过重组DNA方法在宿主细胞(例如，植物细胞)中制备的核酸分子和蛋白质，以及化学合成的核酸分子、蛋白质、和肽。

[0056] 术语“重组(的)”指的是其中已经发生遗传重组的细胞或生物。还包括已经通过人为干预以人工或合成方式(即，非天然)改变的分子(例如，载体、质粒、核酸、多肽、或小RNA)。改变可以对处于天然环境或状态中的分子进行，或者对已被移出其天然环境或状态的分子进行。

[0057] 如本文中使用的，术语“表达”是指将多核苷酸转录为mRNA(包括小RNA分子)的过程和/或藉此随后将转录的mRNA(也称为“转录物”)翻译成肽、多肽、或蛋白质的过程。基因表达可能受到外部信号的影响，例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从DNA到RNA再到蛋白质的途径中的任何位置受到调节。例如，通过控制对转录、翻译、RNA运输和加工、中间分子比如mRNA的降解的作用，或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解，或它们的组合，由此发生基因表达的调节。通过本领域已知的任何方法，包括但不限于，Northern印迹、RT-PCR、Western印迹，或体外、原位或体内蛋白活性测定，可以在RNA水平或蛋白质水平测量基因表达。

[0058] 如本文中使用的，术语“基于同源性的基因沉默”或“HBGS”为通用术语，包括转录基因沉默和转录后基因沉默两者。靶基因座被与之未连锁的沉默基因座所沉默的原因可能是由于转录抑制(转录基因沉默；TGS)或mRNA降解(转录后基因沉默；PTGS)，二者分别是由于对应于启动子或转录序列的双链RNA(dsRNA)的产生所致。在每个过程中涉及不同的细胞组分表明，dsRNA诱导的TGS和PTGS很可能是由于某种古老的普遍机制发生了多样化的结果。然而，由于通常依赖于分析不同的沉默基因座，已经难于实现TGS和PTGS的严格比较。由于产生对应于不同靶基因的启动子和转录序列的dsRNA，一个转基因基因座可能被描述为既触发TGS又触发PTGS。

[0059] 如本文中使用的，术语“核酸分子”、“核酸”、或“多核苷酸”(所有这三个术语彼此同义)是指核苷酸的聚合形式，其可包括RNA、cDNA、基因组DNA、和合成形式的正义和反义链、及其混合聚合物。“核苷酸”可以是指核糖核苷酸、脱氧核糖核苷酸、或这两种类型核苷酸的任一者的修饰形式。除非另外指明，核酸分子通常在长度上具有至少10个碱基。所述术语可以指具有不确定长度的RNA或DNA分子。所述术语包括DNA的单和双链形式。核酸分子可以包括天然存在的核苷酸和/或修饰核苷酸，它们通过天然存在和/或非天然存在的核苷酸连接而连接在一起。

[0060] 正如本领域技术人员易于理解的那样，核酸分子可被化学修饰或生物化学修饰，或者可以含有非天然的或衍生的核苷酸碱基。这些修饰包括，例如，标记物、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰(例如，如不带电连接(uncharged linkage)的修饰：例如甲基膦酸盐、磷酸三酯、氨基磷酸酯、氨基甲酸酯等；带电连接(charged linkage)的修饰：例如，硫代磷酸酯、二硫代磷酸酯等；悬垂部分的修饰：例如肽类；嵌入剂修饰：例如吖啶、补骨脂素等；螯合剂修饰；烷化剂(alkylator)修饰；和修饰的连接：例如α异头核酸等)。术语“核酸分子”还包括任何拓扑结构，包括单链的、双链的、部分双链体的、三链体的、发夹形的(hairpinned)、圆形的、和挂锁形的结构。

[0061] 转录以5′到3′的方式沿着DNA链行进。这表明RNA是通过向生长中的链的3′端连续添加5′-核糖核苷三磷酸而产生的(消除焦磷酸盐是必不可少的)。在线性或环形核酸分子中，如果离散元件以从另一个元件的5′方向结合到或将要结合到同一核酸上，则所述离散元件(例如，特定的核苷酸序列)可被称为相对于所述另一个元件的“上游”。类似地，如果离散元件以从另一个元件的3′方向结合到或将要结合到同一核酸上，则所述离散元件可为相对于所述另一个元件的“下游”。

[0062] 如本文中使用的，术语“碱基位置”是指在指定核酸之内的给定碱基或核苷酸残基的位置。通过与参考核酸的比对可定义指定核酸。

[0063] 如本文中使用的，术语“杂交”是指其中寡核苷酸及其类似物通过互补碱基之间的氢键杂交的过程，所述氢键包括Watson-Crick、Hoogsteen或反Hoogsteen氢键。通常，核酸分子由含氮碱基组成，所述碱基为嘧啶(胞嘧啶(C)、尿嘧啶(U)和胸腺嘧啶(T))或嘌呤(腺嘌呤(A)和鸟嘌呤(G))。这些含氮碱基在嘧啶和嘌呤之间形成氢键，并且嘧啶与嘌呤的键合被称为“碱基配对”。更具体地，A会与T或U键合，而G会与C键合。“互补”指在两条不同的核酸序列或同一核酸序列的两个不同区域之间发生的碱基配对。

[0064] 如本文中使用的，术语“可特异性杂交”和“特异性互补”是指足够的互补程度，使得在寡核苷酸与DNA或RNA靶标之间发生稳定的和特异性的结合。寡核苷酸与和它特异性杂交的靶序列不必100％互补。当寡核苷酸与靶DNA或RNA分子的结合可干扰该DNA或RNA的正常功能，并且有足够的互补程度以避免该寡核苷酸在期望特异性结合的条件下(例如在体内测定或系统情形的生理条件下)与非靶序列发生非特异性结合时，该寡核苷酸是可特异性杂交的。这样的结合被称为特异性杂交。导致特定严格程度的杂交条件会根据选择的杂交方法的性质和杂交的核酸序列的组成和长度而变化。通常，杂交温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg2+浓度)有助于杂交的严格性，尽管洗涤时间也影响严格性。关于得到特定严格程度所需要的杂交条件的计算论述于Sambrook等人(编辑),Molecular Cloning:A Laboratory Manual,第2版,1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York,1989。

[0065] 如本文中使用的，“严格条件”涵盖这样的条件，在该条件下，只有当杂交分子与DNA靶之间的错配小于50％时才发生杂交。“严格条件”包括更具体的严格性水平。因此，如本文中使用的，“中等严格性”条件为具有50％以上序列错配的分子不会杂交的条件；“高严格性”条件为具有20％以上错配的分子不会杂交的条件；并且“极高严格性”条件为具有10％以上错配的序列不会杂交的条件。

[0066] 在特定的实施方案中，严格条件可包括：在65℃杂交，然后在65℃用0.1x SSC/0.1％SDS洗涤40分钟。以下是代表性的非限制性杂交条件：

[0067] ·极高严格性：在5x SSC缓冲液中在65℃杂交16小时；在2x SSC缓冲液中在室温下洗涤两次，每次15分钟；并且在0.5x SSC缓冲液中在65℃洗涤两次，每次20分钟。

[0068] ·高严格性：在5-6x SSC缓冲液中在65-70℃杂交16-20小时；在2x SSC缓冲液中在室温下洗涤两次，每次5-20分钟；并且在1x SSC缓冲液中在55-70℃洗涤两次，每次30分钟。

[0069] ·中等严格性：在6x SSC缓冲液中在室温到55℃杂交16-20小时；在2-3x SSC缓冲液中在室温到55℃洗涤至少两次，每次20-30分钟。

[0070] 在一个实施方案中，可特异性杂交的核酸分子可在极高严格性杂交条件下保持结合。在一个实施方案中，可特异性杂交的核酸分子可在高严格性杂交条件下保持结合。在一个实施方案中，可特异性杂交的核酸分子可在中等严格性杂交条件下保持结合。

[0071] 如本文中使用的，术语“寡核苷酸”是指短的核酸聚合物。寡核苷酸可通过切割较长核酸区段、或通过使单独的核苷酸前体聚合而形成。自动合成仪能够合成在长度上高达几百个碱基对的寡核苷酸。由于寡核苷酸可与互补的核苷酸序列结合，它们可用作检测DNA或RNA的探针。由DNA组成的寡核苷酸(寡脱氧核糖核苷酸)可用于聚合酶链反应中，聚合酶链反应为用于扩增小DNA序列的技术。在聚合酶链反应中，寡核苷酸一般被称为“引物”，其允许DNA聚合酶延伸寡核苷酸并复制互补链。

[0072] 如本文中使用的，术语“聚合酶链式反应”或“PCR”是指其中微量核酸、RNA和/或DNA被扩增的程序或技术，正如美国专利No.4,683,195中所描述。通常，需要可用的来自感兴趣区域的末端的序列信息或其他信息，使得可以设计寡核苷酸引物；这些引物与有待扩增的模板的相对链在序列上相同或相似。两个引物的5′端核苷酸可与扩增材料的末端一致。PCR可用来扩增特异性RNA序列、来自总的基因组DNA的特异性DNA序列、和从总的细胞RNA、噬菌体或质粒序列等转录的cDNA。一般性的参考可见Mullis等人，Cold Spring Harbor Symp.Quant.Biol.,51:263(1987)；Erlich编辑,PCR Technology,(Stockton Press,NY,1989)。

[0073] 如本文中使用的，术语“引物”是指当条件适合于合成引物延伸产物时能够用作沿着互补链的合成的起始点的寡核苷酸。合成条件包括四种不同的脱氧核糖核苷三磷酸和诸如逆转录酶或DNA聚合酶的至少一种聚合诱导剂的存在。这些物质存在于适合的缓冲液中，所述缓冲液可包括作为辅因子或在不同的适当温度下影响诸如pH等条件的组分。引物优选地是单链序列，使得扩增效率得以最佳化，不过可以利用双链序列。

[0074] 如本文中使用的，术语“探针”是指与靶序列杂交的寡核苷酸或多核苷酸序列。在或型测定程序中，探针与位于两个引物的退火位点之间的靶部分杂交。探针包含约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸、或约五十个核苷酸。在一些实施方案中，探针包含从约八个核苷酸到约十五个核苷酸。

[0075] 在Southern印迹测定程序中，探针与附着到膜上的DNA片段杂交。探针包含约十个核苷酸、约100个核苷酸、约250个核苷酸、约500个核苷酸、约1,000个核苷酸、约2,500个核苷酸、或约5,000个核苷酸。在一些实施方案中，探针包含从约500个核苷酸到约2,500个核苷酸。

[0076] 探针可进一步包含可检测标记，例如，放射性标记、生物素化标记、荧光团(异硫氰酸荧光素，等)。可检测标记可直接地共价附接到探针寡核苷酸上，例如位于探针的5′端或探针的3′端。包含荧光团的探针还可进一步包含猝灭剂，例如，BLACK HOLE QUENCHERTM、IOWA BLACKTM，等。

[0077] 如本文中使用的，术语“序列同一性”或“同一性”可以互换地使用并且是指在针对多核苷酸或蛋白质片段的指定比较窗口上比对最大对应性时在共享相似碱基组成的两个序列中的核酸残基。

[0078] 如本文中使用的，术语“序列同一性百分比”是指通过在比较窗口上比较两个最优比对序列(例如核酸序列或氨基酸序列)确定的值，其中在该比较窗口中的序列部分可以包含相比于参考序列(不包含添加或缺失)的添加或缺失(即，空位)，以便于这两个序列的最优比对。通过确定相同核酸或氨基酸残基出现在两个序列中的位置的数目而产生匹配位置的数目，用匹配位置的数目除以比较窗口中的位置的总数，将结果乘以100而产生序列同一性的百分比，从而计算出该百分比。用于比较的序列比对方法是熟知的。各种程序和比对算法例如描述于Smith和Waterman(1981)Adv.Appl.Math.2:482；Needleman和Wunsch(1970)J.Mol.Biol.48:443；Pearson和Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444；Higgins和Sharp(1988)Gene 73:237-44；Higgins和Sharp(1989)CABIOS 5:151-3；Corpet等人(1988)Nucleic Acids Res.16:10881-90；Huang等人(1992)Comp.Appl.Biosci.8:
155-65；Pearson等人(1994)Methods Mol.Biol.24:307-31；Tatiana等人(1999)FEMS Microbiol.Lett.174:247-50。

[0079] 美国国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLASTTM；Altschul等人(1990)J.Mol.Biol.215:403-10)可从几个来源获得，包括美国国家生物技术信息中心(Bethesda,MD)、以及在互连网上，其与几种序列分析程序结合使用。怎样使用该程序确定序列同一性的描述可在互联网的BLASTTM的“帮助”部分获得。为了比较核酸序列，可以采用利用默认参数的BLASTTM(Blastn)程序的“Blast 2序列”函数。在用这种方法评估时，与参考序列具有较大相似性的核酸序列将显示出同一性百分比的增加。

[0080] 如本文中使用的，术语“可操作连接”是指被置于与另一种核酸的功能关系中的核酸。通常，“可操作连接”可意指连接的核酸是连续的。可通过连接在合适的限制性位点处完成连接。如果这样的位点不存在，则合成的寡核苷酸接头或连接子被连接或退火到核酸上，并且用于连接邻接的多核苷酸片段。然而，可操作连接的各元件不必是连续的。

[0081] 如本文中使用的，术语“启动子”是指通常位于基因上游(朝向基因的5′区)并且对于启动和驱动基因转录是需要的DNA区域。启动子可容许它所控制的基因的正确激活或阻抑。启动子可含有被转录因子识别的特异性序列。这些因子可与启动子DNA序列结合，导致RNA聚合酶的募集，所述RNA聚合酶从基因的编码区合成RNA。启动子通常是指位于基因上游的所有基因调控元件，包括上游启动子、5′-UTR、内含子、和前导序列。

[0082] 如本文中使用的，术语“上游启动子”是指足以指导转录起始的连续多核苷酸序列。如本文中使用的，上游启动子涵盖具有若干序列基序的转录起始位点，所述序列基序包括TATA盒、起始序列、TFIIB识别元件和其他启动子基序(Jennifer E.F.等人，(2002)Genes&Dev.,16:2583-2592)。该上游启动子对RNA聚合酶II提供作用位点，所述RNA聚合酶II为具有像TFIIA、B、D、E、F和H的基础或通用转录因子的多亚基酶。这些因子组装成转录前起始复合物，所述转录前起始复合物催化从DNA模板到RNA的合成。

[0083] 上游启动子的激活是通过另外的调节性DNA序列元件的序列完成的，其中各种蛋白质结合到调节性DNA序列元件上并且随后与转录起始复合物相互作用而激活基因表达。这些基因调节元件序列与特异性DNA结合因子相互作用。这些序列基序有时可称为顺式元件。组织特异性或发育特异性转录因子与之结合的这样的顺式元件可单独地或联合地在转录水平决定启动子的时空表达模式。这些顺式元件在它们在可操作连接的基因上发挥作用的控制类型方面变化很大。一些元件响应于环境反应(例如，温度、湿度、和伤害)起作用而增加可操作连接的基因的转录。其他的顺式元件可响应于发育线索(例如，萌发、种子成熟、和开花)或响应于空间信息(例如，组织特异性)。参见，例如，Langridge等人，(1989),Proc.Natl.Acad.Sci.USA 86:3219-23。这些顺式元件位于转录起始位点的不同距离，一些顺式元件(称作近端元件)邻近最小核心启动子区，而其他元件可定位在启动子(增强子)的上游或下游几千个碱基处。

[0084] “DNA结合转基因”是编码DNA结合蛋白的多核苷酸编码序列。随后，DNA结合蛋白能够结合到另一种分子上。结合蛋白可结合到，例如，DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)上。在蛋白质结合蛋白的情况下，它可与自身结合(形成同二聚体、同三聚体，等)和/或结合到一个或多个不同的蛋白质分子上。结合蛋白可具有超过一种类型的结合活性。例如，锌指蛋白具有DNA结合、RNA结合和蛋白质结合的活性。

[0085] DNA结合蛋白的实例包括：大范围核酸酶、锌指、CRISPR和TALE结合结构域，其可被“工程化”为与预定的核苷酸序列结合。工程化的DNA结合蛋白(例如，锌指、CRISPR、或TALE)一般是非天然存在的蛋白质。用于工程化DNA结合蛋白的方法的非限制性实例是设计和选择。设计的DNA结合蛋白是非自然界产生的蛋白质，其设计/组成主要来自合理标准(rational criteria)。用于设计的合理标准包括应用替换原则和计算机化算法对存储已有ZFP、CRISPR、和/或TALE设计和结合数据的信息的数据库进行信息处理。参见，例如，美国专利6,140,081；6,453,242；和6,534,261；还参见WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496和美国公开文本No.20110301073、20110239315和
20119145940。

[0086] “锌指DNA结合蛋白”(或结合结构域)是一种蛋白质，或一种更大蛋白质内的结构域，其通过一个或多个锌指以序列特异性的方式结合DNA，所述锌指是结合结构域内的氨基酸序列区域，其结构通过与锌离子的配位而稳定。术语锌指DNA结合蛋白通常简称为锌指蛋白或ZFP。锌指结合结构域可被“工程化”为结合预定的核苷酸序列。用于工程化锌指蛋白的方法的非限制性实例是设计和选择。设计的锌指蛋白是非自然界产生的蛋白质，其设计/组成主要来自合理标准(rational criteria)。用于设计的合理的标准包括应用替换原则和计算机化算法对存储已有ZFP设计和结合数据的信息的数据库进行信息处理。参见，例如，美国专利No.6,140,081；6,453,242；6,534,261和6,794,136；还参见WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496。

[0087] 在其他实例中，一种或多种核酸酶的DNA结合结构域包含天然存在的或工程化的(非天然存在的)TAL效应子DNA结合结构域。参见，例如，美国专利公开文本No.20110301073，通过提述将其完整并入本文。已知黄单胞菌属的植物病原菌在重要作物中引起许多疾病。黄单胞菌属的致病性依赖于保守的III型分泌(T3S)系统，其将25种以上不同的效应子蛋白注入植物细胞中。这些注入的蛋白质为转录激活子样(TALEN)效应子，其模拟植物转录激活子并操纵植物转录组(参见Kay等人，(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录活化结构域。最充分表征的TAL效应子之一是来自野油菜黄单胞菌疱病致病变种的AvrBs3(参见Bonas等人，(1989),Mol.Gen.Genet.218:127-136和WO2010079430)。TAL效应子含有串联重复序列的集中域，每个重复序列大致含34个氨基酸，所述氨基酸对于这些蛋白质的DNA结合特异性是关键的。另外，它们含有核定位序列和酸性转录活化结构域(对于综述参见Schornack S等人(2006),J.Plant Physiol.163(3):
256-272)。另外，在植物病原细菌青枯劳尔氏菌中，已经发现在青枯劳尔氏菌生物型菌株GMI1000和生物型4菌株RS1000中的命名为brg11和hpx17的两个基因与黄单胞菌属AvrBs3家族同源(参见Heuer等人，(2007),Appl.and Enviro.Micro.73(13):4379-4384)。这些基因在核苷酸序列上彼此具有98.9％的同一性，但是因在hpx17的重复结构域中的1,575bp的缺失而不同。然而，两种基因产物都具有与黄单胞菌属AvrBs3家族蛋白小于40％的序列同一性。参见，例如，美国专利公开文本No.20110301073，通过提述将其完整并入。

[0088] 这些TAL效应子的特异性取决于在串联重复序列中发现的序列。重复序列大致包含102个bp，并且重复序列彼此之间一般具有91-100％的同源性(Bonas等人，同前)。重复序列的多态性常常位于位置12和13处，并且在位置12和13处的高变双残基的同一性与在TAL效应子的靶序列中的连续核苷酸的同一性之间，似乎存在着在一对一的对应关系(参见Moscou和Bogdanove，(2009)Science 326:1501；和Boch等人，(2009)Science 326:1509-1512)。在实验上，已经确定了这些TAL效应子的DNA识别的天然密码，使得在位置12和13处的HD序列导致与胞嘧啶(C)结合，NG与T结合，NI与A、C、G或T结合，NN与A或G结合，并且ING与T结合。这些DNA结合重复序列已组装成具有新的重复序列组合和数目的蛋白质，从而产生能够与新的序列相互作用并激活植物细胞中的非内源报告基因表达的人工转录因子(Boch等人，同前)。工程化的TAL蛋白已经与FokI切割半结构域连接以产生在酵母报告基因测定(基于质粒的靶标)中表现出活性的TAL效应子结构域核酸酶融合(TALEN)。

[0089] CRISPR(成簇的规律间隔的短回文重复序列)/Cas(CRISPR相关的)核酸酶系统是基于可用于基因组工程化的细菌系统的最近工程化的核酸酶系统。其基于许多细菌和古细菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时，侵入物的DNA区段通过“免疫”应答转化为CRISPR RNA(crRNA)。然后，这种crRNA通过部分互补区域与另一类称为tracrRNA的RNA结合以将Cas9核酸酶引导至与称为“原型间隔序列”的靶DNA中的crRNA同源的区域。Cas9在由crRNA转录物中所含的20-核苷酸引导序列指定的位点处切割DNA以在DSB处产生平末端。Cas9需要crRNA和tracrRNA两者的位点特异性DNA识别和切割。这种系统现已被工程化，使得crRNA和tracrRNA可结合成一个分子(“单个引导RNA”)，单个引导RNA的crRNA等效部分可被工程化以引导Cas9核酸酶靶向任何期望序列(参见Jinek等人(2012),Science
337,p.816-821,Jinek等人(2013),eLife 2:e00471；和David Segal(2013),eLife 2:
e00563)。因此，CRISPR/Cas系统可被工程化以在基因组中的期望靶标处产生双链断裂(DSB)，并且可通过使用修复抑制剂影响DSB的修复而引起易错修复增加。

[0090] 在其他实例中，DNA结合转基因为包含工程化的(非天然存在的)大范围核酸酶(也描述为归巢核酸内切酶)的位点特异性核酸酶。已知归巢核酸内切酶或大范围核酸酶(如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII)的识别序列。还参见美国专利No.5,420,032；美国专利No.6,833,252；Belfort等人，(1997)Nucleic Acids Res.25:3379–30 3388；Dujon等人，(1989)Gene 82:115–118；Perler等人，(1994)Nucleic Acids Res.22:11127；Jasin(1996)Trends Genet.12:224–228；Gimble等人，(1996)J.Mol.Biol.263:163–180；Argast等人，(1998)J.Mol.Biol.280:345–353和New England Biolabs catalogue。另外，归巢核酸内切酶和大范围核酸酶的DNA结合特异性可被工程化为结合非天然靶位点。参见，例如，Chevalier等人，(2002)Molec.Cell 10:895-905；Epinat等人，(2003)Nucleic Acids Res.5 31:2952-2962；Ashworth等人，(2006)Nature 441:656-659；Paques等人，(2007)Current Gene Therapy 7:49-66；美国专利公开No.20070117128。归巢核酸内切酶和大范围核酸酶的DNA结合结构域总的来说可在核酸酶的背景下予以改变(即，使得核酸酶包括同源切割结构域)或可融合至异源切割结构域。

[0091] 如本文中使用的，术语“转化”涵盖可将核酸分子导入这种细胞中的所有技术。实例包括但不限于：用病毒载体转染；用质粒载体转化；电穿孔；脂质体转染；显微注射(Mueller等人，(1978)Cell 15:579-85)；土壤杆菌介导的转移；直接DNA摄取；WHISKERSTM介导的转化；和微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化两者。术语“稳定转化”指将核酸片段导入宿主生物的基因组中，从而导致在遗传上稳定的遗传。一旦稳定转化，该核酸片段稳定整合到宿主生物和任何后续世代的基因组中。含有该转化的核酸片段的宿主生物被称为“转基因”生物。术语“瞬时转化”指将核酸片段导入宿主生物的细胞核、或含有DNA的细胞器中，从而导致不具备在遗传上稳定的遗传的基因表达。

[0092] 如本文中使用的，术语“转基因”是外源核酸序列。在一个实例中，转基因是基因序列(例如，除草剂抗性基因)、编码工业或药学上有用的化合物的基因、或编码期望的农业性状的基因。在又另一个实例中，转基因为小RNA，例如反义核酸序列，其中小RNA序列的表达抑制靶核酸序列的表达。转基因可含有与该转基因可操作连接的调节序列(例如，启动子、内含子、或3′-UTR)。在一些实施方案中，感兴趣的核酸(或者，替代地描述为感兴趣的基因)为转基因。然而，在其他实施方案中，感兴趣的核酸为内源核酸，其中所述内源核酸的额外基因组拷贝是期望的，或者为相对于宿主生物中的靶核酸序列处于反义取向的核酸。

[0093] 如本文中使用的，术语“小RNA”是指几类非编码核糖核酸(ncRNA)。术语“小RNA”描述了在细菌细胞、动物、植物、和真菌中产生的短链ncRNA。这些短链ncRNA可在细胞中天然产生或可以通过导入表达短链ncRNA的外源序列而产生。小RNA序列不直接编码蛋白质，并且与其他RNA在功能上不同之处在于，小RNA序列仅仅被转录而不被翻译。小RNA序列涉及其他细胞功能，包括基因表达和修饰。小RNA分子常常由约20个到30个核苷酸构成。小RNA序列可衍生自较长的前体。所述前体形成在自身互补区中彼此折回的结构；然后它们被动物体内的核酸酶切丁酶或植物中的DCL1加工。

[0094] 许多类型的小RNA天然存在或人工产生，包括microRNA(miRNA)、短干扰RNA(siRNA)、反义RNA、短发夹RNA(shRNA)、和小核仁RNA(snoRNA)。某些类型的小RNA，如microRNA和siRNA在基因沉默和RNA干扰(RNAi)中是重要的。基因沉默是其中通常表达的基因被细胞内元件(在这种情况下为小RNA)“关闭”的遗传调节过程。通常经由此遗传信息形成的蛋白质由于干扰而未形成，并且在该基因中编码的信息被阻断表达。

[0095] 如本文中使用的，术语“小RNA”涵盖RNA分子，其在文献中被描述为“极小RNA”(Storz,(2002)Science 296:1260-3；Illangasekare等人，(1999)RNA5:1482-1489)；原核“小RNA”(sRNA)(Wassarman等人，(1999)Trends Microbiol.7:37-45)；真核“非编码RNA(ncRNA)”；“微RNA(miRNA)”；“小非mRNA(snmRNA)”；“功能性RNA(fRNA)”；转运RNA(tRNA)”；“催化性RNA”[例如，核酶，包括自身酰化核酶(Illangaskare等人，(1999)RNA 5:1482-
1489)；“小核仁RNA(snoRNA)”；“tmRNA”(又名“10S RNA”,Muto等人，(1998)Trends Biochem Sci.23:25-29；和Gillet等人，(2001)Mol Microbiol.42:879-885)；RNAi分子，包括但不限于“小干扰RNA(siRNA)”、“核酸内切酶制备的siRNA(e-siRNA)”、“短发夹RNA(shRNA)”、和“时序调节小RNA(stRNA)”；“切丁酶酶切的siRNA(d-siRNA)”、以及包含至少一个尿嘧啶碱基的适体、寡核苷酸和其他合成核酸。

[0096] 如本文中使用的，术语“载体”是指当被导入细胞中时，由此产生转化细胞的核酸分子。载体可以包含允许其在宿主细胞中复制的核酸序列，诸如复制起点。实例包括但不限于质粒、粘粒、噬菌体、细菌人工染色体(BAC)、或携带外源DNA进入细胞的病毒。载体还可包括一个或多个基因、反义分子、和/或选择标志物基因和本领域已知的其他遗传元件。载体可以转导、转化或感染细胞，由此引起细胞表达核酸分子和/或由该载体编码的蛋白质。任选地，载体可包括辅助核酸分子实现进入细胞中的物质(例如，脂质体)。

[0097] 如本文中使用的，术语“盒”、“表达盒”和“基因表达盒”是指可在特异的限制性位点或通过同源重组插入核酸或多核苷酸中的DNA区段。DNA区段包括含编码小RNA或感兴趣多肽的感兴趣基因的多核苷酸，所述盒和限制性位点被设计为确保所述盒插入用于转录和翻译的正确阅读框中。在一个实施方案中，表达盒可包含编码小RNA或感兴趣多肽的多核苷酸，并且具有除了所述多核苷酸之外的便于特定宿主细胞转化的元件。在一个实施方案中，基因表达盒还可包括允许小RNA或编码感兴趣多肽的多核苷酸在宿主细胞中增强表达的元件。这些元件可包括但不限于：启动子、最小启动子、增强子、反应元件、内含子、5′非翻译区序列、3′非翻译区序列、终止子序列、多聚腺苷酸化序列，等。

[0098] 如本文中使用的，术语“异源编码序列”用于指示通常在宿主生物中不存在并且在适当条件下可在宿主细胞中表达的编码或最终编码肽或蛋白质或其等效氨基酸序列(例如酶)的任何多核苷酸。正因为如此，“异源编码序列”可包括通常在宿主细胞中不存在的编码序列的一个或多个另外的拷贝，使得该细胞表达通常在细胞中不存在的编码序列的另外的拷贝。异源编码序列可以是RNA或其任何类型(例如，mRNA)、DNA或其任何类型(例如，cDNA)、或RNA/DNA杂交体。编码序列的实例包括但不限于，包括诸如编码序列、内含子、启动子区、5′-UTR、3′-UTR、和增强子区之类的特征的全长转录单位。

[0099] “异源编码序列”还包括肽或酶的编码部分，即，肽或酶的cDNA或mRNA序列，以及全长转录单位的编码部分，即，包含内含子和外显子的基因，以及编码酶或编码其等效氨基酸序列的“密码子优化的”序列、截短序列或其他形式的改变序列，前提是等效氨基酸序列产生功能蛋白。这样的等效氨基酸序列可具有一个或多个氨基酸缺失，其中该缺失在N端、C端或内部。截短形式在考虑之中，只要它们具有本文中指示的催化能力即可。

[0100] 如本文中使用的，术语“对照”是指在用于比较目的的分析程序中使用的样品。对照可为“阳性”或“阴性”。例如，在分析程序的目的为检测细胞或组织中的差异表达的转录物或多肽的情况下，通常优选包括阳性对照，例如来自展现出期望表达的已知植物的样品，以及阴性对照，例如来自缺乏期望表达的已知植物的样品。

[0101] 如本文中使用的，术语“植物”包括植物和植物部分，包括但不限于，植物细胞和植物组织，如叶、茎、根、花、花粉、和种子。可用于本发明中的植物类别通常宽泛地为适合于诱变的高等和低等植物类别，包括被子植物、裸子植物、蕨类和多细胞藻类。因此，“植物”包括双子叶和单子叶植物。双子叶植物的实例包括烟草、拟南芥、大豆、番茄、木瓜、芸苔、向日葵、棉花、苜蓿、马铃薯、葡萄树、木豆、豌豆、芸苔属植物、鹰嘴豆、糖用甜菜、油菜、西瓜、甜瓜、胡椒、花生、南瓜(pumpkin)、萝卜、菠菜、倭瓜(squash)、绿花椰菜、卷心菜、胡萝卜、花椰菜、芹菜、大白菜、黄瓜、茄子、和莴苣。单子叶植物的实例包括玉米、水稻、小麦、甘蔗、大麦、黑麦、高粱、兰花、竹子、香蕉、香蒲、百合、燕麦、洋葱、小米、和黑小麦。

[0102] 如本文中使用的，术语“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、插条、细胞或组织培养物、或一种植物的任何其他部分或产物。在一个实施方案中，植物材料包括子叶和叶。在一个实施方案中，植物材料包括种子、胚或胚珠。在一个实施方案中，植物材料包括根组织和位于地下的其他植物组织。

[0103] 如本文中使用的，术语“选择标志物基因”是指任选地在植物转化中使用的基因，以便例如保护植物细胞免受选择剂的影响或提供针对选择剂的抗性/耐受性。另外，“选择标志物基因”意味着涵盖报告基因。只有那些接收功能性选择标志物的细胞或植物才能在具有选择剂的条件下分裂或生长。选择剂的实例可以包括，例如包括大观霉素、新霉素、卡那霉素、巴龙霉素、庆大霉素、和潮霉素之类的抗生素。这些选择标志物包括表达赋予抗生素卡那霉素抗性的酶的针对新霉素磷酸转移酶的基因(npt II)，和针对有关抗生素新霉素、巴龙霉素、庆大霉素和G418的基因，或表达赋予潮霉素抗性的酶的针对潮霉素磷酸转移酶的基因(hpt)。其他选择标志物基因可以包括编码除草剂抗性的基因，包括bar或pat(针对草胺磷或膦丝菌素的抗性)、乙酰乳酸合酶(ALS，针对抑制剂诸如磺酰脲类(SU)、咪唑啉酮类(IMI)、三唑并嘧啶类(TP)、嘧啶氧基苯甲酸类(POB)、和阻止支链氨基酸合成第一步的磺酰基氨基羰基三唑啉酮类的抗性)、草甘膦、2,4-D、和金属抗性或敏感性。可用作选择标志物基因的“报告基因”的实例包括表达的报告基因蛋白的视觉观察，所述报告基因蛋白例如编码的蛋白质：β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、DsRed、β-半乳糖苷酶、氯霉素乙酰转移酶(CAT)、碱性磷酸酶等。短语“标志物阳性”是指已经被转化而包含选择标志物基因的植物。

[0104] 如本文中使用的，术语“可检测标志物”是指能够被检测的标记，例如放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螫合剂、或酶。可检测标志物的实例包括但不限于下列各项：荧光标记(例如，FITC、罗丹明、镧系磷光体)、酶标记(例如，辣根过氧化物酶、β-半乳糖苷酶、萤光素酶、碱性磷酸酶)、化学发光标记、生物素基；由次级报道分子识别的预定多肽表位(例如，亮氨酸拉链对序列、第二抗体的结合位点、金属结合结构域、表位标签)。在一个实施方案中，可检测标志物可通过不同长度的间隔臂附接，以降低潜在的空间位阻。

[0105] 如本文中使用的，术语“检测”在最广义上用来包括特异性分子的定性和定量测量两者，例如特异性多肽的测量。

[0106] 除非另外特别地解释，本文中使用的全部技术术语和科学术语具有与属于本公开的领域之内的普通技术人员通常所理解的相同的含义。可以在以下出版物中找到分子生物学中常见术语的定义：例如，Lewin,Genes V,Oxford University Press,1994；Kendrew等人(编)，The Encyclopedia of Molecular Biology,Blackwell Science Ltd.,1994；和Meyers(编)，Molecular Biology and Biotechnology:A Comprehensive Desk Reference,VCH Publishers,Inc.,1995。

[0107] 调控元件

[0108] 用于基础研究或生物技术应用的植物启动子通常是单向的，其仅仅指导融合在其3′端(下游)的转基因的表达。对于代谢工程和性状叠加而言，常常有必要在植物内强表达转基因。另外，在转基因作物中一般需要多个新颖的启动子来驱动多个基因的表达。在本文中公开了启动子，它可指导融合在其3′端(下游)的第一基因的表达。

[0109] 转基因产品的开发变得日益复杂，这需要强表达转基因以及将多个转基因叠加在单基因座中。传统上，每个转基因需要用于表达的独特启动子，其中需要多个启动子来表达一个基因叠加中的不同转基因。随着基因叠加的大小增加，这时常导致相同启动子的重复使用，以获得用于单个多基因性状表达的不同转基因的表达模式的相似水平。已知由相同启动子驱动的多基因构建体引起基因沉默，从而在该领域产生不十分有效的转基因产品。由于启动子重复导致的转录因子(TF)结合位点的过量可引起内源TF的消耗，从而导致转录失活。转基因的沉默将很可能不良地影响产生的转基因植物表达转基因的性能。转基因内的重复序列可引起导致多核苷酸重排的基因座内(intra-locus)同源重组。

[0110] 组织特异性(即，组织优先的)或器官特异性启动子驱动某些组织中(如植物的胚珠、胚、种子、果仁、根、叶或绒毡层中)的基因表达。组织和发育阶段特异性启动子驱动在特定组织中或在植物发育过程中特定时期表达的基因的表达。组织特异性启动子在转基因植物行业中对于某些应用是需要的和期望的，因为它们允许异源基因以组织和/或发育阶段选择性方式特异性表达，表明异源基因在各个器官、组织和/或时间有差别地表达，而非其他。例如，可以借助于土传病原体通过用病原体抗性基因转化植物基因组使得病原体抗性蛋白在植物根内强表达而实现植物对感染的抵抗力增加。或者，可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因。另一种应用是使用组织特异性启动子的需要，例如，使得将编码农艺性状的转基因的表达局限在发育的木质部中。另一种应用是驱动转基因在种子、胚珠或胚内表达。在组织特异性启动子的鉴定中保留的一个特殊问题是怎样鉴定可能最重要的基因及其相应的启动子，以及怎样把它们与细胞的具体发育特性关联起来。另一个问题是克隆全部有关的顺式作用转录控制元件，使得克隆的DNA片段以想要的具体表达模式驱动转录。一个特殊的问题是鉴定与具体细胞类型、发育阶段和/或不表达于其他植物组织中的植物中的功能有关的组织特异性启动子。

[0111] 提供了使用甘蓝型油菜ACC OX基因启动子调控元件在植物中表达转基因的方法和构建体。在一个实施方案中，启动子可以是甘蓝型油菜ACC OX基因启动子，其具有如下序列：

[0112]ctcacatcaccaccttttaacttcgttggttaatttcttgaaaagaagatcgtcatattttacacacaaaaagatcatcattgttgtcatgtactgtttgatgatactgacttacgaaactcgattataatattaaataacatgatataggcttttagattttatatgagttactagttttttcacgtttcgtcatcatgtatatcaataacctcgctaagatcatcagttcaccaccaaataaaacgtagccaaccgaagtctttcttctcaatttgtgttgtcaaatttgtcataaagtatgaatttctcatatacttaatacagataagtattataaattgacaattcatcaactattgaacttgaaattgaataataacattttaaacttttttttgacgacgacttctgaattgttatgtagttttgggggcatcattagaaaagcaaaagagaaagtactatcacttcaaacttcttttcatttttctacttcttagtgagtttgggaatattctataacttcgattaatatgaatgaatgtataaatactctgtatgcttttcaaccttttcttaccaaacatctgatcaaagatctttattgatttgttaggaatatggaggaatatttttccctattatggaggaatccgaagataagttattgtaagtaggtcgcgaatggcaactgatattattgcagaaacaacctcataaatgataaagttacaaaaaaaaaattattatcaagcttatatactttattcccaaaatttaaagtacgcatatttgattcctttgtgatagcgtacacgttctctaaccatgatgattccaataaatacaccaaaaaccttacaaaatgactcttgaaagtaaactagataatcaattcaaattctttctatatagtttgtttgctaaaggttattggtagtttcgaaatagtcattcatatccctttttttttgcatataatgactccccgaaggggctaagcaccagataaaaagtgttcgagtgcttctctgatttgtaacaacccatacacaattattcatataaaataaaagcaaaagaaaaagccaatataattgcagagaataagagatcgaaatggaaaacacaaagtttatcccaccaattatgttgcgcacacacaccatcgtatacaacttccacaacctccttttcttttctagtaaggaaaaaaacaaatttatatctactaagttctaactttatttaaatggcacaattatagatatcgtatatataatatatcattatacatatatatatatatatataaaatataatataatattttttttaagatctttgatttactatctgcgcctataaatagcgatcctccctcaactccttaactcacatttgacaactaacatcttcaacaacattaagttgccagtttaaagatattcatacgtttacatagagagggtctagagta(SEQ ID NO:1)。

[0113] 在一个实施方案中，基因表达盒包含启动子。在一个实施方案中，启动子可以是本主题公开的甘蓝型油菜ACC OX基因启动子。在一个实施方案中，基因表达盒包含启动子，其中该启动子与SEQ ID NO:1具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.8％、或100％同一性。在一个实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因启动子。在一个实施方案中，包含该甘蓝型油菜ACC OX基因启动子的基因表达盒可驱动两个或更多个转基因的表达。在说明性实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因启动子，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。

[0114] 还可通过位于基因的编码序列下游的3′非翻译区(即，3′-UTR)来调节转基因表达。启动子和3′-UTR两者都能调节转基因表达。虽然启动子对于驱动转录是必要的，但3′-UTR基因区能终止转录并起始用于翻译和蛋白质合成的所得mRNA转录物的多腺苷酸化。3′-UTR基因区有助于转基因的稳定表达。在一个实施方案中，3′-UTR可以是甘蓝型油菜ACC OX基因的3′-UTR，其具有如下序列：

[0115]Atggatgtgggattttttatgaaggcaagaaagatggggttttgatatgtgtgtgggcaacaatgttaaataagtattgaagctaatgttatagtagaatcaagaactaagttgtgatcacttatgaatctagtgtggttaagtgtgggagtgtttatgcaataattgtattggaaatatgaattttaaagattatactacaagttcgtaacatttgagatatgaatacttgaaaaaaactcgaatgtttacaaaagtaacaaactcctcacacatgcataattgaaatcatcaacagatttgggcttatgtatattggatcaaaggcccaaaatattttaaaattgtattagggggattctagggcatcactctgtatcctactataaatactcctctagagctgagatttctcatacagcacgggttacagcttacagtcgatgaatcattagagtttctctctttctacacagtagtacagtacacatctcgttttg(SEQ ID NO:2)。

[0116] 在一个实施方案中，基因表达盒包含3′-UTR。在一个实施方案中，3′-UTR可以是甘蓝型油菜ACC OX基因的3′-UTR。在一个实施方案中，基因表达盒包含3′-UTR，其中该3′-UTR与SEQ ID NO:2具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.8％、或100％同一性。在一个实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因的3′-UTR。在说明性实施方案中，基因表达盒包含与转基因可操作连接的3′-UTR，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。

[0117] 在一个实施方案中，基因表达盒包含从甘蓝型油菜ACC OX基因纯化的启动子和3′-UTR。在一个实施方案中，基因表达盒包含：a)启动子，其中该启动子与SEQ ID NO:1具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、
99.8％、或100％同一性；和/或，b)3′-UTR，其中该3′-UTR与SEQ ID NO:2具有至少80％、
85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.8％、或100％同一性。

[0118] 例如，基因表达盒可包括启动子和3′-UTR两者，其中该启动子是多核苷酸SEQ ID NO:1，并且该3′-UTR是多核苷酸SEQ ID NO:2。当基因表达盒包含一个或多个转基因时，启动子和3′-UTR可与基因表达盒之内的不同转基因可操作连接。在说明性实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因启动子(SEQ ID NO:1)，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。在说明性实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR(SEQ ID NO:2)，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。

[0119] 在一个实施方案中，载体包含如本文中公开的基因表达盒。在一个实施方案中，载体可以是质粒、粘粒、细菌人工染色体(BAC)、噬菌体、病毒、或在转化或基因打靶中使用的切离多核苷酸片段，如供体DNA。

[0120] 在一个实施方案中，细胞或植物包含如本文中公开的基因表达盒。在一个实施方案中，细胞或植物包含含有如本文中公开的基因表达盒的载体。在一个实施方案中，载体可以是质粒、粘粒、细菌人工染色体(BAC)、噬菌体、或病毒。由此，包含如本文中公开的基因表达盒的细胞或植物分别是转基因细胞或转基因植物。在一个实施方案中，转基因植物可以是单子叶植物。在一个实施方案中，转基因单子叶植物可以是，但不限于，玉米、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、和小米。在一个实施方案中，转基因植物可以是双子叶植物。在一个实施方案中，转基因双子叶植物可以是，但不限于，大豆、棉花、向日葵、和卡诺拉。一个实施方案还包括来自如本文中公开的转基因植物的转基因种子。

[0121] 在一个实施方案中，基因表达盒包含两个或更多个转基因。所述两个或更多个转基因可与如本文中公开的甘蓝型油菜ACC OX基因启动子或3′-UTR可操作连接。在一个实施方案中，基因表达盒包含一个或多个转基因。在具有一个或多个转基因的实施方案中，至少一个转基因与本主题公开的甘蓝型油菜ACC OX基因启动子或3′-UTR可操作连接。

[0122] 选择标志物

[0123] 还描述为报告基因的各种选择标志物可以被纳入经选择的表达载体中，以允许鉴定和选择经转化的植物(“转化体”)。可以获得确认选择标志物在经转化植物中表达的许多方法，例如包括DNA测序和PCR(聚合酶链反应)、Southern印迹法、RNA印迹法、用于检测从载体中表达出来的蛋白质的免疫学方法，所述蛋白质例如介导膦丝菌素抗性的沉淀蛋白质，或其他蛋白质的视觉观察，所述其他蛋白质如报告基因编码的β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(DsRed)、β-半乳糖苷酶、氯霉素乙酰转移酶(CAT)、碱性磷酸酶，等(参见Sambrook等人，Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring Harbor Press,N.Y.,2001，其全部内容通过提述并入本文)。

[0124] 利用选择标志物基因来选择转化的细胞或组织。选择标志物基因包括编码抗生素抗性的基因，例如编码新霉素磷酸转移酶II(NptII)和潮霉素磷酸转移酶(HPT)的那些基因，以及赋予对除草化合物的抗性的基因。除草剂抗性基因通常编码对该除草剂不敏感的修饰的靶蛋白或编码在植物中在该除草剂能够起作用之前降解该除草剂或将其脱毒的酶。例如，通过使用编码突变体靶酶5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)的基因，已获得对草甘膦的抗性。针对EPSPS的基因和突变体是熟知的，并且在下文进一步描述。已经通过使用编码使对应的除草剂脱毒的pat或DSM-2、腈水解酶、aad-1或aad-12基因的细菌基因获得了对草铵膦、溴苯腈、以及2,4-二氯苯氧乙酸(2,4-D)的抗性。

[0125] 在一个实施方案中，除草剂可以抑制生长点或分生组织，所述除草剂包括包括咪唑啉酮或磺酰脲，并且针对这些除草剂的乙酰羟酸合酶(AHAS)和乙酰乳酸合酶(ALS)的抗性/耐受性的基因是熟知的。草甘膦抗性基因分别包括突变体5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSP)和dgt-28基因(经由导入重组核酸和/或天然EPSP基因的各种形式的体内诱变)、aroA基因和草甘膦乙酰转移酶(GAT)基因)。其他膦酰基化合物的抗性基因包括来自链霉菌属物种(包括吸水链霉菌和绿色产色链霉菌)的bar基因、以及吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸(包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵、喹禾灵)抗性的示例性基因包括乙酰辅酶A羧化酶(ACCase)基因，--Acc1-S1、Acc1-S2和Acc1-S3。在一个实施方案中，除草剂可以抑制光合作用，包括三嗪(psbA和1s+基因)或苄腈(腈水解酶基因)。

[0126] 在一个实施方案中，选择标志物基因包括但不限于，编码下列物质的基因：新霉素磷酸转移酶II；氰酰胺水合酶；天冬氨酸激酶；二氢吡啶二羧酸合成酶；色氨酸脱羧酶；二氢吡啶二羧酸合成酶和脱敏型天冬氨酸激酶；bar基因；色氨酸脱羧酶；新霉素磷酸转移酶(NEO)；潮霉素磷酸转移酶(HPT或HYG)；二氢叶酸还原酶(DHFR)；膦丝菌素乙酰转移酶；2,2-二氯丙酸脱卤素酶；乙酰羟酸合酶；5-烯醇丙酮酰-莽草酸-磷酸合酶(aroA)；卤代芳基腈水解酶；乙酰辅酶A羧化酶；二氢蝶酸合酶(sul I)；和32kD光合体系II多肽(psbA)。

[0127] 一个实施方案还包括编码对下列物质的抗性的基因：2,4-D；氯霉素；甲氨蝶呤；潮霉素；大观霉素；溴苯腈；草甘膦；和膦丝菌素。

[0128] 以上列出的选择标志物基因并非意味着限制。本发明涵盖任何报告基因或选择标志物基因。

[0129] 合成选择标志物基因，以便在植物中优化表达。例如，在一个实施方案中，基因的编码序列已通过密码子优化进行修饰，以增强在植物中的表达。选择标志物基因可以被优化用于在特定的植物物种中表达，或者替代地，被修饰以用于在双子叶或单子叶植物中优化表达。根据在感兴趣的特定植物物种中以最大量表达的蛋白质中最高频率的密码子，可以确定植物优选的密码子。在一个实施方案中，选择标志物基因被设计为以较高水平在植物中表达，从而导致较高的转化效率。用于基因的植物优化的方法是熟知的。关于合成的多核苷酸序列的优化和制造的指南可例如在WO2013016546、WO2011146524、WO1997013402、美国专利No.6166302、美国专利No.5,380,831中找到，将上述文献通过提述并入本文。

[0130] 转基因

[0131] 公开的方法和组合物可用于在植物基因组中表达多核苷酸基因序列。因此，可通过植物启动子驱动编码除草剂耐受性、抗虫性、养分、抗生素或其他治疗分子的基因的表达。

[0132] 在一个实施方案中，本主题公开的甘蓝型油菜ACC OX基因调控元件与编码多核苷酸序列的基因结合或可操作连接，所述多核苷酸序列提供对草甘膦或另一种除草剂的抗性或耐受性，和/或提供选择昆虫或疾病的抗性和/或营养增强、和/或改进的农艺性状、和/或在饲料、食品、工业、制药或其他用途中有用的蛋白质或其他产品。转基因可与植物基因组内的两个或更多个感兴趣的核酸序列“叠加”。叠加可例如通过使用两个或更多个事件的常规植物育种、用含有感兴趣的序列的构建体转化植物、转基因植物的再转化、或者经由同源重组通过靶向整合添加新的性状来实现。

[0133] 这样的感兴趣的多核苷酸序列包括但不限于以下提供的那些实例：

[0134] 1.赋予害虫或疾病抗性的基因或编码序列(例如，iRNA)

[0135] (A)植物疾病抗性基因。植物中疾病抗性基因(R)的产物与病原体中相应的无毒性(Avr)基因的产物之间的特异相互作用经常激活植物防御。可以用克隆的抗性基因转化植物品种，从而工程构建对特定病原体株有抗性的植物。这样的基因的例子包括，抵抗黄枝孢霉(Cladosporium fulvum)的番茄Cf-9基因(Jones等人，1994Science 266:789)、编码蛋白激酶的用于抵抗丁香假单胞菌番茄致病变种(Pseudomonas syringae pv.tomato)的番茄Pto基因(Martin等人，1993Science 262:1432)、以及抵抗丁香假单胞菌(Pseudomonas syringae)的拟南芥RSSP2基因(Mindrinos等人，1994Cell 78:1089)。

[0136] (B)苏云金芽孢杆菌蛋白质、其衍生物或以其为模本的合成多肽，例如Btδ-内毒素基因的核苷酸序列(Geiser等人，1986Gene 48:109)和植物杀虫(VIP)基因(参见，例如，Estruch等人(1996)Proc.Natl.Acad.Sci.93:5389-94)。而且，编码δ-内毒素基因的DNA分子可以从美国典型培养物保藏中心(Rockville,Md.)购得，ATCC登录号为40098、67136、31995和31998。

[0137] (C)凝集素，例如几种君子兰(Clivia miniata)甘露糖结合凝集素基因的核苷酸序列(Van Damme等人，(1994),Plant Molec.Biol.24:825)。

[0138] (D)维生素结合蛋白质，例如亲和素及亲和素同源物，其可用作针对昆虫类害虫的杀幼虫剂。参见美国专利No.5,659,026。

[0139] (E)酶抑制剂，例如蛋白酶抑制剂或淀粉酶抑制剂。这些基因的实例包括水稻半胱氨酸蛋白质酶抑制剂(Abe等人(1987),J.Biol.Chem.262:16793)、烟草蛋白酶抑制剂I(Huub等人(1993),Plant Molec.Biol.21:985)、和α-淀粉酶抑制剂(Sumitani等人(1993),Biosci.Biotech.Biochem.57:1243)。

[0140] (F)昆虫特异性激素或信息素，例如蜕皮激素和保幼激素或其变体、基于它们的模拟物，或其拮抗剂或激动剂，例如杆状病毒表达的克隆保幼激素酯酶，其为保幼激素灭活剂(Hammock等人(1990),Nature 344:458)。

[0141] (G)昆虫特异性肽或神经肽，其在表达时会扰乱受影响的害虫的生理机能(J.Biol.Chem.269:9)。这些基因的实例包括昆虫利尿激素受体(Regan,1994)、在太平洋折翅蠊(Diploptera punctata)中鉴定的咽侧体抑制素(allostatin)(Pratt,1989)、和昆虫特异性麻痹神经毒素(美国专利No.5,266,361)。

[0142] (H)在自然界中由蛇、马蜂等产生的昆虫特异性毒液，例如蝎子昆虫毒性肽(Pang(1992),Gene 116:165)。

[0143] (I)负责超富集单萜、倍半萜、甾体、异羟肟酸、苯丙烷衍生物或其他具有杀虫活性的非蛋白质分子的酶。

[0144] (J)参与生物活性分子修饰(包括翻译后修饰)的酶；例如糖酵解酶、蛋白质水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶，无论是天然的还是合成的。这样的基因的实例包括马蹄莲基因(PCT公开申请WO93/02197)、几丁质酶编码序列(例如可以获自ATCC登录号3999637和67152)、烟草钩虫几丁质酶(Kramer等人(1993),Insect Molec.Biol.23:691)、以及欧芹ubi4-2聚泛素基因(Kawalleck等人(1993),Plant Molec.Biol.21:673)。

[0145] (K)刺激信号转导的分子。这样的分子的例子包括绿豆钙调蛋白cDNA克隆的核苷酸序列(Botella等人(1994),Plant Molec.Biol.24:757)和玉米钙调蛋白cDNA克隆的核苷酸序列(Griess等人(1994),Plant Physiol.104:1467)。

[0146] (L)疏水矩肽(hydrophobic moment peptide)。参见美国专利No.5,659,026和5,607,914，后者教导了赋予疾病抗性的合成抗微生物肽。

[0147] (M)膜通透酶，通道形成剂或通道阻断剂，例如杀菌肽-β裂解肽类似物(Jaynes等人(1993),Plant Sci.89:43)，其使转基因烟草植物对青枯假单胞菌有抗性。

[0148] (N)病毒侵袭性蛋白质或由其衍生的复合毒素。例如，在经转化的植物细胞中，病毒衣壳蛋白的积累可赋予针对该衣壳蛋白所来源的病毒以及相关病毒所致的病毒感染和/或疾病发展的抗性。已经给转化植物赋予了衣壳蛋白介导的针对苜蓿花叶病毒、黄瓜花叶病毒、烟草条纹病毒、马铃薯X病毒、马铃薯Y病毒、烟草蚀纹病毒、烟草脆裂病毒和烟草花叶病毒的抗性。参见，例如，Beachy等人(1990)Ann.Rev.Phytopathol.28:451。

[0149] (O)昆虫特异性抗体或由其衍生的免疫毒素。因此，靶向昆虫肠道关键代谢功能的抗体可以使受影响的酶失活，从而杀死昆虫。例如，Taylor等人(1994)，在第七届国际分子植物-微生物相互作用研讨会(Seventh Int'l.Symposium on Molecular Plant Microbe Interactions)上的第497号摘要显示了转基因烟草中通过产生单链抗体片段的酶失活。

[0150] (P)病毒特异性抗体。参见，例如，Tavladoraki等人(1993),Nature 266:469表明表达重组抗体基因的转基因植物受到免于病毒攻击的保护。

[0151] (Q)由病原体或寄生物自然产生的发育阻滞(developmental-arrestive)蛋白。因此，真菌内切α-1,4-D多聚半乳糖醛酸酶通过溶解植物细胞壁的均聚-α-1,4-D-半乳糖醛酸而促进真菌定殖和植物营养素释放(Lamb等人(1992),Bio/Technology 10:1436)。Toubart等人((1992),Plant J.2:367)描述了豆类内切多聚半乳糖醛酸酶抑制蛋白的编码基因的克隆和表征。

[0152] (R)由植物自然产生的发育阻滞(developmental-arrestive)蛋白，例如大麦核糖体失活基因，其提供了增加的针对真菌疾病的抗性(Longemann等人(1992),Bio/Technology 10:3305)。

[0153] (S)RNA干扰，其中用RNA分子抑制靶基因的表达。一个实施例中的RNA分子是部分或完全双链的，其触发沉默响应，导致dsRNA被切割成小的干扰RNA，它们随后被纳入到靶向复合体中，靶向复合体破坏同源的mRNA。参见，例如，Fire等人，美国专利6,506,559；Graham等人，6,573,099。

[0154] 2.赋予除草剂抗性的基因

[0155] (A)编码针对抑制生长点或分生组织的除草剂，例如咪唑啉酮类(imidazalinone)、磺酰苯胺类(sulfonanilide)或磺酰脲类除草剂的抗性或耐受性的基因。这类基因的实例编码突变体乙酰乳酸合酶(ALS)(Lee等人(1988),EMBOJ.7:1241)，其也被称作乙酰羟酸合酶(AHAS)酶(Miki等人(1990),Theor.Appl.Genet.80:449)。

[0156] (B)一种或多种另外的编码针对草甘膦抗性或耐受性的基因，所述抗性或耐受性是由突变体EPSP合酶和aroA基因赋予的，或者是通过基因如DGT-28、2mEPSPS、GAT(草甘膦乙酰转移酶)或GOX(草甘膦氧化酶)和其他膦酰基化合物，如草铵膦(pat、bar、和dsm-2基因)、以及芳氧基苯氧基丙酸和环己二酮(ACC酶抑制剂编码基因)所致的代谢失活而获得的。参见，例如，美国专利No.4,940,835，其公开了可赋予草甘膦抗性的EPSP形式的核苷酸序列。编码突变体aroA基因的DNA分子能够以ATCC登录号39256获得，并且所述突变体基因的核苷酸序列在美国专利No.4,769,061中公开。欧洲专利申请No.0 333033和美国专利No.4,975,374公开了可赋予除草剂如L-膦丝菌素抗性的谷氨酰胺合成酶基因的核苷酸序列。在欧洲申请No.0 242 246中提供了膦丝菌素乙酰转移酶基因的核苷酸序列。De Greef等人(1989),Bio/Technology 7:61中描述了表达编码膦丝菌素乙酰转移酶活性的嵌合bar基因的转基因植物的产生。赋予针对芳氧基苯氧基丙酸和环己二酮如稀禾定和甲禾灵(haloxyfop)的抗性的示例性基因是Accl-S1、Accl-S2和Accl-S3基因，如Marshall等人在(1992),Theor.Appl.Genet.83:435中所述。

[0157] (C)编码针对抑制光合作用的除草剂如三嗪(psbA基因和gs+基因)和苄腈(腈水解酶基因)的抗性或耐受性的基因。Przibilla等人在(1991),Plant Cell3:169描述了编码转化衣藻属(Chlamydomonas)的突变体psbA基因的质粒的用途。在美国专利No.4,810,648中公开了腈水解酶基因的核苷酸序列，含有这些基因的DNA分子可以通过ATCC登录号53435、67441和67442获得。编码谷胱甘肽S转移酶的DNA的克隆和表达由Hayes等人在(1992),Biochem.J.285:173中描述。

[0158] (D)编码针对可结合羟基苯基丙酮酸二加氧酶(HPPD)的除草剂的抗性或耐受性的基因，HPPD是催化对-羟基苯基丙酮酸(HPP)转化形成尿黑酸的反应的酶。这包括例如异噁唑(EP418175、EP470856、EP487352、EP527036、EP560482、EP682659、美国专利No.5,424,276)，特别是异噁唑草酮，其为玉米的选择性除草剂，二酮腈(diketonitrile)(EP496630、EP496631)，特别是2-氰基-3-环丙基-1-(2-SO2CH3-4-CF3苯基)丙烷-1,3-二酮和2-氰基-
3-环丙基-1-(2-SO2CH3-4-2,3Cl2苯基)丙烷-1,3-二酮，三酮类(EP625505、EP625508、美国专利No.5,506,195)，特别是磺草酮、和吡唑特(pyrazolinate)等除草剂。在植物中产生过量HPPD的基因能够提供针对这些除草剂的耐受性或抗性，包括例如美国专利No.6,268,549和6,245,968和美国专利申请公开文本No.20030066102中描述的基因。

[0159] (E)编码针对苯氧基生长素除草剂，如2,4-二氯苯氧基乙酸(2,4-D)的抗性或耐受性的基因，其也可以赋予针对芳氧基苯氧基丙酸类(AOPP)除草剂的抗性或耐受性。这些基因的实例包括α-酮戊二酸依赖性双加氧酶(aad-1)基因，如美国专利No.7,838,733所述。

[0160] (F)编码针对苯氧基生长素除草剂如2,4-二氯苯氧基乙酸(2,4-D)的抗性或耐受性的基因，其也可以赋予针对吡啶基氧基生长素除草剂，如氟草烟或绿草定的抗性或耐受性。这些基因的实例包括α-酮戊二酸依赖性双加氧酶(aad-12)基因，如WO 2007/053482 A2中所述。

[0161] (G)编码针对麦草畏的抗性或耐受性的基因(参见，例如美国专利公开文本No.20030135879)。

[0162] (H)提供针对抑制原卟啉原氧化酶(PPO)的除草剂的抗性或耐受性的基因(见美国专利No.5,767,373)。

[0163] (I)提供针对可结合光系统II反应中心(PS II)核心蛋白质的三嗪除草剂(例如阿特拉津)和尿素衍生物(如敌草隆)除草剂的抗性或耐受性的基因(参见Brussian等人(1989),EMBO J.1989,8(4):1237-1245)。

[0164] 3.赋予或贡献增值性状的基因

[0165] (A)修饰的脂肪酸代谢，例如，通过用反义基因或硬脂酰-ACP去饱和酶转化玉蜀黍或芸苔属而增加所述植物的硬脂酸含量(Knultzon等人(1992),Proc.Nat.Acad.Sci.USA 89:2624)。

[0166] (B)降低的植酸含量

[0167] (1)引入植酸酶编码基因，如黑曲霉植酸酶基因(Van Hartingsveldt等人(1993),Gene 127:87)，提高植酸降解，向被转化植物添加更多游离磷酸盐。

[0168] (2)可引入降低植酸含量的基因。在玉米中，这可以通过，例如，克隆然后重新导入与单个等位基因相关的DNA来实现，所述单个等位基因是导致以低植酸水平为特征的玉米突变体的原因(Raboy等人(1990),Maydica 35:383)。

[0169] (C)改良的碳水化合物组成，例如通过用编码改变淀粉的分支模式的酶的基因转化植物而实现。这样的酶的例子包括，粘液链球菌(Streptococcus mucus)果糖基转移酶基因(Shiroza等人(1988),J.Bacteriol.170:810、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(Steinmetz等人(1985),Mol.Gen.Genel.200:220)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶(Pen等人(1992),Bio/Technology 10:292)、番茄转化酶基因(Elliot等人(1993))、大麦淀粉酶基因(Sogaard等人(1993),J.Biol.Chem.268:22480)、以及玉米胚乳淀粉分支酶II(Fisher等人(1993),Plant Physiol.102:10450)。

[0170] 转化

[0171] 用于植物转化的适合方法包括可将DNA导入细胞中的任何方法，例如但不限于：电穿孔(参见，例如，美国专利5,384,253)；微粒轰击(参见，例如，美国专利5,015,580；5,550,318；5,538,880；6,160,208；6,399,861；和6,403,865)；土壤杆菌介导的转化(参见，例如，美国专利5,635,055；5,824,877；5,591,616；5,981,840；和6,384,301)；和原生质体转化(参见，例如，美国专利5,508,184)。这些方法可用于稳定转化或瞬时转化植物。

[0172] 使用诸如利用碳化硅纤维搅动的技术(参见，例如，美国专利5,302,523和5,464,765)可以将DNA构建体直接导入到植物细胞的基因组DNA中，或者可以使用生物射弹法如DNA粒子轰击将DNA构建体直接导入到植物组织中(参见，例如，Klein等人(1987)Nature
327:70-73)。或者，可通过纳米颗粒转化将DNA构建体导入植物细胞中(参见，例如，美国专利公开文本No.2009/0104700，通过提述完整并入本文)。

[0173] 另外，可以使用非土壤杆菌细菌或病毒，例如根瘤菌菌种NGR234，苜蓿中华根瘤菌、百脉根根瘤菌、马铃薯病毒X、花椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒实现基因转移，参见，例如Chung等人(2006),Trends Plant Sci.11(1):1-4。

[0174] 通过应用转化技术，基本上任何植物物种的细胞可被稳定转化，并且可通过熟知的技术将这些细胞开发为转基因植物。例如，在棉花转化背景下可以特别有用的技术描述于美国专利5,846,797；5,159,135；5,004,863；和6,624,344中；用于转化芸苔属植物的技术例如描述于美国专利5,750,871中；用于转化大豆的技术例如描述于美国专利6,384,301中；并且用于转化玉米的技术例如描述于美国专利7,060,876和5,591,616、以及国际PCT公开文本WO 95/06722中。

[0175] 在完成外源核酸到受体细胞的递送之后，通常鉴定出转化的细胞用于进一步培养和植物再生。为了提高鉴定转化体的能力，人们可能期望采用选择标志物基因，其中转化载体用来再生转化体。在说明性实施方案中，可通过使细胞暴露于一种或多种选择剂来测定转化的细胞群，或者可筛选所述细胞的期望标志物基因性状。

[0176] 暴露于选择剂后存活的细胞、或者在筛选测定中已被评分为阳性的细胞，可以在支持植物再生的介质中进行培养。在一个实施方案中，可通过包含其他物质，如生长调节剂来改良任何适合的植物组织培养基。可将组织维持在具有生长调节剂的基本培养基上，直到可得到足够的组织开始植物再生的努力时为止，或者在重复轮的手动选择之后，直到组织形态适合于再生时为止(例如，至少2周)，然后转移到有助于芽形成的介质中。定期转移培养物，直到已经出现充分的芽形成时为止。一旦芽形成，将它们转移到有助于根形成的介质中。一旦形成足够的根，可将植物转移到土壤中，以便进一步生长和成熟。

[0177] 为了证实提供在再生植物中的包含期望核酸的构建体的存在，可进行多种测定。这样的测定可包括：分子生物学测定，如Southern和Northern印迹以及PCR；生物化学测定，如检测蛋白质产物的存在，例如通过免疫学方法(ELISA、western印迹、和/或LC-MS MS分光光度法)或借助于酶功能；植物部分测定，如叶或根测定；和/或再生的全植物的表型分析。

[0178] 可例如通过使用对感兴趣核酸分子特异的寡核苷酸引物进行PCR扩增来筛选转基因事件。PCR基因分型应当理解为包括但不限于，来源于分离的宿主植物愈伤组织的基因组DNA的聚合酶链反应(PCR)扩增，所述愈伤组织预期含有整合到基因组中的感兴趣核酸分子，然后进行标准克隆和PCR扩增产物的序列分析。PCR基因分型方法已被很好地描述(参见，例如，Rios等人(2002),Plant J.32:243-53)，并可应用于来源于任何植物物种或组织类型(包括细胞培养物)的基因组DNA。可按顺序使用与靶序列和导入序列两者都结合的寡核苷酸引物的组合，或将所述组合在PCR扩增反应中多重化。可产生被设计为退火到靶位点、导入的核酸序列、和/或这两者的组合上的寡核苷酸引物。因此，PCR基因分型策略可包括，例如但不限于：在植物基因组中的特异性序列的扩增；在植物基因组中的多个特异性序列的扩增；在植物基因组中的非特异性序列的扩增；以及任何前述项的组合。本领域技术人员可设计探询基因组的引物和扩增反应的另外组合。例如，可以设计退火到核酸序列(一个或多个)上的一组正向和反向寡核苷酸引物，所述核酸序列对于导入的核酸序列的边界外部的靶标而言是特异性的。

[0179] 正向和反向寡核苷酸引物可被设计为特异性地退火到导入的核酸分子上，例如，在相应于包含在其中的感兴趣核苷酸序列之内的编码区、或所述核酸分子的其他部分的序列处。引物的使用可以结合本文中描述的引物。寡核苷酸引物可根据期望的序列加以合成并且可商购(例如，来自Integrated DNA Technologies,Inc.,Coralville,IA)。扩增之后可以进行扩增产物的克隆和测序、或直接序列分析。在一个实施方案中，在PCR扩增中采用了对基因靶特异的寡核苷酸引物。

[0180] 表达转基因的方法

[0181] 在一个实施方案中，在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子的植物。在一个实施方案中，在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR的植物。在一个实施方案中，在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子和3′-UTR的植物。

[0182] 在一个实施方案中，在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子的植物组织或植物细胞。在一个实施方案中，在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR的植物组织或植物细胞。在一个实施方案中，在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子和甘蓝型油菜ACC OX基因3′-UTR的植物组织或植物细胞。

[0183] 在一个实施方案中，在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子的基因表达盒的植物。在一个实施方案中，在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR的基因表达盒的植物。在一个实施方案中，在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子和玉米叶绿素a/b结合基因3′-UTR的基因表达盒的植物。

[0184] 在一个实施方案中，在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子的基因表达盒的植物组织或植物细胞。在一个实施方案中，在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR的基因表达盒的植物组织或植物细胞。在一个实施方案中，在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的甘蓝型油菜ACC OX基因启动子和甘蓝型油菜ACC OX基因3′-UTR的基因表达盒的植物组织或植物细胞。

[0185] 在一个实施方案中，植物、植物组织、或植物细胞包含甘蓝型油菜ACC OX基因启动子(还包括上游启动子)。在一个实施方案中，甘蓝型油菜ACC OX基因启动子可以是SEQ ID NO:1。在一个实施方案中，植物、植物组织、或植物细胞包含含有甘蓝型油菜ACC OX基因启动子的基因表达盒，其中所述启动子与SEQ ID NO:1至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.8％、或100％同一。在一个实施方案中，植物、植物组织、或植物细胞包含含有与转基因可操作连接的甘蓝型油菜ACC OX基因启动子的基因表达盒。在说明性实施方案中，植物、植物组织、或植物细胞包含含有与转基因可操作连接的甘蓝型油菜ACC OX基因启动子的基因表达盒，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。

[0186] 在一个实施方案中，植物、植物组织、或植物细胞包含含有甘蓝型油菜ACC OX基因3′-UTR的基因表达盒。在一个实施方案中，植物、植物组织、或植物细胞包含含有甘蓝型油菜ACC OX基因3′-UTR的基因表达盒。在一个实施方案中，该甘蓝型油菜ACC OX基因3′-UTR为具有SEQ ID NO:2的多核苷酸。在一个实施方案中，植物、植物组织、或植物细胞包含含有甘蓝型油菜ACC OX基因3′-UTR的基因表达盒，其中所述甘蓝型油菜ACC OX基因3′-UTR与SEQ ID NO:2至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、
99.5％、99.8％、或100％同一。在一个实施方案中，基因表达盒包含与启动子可操作连接的甘蓝型油菜ACC OX基因3′-UTR，其中所述启动子为甘蓝型油菜ACC OX基因启动子，或为源自植物(例如，拟南芥泛素10启动子)、病毒(例如，木薯叶脉花叶病毒启动子)或细菌(例如，根癌土壤杆菌δmas)的启动子。在一个实施方案中，植物、植物组织、或植物细胞包含含有与转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR的基因表达盒。在说明性实施方案中，植物、植物组织、或植物细胞包含含有与转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR的基因表达盒，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。

[0187] 在一个实施方案中，植物、植物组织、或植物细胞包含含有与转基因可操作连接的甘蓝型油菜ACC OX基因启动子和甘蓝型油菜ACC OX基因3′-UTR的基因表达盒。当基因表达盒包含两个或更多个转基因时，启动子和3′-UTR可与基因表达盒之内的不同转基因可操作连接。在说明性实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因启动子，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。在说明性实施方案中，基因表达盒包含与转基因可操作连接的甘蓝型油菜ACC OX基因3′-UTR，其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。

[0188] 在一个实施方案中，使用本文中描述的方法的转基因表达为在植物的胚珠和种子组织内表达。在一个实施方案中,转基因表达包括一个以上在植物的胚珠和种子组织中表达的转基因。在一个实施方案中，如本文中描述的种植转基因植物的方法包括胚珠和种子优选转基因表达。在一个实施方案中，在植物组织或植物细胞中表达转基因的方法包括胚珠和种子优选组织以及胚珠和种子优选细胞。在一个实施方案中，胚珠和种子优选表达包括双子叶植物的叶和茎优选表达。

[0189] 在一个另外的实施方案中，使用本文中描述的方法的转基因表达为在地上植物组织(例如，胚珠或种子)内表达。在一个实施方案中，转基因表达包括一个以上在诸如胚珠和种子的地上植物组织中表达的转基因。在其他实施方案中，转基因的表达在种子的胚乳组织内。在一个实施方案中，如本文中描述的种植转基因植物的方法包括地上植物组织转基因表达。在一个实施方案中，在植物组织或植物细胞中表达转基因的方法包括地上植物组织和地上植物细胞。在一个实施方案中，地上植物组织表达包括双子叶地上植物组织表达。

[0190] 在一个实施方案中，植物、植物组织、或植物细胞包含含有如本文中公开的甘蓝型油菜ACC OX基因启动子或3′-UTR调控元件的载体。在一个实施方案中，植物、植物组织、或植物细胞包含含有与转基因可操作连接的如本文中公开的甘蓝型油菜ACC OX基因启动子或3′-UTR调控元件的载体。在一个实施方案中，植物、植物组织、或植物细胞包含含有如本文中公开的基因表达盒的载体。在一个实施方案中，载体可以是质粒、粘粒、细菌人工染色体(BAC)、噬菌体、或病毒片段。

[0191] 在一个实施方案中，根据本文中公开的方法的植物、植物组织、或植物细胞可以是单子叶植物的。所述单子叶植物、植物组织、或植物细胞可以是，但不限于玉米、水稻、甘蔗、大麦、黑麦、高粱、兰花、竹子、香蕉、香蒲、百合、燕麦、洋葱、小米、和黑小麦。

[0192] 在一个实施方案中，根据本文中公开的方法的植物、植物组织、或植物细胞可以是双子叶植物的。所述双子叶植物、植物组织、或植物细胞可以是，但不限于，油菜、芸苔、芥菜、埃塞俄比亚芥、大豆、向日葵、和棉花。

[0193] 关于遗传修饰植物的生产，用于植物的基因工程的方法在本领域中是熟知的。例如，已经开发了用于植物转化的多种方法，包括双子叶植物以及单子叶植物的生物和物理转化方案(例如，Goto-Fumiyuki等人,Nature Biotech17:282-286(1999)；Miki等人,Methods in Plant Molecular Biology and Biotechnology,Glick B.R.和Thompson J.E.编辑，CRC Press,Inc.,Boca Raton,pp.67-88(1993))。另外，用于植物细胞或组织转化和植物再生的载体和体外培养方法是可获得的，例如，见于Gruber等人,Methods in Plant Molecular Biology and Biotechnology,Glick B.R.和Thompson J.E.编辑，CRC Press,Inc.,Boca Raton,pp.89-119(1993)。

[0194] 本领域技术人员将认识到，在外源序列稳定纳入转基因植物中并经证实为可操作之后,可通过有性杂交将其导入其他植物中。可以使用许多标准育种技术中的任何一种，这取决于被杂交的物种。

[0195] 可以通过对工程化的植物材料进行选择或筛选，利用转化DNA上存在的标志物基因所编码的性状来鉴定和分离转化的植物细胞、愈伤组织、组织、或植物。例如，可以通过在含有抑制量的抗生素或除草剂(转化基因构建体提供对该抗生素或除草剂的抗性)的培养基上培育工程化的植物材料来实施选择。此外，还可以通过筛选重组核酸构建体上可能存在的任何可见的标志物基因(例如yfp、gfp、β葡糖苷酸酶、荧光素酶、B或C1基因)的活性，来鉴定转化的细胞。这样的选择和筛选方法是本领域技术人员公知的。

[0196] 还可以使用物理和生物化学方法来鉴定含有插入的基因构建体的植物或植物细胞转化体。在某些实施方案中，本公开涉及包括确认基因组DNA的修饰，例如插入植物基因组中的基因表达盒的方法。在某些实施方案中，确认基因组的这种修饰的方法包括通过基于PCR的测定、Southern印迹测定、Northern印迹测定、蛋白质表达测定、Western印迹测定、ELISA测定或下一代测序测定进行的确认。

[0197] 因此，可以通过多种方式(包括使用序列的引物或探针)确认基因组DNA的修饰，例如插入到植物基因组中的基因表达盒。在某些实施方案中，基于转基因在植物的某些组织中或在某些发育阶段的组成型表达或选择性表达，可以检测到稳定整合的转基因，或者所述转基因可基本上在所述植物的整个生命周期表达于基本上所有植物组织中。

[0198] 可以通过任何适合的扩增方法来进行插入到植物基因组中的基因表达盒的确认。总体上参见Kwoh等人,Am.Biotechnol.Lab.8,14-25(1990)。适合的扩增技术的实例包括但不限于，聚合酶链反应、连接酶链反应、链置换扩增(总体上参见G.Walker等人,
Proc.Natl.Acad.Sci.USA 89:392-396(1992)；G.Walker等人,Nucleic Acids Res.20:
1691-1696(1992))、基于转录的扩增(参见D.Kwoh等人,Proc.Natl.Acad Sci.USA 86:
1173-1177(1989))、自我持续序列复制(或“3SR”)(参见J.Guatelli等人,
Proc.Natl.Acad.Sci.USA 87:1874-1878(1990))、Qβ复制酶系统(参见P.Lizardi等人,BioTechnology 6:1197-1202(1988))、基于核酸序列的扩增(或“NASBA”)(参见R.Lewis,Genetic Engineering News 12(9),1(1992))、修复链反应(或“RCR”)(参见R.Lewis，上文)、和自返式(boomerang)DNA扩增(或“BDA”)(参见R.Lewis，上文)。聚合酶链式反应通常是优选的。

[0199] “扩增”是涉及模板特异性的核酸复制的特殊情况。它与非特异性模板复制(即，依赖于模板但不依赖特异性模板的复制)相反。这里的模板特异性区别于复制保真性(即，正确的多核苷酸序列的合成)和核苷酸(核糖核苷酸或脱氧核糖核苷酸)特异性。模板特异性经常是就“靶”特异性而言描述的。

[0200] 如本文中使用的，术语“聚合酶链式反应”和“PCR”通常是指不用克隆或纯化而增加基因组DNA混合物中的一段靶序列的浓度的方法(美国专利No.4,683,195；4,683,202；和4,965,188；通过提述并入本文)。这个扩增靶序列的过程包括将过量的两个寡核苷酸引物导入含有期望靶序列的DNA混合物中，随后在DNA聚合酶的存在下进行一些列精确的热循环。这两个引物与它们的双链靶序列的对应链互补。为了实施扩增，使混合物变性，然后使引物退火到它们的靶分子内的互补序列上。退火之后，用聚合酶延伸引物，从而形成新的互补链对。可以多次重复变性、引物退火和聚合酶延伸步骤(即，变性、退火和延伸构成一个“循环”；可以有许多个“循环”)，以获得高浓度的期望靶序列的扩增区段。期望靶序列的扩增区段的长度是由引物相对于彼此的相对位置决定的，因此，这个长度是可控的参数。由于该过程的重复方面，该方法被称为“聚合酶链反应”(在下文中的“PCR”)。由于靶序列的期望扩增区段成为混合物中的主要序列(就浓度而言)，它们被说成是经PCR扩增的。

[0201] 术语“逆转录酶”或“RT-PCR”是指起始材料为mRNA的PCR类型。利用逆转录酶，起始mRNA被酶促转化为互补DNA或“cDNA”。然后，cDNA用作“PCR”反应的“模板”。

[0202] 在一个实施方案中，扩增反应被定量。在其他实施方案中，利用标志谱(signature profile)将扩增反应定量，其中标志谱选自解链温度或荧光标志谱。

[0203] 本公开的实施方案的核酸分子或其区段可以用作PCR扩增引物。在进行PCR扩增中，可容许一定程度的在引物与模板之间的错配。因此，例示引物的突变、缺失和插入(特别是在5′或3′端的核苷酸添加)也落在本主题公开的范围内。可以通过本领域普通技术人员已知的方法在给定的引物中产生突变、插入和缺失。

[0204] 分子信标已被描述用于序列检测。简要地说，设计与侧翼基因组和插入物DNA接点重叠的FRET寡核苷酸探针。FRET探针的独特结构导致它含有使荧光部分和猝灭部分保持非常靠近的二级结构。在热稳定聚合酶和dNTP的存在下，使FRET探针和PCR引物(一个引物在插入DNA序列内，一个引物在侧翼基因组序列内)循环。在成功的PCR扩增之后，FRET探针与靶序列的杂交导致探针的二级结构消除以及荧光部分和淬灭部分的空间分离。荧光信号指示由于成功的扩增和杂交导致的侧翼基因组/转基因插入序列的存在。这样的用于检测扩增反应的分子信标测定是本主题公开的实施方案。

[0205] 水解探针测定，或者也称作 (Life Technologies,Foster City,CA)，是一种检测和定量DNA序列的存在的方法。简要地说，设计FRET寡核苷酸探针，其具有一段在转基因内的寡聚体，一段在侧翼基因组序列内的寡聚体，用于事件特异性检测。在热稳定聚合酶和dNTP的存在下，使FRET探针和PCR引物(一个引物在插入DNA序列内，一个引物在侧翼基因组序列内)循环。FRET探针的杂交导致荧光部分从FRET探针上的猝灭部分被切断并释放。荧光信号指示由于成功的扩增和杂交导致的侧翼/转基因插入序列的存在。这样的用于检测扩增反应的水解探针测定是本主题公开的实施方案。

[0206] 测定是检测和定量DNA序列的存在的方法。简要地说，利用被称为测定系统的基于聚合酶链反应(PCR)的测定，筛选了包含插入到植物基因组中
的基因表达盒的基因组DNA样品。在主题公开的实践中使用的测定可利用含有
多种引物的 PCR测定混合物。在PCR测定混合物中使用的引物可包括至少一个正
向引物和至少一个反向引物。正向引物含有相应于供体DNA多核苷酸的特定区域的序列，并且反向引物含有相应于基因组序列的特定区域的序列。另外，在PCR测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。例如， PCR测定混合物可利用
相应于两个不同等位基因的两个正向引物和一个反向引物。正向引物之一含有相应于内源基因组序列的特定区域的序列。第二正向引物含有相应于供体DNA多核苷酸的特定区域的序列。反向引物含有相应于基因组序列的特定区域的序列。这样的用于检测扩增反应的测定是本主题公开的实施方案。

[0207] 在一些实施方案中，该荧光信号或荧光染料选自下组：HEX荧光染料、FAM荧光染料、JOE荧光染料、TET荧光染料、Cy 3荧光染料、Cy 3.5荧光染料、Cy 5荧光染料、Cy 5.5荧光染料、Cy 7荧光染料、和ROX荧光染料。

[0208] 在其他实施方案中，使用适合的第二荧光DNA染料进行扩增反应，所述第二荧光DNA染料能够在流式细胞术可检测的浓度范围内使细胞DNA染色，并且具有通过实时热循环仪可检测的荧光发射光谱。本领域普通技术人员应当理解的是，其他核酸染料是已知的并且正在被不断地鉴定。可以采用具有适当激发和发射光谱的任何适合的核酸染料，如Green、 Green I、
和在一个实施方案中，第二荧光DNA染料是以少于10μM、少于4μM、或少于2.7μM使用的

[0209] 在另外的实施方案中，可以使用下一代测序(NGS)确认插入到植物基因组中的基因表达盒。如由Brautigma等人，2010所述，可以使用DNA序列分析来确定分离和扩增的片段的核苷酸序列。可以分离扩增的片段并亚克隆到载体中，并使用链终止子法(也称为Sanger测序)或染料终止子测序进行测序。另外，可以用下一代测序对扩增子进行测序。NGS技术不需要亚克隆步骤，并且可以在单个反应中完成多个测序读取。有三种NGS平台可商购：来自454Life Sciences/Roche的Genome Sequencer FLX，来自Solexa的Illumina Genome Analyzer和Applied Biosystems的SOLiD(首字母缩写词，代表：“寡聚物连接和检测测序”(“Sequencing by Oligo Ligation and Detection”)。另外，目前正在开发两种单分子测序方法。这些包括来自Helicos Bioscience的真实单分子测序(tSMS)和来自Pacific Biosciences的单分子实时测序(SMRT)。

[0210] 由454Life Sciences/Roche推向市场的Genome Sequencer FLX是长读段NGS，其使用乳液PCR和焦磷酸测序来生成测序读段。可以使用300-800bp的DNA片段或含有3-20kbp片段的文库。反应每次运行可以产生超过100万个约250至400个碱基的读段，总产量为250至400兆碱基。与其他NGS技术相比，这种技术产生的读段最长，但每次运行的总序列输出较低。

[0211] 由Solexa推向市场的Illumina Genome Analyzer是一种短读段NGS，其利用荧光染料标记的可逆终止子核苷酸的边合成边测序法，并且以固相桥式PCR为基础。可以使用含有高达10kb的DNA片段的配对末端测序文库的构建。反应产生长度为35-76个碱基的超过1亿个短读段。这些数据每次运行可以产生3-6千兆碱基。

[0212] 由Applied Biosystems推向市场的寡聚物连接和检测测序(SOLiD)系统是一种短读段技术。这种NGS技术使用长度最多可达10kbp的片段化双链DNA。该系统使用通过染料标记的寡核苷酸引物的连接和乳液PCR进行的测序，以生成10亿个短读段，其导致每次运行高达30千兆碱基的总序列输出。

[0213] Helicos Bioscience的tSMS和Pacific Biosciences的SMRT应用不同的方法，所述方法使用单个DNA分子进行序列反应。tSMS Helicos系统产生高达8亿个短读段，每次运行生成21千兆碱基。使用荧光染料标记的虚拟终止子核苷酸完成这些反应，其被描述为“边合成边测序”方法。

[0214] 由Pacific Biosciences推向市场的SMRT下一代测序系统使用实时的边合成边测序。由于不受可逆终止子的限制，这种技术可以产生长度高达1000bp的读段。使用这种技术每天可以产生相当于二倍体人类基因组的一倍覆盖度的原始读取通量。

[0215] 在另一个实施方案中，可以使用印迹测定法完成基因表达盒插入植物基因组中的确认，包括Western印迹、Northern印迹和Southern印迹。此类印迹测定法是在生物样品的鉴定和定量的生物研究中常用的技术。这些测定法包括首先通过电泳法分离凝胶中的样品组分，接着将电泳分离的组分从凝胶转移到诸如用硝酸纤维素、聚偏二氟乙烯(PVDF)或尼龙的材料制成的转移膜上。也可以将分析物直接点样在这些支持物上，或通过施加真空、毛细管作用或压力而定向到支持物上的特定区域上，而不需要预先分离。然后通常对转移膜进行转移后处理，以增强分析物彼此区分和在视觉上或通过自动读取器被检出的能力。

[0216] 在进一步的实施方案中，可以使用ELISA测定法来完成基因表达盒插入植物基因组中的确认，所述ELISA测定法使用固相酶免疫测定法检测液体样品或湿样品中物质(通常是抗原)的存在。将来自样品的抗原附着在平板的表面上。然后，将另一种特异性抗体施用在该表面上，使得它可以与所述抗原结合。这种抗体是与酶连接的，并且，在最后的步骤中，添加含有酶底物的物质。随后的反应产生可检测的信号，最常见的是底物中的颜色变化。

[0217] 本发明公开还涵盖上文描述的转基因植物的种子，其中该种子包含所述转基因或基因表达盒。本发明公开进一步涵盖上文描述的转基因植物的后代、克隆、细胞系或细胞，其中所述后代、克隆、细胞系或细胞包含所述转基因或基因构建体。

[0218] 虽然已经参考特定的方法和实施方案描述了本发明，应当理解的是，可以做出各种不偏离本发明的修改和变化。实施例

[0219] 实施例1：从甘蓝型油菜中鉴定调控元件

[0220] 通过微阵列概貌分析(profiling)手段鉴定甘蓝型油菜基因调控元件。然后分离和克隆这些调控元件，以表征在转基因植物中使用的调控元件的表达谱。产生了用Phiyfp基因和pat选择标志物基因稳定转化的转基因拟南芥系，并且评定了转基因表达水平和组织特异性。如此，鉴定和表征了甘蓝型油菜调控元件。首次公开了在基因表达构建体中使用的启动子和3′-UTR调控元件。

[0221] 微阵列概貌分析方法

[0222] 在授粉后第15、20、25、30、35和42日(DAP)，从转基因纯合子系和未转化的野生型植物采集正在发育的甘蓝型油菜种子。接下来，通过单色全局基因表达概貌分析设计(single-color,global gene expression profiling)分析种子，以确定每个既定的时间点的全局基因表达水平。将各个60聚体寡核苷酸阵列(Agilent Technologies Inc.,Santa Clara,CA)的三个相同的重复与来自每个样品的经扩增的Cy3标记的cRNA杂交。使用定制设计的60聚体系统性全转录组卡诺拉寡核苷酸阵列(eArray,Agilent Technologies Inc.,Santa Clara,CA)进行杂交。寡核苷酸阵列包含从公共数据源(Agilent Technologies Inc.,Santa Clara,CA)获得的超过37,000种不同的卡诺拉转录物。

[0223] 使用来自制造商(Agilent Technologies Inc.,Santa Clara,CA)的Sure-PrintTM技术原位合成了60聚体寡核苷酸。为了高效地测量每个转录物的表达水平，存在于阵列中的寡核苷酸被设计为对于每个靶是独特且特异的，以便与预测的靶序列高效杂交。对于与多于一个转录物形成双链体的寡核苷酸，将其从阵列中排除。每个寡核苷酸还具备为了实现整个微阵列处理过程中的最佳性能所需的化学和物理性质。另外，定制设计的卡诺拉寡核苷酸阵列中还包括一些特异且独特的寡核苷酸，它们代表新引入的基因的以及其他几种感兴趣的基因。这些标准用于产生定制设计的60聚体系统性全转录组卡诺拉寡核苷酸阵列。

[0224] 在授粉后15、20、25、30、35和42日(DAP)，从每种基因型( 野生型和AnD9DS转基因系)的多株植物获得正在发育的种子的样品。将种子冷冻且合并，用作RNA分离和纯化的起始材料。按照Agilent One-Color Microarray-Based Gene Expression QuickAmp Labeling ProtocolTM(Agilent,Santa Clara,CA)进行标记，将来自每个样品的总共1.0μg纯化的总RNA逆转录、扩增并用Cy3-CTP标记。使用Agilent Technologies Gene Expression Hybridization kitTM和Wash Buffer kitTM(Agilent,Santa Clara,CA)，将寡TM
核苷酸基因表达阵列杂交。在全自动TECAN HS4800 PRO (TECAN,Research Triangle Park,NC)杂交站上进行杂交。

[0225] 在扫描和特征提取后，将原始数据文件上传到 GX version 10.0.2TM(Agilent Technologies,Santa Clara,CA)。基于加标对照进行样品的质量控制，以确保生成的数据具备足够高的质量，然后通过生成报告。接下来，使用
全局百分位数移位归一化方法对所得到的数据进行归一化，以使系统性非生物差异降低至最低限度并使阵列标准化以便于交叉比较。然后，将归一化的数据过滤，选择在研究中的每一个样本中被标记为“存在”的实体，消除标记为“稀少”或“缺无”的实体。将经过归一化和过滤的实体的表作为统计分析的输入，统计分析使用双向ANOVA法，其中用p<0.05的校正p值截止值定义DAP和基因型为参数。在本研究中，为所有时间点定义了甘蓝型油菜种子发育的全局基因表达谱。应用另外一组选择标准来鉴定在所有样品中在甘蓝型油菜种子发育早期一致地高水平(>50,000 像素/点)表达的基因。

[0226] 基于基因注释人工选择了其他基因，使总候选池中的靶标达到88个。为了优化总候选池，通过实时定量聚合酶链式反应(RT-qPCR)以已知的油生物合成基因表达水平为对照验证了表达水平。考察了来自15DAP和20DAP时间点的RNA，以及从卡诺拉嫩叶提取和纯化的总RNA。用SuperScriptIIITM(Invitrogen,Carlsbad,CA)进行RT-qPCR的cDNA合成。使用AbGene Absolute Blue SYBR green master mixTM(Thermo Fisher)，在480instrumentTM(Roche,Indianapolis,IN)上进行实时PCR反应。使用
primer3TM(MIT,Cambridge,MA)设计RT-qPCR的引物。针对60℃的最佳Tm设计引物。扩增子大小范围为100-224bp。选择引物以在被转录的靶序列的3′区域中产生扩增子。出于标准化目的，还测定了4种内源性油生物合成基因，包括BnACP05(酰基载体蛋白)、BnKCS(酮脂酰-CoA合酶)、BnKASIII(酮脂酰-ACP合酶)和BnSAD(硬脂酰-ACP去饱和酶)。

[0227] 为了进一步过滤候选池，选择了在早期种子中显示出表达高于ACP05(GenBank:X16114.1)的基因。还要求基因所表现出的从叶到早期种子的表达增加必须大于KASII(GenBank:AF244520.1)的种子/叶表达差异。这些过滤条件将候选基因列表减少到一种特定基因用于鉴定靶启动子。因此，使用微阵列测定法鉴定来自甘蓝型油菜的启动子和3′UTR基因调控元件，所述甘蓝型油菜在15DAP高表达cDNA，并且优先在种子中表达。

[0228] 实施例2：基因调控元件鉴定

[0229] 使用上述筛选参数，从甘蓝型油菜微阵列产生的数据中选择了一条特定序列。使用PCR反应从甘蓝型油菜栽培种Nex710中分离特异性启动子和3′UTR序列。PCR引物是根据表达的序列标签重叠群27160设计的，该重叠群是根据公众可获得的EST：Genbank：EV001081.1、CD813186.1、ES989902.1和EV088583.1)以及甘蓝栽培种TO1000的基因组重叠群ctg7180009837416组装的，后者被鉴定为与EST重叠群27160具有同源性。获得提取的启动子和3′UTR甘蓝型油菜调控序列，并通过DNA测序进一步表征。来自甘蓝型油菜栽培种Nex710基因组的、标记为ACC OX的甘蓝型油菜基因的启动子序列作为SEQ ID NO:1的
1483bp启动子序列提供。全长820bp的启动子序列在下文中以SEQ ID NO:1提供。500bp的
3′-UTR序列在下文中以SEQ ID NO:2提供。

[0230] SEQ ID NO:1

[0231]ctcacatcaccaccttttaacttcgttggttaatttcttgaaaagaagatcgtcatattttacacacaaaaagatcatcattgttgtcatgtactgtttgatgatactgacttacgaaactcgattataatattaaataacatgatataggcttttagattttatatgagttactagttttttcacgtttcgtcatcatgtatatcaataacctcgctaagatcatcagttcaccaccaaataaaacgtagccaaccgaagtctttcttctcaatttgtgttgtcaaatttgtcataaagtatgaatttctcatatacttaatacagataagtattataaattgacaattcatcaactattgaacttgaaattgaataataacattttaaacttttttttgacgacgacttctgaattgttatgtagttttgggggcatcattagaaaagcaaaagagaaagtactatcacttcaaacttcttttcatttttctacttcttagtgagtttgggaatattctataacttcgattaatatgaatgaatgtataaatactctgtatgcttttcaaccttttcttaccaaacatctgatcaaagatctttattgatttgttaggaatatggaggaatatttttccctattatggaggaatccgaagataagttattgtaagtaggtcgcgaatggcaactgatattattgcagaaacaacctcataaatgataaagttacaaaaaaaaaattattatcaagcttatatactttattcccaaaatttaaagtacgcatatttgattcctttgtgatagcgtacacgttctctaaccatgatgattccaataaatacaccaaaaaccttacaaaatgactcttgaaagtaaactagataatcaattcaaattctttctatatagtttgtttgctaaaggttattggtagtttcgaaatagtcattcatatccctttttttttgcatataatgactccccgaaggggctaagcaccagataaaaagtgttcgagtgcttctctgatttgtaacaacccatacacaattattcatataaaataaaagcaaaagaaaaagccaatataattgcagagaataagagatcgaaatggaaaacacaaagtttatcccaccaattatgttgcgcacacacaccatcgtatacaacttccacaacctccttttcttttctagtaaggaaaaaaacaaatttatatctactaagttctaactttatttaaatggcacaattatagatatcgtatatataatatatcattatacatatatatatatatatataaaatataatataatattttttttaagatctttgatttactatctgcgcctataaatagcgatcctccctcaactccttaactcacatttgacaactaacatcttcaacaacattaagttgccagtttaaagatattcatacgtttacatagagagggtctagagta

[0232] SEQ ID NO:2

[0233]atggatgtgggattttttatgaaggcaagaaagatggggttttgatatgtgtgtgggcaacaatgttaaataagtattgaagctaatgttatagtagaatcaagaactaagttgtgatcacttatgaatctagtgtggttaagtgtgggagtgtttatgcaataattgtattggaaatatgaattttaaagattatactacaagttcgtaacatttgagatatgaatacttgaaaaaaactcgaatgtttacaaaagtaacaaactcctcacacatgcataattgaaatcatcaacagatttgggcttatgtatattggatcaaaggcccaaaatattttaaaattgtattagggggattctagggcatcactctgtatcctactataaatactcctctagagctgagatttctcatacagcacgggttacagcttacagtcgatgaatcattagagtttctctctttctacacagtagtacagtacacatctcgttttg

[0234] 实施例3：甘蓝型油菜启动子和3′UTR构建体

[0235] 使用标准重组DNA技术构建了基因表达盒，其由SEQ ID NO:1的全长甘蓝型油菜ACC OX基因启动子、含有马铃薯光特异性组织诱导型LS-1基因(ST-LS1内含子；Genbank登录号X04753)的黄色荧光蛋白基因(Phiyfp；Shagin等人(2004),Mol Biol Evol 21；841-50)、和具有SEQ ID NO:2的甘蓝型油菜ACC OX 3′UTR组成。这个基因表达盒的两侧有att位点。得到的入门质粒含有在甘蓝型油菜ACC OX基因启动子的控制下、并以甘蓝型油菜ACC OX基因3′UTR终止的yfp基因表达盒，接下来以该入门质粒和以及目的载体进行
LR CLONASE (Life Technologies,Carlsbad,CA)反应，生成最终的表达
载体pDAB113904。该目的载体含有一个选择标志物盒，选择标志物盒包含pat基因(Wohlleben等人,Gene 70:25-37；(1988))，该pat基因由木薯叶脉花叶病毒启动子(CsVMV启动子；Verdaguer等人,Plant Molecular Biology 31:1129-1139；(1996))驱动，并以根癌土壤杆菌开放阅读框1的3′-UTR(AtuORF1 3′UTR；Huang等人,J.Bacteriol.172:1814-
1822；(1990))终止。得到的构建体pDAB113904是一个异源表达构建体，含有一个yfp基因表达盒(SEQ ID NO:3)和一个pat基因表达构建体(SEQ ID NO:4)，由以图1中的质粒图谱表示。

[0236] SEQ ID NO:3(提供来自pDAB113904的黄色荧光蛋白基因表达盒的核酸序列)[0237]ctcacatcaccaccttttaacttcgttggttaatttcttgaaaagaagatcgtcatattttacacacaaaaagatcatcattgttgtcatgtactgtttgatgatactgacttacgaaactcgattataatattaaataacatgatataggcttttagattttatatgagttactagttttttcacgtttcgtcatcatgtatatcaataacctcgctaagatcatcagttcaccaccaaataaaacgtagccaaccgaagtctttcttctcaatttgtgttgtcaaatttgtcataaagtatgaatttctcatatacttaatacagataagtattataaattgacaattcatcaactattgaacttgaaattgaataataacattttaaacttttttttgacgacgacttctgaattgttatgtagttttgggggcatcattagaaaagcaaaagagaaagtactatcacttcaaacttcttttcatttttctacttcttagtgagtttgggaatattctataacttcgattaatatgaatgaatgtataaatactctgtatgcttttcaaccttttcttaccaaacatctgatcaaagatctttattgatttgttaggaatatggaggaatatttttccctattatggaggaatccgaagataagttattgtaagtaggtcgcgaatggcaactgatattattgcagaaacaacctcataaatgataaagttacaaaaaaaaaattattatcaagcttatatactttattcccaaaatttaaagtacgcatatttgattcctttgtgatagcgtacacgttctctaaccatgatgattccaataaatacaccaaaaaccttacaaaatgactcttgaaagtaaactagataatcaattcaaattctttctatatagtttgtttgctaaaggttattggtagtttcgaaatagtcattcatatccctttttttttgcatataatgactccccgaaggggctaagcaccagataaaaagtgttcgagtgcttctctgatttgtaacaacccatacacaattattcatataaaataaaagcaaaagaaaaagccaatataattgcagagaataagagatcgaaatggaaaacacaaagtttatcccaccaattatgttgcgcacacacaccatcgtatacaacttccacaacctccttttcttttctagtaaggaaaaaaacaaatttatatctactaagttctaactttatttaaatggcacaattatagatatcgtatatataatatatcattatacatatatatatatatatataaaatataatataatattttttttaagatctttgatttactatctgcgcctataaatagcgatcctccctcaactccttaactcacatttgacaactaacatcttcaacaacattaagttgccagtttaaagatattcatacgtttacatagagagggtctagagtaggatctccatgtcatctggagcacttctctttcatgggaagattccttacgttgtggagatggaagggaatgttgatggccacacctttagcatacgtgggaaaggctacggagatgcctcagtgggaaaggtatgtttctgcttctacctttgatatatatataataattatcactaattagtagtaatatagtatttcaagtatttttttcaaaataaaagaatgtagtatatagctattgcttttctgtagtttataagtgtgtatattttaatttataacttttctaatatatgaccaaaacatggtgatgtgcaggttgatgcacaattcatctgtactaccggagatgttcctgtgccttggagcacacttgtcaccactctcacctatggagcacagtgctttgccaagtatggtccagagttgaaggacttctacaagtcctgtatgccagatggctatgtgcaagagcgcacaatcacctttgaaggagatggcaacttcaagactagggctgaagtcacctttgagaatgggtctgtctacaatagggtcaaactcaatggtcaaggcttcaagaaagatggtcacgtgttgggaaagaacttggagttcaacttcactccccactgcctctacatctggggagaccaagccaaccacggtctcaagtcagccttcaagatatgtcatgagattactggcagcaaaggcgacttcatagtggctgaccacacccagatgaacactcccattggtggaggtccagttcatgttccagagtatcatcatatgtcttaccatgtgaaactttccaaagatgtgacagaccacagagacaacatgagcttgaaagaaactgtcagagctgttgactgtcgcaagacctacctttgagtagttagcttaatcacctagagctcggtcaccatggatgtgggattttttatgaaggcaagaaagatggggttttgatatgtgtgtgggcaacaatgttaaataagtattgaagctaatgttatagtagaatcaagaactaagttgtgatcacttatgaatctagtgtggttaagtgtgggagtgtttatgcaataattgtattggaaatatgaattttaaagattatactacaagttcgtaacatttgagatatgaatacttgaaaaaaactcgaatgtttacaaaagtaacaaactcctcacacatgcataattgaaatcatcaacagatttgggcttatgtatattggatcaaaggcccaaaatattttaaaattgtattagggggattctagggcatcactctgtatcctactataaatactcctctagagctgagatttctcatacagcacgggttacagcttacagtcgatgaatcattagagtttctctctttctacacagtagtacagtacacatctcgttttg

[0238] SEQ ID NO:4(提供来自pDAB113904的膦丝菌素乙酰转移酶基因表达盒的核酸序列)

[0239]ccagaaggtaattatccaagatgtagcatcaagaatccaatgtttacgggaaaaactatggaagtattatgtaagctcagcaagaagcagatcaatatgcggcacatatgcaacctatgttcaaaaatgaagaatgtacagatacaagatcctatactgccagaatacgaagaagaatacgtagaaattgaaaaagaagaaccaggcgaagaaaagaatcttgaagacgtaagcactgacgacaacaatgaaaagaagaagataaggtcggtgattgtgaaagagacatagaggacacatgtaaggtggaaaatgtaagggcggaaagtaaccttatcacaaaggaatcttatcccccactacttatccttttatatttttccgtgtcatttttgcccttgagttttcctatataaggaaccaagttcggcatttgtgaaaacaagaaaaaatttggtgtaagctattttctttgaagtactgaggatacaacttcagagaaatttgtaagtttgtaggtaccagatctggatcccaaaccatgtctccggagaggagaccagttgagattaggccagctacagcagctgatatggccgcggtttgtgatatcgttaaccattacattgagacgtctacagtgaactttaggacagagccacaaacaccacaagagtggattgatgatctagagaggttgcaagatagatacccttggttggttgctgaggttgagggtgttgtggctggtattgcttacgctgggccctggaaggctaggaacgcttacgattggacagttgagagtactgtttacgtgtcacataggcatcaaaggttgggcctaggatctacattgtacacacatttgcttaagtctatggaggcgcaaggttttaagtctgtggttgctgttataggccttccaaacgatccatctgttaggttgcatgaggctttgggatacacagcccggggtacattgcgcgcagctggatacaagcatggtggatggcatgatgttggtttttggcaaagggattttgagttgccagctcctccaaggccagttaggccagttacccaaatctgagtagttagcttaatcacctagagctcgatcggcggcaatagcttcttagcgccatcccgggttgatcctatctgtgttgaaatagttgcggtgggcaaggctctctttcagaaagacaggcggccaaaggaacccaaggtgaggtgggctatggctctcagttccttgtggaagcgcttggtctaaggtgcagaggtgttagcgggatgaagcaaaagtgtccgattgtaacaagatatgttgatcctacgtaaggatattaaagtatgtattcatcactaatataatcagtgtattccaatatgtactacgatttccaatgtctttattgtcgccgtatgtaatcggcgtcacaaaataatccccggtgactttcttttaatccaggatgaaataatatgttattataatttttgcgatttggtccgttataggaattgaagtgtgcttgaggtcggtcgccaccactcccatttcataattttacatgtatttgaaaaataaaaatttatggtattcaatttaaacacgtatacttgtaaagaatgatatcttgaaagaaatatagtttaaatatttattgataaaataacaagtcaggtattatagtccaagcaaaaacataaatttattgatgcaagtttaaattcagaaatatttcaataactgattatatcagctggtacattgccgtagatgaaagactgagtgcgatattatggtgtaatacatagg

[0240] 组装了含有黄色荧光蛋白(yfp)基因表达盒和膦丝菌素乙酰转移酶基因表达盒的阳性对照构建体pDAB9381。具体地说，所述黄色荧光蛋白基因表达盒含有拟南芥泛素10基因启动子(At Ubi10启动子；Callis等人(1990),J.Biol.Chem.265:12486-12493)、含有马铃薯光特异性组织诱导型LS-1基因(ST-LS1内含子；Genbank登录号X04753)的黄色荧光蛋白编码序列(PhiYFP；Shagin等人(2004),Molecular Biology and Evolution,21(5),841-850)，并以根癌土壤杆菌开放阅读框23的3′非翻译区(AtuORF23 3′UTR)终止。所述选择标志物基因表达盒含有木薯叶脉花叶病毒启动子(CsVMV启动子；Verdaguer等人,Plant Molecular Biology 31:1129-1139；(1996))、膦丝菌素乙酰转移酶(PAT；Wohlleben等人,Gene 70:25-37；(1988))和根癌土壤杆菌ORF1 3′非翻译区(AtuORF1 3′UTR；Huang等人,J.Bacteriol.172:1814-1822；(1990))。得到的构建体pDAB9381是一个异源表达构建体，含有yfp基因表达盒(SEQ ID NO:5)和pat基因表达构建体(SEQ ID NO:5)，将其表示在图2中。

[0241] SEQ ID NO:5(提供来自pDAB9381的黄色荧光蛋白基因表达盒的核酸序列)

[0242]gtcgacctgcaggtcaacggatcaggatattcttgtttaagatgttgaactctatggaggtttgtatgaactgatgatctaggaccggataagttcccttcttcatagcgaacttattcaaagaatgttttgtgtatcattcttgttacattgttattaatgaaaaaatattattggtcattggactgaacacgagtgttaaatatggaccaggccccaaataagatccattgatatatgaattaaataacaagaataaatcgagtcaccaaaccacttgccttttttaacgagacttgttcaccaacttgatacaaaagtcattatcctatgcaaatcaataatcatacaaaaatatccaataacactaaaaaattaaaagaaatggataatttcacaatatgttatacgataaagaagttacttttccaagaaattcactgattttataagcccacttgcattagataaatggcaaaaaaaaacaaaaaggaaaagaaataaagcacgaagaattctagaaaatacgaaatacgcttcaatgcagtgggacccacggttcaattattgccaattttcagctccaccgtatatttaaaaaataaaacgataatgctaaaaaaatataaatcgtaacgatcgttaaatctcaacggctggatcttatgacgaccgttagaaattgtggttgtcgacgagtcagtaataaacggcgtcaaagtggttgcagccggcacacacgagtcgtgtttatcaactcaaagcacaaatacttttcctcaacctaaaaataaggcaattagccaaaaacaactttgcgtgtaaacaacgctcaatacacgtgtcattttattattagctattgcttcaccgccttagctttctcgtgacctagtcgtcctcgtcttttcttcttcttcttctataaaacaatacccaaagcttcttcttcacaattcagatttcaatttctcaaaatcttaaaaactttctctcaattctctctaccgtgatcaaggtaaatttctgtgttccttattctctcaaaatcttcgattttgttttcgttcgatcccaatttcgtatatgttctttggtttagattctgttaatcttagatcgaagacgattttctgggtttgatcgttagatatcatcttaattctcgattagggtttcataaatatcatccgatttgttcaaataatttgagttttgtcgaataattactcttcgatttgtgatttctatctagatctggtgttagtttctagtttgtgcgatcgaatttgtcgattaatctgagtttttctgattaacagagatctccatgtcatctggagcacttctctttcatgggaagattccttacgttgtggagatggaagggaatgttgatggccacacctttagcatacgtgggaaaggctacggagatgcctcagtgggaaaggtatgtttctgcttctacctttgatatatatataataattatcactaattagtagtaatatagtatttcaagtatttttttcaaaataaaagaatgtagtatatagctattgcttttctgtagtttataagtgtgtatattttaatttataacttttctaatatatgaccaaaacatggtgatgtgcaggttgatgcacaattcatctgtactaccggagatgttcctgtgccttggagcacacttgtcaccactctcacctatggagcacagtgctttgccaagtatggtccagagttgaaggacttctacaagtcctgtatgccagatggctatgtgcaagagcgcacaatcacctttgaaggagatggcaacttcaagactagggctgaagtcacctttgagaatgggtctgtctacaatagggtcaaactcaatggtcaaggcttcaagaaagatggtcacgtgttgggaaagaacttggagttcaacttcactccccactgcctctacatctggggagaccaagccaaccacggtctcaagtcagccttcaagatatgtcatgagattactggcagcaaaggcgacttcatagtggctgaccacacccagatgaacactcccattggtggaggtccagttcatgttccagagtatcatcatatgtcttaccatgtgaaactttccaaagatgtgacagaccacagagacaacatgagcttgaaagaaactgtcagagctgttgactgtcgcaagacctacctttgagtagttagcttaatcacctagagctcggtcaccagcataatttttattaatgtactaaattactgttttgttaaatgcaattttgctttctcgggattttaatatcaaaatctatttagaaatacacaatattttgttgcaggcttgctggagaatcgatctgctatcataaaaattacaaaaaaattttatttgcctcaattattttaggattggtattaaggacgcttaaattatttgtcgggtcactacgcatcattgtgattgagaagatcagcgatacgaaatattcgtagtactatcgataatttatttgaaaattcataagaaaagcaaacgttacatgaattgatgaaacaatacaaagacagataaagccacgcacatttaggatattggccgagattactgaatattgagtaagatcacggaatttctgacaggagcatgtcttcaattcagcccaaatggcagttgaaatactcaaaccgccccatatgcaggagcggatcattcattgtttgtttggttgcctttgccaacatgggagtccaaggtt

[0243] SEQ ID NO:6(提供了来自pDAB9381的膦丝菌素乙酰转移酶基因表达盒的核酸序列)

[0244]ccagaaggtaattatccaagatgtagcatcaagaatccaatgtttacgggaaaaactatggaagtattatgtaagctcagcaagaagcagatcaatatgcggcacatatgcaacctatgttcaaaaatgaagaatgtacagatacaagatcctatactgccagaatacgaagaagaatacgtagaaattgaaaaagaagaaccaggcgaagaaaagaatcttgaagacgtaagcactgacgacaacaatgaaaagaagaagataaggtcggtgattgtgaaagagacatagaggacacatgtaaggtggaaaatgtaagggcggaaagtaaccttatcacaaaggaatcttatcccccactacttatccttttatatttttccgtgtcatttttgcccttgagttttcctatataaggaaccaagttcggcatttgtgaaaacaagaaaaaatttggtgtaagctattttctttgaagtactgaggatacaacttcagagaaatttgtaagtttgtaggtaccagatctggatcccaaaccatgtctccggagaggagaccagttgagattaggccagctacagcagctgatatggccgcggtttgtgatatcgttaaccattacattgagacgtctacagtgaactttaggacagagccacaaacaccacaagagtggattgatgatctagagaggttgcaagatagatacccttggttggttgctgaggttgagggtgttgtggctggtattgcttacgctgggccctggaaggctaggaacgcttacgattggacagttgagagtactgtttacgtgtcacataggcatcaaaggttgggcctaggatctacattgtacacacatttgcttaagtctatggaggcgcaaggttttaagtctgtggttgctgttataggccttccaaacgatccatctgttaggttgcatgaggctttgggatacacagcccggggtacattgcgcgcagctggatacaagcatggtggatggcatgatgttggtttttggcaaagggattttgagttgccagctcctccaaggccagttaggccagttacccaaatctgagtagttagcttaatcacctagagctcgatcggcggcaatagcttcttagcgccatcccgggttgatcctatctgtgttgaaatagttgcggtgggcaaggctctctttcagaaagacaggcggccaaaggaacccaaggtgaggtgggctatggctctcagttccttgtggaagcgcttggtctaaggtgcagaggtgttagcgggatgaagcaaaagtgtccgattgtaacaagatatgttgatcctacgtaaggatattaaagtatgtattcatcactaatataatcagtgtattccaatatgtactacgatttccaatgtctttattgtcgccgtatgtaatcggcgtcacaaaataatccccggtgactttcttttaatccaggatgaaataatatgttattataatttttgcgatttggtccgttataggaattgaagtgtgcttgaggtcggtcgccaccactcccatttcataattttacatgtatttgaaaaataaaaatttatggtattcaatttaaacacgtatacttgtaaagaatgatatcttgaaagaaatatagtttaaatatttattgataaaataacaagtcaggtattatagtccaagcaaaaacataaatttattgatgcaagtttaaattcagaaatatttcaataactgattatatcagctggtacattgccgtagatgaaagactgagtgcgatattatggtgtaatacatagg

[0245] 实施例4：植物转化和分子确认

[0246] 土壤杆菌的制备

[0247] 接下来，用60μl含有上述二元质粒之一的土壤杆菌菌株[于50％甘油(预先制备并于-80℃冷冻)中]来制备含有大观霉素(100mg/L)、卡那霉素(50mg/L)和利福平(10mg/L)的TM5ml的YEP液(Bacto Peptone 10.0gm/L、酵母提取物10.0gm/L、和氯化钠5.0gm/L)起子培养物，并在28℃通气下温育过夜。然后，将土壤杆菌起子接种到无菌的500mL带挡板烧瓶中的含大观霉素(100mg/L)、卡那霉素(50mg/L)和利福平(10mg/L)的300mL YEP液中，在28℃以200rpm振摇过夜。将培养物以6000rpm离心并重悬于等体积的含有10％(w/v)蔗糖、10μg/L 6-苄氨基嘌呤和.03％Silwet L-77的1/2X MS培养基中，然后转化植物组织。

[0248] 拟南芥转化

[0249] 使用自Clough和Bent(1998)借鉴的花序浸渍法(floral dip)转化拟南芥。使用含有上述二元质粒之一的经验证的土壤杆菌甘油储液接种5mL含有大观霉素(100mg/L)和卡那霉素(50mg/L)、和利福平(10mg/L)的YEP肉汤预培养物。将培养物在28℃通气下温育过夜。然后，在相同的抗生素选择条件下将预培养物放大至300mL，再次在225rpm恒定搅拌下在28℃温育。在4℃使细胞在大约5,000x g下沉淀15分钟，弃去上清液。将细胞沉淀轻轻重悬于300mL的接种培养基中，所述培养基含有：10％(w/v)蔗糖、10μg/L 6-苄氨基嘌呤、以及.03％Silwet L-77。将41日龄的植物(在35天时修剪主花序)倒置并浸入培养基中。将植物(现在称为T0)侧放在透明覆盖的塑料桶中，过夜，然后在第二天直立放置在生长室中。使植物在22℃、16小时光照/8小时黑暗的光周期中生长。浸渍四周后，将水去除，使植物干燥一周以备T1种子收获。

[0250] 将T1种子播种在10.5”x21”发芽托盘(germination tray)中，每个盘放入200mg等份的层积T1种子(约10,000粒种子)，所述种子先前已悬于40mL 0.1％琼脂糖溶液中，并在4℃保存2天，以确保种子同步萌发(春化)。

[0251] 将Sunshine Mix LP5土壤介质用细蛭石覆盖，并用Hoagland溶液从地下灌溉至湿润，然后通过重力排干。用移液器将每个40mL等份的层积种子均匀播种在蛭石上，并用保湿盖(humidity dome)覆盖4-5天。除去保湿盖1天后，利用草铵膦(Liberty)进行初始转化体选择。

[0252] 在种植后7天日(7DAP)以及9DAP时，对T1植物(分别在子叶和2-4叶期)用0.2％的Liberty除草剂溶液(200g活性成分/L的草铵膦，Bayer Crop Sciences,Kansas City,MO)以10ml/盘(703L/公顷)的喷洒体积使用DeVilbiss压缩空气喷嘴进行喷洒，递送的有效比率为每次施用280g ai/ha的草铵膦。在最后喷洒3天后鉴定存活者(活跃生长的推定转化植物)，并在最后喷洒选择之后7天(16DAP)逐一移栽到温室中的备有Sunshine Mix LP5的3英寸盆中。将移栽的植物在温室中培养(22±5℃,50±30％RH，14h光照:10小时黑暗，最低500μE/m2s1自然光+补充光)。对存活的T1植物进行分子分析，以确认pat除草剂选择标志物基因已经整合到植物的基因组中。

[0253] 分子确认

[0254] 对推定的转基因拟南芥植物进行取样，用于采用针对pat的定量PCR测定法检测转基因的存在。使用 BIOSPRINT96Kit DNA提取试剂盒(Qiagen,Valencia,CA)按照制造商的说明从叶样品中提取总DNA。

[0255] 为了检测感兴趣的基因，通过水解(类似于 )引物/探针组扩增基因特异性DNA片段，所述引物/探针组含有用于pat基因的Cy5标记的荧光探针和用于内源性TafII-
15参考基因对照(Genbank ID:NC 003075；Duarte等人，BMC Evol.Biol.,10:61)的HEX标记的荧光探针。下列引物用于pat和内源性TafII-15参考基因扩增。引物序列如下：

[0256] pat引物/探针：

[0257] Pat正向引物：TQPATS:ACAAGAGTGGATTGATGATCTAGAGAGGT(SEQ ID NO:7)；

[0258] Pat反向引物：TQPATA:CTTTGATGCCTATGTGACACGTAAACAGT(SEQ ID NO:8)；和[0259] Pat探针：5′-/5Cy5/AGGGTGTTGTGGCTGGTATTGCTTACGCT/3BHQ_2/-3′(SEQ ID NO:9)；

[0260] TafII-15引物/探针：

[0261] 正向引物：TafII-15F:GAGGATTAGGGTTTCAACGGAG(SEQ ID NO:10)；

[0262] 反向引物：TafII-15R:GAGAATTGAGCTGAGACGAGG(SEQ ID NO:11)；和

[0263] TafII-15探针：5′-/5HEX/AGAGAAGTTTCGACGGATTTCGGGC/3BHQ_2/-3′(SEQ ID NO:12)；

[0264] 接下来，在10μl的反应终体积中进行qPCR反应，所述反应含有5μl的Roche480Probes母液混合物(Roche Applied Sciences,Indianapolis,IN)；
各自0.4μl的TQPATA、TQPATS、TafII-15F和TafII-15R引物，其从10μM的原液稀释为终浓度
400nM；各自0.4μl的Pat探针和TafII-15探针，其从5μM原液稀释为终浓度200nM；以1:5稀释在水中的2μl的基因组DNA；和0.5μl水。在Roche 480System中在下列条件
下扩增DNA：95℃10分钟，1个循环，接着为40个循环的下列3个步骤：95℃10秒；60℃40秒；和
72℃1秒。通过将未知样品的靶(感兴趣基因)/参考(转化酶基因)值(由
480输出)与pat拷贝数对照的靶/参考值进行比较来确定pat拷贝数。

[0265] 根据分子确认，鉴定了含有上述质粒的单个转基因插入片段的特定拟南芥转基因事件。使这些植物自体受精，种植所得的T1种子，以监测和测定T1幼苗在不同发育阶段的不同植物组织中的YFP蛋白表达。

[0266] 实施例5：转基因植物表达筛选

[0267] 使拟南芥T1转基因事件长成幼苗，在15DAP时通过荧光显微镜和目视观察评定YFP荧光。另外，在种植7周后，进一步观察拟南芥T1转基因事件，其中通过荧光显微镜和目视查看了叶、花序和长角果。最后，在种植10周后观察拟南芥T1转基因事件，其中通过荧光显微镜和目视查看正在发育的幼苗。使用Leica DFC310FX StereoscopeTM(Leica,Buffalo Grove,IL)对幼苗和正在发育的种子成像，其设置如下(例如，最大激发波长-525nm、最大发射波长-482nm)。使用Typhoon ScannerTM(GE Healthcare Life Sciences,Piscataway,NJ)对叶、花序和长角果进行成像，其设置如下(例如，用于叶绿素的蓝色488nm激光，670BP 30，用于Phiyfp的520BP 40，350PMT)。

[0268] T1幼苗和植物组织的YFP成像表明，在甘蓝型油菜ACC OX基因启动子控制下并由甘蓝型油菜ACC OX基因3′UTR终止的蛋白质在种子中优先表达，该种子优先表达在单拷贝事件中检测到。目视观察表明，由这些调控元件驱动的表达是早期种子发育和早期花发育所特有的。就这点而言，在正在发育的花序的胚珠内观察到由甘蓝型油菜ACC OX调控元件驱动的表达模式(图3)。在拟南芥植物种子发育期间，YFP蛋白组织的表达最可能位于胚乳组织内。胚乳组织中的表达是显著的，因为在种子发育早期大部分的种子组织是由这种类型的组织构成的。在含有yfp基因的多个拷贝的转基因事件的花、茎、叶和种子中观察到了进一步的YFP蛋白表达。

[0269] 实施例6：拟南芥中的蛋白表达定量

[0270] 通过PhiYFP ELISA测定拟南芥植物种子的样品，收集种子并进行珠磨。在KleccoTM珠磨机中将约10mg的种子材料用2BB(4.5mm 钢珠；Daisy；Rogers，AR)击打1分钟。加入300μl提取缓冲液(PBS，补充有按重量计的0.05％Tween20和0.05％牛血清白蛋白)。在轻轻敲打使样品悬浮，在室温下在平台式摇床上摇动30分钟。然后，将样品在离心机中以14,000x g旋转离心5分钟。除去上清液并通过ELISA分析。

[0271] 将Maxisorb platesTM(Thermo Fisher Scientific)用1X PBS中的1.0μg/ml浓度的抗YFP单克隆抗体(Origene#TA150028)包被。在4℃温育过夜后，用含有0.5％牛血清白蛋白的PBST(PBS+0.5％ -20)在37℃封闭平板2小时。在分析前，将平板在洗板机中洗涤4次，每次洗涤使用350μl的PBST。将纯化的蛋白质参考抗原(Evrogen)在封闭缓冲液中稀释到2ng/ml，用于生成具有2ng/ml到0.0313ng/ml系列稀释度的标准曲线。将样品在封闭缓冲液中稀释到1:4的起始稀释度，并以1:4的比率另外稀释3次(1:4、1:16、1:64、1:256)。
接着，将100μl的所有标准品和样品稀释物以一式两份上样到ELISA板上。在室温下在ELISA板上温育样品1小时。温育后，如上所述洗涤平板。将兔抗PhiYFP多克隆抗体(Evrogen)在封闭缓冲液中稀释到1μg/ml，并以100μl/孔加入板中。在室温下将平板温育1小时，然后洗涤。
将抗兔辣根过氧化物酶缀合的检测抗体(Pierce)以1:5000稀释度加入板中。在室温下将平板温育1小时，如上进行洗涤。接着，以每孔100μl向平板中加入1-Step Ultra TMB TM
substrate (Thermo Scientific)。当含有标准曲线最低稀释度的孔开始显示蓝色时，加入
50μl的终止溶液(0.4N H2SO4)使反应停止。在使用 Pro v5(Molecular Devices)的酶标仪(Molecular Devices)中在450nm下读板，减去650nm的参比。通过二次方标准曲线的线性回归计算测试样品的PhiYFP浓度。

[0272] 将YFP的表达水平定量，并提供在下表1中。对于含有低拷贝数事件(即1至2个拷贝)的转基因事件，YFP在甘蓝型油菜ACC OX调控元件作用下在拟南芥种子中的表达的范围为0.004到0.020ng/mg。此外，这些结果表明，低拷贝数事件的平均表达量为约0.00875ng/mg。最后，对于含有高拷贝数事件(即，多于2个拷贝)的转基因事件，在甘蓝型油菜ACC OX调控元件作用下在拟南芥种子中的YFP表达量为1.079ng/mg。

[0273] 表1：拟南芥种子中YFP的表达定量

[0274]

[0275] 如此，鉴定和表征了甘蓝型油菜ACC OX基因调控元件。首次公开了在基因表达构建体中使用的新的启动子和3′-UTR调控元件。

标题	发布/更新时间	阅读量
转基因在棉花中的保卫细胞特异性表达	2020-05-12	982
人粒细胞巨噬细胞集落刺激因子特异性表达的基因序列	2020-05-13	628
肝癌细胞特异的基因工程腺病毒的构建及应用	2020-05-12	813
人异基因有核细胞工业化制备自然杀伤性细胞（NK）及注射液	2020-05-12	658
一种细胞特异性ndrg2基因表达下调的载体	2020-05-11	687
一种牙鲆卵母细胞特异基因figla及其应用	2020-05-12	242
粒－巨细胞集落刺激因子基因修饰的异基因肿瘤细胞疫苗	2020-05-11	920
肽癌抗原‑特异性T细胞的受体基因	2020-05-11	949
肿瘤特异性细胞亚群和特征基因及其应用	2020-05-11	487
CRISPR-Cas9靶向敲除人细胞SANIL1基因及其特异性的sgRNA	2020-05-12	816

通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子

通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子

该功能需要专业版企业版VIP权限，您可以：