首页 / 专利库 / 兽医学 / 乳腺炎 / 乳腺炎抗性的遗传标记

乳腺炎抗性的遗传标记

阅读:638发布:2020-05-13

专利汇可以提供乳腺炎抗性的遗传标记专利检索,专利查询,专利分析的服务。并且提供了一种用于确定 牛 受试者中的 乳腺炎 抗性的方法,包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联。此外,提供了针对所述牛受试者中对乳腺炎易感性而言来确定 育种值 的方法,包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,并基于所述存在与否来分配育种值。,下面是乳腺炎抗性的遗传标记专利的具体信息内容。

1.一种确定受试者中的乳腺炎抗性的方法,包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,其中所述至少一个遗传标记位于BTA6上的神经肽FF受体
2(NPFFR2)基因中,和/或所述至少一个遗传标记位于选自区域1-61的牛基因组的区域中,其中所述区域由列3和5中所鉴定的SNP标记划定,和/或由列4和6中所鉴定的基因组位置划定:
2.根据权利要求1所述的方法,其中所述遗传标记选自权利要求1中的表格的列9中所列的最显著SNP。
3.根据前述任一项权利要求所述的方法,其中所述遗传标记位于选自权利要求1的表格中所列的区域14、34、43和53的区域中。
4.根据前述任一项权利要求所述的方法,其中所述遗传标记选自
BovineHD0600024355、BovineHD1300017074、BovineHD1600014622和BovineHD2000010279。
5.根据前述任一项权利要求所述的方法,其中所述遗传标记位于BTA6上的由SNP标记
18708和26792所划定的区域中。
6.根据前述任一项权利要求所述的方法,其中所述遗传标记位于BTA6上的神经肽FF受体2(NPFFR2)基因中。
7.根据前述任一项权利要求所述的方法,其中所述遗传标记为
SNPBovineHD0600024355和/或以遗传方式偶联到SNP BovineHD0600024355的任何遗传标记。
8.根据前述任一项权利要求所述的方法,其中所述遗传标记为位于
89,059,253Bp(UMD3.1)处的G/A SNP,其中A等位基因与乳腺炎相关联,且G等位基因与乳腺炎抗性相关联。
9.根据前述任一项权利要求所述的方法,其中所述遗传标记位于BTA20上的含半胱天冬酶募集结构域的蛋白6(CARD6)基因中,诸如rs133218364T/C SNP,其中T等位基因与乳腺炎相关联,且C等位基因与乳腺炎抗性相关联。
10.根据前述任一项权利要求所述的方法,其中所述遗传标记位于BTA20上的白血病抑制因子受体(LIFR)基因的下游5000bp区域中,诸如rs133596506SNP,其中C等位基因与乳腺炎相关联,且T等位基因与乳腺炎抗性相关联。
11.根据前述任一项权利要求所述的方法,其中所述遗传标记选自表10、12、13、15、
16、18、19、21、23和24中所列的SNP。
12.根据前述任一项权利要求所述的方法,其中所述遗传标记位于选自表11、14、17、
20、22和25中所列的基因中。
13.根据前述任一项权利要求所述的方法,其中所述性状选自CM11(第一次产犊之后的-15天至50天临床乳腺炎(1)或否(0))、CM12(第一次产犊之后的51天至305天临床乳腺炎(1)或否(0)、CM2(第二次产犊之后的-15天至305天临床乳腺炎(1)或否(0))、CM3(第三次产犊之后的-15天至305天临床乳腺炎(1)或否(0))、CM(临床乳腺炎:
0.25*CM11+0.25*CM12+0.3*CM2+0.2*CM3)、SCC1(第一哺乳期的体细胞数对数平均值)、SCC2(第二哺乳期的体细胞数对数平均值)、SCC3(第三哺乳期的体细胞数对数平均值)和SCC(体细胞数对数:0.5*SCC1+0.3*SCC2+0.2*SCC3)。
14.根据前述任一项权利要求所述的方法,其中指示乳腺炎抗性的所述至少一个遗传标记被用于估计实施牛受试者的育种值
15.根据前述任一项权利要求所述的方法,其中所述样本选自血液、精液(精子)、尿液、肌肉、皮肤、毛发、朵、尾巴、脂肪和/或唾液。
16.根据前述任一项权利要求所述的方法,其中所述样本是精液(精子)或血液。
17.根据前述任一项权利要求所述的方法,所述方法包括扩增包含所述遗传标记的基因区域,并检测所述扩增产物。
18.根据前述任一项权利要求所述的方法,其中牛受试者是Holstein牛种的成员。
19.根据前述任一项权利要求所述的方法,其中牛受试者是丹麦Holstein牛种群的成员。
20.根据前述任一项权利要求所述的方法,其中牛受试者是北欧Holstein牛种、丹麦Jersey牛种和北欧红色牛种的成员。
21.根据前述任一项权利要求所述的方法,其中所述至少一个遗传标记为至少两个遗传标记,诸如3、4、5、6、7、8、9,例如至少10个遗传标记。
22.一种为育种目的选择牛受试者的方法,所述方法包括:通过如前述任一项权利要求中所限定的方法确定所述牛受试者和/或其后代的乳腺炎抗性。
23.根据权利要求22所述的方法,包括估计所述牛受试者的育种值。
24.根据权利要求22所述的方法,其中所述育种值是基于如权利要求1至权利要求21中任一项所限定的遗传标记的存在与否来估计的。
25.一种针对牛受试者中乳腺炎的易感性而言来估计牛的育种值的方法,包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,并基于所述存在与否来分配育种值,其中所述至少一个遗传标记位于BTA6上的神经肽FF受体2(NPFFR2)基因中,和/或所述至少一个遗传标记位于选自权利要求1中所鉴定的表中的区域1-61的牛基因组的区域中,其中所述区域由列3和5中所鉴定的SNP标记划定,和/或由列4和6中所鉴定的基因组位置划定。
26.根据权利要求25所述的方法,其中所述育种值是使用标记辅助的单性状最佳线性无偏预测(MA-BLUP)来计算的。
27.根据权利要求25所述的方法,如进一步在权利要求1至权利要求21中任一项所限定。
28.一种对牛受试者进行选择性育种的方法,所述方法包括:
a.提供牛受试者,
b.从所述受试者获得生物样本,
c.确定所述样本中存在位于选自权利要求1中所鉴定的表中的区域1-61的牛基因组的区域中的至少一个遗传标记,其中所述区域由列3和5中所鉴定的SNP标记划定,和/或由列4和6中所鉴定的基因组位置划定,
d.选择在其基因组中具有所述至少一个遗传标记的牛受试者,和
e.使用所述牛受试者进行育种。
29.根据权利要求25所述的方法,所述方法包括从所述选定的牛受试者收集精液和使用所述精液对一个或更多个小母牛或母牛人工授精。

说明书全文

乳腺炎抗性的遗传标记

技术领域

[0001] 本发明涉及一种确定受试者的乳腺炎抗性的方法,包括检测与乳腺炎抗性相关联的至少一种遗传标记。此外,本发明涉及一种试剂盒,用于检测与乳腺炎抗性相关联的至少一种遗传标记的存在与否。

背景技术

[0002] 乳腺炎是由感染或创伤所导致的母牛的乳房或乳腺的炎症,且乳腺炎被认为是对于牛的经济上最重要的疾病。这种疾病可能是由多种因素引起的。乳腺炎的主要原因是生物经由乳头端部的入侵。乳腺炎可以是临床或亚临床的,所述亚临床的是具有前期临床表现的亚临床感染。临床乳腺炎(CM)可以通过观察红肿的乳腺(即红肿的乳房)和通过凝乳的产生在视觉上被检测出。一旦检测到,则将来自乳腺炎母牛的牛奶与大桶分离开来,从而使其不会影响整体的牛奶质量。亚临床乳腺炎是一种表征为高体细胞数(SCC)、正常或升高的体温,且牛奶样本应培养测试阳性的乳腺炎类型。因此,亚临床乳腺炎无法通过乳房的肿胀或通过观察腺体或产出的牛奶而在视觉上被检测出。正因为如此,农民无法选择将亚临床乳腺炎的母牛的牛奶转移。然而,与来自未感染的母牛的牛奶相比,这种牛奶的质量较差,因此会污染大桶中其余的牛奶。
[0003] 乳腺炎可以通过利用体细胞数(SCC)来检测,其中对来自母牛的牛奶样本的体细胞的存在(白细胞)进行分析。体细胞是牛的自然防御机制的一部分,且当乳房受到感染时,细胞数升高。可以通过滚球式粘度计和库尔特计数器来间接地估计牛奶样本中体细胞的数量。
[0004] 由于乳腺炎导致牛奶和牛奶制品在质量和数量上下降,因此乳腺炎对农民和乳品工业造成经济损失。因此,确定牛的乳腺炎抗性的遗传基础的能对于乳品工业无论是在日常的牛奶生产方面还是在饲养管理、选择乳腺炎抗性的牛受试者方面都具有巨大的经济意义。在遗传上选择将生产不易发生乳腺炎的母牛的具有改进抗性的牛受试者的方法是可取的。
[0005] 许多研究已试图检测影响乳腺炎的数量性状基因座(QTL)(例如Schrooten等,2000;Boichard等,2003),以使得QTL信息能够通过标记辅助选择(MAS)被利用。到目前为止,大多数研究已针对作为临床乳腺炎(CM)的指标性状的体细胞评分(SCS)确定了QTL,而不是直接针对CM。虽然这两个性状具有较高的遗传相关性(Lund等,1999),但是还不清楚是否针对SCS已确定的QTL也影响CM。已经证明,持续高的体细胞数(SCC)平主要是亚临床乳腺炎的信号,这通常是由诸如金黄色葡萄球菌(Streptococcus aureus)和无乳链球菌(Streptococcus agalactiae)这样的传染性细菌引起的(de Haas等,2002)。急性临床乳腺炎的发生经常是由诸如大肠杆菌的环境细菌引起的,在这些感染中,SCC水平迅速增加但当感染被治愈时很快下降到正常水平。因此急性感染可能不能通过高SCC水平检测到。
早期研究的另一个限制是,QTL是通过具有低精度的连分析(LA)针对QTL位置进行的,此外,标记与性状之间的LA关联只可用于家族内的选择。与此相反,连锁不平衡与连锁分析(LDLA)相结合可利用紧密连锁的标记有可能将QTL精细映射到小于1cM的染色体区域
(Meuwissen&Goddard,2000)。LDLA置信区间内的标记可被用于识别在一般人群中具有预测能力的单体型。这些单倍型比LA标记更易于在MAS中使用。
[0006] 一旦绘制图谱,遗传标记可以有效地应用在标记辅助选择中。在本发明中,在牛基因组中确定了与临床乳腺炎相关的遗传标记和/或SCS,这允许了一种确定牛受试者及其后代是否会对乳腺炎有抗性的方法。

发明内容

[0007] 在养牛业中,能够选择对乳腺炎具有增加的抗性的牛受试者具有显著的经济利益,从而避免与动物患乳腺炎有关的经济损失。可通过本发明对乳腺炎抗性的遗传倾向进行检测。本发明提供了一种基于与乳腺炎抗性相关联和/或有联系的遗传标记来确定牛受试者中的乳腺炎抗性的方法。
[0008] 本发明一方面涉及一种确定牛受试者中的乳腺炎抗性的方法,包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,其中所述至少一个遗传标记位于选自表2中所鉴定的区域1-61的牛基因组的区域中,其中所述区域由第3列和第5列中所鉴定的SNP标记划定,和/或由第4列和第6列中所鉴定的基因组位置划定。
[0009] 另一方面,本发明涉及一种为育种目的而选择牛受试者的方法,所述方法包括:通过本发明的方法确定所述牛受试者和/或其后代的乳腺炎抗性,然后基于所确定的育种值,选择或不选择所述牛受试者用于育种。
[0010] 本发明的第三方面涉及一种检测牛受试者中与乳腺炎抗性相关联的至少一个遗传标记的存在与否的试剂盒,包括至少一个检测部件,用于确定位于选自表2中所鉴定的区域1-61的牛基因组的区域中的遗传标记,其中所述区域由第3列和第5列中所鉴定的SNP标记划定,和/或由第4列和第6列中所鉴定的基因组位置划定。
[0011] 在第四方面,本发明涉及上述用于检测牛受试者中与乳腺炎抗性相关联的至少一个遗传标记的存在与否的试剂盒的用途。
[0012] 在第五方面,本发明涉及一种针对牛受试者中乳腺炎的易感性而言来估计牛的育种值的方法,包括:从牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,其中所述至少一个遗传标记位于选自表2中所鉴定的区域1-61的牛基因组的区域中,其中所述区域由第3列和第5列中所鉴定的SNP标记划定,和/或由第4列和第6列中所鉴定的基因组位置划定。
附图说明
[0013] 图1、乳腺炎性状CM(整个哺乳期临床乳腺炎)的全基因组扫描:与SNP关联性的p值的–log10分析。为了清楚起见,染色体以交替的颜色示出。虚线表示在本实例中所考虑的暗示关联[-log10(p值)=4]。
[0014] 图2、乳腺炎性状SCS(体细胞评分)的全基因组扫描:与SNP关联性的p值的–log10分析。为了清楚起见,染色体以交替的颜色示出。虚线表示在本实例中所考虑的暗示关联[-log10(p值)=4]。
[0015] 图3、乳腺炎性状CM11(第一哺乳期临床乳腺炎,-15至50天)的全基因组扫描:与SNP关联性的p值的–log10分析。为了清楚起见,染色体以交替的颜色示出。虚线表示在本实例中所考虑的暗示关联[-log10(p值)=4]。
[0016] 图4、乳腺炎性状CM12(第一哺乳期临床乳腺炎,51至305天)的全基因组扫描:与SNP关联性的p值的–log10分析。为了清楚起见,染色体以交替的颜色示出。虚线表示在本实例中所考虑的暗示关联[-log10(p值)=4]。
[0017] 图5、乳腺炎性状CM2(第二哺乳期临床乳腺炎,-15至305天)的全基因组扫描:与SNP关联性的p值的–log10分析。为了清楚起见,染色体以交替的颜色示出。虚线表示在本实例中所考虑的暗示关联[-log10(p值)=4]。
[0018] 图6、乳腺炎性状CM3(第三哺乳期临床乳腺炎,-15至305天)的全基因组扫描:与SNP关联性的p值的–log10分析。为了清楚起见,染色体以交替的颜色示出。虚线表示在本实例中所考虑的暗示关联[-log10(p值)=4]。
[0019] 图7、第一次产犊(CM11)之后的-15天至50天的临床乳腺炎的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0020] 图8、第一次产犊(CM12)之后的-51天至305天的临床乳腺炎的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0021] 图9、第二次产犊(CM2)之后的-15天至305天的临床乳腺炎的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0022] 图10、第三次产犊(CM3)之后的-15天至305天的临床乳腺炎的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0023] 图11、临床乳腺炎指数(CM5)的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0024] 图12、第一哺乳期的对数平均体细胞数(SCC1)的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0025] 图13、第二哺乳期的对数平均体细胞数(SCC2)的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0026] 图14、第三哺乳期的对数平均体细胞数(SCC3)的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0027] 图15、对数平均体细胞数指数(SCC)的曼哈顿图。X轴示出了染色体和SNP。Y轴示出了针对每个SNP的-log10(p值),反映了SNP与所分析的性状的关联强度。
[0028] 图16、在牛染色体6上的88-96Mb处,从全部基因组序列中鉴定的SNP变体与第一哺乳期临床乳腺炎(CM11)的关联。x轴是以牛基因组组装(UMD3.1)为顺序的SNP数目,y轴是–log10(p值)。
[0029] 图17、表6
[0030] 图18、BTA5的曼哈顿图,A.Chr-5.1MAS11;B.Chr-5.2MAS12;C.Chr-5.3MAS2;D.Chr-5.4MAS3;D.Chr-5.5MAS- 指 数;F.Chr-5.6SCS1;G.Chr-5.7SCS2;H.Chr-5.8SCS3;
I.Chr-5.9SCS-指数
[0031] 图19、BTA6的曼哈顿图,A.Chr-6.1MAS11;B.Chr-6.2MAS12;C.Chr-6.3MAS2;D.Chr-6.4MAS3;D.Chr-6.5MAS- 指 数;F.Chr-6.6SCS1;G.Chr-6.7SCS2;H.Chr-6.8SCS3;
I.Chr-6.9SCS-指数
[0032] 图20、BTA13的曼哈顿图,A.Chr-13.1MAS11;B.Chr-13.2MAS12;C.Chr-13.3MAS2;D.Chr-13.4MAS3;D.Chr-13.5MAS- 指 数;F.Chr-13.6SCS1;G.Chr-13.7SCS2;
H.Chr-13.8SCS3;I.Chr-13.9SCS-指数
[0033] 图21、BTA16的曼哈顿图,A.Chr-16.1MAS11;B.Chr-16.2MAS12;C.Chr-16.3MAS2;D.Chr-16.4MAS3;D.Chr-16.5MAS- 指 数;F.Chr-16.6SCS1;G.Chr-16.7SCS2;
H.Chr-16.8SCS3;I.Chr-16.9SCS-指数
[0034] 图22、BTA19的曼哈顿图,A.Chr-19.1MAS11;B.Chr-19.2MAS12;C.Chr-19.3MAS2;D.Chr-19.4MAS3;D.Chr-19.5MAS- 指 数;F.Chr-19.6SCS1;G.Chr-19.7SCS2;
H.Chr-19.8SCS3;I.Chr-19.9SCS-指数
[0035] 图23、BTA20的曼哈顿图,A.Chr-20.1MAS11;B.Chr-20.2MAS12;C.Chr-20.3MAS2;D.Chr-20.4MAS3;D.Chr-20.5MAS- 指 数;F.Chr-20.6SCS1;G.Chr-20.7SCS2;
H.Chr-20.8SCS3;I.Chr-20.9SCS-指数
[0036] 图24、BTA20上与乳腺炎有关的SNP多态性。圆圈是来自利用全序列变体的线性混合模型进行的单标记分析;黑线是利用50K基因型进行的单体型分析;绿线是利用包括在模型中作为固定效应的位于BTA20上33,642,072Bp处的SNP(rs133218364)的50K进行的单体型分析;红线是利用包括在模型中作为固定效应的位于BTA20上35,969,994Bp处的SNP(rs133596506)的50K进行的单体型分析。

具体实施方式

[0037] 本发明涉及母牛中乳腺炎抗性的遗传定子genetic determinants)。乳腺炎(临床乳腺炎和亚临床乳腺炎两者)的发生涉及对乳品工业的巨大经济损失。因此,鉴定那些具有乳腺炎抗性遗传倾向的牛受试者是具有经济利益的。具有这种遗传倾向的牛受试者是期望性状的载体,这些期望性状可以被传递给它们的后代。
[0038] 术语和定义
[0039] 术语“遗传标记”是指牛染色体上的DNA的可变核苷酸序列(多态性)并将一个等位基因与另一个区分开。可变核苷酸序列可通过本领域技术人员已知的方法来鉴定,例如在扩增方法中,例如通过使用特异性寡核苷酸来鉴定和/或观察尺寸差异来鉴定。然而,可变核苷酸序列也可以通过测序或例如限制性片段长度多态性分析,或者通过不同的杂交技术,诸如使用寡核苷酸探针的Southern印迹或阵列技术进行检测。可变核苷酸序列可通过缺失、插入、重复和/或点突变来表示。
[0040] 一种类型的遗传标记是微卫星标记,其可位于/或偶联到数量性状基因座。微卫星标记是指在彼此之后重复的短序列。在短序列中有,例如一个核苷酸,诸如两个核苷酸,例如三个核苷酸,诸如四个核苷酸,例如五个核苷酸,诸如六个核苷酸,例如七个核苷酸,诸如八个核苷酸,例如九个核苷酸,诸如十个核苷酸。然而,有时会发生变化且重复的次数可以增加或减少。多态性微卫星标记的基因座和具体定义可参见USDA遗传图谱(kappes等,1997;或通过以下网址链接到美国肉类动物研究中心http://www.marc.usda.gov/genome/cattle/cattle.html)。另一种类型的遗传标记是单核苷酸多态性(SNP)。在牛身上,可以使用市售的试剂盒同时得到大量SNP标记的基因型,例如由lllumina公司提供的牛SNP基因分型试剂盒。
[0041] 应当理解的是,本发明的遗传标记与牛受试者中乳腺炎抗性的性状在遗传上有关联。然而,还应当理解,可在相邻的DNA区域中找到一些额外遗传标记,并且当这些额外遗传标记以遗传方式偶联到本发明所提供的标记时,这些标记可用于推断本文提供的与乳腺炎相关的遗传标记的特征。这些额外遗传标记显然是本文所提供的标记物的等同物,并且这些标记也在本发明的范围内。
[0042] 术语“数量性状基因座(QTL)”是与特定性状(例如,乳腺炎抗性、体细胞数或临床乳腺炎)相关联的DNA区域。虽然不一定是基因本身,但QTL是与作为所讨论的性状的基础的基因密切相关的DNA区域。
[0043] 本文所使用的关于遗传标记等位基因和/或遗传标记等位基因的组合及表型性状的术语“相关联”是指包括直接和间接的遗传连锁。因此,根据本发明与性状相关联的遗传标记等位基因和/或遗传标记等位基因的组合可通过直接或间接的遗传连锁偶联到所述性状。此外,本文所使用的关于特定表型的术语“相关联性状”涉及任何表型性状,这在任何程度上有助于所述表型。例如,所述性状体细胞数(SCC)、体细胞评分(SCS)、乳房形态(包括几个定量测量,诸如前乳房附着、乳房深度、乳房结构等)和诊断变量(诸如在特定时间段内治疗的临床乳腺炎病例)有助于总体乳腺炎表型。因此,“与乳腺炎抗性相关联的性状”或“乳腺炎抗性表型性状”包括SCC、SCS、CM 11、CM 12、CM2、CM3、CM、SCC3、SCC2、SCC1、SCC和诊断变量,所述诊断变量包括任何所述表型性状的指数。
[0044] 本文所使用的术语“以遗传方式偶联”是关于往往一起分离的两个基因座。因此,与根据本发明的特定表型性状相关联的、以遗传方式偶联到另一遗传标记等位基因的SNP标记等位基因是所述遗传标记的标志,并且因此可在样本中作为与所述表型性状(例如,与乳腺炎抗性相关联的性状)相关联的所述遗传标记的替代被检测到。
[0045] 应进一步理解的是,在牛受试者中,本发明的遗传标记等位基因或标记等位基因的组合的核苷酸序列与本发明的表型性状在遗传上相关联。因此,还应当理解,一些遗传标记可被包括在位于根据本发明方法的遗传标记侧翼并包括根据本发明方法的遗传标记的DNA区域的核苷酸序列中。
[0046] 本文所使用的术语“基因”是指包括任何基因的编码区以及非编码区,以及开放阅读框的上游和下游区域。因此,“位于基因中”的遗传标记可位于外显子、内含子或开放阅读框的上游或下游中,例如位于所讨论的基因的开放阅读框的上游或下游的1000个核苷酸或更多个的区域中。
[0047] 具体地,基因的转录区被认为是包括在术语“基因”中,因此,位于基因中的标记包括位于该基因的转录区中的任何标记。
[0048] 连锁不平衡
[0049] 连锁不平衡(LD)反映可以追溯到历史上的重组事件,且在家族中使用LD图谱增加图谱的分辨率。当在群体中观察到的单倍型与通过将每个单倍型中的个体遗传标记的频率相乘所预测的单倍型频率不一致时存在LD。在这方面,术语单倍型是指存在于一个染色体上倾向于一起遗传的一组密切相关的遗传标记。为了使LD图谱有效,遗传标记的密度需要与LD在给定群体中延伸的整个距离相配。连锁不平衡反映了不同的遗传标记在群体中倾向于被共遗传的程度。由于特别是近亲繁殖和历史的瓶颈,牛的LD水平例如与人类相比更高。因此,一个遗传标记的特征通常可从处于LD的替代遗传标记的特征推断出。
[0050] 孙女设计
[0051] 孙女设计包括来自针对已被广泛用于养殖的祖公畜和针对祖公畜的已产生后代的雄性子代的基于DNA标记的分析数据。要与DNA标记数据一起使用的表型数据源自所述雄性子代的雌性子代。所述表型数据例如可以是牛奶生产特征,与产犊、肉质或疾病相关的特征。一组雌性子代从它们的父体继承了一个等位基因,而第二组雌性子代从它们的父体继承了另一个等位基因。通过比较这两组的数据,可以得到特定染色体的片段是否携带影响所讨论的性状的一个或多个基因的信息。可以得出QTL是否存在于该染色体的片段中。执行孙女设计的前提是详细的表型数据的可用性。在本发明中,所述数据可以得到(http://www.lr.dk/kvaeg/diverse/principles.pdf)。赋予个体数量性状的基因可通过观察染色体的片段,好像一个或多个基因位于染色体的那个片段内一样,以间接的方式来寻找。与此相反,当已经针对父母和其后代之一或两者确定了染色体上的一些DNA标记时,DNA标记可被直接用来提供从父母传递到其一个或更多个后代的性状信息。该标记可被用于计算与所述DNA标记有关的染色体的遗传史。
[0052] 牛受试者
[0053] 术语“牛受试者”是指任何品种的牛且意在包括母牛和公牛两者,无论成年或新生动物。该术语不表示动物的特定年龄。牛受试者的一个例子是Holstein牛种中的成员。在一个优选的实施方式中,牛受试者是Holstein-Friesian牛种群中的成员。在一个实施方式中,牛受试者是丹麦和/或瑞典Holstein牛种群中的成员。在另一实施方式中,牛受试者是Holstein Swartbont牛种群中的成员。在另一实施方式中,牛受试者是德国Holstein Schwarzbunt牛种群中的成员。在另一实施方式中,牛受试者是美国Holstein牛种群中的成员。在一个实施方式中,牛受试者是红色和白色Holstein牛种中的成员。在另一实施方式中,牛受试者是德国Holstein Schwarzbunt牛种群中的成员。
[0054] 在一个实施方式中,牛受试者是任何家族的成员,其中包括Holstein牛种的成员。在一个优选的实施方式中,牛受试者是丹麦红色种群的成员。在另一优选的实施方式中,牛受试者是芬兰Ayrshire种群的成员。在又一实施方式中,牛受试者是瑞典红白种群的成员。在进一步的实施方式中,牛受试者是丹麦Holstein种群的成员。在另一实施方式中,牛受试者是瑞典红白种群的成员。在又一实施方式中,牛受试者是北欧红色种群的成员。在又一实施方式中,牛受试者是北欧Holstein、丹麦Jersey和北欧红色牛种的成员。
[0055] 在本发明的一个实施方式中,牛受试者选自瑞典红白种群、丹麦红色种群、芬兰Ayrshire种群、Holstein-Friesian种群、丹麦Holstein种群和北欧红色种群。在本发明的另一实施方式中,牛受试者选自芬兰Ayrshire牛和瑞典红白牛。在本发明的另一实施方式中,牛受试者选自芬兰Ayrshire和瑞典红白牛。
[0056] 乳腺炎抗性
[0057] 术语“乳腺炎”涉及母牛的乳房的乳腺的炎症。在本申请中,术语“乳腺炎”用于描述临床乳腺炎和亚临床乳腺炎两者,其特征在于例如高体细胞评分(SCS)。
[0058] 术语“乳腺炎抗性”和“抗乳腺炎”可互换使用并且涉及以下事实,即某些牛受试者相比于其他牛受试者不易发生乳腺炎,换句话说,某些牛受试者比其他牛受试者不易受到乳腺炎的影响。因此,在此使用的“抗性”,是指任何水平的乳腺炎降低,从0.5%或更小的微小降低到完全没有乳腺炎(即,完全抗性)。在本发明中,在为了确定与抗乳腺炎相关的遗传标记而进行了一些牛受试者的分析的情况下,可通过所分析的牛受试者中与临床乳腺炎和/或亚临床乳腺炎的发生有关的遗传标记的存在与否来观察表示乳腺炎抗性的性状。应理解的是,乳腺炎抗性包括抗性性状,从而影响牛受试者或其后代的乳房健康。因此,公牛的乳腺炎抗性由其雌性后代在身体上表现出。
[0059] 乳腺炎抗性与乳腺炎易感性呈负相关,即具有高乳腺炎抗性的牛受试者具有低乳腺炎易感性。因此,在此使用的术语“乳腺炎易感性”意在表明牛受试者具有患乳腺炎或具有指示乳腺炎的性状的相对较高的可能性。
[0060] 指示乳腺炎抗性的性状
[0061] 可在若干不同的定量和定性参数的基础上,对公牛的雌性后代关于乳腺炎抗性进行评分。具体地说,根据本发明可基于指示乳腺炎抗性的具体性状观察到乳腺炎抗性。一个这种指示牛种群中乳腺炎抗性的性状被记录为临床乳腺炎病例。性状的其它例子为体细胞数(SCC)或体细胞评分(SCS),所述体细胞评分(SCS)被定义为从牛奶记录方案获得的体10
细胞计数值(10,000/mL)的log 转化的平均值。所述平均值例如是产犊之后10天至180
天的时间段内取得的。针对雄性子代性状的估计育种值(EBV)可利用忽略家族结构的单一性状最佳线性无偏预测(BLUP)动物模型进行计算。下表中提供指示乳腺炎抗性的具体定量性状的例子:
[0062] 表1.根据本发明的与乳腺炎相关的示例性性状的定义。
[0063]性状编号 性状缩写 性状定义
1 CM11 第一次产犊之后的-15天至50天临床乳腺炎(1)或否(0)
2 CM12 第一次产犊之后的51天至305天临床乳腺炎(1)或否(0)
3 CM2 第二次产犊之后的-15天至305天临床乳腺炎(1)或否(0)
4 CM3 第三次产犊之后的-15天至305天临床乳腺炎(1)或否(0)
5 CM 临床乳腺炎:0.25*CM11+0.25*CM12+0.3*CM2+0.2*CM3
6 SCC1 第一哺乳期的体细胞数对数平均值
7 SCC2 第二哺乳期的体细胞数对数平均值
8 SCC3 第三哺乳期的体细胞数对数平均值
9 SCC 体细胞数对数:0.5*SCC1+0.3*SCC2+0.2*SCC3
[0064] 在本发明的一个实施方式中,在此描述的方法和试剂盒涉及乳腺炎抗性,诸如通过体细胞数或SCS所检测到的如临床乳腺炎抗性和/或亚临床乳腺炎抗性。更具体地说,在一个实施方式中,本发明的方法和试剂盒涉及与指示乳腺炎的至少一个性状相关联的遗传标记,在优选的实施方式中,所述性状选自CM11(第一次产犊之后的-15天至50天临床乳腺炎(1)或否(0))、CM12(第一次产犊之后的51天至305天临床乳腺炎(1)或否
(0))、CM2(第二次产犊之后的-15天至305天临床乳腺炎(1)或否(0))、CM3(第三次产
犊之后的-15天至305天临床乳腺炎(1)或否(0))、CM(临床乳腺炎:0.25*CM11+0.25*C
M12+0.3*CM2+0.2*CM3)、SCC1(第一哺乳期的体细胞数对数平均值)、SCC2(第二哺乳期的体细胞数对数平均值)、SCC3(第三哺乳期的体细胞数对数平均值)和SCC(体细胞数对
数:0.5*SCC1+0.3*SCC2+0.2*SCC3)。在优选的实施方式中,所述性状为临床乳腺炎,例如选自CM11、CM12、CM2、CM3或CM的任何性状。如表1中所指定的,CM是基于CM1、CM1、CM2和CM3的关于临床乳腺炎的指数。
[0065] 在又一实施方式中,本发明的方法和试剂盒主要涉及诸如通过体细胞数或SCS(例如SCC、SCC2、SCC3或SCC)检测到的临床乳腺炎抗性结合亚临床乳腺炎抗性。本发明的方法和试剂盒包括检测与指示牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联的至少一个遗传标记的存在与否,其中所述至少一个性状选自体细胞数(SCC)、体细胞评分(SCS)和/或临床乳腺炎。
[0066] 一般来说,SCS水平增加指示得了乳腺炎,例如亚临床乳腺炎。SCC水平可相较于同一牛受试者的先前测量或相较于给定种群、牛种或家族的平均SCC增加。可在任何时间测量SCS水平,且SCS水平可单独测量或者是在一个哺乳期内的平均值。例如100.000细胞/ml牛奶以上的SCC水平,诸如200.000以上,例如300.000细胞/ml牛奶以上的SCC水平,诸如400.000以上,例如500.000细胞/ml牛奶以上的SCC水平,诸如600.000以上,细胞/ml牛奶指示乳腺炎,诸如临床乳腺炎或亚临床乳腺炎。因此,这一量级的SCC水平被视为根据本发明的指示乳腺炎易感性降低的性状。然而,指示乳腺炎抗性或乳腺炎易感性的SCC水平对于不同的牛受试者、牛种和家族可以变化。
[0067] 本发明可用于从乳腺炎抗性或乳腺炎易感性度估计育种值。真育种值是个体的遗传价值,其可被概念性地定义为当无限种群随机交配时,为其后代总平均值的平均偏差的两倍。真育种值是个体产生优良后代的能力的估计。真育种值是未知的,但可以从动物自身的性能和/或其后代的的性能和/或其它亲属的性能进行估计。除了表型性能之外或代替表型性能,在与目的性状相关的某些基因或标记处的关于动物基因型的信息可用在育种值估计过程中。使用这些信息可提高育种值的可靠性并且例如可以在较低年龄时做出选择。在一个实施方式中,所述指示乳腺炎抗性的至少一个遗传标记用于估计牛受试者的育种值。
[0068] 指示乳腺炎抗性的性状可换算成针对每个牛受试者(例如每个公畜)的育种值。因此,本发明的方法和试剂盒的遗传标记可用于选择具有增加的育种值的牛受试者,并用于检测指示乳腺炎抗性的至少一个遗传标记,根据本发明的指示乳腺炎抗性的至少一个遗传标记指示牛受试者增加的育种值。例如育种值增加至少0.5%,诸如至少1%,诸如至少
2%、3%、4%、5%、6%、7%、8%、9%,例如至少10%。
[0069] 样本
[0070] 根据本发明的方法包括:分析牛受试者的样本,其中所述样本可为能够提供该方法中使用的牛遗传物质的任何合适的样本。样本的类型并不重要,只要该样本包括对被分析的牛受试者来说特定的遗传物质。因此,可以使用包括来自所述牛受试者的遗传物质的任何样本。优选地,所述样本是很容易从牛受试者获得的样本,优选为无需任何侵入性操作即可获得的样本。
[0071] 因此,乳腺炎抗性是通过检测包括遗传物质的任何来源的样本中遗传标记等位基因的存在与否来确定的。如果需要,牛遗传物质例如可以被提取、分离和/或纯化。所述样本可以是新鲜的或冷冻的。遗传标记的检测可在选自以下组织的样本上进行:血液、精液(精子)、尿液、肝组织、肌肉、皮肤、毛发、毛囊、朵、尾巴、脂肪、睾丸组织、组织、唾液、脊髓活组织和/或任何其它组织。
[0072] 在优选的实施方式中,样本选自精液(精子)、血液、尿液、皮肤、毛发、耳朵、尾巴和肌肉。在另一优选的实施方式中,样本选自血液。在特别优选的实施方式中,样本是牛奶。在另一特别优选的实施方式中,样本是皮肤组织。在又一特别优选的实施方式中,样本是肌肉。在一最优选的实施方式中,样本是精液(精子)。
[0073] 对于微卫星或SNP基因分型,可通过多种技术从样本中提取核酸。例如可通过用蛋白酶K处理接着用酚提取从样本中分离基因组DNA(例如参见Sambrook等,1989)。然而,也可直接使用样本。
[0074] 用于根据本发明的方法检测遗传标记的微卫星或SNP基因分型所使用的核酸的量在纳克到微克的范围内。本领域技术人员应当理解的是,在实践中,待分析的核酸的量不存在上限。本领域技术人员遇到的问题是,待分析的样本的量是有限的。因此,有利的是,本发明的方法可在少量的样本上进行,从而需要样本中有限量的核酸。这样,待分析的核酸的量至少为1ng,诸如至少为10ng,例如至少为25ng,诸如至少为50ng,例如至少为75ng,诸如至少为100ng,例如至少为125ng,诸如至少为150ng,例如至少为200ng,诸如至少为225ng,例如至少为250ng,诸如至少为275ng,例如至少为300ng、400ng,例如至少为500ng,诸如至少为600ng,例如至少为700ng,诸如至少为800ng,例如至少为900ng或至少为1000ng。
[0075] 在一个优选的实施方式中,作为本发明的方法的起始材料的核酸的量为20-50ng。在特别优选的实施方式中,用于本发明的方法的起始材料为30-40ng。
[0076] 染色体区域和标记
[0077] BTA是牛常染色体的简称。
[0078] 本发明的一个方面涉及一种确定牛受试者中的乳腺炎抗性的方法,包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述至少一个遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,其中所述至少一个遗传标记位于从表2中所指定的区域1-61中选择的牛基因组的基因区域中。
[0079] 表2
[0080]
[0081]
[0082]
[0083]
[0084]
[0085] 在一个实施方式中,本发明的遗传标记选自表2中第9列和第10列中所列的标记。
[0086] 在另一实施方式中,所述遗传标记选自表10、12、13、15、16、18、19、21、23和24中所列的SNP,参见下文的实施例
[0087] 在另一实施方式中,所述遗传标记位于从表11、14、17、20、22和25中所列的基因选择的基因中,参见下文的实施例。
[0088] 在另一实施方式中,所述遗传标记选自ss86284888、rs41649041、ss61565956、ss86341106、ss86317725、ss86328358、rs41812941、ss86327354和rs41940571(参见表3)。
[0089] 在另一实施方式中,所述遗传标记选自ss86328743、rs41618669、ss86284888、rs41580905、rs41649041、rs43706944、rs42189699、rs42553026、rs41664497、rs41664497、ss86290235、ss86340493、ss86305923、ss86330005、ss86340725、rs29015635、rs42895750、ss117968104、rs29017739、rs29001782、rs41588957、ss86307579、
ss86317213、rs41610991、ss117968170、ss117968764、ss117968030、ss117968525、rs29019575、ss117968738、ss86326721、ss86341106、ss86341106、rs29010419、
rs29022799、ss86278591、ss86337596、rs43338539、ss86296213、rs42766480、rs41617692、ss117963883、rs43475842、rs29019286、ss86292503、ss86317725、ss86290731、
ss86332750、ss86335834、ss86340346、ss105239139、ss117971362、ss86287919、
ss86329615、ss86301882、ss86328358、ss117971370、ss117971325、ss86339873、
ss117971671、ss117971176、rs41807595、rs41807595、rs29023167、ss86303613、
ss86283374、ss86328473、ss86307986、rs41603818、rs41812941、ss105262977、
ss105262977、rs42465037、ss86327354、ss86327432、ss61484557、rs42329877、
ss86333005、ss86306906、ss117972835、rs41938511、rs42542144、rs41940571、
rs41947330、rs29018751、rs41581087、ss105263178、rs41641052、rs41641055、
ss86292111、rs41600165和ss86306865(参见表4)。
[0090] 由于如本文所述的连锁不平衡,本发明还涉及一种确定牛受试者中的乳腺炎抗性的方法,其中至少一个遗传标记被连接到或以遗传方式偶联到针对抗乳腺炎的牛性状的遗传定子。应理解的是,为了确定牛受试者中的乳腺炎抗性,本发明中可使用一个以上遗传标记。例如,至少一个遗传标记可以是至少两个或更多个遗传标记的组合,使得精确度可以提高,诸如至少三个遗传标记,例如四个遗传标记,诸如至少五个遗传标记,例如六个遗传标记,诸如至少七个遗传标记,例如八个遗传标记,诸如至少九个遗传标记,例如十个遗传标记。
[0091] 所述至少一个遗传标记可位于至少一个牛染色体上,诸如两个染色体,例如三个染色体,诸如四个染色体,例如五个染色体,和/或诸如六个染色体。因此,所述至少一个遗传标记可以是位于不同染色体上的标记的组合。所述至少一个遗传标记选自下文所示的表中的任何个体标记。
[0092] 在本发明的一个实施方式中,所述至少一个遗传标记位于牛染色体BTA1上由BovineHD基因分型芯片SNP#19479和SNP#19481所划定的区域中和/或在
no.76096755与碱基no.76099500之间的区域中,例如所述标记是BovineHD0100021877或BovineHD基因分型芯片SNP#76096755,或与任何所述标记有关。
[0093] 在本发明的另一个实施方式中,所述至少一个遗传标记位于牛染色体BTA3上由BovineHD基因分型芯片SNP#23488和SNP#25665所划定的区域中和/或在碱基
no.92199528与碱基no.101364920之间的区域中,例如所述标记是BovineHD0300028997或BovineHD基因分型芯片SNP#101323866,或与任何所述标记有关。
[0094] BTA5
[0095] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA5上由BovineHD基因分型芯片SNP#20435和SNP#27159所划定的区域中和/或在碱基
no.84539347与碱基no.109948232之间的区域中,例如所述标记是BovineHD0500024659或BovineHD基因分型芯片SNP#86998734,或与任何所述标记有关。
[0096] 在一个实施方式中,所述遗传标记位于牛染色体BTA5上的84-95Mb之间的区域中,例如所述标记是Chr5_92753829和/或所述性状是乳腺炎抗性,诸如CM11。在一个实施方式中,所述遗传标记选自Chr5_92753829、BovineHD0500024659、Chr5_87360522、BovineHD0500026657、Chr5_92753829、Chr5_87360522、Chr5_94040670、Chr5_89528205和Chr5_87360522(参见表10),和/或具有增加的乳腺炎抗性相关联的遗传标记等位基因,和/或所述特定性状如表10所示。
[0097] 在一个实施方式中,所述遗传标记位于从以下基因构成的组中选择的基因中:ENSBTAG00000022360、ENSBTAG00000005833、ENSBTAG00000001673、ENSBTAG00000013202、ENSBTAG00000047048、ENSBTAG00000046178、ENSBTAG00000020715、ENSBTAG00000030493、ENSBTAG00000013541、ENSBTAG00000008541和ENSBTAG00000009444,参见表11。
[0098] BTA6
[0099] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA6上由BovineHD基因分型芯片SNP#18708和SNP#26792所划定的区域中和/或在碱基
no.71082832与碱基no.102757841之间的区域中,例如所述标记是BovineHD0600024355或BovineHD基因分型芯片SNP#88919352,或与任何所述标记有关。
[0100] 然而,在一特别优选的实施方式中,所述至少一个遗传标记位于牛染色体BTA6上碱基no.88000560与碱基no.95999980之间的区域中。在一特定优选的实施方式中,所述至少一个遗传标记是位于BTA6上的88,919,352Bp处的BovineHD0600024355。在一个实施方式中,BovineHD0600024355是与临床乳腺炎(诸如CM11)相关联的遗传标记。
[0101] 例如,所述至少一个遗传标记位于BTA6上的碱基no.89,052,210与碱基no.89,059,348之间的区域中。因此,在一个优选的实施方式中,与指示乳腺炎(诸如临床乳腺炎,例如CM11)的至少一个性状相关联的遗传标记位于神经肽FF受体2(NPFFR2)
基因中,尤其是在NPFFR2的编码区中。在一个实施方式中,与乳腺炎相关联的遗传标记是chr6_89059253SNP,其位于BTA6上的89,059,253Bp处。该SNP是G-A置换。然而,由于位于NPFFR2基因内的可替代SNP强偶联到chr6_89059253SNP,因此位于NPFFR2基因中的任何遗传标记多态性与指示乳腺炎的性状相关联。因此,本发明涉及确定乳腺炎和/或育种值的方法以及对选定的牛进行育种的方法和试剂盒,其中所述至少一个遗传标记位于NPFFR2基因中或以遗传方式偶联到NPFFR2基因,并且在一个优选的实施方式中,所述至少一个遗传标记是chr6_89059253SNP和/或以遗传方式与其偶联的任何遗传标记多态性。因此,在一个实施方式中,所述遗传标记是位于89,059,253Bp处的G/A SNP(UMD3.1),其中A等位基因与乳腺炎相关联,而G等位基因与乳腺炎抗性相关联。
[0102] 在一个实施方式中,所述遗传标记位于牛染色体BTA6上的88-96Mb之间的区域中,例如所述标记为Chr6_88977023和/或所述性状是乳腺炎抗性,诸如CM11。在
一个实施方式中,所述遗传标记选自Chr6_88977023、Chr6_88612186、Chr6_88610743、Chr6_88977023、Chr6_88977023、Chr6_88326504、Chr6_88326504、Chr6_88326504 和Chr6_88326504(参见表12),和/或与增加乳腺炎抗性相关联的遗传标记等位基因,和/或特定性状,如表12中所示。在一个实施方式中,所述标记是Chr6_89059253,与乳腺炎抗性相关联的等位基因是G等位基因。
[0103] 在一个实施方式中,所述遗传标记位于从以下基因构成的组中选择的基因中:ENSBTAG00000018531、ENSBTAG00000009310、ENSBTAG00000016795、ENSBTAG00000008577、ENSBTAG00000016290、ENSBTAG00000012397、ENSBTAG00000002348、ENSBTAG00000013718、ENSBTAG00000009070和ENSBTAG00000006507,参见表14。
[0104] BTA7
[0105] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA7上由BovineHD基因分型芯片SNP#2907和SNP#4789所划定的区域中和/或在碱基no.14485587
与碱基no.22681472之间的区域中,例如所述标记是BovineHD0700005054或BovineHD基因分型芯片SNP#18032163,或与任何所述标记有关。
[0106] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA7上由BovineHD基因分型芯片SNP#7174和SNP#10157所划定的区域中和/或在碱基no.31432538与碱基no.41607314之间的区域中,例如所述标记是BovineHD4100005904或BovineHD基因分型芯片SNP#33485418,或与任何所述标记有关。
[0107] BTA12
[0108] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA12上由BovineHD基因分型芯片SNP#787和SNP#933所划定的区域中和/或在碱基no.2569573与碱基no.2991581之间的区域中,例如所述标记是BovineHD1200000926或BovineHD基因分型芯片SNP#2917822,或与任何所述标记有关。
[0109] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA12上由BovineHD基因分型芯片SNP#3217和SNP#7626所划定的区域中和/或在碱基no.11578657与碱基no.27097379之间的区域中,例如所述标记是BovineHD1200006858或BovineHD基因分型芯片SNP#22865273,或与任何所述标记有关。
[0110] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA12上由BovineHD基因分型芯片SNP#15918和SNP#17398所划定的区域中和/或在碱基
no.62561736与碱基no.68494212之间的区域中,例如所述标记是BovineHD1200017277或BovineHD基因分型芯片SNP#63068164,或与任何所述标记有关。
[0111] BTA13
[0112] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA13上由BovineHD基因分型芯片SNP#11798和SNP#15089所划定的区域中和/或在碱基
no.53471793与碱基no.70173150之间的区域中,例如所述标记是BovineHD1300017074或BovineHD基因分型芯片SNP#59588546,或与任何所述标记有关。
[0113] 在一个实施方式中,所述遗传标记位于牛染色体BTA13上的57-63Mb之间的区域中,例如所述标记为Chr13_57608628和/或所述性状是乳腺炎抗性,诸如CM。在一
个实施方式中,所述遗传标记选自Chr13_57608336、Chr13_57608354、Chr13_59584651、Chr13_59584651、Chr13_57608628、Chr13_57608354、Chr13_60621602、Chr13_60621602和Chr13_60621602(参见表15),和/或与增加乳腺炎抗性相关联的遗传标记等位基因,和/或特定性状,如表15中所示。在一个实施方式中,所述标记是Chr13_57579568,与乳腺炎抗性相关联的等位基因是T等位基因,和/或所述标记是Chr13_57579569,与乳腺炎抗性相关联的等位基因是G等位基因。
[0114] 在一个实施方式中,所述遗传标记位于从以下基因构成的组中选择的基因中:ENSBTAG00000020261、ENSBTAG00000012109、ENSBTAG00000018053、ENSBTAG00000018418、ENSBTAG00000013330、ENSBTAG00000048288、ENSBTAG00000003364、ENSBTAG00000048009、ENSBTAG00000027384、ENSBTAG00000027383、ENSBTAG00000020555、ENSBTAG00000031254、ENSBTAG00000016169、ENSBTAG00000016348、ENSBTAG00000019200、ENSBTAG00000010112、ENSBTAG00000038687和ENSBTAG00000038412,参见表17。
[0115] BTA16
[0116] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA16上由BovineHD基因分型芯片SNP#5299和SNP#16175所划定的区域中和/或在碱基no.21799660与碱基no.64955150之间的区域中,例如所述标记是BovineHD1600014622或BovineHD基因分型芯片SNP#52924145,或与任何所述标记有关。
[0117] 在一个实施方式中,所述遗传标记位于牛染色体BTA16上的48-55Mb之间的区域中,例如所述标记为Chr16_50529178和/或所述性状是乳腺炎抗性,诸如CM11。在一个实施方式中,所述遗传标记选自Chr16_50529178、Chr16_49054912、Chr16_49054912、Chr16_54246279、Chr16_50532600、Chr16_52097973、Chr16_53806663、Chr16_53806663和Chr16_53998150(参见表18),和/或与增加乳腺炎抗性相关联的遗传标记等位基因,和/或特定性状,如表18中所示。在一个实施方式中,所述标记是Chr16_50529178,与乳腺炎抗性相关联的等位基因是A等位基因,和/或所述标记是Chr16_50564280,与乳腺炎抗性相关联的等位基因是T等位基因。
[0118] 在一个实施方式中,所述遗传标记位于从以下基因构成的组中选择的基因中:ENSBTAG00000024663、ENSBTAG00000016057、ENSBTAG00000010732、ENSBTAG00000015635、ENSBTAG00000015632、ENSBTAG00000014707、ENSBTAG00000014537和ENSBTAG00000037523,参见表20。
[0119] BTA18
[0120] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA18上由BovineHD基因分型芯片SNP#11892和SNP#13902所划定的区域中和/或在碱基
no.41653211与碱基no.48570545之间的区域中,例如所述标记是BovineHD1800013234或BovineHD基因分型芯片SNP#44778431,或与任何所述标记有关。
[0121] BTA19
[0122] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA19上由BovineHD基因分型芯片SNP#12750和SNP#16762所划定的区域中和/或在碱基
no.49013784与碱基no.62339802之间的区域中,例如所述标记是BovineHD1900015719或BovineHD基因分型芯片SNP#55615219,或与任何所述标记有关。
[0123] 在一个实施方式中,所述遗传标记位于牛染色体BTA19上的55-58Mb之间的区域中,例如所述标记为Chr19_55296191和/或所述性状是乳腺炎抗性,诸如SCS3。在一个实施方式中,所述遗传标记选自Chr19_57164311、Chr19_55461224、BovineHD1900015719、Chr19_57418222、BovineHD1900015719、Chr19_55296191、Chr19_55296191、Chr19_55296191和Chr19_55296191(参见表21),和/或与增加乳腺炎抗性相关联的遗传标记等位基因,和/或特定性状,如表21中所示。
[0124] 在一个实施方式中,所述遗传标记位于从以下基因构成的组中选择的基因中:ENSBTAG00000013677、ENSBTAG00000005104和ENSBTAG00000044443;参见表22。
[0125] BTA20
[0126] 在本发明的另一实施方式中,所述至少一个遗传标记位于牛染色体BTA20上由BovineHD基因分型芯片SNP#7852和SNP#14407所划定的区域中和/或在碱基no.28291423与碱基no.55744850之间的区域中,例如所述标记是BovineHD2000010279或BovineHD基因分型芯片SNP#35981673,或与任何所述标记有关。
[0127] 在一个实施方式中,所述遗传标记位于牛染色体BTA20上的32-40Mb之间的区域中,例如所述标记为Chr20_35965955和/或所述性状是乳腺炎抗性,诸如CM2。在一
个实施方式中,所述遗传标记选自Chr20_34269660、Chr20_35965955、Chr20_35965955、Chr20_35914181、Chr20_35965955、Chr20_35969130、Chr20_35865606、Chr20_35914086和Chr20_35543794(参见表23),和/或与增加乳腺炎抗性相关联的遗传标记等位基因,和/或特定性状,如表23中所示。在一个实施方式中,所述标记是Chr20_35965955,且与乳腺炎抗性相关联的等位基因是A等位基因。
[0128] 在一个实施方式中,所述遗传标记位于从以下基因构成的组中选择的基因中:ENSBTAG00000010423、ENSBTAG00000014972、ENSBTAG00000016149、ENSBTAG00000006697、ENSBTAG00000033107、ENSBTAG00000011766and ENSBTAG00000014177,参见表25。
[0129] 在一个具体的实施方式中,所述至少一个遗传标记位于BTA20上的含有半胱天冬酶募集结构域的蛋白6(CARD6)基因中。因此,在一个优选的实施方式中,与指示乳腺炎(诸如临床乳腺炎)的至少一个性状(例如CM11)相关联的遗传标记位于CARD6基因中,特别是在NPFFR2的编码区中。在一个实施方式中,与一个或多个乳腺炎性状相关联的遗传标记是rs133218364SNP,其位于BTA20上的CARD6基因中;参见SEQ ID NO:2。该SNP是T-C置换。然而,由于位于CARD6基因内的可替代SNP强偶联到rs133218364SNP,因此位于CARD6基因中的任何遗传标记多态性与指示乳腺炎的性状相关联。因此,本发明涉及确定乳腺炎和/或育种值的方法以及对选定的牛进行育种的方法和试剂盒,其中所述至少一个遗传标记位于CARD6基因中或以遗传方式偶联到CARD6基因,并且在一个优选的实施方式中,所述至少一个遗传标记是rs133218364SNP和/或以遗传方式与其偶联的任何遗传标记多态性。
因此,在一个实施方式中,所述遗传标记是位于CARD6基因中的T/C SNP,其中T等位基因与乳腺炎相关联,而C等位基因与乳腺炎抗性相关联。
[0130] 在另一具体的实施方式中,所述至少一个遗传标记位于BTA20上的白血病抑制因子受体基因(LIFR)中,或其侧翼序列中,诸如LIFR基因上游或下游的5000bp中。在一个优选的实施方式中,与指示乳腺炎(诸如临床乳腺炎)的至少一个性状(例如CM11)相关联的遗传标记位于LIFR基因中或所述侧翼序列中,特别是在LIFR基因下游的5000bp内的编码区中。在一个实施方式中,与一个或多个乳腺炎性状相关联的遗传标记是rs133596506SNP,其位于BTA20上的LIFR基因下游的3323bp处;参见SEQ ID NO:3。该SNP是T-C置换。然而,由于位于LIFR基因及其侧翼区域内的可置换SNP强偶联到rs133596506SNP,因此位于LIFR基因中的任何遗传标记多态性与指示乳腺炎的性状相关联。因此,本发明涉及确定乳腺炎和/或育种值的方法以及对选定的牛进行育种的方法和试剂盒,其中所述至少一个遗传标记位于LIFR基因中或其侧翼区域以遗传方式偶联到LIFR基因,并且在一个优选的实施方式中,所述至少一个遗传标记是rs133596506SNP和/或以遗传方式与其偶联的任何遗传标记多态性。因此,在一个实施方式中,所述遗传标记是位于LIFR基因或其侧翼区域中的T/C SNP,其中C等位基因与乳腺炎相关联,而T等位基因与乳腺炎抗性相关联。
[0131] 检测
[0132] 根据本发明的用于确定牛受试者的乳腺炎抗性的方法包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联。与乳腺炎抗性相关联的具体遗传标记在本文其它部分提供。包括微卫星标记和/或SNP或互补序列的遗传标记以及由此得到的转录(mRNA)和翻译产物(多肽、蛋白质)可通过本领域技术人员已知的任何方法来鉴定。
[0133] 对于本领域技术人员将显而易见的是,存在多种可用来检测在特定区域中本文提到的一个或更多个位置处的变体核苷酸的存在与否的分析方法。可通过使用多种技术来检测特定区域内或其侧翼的突变或多态性。来自任何有核细胞的核酸可被用作这种分析技术的起始点,并且可按照本领域技术人员所熟知的核酸制备过程来分离所述核酸。一般来说,等位变异的检测需要突变鉴别技术,可选地为扩增反应和信号产生系统。
[0134] 下面列出多种突变检测技术。一些列出的方法是基于聚合酶链反应(PCR),其中根据本发明的方法包括:基于可变核苷酸序列的核苷酸序列在引物存在的情况下对目的核苷酸序列进行扩增的步骤。所述方法可结合多个信号产生系统使用,下面进一步列出所述方法中的选择。
[0135]
[0136]
[0137] 进一步的扩增技术参见本文其它部分。用于检测等位基因变异的许多现行方法综述于Nollau等,Clin.Chem.,43,1114-1120,1997;以及见标准教科书例如“突变检测实验指南”,由U.Landegren编辑,牛津大学出版社,1996和“PCR”第二版,由Newton&Graham编辑,BIOS Scientific Publishers Limited,1997。
[0138] 遗传标记的检测可根据本发明一个实施方式通过本领域技术人员已知的多种技术来实现,包括微卫星分类或短串联重复(STR)、限制性片段长度多态性(RFLP)、缺失或插入检测、随机扩增多态性DNA(RAPID)或采用诸如以下方法的单核苷酸多态性分类:限制性片段长度聚合酶链反应、等位基因特异性寡聚体杂交、寡聚体特异性连接分析、利用PNA或锁核酸(LNA)探针的杂交。
[0139] 在一个实施方式中,本发明的方法包括扩增包含在由牛受试者提供的样本中的遗传区域。因此,具体方法可包括扩增包含本发明的遗传标记的遗传区域并检测扩增产物。
[0140] 在另一优选的实施方式中,遗传标记是通过DNA阵列方法进行检测的。例如,可以使用市售的SNP基因分型试剂盒同时得到大量SNP标记的基因型。这样的试剂盒例如由lllumina公司提供的BovineSNP50BeadChip SNP试剂盒和来自lllumina公司的BovineHD BeadChip。这两种试剂盒优选用于根据本发明的SNP基因分型。
[0141] 本发明的引物是核酸分子,所述核酸分子与其所基于的序列充分互补并具有足够的长度以与预期扩增的核酸分子的相应区域选择性杂交。所述引物能够在上述方法中引发预期核酸分子的相应区域的合成。类似地,本发明的探针是一种分子,例如具有足够的长度并与目的核酸序列充分互补的核酸分子,其在高或低严谨条件下选择性地结合到目的核酸序列。根据本发明的与乳腺炎抗性相关联的遗传标记可通过本领域技术人员已知的多种方法来检测。例如,所述遗传标记可通过使用选自以下方法的基因分型来鉴定,所述方法包括单核苷酸多态性(SNP)、微卫星标记、限制性片段长度多态性(RFLP)、DNA芯片、扩增片段长度多态性(AFLP)、随机扩增多态性序列(RAPD)、序列特征性扩增区域(SCAR)、酶切扩增多态性序列(CAPS)、核酸测序和微卫星基因分型。
[0142] 在一优选的实施方式中,如本发明所公开的与乳腺炎抗性性状相关联的遗传标记是通过SNP或微卫星基因分型进行检测的。SNP或微卫星基因分型可通过SNP或微卫星标记的扩增,随后例如在扩增产物的长度、数量和/或序列方面对扩增产物的分析来执行。
[0143] 具体地说,根据本发明的至少一个遗传标记可通过使用包含NPFFR2基因的5个至100个连续核苷酸的至少一种寡核苷酸来检测,诸如10个至30个连续核苷酸,或至少5个,诸如6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24个或至少25个连续核苷酸,诸如SEQ ID NO:1,或与其具有至少70%同一性的核酸序列,诸如与其具有至少75%、
76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%同一性,诸如与其具有至少99%同一性。
[0144] 在本发明的方法和试剂盒的一个实施方式中,所述遗传标记是通过使用能够识别选自表2的第10列所列的SNP中的至少一个SNP的寡核苷酸引物或探针来检测。所述寡核苷酸可被用作核酸扩增反应中的引物和/或所述寡核苷酸可被用作杂交检测技术中的探针。
[0145] 本发明的引物可单独使用或与一个或更多个引物或引物对(诸如本发明的任何引物)组合使用。
[0146] 这种引物或探针的设计对于本领域的普通分子生物学家而言将是显而易见的。这样的引物具有任何适当的长度,诸如多达50个碱基,多达40个碱基,更适当地为多达30个碱基,例如长度为诸如8-25个或8-15个碱基。一般来说,这类引物将包含与该区域中的相应的野生型或变体基因座完全互补的碱基序列。然而,如果需要的话,可引入一个或更多个错配,前提条件是所述寡核苷酸探针的区分能力不会过度地受影响。本发明的引物/探针可以携带一个或多个标记物,以便于检测。
[0147] 在一个实施方式中,所述引物和/或探针能够与一个子序列杂交和/或扩增所述子序列,所述子序列与含有由如本文所示的标记划定的序列的单核苷酸多态性杂交。
[0148] 本发明的引物核苷酸序列进一步包括:(a)在严谨条件下与核酸分子杂交的任何核苷酸序列,其包含遗传标记序列或其互补序列或RNA产物,例如,在约45℃、在6x氯化钠/柠檬酸钠(SSC)中与滤膜结合的DNA杂交,随后在约50-65℃、在0.2x SSC/0.1%十二烷基硫酸钠(SDS)中洗涤一次或更多次,或者(b)在高度严谨条件下,例如,在约45℃、在6x SSC中与滤膜结合的核酸杂交,随后在约68℃、在0.1x SSC/0.2%SDS中洗涤一次或更多次,或在其它对本领域技术人员来说显而易见的杂交条件下(例如,参见Ausubel F.M.等编辑,1989,Current Protocols in Molecular Biology,Vol.I,Green Publishing Associates,Inc.和John Wiley&sons,Inc.,New York,在pp.6.3.1-6.3.6和2.10.3)。
优选地,与上面的(a)和(b)的核苷酸序列杂交的核酸分子包括含有遗传标记序列或互补序列或其RNA产物的基因组DNA的核酸分子的互补物。
[0149] 在本发明的核酸分子中,脱寡核苷酸(“寡核苷酸”)在高度严谨或严谨条件下与上述核酸分子杂交。一般来说,对于长度为14和70个核苷酸之间的探针,使用下式计算解链温度(TM):
[0150] Tm(℃)=81.5+16.6(log[一价阳离子(摩尔)])+0.41(%G+C)-(500/N)
[0151] 其中N是探针的长度。如果杂交是在含有甲酰胺的溶液中进行的,则使用下式计算解链温度:Tm(℃)=81.5+16.6(log[一价阳离子(摩尔)])+0.41(%G+C)-(0.61%甲酰胺)-(500/N),其中N是探针的长度。一般来说,杂交是在比Tm(针对DNA-DNA杂交体)低大约20-25度或比Tm(针对RNA-DNA杂交体)低大约10-15度进行的。
[0152] 示例性高度严谨条件可参考,例如,在37℃(对于约14个碱基的寡核苷酸)、48℃(对于约17个碱基的寡核苷酸)、55℃(对于约20个碱基的寡核苷酸)和60℃(对
于约23个碱基的寡核苷酸),在6×SSC/0.05%焦磷酸钠中洗涤。
[0153] 因此,本发明还提供了检测本发明的多态性的核苷酸引物或探针。可通过至少一种核酸引物或探针进行估计,诸如DNA、RNA或核酸类似物(诸如肽核酸(PNA)或锁核酸(LNA))的引物或探针。
[0154] 根据本发明的一个方面,提供了一种能够在划定区域中的一个或更多个位置检测多态性的等位基因特异性寡核苷酸探针。
[0155] 所述等位基因特异性寡核苷酸探针优选为5-50个核苷酸,更优选为约5-35个核苷酸,更优选为约5-30个核苷酸,更优选为至少9个核苷酸。
[0156] 与乳腺炎关联性的确定
[0157] 为了检测遗传物质中是否存在遗传标记,可应用本领域技术人员所熟知的标准方法,例如通过使用核酸扩增。为了确定遗传标记是否在遗传上与乳腺炎抗性性状相关,可以应用置换检验(Doerge和Churchill,1996),或者可以应用Piepho方法(Piepho,2001)。置换检验的原理由Doerge和Churchill(1996)进行了很好的描述,Piepho方法
由Piepho(2001)进行了很好的描述。采用置换检验(Doerge和Churchill,1996),使用回归法、10000个置换对家族内的显著连锁进行分析。在5%的染色体范围水平的阈值被认为是针对遗传标记与乳腺炎抗性和体细胞数性状之间的连锁的显著证据。此外,该QTL在不同的公畜家族中得到证实。对于利用方差分量法进行的跨家族分析和多性状分析,采用Piepho法来确定显著性水平(Piepho,2001)。在5%的染色体范围水平的阈值被认为是针对遗传标记与乳腺炎抗性和体细胞数性状之间的连锁的显著证据。
[0158] 选择牛受试者的方法
[0159] 一方面,本发明进一步涉及一种为育种目的选择牛受试者的方法。这种为育种目的选择牛受试者的方法包括:通过如本文所定义的任何方法来确定牛受试者和/或其后代的乳腺炎抗性,诸如通过在来自所述牛受试者的样本中检测如本文所定义的至少一个遗传标记的存在与否来确定牛受试者中的乳腺炎抗性。
[0160] 所述方法的目的是选择具有最佳育种值的那些牛受试者用于育种。例如,与牛受试者前代(亲代)的平均育种值相比,根据本发明的用于育种的牛受试者的选择有助于增加牛受试者下一代的平均育种值。
[0161] 在一个实施方式中,本发明的为育种目的选择牛受试者的方法包括:估计所述选定的牛受试者的育种值。例如,在本发明的遗传标记存在与否的基础上估计育种值。
[0162] 试剂盒
[0163] 一方面,本发明涉及一种试剂盒(诸如诊断试剂盒),所述试剂盒用于检测如本文所述的至少一个遗传标记(诸如与抗乳腺炎相关联的标记)在牛受试者中存在与否。在一个实施方式中,本发明涉及一种用于检测如本文其他部分所述的两个或更多个遗传标记等位基因在牛受试者中存在与否的诊断试剂盒,所述试剂盒包括至少一个检测元件。具体地说,所述试剂盒适合于检测至少一个遗传标记等位基因(诸如两个或更多个遗传标记)的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联。指示乳腺炎抗性的特定性状的实例在本文其它部分公开。这些性状包括SCS、SCC和临床乳腺炎的治疗病例,例如CM11、CM12、CM2、CM3、CM、SCC3、SCC2、SCC1和/或SCC。
[0164] 本发明的试剂盒优选包括至少一个检测元件,用于确定如上文所定义的位于基因组区域中的遗传标记。
[0165] 本发明的检测元件包括适于检测在基因组上的遗传标记(包括表观的)转录或翻译水平的任何实体。检测元件包括寡核苷酸引物和/或探针、抗体、适体、化学物质等。在一个实施方式中,诊断试剂盒包括用于检测所述牛受试者中的所述遗传标记等位基因的至少一个寡核苷酸。
[0166] 在一个实施方式中,所述检测元件是寡核苷酸引物和/或寡核苷酸探针。在一个优选的实施方式中,所述检测元件是如本文其它部分所述的寡核苷酸引物,或具有对应于如本文所定义的任何寡核苷酸引物的序列的寡核苷酸探针。所述试剂盒的至少一个寡核苷酸优选地包括5个至100个连续核苷酸或由5个至100个连续核苷酸构成,诸如10个至30个连续核苷酸,或至少5个,诸如6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、
23、24个,或至少25个连续核苷酸。在一个优选的实施方式中,所述检测元件是包括特异于表2中第9列和第10列所列的SNP标记的任何一个的至少5个连续核苷酸的寡核苷酸。
[0167] 一方面,本发明涉及用于检测与抗乳腺炎相关联的至少一个遗传标记在牛受试者中存在与否的的试剂盒,所述试剂盒包括至少一个检测元件,所述检测元件用于确映射于选自表2的区域1-61的牛基因组区域中的遗传标记,其中所述区域由第3列和第5列中确定的SNP标记划定,和/或由第4列和第6列中确定的基因组位置划定。
[0168] 待通过本发明的试剂盒的检测元件来检测的遗传标记在本文其它部分公开。因此,所述遗传标记例如是如本文所述的任何遗传标记,诸如位于从表2的第9列和第10列中提到的标记中选择的基因中的两个或更多个遗传标记等位基因。在一个优选的实施方式中,所述遗传标记位于如本文其它部分所定义的NPFFR2基因中。因此,在一个实施方式中,本发明的试剂盒包括至少一个检测部件,其能够检测NPFFR2基因中的突变,特别是用于检测位于上BTA6上的89,059,253Bp位置处的chr6_89059253SNP。因此,在一个优选的实施方式中,所述检测部件是包括NPFFR2基因的5个至100个连续核苷酸的核酸序
列,诸如10个至30个连续核苷酸,或至少5个,诸如6、7、8、9、10、11、12、13、14、15、16、17、
18、19、20、21、22、23、24个,或至少25个连续核苷酸,诸如SEQ ID NO:1,或与其具有至少
70%同一性的核酸序列,诸如与其具有至少75%、76%、77%、78%、79%、80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%同一性,诸如与其具有至少99%同一性。在一个优选的实施方式中,所述核酸序列包括chr6_89059253SNP和/或与其偶联的任何遗传标记多态性。
[0169] 本发明的试剂盒可进一步包括至少一个参照样本。在一个实施方式中,所述参照样本包括含有如本文所述的与乳腺炎抗性相关联的遗传标记的核酸序列,在另一实施方式中,参照样本包括含有与乳腺炎易感性相关联的遗传标记的核酸序列。
[0170] 在特定的实施方式中,本发明的试剂盒进一步包括实现所述试剂盒的检测方法和对结果进行解释的操作指南。
[0171] 为了确定抗乳腺炎的遗传定子,根据本发明的牛受试者的基因分型可基于DNA和/或RNA的分析。一个例子是,可使用如本文所述的标准DNA提取方法所提供的基因组DNA。所述基因组DNA可使用标准技术来分离和扩增,所述标准技术诸如使用与多态性标记区域对应(互补)的寡核苷酸引物的聚合酶链反应。在扩增反应之前可包括纯化DNA的额外步骤。因此,在单独包装中的用于确定乳腺炎抗性和体细胞数特性的诊断试剂盒包括至少一个寡核苷酸序列。
[0172] 本发明还涉及将本发明的试剂盒应用于检测与抗乳腺炎相关联的至少一个遗传标记在牛受试者中存在与否,特别是用于检测本文所确定的标记的任何一个或更多个。此外,本发明涉及将本发明的试剂盒应用于在牛受试者中就乳腺炎易感性方面估计育种值。
[0173] 估计育种值的方法
[0174] 本发明还涉及测定估计育种值。
[0175] 在一个大的随机交配种群中,每个个体应平均生出两个后代,以维持种群规模。种群中后代数量的分布具有平均值为2和方差为2的左偏斜二项式分布(泊松分布)。这意味着每个个体后代的数量可以从0变化及以上,值0、1、2、3、4和5是最常见的。估计的育种值通常被称为指数(I)。所述指数可以在来自所有可能的亲属的表型值信息的基础上进行估计。可使用简单的回归线或多元回归。亲属数量越高,估计越准。真育种值(A)和指数之间的相关性被命名为精度,其符号为rAI。估计的育种值是基于线性回归理论和相关性。
[0176] 一方面,本发明涉及一种在牛受试者中就乳腺炎易感性方面估计育种值的方法,所述方法包括:从所述牛受试者的样本中检测至少一个遗传标记的存在与否,所述遗传标记与指示所述牛受试者和/或其后代的乳腺炎抗性的至少一个性状相关联,其中所述至少一个遗传标记位于选自表2的区域1-61的牛基因组区域中,其中所述区域由第3列和第5列中所确定的SNP标记划定,和/或由第4列和第6列中所确定的基因组位置划定。所述方法优选地包括检测在本文其它部分确定的与乳腺炎相关联的一个或更多个特定标记。
[0177] 在一个实例中,使用多性状随机回归模型(mt-RRM)结合纵向TDSCS和二元CM性状来确定育种值,例如呈矩阵形式的模型一般描述为:
[0178] y=Xb+Hhh+Kkk+zaa+Zpp+e,
[0179] 其中:y是对如上所述九个不同性状进行观察的矢量。矢量b、h、k包含环境影响,而矢量a和p分别包含加性遗传和非遗传动物回归系数。
[0180] 模型中的环境影响可以是产犊年龄、牛群环境和泌乳期。加性遗传和非遗传动物影响可通过TDSCS的二阶Legendre多项式进行建模,并且针对其它性状的截距产生针对每个待估计的随机影响的15×15(协)方差矩阵。矢量e包含9个性状的残差。
[0181] 为了便于精确估计,CM性状与TDSCS之间的残余(协)方差可以假定为零,CM与乳房类型性状之间的残余方差可被可操作地设置为低值,以使该方差的部分被录入永久环境分量。这有助于估计CM和纵向性状之间的永久环境相关性。使用DMU包来估计协方差分量。
[0182] 在一个实施方式中,育种值是使用标记辅助的单性状最佳线性无偏预测(MA-BLUP)来计算的。
[0183] 在本文其它部分定义了特定乳腺炎抗性性状、遗传标记和标记等位基因、样本、牛受试者、检测方法等。
[0184] 选择性育种
[0185] 一方面,本发明提供一种对牛受试者进行选择性育种的方法。本发明的所述方法允许对适于选择性育种的牛受试者进行鉴定。
[0186] 在一个实施方式中,这些方法包括以下步骤:
[0187] a.提供牛受试者,
[0188] b.从所述受试者获得生物样本,
[0189] c.确定该样本中存在位于选自表2的区域1-61的牛基因组区域中的至少一个遗传标记,其中所述区域由第3列和第5列中所鉴定的SNP标记划定,和/或由第4列和第6列中所鉴定的基因组位置划定,
[0190] d.选择在其基因组中具有至少一个遗传标记的牛受试者,和
[0191] e.使用所述牛受试者进行育种。
[0192] 所述生物样本可以是包括遗传物质的任何合适的样本,并且优选为容易获得的。样本类型在本文其它部分进一步描述。
[0193] 牛优选为雄性受试者,即公牛。例如,当牛受试者是公牛时,将牛受试者应用于育种通常包括从所述公牛收集精液和使用所述精液对一个或更多个小母牛或母牛人工授精。
[0194] 然而,根据本发明的方法还可确定母牛和小母牛中相关遗传标记的存在。
[0195] 实施例
[0196] 实施例1
[0197] 奶牛中临床乳腺炎和体细胞评分QTL的精细绘图
[0198] 介绍
[0199] 由于大型半同胞家系结构的可用性,直到最近,全基因组连锁分析仍是针对牛的数量性状位点(QTL)基因组扫描的有效方法。连锁分析是传统上用于鉴定表现出孟德尔遗传表型的基因的方法。对于复杂的表型,诸如数量性状,连锁分析仅取得了有限的成功。在连锁分析中,存在一些在家族和具有已知祖先的谱系内发生重组的机会,导致相对较低的图谱分辨率,这限制了候选多态性搜索。与此相反,联合绘图(连锁不平衡绘图)已成为针对高分辨率绘图通过利用种群水平的历史重组事件来在序列水平解决复杂的性状变异的强大工具。在这种方法中,鉴定出在普通种群中针对目标性状具有预测能力的标记/单倍型。这类标记和单倍型可直接用于基于标记的选择。通常基因组扫描被用于绘制QTL图谱,其中一些检验统计量超过了预定的阈值。虽然阈值水平可被选择为非常保守,但是仍然存在实际的QTL表示I型误差的可能性。因此,来自QTL研究的结果应在被用于随后的精细绘图实验或标记辅助选择中之前,在独立的分析中得到确认。如果来自连锁分析的结果可通过关联研究得到确认,则它也将为检测到的QTL提供可信度。
[0200] Lund等(2008)使用连锁分析绘制了丹麦Holstein牛中针对临床乳腺炎和体细胞评分的QTL图谱。这些作者使用了以平均标记间距8.6cM遍布在所有常染色体上的356个微卫星标记上的数据。不过,所报道的QTL区域相当长(对于一些QTL超过20cM)。这样大的QTL区域连同家族特异性标记-QTL关联限制其结果用于实际动物育种以及用于候选多态性搜索的可用性。因此,仍然需要将QTL绘制到较窄的基因组区域,因为在选择决定中列入QTL信息需要因果多态性的精细图谱。在本实施例中,使用密集SNP标记针对牛的6个乳腺炎性状进行联合绘图。
[0201] 材料和方法
[0202] 基因分型
[0203] 使用bovineSNP50BeadChip( )对总共2,531个丹麦和瑞典Holstein公牛进行基因分型。只有次等位基因频率等于或高于0.05和平均GC评分为至少0.65的SNP被保留用于分析。因此,29个牛常染色体(BTA)上的总共36,387个SNP被选定用于关联分析。GC评分小于0.6的个体SNP类型被丢弃。所包括的用于分析的SNP数量从BTA28上的
675个变化到BTA1上的2,320个。基因分型平台和对SNP的质量控制上的细节由Sahana
等(2010a)进行了描述。染色体内的SNP位置是基于Bos taurus基因组组装(Btau_4.0,Liu等,2009)。
[0204] 表型数据
[0205] 单性状育种值(STBV)被用作该分析中的表型。针对与SNP的关联性,对六个乳腺炎有关的STBV进行了分析。使用最佳线性无偏预测(BLUP)程序和北欧牛遗传估计的公畜模型来计算针对每个动物的单性状育种值。对于育种值预测中使用的定义和模型,参见http://www.nordicebv.info,不同的是与其他性状的相关性被设定为0,以避免来自相关性状的表型信息影响任何特定性状的结果。此外,只有公畜-雄性子代和雄性子代-后代关系被包括在内,从而有效地生成公畜模型。如同在官方常规估计中,针对同一系统环境影响对STBV进行调整。临床乳腺炎被定义为在四个时间段内乳腺炎治疗(1)或否(0)的二
元性状:第一哺乳期的-15至50天(CM11)、第一哺乳期的51至305天(CM12)、第二哺乳期的-15至50天(CM2)、第三哺乳期的-15至50天(CM3),乳腺炎的发生率全部测量作为二
元性状。通过以下相对权重将关于四个乳腺炎性状的STBV加权在一起:CM=0.25*CM11+0.25*CM12+0.3*CM2+0.2*CM3,以形成乳腺炎抗性指数(CM)(Johansson等,2007),被标准化为平均值为100和标准偏差为10。体细胞评分(SCS)是用于针对乳房健康估计育种值的
重要性状。SCS是针对第一、第二和第三哺乳期的相对权重分别为0.5、0.3和0.2的从第一至第三哺乳期的5至170天的平均对数体细胞数的指数(Johansson等,2007)。可用于基因分型动物中的分析的STBV数量分别为:对于CM11,1671个;CM121668个;CM21669个;
CM31544个;CM 2098个;和SCS 1671个。
[0206] 关联分析的统计方法
[0207] 混合模型:利用由Yu等(2006)提出的混合模型分析进行关联分析。在这种方法中,多基因遗传效应拟合为随机效应。单SNP依次被包含作为模型中的固定效应。所述模型为:
[0208] y=μ1+αs+zu+e
[0209] 其中y是观察到的表型(STBV)的矢量,μ是共享的固定效应,1是全1矢量,α是SNP的等位基因置换效应,s是使α与个体相关的具有元素0、1或2的发生率矢量,Z是使记录与个体相关的矩阵,u是加性多基因效应的矢量,且e是随机残差效应的矢量。随机2 2
变量u和e被认为是多元正态分布。u具有平均值0和协方差矩阵σgA,其中σg是多基
2 2
因遗传变异,A是源自谱系的加性关系矩阵。e具有平均值0和协方差矩阵eI,其中e是残余方差,I是单位矩阵。使用软件包DMU(http://gbi.agrsci.dk/dmu/)进行所述分析。使用针对α=0的零假设的t检验对每个标记的作用显著性进行检验。
[0210] 显著性检验:对于总Ⅰ类错误率(family-wise error rate,FWER)的控制,应用mBonferroni校正。Bonferroni校正控制FWER(α)=1-(1-αi)≈αim,其中,αi是个体检验拒绝水平,m是检验的次数。5%的染色体规格的(chromosome-wise)显著性阈值的-5 -5
范围从BTA1上的逐点p值2.16x10 至BTA28上的7.41x10 ,或者以–log10转化标度为
4.67至4.13。Bonferroni校正是非常保守的(Han等,2009),因为它没有考虑到SNP之间-4
的相关性(连锁不平衡)。针对QTL区域使用了自由的显著性阈值10 ,这里的QTL先前已由Lund等(2008)确定,Lund等使用针对QTL绘图的微卫星标记进行连锁分析。在以下部-4
分中,显著关联将意味着染色体规格显著,暗示关联意味着逐点p值小于10 。
[0211] 标记QTL区域:通常预计在单SNP分析中,在一个QTL附近的多个SNP产生显著性结果。这是因为在物理上位于病原附近的所有SNP将倾向于处于连锁不平衡中。这种效应随遗传距离下降并且还依赖于次等位基因频率。在这项研究中,QTL区域被主观地划分。从最显著的SNP开始,所述QTL区域左右延伸,直到区域到达所有标记具有低于3的–log(p)值的地方。即,这样划分的QTL可包含一个或更多个非显著性标记。为了比较本研究与先前研究的结果,采用了Btau_4.0中的标记位置。如果所述标记位置在Btau_4.0中不可用,我们已报道了所述标记并在MARC表中给出了以厘米表示的位置[http://www.marc.usda.gov/genome/cattle/cattle.html]。
[0212] 结果
[0213] 目前的全基因组关联研究(GWAS)在丹麦和瑞典Holstein牛的8个染色体上确定了针对临床乳腺炎和体细胞评分的9个染色体规格显著性QTL(表3)。我们已经列出显示染色体规格显著性关联的92SNP x性状组合,而该范围外的24个组合超出了染色体规格显著性阈值(补充表3)。大部分的全基因组显著性关联是针对CM观察的,且四个SNP显示出与CM2的全基因组显著性关联。五个SNP显示出与一个以上乳腺炎性状的显著性关联。信号图(图1至图6)概述了SNP关联如何位于整个基因组,还有助于当基因组位置上的QTL影响一个以上性状时的可视化。在BTA6上观察到最高显著性信号。这里观察到与数个乳腺炎性状的高显著性关联。最强的信号是针对CM,随后是CM2、SCS和CM11。在BTA16上针对SCS、CM11、CM12和CM与在BTA1上针对SCS、CM11、CM12、CM2和CM关于性状关联性观察到一致的结果。在BTA14上还观察到关于数个乳腺炎性状的相同染色体位置处QTL的确认。
[0214] 表3通过关联分析检测到的针对乳腺炎性状具有最显著的SNP的数量性状位点(QTL)和QTL区域。
[0215]
[0216] 表4.示出与乳腺炎性状的染色体显著关联的SNP。全基因组显著性SNP(本发明的优选标记)以粗体示出。
[0217]
[0218]
[0219]
[0220]
[0221] 讨论
[0222] 利用联合绘图所观察到的QTL区间比Lund等(2008)所报道的那些区间窄得多。Lund等使用的是微卫星标记的稀疏图谱的连锁研究。联合绘图利用群体水平连锁不平衡。
因此,它能够将QTL绘制到非常小的染色体区域。在本研究与Lund等(2008)的研究中,乳腺炎性状的定义略有不同。这样,他们是将第一哺乳期(-10至305天)的临床乳腺炎作为一个性状(CM1)进行研究,而我们将第一哺乳期乳腺炎划分成两个子性状(CM11和CM 12)。
在BTA4上,我们在19.7Mb处检测到影响CM和SCS的QTL。我们在66.46-66.61Mb之间进
一步观察到具有3.5-3.8之间的–log10(p)值的3个SNP。我们在BTA5上的40.3Mb和
97.0Mb处还检测到针对CM的两个暗示QTL。
[0223] 在本研究中,在BTA6上的89.2Mb处观察到SNP与乳腺炎性状的最强关联。该QTL影响CM、CM11和SCS。最显著的SNP为ss86341106,其位于脱氧胞苷激酶(DCK)基因中,所述DCK在脱氧核苷补救途径中催化速控步骤。DCK表达的最高水平存在于胸腺和骨髓中,这表明DCK在淋巴细胞增殖中的作用。事实上,缺乏酶活性的基因敲除小鼠显示出复合性免疫缺陷表型,即它们产生T淋巴细胞和B淋巴细胞的水平非常低(Toy等,2010)。该区域中另一个强的候选基因是编码免疫球蛋白J多肽的IGJ基因。这种蛋白质在免疫球蛋白M(IgM)五聚体复合物的形成中及在IgA二聚体和聚合物的组装中起成核作用。IgM是在对微生物感染的初次免疫应答中产生的第一抗体,因此在防止病原体的全身扩散方面起关键作用(Racine和Winslow,2009)。此外,IgA参与抗微生物的防御,特别是那些通过粘膜表面侵入宿主的微生物。因此,IgA是在粘膜分泌物中发现的主要抗体类别,在那里它与微生物结合以防止它们附着到粘膜或穿透粘膜(Lamm,1997)。
[0224] 我们还检测到在BTA6上25.2处与SNP ss61565956显著关联的另一个QTL。在此区域中一个有趣的候选基因是DAPP1,也被称为Bam32,其在B细胞淋巴细胞中被表达并被发现与B细胞抗原受体(BCR)的信号转导有关。因此,结合到BCR的抗原包括对B细胞命运决定至关重要的信号转导过程(诸如增殖和分化)链,和BCR介导的抗原内化、处理并呈现给T细胞(Pierce,2002)。对Bam32缺陷小鼠的研究表明,Bam32介导B细胞的BCR诱导的增殖,但不存活(Han等,2003),它调节B细胞抗原受体的内化(Niiro等,2004),并且它促进有效的T细胞活化所需的B细胞与T细胞之间的稳定相互作用的形成,这最有可能是通过促进与T细胞上表达的整联蛋白配体的粘附(Al-Alwan等,2010)。
[0225] 我们还发现在BTA9上的75.9Mb处影响CM的QTL的暗示证据。
[0226] 我们在BTA11上的69.2Mb处观察到影响CM的QTL的暗示证据。此外,在我们的分析中,在30.4Mb处观察到一个关于CM的暗示性QTL。
[0227] 在BTA13上,我们在BTA13上的57.7Mb处检测到针对CM、CM11和CM12全基因组显著性QTL。存在两个位置靠近的表明全基因组关联的SNP,其位置非常靠近内皮素3基因[http://www.ensembl.org/Bos_taurus/]。由众多细胞和组织,诸如巨噬细胞和内皮细胞和上皮细胞产生的内皮素ET-1、ET-2和ET-3构成21个基酸的肽家族(Giaid等,
1991)。除了血管收缩作用,它们还对许多不同类型的细胞起作用,包括中性粒细胞的激活(Elferink和De Koster,1998)。中性粒细胞是通过吞噬或释放抗菌肽来对抗细菌和真菌感染的血源性白细胞(Selsted和Ouellette,2005)。位于该区域的另一可能的候选基因是Phactr3(磷酸酶和肌动蛋白调节器3),已证明Phactr3能通过与肌动蛋白细胞骨架直接相互作用来刺激细胞扩散和迁移(Sagara等,2009)细胞迁移率对细胞介导的免疫应答非常重要(Luster等,2005)。Lund等(2008)在微卫星标记BM9248(29.1cM)与BL1071(68.6cM;
Btau_4.0上的71.9Mb)之间检测到针对SCS的QTL。在连锁分析中,所报道的QTL区间非
常大(39.5cM)。相比之下,本发明的GWAS能够将QTL缩小到4Mb的区域。
[0228] 我们已鉴定了在BTA20上的37.7Mb处的全基因组显著性QTL。最显著SNP为rs41940571,其与MTOR的基因RIPTOR独立伴侣,复合物2连锁。在Btau_4.0组装的该QTL区域中存在其他几个基因。其中有编码补体成分C9前体的C9基因。补体系统是对抗入侵病原体的免疫应答的一部分。通过经典的、替代的或甘露聚糖结合凝集素途径激活补体系统,最终导致形成膜攻击复合物,其在细菌膜中产生孔,导致细胞裂解。补体C9是MAC的成孔亚基,且该基因中的突变与感染(例如流行性脑脊髓膜炎)险的增加相关联(Kira等,
1998;Zoppi等,1990;Horiuchi等,1998)。Lund等(2008)在BTA20上的31.3和48.2Mb之间观察到针对UD的QTL。这两个研究可能是指同一个QTL。
[0229] 在BTA23上,Lund等(2008)观察到在BMS466(46.1cM;Btau_4.0上的43.4Mb处)与INRA090(53.2cM)之间针对SCS的QTL,以及在43.9-46.6Mb之间针对UD的QTL。Ashwell等(1997)和Heyen等(1999)在BTA3上的39.9Mb处和48.6Mb处分别检测到针对SCS的QTL。我们的研究发现在这个染色体上影响CM和SCS的QTL的暗示证据在11.7Mb处,离先前报道的QTL很远。我们发现的QTL可能是与先前报道的那些QTL不同的一个QTL。
[0230] 我们还在BTA14的近端处(0.7Mb)检测到影响CM和CM2的一个全基因组显著性QTL,其在同一种群中未被Lund等(2008)检测到。三个SNP显示出与MAS2的全基因组显
著关联性。在德国Holstein牛中,在关于CYP11B1harbor的1.3Mb周围的区域针对SCS的QTL与本研究中所检测到QTL可能是同一QTL(Kaupe等,2007)。在Btau_4.0中的所述QTL区域存在包括DGAT1在内的数个基因(Grisart等,2002),DGAT1对牛奶中的脂肪含量和其它牛奶特性的表型变异有很大影响。
[0231] 临床乳腺炎与SCS之间的遗传相关性>0.70(Lund等,1999;Carlen等,2004;Heringstad等,2006)。因此,预期影响CM的许多QTL也将影响SCS。在影响临床乳腺炎性状的九个显著QTL中,五个QTL显示出对SCS的影响。由于临床乳腺炎与SCS之间的高遗
传相关性,这个结果如所预料的一样。因为在本研究中我们分析了临床乳腺炎和SCS两者,这可有助于指示SCS的程度,可以预期文献中的QTL对临床乳腺炎的影响。在本研究所分析的六个乳腺炎性状中,针对乳腺炎指数观察到了最大数量的QTL,所述乳腺炎指数是结合前三个哺乳期的临床乳腺炎的指数。
[0232] 本研究鉴定了数个乳腺炎QTL。我们在混合模型分析中使用密集SNP标记和关联研究,所述关联研究被观察到对于来自复杂的纯系种群(如牛)的样本效果最好(Sahana等,2010b)。在本研究中,将QTL位置改进为比通过先前的连锁分析所能实现的更窄的基因组区域。此联合绘图鉴定了与QTL连锁不平衡的或者是致病突变的SNP,因此,可在群体水平上针对乳腺炎抗性进行基于标记的选择。一些QTL区域足够窄,启动了对引起乳腺炎QTL的候选基因的进一步寻找。
[0233] 实施例2
[0234] 奶牛中临床乳腺炎和体细胞评分QTL的超精细绘图
[0235] 使用包括777,962个SNP探针的高密度SNP芯片对奶牛中临床乳腺炎和体细胞评分QTL进行精细绘图。
[0236] 联合绘图
[0237] 联合绘图鉴定与性状的表型差异有关的特定功能性变体(即,基因座、等位基因),以便于检测引起DNA序列多态性的性状和/或选择与表型非常类似的基因型。联合绘图已有各种不同的定义(Chakraborty和Weiss 1988;Kruglyak 1999),也被称为“关联遗传学”、“关联研究”和“连锁不平衡绘图”。全基因组关联研究(GWAS)为对常见的遗传变异与疾病或数量性状的风险之间的关联进行不可知的评价提供了一个重要渠道。以我们对遗传变异和测量这种变异的技术认识,最新的进展使得GWAS是可行的。
[0238] 在本实施例中,使用联合绘图来确定与奶牛中的乳腺炎抗性相关联的单核苷酸多态性(SNP)。确定了数个数量性状位点(QTL),所述QTL可被有效地应用于为改善乳腺炎抗性的动物选择中。
[0239] 表型
[0240] 使用丹麦和瑞典的Holstein牛针对所分析的九个乳腺炎表型进行了关于乳腺炎抗性的基因组扫描。用于绘制关于乳腺炎抗性的数量性状位点(QTL)的表型是对北欧牛遗传估计进行估计的乳房健康指数(NAV,Pedersen,2008,www.nordicebv.info)。目前NAV中所估计的乳房健康性状包括三个哺乳期中的四个临床乳腺炎性状,所有形状测量作为二元性状(表5)。将这四个乳腺炎性状加权在一起以形成乳腺炎抗性指数(CM),其被标准化为平均值为100和标准偏差为10(Johansson等,2007)。针对这九个与乳腺炎相关的表型,对重新编码的来自丹麦、瑞典和芬兰的Holstein牛中的公牛的4200个后代进行了测试。这些公牛的SNP基因型和表型用于联合绘图。
[0241] 表5.本研究所包括的性状的缩写和定义
[0242]性状编号 性状缩写 性状定义
1 CM11 第一次产犊之后的-15天至50天临床乳腺炎(1)或否(0)
2 CM12 第一次产犊之后的51天至305天临床乳腺炎(1)或否(0)
3 CM2 第二次产犊之后的-15天至305天临床乳腺炎(1)或否(0)
4 CM3 第三次产犊之后的-15天至305天临床乳腺炎(1)或否(0)
5 CM 临床乳腺炎:0.25*CM11+0.25*CM12+0.3*CM2+0.2*CM3
6 SCC1 第一哺乳期的体细胞数对数平均值
7 SCC2 第二哺乳期的体细胞数对数平均值
8 SCC3 第三哺乳期的体细胞数对数平均值
9 SCC 体细胞数对数:0.5*SCC1+0.3*SCC2+0.2*SCC3
[0243] 基因型
[0244] 利用Illumina Bovine SNP50BeadChip对Holstein公牛进行基因分型。基因分型是在丹麦农业科学研究所的Research Center Foulum的分子生物学和遗传学系及
GenoSkan的AgroBusiness Park Foulum通过Illumina Bovine SNP50BeadChip(Illumina Inc.,http://www.illumina.com/Documents/products/datasheets/datasheet_bovine_snp5O.pdf)完成的。所使用的平台是 Infinium II多重采样分析装置。利用
iScan对SNP芯片进行扫描,并使用Beadstudio ver.3.1软件对SNP芯片进行分析。用于选择SNP的质量参数对于个体的最低呼叫率为85%,对于位点的最低呼叫率为95%。具有次等位基因频率(MAF)低于5%的标记位点被排除在外。针对个体类型的最小可接受
GC评分为0.60。平均GC评分低于0.65的个体被排除在外。在50K数据集中,质量控制
之后的SNP的数量为43,415。利用BovineHD基因分型BeadChip(http://www.illumina.
com/Documents/products/datasheets/datasheet_bovineHD.pdf0对EuroGenomics项目(Lund等,2011)中的总共557个Holstein牛进行重新分型。BovineHD BeadChip上的总共
777,962个SNP以3.43kb的平均间隙尺寸和2.68kb的中值间隙尺寸均匀地分布在整个牛
基因组上。为HD数据设定的质量控制参数与如上所述为50K芯片所设定的参数类似。基于HD基因型公牛的标记数据,使用Beagle软件包(Browning和Browning,2009)将50K基因型归属为HD基因型(Su等2011;interbull会议简报)。在50K芯片中但不包括在HD
芯片中的标记被排除在归属处理外。对BovineHD芯片归属之后的SNP的数量为648,219。
所述SNP的基因组位置取自UMD3.1组装(http://www.ensembl.org/Bos_taurus/2011_09_cow_genebuild.pdf)。可在www.illumina.com得到位于29个牛常染色体上的648,219个SNP的物理图谱。
[0245] 用于联合绘图的模型
[0246] Yu等(2006)和Sahana等(2010)描述了联合绘图模型的细节。用于关联分析的统计模型是:
[0247] yi=μ+bxi+si+ei
[0248] 其中yi为个体i的单性状估计育种值,μ是一般平均值,xi是两个等位基因之一(具有任意标签)的个体i中的计数,b是等位基因置换效应,si是个体i的公畜的随机效应,假定具有正态分布 其中A是加性关系矩阵, 是父系方差,ei是个体i的随机残差,假定服从正态分布且具有均值零和误差方差 使用Wald检验对H0:b=0的零假
设进行检验。使用Bonferroni校正确定显著性阈值。将标称显著性阈值0.05除以包括在分析中的SNP的总数来计算全基因组显著性阈值。
[0249] 结果
[0250] 在22个染色体上鉴定出与乳腺炎相关性状相关联的总共61个QTL区域。所述QTL区域以及每个QTL的最高显著关联SNP列于表6中;参见图17。BovineHD基因
分型BeadChip的数据表可从以下地址下载:(http://www.illumina.com/Documents/
products/datasheets/datasheet_bovineHD.p df)。SNP的名称和位置获自Illumina的网站,参见www.Illumina.com。
[0251] 表6:参见图17
[0252] 表7:
[0253]
[0254] 实施例3
[0255] 使用BTA6(88-96Mb)上的QTL区域的全基因组序列数据的针对致病突变的靶向全基因组关联。
[0256] 靶向区域(TR)
[0257] BTA6上88-96Mb中的基因组区域被选定用于具有从90头公牛的全基因组序列中鉴定的SNP变体的靶向全基因组关联研究。选择该基因组区域是因为它在Illumina
Bovine SNP50BeadChip(HD SNP芯片)分析中显示出与临床乳腺炎的最强关联性。用于
HD SNP芯片分析的与临床乳腺炎相关联的最显著SNP为位于BTA6上88,919,352Bp处的
BovineHD0600024355。
[0258] 全基因组序列(WGS)
[0259] 在中国北京基因组研究所(BGI)对来自三个牛种的九十头公牛(来自北欧Holstein牛种、丹麦Jersey牛种和北欧红色牛种各30头)的全基因组进行测序(~10X
覆盖率)。对全基因组序列进行分析,并对超过2400万的变体进行观察。所述变体被功能性地注释。在BTA6上的靶向区域(TR)提取含有乳腺炎QTL的SNP多态性。在8Mb的TR内
总共有41,993个SNP变体。5,193头北欧Holstein公牛具有临床乳腺炎表型和HD SNP芯
片基因型。针对使用软件Beagle(Browning和Browning,2007)在WGS中确定的41,993个SNP变体对这些动物进行归属。使用混合线性模型分析(Yu等,2006)对这5193头公牛的数据进行关联分析。结果表明:神经肽FF受体2(NPFFR2)基因与临床乳腺炎的关联(图16)。
所述基因位于BTA6上的89,052,210–89,059,348Bp处。NPFFR2基因内的非同义突变由
SNP chr6_89059253确定且位于BTA6上的89,059,253Bp处,所述非同义突变的–log10(p值)=37.4。该SNP变体与第一哺乳期的临床乳腺炎(CM11)相关联。因此,NPFFR2基因
似乎强烈影响临床乳腺炎且chr6_89059253SNP有可能是影响北欧Holstein牛的临床乳腺炎抗性的原因性突变或该SNP与造成临床乳腺炎抗性的原因性多态性强连锁不平衡。
[0260] 实施例4
[0261] 有关靶向区域的关联研究(RWAS)。
[0262] 先前在北欧Holstein牛中针对九个乳腺炎性状进行了全基因组关联研究(GWAS)。使用Bovine HD SNP芯片完成基因分型。进行线性混合模型分析以确定与乳腺炎抗性显著关联的SNP。基于该GWAS研究,具有全基因组序列数据的六个基因组区域被选定为靶向GWAS(表8)。
[0263] 全基因组测序
[0264] 在中国BGI对总共90头公牛(来自丹麦红色牛种、丹麦Jersey牛种和北欧Holstein牛种各30头)的全基因组进行测序。序列数据由奥胡斯大学MBG的数量遗传学
和基因组中心(QGG)作出分析。平均基因组覆盖率超过10X。进行序列读取与牛参考基因组的比对,并鉴定其中一个或更多个样本与参照序列不同的候选位点或区域。质量控制措施移除有可能是假阳性的候选位点。使用VCF工具(http://vcftools.sourceforge.net/)进行变体识别(即存在于每个个体中变体位点处的等位基因的估计)。在三个牛品种中观察到总共超过2400万个DNA水平变体(单核苷酸多态性(SNP)、插入缺失(indel)、拷贝数变异(CNV)等)。所有变体被功能性地注释,用于寻找影响乳腺炎相关性状的候选多态性。
[0265] 靶向归属
[0266] 基于利用HD SNP芯片对北欧Holstein牛中九个乳腺炎抗性性状的GWAS研究,选定六个染色体区域(表8)。在表8中给出质量控制之后所选定的每个区域的SNP变体(来自全基因组序列数据)的数量和这些区域的长度。表型(估计育种值)可用于5193头北
欧Holstein公牛的九个乳腺炎相关性状。使用软件Beagle(Browing和Browing,2006)将这些公牛的SNP芯片基因型(50k和777k)归属为针对靶向区域的序列水平。这里提到的
所有SNP位置都是按照牛基因组组装(UMD3.1)。
[0267] 表8.六条染色体上所选定的用于RWAS的靶向区域。表中还列出了针对每个靶向区域所分析的九个乳腺炎性状的最高显著SNP。
[0268]
[0269] 区域关联研究(RWAS)
[0270] 进行SNP-y-SNP分析,其中每个SNP被分别拟合到Yu等(2006年)提出的线性混合模型(LMM)中。复杂的家族关系是在牲畜种群的GWAS研究中的主要混杂因素。LMM通过多基因效应包括了个体之间的关系,其能够控制由于家族结构导致的假阳性(Yu等,2006)。
[0271] 线性混合模型
[0272] 分别针对每个SNP,通过使用线性混合模型的单一基因座回归分析估计所述SNP与表型之间的关联。所述模型如下:
[0273] y=1μ+mg+Zu+e
[0274] 其中y是矢量的表型(EBV),1是长度等于观测次数的1s的矢量,μ是一般平均值,m是与记录的标记影响相关联的基因型评分(从Beagle输出获得;其值介于0与2之间),g是SNP的相关加性效应的标量,Z是使表型与相应的随机多基因效应相关的关联矩阵,u是具有正态分布 的随机多基因效应的矢量,其中A是加性关系矩阵, 是父
系方差,e是具有正态分布 的随机环境偏差的矢量,其中 是误差方差。使用软件
DMU(Madsen和Jensen,2011)通过约束最大似然法(REML)将所述模型拟合,并使用Wald检验针对g=0的零假设进行测试。
[0275] 显著性关联
[0276] 如果对多重检验进行Bonferroni校正之后的p值超过区域显著性阈值,则SNP被认为具有显著性关联。
[0277] 将首要SNP作为模型中的辅因子的关联分析
[0278] 大量的SNP超过区域显著性阈值。由于存在LD且仅与靶向区域中分离的一个随意变体连锁,因此预计这些SNP的显著影响会较高。然而,由于该区域相当大(在某些情况下>5Mb),也有可能所观察到的效应是由于北欧Holstein种群中分离的多个原因性变体导致的。进行此分析是为了查看在将来自LMM分析和/或功能注释的首要SNP包含在模型中作为辅因子之后,是否有任何SNP显示出显著性关联(表9)。该分析是利用R-package的nlme的lme函数(http://cran.r-project.org/)完成的。所述模型如下:
[0279] Yij=μ+Si+fixSNP+SNPm+eij
[0280] 其中Yij是从第i个公畜的第j个动物的动物模型(即对谱系进行调整)获得的残余表型,Si是第i个公畜的随机效应,fixSNP是针对LMM中的最高显著SNP(或基于一些顶部SNP之间的功能注释的首要SNP)的基因型评分的回归,SNPm是第m个SNP(m≠fixSNP)的基因型评分的回归,eij是随机误差。
[0281] 表9.将被用作线性模型中的辅因子的基于关联强度以及功能注释选定的SNP
[0282]染色体 区域(Mb) 用作辅因子的SNP SNP位置(Bp) MAF
BTA5 84-95 Chr5_92753829 92,753,829 0.204
BTA6 88-96 Chr6_89059253 89,059,253 0.483
BTA13 57-63 Chr13_57572723 57,572,723 0.137
BTA16 48-55 Chr16_50529178 50,529,178 0.019
BTA19 55-58 Chr19_55296191 55,296,191 0.380
BTA20 32-40 Chr20_35965955 35,965,955 0.203
[0283] 结果
[0284] 在图18-23中示出关于RWAS(线性混合模型和将首要SNP作为辅因子的线性模型两者)的曼哈顿图。在下表中列出在北欧Holstein牛中对于为靶向GWAS选定的这些基因组区域的每一个的与九个乳腺炎性状相关联的最显著SNP的名单。各靶向区域的候选多态性是基于功能注释信息进行检索的,并检测它们的关联强度。
[0285] 所有六个靶向区域具有广泛选择的关联性。然而,包括最显著关联的SNP作为辅因子(表9),关联区域的整个范围收缩。这表明表9中提到的被用作辅因子的SNP或者为影响北欧Holstein牛中的乳腺炎抗性的原因性多态性,或者与靶向区域中的原因性多态性处于非常高的LD。因此,这些SNP可被用作对Holstein牛中个体动物的乳腺炎抗性的预测。下面将详细讨论来自个体基因组区域的结果。
[0286] BTA5(84-95Mb)
[0287] 针对BTA5上的靶向区域,在表10中列出关于九个乳腺炎相关性状的每一个的最显著SNP。BTA5上的靶向区域的总长度为9Mb,且有两个区域(在86.99Mb和92.75Mb处),其中高度显著SNP被集中。在图18中示出关于该区域的曼哈顿图。
[0288] 表10.BTA5上的靶向区域中与九个乳腺炎相关联的最显著SNP
[0289]
[0290]
[0291] BTA5靶向区域内的候选多态性:
[0292] BTA5(86.99Mb):在86.99Mb处有一个大型内含子。在上游86,948,388处有一个非同义多态性(对于多态性的替代等位基因的等位基因频率(alt)为64%),这可能是候选多态性。在下游87,004,771(alt 15%)处和87,004,957(alt3%)处,在内含子的非编码基因中有两个多态性。进一步的下游87,023,448(alt31%)处,有一个同义编码剪接位点多态性。
[0293] BTA5(92.75Mb):在 92,496,500周 围 的 基 因 在92,496,251(alt 54 % )、92,496,510(alt 28%)和92,496,586(alt 3%)处有三个多态性。下游的下一个注释开始于93,688,996周围(基因ENSBTAG00000013541)。然而,在该基因中所有多态性为上游或下游的内含子。下一个下游的候选原因性多态性可能在93,939,231(alt 7%)(基因
ENSBTAG00000008541)处,其为非同义编码。然而,上述讨论的BTA5的靶向区域内的候选多态性都没有显示出对整个所分析的乳腺炎性状的强关联信号。
[0294] BTA5:根据分析的与乳腺炎相关联的基因总结于下表中。对于临床乳腺炎,顶部SNP集中在92.7Mb周围,而在位置87Mb(88.8Mb、90.9MB)和93.4Mb处也有小峰。以下基因位于87Mb和92.7Mb周围的两个主峰区域中。
[0295] 表11.BTA5:根据本分析的与乳腺炎相关联的基因。
[0296]
[0297]
[0298] 在该区域的候选基因中,我们发现编码Ras相关和雌激素调节的生长抑制剂样蛋白的RERGL。在文献中很少有或没有关于这个特定基因的功能信息。然而,小GTP酶的Ras家族是在不同的生物过程中起作用的超过150种蛋白质的组,包括免疫和炎症(Johnson和Chen,Current Opinion in Pharmacology 12,458-463,2012)。另一个可能与乳腺炎相关的良好候选基因是PIK3C2G,其编码磷脂酰肌醇-3-激酶2类伽亚基。许多PI3K酶在免疫细胞的运作中起重要作用(Johnson和Chen,Current Opinion in Pharmacology,2012;Koyasu,Immunology,2003)。
[0299] BTA6(88-96Mb)
[0300] 针对BTA6上的靶向区域,在表12中列出关于九个乳腺炎相关性状的每一个的最显著SNP。BTA6上的靶向区域长度为8Mb。在图19中示出关于该区域的曼哈顿图。
[0301] 表12.BTA6上的靶向区域中与九个乳腺炎相关联的最显著SNP
[0302]
[0303]
[0304] 针对BTA6靶向区域的候选多态性:
[0305] SNP:Chr6_89059253是针对BTA6的靶向区域的强候选多态性(alt48%,基因ENSBTAG00000009070)。该SNP显示出与所有五个临床乳腺炎性状(CM11、CM12、CM2、CM3和CM)非常强的相关性(表13)。
[0306] 表13.来自注释的最相关的多态性SNP位于BTA6上的89,059,253处。该SNP显示与所有五个临床乳腺炎性状高度相关。
[0307]
[0308] 表14.BTA6:根据本分析的与乳腺炎相关联的基因。
[0309] 对于临床乳腺炎,顶部SNP集中在88.9Mb周围,而针对SCS的主峰集中在88.4MB上。在此我们发现以下基因:
[0310]
[0311]
[0312] 一个相关联的基因是编码免疫球蛋白J链的IGJ基因,但是应注意该基因可能离峰太远。这种蛋白质与免疫球蛋白IgM和IgA相互作用。IgM是在对微生物感染的初次免疫应答中产生的第一抗体,而IgA参与抗微生物的防御,特别是那些通过粘膜表面侵入宿主的微生物。另一个相关联的基因是脱氧胞苷激酶(DCK基因),其催化在脱氧核糖核苷补救途径中的限速步骤。DCK在胸腺和骨髓中表达,这表明可能在淋巴细胞增殖中起作用。缺乏DCK酶活性的小鼠显示出复合性免疫缺陷表型,即它们产生T淋巴细胞和B淋巴细胞的水平非常低(Toy等,PNAS,2010)。在此区域中一个相关的基因是属于白蛋白家族的GC基因。GC蛋白与维生素D结合并参与(炎症引发的)巨噬细胞的激活(Yamamoto和Naraparaju,
Journal of Immunology,1996;Kisker等,Neoplasia,2003)。在该区域中与乳腺炎相关联的另一基因是NPFFR2基因(也被称为GPR74),其编码神经肽FF受体2。NPFFR2在数个组
织中都显示表达,包括胸腺、肝、脾、脑、脊髓和其他组织。NPFF受体已被指出涉及通过调制阿片系统的激素调节、摄食调节、体温调节和伤害感受(来自GeneCard的信息)。然而,有文献表明,许多神经肽例如通过充当刺激剂或巨噬细胞活性的抑制剂来参与免疫应答(参见Ganea和Delgado的综述,微生物与感染,2001)。NPFFR2还结合催乳素释放激素,这表明NPFFR2可能在促乳素分泌中起作用(Ma等,European journal of neuroscience,2009)。有趣的是,除了调节哺乳期,催乳素还作为免疫系统的重要调节器(Yu-lee,Recent Progress in Hormone Research,2002)。
[0313] BTA13(57-63Mb)
[0314] 针对BTA13的靶向区域,在表12中列出关于九个乳腺炎相关性状的每一个的最显著SNP。靶向区域的长度为6Mb。在图20中示出关于该区域的曼哈顿图。
[0315] 表15.BTA13上的靶向区域中与九个乳腺炎相关联的最显著SNP
[0316]
[0317] 针对BTA13靶向区域的候选多态性:
[0318] 基于BTA13的靶向区域内的功能注释的两个可能的候选多态性可以是位于57579568和57579569处的两个连续SNP,且两者均显示出与乳腺炎性状非常高的相关性。
[0319] 表16.来自BTA13上的注释的与临床乳腺炎最相关的两个多态性SNP的关联结果。
[0320]
[0321]
[0322] 表17.BTA13.根据本分析的与乳腺炎相关联的基因。
[0323]
[0324]
[0325]
[0326]
[0327] BTA16(48-55Mb)
[0328] 针对BTA16的靶向区域,在表18中列出关于九个乳腺炎相关性状的每一个的最显著SNP。BTA16上的靶向区域的长度为7Mb。在图21中示出关于该区域的曼哈顿图。
[0329] 表18BTA16上的靶向区域中与九个乳腺炎相关联的最显著SNP
[0330]
[0331] 针对BTA16靶向区域的候选多态性
[0332] 在表19中示出对数个乳腺炎相关性状显示出强关联性的BTA16上的靶向区域的候选SNP。50,529,178处的SNP以及随和的两个SNP(50,564,280和50,573,032)对
数个性状显示出强关联性。除这三个候选SNP之外,在位于基因ENSBTAG00000020014中的50,529,395(alt 8%)处有一个非同义多态性。在下游ENSBTAG00000004738中的
50,546,994(alt 45%)处有候选SNP(非同义)和50,547,815(alt 78%)处有剪接位点
多态性。
[0333] 表19.来自BTA16上的注释的与临床乳腺炎性状相关联的最强多态性的关联结果[0334]
[0335]
[0336] 表20.BTA16:根据本分析的与乳腺炎相关联的基因。
[0337]
[0338]
[0339]
[0340] BTA19(55-58Mb)
[0341] 针对BTA19的靶向区域,在表21中列出关于九个乳腺炎相关性状的每一个的最显著SNP。BTA19上的靶向区域的长度为3Mb。在图22中示出关于该区域的曼哈顿图。
[0342] 表21.BTA19上的靶向区域中与九个乳腺炎相关联的最显著SNP
[0343]
[0344]
[0345] 在靶向BTA19中与乳腺炎抗性相关联的多态性:
[0346] 下 游 ENSBTAG00000013677 开 始 于 55,324,679Bp(alt 72 % ) 周 围。在55,331,001(alt 21 %) 和55,338,316(alt 64 %)处 存 在 剪 接 位 点 变 体。
ENSBTAG00000044443开始于55,414,846(不包括在关联分析中)周围。在非编码基因中
55,419,720(alt 29%)处有一变体。上游ENSBTAG00000002633开始于55,158,662周围,无任何目标多态性。选自功能注释的上述SNP都没有显示出与乳腺炎抗性的强关联信号。
[0347] 表22.BTA19:根据本分析的与乳腺炎相关联的基因。
[0348]
[0349]
[0350] BTA20(32-40Mb)
[0351] 针对BTA20的靶向区域,在表23中列出关于九个乳腺炎相关性状的每一个的最显著SNP。BTA20上的靶向区域的长度为8Mb。在图6中示出关于该区域的曼哈顿图。
[0352] 表23.BTA20上的靶向区域中与九个乳腺炎相关联的最显著SNP
[0353]
[0354] 在靶向BTA20区域中与乳腺炎抗性相关联的的多态性:
[0355] 在35,965,955和35,965,956处有两个目标候选多态性变体。关联结果指出35,965,955处的SNP显示出与所有分析的九个形状的强关联性(表24)。在
ENSBTAG00000010423中,在35,966,158(alt 52%)处有一个非同义多态性。在
35,942,954(三个等位基因的indel+snp多态性)和35,942,739(alt 52%)处也有候选
多态性,且在35,938,178(alt 2%)处有剪接位点多态性。在35,922,233(alt 4%)处
有另外一个非同义多态性,另一基因(ENSBTAG00000019595)起始于35.994.141周围。在
36,011,203(alt 84%)和36,013,931(alt 73%)处存在非同义变体。结合关联结果和功能注释,SNP Chr20_35965955成为位于BTA20上的靶向区域内的影响乳腺炎形状的最强候选多态性。
[0356] 表24.来自BTA20上的注释的与临床乳腺炎性状相关联的最强多态性的关联结果[0357]
[0358] 表25.BTA20:根据本分析的与乳腺炎相关联的基因。
[0359]
[0360]
[0361] 实施例5
[0362] 针对BTA6乳腺炎QTL的原因性多态性
[0363] 神经肽FF受体2基因(NPFFR2)中的错义突变rs110326785(G/A)与BTA6上的乳腺炎QTL相关联。位于89,059,253Bp(UMD3.1)处的该SNP引起氨基酸392E变为K(谷氨酸
变为赖氨酸)。北欧Holstein牛中rs110326785的次等位基因频率为48.3%。在下表26中给出针对Holstein牛中九个乳腺炎性状的等位基因置换效应。该SNP(rs110326785)在北欧红牛种群中也是分离的(MAF=41.2%),且针对关于乳腺炎指数的育种值具有-2.68(se=0.26)的等位基因置换效应,并且该SNP解释了遗传方差的2.58%。这确认了其在
Holstein牛和北欧红牛二者中在同一方向的效应,即在这两个种群中等位基因A降低了对乳腺炎的抗性。
[0364] 表26SNP,rs110326785,对北欧Holstein种群中九个乳腺炎形状的影响
[0365]
[0366]
[0367] 实施例6
[0368] 针对BTA20乳腺炎QTL的多态性
[0369] SNP rs133218364是含胱冬肽酶募集结构域的蛋白6(CARD6)基因内的非同义变体,其显示出与在Holstein牛中临床乳腺炎指数的最显著关联。该SNP位于BTA20上的33,642,072Bp处。类似地,位于3323Bp下游的关于LIFR基因(白血病抑制因子受体)的
另一SNP rs133596506(位于35969994Bp处)也显示出与临床乳腺炎指数非常高的显著
关联。这两个变体都被拟合为使用50K基因型的基于单倍型的分析中的固定效应。变体rs133218364能够解释的针对BTA20上的靶向区域的总QTL方差(参见下图中的绿线)。然而,rs133218364作为同义变体,不改变蛋白质的氨基酸组成成分。因此,rs133218364不太可能是构成QTL的原因性多态性,但与原因性多态性处于完善的连锁不平衡。靠近LIFR基因的rs133596506在被包括在单倍型模型中时,还会导致检验统计量的大幅下降。
[0370] 序列
[0371] SEQ ID NO:1
[0372] NPFFR2基因–编码区域
[0373] NCBI参考序列:AC_000163.1
[0374] GenBankGraphics
[0375] >gi|258513361:89052219-89059482Bos tauru牛种Hereford染色体6,Bos_taurus_UMD_3.1,全基因组枪序列,位于89,059,253处具有G等位基因的的G/A SNP。
[0376] ATGAGTGAGGAATGGGATTCAAACTCTACAGAAAACTGGCATTACATTTGGAATAATGCCACAACACATGATCTGTACTCAGATATCAATATTACCTATGTGAACTACTATCTTCACCAGCCTCAAGTGGCAGCGATTTTCATTATTTCCTACTTTTTGATCTTCTTCCTATGCATGGTGGGAAACACAGTGGTTTGCTTCATTGTAATGAGGAACAAACATATGCACACAGTCACTAATCTCTTCATCTTGAACCTGGCCATAAGTGATCTACTAGTTGGTATATTCTGTATGCCTATCACACTGCTGGACAATATTATAGCAGGTATGTTGATCCACTCCAGTATTCTTGCCTGGAAAATCCCATGGATGGAGGAGCCTGGTGGGCTACAGTCTATGGGGTCACAAACAGCTGGAAATGACTGAGTGACTTCACTTATGTTGATTTGTGTACAGCTCAAAGATAATATAAAAAAATATTTGTCCCATATCCCTGCAGCTATGGTACAGTCATCCATTCATTTCAAATATTTACGGAGTTCCAAGAACTTCTCCAAGTAGCTGTCCTCATGAGGCCTACATTATAAAGGAGGATAAAAAAACAACAAACAAAAAACTATATAAACAGAGAATAAAAAGAATTATGGGGAAAAGTAAAGCAAGTGACAGAGATGAGATGTGGAGGCTGATTTTTATAGAGTTCACTGACGGTCATCCATGAATGATGACACTTCTTACTGAAGACTATGAATTTCCTTGGCAGTTCTGAGCACATATAGTATGGTAGGAATGTTATTGAGACTATATGCATCATAAAGCTCTAAGAACTGCTAAGTGTGGTTTCCATTAATATGATGTCTTCAATATAACGTAAATAGATATTTAGACCCTCTTGTGGTTAGCTGGGCTTCTCTGGTGGTTGGGAGATTTCCAACAGTTTTTGATGGAAGGCAAGCAGCAGGACCAATGATATGTCACAAAGTGGTAGTTTCATTCATGGAGTAGTAATTTACATGTGCAACATAAACAATGGTTCGGGTGCTACCCTAGAGGACTTCCAGGTCCGTATTACCACTTCCTAACACAACTTTATGTCCCTCTCTTGTGGCTCAGCTGGTAAAGAATCCACCTGTAATCAATCCCTGGGTTGGGAAGATTCCCCTGGAGGATGACATGGCAACCCACTCTAGTTTTCTTGTCTGGAAAATCCCCATGGACAGAAGAGCCTGGCAGGCTGCAGTCCATGGGGTCACAAACAGTTGGACACAACTGAGCGACCAAGCACAAAACATCACATTATATACCCCAGAAGTATAGGAATGGTGTATCTATGGCTCCTGGTAGAGTTTTGGTACATAGTACCTGATTAATAAATATTTGTTGTACAAACTAATGAATAGCACTCAAGATACTCATATTCCAAATCTGTATAAGAAAATATAAAAAGTATTTAGATCAAACAAGCCATATCATGGGGCTACTGTGGTGGCTCAGGAGTAAAGAATTTGCCTGCAATGCAGGAGATGCAGAGATGTGGGTTCAATCCCTGGGTCGGAAAGATTCCCTGAAGGAGAAAATGGCAACCCACTCCAGTAATCTTGCCCAGAAAGTAAACTGATGTTGAATGCCACAAAAGGGAAAGAACTGTGGTGTGGTTTGTTGTTACTGCTGTGTAGTCAGACACGACTGAGTGACTAAACAATAATAACACAAGTCATATCACAGTTCTTTTCCATTATGGCATTCAACATAGGTTTACTGAAAAATGGAGATTTAAGAATTTATTTCTGTTTCTTTCCTTTCTCTGAAGTGGGAGTCAGGGAATGTTTGAGTGGCTATTCTATCATAATATACTACATAAATTCTGTGTTTCCATGATGCTTGTCATTTAAAAGCAATATTTATTAATGATGTACATTTAAAAAAAATGATGTACATTTTTAAGATGTGCTAGACAAAAAGAGTTGATAAAAATTGTTGTCTCAATAAACTTAAGAAATGATCTCAATATGTCTCCCATAAATATCTATAATTAAATTACTAGTTAAGTTTTTTCATATACAGTATCCTTCCCTACCCCTGATTCCTATTCCCAGGAGGCAGCCACATTCAGCATTTTTGCATTTATTTTTGGTAATTACTATAATATTTCTGAATAACATGTTTTTATTCTAGTATATTATCCAACTGCAGAAGATGCAATTTAGTTCTCATTATCCTCTTCTACCCCAAGAGATAGTTTCCCTCACCAAACTCCACTGAACTGACAGCACTAGGGCAAAAGAATGTAAATCCATAGAAACTGTCTGAATGTGAAATTGGAAAAACAACATGACTGGTTGAAATTTGGTATAAATACCAACAGACACATTTATACAGAGCCACAAATATACATTCATTTTTCACCTCCCTCATTCTCTCAATATGAGCACGTCATTGTTTTTTGTTAAATCAATATTTAGGGTATGCATTACTATTATTATATGTACCTTACCCCTGCTGAACCATGTAGAGTACTATGATAGCAACCTTTTCTCTTATAAAATGTTTTTGTTTTCCTGGATTTAATAAGGGCATAATCTTTTGATTTGTTTAATGTTTTGAGTATAGCTATCAATAATGTTTTCTCAGATTTTCTTCCAGGAGAGTTAAGTTTCTTGCCAATACCTTCAAACATATAAAGTACATATATGTGTTTTTAACACATCAAAAAGATGTAAATGAGGTGAATAATAAAGCTTCCAAGCTTGTTGTGGGGATTAGATATGTTAATAGATGCAAAATATTTATTAGAGCATATAGAATGTTGAAACTACTGTATAAGCTTTGACATTATTAATATACTGAAAAACAAAGCTCTAAATATATTAATGAAAATAATGGGAAATGTTGATTGTTCCCTGGATCTTTTAGGAAACAGTTACATGCATCTAATTTCATGTCTTTCTCTTCAAAATTTCAGTGAAATTAAAATATACATGTATGATCTCTCTGAAGACTAACTGTTCCATTTCCCTTTCAGGATGGCCTTTTGGAAGTACAATGTGCAAGATCAGTGGCTTGGTTCAGGGAATATCTGTTGCGGCTTCTGTCTTTACTTTAGTTGCAATAGCAGTGGATAGGTAGGTCAACCCCAAACTCTGAATCCAGAAAATTGAGCATGTCTGCAACTATTCTACCTAACCAGTGAAAAATGTGTCATCTACTACATTTGGGCATATCTGTTTAAAATTGTATTCATAATATATCCTTTTATATATATATATATATGTAGTATATAATATATATACATATGCATAGTATATATGTGTGTGTATATATATTTGTGCATTATATATACATAAATTGTATCCACAGTATGTATCCCTTTATATATATATATATATAGAGAGAGAGAGAGAGGGAGATAGGGTGTATGCATGTGCATGCTCAGTTACTCAGTCATTTCTGATTCTTTGTGACCACATGGACTGTGGCCTGCCAAGTTCCTCTGTCCATGGAATTTTCTAGGCAAGAATACTGGAGTGGGTTGCCATTTCCTACTCCAGGGGATCTTCCTGAGCCAGGGATCAAACCCATGCCTCCTGCATTTGCAGGAGCATTCTTTACCACTGCACCACCTGAGAAACCACACACACACACACACACACTAAGAGTTCAGTAATAAAATAAAACTAGTAAAGTTTTCATATTTTAAAATTAAATAATTAGAGATGATTCATGTCCTAGTTTGGCCTGCTATAACAAGGTATAATACGTTATTTGATGAATGAATAAATGAAAAAATAATACTTGAAGTTTCCATAATTGTTTTACAAAAGGAGCAAAAATACCTAGAACAGCACCTATGAAGTTATCCGTAATTTAAGGGTGAGTAAATGGGAGAATTCACTGATTAGAAGACTAGATGAACACTTGGAGGTTAAGACAGAAGACCTATCACTTCATGGAAAATAGATGGGAACAAAGTAGAAACAGTGGCAGATTTTATTTTCTTGGATTCCAAAATCACTGTGGATGGTGACCACAGCCACGAAATGAAATGATGCTTGCTTCTTGGAAGTTACAAGGGAAGCCTGGTGACAAACCTATACAGTGTATTACAAAGCAGAGACATCACTTTGTGGACAAAACTCACATAGTCCAACCTATGGTTTTTCCAGTAGTCCTCTAGGGATGTGAGAGTTGGACCATGAAGAAGGCTGAGAGCCAAAGAATTGATGCTTTAGAACTGTGCTGCTGGAGAAGACTCTTGAGAGTTCCTTGGACTGCAAAGAGATCAAACCAGTCAATCCTAAAGGAAATCAACCGTGAATATTCATTGGAAGGACTGATGCTGAAGCTGAAACTACAATTGATGTGAAGAACCAACTCATTGGAAAACACTCTGATGCTGGGAAAGATTGAGGGCAGGAGGAGAAGTGGGTGACAGAGAATTAGATGGTTGGAGAGCTTCACCGACTCAATGGAGATGAAATTGAACAAACTCTGGGAGATAGTGGAGGACAGAGAAGCCTAGCGTGGTGCAGTCCATGGGGTTGCAAAGAGCTGAACACAACTTAGCAACTGAGCAACAACAAAAACAAGACTTTACATATGCTTTGAAGGAGTTGTAAAGAAAGACAACAGAGTAGTAAAAGCTCAAGCTAACTAGTCGTTATATAAAGATATTAGATAAATTAGTTTGGGTTGCTTCTAAGCCATTTAAAAACTCTGTTTTCTTACCTGCAGATCTGGAAAACAGTAAGTTTCATAACATTTCAGTTTTATAGAGTCATCAAAAAAATCCTAGAAAATTCAATAGATGATAATACTTTGAAAAATGTGTTATGCAGTTGCATAGTTGTATGGTTATCTTATACTGCAGAAGGAAATGGCAACCCAGTCCAGTATTCTTGCCTGGAAAATTCCATGGAAAGAGGAGCCTGGCAGGCTACAGTTCATGAGGTCACAAAGAGTCAGACATGACTGAATGACTGAGCACATGGTTATCTTATAATGAACATAATGAACATCAATAATAACATTAAGAATCACAATGACAAAAATTAACAGCAGTAAAATGAACCAGTGTTACTCTTCATATTGATGTTGAATTTTCATGCTCCTTAGAAGATATGGAACACCAGGAAGGTGTATAAACAGAACTCATAATTGGCAACTCTCAGAGTCTTACAGCTCTGAAAAAAACCACCAAGACACTTGGTGGCTCAAAACAGCAGTGTTCAGTACTTCCCACAACTCTGTAGATTGGCTGGGTGTGGTTCTCCTACTCTATGTCTTATAGCTGAAATTGCTCATGCTTCCACTTATACCATGCTTGCTAATGTTCAACTAACTGGCCAAAGCAAATTGCATGTCCAAGCACACAGATCATATGTGAGGGGACCACAGAAGGGCATGAAGGAAAGTATAAGAATATGGGCTCTGGAGCCAAACCACATGTGCAACAATCATGTGTGATTATGGGCAAGAATTTTTACCCTTTCTAAGACTTTTCCCCATAAAAGGCTTAAAGATACAATCCATGCAAACCAATGAAAAGGACCTTAGAACAGAATATTAAATGTTCAATATGGGCTGCTTAACACTAACATTTTTATTATAACTTTAAAATTTTTATTGGAGTAGAGTTGATTTACAATGTTGTGTTAATTTCTGCTATACAGAAAAGTGAATCAGTTGTAAATACATATGCATACATCCGTGCTTTTTTTCTAAAGGTTTATTGTATTTATTTATTTAATTTACTTTTTGGCTGTGCTGGGTCTTCGTTGCTGTGCATAGGCTTTTCTCTAACTGCAGCGAGTGGGGCTACTCTCCGTTGTGATGCACAGGCTTCTTGTTGCAGCAGCTTCTCTTGTTACGGAGCACAGGATCTAGGTGCGCAGGTTTCAGTAGCTGCAGCACATGGGCTCTGTAATTGTGGTTCACAGGCTCTAGACGCTGGCTCAGTAGTTGTGATGCATCAACTTAGCCACTCTGCGGCATGTGAGATCCTCCCAGACCAGGGATCAAACCAGCATCCCTTGCACTGCAAGACGGATTCCTAATCGCTGGACCACCAGGGAAGCCTGAGTACTTTTACTATTAATAGTGTCTGATATACTCCACTTATTCGTATTTTGAGTTGAAATTAATCTCATATAATAATTACAGAAAATGCGTCTCTCCTAATTCTAACTTTCTACATTTTAGGGAGAACGTGGATGAAGACTGCAGTTACTGAAATTTAATTAATGACTCAGCCAGAAGTTATGAGCAGTCCTTCACTGATATTTGCCTTTCGTTACAGGTTCCGGTGTGTCATCTACCCTTTTAAACCAAAGCTCACTATCAAGACGGCGTTTGTCATCATTATGATTATCTGGGTCCTGGCCATTGCCATCATGTCCCCATCTGCAGTAATGTTACATGTACAGGAAGAAAAAAATTACCGAGTGAGATTCAACTCCCAGGATAAAACCAGCCCAGTCTACTGGTGCCGGGAAGACTGGCCAAGTCAGGAAATGAGGAGGATTTATACCACAGTGCTGTTTGCCAATATCTACCTGGCTCCCCTGTCCCTCATTGTCATCATGTATGGAAGGATTGGAATTTCACTGTTCAAGAGGAAAGTGCCCCACACAGGCAAACAGAACCGGGAGCAGTGGCATGTGGTATCCAAGAAGAAGCAGAAGATCATTAAGATGCTCCTGACCGTGGCTCTGCTTTTCATTCTCTCCTGGTTGCCCCTGTGGACCCTGATGATGCTCTCAGATTATGTTGACCTGTCTGCAAATGAACTGCAGGTCATCAATATCTACATCTACCCTTTTGCACACTGGCTGGCCTTCTGCAACAGCAGCGTCAACCCCATCATTTATGGTTTCTTCAATGAAAATTTTCGTCGTGGTTTCCAAGATGCTTTTCACCTCCAGCTCTGCCAAAAAAGAGCAAAGTCCAAGGAAGTCTACACTCTGAGAGCTAAAAACACTGTGGTCATCAACACATCTCATCTGTCAGCACAGGAATCAACAGTTAAAAACCCACACGAGGAAACTGTGCTTTGTAGGATAAGTGCTGAAAAGCCCTTACAGGAATTAATGATGGAAGAATTAGGAGAAATTACCAGTAGCAATGAGATGTAAAAAGAGCTGGTGTGATGATTTTAACTCTGCTGTGTGATATATATTGAAATATTGTTGATGTCTATGGCTTCGTTCTTTAGTTCTTTCTATGAATGTTAGAAACCCTCTCTGAAAAAAAGTCAACAAAATGAACC
[0377] SEQ ID NO:2
[0378] rs133218364SNP
[0379] 原始来源
[0380] 从dbSNP(版本137)导入的变体(包括SNP和indel)
[0381] 等位基因
[0382] 参考/替代:T/C|模糊代码:Y
[0383] 位置
[0384] 染色体20:33640072(前向链)
[0385] 同义密码子
[0386] 目前在数据库中没有
[0387] HGVS名称
[0388] 该变体具有2个HGVS名称-点击plus显示
[0389]
[0390] 侧翼序列
[0391] 以下序列来自变体位置侧翼的参考基因组。变体以粗体下划线(Y)示出。Y位置可以是T/C。
[0392] 相邻变体以高亮显示的字母和模糊代码(R和K)示出。R是G/A变体;K是G/T变体。
[0393] TAGATTGGGAGGACTGGGGCTGGCATGGCTTGGGCTGAGTGGATTTGGATGGCGAACTTT
[0394] CAGCTCGGGGG CCTGGTGCTGAGTGGGCTTGGTTTGAGTGGGTTTGGGTTGAAAGGGCA
[0395] CAGGTTGGGAGGGTTTGTGCTGGGACTGTTTGACCTGGGGTGACTTGTGCTGATTAGGTC
[0396] TGAATTGAGAGCTGGGCAAATACATGCTGTAGGACATAGGATGGAATCCCATTTGGAAAG
[0397] ATGGATTTGAAGGCCCACCTTGTGTCTTCAGCTTAGCTCCTTGCTGAGGGGCAGTCCTTC
[0398] TTGGTTTTTGTGTGGCTCCTGCTGCTTGAAAGGCTTGATGATGAGGATTTTCAATATGGG
[0399] GTTTTGTTCTCATGGATGTTCTCACTGTCTCTGTTGGCTT GTTCCCCTGGCACTGACTT
[0400] GCCCAGGCTTCCCAACTGCTCCTCCTGGCCATGAACCCAGGGAATGGAGGTGACCTACCT
[0401] GGGAGTCCTCTTTCCCAGACCTTTCAAGGGTTCCTATTGTCTGTGGTCTCTGAGGCCAGG
[0402] CCGGTATATGCTGAGACATGGGTCTTGGTGGTCTCCCAAAAGTTCTACCCATGTGATGTC
[0403] TCCAAGGAGTTCCTGAAAATCTCATAAATGTTTCACCTGAATAAAATCTCTGGGGCTGGA
[0404] AATATTGAATTCCAAAACGTTTGCCTGGACTATGTGCCCTTGTATTCTGAAAGGGCAAAG
[0405] GATGGAACCTCTTAGGCCTCTGCTGTAACCAGAAGC GGAGCCCATAGCCCAAGGGGCTT
[0406] TCAAAGAAACATGGTTAAAGT
[0407] SEQ ID NO:3
[0408] rs133596506SNP
[0409] 原始来源
[0410] 从dbSNP(版本137)导入的变体(包括SNP和indel)
[0411] 等位基因
[0412] 参考/置换:T/C|模糊代码:Y
[0413] 位置
[0414] 染色体20:35969994(前向链)
[0415] 证据状态
[0416]
[0417] 同义密码子
[0418] 目前在数据库中没有
[0419] HGVS名称
[0420] 20:g.35969994T>C
[0421]
[0422] 侧翼序列
[0423] 以下序列来自变体位置侧翼的参考基因组。变体以粗体下划线(Y)示出。Y位置可以是T/C。
[0424] 相邻变体以高亮显示的字母和模糊代码(Y、R、S)示出。加下划线的TC是TC/--indel变体;R是G/A变体;S是G/C变体。
[0425] CCTTATTAACTGCGTATTGCATGGACTAGCATCYGTATACAATTGAAGTCTTCAGTGTGC
[0426] TAAACCTGTAGGAGCCTGGGTTTGACATTGTGGCCCAAATATCTGAATAGTTGGGTGTTT
[0427] ATGTGCTTCAGTGATAGAGGTGCTCCATCCCTGCAGTTTACACAGAGTGGCARCGATTCC
[0428] CAGAAAAATTTACAGGCAGGAGYTTCAGCCTCATTTTCCATACCAGCATTGCTTTCACGG
[0429] CTCATGGATCTGAAGGATTGCATTGAGAACATCTAGTCCTATTGCACTCTCAGAAACTGT
[0430] GGGAAAAGTCATATTCTTAAACCTTCATGCAACTTGTATTCTTGTTGGAAATTAGTCCTG
[0431] TGATTTCTTAGTTGTCTTCATACTGGCCATATTTAAAGAA ATCACAGTCCTTTTTTGTA
[0432] CTTGAATAATTAGATGTAGTTTAGTGAAGGAGACATGTGAATGTTTTCTTCCAAAAGGAA
[0433] TTTGGAATCAGTTTTAACGAGTTTGAAATAAAAGTGCTCCCTAACCTGTTAATATGCAGA
[0434] AAATATTATCTCAAATTTTTCTACTGCTGAGGCACATAATCTGATAAAACTTTTTTTTTT
[0435] TTTCTTCTGTTTAAGGTAGTTTTTACTGTTTTCTGTTCTGAACCATGTTAAAATTTGTAT
[0436] ATCTTTTATAACATASATTTCCCCCCTTATTTTGAAAGTATAAAATTGGGCATCTCAAAA
[0437] GTCAAATGTGGGATCATTAGTTAATCACTAAGACTAGGCACATAATGGAAATTCAGTCAG
[0438] GTTTTTTATTGACTGAGTCCC
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈