本发明依靠识别癌症患者,特别是乳腺癌、子宫癌或睾丸癌患者 中所表达的基因。在取自患者的样本中识别出该基因(或其表达产物) 说明患者存在癌症或者有患癌症的风险。
本发明进一步涉及可用于癌症的检测、诊断、监测、预测、
预防、 成像、治疗或确定癌症诱因的
试剂,如多肽序列。
本发明特别适于检测子宫癌、睾丸癌或乳腺癌,尤其是ERα-阳性 肿瘤。
进行诊断的方法可包括从试样中的mRNA合成cDNA,扩增cDNA 上的相应于该基因或其片段的适当的部分,并检测扩增产物作为该组 织中存在该疾病的标志,或者检测包含基因序列的mRNA的翻译产物 作为存在该疾病的标志。
可用试剂包括多肽或其片段,所述多肽或其片段可用于诊断方法 (如RT-PCR、PCR或杂交检测)中,所述检测对象可为从活检组织、 血液或其他试样中提取的mRNA;或者作为该mRNA翻译产物的蛋白 质;或者针对这些
蛋白质的抗体。这些试验还包括根据体内可能的翻 译后修饰检测基因产物(蛋白)的方法,所述翻译后修饰包括与诸如 辅因子、
抑制剂、激活剂和形成亚基
复合体的其他蛋白质等分子相互 作用。
癌症相关基因包含于如SEQ ID NO.1所示的多核苷酸序列中。推 测的编码区如SEQ ID NO.2所示。该基因的表达产物被SEQ ID NO.3 识别。识别该基因或其表达产物可利用已知的用于检测或鉴定多核苷 酸或多肽的技术进行。例如,从患者中分离的遗传物质可使用可与靶 基因特异性杂交的短寡核苷酸探测。寡核苷酸探针可被可检测地标记, 例如使用
荧光团,以便探针一旦与靶基因杂交即可被检测。或者,该 基因或其部分,可使用
聚合酶链反应扩增,仍使用标记的寡核苷酸识 别扩增产物。
结合该基因,或相关蛋白或抗体的诊断方法包括但不限于:
聚合酶链反应(PCR)
反转录PCR(RT-PCR)
实时PCR
原位杂交
DNA斑点印迹
免疫组织化学
核糖核酸酶保护测定
cDNA阵列技术
ELISA
排布于固体支持物如玻璃或陶瓷上、可用于结合研究的蛋白、抗 原或抗体阵列。
小干扰RNA功能测定。
以上所有技术均为本领域技术人员所公知。
另一检测方法是使用本领域中被称为“分子信标(Molecular beacon)”的技术。分子信标是被设计成用来检测和定量靶核酸的寡核 苷酸。该寡核苷酸通常包括自杂交部分,在缺少靶核酸时可形成茎环 结构。荧光部分和猝灭剂部分附着于寡核苷酸的每一端,当寡核苷酸 处于茎环取向时两者的
位置相邻。在这种取向时荧光被猝灭剂有效阻 止。寡核苷酸的环部分与特异性靶核酸互补,如果靶标存在,与靶标 的杂交可破坏茎环取向,使荧光素与猝灭剂分开,导致可检测荧光的 增加。使用分子信标法检测基因序列公开于美国
专利6548254。
本发明还涉及一种分离的多核苷酸,包括SEQ ID NO.1或SEQ ID NO.2的序列,或其互补序列,或者它们的包括至少15个连续核苷酸, 优选30个核苷酸,更优选至少50个核苷酸的片段。与以上限定的多 核苷酸杂交的多核苷酸,也在本发明的范围之中。杂交通常在严格条 件下进行。严格的杂交条件为技术人员所熟知,选择此条件是为了减 少非互补杂交的可能性。适当条件的实例公开于Nucleic Acid Hybridisation,A Practical Approach(B.D.Hames and S.J.Higgins, editors IRL Press,1985)。更具体地说,严格的杂交条件包括在42℃下, 在包括下列成分的溶液中过夜培育:50%甲酰胺、5×SSC(150mM NaCl、15mM
柠檬酸三钠)、50mM
磷酸钠(ph7.6)、5×Denhardt 溶液、10%
硫酸葡聚糖和20μl/ml变性的、剪切过的蛙鱼精子DNA, 随后在65℃下用0.1×SSC洗涤。
识别该基因使得可以开发新疗法,其中该基因作为治疗分子的靶 标。例如,现在有很多已知的分子已经用于开发基因疗法,以靶向和 阻止特定基因的表达。一种特殊分子是小干扰RNA(siRNA),它通过 刺激靶mRNA的降解来抑制特定靶蛋白的表达。还知道另一种合成寡 核苷酸,它可结合所研究的基因(或其调控元件)以改变表达。与DNA 相连的肽核酸(PNA)(PNA-DNA嵌合体)也显示了强诱饵(decoy) 活性,可改变所研究基因的表达。这些分子可用于结合基因或其上游 调控元件,阻止表达。
本发明还涉及所研究基因的分离的多肽产物。本发明的分离多肽 包括SEQ ID NO.3的序列,或者它的至少10个连续氨基酸,优选至 少15个连续氨基酸,更优选至少20个氨基酸的片段。这些多肽可用 于制备抗体,或者开发可在体内与蛋白结合以抑制其活性的蛋白结合 分子。
本发明还包括针对本发明多肽的抗体。抗体对于多肽通常具有至 少10-6M,更优选10-9M,最优选至少10-11M的亲和力。抗体可为任 何适当类型,包括单克隆抗体或多克隆抗体。还包括可测定试样中存 在多肽抗原的检测
试剂盒。在一个实施方案中,检测试剂盒包括装有 抗体的容器,所述抗体与抗原特异性结合,其中抗原包括由本发明的 基因编码的至少一个表位。这些试剂盒可进一步包括带有用于收集试 样如血液、唾液、尿液和
粪便等的工具的容器。这些工具包括用于收 集和稳定血液的刺血针、吸收纸或布,收集和稳定唾液的拭子,收集 和稳定尿液和粪便样本的杯子。抗体可附着于固相上,例如玻璃或陶 瓷表面。
还可以检测可与抗原特异性结合的抗体是否存在于怀疑含有这些 抗体的试样中。该检测方法包括将试样与含有至少一个该基因表位的 多核苷酸
接触。接触进行的时间和条件应足以使抗原/抗体复合物形 成。该方法需要进一步检测复合物,该复合物中包含所述多肽。该多 肽复合物可通过重组或合成制备,或者从天然来源纯化。
在本发明一个单独的实施方案中,针对抗原的抗体或其片段可用 于检测患者中抗原的成像
定位,以用于检测或诊断疾病或病情的目的。 这些抗体可为单克隆抗体或多克隆抗体,或者通过分子生物学技术制 备,并且可使用多种可检测试剂标记,包括但不限于
放射性同位素。
在进一步的实施方案中,抗体或其片段,不管是单克隆抗体或是 多克隆抗体或者通过分子生物学技术制备的抗体,可用作治疗通过本 发明基因的表达所鉴定的疾病的治疗剂。抗体可以非衍生形式使用, 或者它可使用细胞毒素剂如放射性同位素、酶、毒素、药物、前药等 衍生。
术语“抗体”广义上指任何免疫结合试剂,如IgG、IgM、IgA、 IgD和IgE。抗体还指具有抗原结合区的任何抗体样分子,包括但不限 于抗体片段如单区抗体(single domain antibody,DABS)、Fv、scFv 等。制备和利用各种基于抗体的构建体和片段的技术已为本领域所公 知。
如果需要,本发明的癌症筛选方法可与其他方法容易地结合,以 提供更加准确的诊断或预后标志,因而可提供多标记测试。
以下
实施例参照附图用来说明本发明的内容。
实施例
利用非同位素差异显示(DDRT-PCR),从来自乳腺癌患者匹配临 床样本的cDNA群中分离到许多差异表达基因片段。这些片段之一(本 文称为DD11)显示出在来自许多供体的乳房肿瘤组织样本中显著上 调。本文将详细叙述这个新分子标记的表达曲线,其全长以及相应推 定的蛋白序列。
材料和方法
在来自相同供体的正常乳房组织和肿瘤组织
配对之间进行差异基 因表达。在完全满足道德要求和征得患者同意的前提下,从英国彼得 伯勒Pathlore获得组织样本。在手术摘除肿瘤之后,收集一个肿瘤组 织样本,同时收集与之相邻的、一起切下的正常组织。分别利用Dynal dT18标记的Dynabeads和SuperscriptII反转录法提取信使RNA并随 后合成cDNA。采用差异显示反转录PCR(DDRT-PCR)观察这些匹 配样本基因表达曲线的差异,将显示上调或下调的单基因转录物分离 出来并进一步研究。
差异显示反转录PCR(DDRT-PCR)首先由Liang和Pardee(1992) 记载,它使用来自两个或更多生物样本的mRNA作为模板,通过反转 录使用3个可能的锚定引物之一进行代表性cDNA合成。3个亚群使 用相应的锚定引物与80个随机13体引物之一一起分别进行PCR扩 增。这个引物组合的数量据估计可代表mRNA群中96%的表达基因 (Sturtevant,2000)。对每一套引物,这种对群的细分导致在真核细胞 中表达的估计达12,000~15,000种mRNA,通过第二链cDNA合成的 末端减少到100~150种转录物。这有助于在聚丙烯酰胺凝胶上进行平 行
电泳分离和匹配成套引物的准确显影,导致可以识别在一种组织样 本中表达而不在另一种组织样本中表达的基因片段。
切除并重新扩增所研究的片段之后通过反向DNA斑点印迹除去 假阳性。这需要将每一重新扩增的片段点样至两张尼龙膜上(Hybond N+,Amersham Pharmacia Biotech),并将其与所述片段的供体的肿瘤 或正常组织cDNA群杂交。然后将确定为差异表达的片段直接测序, 即不经克隆,随后检索网络
数据库以确定每条基因是否为新发现的。 无法匹配已知基因的片段被看作有可能代表它们的来源——乳腺癌的 新标记。各转录物的进一步筛选利用来自多个乳房肿瘤供体的一套匹 配cDNA群,通过半定量RT-PCR或实时PCR进行。在所有情况下, β-肌动蛋白用作组成型参照基因,以校准cDNA模板并在PCR过程中 作为内部阳性对照。通过在校准的模板上使用基因特异性成套引物来 表达每个假定的新标记基因。新基因片段的全长转录物,包括开放读 码框(编码该蛋白的那段基因)随后使用被称为5′RACE(cDNA末 端快速扩增)的复合物法合成,该方法包含基因特异性延伸和扩增, 可由测序验证。
针对来自非乳房组织,包括脑、心脏、淋巴细胞、脾、肾、睾丸 和肌肉(来自Origene)的cDNA群,使用来自各新标记的基因特异 性引物来测定组织特异性。使用来自更广泛的一组22种人类组织类型 的cDNA群进一步测定DD11分子标记。它们如下所示:
肾上腺 由62供体汇集
骨髓 由7供体汇集
脑,小脑 由24供体汇集
脑,全部 由1供体汇集
结肠* 由1供体汇集
胎儿脑 由59供体汇集
胎儿肝脏 由63供体汇集
心脏 由1供体汇集
肾脏 由1供体汇集
肝脏 由1供体汇集
肺 由1供体汇集
胎盘 由7供体汇集
前列腺 由47供体汇集
唾液腺 由24供体汇集
骨骼肌 由2供体汇集
小肠* 由1供体汇集
脾 由14供体汇集
睾丸 由19供体汇集
胸腺 由9供体汇集
甲状腺 由65供体汇集
气管 由1供体汇集
子宫 由10供体汇集
特别说明的是这些样本多数是人总RNA组II(Clontech)的一部 分,但是标有星号的两个样本是以组织
块(tissue chunk)形式获自 Pathlore(Peterborough Hospital Tissue Bank),并在Randox Laboratories Ltd处理。
另外还在道德允许的人类肿瘤样本范围内进行实验,实验方法如 获自Pathlore的所述。代表来自卵巢、睾丸、胃、肝脏、肺、膀胱、 结肠和胰腺的肿瘤的cDNA通过实时PCR针对β-肌动蛋白和DD11 进行实验。
与新标记表达分析一起,对每一乳房组织配对还进行分子特征分 析。这需要针对每种组织cDNA在半定量RT-PCR中使用对多种已公 开的乳腺癌分子标记具有特异性的成套引物。测定各分子标记之间的 关系,对每一样本列成表格用作参照,新标记可与之相比。这样做的 目标是对肿瘤类型进行细分,以使新型标记与这些亚类相联系,大大 提高诊断标记的效力。
结果和讨论
来自乳腺癌供体匹配组织cDNA的一个称为DD11的基因片段, 使用差异显示观察到在肿瘤cDNA群中与相应正常组织cDNA相比显 著上调。该产物通过反向DNA斑点印迹证实为差异表达。序列分析后 检索数据库证实DD11分别与EMBL和SWISSPROT数据库中的已知 基因或蛋白均不同源,因此看作可能为新标记。然而它在除去poly-A 尾巴之后,与来自人类基因组8号
染色体的克隆(RP11-875011)(检 索号AC107959)100%同源。
该片段使用来自其他患者捐献的多个匹配乳房肿瘤组织的cDNA 群进一步筛选。在筛选的供体样本中,9个中有6个显示表达显著增 加,证实了DD11为存在乳房肿瘤的推定的分子标记(图1)。该分析 结果通过对所有当前可用的匹配乳房组织样本进行分子特征分析可证 实,如下:
肿瘤中增长 10 52.6%
正常情况下增长 1 5.3%
无可辨别差异 7 36.8%
无明显表达 1 5.3%
总计 19 100%
为了帮助进一步分析,采用5′-RACE将该片段延长至包括该基因 的全部开放读码框(ORF),加上任何5′非编码序列。使用该技术, 获得了推测的513个核苷酸的全长产物(SEQ ID NO.1),随后进行数 据库检索证明前述的与人类8号染色体的同源性为在全长序列 (513/513)上的100%同源性。从该序列中,产生了所有6氨基酸的 读码框并且在+2框中发现了推测的小ORF(SEQ ID NO.2),包含47 个氨基酸,包括终止密码子(SEQ ID NO.3)。这个小蛋白与SWALL 数据库中的任何已知蛋白均不显示高同源性,所以被认为是新的。
为了测定器官特异性,除了来自乳腺癌供体的成对cDNA外,还 对来自8种非乳房人体组织的cDNA群针对DD11引物进行了测定。 还利用来自组成型持家基因β-肌动蛋白的引物对相同的样本进行测 定,作为阳性对照并校准半定量PCR分析的模板。β-肌动蛋白产物 在所研究的所有cDNA群中均强烈扩增,而DD11产物只在乳房肿瘤 样本中检测到(图2)。这为该基因可能是存在乳房肿瘤的极强分子标 记提供了另一个证据。
该分子标记通过常规和实时PCR分析,利用来自一组22种人体 组织类型的cDNA群进一步测试。在所有测试之中,使用Opticon II 实时热循环仪(MJ Research),只在来自胎盘和睾丸的样本检测到 DD11。另外,还对道德上允许的人体肿瘤样本范围进行实验,方法如 获自Pathlore的所述,以确定该标记是乳房肿瘤特异性还是特异性较 差的肿瘤标记。代表来自卵巢、睾丸、结肠、胃、肝脏、肺、膀胱和 胰腺的肿瘤的cDNA针对β-肌动蛋白和DD11进行实验。它们之中, DD11只在来自睾丸肿瘤的cDNA中检测到有显著水平。这些PCR扩 增所得产物通过直接测序确定为DD11。
使用相结合的一组22种正常人体组织cDNA和8种肿瘤cDNA群, 在标准热循环仪上进行常规PCR扩增,证实DD11对非常有限的组织 类型具有特异性。在实时PCR测试中,睾丸cDNA群表达DD11,这 和睾丸肿瘤一样。显示出显著表达该标记的唯一一种其他群来自子宫 样本。胎盘样本显示出低水平表达,但这与睾丸和子宫样本根本不在 一个级别。还在其他一些样本中发现了低水平产物,但这些可忽略不 计。这说明在所有测试样本中,DD11只在受生殖
激素影响的组织中强 烈表达。具体地说,这些组织来自乳房和相关肿瘤、睾丸和相关肿瘤 以及子宫。胎盘组织也更小程度地表达这种标记。
DD11与最常用作“标准”乳腺癌标记的一些标记,如雌二醇受体 (ERα)和人表皮生长因子受体(c-ErbB-2)相比,是极为有利的。 这在以下两方面都是显而易见的:一是对所有匹配乳腺癌组织样本进 行分子特征分析,其中在许多情况下来自相同患者的两个样本有相似 的表达;二是使用针对一组来自人体正常和肿瘤组织的内部30个 cDNA群的靶特异性引物。
参考文献:
DeRisi,J.L.,lyer,V.R.and Brown,P.O.1997.Exploring the metabolic and genetic control of gene expression on a genomic scale.Science.278:680- 686.
Liang,P.and Pardee,A.B.1992.Differential display of eukaryotic messenger RNA by means of the polymerase readion.Science.257:967-971.
Pritzker,K.P.2002 Cancer biomarkers:easier said than done.Clin. Chem.2002 Aug;48(8):1147-50.
Salodof MacNeil.2001.From genes to proteins:The FLEXgene consortium.HMS Beagle.112:on-line journal.
Sorlie T,Perou CM,Tibshirani R,Aas T,Geisler S,Johnsen H,Hastie T, Eisen MB,van de Rijn M,Jeffrey SS,Thorsen T,Quist H,Matese JC,Brown PO, Botstein D,Eystein Lonning P,Borresen-Dale AL.2001.Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implicatiors.Proc Natl Acad Sci USA.Sep 11;98(19):10869-74.
Srinivas PR,Verma M,Zhao Y,Srivastava S.2002.Proteomics for cancer biomarker discovery.Clin Chem.Aug;48(8):1160-9.
Sturtevant,J.Applications of differential-display reverse transcrription- PCR to molecular pathogenesis and medical mycology.Clin Microbiol Rev.2000 Jul;13(3):408-27.
Yousef et al.,2002 Yousef GM,Scorilas A,Kyriakopoulou LG,Rendl L, Diamandis M,Ponzone R,Biglia N,Giai M,Roagna R,Sismondi P,Diamandis EP.Human kallikrein gene 5(KLK5)expression by quantitative PCR:an independent indicator of poor prognosis in breast cancer.Clin Chem.2002 Aug;48(8):1241-50.
Zong,Q.,Schummer,M.,Hood,L.and Morris,D.R.1999.Messenger RNA translation state:the second dimension of high-throughput expression screening.Proc.Natl.Acad.Sci.96:10632-10636.
序列表<110>兰多克斯实验室有限公司
<120>
乳腺癌风险诊断<130>JWJ01047WO
<150>0320648.9
<151>2003-09-03
<160>3
<170>PatentIn version 3.1
<210>1
<211>513
<212>DNA
<213>人(Homo sapiens)
<400>1
tttatggtca taagcttaga aaatcctttg cccaacataa aataagagaa ctctaatttc 60
ttagggagat ttttattaaa tgattagatt tgtagcatat agttgtataa aataagatga 120
actctaattt cttagggagg ttttattaaa tgattagatt tgtagcatat catcgtgtaa 180
agtacatgga cattattttt gatatagaaa gtgtagtgtt ccccttcatt gttctgagtt 240
actctcatct gtccaacccc agcgagccac tgattattcc ctttctctga actttgtggt 300
gtttatggaa gcttcattcc gtagcacgaa ggcgtcaatc attaatctcg ggtgattagt 360
cctcaggcat ctccctgctc tgagctgagg ggtgtggtag tgttgaaagt tgcagtgctc 420
tgatcacgtg gttggttcga ctggtaactg gtccctctct ggcaagagcc acctcatcag 480
tatcaactca ggaatgctgg aaatcatttt atg 513
<210>2
<211>138
<212>DNA
<213>人(Homo sapiens)
<220>
<221>CDS
<222>(1)..(138)
<223>
<400>2
atg att aga ttt gta gca tat cat cgt gta aag tac atg gac att att 48
Met Ile Arg Phe Val Ala Tyr His Arg Val Lys Tyr Met Asp Ile Ile
1 5 10 15
ttt gat ata gaa agt gta gtg ttc ccc ttc att gtt ctg agt tac tct 96
Phe Asp Ile Glu Ser Val Val Phe Pro Phe Ile Val Leu Ser Tyr Ser
20 25 30
cat ctg tcc aac ccc agc gag cca ctg att att ccc ttt ctc 138
His Leu Ser Asn Pro Ser Glu Pro Leu Ile Ile Pro Phe Leu
35 40 45
<210>3
<211>46
<212>PRT
<213>人(Homo sapiens)
<400>3
Met Ile Arg Phe Val Ala Tyr His Arg Val Lys Tyr Met Asp Ile Ile
1 5 10 15
Phe Asp Ile Glu Ser Val Val Phe Pro Phe Ile Val Leu Ser Tyr Ser
20 25 30
His Leu Ser Asn Pro Ser Glu Pro Leu Ile Ile Pro Phe Leu
35 40 45