首页 / 专利库 / 病理 / 乳腺癌 / 乳腺癌预后

乳腺癌预后

阅读:554发布:2020-05-11

专利汇可以提供乳腺癌预后专利检索,专利查询,专利分析的服务。并且通过分析一组基因的表达进行了提供 乳腺癌 预后 的方法。包括了在各种介质例如微阵列中的基因表达分布型,还包括了含有它们的 试剂 盒 。,下面是乳腺癌预后专利的具体信息内容。

1.用于检测基因组合的分离的核酸序列、它们的互补物、或其部分的材料在制备用于评定乳腺癌状态的试剂盒中的用途,所述基因选自由编码mRNA的那些构成的组,所述mRNA:
i.相应于SEQ ID NO:1-111;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:1-111的探针集标识码构成的组。
2.用于检测基因组合的分离的核酸序列、它们的互补物、或其部分的材料在制备用于给乳腺癌患者分期的试剂盒中的用途,所述基因选自由编码mRNA的那些构成的组,所述mRNA:
i.相应于SEQ ID NO:1-111;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:1-111的探针集标识码构成的组。
3.权利要求2的用途,其中所述分期相应于TNM系统的分类。
4.权利要求2的用途,其中所述分期相应于具有类似基因表达分布型的患者。
5.用于检测基因组合的分离的核酸序列、它们的互补物、或其部分的材料在制备用于确定乳腺癌患者治疗方案的试剂盒中的用途,所述基因选自由编码mRNA的那些构成的组,所述mRNA:
i.相应于SEQ ID NO:1-111;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:1-111的探针集标识码构成的组。
6.权利要求1、2或5的用途,其中所述SEQ ID NO是1-35。
7.权利要求1、2或5的用途,其中所述SEQ ID NO是36-95。
8.权利要求7的用途,其中所述试剂盒用于为ER阳性患者提供预后
9.权利要求1、2或5的用途,其中所述SEQ ID NO是96-111。
10.权利要求9的用途,其中所述试剂盒用于为ER阴性患者提供预后。
11.权利要求1、2或5的用途,其中所述SEQ ID NO是36-111。
12.权利要求1、2或5的用途,其中所述试剂盒进一步包含用于检测编码mRNA的至少一个基因的分离的核酸序列、它们的互补物、或其部分的材料,所述mRNA:
i.相应于SEQ ID NO:112-132;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQID NO:112-132的探针集标识码构成的组。
13.权利要求1、2或5的用途,其中所述试剂盒进一步包含用于检测在样品中组成性表达的至少一个基因的分离的核酸序列、它们的互补物、或其部分的材料。
14.权利要求1、2或5的用途,其中所述试剂盒进一步包含用于确定样品的雌激素受体(ER)状态的材料。
15.一种组合物,包含至少一个探针集,所述探针集选自以下构成的组:SEQ ID NO:
1-111;或表10中描述相应于SEQ ID NO:1-111的探针集标识码。
16.用于进行分析以确定生物样品中的乳腺癌预后的试剂盒,包含:用于检测基因组合的分离的核酸序列、它们的互补物、或其部分的材料,所述基因选自由编码mRNA的那些构成的组,所述mRNA:
i.相应于SEQ ID NO:1-111;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQID NO:1-111的探针集标识码构成的组。
17.权利要求16的试剂盒,其中所述SEQ ID NO是36-95。
18.权利要求16的试剂盒,其中所述SEQ ID NO是96-111。
19.权利要求16的试剂盒,其中所述SEQ ID NO是36-111。
20.权利要求16的试剂盒,进一步包含用于进行微阵列分析的试剂。
21.权利要求16的试剂盒,进一步包含介质,通过所述介质分析所述核酸序列、它们的互补物或其部分。
22.用于评定乳腺癌状态的试剂盒,包含:用于检测基因组合的分离的核酸序列、它们的互补物、或其部分的材料,所述基因选自由编码mRNA的那些构成的组,所述mRNA:
i.相应于SEQ ID NO:1-111;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQID NO:1-111的探针集标识码构成的组。
23.权利要求22的试剂盒,其中所述SEQ ID NO是36-95。
24.权利要求22的试剂盒,其中所述SEQ ID NO是96-111。
25.权利要求22的试剂盒,其中所述SEQ ID NO是36-111。
26.权利要求22的试剂盒,进一步包含用于进行微阵列分析的试剂。
27.权利要求22的试剂盒,进一步包含介质,通过所述介质分析所述核酸序列、它们的互补物或其部分。
28.用于评定乳腺癌状态、给乳腺癌患者分期和确定乳腺癌患者治疗方案微阵列或基因芯片,包括基因组合的分离的核酸序列、它们的互补物或其部分,所述基因选自由编码mRNA的那些构成的组,所述mRNA:
i.相应于SEQ ID NO:1-111;或
ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQID NO:1-111的探针集标识码构成的组
其中所述组合足以表征生物样品中的乳腺癌状态或复发险。
29.权利要求28的微阵列或基因芯片,其中所述测量或表征是至少1.5倍过量或减量表达。
30.权利要求28的微阵列或基因芯片,其中所述测量提供了统计学上显著的p值过量或减量表达。
31.权利要求28的微阵列或基因芯片,其中所述p值小于0.05。
32.权利要求28的微阵列或基因芯片,包含cDNA阵列或寡核苷酸阵列。
33.权利要求28的微阵列或基因芯片,进一步包含一个或多个内部对照试剂。

说明书全文

乳腺癌预后

发明领域

[0001] 本发明涉及根据患者生物样品的基因表达分布型的乳腺癌患者预后。

背景技术

[0002] 约60-70%的淋巴结阴性(LNN)乳腺癌患者通过单独的局部或区域治疗被治愈。Lancet(1998a);以及Lancet(1998b)。已经发展出指导原则来帮助临床医师选择应接受辅
助治疗的患者。最广泛使用的建议是St.Gallen指标(Goldhirsch et al.(2003))和国立
卫生研究院(NIH)的公认指标。Eifel et al.(2001)。这些指导原则指出85%-90%的
LNN患者是辅助性全身治疗的候选者。
[0003] 需要具体地鉴定患者疾病复发的险以确保她接受合适的治疗。当前,只有少数诊断工具能鉴定有风险(at-risk)患者。已经使用基因表达模式来将乳腺肿瘤分成
不同的临床上的相关亚型。Perou et al.(2000);S rlie et al.(2001);S rlie et
al.(2003);Gruvberger et al.(2001);van′t Veer et al.(2002);van de Vijver et
al.(2002);Ahr etal.(2002);Huang et al.(2003);Sotiriou et al.(2003);Woelfle et al.(2003);Ma et al.(2003);Ramaswamy et al.(2003);Chang et al.(2003);Sotiriou et al.(2003);和Hedenfalk et al.(2001)。
[0004] 当前在LNN患者中,在外科手术切除原发肿瘤之后应用辅助治疗、以及应用何种类型(内分泌的和/或化疗)的决定,主要取决于患者的年龄、绝经状态、肿瘤大小、肿瘤级
别和甾类激素受体状态。在指导原则例如St.Gallen指标和国立卫生研究院(NIH)公认指
标中这些因素都被考虑了。根据这些指标,超过85%-90%的LNN患者将成为接受辅助性
全身治疗的候选者。为了指导治疗选项的选择,明显地需要鉴定更好的预后因素。
[0005] 发明概述
[0006] 认识到疾病发展的复杂性,我们在此报道了基因表达的全面的基因组规模的评定来鉴定可广泛应用的预后标记物。Ntzani et al.(2003);和Wang et al.(2004)。
[0007] 本发明包括评定乳腺癌状态的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:
1-111;或由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:1-111的psid
构成的组,其中所述基因表达水平高于或低于预定的截断水平是乳腺癌状态的指示。
[0008] 本发明包括为乳腺癌分期(staging breast cancer)的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所
述mRNA相应于SEQ ID NO:1-111;或由探针集识别,所述探针集选自由表10中描述的相应
于SEQID NO:1-111的psid构成的组,其中所述基因表达水平高于或低于预定的截断水平
是乳腺癌分期(stage)的指示。
[0009] 本发明包括确定乳腺癌患者治疗方案的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于
SEQ ID NO:1-111;或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:
1-111的psid,其中所述基因表达水平高于或低于预定的截断水平是复发风险的充分指
示,以允许医师确定推荐的治疗的程度和类型以防止复发。
[0010] 本发明包括治疗乳腺癌患者的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:
1-111;或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:1-111的psid,
其中所述基因表达水平高于或低于预定的截断水平是表明复发的高风险;如果她们是高风
险患者则用辅助治疗来治疗患者。
[0011] 本发明包括交叉验证乳腺癌患者的预后基因表达分布型的方法,通过从统计学上显著数量的患者生物样品获得基因表达数据;使样品顺序随机化;撇开约10%-50%的样
品的数据;对余下的样品,对所有变量计算感兴趣的因数并选择满足p值截断(p)的变量;
使用前向搜索来选择符合预测模型的变量,评估训练误差(training error)直到它命中预
定的误差率;对留出的10-50%的样品测试预测模型;除去一套新的样品重复步骤c-g;继
续步骤c)-g)直到已经测试了100%的样品并记录了分类表现。
[0012] 本发明包括独立验证乳腺患者的预后基因表达分布型的方法,通过以下方式进行:从统计学上显著数量的患者生物样品获得基因表达数据;使基因表达数据中的来源变
异性标准化;对预先选择的所有变量计算感兴趣的因数;对样品测试预测模型并记录分类
表现。
[0013] 本发明包括产生复发危险分值(Relapse Hazard Score)以允许进行乳腺癌患者预后的方法,通过从统计学上显著数量的患者生物样品获得基因表达数据;对该数据应用
单变量Cox’s回归分析来获得选定的基因;对具有标准Cox’s系数的选定基因应用加权表
达水平来获得可以用作复发危险分值的预测模型来进行。
[0014] 本发明包括产生乳腺癌预后患者报告的方法,通过以下来进行:从患者获得生物样品;测量样品的基因表达;对步骤b的结果应用复发危险分值;使用步骤c中获得的结果
来产生报告,从而产生患者报告。
[0015] 本发明包括至少一个探针集的组合物;所述探针集选自:SEQ IDNO:1-111;或表10中描述的相应于SEQ ID NO:1-111的psid。
[0016] 本发明包括用于进行分析以确定生物样品中的乳腺癌预后的试剂盒,含有:用于检测基因组合的分离的核酸序列、它们的互补物或其部分的材料,所述基因选自编码mRNA
的那些,所述mRNA相应于SEQ ID NO:1-111;或由探针集识别,所述探针集选自表10中描
述的相应于SEQ ID NO:1-111的psid。
[0017] 本发明包括用于评定乳腺癌状态的物品,含有:用于检测基因组合的分离的核酸序列、它们的互补物或其部分的材料,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ
ID NO:1-111;或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:1-111的
psid。
[0018] 本发明包括诊断/预后档案(portfolio),含有:基因组合的分离的核酸序列、它们的互补物或其部分,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:1-111;
或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:1-111的psid,其中所
述组合足以表征生物样品中的乳腺癌状态或复发风险。
[0019] 附图的简要说明
[0020] 附图1描述了样品选择的分布型(profile),用于患有淋巴结阴性的(LNN)乳腺癌的286患者的基因表达数据的分析和无监督聚类分析。(A).选择用于分析的患者样品的流
程图。ER状态被用于确定患者亚组。为了选择标记物然后对每个亚组单独地分析。亚组中
的患者被分配成训练集或测试集。将从每个亚组选出的标记物组合以形成单个标志,来预
测测试集中所有患者总体上的肿瘤复发。(B)286位LNN乳腺癌患者的基因表达数据的无监
督聚类分析。左边的画面是17,819个信息基因的视图。红色表示高的相对表达;绿色表示
相对低的表达。每一列是一种样品,每一行是一种基因。右边的画面是从左侧视图鉴定的、
在两个患者亚组之间具有强烈差异表达的两个显性基因簇的放大的视图。在ER阳性亚组
中上部的基因簇具有一组282个减量调节的基因。在ER阳性亚组中底部基因簇被表示为
一组339个增量调节的基因。每个树状图底部的标记条表示由常规分析测量的患者ER状
态。
[0021] 附图2.对无远处转移(distant-metastasis-free,DMFS)和总体存活率(OS)建立76基因分布型和Kaplan-Meier分析。A.选择用于预后标志的基因。使用ROC分析从两
个训练集选择ER阳性和ER阴性组的基因标记物。60个基因来自ER阳性组,16个基因来
自ER阴性组(左),来自测试集中171位患者的分析的、76-基因标志的ROC曲线(右)。
B.171位LNN患者的验证集中的DMFS分析(左)和OS分析(右)。根据76-基因标志评
定每个患者的失败风险,通过训练集确定阈值。log rank test被用于测试差异。
[0022] 附图3.LNN患者的亚组中的DMFS和OS分析。84位绝经前患者(A)、87位绝经后患者(B)和79位具有10-20mm大小范围的肿瘤的患者(C)中的DMFS(左)和OS(右)。结
果来自验证集中的独立的患者。根据76-基因标志评定每个患者的复发风险,通过训练集
确定阈值。Log rank检验被用于测试差异。
[0023] 附图4描述了根据5121个基因的分级聚类。
[0024] 附图5是描述21个对照基因的表达水平的柱形图(表7)。
[0025] 附图6描述了数据分析工作流程。
[0026] 附图7描述了用过滤的基因集的PCA分析。
[0027] 附图8是描述用于分配患者亚组的ER状态的饼分图。通过StudentT-测验来定义LCM和大组织(bulk tissue)样品中ER阳性和ER阴性的子聚类之间差异表达的基因。
[0028] 附图9是一系列柱形图,描述了通过Gene Ontology对LCM样品中、仅在大块组织中,和对于LCM和大块组织是相同的那些样品中仅与ER相关的基因的途径分析的结果。
[0029] 附图10显示了独立的验证的结果。附图10中的流程图显示了132位患者是在四个不同的来源收集的。根据76-基因标志的表达水平对每个患者计算复发危险分值。将患
者分成良好和不良结局组。
[0030] 附图11描述了A.用于验证研究的患者和它们的肿瘤的临床和病理特征和B.验证研究中76-基因标志的ROC曲线。
[0031] 附图12描述了在验证研究中132位患者的分类结果。预测良好和不良结局组的Kaplan-Meier存活曲线和log rnak检验在图表中显示。
[0032] 附图13描述了途径分析的结果。附图13中的流程图显示了用来选择用于统计分析的样品的方法。A.将286位患者随机分成115位患者的训练集以及测试集。B.将286
位患者随机分成80%患者的训练集和20%患者的测试集。训练集被用于选择基因标记物
和构建预后标志。测试集用于进行验证。两个过程都重复10次。
[0033] 附图14描述了GO本体论分析的概要。每个柱形代表76-基因标志中显著地过度呈现的途径(p<0.05)。根据可选择标志的结果计算标准偏差。A.使用115位患者的训练
集的10个标志的结果。B.使用80%患者的训练集的10个标志的结果。
[0034] 详细说明
[0035] 本发明包括评定乳腺癌状态的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:
1-111;或由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:1-111的psid
构成的组,其中所述基因表达水平高于或低于预定的截断水平(cut-offlevel)指示乳腺
癌状态。
[0036] 本发明包括为乳腺癌分期的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:
1-111;或由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:1-111的
psid构成的组,其中所述基因表达水平高于或低于预定的截断水平指示乳腺癌分期。该方
法利用了任何本领域已知的分类法,包括TNM系统美国癌症联合委员会(American Joint
Committee on Cancerwww.cancerstaging.org),以及与相应于具有类似基因表达分布型
的患者的阶段的比较。
[0037] 本发明包括确定乳腺癌患者治疗方案的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于
SEQ ID NO:1-111;或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:
1-111的psid,其中所述基因表达水平高于或低于预定的截断水平是复发风险的充分指
示,以允许医师确定推荐的治疗的程度和类型以防止复发。
[0038] 本发明包括治疗乳腺癌患者的方法,通过从乳腺癌患者获取生物样品;和测量样品中基因的表达水平来进行,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:
1-111;或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:1-111的psid,
其中所述基因表达水平高于或低于预定的截断水平是表明复发的高风险;如果她们是高风
险患者则用辅助治疗来治疗患者。
[0039] 在任何上述方法中,SEQ ID NO可以是1-35、36-95、96-111或36-111。优选的,SEQ ID NO对于雌激素受体(ER)患者是36-95,对于ER阴性患者是96-111。
[0040] 样品可以通过本领域已知的任何方法来制备,包括大块组织制备和激光俘获显微解剖。大块组织制备物可以从活组织检查或外科样本获得。
[0041] 上述的方法可以进一步包括测量至少一个编码mRNA的基因的表达水平,所述mRNA相应于SEQ ID NO:112-132;或被探针集识别,所述探针集选自表10中描述的相应于
SEQ ID NO:112-132的psid。它们还可以包括测量在样品中组成性表达的至少一个基因的
表达水平。
[0042] 上述的方法可以进一步包括确定样品的雌激素受体(ER)状态。ER状态可以通过本领域已知的任何方法来测量,包括测量指示ER状态的至少一个基因的表达水平,测量样
品中ER的存在和免疫组织化学测量。
[0043] 上述的方法可以用于来自任何生物学来源的样品。优选的,所述样品是从原发肿瘤获得。
[0044] 上述方法优选的具有至少40%的特异性和至少90%的灵敏度。
[0045] 当基因的表达模式与指示复发患者的表达模式相比较时可以使用上述方法。所述比较可以通过本领域已知的任何方法,包括表达模式的比较通过模式识别方法来进行。模
式识别方法可以是本领域已知的任何方法,包括Cox’s比例危害分析。
[0046] 相对于良性细胞或正常组织,当预定的截断水平在样品中是至少1.5倍过量或减量表达时,可以使用上述方法。优选的,相对于良性细胞或正常组织,在具有转移性细胞的
样品中预定的截断水平至少具有统计学上显著的p值过量表达。更优选的,所述p值低于
0.05。
[0047] 当在微阵列或基因芯片上测量基因表达时可以使用上述方法。适合于在此使用的基因芯片和微阵列也包括在本发明中。所述微阵列可以是cDNA阵列或寡核苷酸阵列,可以
进一步含有一种或多种内部对照试剂。
[0048] 当对从样品提取的RNA通过聚合酶链式反应(PCR)进行核酸扩增来测定基因表达时,可以使用上述方法。所述PCR可以是逆转录聚合酶链式反应(RT-PCR)。所述RT-PCR可
以进一步含有一种或多种内部对照试剂。
[0049] 当通过测量或检测由基因编码的蛋白来检测基因表达时,可以使用上述方法。可以使用本领域已知的任何方法,包括通过特异于所述蛋白的抗体来检测和测量所述基因的
特征。适合的特征非限制性地包括DNA扩增、甲基化、突变和等位变异。
[0050] 本发明包括交叉验证乳腺癌患者的预后基因表达分布型的方法,通过下述方式来进行:从统计学上显著数量的患者生物样品获得基因表达数据;使样品顺序随机化;撇开
约10%-50%的样品的数据;对余下的样品,对所有变量计算感兴趣的因数并选择满足p值
截断(p)的变量;使用前向搜索来选择符合预测模型的变量,评估训练误差直到它命中预
定的误差率;对留出的10-50%的样品测试预测模型;除去一套新的样品重复步骤c-g;继
续步骤c)-g)直到已经测试了100%的样品并记录了分类结果。
[0051] 可以使用所述交叉验证方法,其中步骤h中获得的基因表达数据由选自编码mRNA的那些基因的基因来表示,所述mRNA:相应于SEQ ID No:3、4、10、18、37、40、42、43、45、
55、58、64、67、72-74、76、81、85-86、89、97、100-101、110-111、125 和 132-442,或 2、3、5、
12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、
66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、
107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、
182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、
238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、
288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、
368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651和
443-650;或由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:3、4、10、
18、37、40、42、43、45、55、58、64、67、72-74、76、81、85-86、89、97、100-101、110-111、125 和
32-442,或 2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、
60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、
98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、
171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、
228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、
273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、
346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、
435、436、440、651和443-650的psid构成的组。
[0052] 本发明包括独立验证乳腺患者的预后基因表达分布型(geneexpressionprofile)的方法,通过从统计学上显著数量的患者生物样品获得基因表达数据;使基因表
达数据中的来源变异性标准化;对预先选择的所有变量计算感兴趣的因数;对样品测试预
测模型并记录分类表现来进行。
[0053] 可以使用所述独立验证方法,其中步骤d.中获得的基因表达数据由选自编码mRNA的那些基因的基因来表示,所述mRNA:相应于SEQ ID NO:3、4、10、18、37、40、42、43、
45、55、58、64、67、72-74、76、81、85-86、89、97、100-101、110-111、125和 132-442,或 2、3、
5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、
66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、
107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、
182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、
238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、
288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、
368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651和
443-650;或由探针集识别,所述探针集选自由表10中描述的相应于SEQ ID NO:3、4、10、
18、37、40、42、43、45、55、58、64、67、72-74、76、81、85-86、89、97、100-101、110-111、125 和
132-442,或2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、
60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、
98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、
171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、
228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、
273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、
346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、
435、436、440、651和443-650的psid构成的组。
[0054] 本发明包括产生复发危险分值(Relapse Hazard Score)以允许乳腺癌患者预后的方法,通过从统计学上显著数量的患者生物样品获得基因表达数据;对该数据应用单变
量Cox’s回归分析来获得选定的基因;对具有标准Cox’s系数的选定基因应用加权表达水
平来获得可以用作复发危险分值的预测模型来进行。
[0055] 复发危险分值可以通过以下公式获得:
[0056]
[0057] 其中
[0058]
[0059] A和B是常数
[0060] wi是X基因+标记物的标准化的Cox’s回归系数
[0061] xi是按log2尺度的ER+标记物的表达值
[0062] wj是X基因-标记物的标准化的Cox’s回归系数
[0063] xj是按log2尺度的ER-标记物的表达值
[0064] X基因选自由编码mRNA的那些构成的组,所述mRNA:
[0065] i.相应于SEQ ID NO:1-111;或
[0066] ii.由探针集识别,所述探针集选自由表10中描述的相应于SEQ IDNO:1-111的psid构成的组。
[0067] 本发明包括产生乳腺癌预后患者报告的方法,通过以下方式进行:从患者获得生物样品;测量样品的基因表达;对步骤b的结果应用复发危险分值;使用步骤c中获得的结
果来产生报告,从而产生患者报告。所述报告可以含有相对于患者群体而言的患者结局和
/或风险概率的评定。
[0068] 本发明包括至少一个探针集的组合物,所述探针集选自:SEQ IDNO:1-111;或表10中描述的相应于SEQ ID NO:1-111的psid。所述组合物可以含有至少一个选自SEQ ID
NO:36-95;96-111;或36-111的探针集。所述组合物可以进一步含有用于进行微阵列分析
的试剂,和介质,通过所述介质分析所述核酸序列、它们的互补物或其部分。
[0069] 本发明包括用于进行分析以确定生物样品中的乳腺癌预后的试剂盒,含有:用于检测基因组合的分离的核酸序列、它们的互补物或其部分的材料,所述基因选自编码mRNA
的那些,所述mRNA相应于SEQ ID NO:1-111;或由探针集识别,所述探针集选自表10中描
述的相应于SEQ ID NO:1-111的psid。所述试剂盒可以进一步含有用于进行微阵列分析
的试剂,和介质,通过所述介质分析所述核酸序列、它们的互补物或其部分。
[0070] 本发明包括用于评定乳腺癌状态的物品,含有:用于检测基因组合的分离的核酸序列、它们的互补物或其部分的材料,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ
ID NO:1-111;或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:1-111的
psid。所述物品可以进一步含有用于进行微阵列分析的试剂,和介质,通过所述介质分析所
述核酸序列、它们的互补物或其部分。
[0071] 在此提供的微阵列可以含有:基因组合的分离的核酸序列、它们的互补物或其部分,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:1-111;或由探针集识别,
所述探针集选自表10中描述的相应于SEQ ID NO:1-111的psid,其中所述组合足以表征
生物样品中的乳腺癌状态或复发风险。
[0072] 所述微阵列测量或表征优选的是至少1.5倍过量或减量表达。所述微阵列可以检测预定的截断水平,相对于良性细胞或正常组织,所述预定的截断水平是在样品中至少1.5
倍过量或减量表达。优选的,相对于良性细胞或正常组织,在具有转移性细胞的样品中预定
的截断水平至少具有统计学上显著的p值过量表达。更优选的,所述p值低于0.05。
[0073] 本发明包括诊断/预后档案(portfolio),含有:基因组合的分离的核酸序列、它们的互补物或其部分,所述基因选自编码mRNA的那些,所述mRNA相应于SEQ ID NO:1-111;
或由探针集识别,所述探针集选自表10中描述的相应于SEQ ID NO:1-111的psid,其中所
述组合足以表征生物样品中的乳腺癌状态或复发风险。所述档案可以检测预定的截断水
平,相对于良性细胞或正常组织,所述预定的截断水平是在样品中至少1.5倍过量或减量
表达。优选的,相对于良性细胞或正常组织,在具有转移性细胞的样品中预定的截断水平至
少具有统计学上显著的p值过量表达。更优选的,所述p值低于0.05。
[0074] SEQ ID NO:1-650在表10中概述。在SEQ ID NO:1-650的每一个中,标记物通过psid或Affymetrix基因芯片名称来标识,代表相应于给定SEQ ID NO、编码任何变体、等位
基因等的基因。标记物还被定义为编码mRNA的基因,所述mRNA由相应于给定psid的探针
识别。以下更详细地描述一些标记物。
[0075] M83,SEQ ID NO:45被 美国专利 申请公 开号20020110547;20040009491;和 20030236392, 和 PCT 公 开 号 WO0149716;WO0170979;WO03025138;WO03042661;
WO03016475;WO2004063355;WO2004047728和WO2004030615提及。
[0076] ABLIM-s,SEQ ID NO:43被美国专利申请公开号20020131971;20030087818;20030166064;20030236392;和 20040005560 和 PCT 公 开 号 WO0036107;WO0159063;
WO0160860;WO0174405;WO0177288;WO02059271;WO0212328;WO0224956;WO0229086;
WO03025138;WO2004024097;WO2004037996;WO2004039956;WO2004043361和WO2004047728
提及。
[0077] ATAD2,SEQ ID NO:54被美国专利申请公开号20020064872;20020085998;20020150581;20020156011;20020192678;20030069180;20030073623;20030104366;
20040005560;20040013663;和 20040058340 和 PCT 公 开 号 WO0060076;WO0142467;
WO0155322;WO0160860;WO0170979;WO0179286;W0196388;WO02057414;WO02059377;
WO02060317;WO02086443;WO0231198;WO0250279;WO03004989;WO03025138;WO03042661;
WO03062379;WO2004047728;WO2004048938;WO2004048938;WO2004063355和WO9938972提
及。
[0078] C11ORF9,SEQ ID NO:48被美国专利申请公开号20030065157;和20030073623和PCT 公 开 号WO0056880;WO0058473;WO0159063;WO0174405;WO02059260;WO0229086;
WO03101283;WO2004031413和WO2004060270提及。
[0079] C3,SEQ ID NO:46被美国专利申请公开号20040005560和20040058340和PCT公开 号 WO9101999;WO0055350;WO0160860;WO0175067;WO0188088;WO0224956;WO0294629;
WO03078572;WO2004028479;WO2004030615;WO2004041170和WO2004060270提及。
[0080] CGI-41,SEQ ID NO:65被美国专利申请公开号20030073623和20030096982和PCT公开号WO9514772;WO9940100;WO0154472;WO0157188;WO03046152;WO2004060270提及。
[0081] CLN8,SEQ ID NO:36被EP1104808B1美国专利申请号20030073623和20040009491和PCT公开号WO9845437;WO9935158;WO0142451;WO0190304;WO02090526;WO02095010;
WO02102993;WO02102994;WO03004622;WO04024892和WO04041170提及。
[0082] CNK1,SEQ ID NO:60被美国专利申请公开号20040058340和PCT公开号WO9938972和WO2004037996提及。
[0083] DUSP4,SEQ ID NO:57被美国专利申请公开号20030073623;20030194704;20040058340 和 20040110194 和 PCT 公 开 号 WO0100828;WO0204514;WO02059377;
WO02103320;WO0224956;WO03004989;WO2004018641;WO2004023973;WO2004037996;
WO2004039956;WO2004043361;WO2004047728;WO2004048938和WO9423039提及。
[0084] FEN1,SEQ ID NO:62被美国专利申请公开号5874283,美国专利申请号20020156011;20030069180;20030073623 和 20030194704 和 PCT 公 开 号 WO0196388;
WO03016475;WO03016500;WO03072035;WO03101283;WO2004022059;WO2004030615;
WO2004039956;WO2004043361;WO2004047728;WO2004048938;WO2004060270 和
WO2004079014提及。
[0085] FKBP2,SEQ ID NO:63被美国专利申请公开号20030073623和PCT公 开号 WO02059377;WO02070737;WO02081731;WO02083898;WO0224956;WO03016475;
WO03054152;WO2004039956;WO2004043361和WO9219745提及。
[0086] GP73,SEQ ID NO:37被美国专利申请公开号20030022239;20030073623;20030236392;20040009478;20040034196 和 20040058340 和 PCT 公 开 号 WO0012708;
WO0061610;WO0078961;WO0140466;WO0160860;WO0177168;WO0194629;WO02059260;
WO02083876;WO0224956;WO03004989;WO2004024892;WO2004031414 和 WO2004053081 提
及。
[0087] H4FH,SEQ ID NO:61被美国专利申请公开号20020151681和PCT公开号WO0055174;WO0175067;WO0224956;WO03016476;WO2004039943提及。
[0088] IL-18,SEQ ID NO:39被美国专利号6060283,美国专利申请公开号20040115636和PCT公开号WO0194629;WO02057414;WO0224956;WO0229086;WO03025138;WO03042661和
WO9724441提及。
[0089] KIAA0748,SEQ ID NO:56被PCT公开号WO0021991;WO02094988和WO2004003162。
[0090] KPNA2,SEQ ID NO:64被美国专利申请公开号20020151681;20020156011;20030069180和20040058340和PCT公开号WO9712967;WO9964576;WO0055174;WO0146697;
WO0170979;WO0196388;WO02057414;WO02059377;WO02086443;WO02102235;WO0224956;
WO03010336;WO03025138;WO03027285;WO03042661;WO2004024097;WO2004024892;
WO2004028479;WO2004037996;WO2004039956;WO2004043361;WO2004047728 和
WO2004063355提及。
[0091] MGC11335,SEQ ID NO:66被美国专利申请公开号20030073623;20030219744和20030236392和PCT公开号WO0144448;WO0153312;WO0157182;WO0188088和WO2004030615
提及。
[0092] OR12D2,SEQ ID NO:52 被 PCT 公 开 号 WO0127158;WO02068652;WO02081498;WO02081517;WO030000735和WO03091388提及。
[0093] ORC3,SEQ ID NO:53被美国专利申请公开号20040013663和PCT公开号WO9810067;WO9958642;WO0060078;WO0175067;WO02059377;WO02070737;WO02102235 和WO03042661提及。
[0094] PLK1,SEQ ID NO:59被DE4329177,美国专利申请公开号20020081659和20020151681和PCT公开号WO0055174;WO0055320;WO02070737;WO02086443;WO0224956;
WO03003906;WO03016476;WO03018807;WO03025138;WO03042661;WO2004030615;
WO2004037996;WO2004042022;WO2004047728;WO2004048938;WO2004063355 和
WO2004070062提及。
[0095] PPP1CC,SEQ ID NO:42被美国专利申请公开号20030073623和20040013663和PCT 公 开 号 WO03016476;WO0063438;WO0170979;WO0202623;WO02036766;WO02074237;
WO0228999;WO03016475和WO2004030615提及。
[0096] SMC4,SEQ ID NO:55被美国专利申请公开号20020123619;20020168637和20040058340和PCT公 开 号 WO9938972;WO9964576;WO0175067;WO0190154;WO0204514;
WO02059377;WO02074237;WO02086443;WO02102235;WO03003906;WO03016475;
WO03025138;WO03042661;WO2003094848;WO2004024892;WO2004047728;WO2004048938;
WO2004063355和WO2004074301提及。
[0097] TRDL-1,SEQ ID NO:44被美国专利号6171787和6440694,美国专利申请公开号20020055474;20020072089;20020081659;20030065157;20030073623; 和 20030219767
和 PCT 公 开 号 WO9733902;WO9912965;WO9926976;WO9928462;WO9933980;WO9935170;
WO9950416;WO9954460;WO0026244;WO0032776;WO0055320;WO0125256;WO0177291;
WO2004020593;WO2004024892;WO2004033637和04037996提及。
[0098] Yif1p,SEQ ID NO:38被美国专利申请公开号20020131971;20030166064;和20040037842和PCT公开号WO9933981;WO9947540;WO0173027;WO02060317;WO02070737;
WO02076488;WO02095010;WO0224956;WO03004622 ;WO03038063;WO03042661;
WO03054152;WO03064589;WO2004024892;WO2004037996;WO2004047728 和 WO2004048938
提及。
[0099] 利用来自没有接受辅助性全身治疗的286位淋巴结阴性(LNN)乳腺癌患者的冷冻肿瘤样品的总RNA,使用Affymetrix Human U133a基因芯片分析了22,000个转录产物的表
达。我们发现,基因表达的基因组范围的测量可以鉴定基因活性的模式,其将肿瘤再分类,
并提供了在患有淋巴结阴性乳腺癌的患者中改进的个体风险评估方法。
[0100] 在115个肿瘤的训练集中,我们鉴定了包含ER阳性患者的60个基因和ER阴性患者的16个基因的76个基因标志(signature)。在随后的171位LNN患者的独立测试集中,
这种标志显示了93%的敏感性和48%的特异性。在鉴定5年内发生远处转移的患者时,
即使对多变量分析中传统的预后因素进行了修正(HR:5.55,CI:2.46-12.5),基因分布型
仍是高度信息性的(危险比例,HR:5.67,95%置信区间,CI:2.59-12.4)。76-基因分布型
-4
还代表了在84位绝经前患者(HR:9.60,p=1.6×10 )、87位绝经后患者(HR:4.04,p=
-3
1.7×10 )以及疾病预后特别困难的79位具有10到20mm大小的肿瘤的患者(HR:14.1,p
-6
=2.3×10 )的亚组中发生转移的强预后因素。
[0101] 在这项研究中,我们提供了来自所有年龄和肿瘤尺寸组的286位LNN乳腺癌患者的原发肿瘤分析结果。患者没有接受辅助性全身治疗,使得这成为第一种多基因预后评定,
不含有由与全身性治疗有关的预测因素带来的潜在混淆性贡献,通过独立的测试集适当地
验证,对肿瘤大小和年龄没有限制。所描述的基于基因表达的算法可以高置信度地在LNN
患者中预测发生远处复发的概率。
[0102] 在组织样品中单纯地存在或缺乏特定的核酸序列仅极少地被发现具有诊断或预后价值。另一方面,关于各种蛋白、肽或mRNA的表达的信息被越来越认为是重要的。在基
因组内单纯地存在具有表达蛋白、肽或mRNA的潜的核酸序列(这种序列被称为基因)本
身对于蛋白、肽或mRNA是否在给定细胞中表达不是决定性的。能表达蛋白、肽或mRNA的给
定基因是否进行表达、或如果表达的话这种表达发生到什么程度,是由各种复杂的因素决
定的。不考虑在了解和评定这些因素方面的难度,分析基因表达可以提供关于发生重要事
件的有用信息,所述事件例如肿瘤发生、转移、细胞凋亡和其他临床上相关的现象。在基因
表达分布型中可以发现基因的活性或无活性所达到的程度的相关指示。本发明的基因表达
分布型被用于提供预后和治疗乳腺癌患者。
[0103] 样品制备需要收集患者样品。用于该发明性方法的患者样品是被怀疑含有患病细胞如上皮细胞、取自乳腺样品中原发肿瘤的那些。取自手术边缘(surgical margins)的样
品也是优选的。然而,最优选的,样品取自乳腺癌手术获得的淋巴结。激光俘获显微解剖
(LCM)技术是选择要研究的细胞、最小化由细胞类型异质性引起的变异的一种方法。因而,
可以容易地检测正常细胞和癌细胞之间基因表达方面的中度或微小的变化。样品也可以包
含取自外周血的循环上皮细胞。可以根据许多方法来获得这些,但最优选的方法是美国专
利6,136,182中描述的磁分离技术。一旦获得了含有目标细胞的样品,提取RNA并进行扩
增,对于在适合的档案中的基因,优选的通过微阵列来获得基因表达分布型。
[0104] 确定基因表达分布型的优选的方法包括测定由可编码蛋白或肽的基因产生的RNA的数量。这可以通过逆转录酶PCR(RT-PCR)、竞争性RT-PCR、实时RT-PCR、差异展示RT-PCR、Northern印迹分析和其他相关的测试来实现。虽然可能使用单独的PCR反应来进行这些
技术,但最好是扩增由mRNA产生的互补DNA(cDNA)或互补RNA(cRNA),并通过微阵列来
分析。许多不同的阵列结构和它们的产生方法是本领域的技术人员已知的,已在美国专
利中描述,例如:5,445,934;5,532,128;5,556,752;5,242,974;5,384,261;5,405,783;
5,412,087;5,424,186;5,429,807;5,436,327;5,472,672;5,527,681;5,529,756;
5,545,531;5,554,501;5,561,071;5,571,639;5,593,839;5,599,695;5,624,711;
5,658,734和5,700,637。
[0105] 微阵列技术允许同时测量数千个基因的稳态mRNA水平,从而提供了鉴定不受控细胞增殖的影响,例如发作、延滞或调节的有效方法。两种微阵列技术是当前广泛使用的。
第一种是cDNA阵列,第二种是寡核苷酸阵列。尽管在这些芯片的结构方面存在差别,基本
上所有的下游数据分析和输出是相同的。这些分析的结果一般是来自标记的探针的信号
度的度量,所述探针被用于检测样品中与微阵列的已知位置上的核酸序列杂交的cDNA序
列。一般地,信号的强度与cDNA的数量成比例,因而与样品细胞中表达的mRNA成比例。许
多这样的技术是可用的和有用的。测定基因表达的优选的方法可以在美国专利6,271,002;
6,218,122;6,218,114;和6,004,755中找到。
[0106] 通过比较信号强度进行表达水平的分析。通过生成测试样品中的基因相对于对照样品中的基因的表达强度的比例矩阵(ratio matrix),来最好地进行。例如,可以将来自患
病组织的基因表达强度与产自相同类型的正常组织的表达强度相比较(例如,患病的乳腺
组织样品相对于正常乳腺组织样品)。这些表达强度的比例表明了测试样品和对照样品之
间基因表达方面的倍数变化。
[0107] 也可以按许多种方式展现基因表达分布型。最普遍的方法是将未加工的荧光强度或比率矩阵编排到图形化树形图中,其中各个列代表测试样品,各个行代表基因。排列数据
使得具有类似的表达分布型的基因相互接近。每个基因的表达比例用一种颜色显现。例
如,小于一的比例(表明减量调节)可以在谱图的蓝色部分中显现,而大于一的比例(表
明增量调节)可以作为一种颜色在谱图的红色部分显现。商业上可获得的计算机软件
序是可用的,来显示这样的数据,包括来自Agilent Technologies的GeneSpring和来自
TM TM
Partek 的PartekDiscover 和Partek Infer 软件。
[0108] 在实施例中描述了在本发明的方法中使用的调节基因。相对于没有复发的患者,在有乳腺癌复发的患者中差别表达的基因不是增量调节就是减量调节的。增量调节和减
量调节是相对的术语,意思是相对于某些基准线在基因的表达数量中存在的可检测的差异
(超过用于测量它的系统中噪声的贡献)。在这种情况下,基准线是测量的非复发患者的基
因表达。使用相同的测量方法,相对于所述基准线,在患病的细胞(来自复发患者)中的目
标基因是增量或减量调节的。在此,患病的是指身体状态的改变,其阻断或干扰、或有可能
干扰身体的正常机能,如同细胞的不受控增殖那样。当一个人的基因型或表型的某个方面
与疾病的存在相一致时,他被诊断为患有疾病。然而,进行诊断或预后的行动包括疾病/状
态问题的确定,例如确定复发的可能性和治疗监视。在治疗监视中,通过比较一段时间的基
因表达来确定基因表达分布型是否已经改变或正在改变成更为符合正常组织的模式,来针
对给定的治疗过程的效果进行临床判断。
[0109] 优选的,根据杂交的微阵列探针的强度测定的倍数变化对增量或减量调节的水平进行辨别。对于进行这样的辨别,2.0倍的差异是优选的(或p值小于0.05)。也就是说,
在将基因说成是在患病/复发细胞与正常/非复发细胞中是差别表达的之前,与标准细胞
相比,发现患病细胞产生至少2倍高或低至1/2的强度。倍数差异越大,该基因作为诊断或
预后工具的用途越是优选的。为本发明的基因表达分布型选择的基因具有引起信号产生的
表达水平,通过超出所使用的临床实验室检测设备的背景的一定量,该信号与正常或未调
节基因的信号是可区分的。
[0110] 统计数值可以用来确信地将调节的基因与未调节基因和噪声辨别开来。统计试验找出在各组样品之间最显著不同的基因。Student’s t-检验是可以用于找出两个组之间
的显著差异的强有力的统计检验的实例。p值越低,在不同的组之间基因显示出差异的证据
就越强。尽管如此,由于微阵列同时测量超过一个的基因,可以一次进行数万个统计检验。
因此,人们不太可能仅是偶然地看见小的p值,可以利用Sidak校正对这进行调整以及进行
随机化/置换实验。t-检验的p值低于0.05是该基因显著不同的证据。更强的证据是在
考虑Sidak校正之后p值小于0.05。对于每个组中的许多样品,在随机化/置换试验之后
p值小于0.05是显著差异的最强证据。
[0111] 可以用来选择基因的另一个参数是使用绝对信号差异的检测,所述基因产生的信号大于未调节基因的信号或噪音。优选的,由调节的基因表达产生的信号至少20%不同于
正常的或未调节基因的信号(在绝对值的基础上)。再更优选的是,这种基因产生的表达模
式至少30%不同于正常的或未调节基因的表达模式。
[0112] 基因可以被分组,从而获得的关于该组中基因集的信息提供了用于进行临床上相关的判断,例如诊断、预后或治疗选择的可靠的基础。这些基因集(sets of genes)构成了
本发明的档案。在这种情况下,由所述档案支持的判断包括乳腺癌和它复发的机会。同最具
诊断性的标记物一样,常常希望的是使用足以进行正确医学判断的最少数量的标记物。这
防止了在等待进一步分析的治疗中的延迟以及不适当的时间和资源的耗费。
[0113] 优选的,建立档案,从而在档案中基因的组合相对于单独的基因或随机选择的基因组合展现出改善的敏感性和特异性。在本发明的上下文中,档案的敏感性可以反映在由
患病状态中基因表达所展现的、相对正常状态的倍数差异中。特异性可以反映在对基因表
达的信号与感兴趣状况的相关性的统计度量中。例如,标准误差可以用作这种度量。在考
虑用于包含在档案中的一组基因时,在表达度量中的小的标准差与更高的特异性相关。也
可以使用变异的其他度量,例如相关系数。
[0114] 建立基因表达档案的一种方法是通过使用优化的算法,例如在建立股票档案(stock portfolios)中广泛使用的平均变异算法。在美国专利公开号20030194734中详细
地描述了该方法。基本上,该方法要求建立将会优化人们为使用它而接收到的返回(例如,
产生的信号)的一组输入(金融应用中的股票,在此为由强度来度量的表达),而最小化返
回的变异性。对于进行这种操作,许多商业的软件程序是可获得的。“Wagner Associates
Mean-Variance OptimizationApplication”,在本说明书中称为“Wagner Software”,是优选的。该软件使用来自“Wagner Associates Mean-Variance OptimizationLibrary”的函
数来确定效率界限(efficient frontier),在Markowitz意义上的最佳档案是优选的。使
用这类软件需要转化微阵列数据,从而可以将其作为输入来处理,如同该软件被用于预定
的金融分析目的时使用股票返回(stock return)和风险度量的方式。
[0115] 选择档案的过程也可以包括试探规则的应用。优选的,根据生物学和对用来产生临床结果的技术的理解来制定这种规则。更优选的,将它们应用于来自优化方法的输出。例
如,档案选择的平均方差法可以应用于微阵列数据,用于在患有乳腺癌的受试者中差异表
达的许多基因。该方法的输出将是优化的基因集,其将包括在外周血中以及在患病组织中
表达的某些基因。如果用于测试方法的样品是从外周血获得的,并且在乳腺癌的情形中差
异表达的某些基因是在外周血中差异表达的,则可以应用试探规则,其中档案选自排除了
外周血中差异表达的那些的效率界限。当然地,例如,通过在数据预选期间应用规则,可以
在形成效率界限之前应用规则。
[0116] 可以使用不一定与讨论的生物学相关的其他试探规则。例如,人们可以应用一种规则,仅档案的指定百分比可以由特定的基因或一组基因表示。商业上可获得的软件例如
Wagner Software容易地提供了这些类型的试探。例如,当不同于准确度和精确度(例如,
预期的许可费用)的因素对包括一个或多个基因的需要性(desirability)具有影响时,这
是有用的。
[0117] 本发明的一个方法包括比较各种的基因(或档案)的基因表达分布型来归类(ascribe)预后。将构成档案的每个基因的基因表达分布型固定在媒介,例如计算机可读
媒介上。这可以采用许多形式。例如,可以建立表格,指示疾病的信号范围(例如,强度度
量)被输入到该表格中。因而实际的患者数据可以与表格中的数值比较,来确定患者样品
是正常还是患病的。在更完善的实施方式中,表达信号(例如,荧光强度)的模式是数字地
或图形地记录的。
[0118] 然后来自与患者样品结合使用的基因档案的基因表达模式可以与表达模式相比较。然后可以使用模式比较软件来确定患者样品是否具有指示疾病复发的模式。当然地,
这些比较也可以用来确定患者是否不可能经历疾病复发。然后样品的表达分布型可以与对
照细胞的档案相比较。如果样品表达模式与乳腺癌的复发的表达模式相符,则(不存在抵
销性的医学考虑)该患者像治疗复发患者一样被治疗。如果样品表达模式与来自正常/对
照细胞的表达模式相符,则患者被诊断为乳腺癌阴性。
[0119] 本发明的优选的分布型是由SEQ ID NO:1-35组成的35基因档案,由SEQ ID NO:36-95组成的60基因档案,其最好地用于预测ER阳性患者,和由SEQ ID NO:96-111组成
的16基因档案,其最好地用于预测ER阴性患者。最优选的,所述档案由SEQ ID NO:36-111
组成。这个最优选的档案不管ER状态如何,最好地将高复发风险的乳腺癌患者从其他患者
中分离出来。一旦鉴定了高风险患者,则他们可以用辅助治疗来治疗。
[0120] 在本发明中,用于分析患者的基因表达模式来确定乳腺癌的预后的最优选的方法是使用Cox’s危险分析程序。最优选的,使用S-Plus软件(可从Insightful Corporation
商业地获得)进行分析。使用这种方法,将基因表达分布型与确信地代表复发的分布型
(即,在分布型中基因组合的表达水平是复发的指示)进行比较。具有建立的阈值的Cox’s
危险模型被用于比较两个分布型(已知的复发对比患者)的相似性,然后确定患者分布型
是否超出阈值。如果是,则该患者被分类为将会复发的患者,给予治疗,例如辅助治疗。如
果患者分布型没有超过阈值,则他们被分类为不复发患者。也可以使用其他分析工具来回
答相同的问题,例如,线性区别分析,逻辑回归和神经网络方法。
[0121] 模式识别的许多的其他公知的方法是可用的。以下参考文献提供了一些实例:
[0122] Weighted Voting:Golub et al.(1999).
[0123] Support Vector Machines:Su et al.(2001);and Ramaswamy etal.(2001).
[0124] K-nearest Neighbors:Ramaswamy(2001).
[0125] Correlation Coefficients:van′t Veer et al.(2002).
[0126] 本发明的基因表达分布型也可以连同在癌症诊断、预后或治疗监视中有用的其他非基因性的诊断方法来使用。例如,在某些情况下,有益的是将基于如上所述方
法的基因表达的诊断能力与来自常规标记物,例如血清蛋白标记物(例如,癌症抗原
27.29(“CA27.29”))的数据组合。现有大量的这种标记物,包括例如CA27.29的被分析
物。在一个这样的方法中,从治疗的患者周期性地采取血液,然后进行针对如上所述血清标
记物之一的酶免疫测定。当标记物的浓度暗示肿瘤的回归或治疗失败时,采取可经受基因
表达分析的样品源。在存在怀疑的肿块处,采取微针吸出物(FNA),然后如上所述分析采自
肿块的细胞的基因表达分布型。做为选择,组织样品可以采自邻近于早先除去肿瘤的组织
的区域。当其他测试产生不明确的结果时这种方法是特别有用的。
[0127] 本发明的物品包括对于治疗、诊断、预后以及评定疾病有用的基因表达分布型的呈示(representations)。这些分布型呈示被化为可以通过机器自动读取的媒介,例如计算
机可读媒介(磁的、光的,等等)。所述物品还可以包括在这种媒介中用于评定基因表达分
布型的说明书。例如,所述物品可以包括具有计算机指令的CD ROM,所述计算机指令用于比
较如上所述的基因档案的基因表达分布型。所述物品还可以具有数字性记录在其中的基因
表达分布型,从而它们可以与来自患者样品的基因表达数据相比较。做为选择,所述分布型
可以以不同的表现形式记录。图形的记录是一种这样的形式。聚类算法,例如整合在上述
TM TM
来自 的Partek Discover 和Partek Infer 软件中的那些,可以最好的帮助这种
数据的可视化
[0128] 根据本发明的制造物品的不同类型是用于揭示基因表达分布型的介质或格式化的分析。这些可以包括,例如,微阵列,在其中互补物或探针附着到基质上,指示目标基因的序列组合到其上产生它们之存在的可读决定簇。做为选择,根据本发明的物品可以制成试
剂盒,用于进行杂交、扩增和信号产生,指示用于检测乳腺癌的目标基因的表达水平。
[0129] 根据本发明制造的试剂盒包括用于确定基因表达分布型的格式化的分析。这些可以包括进行分析所需的所有或某些材料,例如试剂和说明书。
[0130] 通过以下非限制性的实施例进一步说明本发明。在此引用的所有参考文献通过引用合并在此。
[0131] 实施例:根据本发明分析的基因一般与编码蛋白或肽的产生的全长核酸序列有关。本领域的技术人员将认识到,从分析的度来看,标明全长序列不是必需的。也就是
说,可以根据公知的原则选择序列的部分或EST,对它们可以设计探针来评定相应基因的基
因表达。
[0132] 实施例1
[0133] 样品处理和微阵列工作
[0134] 来自在1980-1995年间治疗的、但未用全身性的最新辅助治疗进行治疗的LNN患者的冷冻肿瘤样本,选自我们在Erasmus MedicalCenter(Rotterdam,Netherlands)的肿
瘤库。所有肿瘤样品被提交给我们来自25个地方医院的参考实验室,进行甾类激素受体测
量。初级处理的指导原则对于所有医院都是相似的。以避免偏见的方式选择肿瘤。假定
5年内25-30%,以及由于质量控制原因肿瘤的实质上的损失,处理了436个侵入性肿瘤样
品。包括了具有不良、中间和良好临床结局的患者。根据不充足的肿瘤内容(53个)、不良
的RNA质量(77个)或不良的芯片质量(20个)排除了样品,留下适合于进一步分析的286
个样品。
[0135] 研究方案得到医学伦理委员会机构的批准(MEC no.02.953)。在手术时患者的中间年龄是52岁(范围,26-83岁)(乳腺保留手术:219位患者;修改的根治性乳房切除术:
67位患者)。根据我们的设立方案给予248位患者放疗(87%)。经历乳腺保留治疗和放
疗的患者的比例对于LNN疾病是正常的。不考虑放疗状态来包括患者,因为这项研究目的
不是研究特定类型的手术或辅助放疗的潜在效果。此外,研究显示,放疗对于远处疾病复发
没有明确的影响。早期乳腺癌实验列表(1995)。淋巴结阴性是基于地方病理学家的病理检
查。Foekens et al.(1989a)。
[0136] 在被包括进来之前,证实所有286个肿瘤样品具有足够的(>70%)肿瘤和在H&E染色的5μm冷冻切片中均匀的包含肿瘤。通过配体结合分析或酶免疫测定(EIA)(Foekens
et al.(1989b))、或通过免疫组织化学(9个肿瘤)来测定ER(和PgR)水平。用来将患者
分类为ER和PR的阳性或阴性的截断值是10fmol/mg蛋白或10%阳性肿瘤细胞。手术后
跟踪包括在第一个2年内每3个月、第3年到第5年每6个月、和第5年开始每12个月
进行检查。诊断转移的日期被定义为在患者报告症状、检测临床征象之后或在常规的跟踪
时确认转移的日期。存活患者(n=198)的中值跟踪周期是101个月(范围,20-171)。在
包括的286位患者中,93位(33%)显示了5年内的远处转移的证据,被当做在无远处转移
存活(DMFS)分析中的失败。五位患者(2%)没有疾病证据而死亡,在最后的跟踪中审查。
83位患者(29%)在先前的复发之后死亡。因此,在总体存活(OS)分析中总共88位患者
(31%)失败。
[0137] 实施例2
[0138] 实施例1获得的数据的基因表达分析
[0139] 用 RNAzol B(Campro Scientific,Veenendaal,Netherlands) 从 30μm 厚 的(50-100mg)20到40个低温恒温切片中分离总RNA。使用公开的方法(Affymetrix,CA,
Lipshutz et al.(1999))制备生物素化的靶点,与Affymetrix寡核苷酸微阵列U133a基因
芯片杂交。使用标准的Affymetrix方案扫描阵列。每个探针集作为独立的基因处理。使
用Affymetrix GeneChip分析软件MAS5.0计算表达值。如果平均强度<40或如果背景信
号>100,排除芯片。为标准化芯片信号,将探针集换算(scaled)到600的目标强度,不选择
scale mask files。
[0140] 实施例3
[0141] 实施例2中鉴定的基因的统计分析
[0142] 过滤基因表达数据以包括在两个或多个样品中称为“存在”的基因。17,819个基因通过了这个过滤,用于分级聚类。在聚类之前,每个基因的表达水平除以患者中它的中值
表达水平。这个标准化步骤限制了基因表达的数量的影响,在聚类分析中将具有类似表达
模式的基因集中在一起。为了鉴定患者亚组,我们使用GeneSpring6.0对基因和样品都进
行了平均联系(average linkage)分级聚类。
[0143] 为了鉴定将发展出远处转移的患者与保持无转移5年的患者区别开来的基因,我们使用了两种指导性的分类预测方法。在第一种方法中,将286位患者分别随机分配
到80和206位患者的训练和测试集。对两个集检查Kaplan-Meier存活曲线(Kaplan et
al.(1958)),以确保没有显著差异和没有偏见被通过随机选择训练和测试集导入。在第二
种方法中,患者被分配到由ER状态分开的两个亚组(附图1)之一中。
[0144] 为了选择标记物对每个亚组单独地分析。在ER阳性亚组中的患者被分别随机分配到80和129位患者的训练和测试集。在ER阴性亚组中的患者被分别随机分入35
和42位患者的训练和测试集。为每个亚组训练集选择的标记物被组合以形成单个标志
(signature),来在随后的独立验证中为ER阳性和ER阴性患者预测肿瘤转移。
[0145] 训练集的样品大小由再取样方法确定,以确保它的统计可信水平。简要地,在训练集中的患者数目从15位患者开始,每步增加5位患者。对于给定的样本大小,产生随机选
择患者的10个训练集。从每个训练集构建基因标志,然后通过分析在作为定义点的5年内
远处转移的接受者操作特性(ROC)曲线、在指定的患者测试集中测试。对于给定的样本大
小计算曲线下区域(AUC)的平均数和变异系数(CV)。在平均AUC达到平台期和10个AUC
的CV低于5%的点,选择训练集所需的患者最小数目。
[0146] 如下选择基因。首先,使用单变量Cox’s比例危险回归来鉴定基因,所述基因的表达(在log2尺度上)与DMFS的长度相关。为了降低多次测试的影响和测试选择的基
因的强大程度(robustness),用训练集中患者的自展(bootstrapping)构建Cox’s模型。
Efron et al.(1981)。简要地,构建训练集的400个自展样品,每一个具有随机置换选择的
80位患者。对每一个自展样品(bootstrap sample)运行Cox’s模型。通过除去顶部和底
部5%p值,然后将余下的自展p值的倒数平均,来为每个基因产生自展分值。这个分值被
用于排列基因。为了构建多基因标志,通过根据所述排列的顺序一次添加一个基因,测试基
因标记物的组合。进行利用5年内的远处转移作为定义点的ROC分析,来计算随着基因数
目的提高、每个标志的AUC下的区域,直到达到最大AUC值。
[0147] 使用复发分值(RS)来计算每个患者的远处转移的风险。该分值被定义为用标准化的Cox’s回归系数作为加权的、加权的表达信号的线性组合。
[0148]
[0149] 其中
[0150]
[0151] A和B是常数
[0152] wi是ER+标记物的标准化的Cox’s回归系数
[0153] xi是按log2尺度的ER+标记物的表达值
[0154] wj是ER-标记物的标准化的Cox’s回归系数
[0155] xj是按log2尺度的ER-标记物的表达值
[0156] 从训练集的ROC曲线测定阈值以确保100%敏感性和最高的特异性。选择常数A的值313.5和常数B的值280,以对于ER阳性和ER阴性患者将RS的阈值都中心化到零。
具有正RS分值的患者被分类到不良预后组中,具有负RS分值的患者被分类到良好预后组
中。在测试集中验证基因标志和截断。使用Kaplan-Meier存活率标绘图和log-rank检验
来评定所预测的高风险和低风险组的远处转移的时间差异。几率比(OR)被计算为被预测
复发的患者和被预测保持无复发的患者之间远处转移几率的比例。
[0157] 对有或没有基因标志的单独的临床变量进行使用Cox’s比例危险回归的单变量和多变量分析。HR和它的95%置信区间(CI)来自于这些结果。使用S-Plus6.1软件
(Insightful,VA)进行所有的统计分析。
[0158] 实施例4
[0159] 实施例3中鉴定的基因的途径分析
[0160] 将功能性分类分配给预后标志基因中的每个基因。使用Ingenuity1.0软件(Ingenuity Systems,CA)进行途径分析。Affymetrix探针被用作输入来查找该软件构建
的生物学网络。通过GO本体论分类法在一般性功能分类的环境中评定由该程序鉴定的生
物学网络。选择和评估预后标志中两个或多个基因的途径。
[0161] 实施例5
[0162] 实施例1-4的结果
[0163] 患者和肿瘤特征
[0164] 286位患者的临床和病理的特征在表1中概述。
[0165] 表1.患者和他们的肿瘤的临床和病理特征
[0166]*
[0167] ER阳性和PgR阳性:>10fmol/mg蛋白或>10%阳性肿瘤细胞。
[0168] 在年龄或绝经状态中没有差异。正如所料,与ER阳性训练集相比,ER阴性的训练组具有稍微更高比例的更大的肿瘤,以及更多不良分级的肿瘤。对于任何患者或肿瘤特征,
171位患者的验证组(129位ER阳性,42位ER阴性)没有不同于286位患者的总组。
[0169] 使用两种方法来鉴定预测疾病复发的标记物。首先,我们将所有286位患者(ER阳性和ER阴性组合起来)分到训练集和测试集中。从训练集的80位患者中选出35个基因,
构建Cox’s模型来预测远处转移的发生。观察到中度的预后值。表2.无监督的聚类分析
显示了与肿瘤ER状态高度相关的两个不同的亚组(卡方检验p<0.0001)。附图1B,其支持
了第二种方法,在其中患者首先根据ER状态被放置到亚组中。
[0170] 表2
[0171] SEQ ID NO: Cox’s系数 p值
[0172] 1 4.008 0.00006
[0173] 2 -3.649 0.00026
[0174] 3 4.005 0.00006
[0175] 4 -3.885 0.00010
[0176] 5 -3.508 0.00045
[0177] 6 -3.176 0.00150
[0178] 7 3.781 0.00016
[0179] 8 3.727 0.00019
[0180] 9 -3.570 0.00036
[0181] 10 -3.477 0.00051
[0182] 11 3.555 0.00038
[0183] 12 -3.238 0.00120
[0184] 13 -3.238 0.00120
[0185] 14 3.405 0.00066
[0186] 15 3.590 0.00033
[0187] 16 -3.157 0.00160
[0188] 17 -3.622 0.00029
[0189] 18 -3.698 0.00022
[0190] 19 3.323 0.00089
[0191] 20 -3.556 0.00038
[0192] 21 -3.317 0.00091
[0193] 22 -2.903 0.00370
[0194] 23 -3.338 0.00085
[0195] 24 -3.339 0.00084
[0196] 25 -3.355 0.00079
[0197] 26 3.713 0.00021
[0198] 27 -3.325 0.00088
[0199] 28 -2.984 0.00284
[0200] 29 3.527 0.00042
[0201] 30 -3.249 0.00116
[0202] 31 -2.912 0.00360
[0203] 32 3.118 0.00182
[0204] 33 3.435 0.00059
[0205] 34 -2.971 0.00297
[0206] 35 3.282 0.00103
[0207] 为了选择标记物对每个亚组进行分析。从训练集的患者中选出76个基因(60个来自ER阳性组,16个来自ER阴性组)(附图2A,左侧)。将选择的基因和ER状态合起来,
对所有LNN患者构建预测癌症复发的Cox’s模型。171位患者的测试集中76基因预测物
的验证产生0.694的AUC值、93%的敏感性(52/56)和48%的特异性(55/115)的ROC(附
图2A,右侧)。具有高于预后标志的阈值的复发分值的患者具有11·9倍的OR(95%CI:
4.04-35.1;p<0.0001)在5年内发展出远处转移。作为对照,产生随机选择的76基因集。
在测试组中这些产生了0.515的平均AUC值、91%的敏感性和12%的特异性的ROC。通过
这种基因集分级的患者具有1.3的几率比(0.50-3.90;p=0.8)发展出转移,指示了随机
的分类。此外,作为76基因标志的函数的无远处转移存活率(DMFS)和总体存活率(OS)的
Kaplan-Meier分析,显示了预测具有良好和不良预后的组之间转移在时间上的高显著性的
差异。(附图2)。在60和80个月,在具有预测的良好和不良预后的组之间在DMFS中各
自的绝对差异分别为40%(93%vs.53%)和39%(88%vs.49%),在OS中分别为27%
(97%vs.70%)和32%(95%vs.63%)。
[0208] 76-基因分布型还代表了在84位绝经前患者(HR:9.60)、87位绝经后患者(HR:4.04)以及79位具有10到20mm大小的肿瘤的患者(HR:14.1)的亚组中发生远处转移的
强预后因素(附图3)。
[0209] 在表3中概述了单变量和多变量Cox’s回归分析。
[0210] 表3:在171位LNN患者的测试集中DMFS的单变量和多变量分析
[0211]
[0212] *由于9位患者中缺失数值,多变量模型包括162位患者。
[0213] 危险比例和95%置信区间
[0214] 年龄1是≤40岁,年龄2是41到55岁,年龄3是56到70岁,年龄4是>70岁。
[0215] §绝经后vs.绝经前
[0216] 阶段:II & III vs.I
[0217] 级别:中度/好vs.不良,未知级别作为独立的组来包括。
[0218] **肿瘤大小:>20mm vs.≤20mm
[0219] 阳性vs.阴性
[0220] 不同于该76基因标志,在单变量分析中仅级别是显著的,中度和良好的区别与有利的DMFS相关。5年内发生肿瘤转移的HR的多变量回归估计为5.55(p<0.0001),表明76
基因集代表了与肿瘤转移的更高风险强烈相关的独立预后标志。还为ER阳性和ER阴性患
者单独地进行单变量和多变量分析,在由ER状态分级的亚组中76基因标志也是独立的预
后变量。
[0221] 分析预后标志中76个基因的功能(表4)以将基因与生物学途径相关联。
[0222] 表4
[0223]
[0224]
[0225]
[0226] 尽管76个基因中的18个具有未知的功能,鉴定了很好地表现的几种途径或生化活性,例如细胞死亡、细胞周期和增殖、DNA复制和修复,和免疫反应(表5)。
[0227] 表5.来自预后标志的76个基因的途径分析
[0228] 功能分类 76-基因标志
[0229] 细胞死亡 TNFSF10,TNFSF13,MAP4,CD44,IL18,GAS2,NEFL,
[0230] EEF1A2,BCLG,C3
[0231] 细胞周期 CCNE2,CD44,MAP4,SMC4L1,TNFSF10,AP2A2,FEN1,
[0232] KPNA2,ORC3L,PLK1
[0233] 增殖 CD44,IL18,TNFSF10,TNFSF13,PPP1CC,CAPN2,PLK1,
[0234] SAT
[0235] DNA复制、重组/ TNFSF10,SMC4L1,FEN1,ORC3L,KPNA2,SUPT16H,
[0236] 修复 POLQ,ADPRTL1
[0237] 免疫反应 TNFSF10,CD44,IL18,TNFSF13,ARHGDIB,C3
[0238] 生长 PPP1CC,CD44,IL18,TNFSF10,SAT,HDGFRP3
[0239] 细胞装配和构造 MAP4,NEFL,TNFSF10,PLK1,AP2A2,SMC4L1
[0240] 转录 KPNA2,DUSP4,SUPT16H,DKFZP434E2220,PHF11,
[0241] ETV2
[0242] 细胞-细胞信号传 CD44,IL18,TNFSF10,TNFSF13,C3
[0243] 递和相互作用
[0244] 存活 TNFSF10,TNFSF13,CD44,NEFL
[0245] 发育 IL18,TNFSF10,COL2A1
[0246] 细胞形态 CAPN2,CD44,TACC2
[0247] 蛋白质合成 IL18,TNFSF10,EEF1A2
[0248] ATP结合 PRO2000,URKL1,ACACB
[0249] DNA结合 HIST1H4H,DKFZP434E2220,PHF11
[0250] 集落形成 CD44,TNFSF10
[0251] 粘附 CD44,TMEM8
[0252] 神经发生 CLN8,NEURL
[0253] 高尔基体 GOLPH2,BICD1
[0254] 激酶活性 CNK1,URKL1
[0255] 转移酶活性 FUT3,ADPRTL1
[0256] 所发现的与疾病发展有关的基因包括calpain2、起点识别蛋白、双特异性磷酸酶、Rho-GDP分离抑制物、TNF超家族蛋白、互补成分3、微管相关蛋白、蛋白磷酸酶1和细胞凋
亡调节物BCL-G。此外,早先表征的预后基因,例如cyclin E2(Keyomarsi et al.(2002))
和CD44(Herrera-Gayol et al.(1999))存在于该基因标志中。
[0257] 实施例6
[0258] 讨论实施例1-5
[0259] 我们提供了来自所有年龄组和肿瘤大小的286位淋巴结阴性乳腺癌患者的原发肿瘤分析结果。患者没有接受辅助性全身治疗,从而预后的多基因评定不受到与全身性治
疗有关的预测因素的潜在混淆性贡献的影响。
[0260] 这些研究显示了精确地预测远处肿瘤复发的76基因标志。这个标志独立于年龄、肿瘤大小和级别和ER状态适合于所有LNN乳腺癌患者。在DMFS的Cox’s多变量分析中,
76基因标志是唯一重要的变量,取代了临床的变量,包括级别。5年后,具有良好的和不良
76基因标志的患者之间DMFS和OS中的绝对差异分别是40%和27%。对于具有良好预后
标志的患者,5年内7%发展了远处转移,3%死亡。如果进一步验证,假定LNN患者中25%
比例的疾病复发,这个预后标志将产生37%的正预测值和95%的负预测值。特别地,这个
标志对于定义升高比例的T1肿瘤(<2cm)的复发风险是很有价值的。与St Gallen和NIH
指导原则比较是有益的。虽然确保相同数量的高风险患者将接受必需的治疗,我们的76基
因标志将仅对52%的低风险患者建议全身性佐剂化疗,与St.Gallen和NIH指导原则分别
是90%和89%相对比(表6)。
[0261] 表6.比较76基因标志和当前治疗乳腺癌的常规共识
[0262]
[0263] 常规的公认指标。St.Gallen:肿瘤≥2cm,ER-阴性,级别2-3,患者<35岁(这些指标的任何一个);NIH:肿瘤>1cm.
[0264] 因而该76基因标志可以引起被推荐进行不必要的辅助性全身治疗的低风险LNN患者数目的降低。
[0265] 预后标志中的76个基因属于许多功能分类,表明不同的途径可能引起疾病发展。标志包括良好表征的基因和18个未知基因。这个发现可以解释与其他预后因素相比这种
标志的优越性能。虽然在由ER状态分级的患者组中都发现了涉及细胞死亡、细胞增殖和转
录调节的基因,为ER阳性组所选的60个基因和为ER阴性组所选的16个基因没有重叠。这
个结果支持了这样的思想,疾病发展的异质性的程度和根本的机制对于乳腺癌患者的两种
基于ER的亚组可能是不同的。
[0266] 因为在患者、技术和使用的材料上的差异,将我们的结果与van deVijver etal.(2002)的研究相比较是困难的。van de Vijver et al.包括了淋巴结阴性和淋巴结阳
性患者,它们有或没有接受过辅助性全身治疗,并仅包括小于53岁的女性。此外,在研究中
使用的微阵列平台是不同的,Affymetrix对比Agilent。对于van′t Veer(2002)研究的
70个基因,仅48个存在于Affymetrix U133a阵列上,而我们的76个基因仅38个存在于
Agilent阵列上。在两种标志之间有3个基因重迭(cyclin E2、起点识别复合物和TNF超
家族蛋白)。尽管具有显著差异,两种标志都包括一些基因,所述基因鉴定了几种可能涉及
肿瘤复发的常见途径。这种发现支持了这样的思想,虽然在基因成员中可能有冗余,可能需
要有效的标志来包括特定途径的呈现。
[0267] 与van de Vijver et al.(2002)的研究相比,我们的研究的优点在于更大数目的未治疗的LNN患者(286vs.141),以及我们的76基因标记物对于年龄、绝经状态和肿瘤
大小的独立性。与其他的报道的90%相比,我们的患者的验证集与训练集完全没有重迭。
Ransohoff(2004)。总之,由于仅大约30-40%的未治疗LNN患者发生了肿瘤复发,该预后标
志可以提供有力的工具来鉴定那些低风险的患者,防止在相当数量的患者中的过度治疗。
在患有原发乳腺癌的患者中推荐辅助性全身治疗将来可以通过这种预后标志来指导。可以
在辅助情形或在患有转移性疾病的患者中测试我们的基因标志对于不同的全身性治疗方
式有效性的预测值。
[0268] 实施例7
[0269] 比较产自阶段I/II乳腺癌激光俘获显微解剖和大块组织的乳腺肿瘤基因分布型
[0270] 已经证明了基因表达分布型是对各种癌症类型的强大的诊断和预后工具。几乎在所有情况下大块肿瘤RNA被用于在芯片上杂交。在激素依赖性肿瘤的发展和生长中,雌激
素扮演了重要的角色。
[0271] 约75%的乳腺癌表达雌激素受体(ER),其是(辅助性)它莫西芬(tamoxifen)治疗的指示物,并与患者结局相关。
[0272] 为了看清在乳腺上皮细胞中由雌激素触发的机制以及它们与肿瘤发生的相关性,使用激光俘获显微解剖(LCM)来从29个早期原发乳腺肿瘤取得组织学上同质的肿瘤细胞
群体,与基因芯片表达分析相结合。这29位患者中,根据对肿瘤胞质液的定量配体结合或
酶免疫测定,11位是ER阴性,17位是ER阳性。为了对比,还使用分离自相同的29位患者
的组的大块组织RNA获得了基因表达分布型。
[0273] 从29位淋巴结阴性乳腺癌患者(肿瘤特征,表2)收集新鲜的冷冻组织样品,所述患者已经外科手术治疗了乳腺肿瘤,没有接受新的辅助性全身治疗。对于每个患者组织样
品,我们首先使用H&E载玻片来评估细胞形态。通过在低温恒温切片上进行LCM(PALM),和
从整个低温恒温切片,即相同肿瘤的大块组织获得肿瘤细胞,从两种肿瘤细胞分离RNA。通
过Agilent BioAnalyzer分析RNA样品质量。将RNA样品与含有大约22,000个探针集的
Affymetrix人类U133A芯片杂交。对荧光进行定量,对强度进行标准化。使用聚类分析和
主要成分分析来将患者按相似的基因表达分布型分组。选择在ER阳性和ER阴性样品之间
差别表达的基因。
[0274] 在目标制备中,分离自LCM取得的乳腺癌细胞的总RNA经历两轮基于T7的扩增,相比之下大块组织RNA经历一轮扩增。比较LCM数据集和大块组织集之间的21个对照基
因的表达水平(表7),来证明线性扩增的精确度。
[0275] 表7:对照基因列表
[0276]SEQ ID
名称
NO:
112 蛋白磷酸酶2,调节亚基B(B56),delta同种型
113 CCCTC结合因子(锌指蛋白)
114 溶质载体家族4(阴离子交换剂),成员1,衔接蛋白
115 核糖核酸酶P
116 假定的蛋白FLJ20188
117 KIAA0323蛋白
118 cDNA FLJ12469
119 翻译起始因子eIF-2b delta亚基
120 核不均一核糖核蛋白K
121 羟基甲基胆色烷合酶
122 cDNA DKFZp586O0222
123 染色体20开放阅读框4
124 甲状腺激素受体互作因子(interactor)4
125 次黄嘌呤磷酸核糖转移酶1(Lesch-Nyhan综合征)
126 DnaJ(Hsp40)同源物,亚族C,成员8
127 双特异性磷酸酶11(RNA/RNP复合物1-相互作用)
128 结合特应性相关自身抗原1
129 基质细胞衍生因子2
130 Ewing肉瘤断点区域1
131 CCR4-NOT转录复合物,亚基2
132 F-盒唯一蛋白7(F-box only protein7)
[0277] 获得的结果在表8和附图4-9中描述。
[0278] 表8 患者的临床特征
[0279]
[0280] 附图4是根据5121个基因的分级聚类,显示了LCM和大块组织样品根据全局RNA表达分布型是完全独立的。附图5是描述在分离自LCM样品和大块组织的RNA中21个对
照基因(表6)表达水平的柱形图,显示了用于LCM所获RNA的另一轮线性扩增没有引起对
照基因的差异表达。附图6是数据分析途径,附图7显示了使用过滤的基因集的PCA分析。
附图8是用来分配患者亚组的ER状态的饼分图。通过Student t-测验来定义LCM和大块
组织样品中ER阳性和ER阴性的亚簇(sub-clusters)之间差异表达的基因。附图9是一
系列柱形图,显示了通过Gene Ontology对LCM样品中、仅在大块组织中,和对于LCM和大
块组织是共有的那些样品中仅与ER相关的基因的途径分析的结果。
[0281] 总的来说,获得的结果显示几个重要的结论。首先,在大块组织数据集和LCM数据集中都看到了ER-/ER+患者中与细胞增殖和能量代谢相关的基因的差别表达。第二,
由于通过LCM对乳腺癌细胞的富集,发现涉及细胞表面受体相关信号转导、RAS信号转导、
JAK-STAT信号转导和细胞凋亡的基因与ER状态相关。在大块数据集中没有鉴定出这些基
因。第三,显微解剖提供了研究上皮细胞瘤的敏感方法,以及对与雌激素受体相关的信号途
径的了解。因此,明显的是,对LCM分离的肿瘤细胞应用在此描述的基因表达分布型与在异
质大块组织中获得的结果相当。
[0282] 实施例8
[0283] 在乳腺癌中76基因预后标志的验证和途径分析
[0284] 这个实施例报告了验证研究的结果,在所述验证研究中,76基因标志被用于预测来自4个独立来源的132位患者的结局。
[0285] 此外,为了评估这些基因标志的强大程度,这个实施例进一步提供了鉴定所述标志的可替代成分,并描述了这样的替换如何产生有效标志中关键途径的鉴定。
[0286] 新鲜的冷冻组织样品收集自132位患者,所述患者已经手术治疗了乳腺肿瘤,并且没有接受辅助性全身治疗。使用的患者样品收集自1980和1996年之间(附图10)。
对于每个患者组织样品,使用H&E载玻片来评估细胞形态。然后制备总RNA样品,通过
AgilentBioAnalyzer分析样品质量。通过微阵列分析来分析RNA样品。对荧光进行定量,
对强度进行标准化。根据76个基因标志的表达水平对每个患者计算复发危险分值。将患
者分成良好和不良结局组。附图11和12。
[0287] 为了评估这个基因标志的强大程度,设计和使用了两种统计分析。附图13。首先,重复了我们用来发现该76基因标志的基因选择和标志构建过程。如表8所示,从总共286
位患者中随机选择115位患者的十个训练集。余下的患者充当测试集。
[0288] 第二,将训练集中的患者数目增加到286位患者的80%,使用剩余的20%患者作为测试集。这个选择过程也重复10次。在两种过程中,使用Kaplan-Meier存活曲线来确保
训练和测试对之间无疾病存活方面没有显著差异。选择基因,使用Cox’s比例-危险回归
从每个训练集构建标志。在相应的测试集中验证每个标志。此外,使用GO本体论分类法将
76基因预后标志分类到功能组中。选择覆盖了标志中显著数量的基因的途径(p值<0.05
以及>2次命中)。还在来自不同训练集的所有预后标志中评估了所选择的途径。
[0289] 在表9中,A含有使用115位患者的训练集的10个标志的结果,B含有使用80%患者的训练集的10个标志的结果。
[0290]
[0291] 这个实施例中获得的结果显示了:
[0292] ●在132位独立患者中成功地验证了76基因标志,在来自4个独立来源的132位LNN乳腺癌患者中得出0.757的AUC值。该标志显示了88%的敏感性和41%的特异性。
[0293] ●取代标志的平均AUC是0.64(95%CI:0.53-0.72)。这个结果与76基因预测物的相一致(AUC0.69)。在76基因标志中过量呈现的21个途径也在所有其他预后标志中发
现,表明了在肿瘤复发中涉及共同的生物学途径。
[0294] ●这些结果表明,基因表达分布型提供了进行患者结局的风险评估的强大方法。该数据突出了为患者提供肿瘤复发的定量测定的分子性预后分析的可行性。
[0295] 尽管已经通过例示和举例为了清楚和理解的目的较详细地描述了上述发明,这些说明和实施例不应被看作限制本发明的范围。
[0296] 表10.
[0297] 序列标识
[0298]SEQ ID
Psid 基因名称 登记# 基因描述
NO:
1 213165_at CDABP0086 AI041204
2 217432_s_at AF179281 杜糖酸2-硫酸酯酶(Hunter综合症)
3 221500_s_at BE782754 syntaxin16/
4 208452_x_at MYO9B NM_004145 肌球蛋白IXB
5 220234_at CA8 NM_004056 酸酐酶VIII
6 207865_s_at BMP8 NM_001720 骨骼形态发生蛋白8(成骨蛋白2)
7 201769_at KIAA0171 NM_014666 KIAA0171基因产物
8 218940_at FLJ13920 NM_024558 假定的蛋白FLJ13920
9 209018_s_at BRPK BF432478 蛋白激酶BRPK
DKFZp586L1
10 216647_at AL117663 来自克隆DKFZp586L1824
824
DKFZp564E1
11 213405_at N95443 来自克隆DKFZp564E122
22
12 202921_s_at ANK2 NM_001148 锚蛋白2,神经元的,转录产物变体1
具有CA二核苷酸重复的胰高血糖素样
13 208401_s_at U01157
肽-1受体
14 218090_s_at WDR11 NM_018117 WD40重复结构域11蛋白
15 218139_s_at FLJ10813 NM_018229 假定的蛋白FLJ10813
甲基-CpG结合结构域蛋白2,转录产物
16 202485_s_at MBD2 NM_003927
变体1
17 201357_s_at SF3A1 NM_005877 剪接因子3a,亚基1,120kD
18 214616_at H3FD NM_003532 H3组蛋白家族,成员D
19 207719_x_at KIAA0470 NM_014812 KIAA0470基因产物
甲状腺激素受体互作因子(interactor)
20 202734_at TRIP10 NM_004240
10
21 202175_at FLJ22678 NM_024536 假定的蛋白FLJ22678
22 213870_at AL031228 染色体6p21.2-21.31上的克隆1033B10
23 208967_s_at adk2 U39945 腺苷酸激酶2
24 204312_x_at AI655737 cAMP应答元件结合蛋白1
25 203815_at GSTT1 NM_000853 谷胱甘肽S-转移酶ζ1
26 207996_s_at C18ORF1 NM_004338 染色体18开放阅读框1
27 221435_x_at HT036 NM_031207 假定的蛋白HT036
28 219987_at FLJ12684 NM_024534 假定的蛋白FLJ12684
29 221559_s_at MGC:2488 BC000229 克隆MGC:2488
30 207007_at NR1I3 NM_005122 核受体亚族1,组1,成员3
31 219265_at FLJ13204 NM_024761 假定的蛋白FLJ13204
32 40420_at AB015718 蛋白激酶的lokmRNA
33 202266_at AD022 NM_016614 TRAF和TNF受体相关蛋白
34 219522_at FJX1 NM_014344 fjx1的推定的分泌配体同源物
35 212334_at AKAP350C BE880245 AKAP350C,选择性剪接的
36 219340_s_at CLN8 AF123759 推定的跨膜蛋白
37 217771_at GP73 NM_016548 Golgi膜蛋白(LOC51280)
推定的跨膜蛋白;酵母Golgi膜蛋白的
38 202418_at Yif1p NM_020470
同源物
39 206295_at IL-18 NM_001562 白细胞介素18
40 201091_s_at BE748755 异染色质样蛋白
41 204015_s_at DUSP4 BC002671 双特异性磷酸酶4
42 200726_at PPP1CC NM_002710 蛋白磷酸酶1,催化亚单位,γ同种型
肌动蛋白结合LIM蛋白1,转录产物变
43 200965_s_at ABLIM-s NM_006720

44 210314_x_at TRDL-1 AF114013 肿瘤坏死因子相关死亡配体1γ
45 221882_s_at M83 AI636233 五跨度跨膜蛋白
46 217767_at C3 NM_000064 互补物成分3
47 219588_s_at FLJ20311 NM_017760 假定的蛋白
48 204073_s_at C11ORF9 NM_013279 染色体11开放阅读框9
49 212567_s_at AL523310 推定的翻译起始因子
50 211382_s_at TACC2 AF220152
51 201663_s_at CAP-C NM_005496 染色体相关多肽C
[0299]52 221344_at OR12D2 NM_013936 嗅感受蛋白,家族12,亚族D,成员2
53 210028_s_at ORC3 AF125507 起点识别复合物亚基3
54 218782_s_at PRO2000 NM_014109 PRO2000蛋白
55 201664_at SMC4 AL136877 (酵母染色体4的结构维持)样
56 219724_s_at KIAA0748 NM_014796 KIAA0748基因产物
57 204014_at DUSP4 NM_001394 双特异性磷酸酶4
58 212014_x_at CD44 AI493245 CD44
59 202240_at PLK1 NM_005030 Polo(果蝇)样激酶1
KSR样的连接物增强子(ras的果蝇激
60 204740_at CNK1 NM_006314
酶抑制物)
61 208180_s_at H4FH NM_003543 H4组蛋白家族,成员H
62 204768_s_at FEN1 NM_004111 Flap结构特异性核酸内切酶
63 203391_at FKBP2 NM_004470 FK506结合蛋白2
Karyopherinα2(RAG cohort1,
211762_s_at KPNA2 BC005978
importinα1)
65 218914_at CGI-41 NM_015997 CGI-41蛋白
66 221028_s_at MGC11335 NM_030819 假定的蛋白MGC11335
67 211779_x_at MGC13188 BC006155 克隆MGC:13188
68 218883_s_at FLJ23468 NM_024629 假定的蛋白FLJ23468
69 204888_s_at AA772093 Neuralized(果蝇)样
染色质特异性转录延伸因子,140kD亚
70 217815_at FACTP140 NM_007192

71 201368_at Tis11d U07802
72 201288_at ARHGDIB NM_001175 Rho GDP分离抑制物(GDI)β
蛋白酶体(prosome,macropain)26S
73 201068_s_at PSMC2 NM_002803
亚基,ATPase,2
DKFZP434E2
74 218478_s_at NM_017612 假定的蛋白DKFZP434E2220
220
75 214919_s_at KIAA1085 R39094
76 209835_x_at BC004372 类似于CD44
77 217471_at AL117652
溶质载体家族35(CMP唾液酸转运蛋
78 203306_s_at SLC35A1 NM_006416
白),成员1
79 205034_at CCNE2 NM_004702 Cyclin E2
80 221816_s_at BF055474 推定的锌指蛋白NY-REN-34抗原
81 219510_at POLQ NM_006596 聚合酶(DNA指导的)ζ
82 217102_at AF041410 恶性肿瘤相关蛋白
83 208683_at CANP M23254 Ca2活化的中性蛋白酶大亚基
84 215510_at AV693985 ets变体基因2
85 218533_s_at FLJ20517 NM_017859 假定的蛋白FLJ20517
86 215633_x_at LST-1N AV713720 LST-1N蛋白的mRNA
Hs234898EST,微弱地类似于2109260A
87 221928_at AI057637
B细胞生长因子
88 214806_at BICD U90030 Bicaudal-D
89 204540_at EEF1A2 NM_001958 真核的翻译延伸因子1α2
90 221916_at BF055311 假定的蛋白
DKFZp434C1
91 216693_x_at AL133102
722
92 209500_x_at AF114012 肿瘤坏死因子相关死亡配体-1β
93 209534_at FLJ10418 AK001280 中度类似于肝细胞瘤衍生的生长因子
94 207118_s_at MMP23A NM_004659 基质金属蛋白酶23A
95 211040_x_at BC006325 G-2和S期表达的1
96 218430_s_at FLJ12994 NM_022841 假定的蛋白FLJ12994
97 217404_s_at X16468 α-1II类胶原蛋白
98 205848_at GAS2 NM_005256 生长延滞特异性2
克隆HEMBA1005931,微弱地类似于锌
99 214915_at FLJ11780 AK021842
指蛋白83
100 216010_x_at D89324 α(1,31,4)岩藻糖基转移酶
101 204631_at MYH2 NM_017534 肌球蛋白重肽2骨骼肌成年人
102 202687_s_at U57059 Apo-2配体mRNA
103 221634_at BC000596 类似于核糖体蛋白L23a,克隆MGC:2597
104 220886_at GABRQ NM_018558 γ-基丁酸(GABA)受体,ζ
ADP-核糖基转移酶(NAD+;聚(ADP-
105 202237_at ADPRTL1 NM_006437
核糖)聚合酶)样1
DKFZP564M
106 204218_at NM_014042 蛋白DKFZP564M082
082
107 221241_s_at BCLG NM_030766 细胞凋亡调节物BCL-G
类似于KIAA0092基因产物,克隆
108 209862_s_at BC001233
MGC:4896
含有新的基因和类似X连接的核糖体蛋
109 217019_at RPS4X AL137162
白4的新蛋白基因的5部分
110 210593_at M55580 亚精胺精胺N1转乙酰酶
111 216103_at KIAA0707 AB014607 KIAA0707
蛋白磷酸酶2,调节亚基B(B56),delta
112 202513_s_at PPP2R5D NM_006245
同种型
113 202521_at CTCF NM_006565 CCCTC结合因子(锌指蛋白)
溶质载体家族4(阴离子交换剂),成员
114 218682_s_at SLC4A1AP NM_018158
1,衔接蛋白
115 203436_at RPP30 NM_006413 核糖核酸酶P
116 220127_s_at FLJ20188 NM_017703 假定的蛋白FLJ20188
117 212355_at KIAA0323 AI075450 KIAA0323蛋白
118 215158_s_at FLJ12469 AK022531 cDNA FLJ12469
119 209429_x_at AF112207 翻译起始因子eIF-2b delta亚基
120 200097_s_at AI701949 核不均一核糖核蛋白K
121 203040_s_at HMBS NM_000190 羟基甲基胆色烷合酶
DKFZp586O
122 221647_s_at AL136935 克隆DKFZp586O0222
0222
染色体20开放阅读框4
123 218089_at C20orf4 NM_015511
DKFZP564N1363
甲状腺激素受体互作因子(interactor)
124 203732_at TRIP4 NM_016213
4
次黄嘌呤磷酸核糖转移酶1(Lesch-
125 202854_at HPRT1 NM_000194
Nyhan综合征)
DnaJ(Hsp40)同源物,亚族C,成员
126 205545_x_at DNAJC8 NM_014280
8
双特异性磷酸酶11(RNA/RNP复合物1-
127 202703_at DUSP11 NM_003584
相互作用)
128 216903_s_at CBARA1 AK022697 钙结合特应性相关自身抗原1
129 203090_at SDF2 NM_006923 基质细胞衍生因子2
130 209214_s_at EWSR1 BC004817 Ewing肉瘤断点区域1
131 217798_at CNOT2 AI123426 CCR4-NOT转录复合物,亚基2
132 201178_at FBXO7 NM_012179 F-box唯一的蛋白7
133 212160_at AI984005 输出蛋白,tRNA(tRNA的核输出受体)
134 201111_at CSE1 AF053641 脑细胞的细胞凋亡敏感性蛋白
135 201112_s_at CSE1L NM_001316 染色体分离1(酵母同源物)样
额外的纺锤极,S.cerevisiae,
136 204817_at KIAA0165 NM_012291
(KIAA0165)的同源物
137 215623_x_at FLJ11338 AK002200 高度类似于染色体相关多肽C mRNA
138 38158_at KIAA0165 D79987
非组蛋白染色体蛋白2(S.cerevisiae)
139 201076_at NHP2L1 NM_005008
样1
140 201947_s_at CCT2 NM_006431 含有chaperonin的TCP1,亚基2(beta)
成神经细胞瘤RAS病毒(v-ras)癌基因
141 202647_s_at NRAS NM_002524
同源物
142 202705_at CCNB2 NM_004701 cyclin B2
v-Ki-ras2Kirsten大鼠肉瘤2病毒癌基
143 204009_s_at NM_004985
因同源物
144 204566_at PPM1D NM_003620 蛋白磷酸酶1D镁依赖性,delta同种型
145 214710_s_at BE407516
146 202095_s_at BIRC5 NM_001168 baculoviral IAP含重复5(存活蛋白)
147 204900_x_at SAP30 NM_003864 sin3相关多肽,30kD
148 201986_at KIAA0593 AB011165 KIAA0593蛋白mRNA,cds部分
甲状腺激素受体相关蛋白,240kDa亚
149 201987_at AI984051

150 203605_at SRP54 NM_003136 信号识别粒子54kD
151 213226_at AI346350 多肌炎硬皮病自身抗原(75kd)
152 205757_at ENTPD5 NM_001249 外核苷三磷酸盐二磷酸水解酶5
153 212062_at KIAA0611 AB014511 KIAA0611蛋白的mRNA
154 213007_at W74442 聚合酶(DNA指导的),γ
MAD2(有丝分裂延滞缺陷,酵母,同
155 203362_s_at MAD2L1 NM_002358
源物)样1
NIMA(不在有丝分裂基因a中)-rel.激
156 204641_at NEK2 NM_002497
酶2
157 206983_at CCR6 NM_004367 趋化因子(C-C基序)受体6
158 210375_at EP3a2 X83858 前列腺素E受体
DKFZp586M
159 213933_at AW242315 来自克隆DKFZp586M0723
0723
160 201756_at RPA2 NM_002946 复制蛋白A2(32kD)
161 208688_x_at eIF3 U78525 真核的翻译起始因子
162 212655_at KIAA0579 AB011151 KIAA0579蛋白
163 213124_at BG538800 DKFZP434N043蛋白
164 213520_at RECQL4 NM_004260 RecQ蛋白样4
165 218277_s_at FLJ22060 NM_024612 假定的蛋白FLJ22060
166 201938_at DOC1 NM_004642 口腔癌中删除的(小鼠,同源物)1
167 202692_s_at UBTF NM_014233 上游结合转录因子,RNA聚合酶I
168 203616_at POLB NM_002690 聚合酶(DNA指导的),β
169 204407_at AF080255 北极星蛋白
170 206188_at KIAA0628 NM_014789 KIAA0628基因产物
171 209831_x_at AB004574 脱核糖核酸酶II,溶酶体
172 211980_at AI922605 胶原蛋白,IV型,α1
173 214853_s_at AI091079 (含有Src同源性2结构域)转化蛋白1
174 215888_at FLJ23236 AK026889 克隆COL00725
转录因子7样2(T细胞特异性,HMG-
175 216037_x_at AA664011
盒)
176 202666_s_at BAF53A NM_004301 BAF53
[0300]177 204146_at BE966146 RAD51相互作用蛋白
178 203920_at NR1H3 NM_005693 核受体亚族1,组H,成员3
179 205322_s_at AW182367 金属调节转录因子1
180 206644_at NR0B1 NM_000475 核受体亚族0,组B,成员1
181 201558_at RAE1 NM_003610 (RNA输出1,S.pombe)同源物
182 209448_at BC002439 Tat相互作用蛋白(30kD)
183 220960_x_at RPL22 NM_000983 核糖体蛋白L22
staufen(果蝇,RNA结合蛋白)转录产
184 207320_x_at STAU NM_004602
物变体T4
185 208948_s_at MGC:4921 BC000830 MGC:4921
staufen蛋白,部分果蝇,RNA结合蛋
186 213037_x_at AJ132258

187 200725_x_at RPL10 NM_006013 核糖体蛋白L10
188 200937_s_at RPL5 NM_000969 核糖体蛋白L5
含有PNAS-102mRNA chaperonin的
189 208696_at PNAS-102 AF275798
TCP1,亚基5(epsilon)
190 209593_s_at FKSG18 AF317129 FKSG18
191 209619_at K01144 MHCII抗原γ链
192 218336_at PFDN2 NM_012394 prefoldin2
193 219390_at FLJ20731 NM_017946 假定的蛋白FLJ20731
194 206976_s_at HSP105B NM_006644 热激105kD
195 204444_at KNSL1 NM_004523 驱动蛋白样1
196 206364_at KIAA0042 NM_014875 KIAA0042基因产物
197 209408_at U63743 有丝分裂着丝点相关驱动蛋白
淀粉样蛋白β前体蛋白(细胞质尾部)
198 202629_at APPBP2 AV681579
结合蛋白2
淀粉样蛋白β前体蛋白(细胞质尾部)
199 202630_at APPBP2 AA046411
结合蛋白2
淀粉样蛋白β前体蛋白(细胞质尾部)
200 202631_s_at APPBP2 NM_006380
结合蛋白2
201 210629_x_at AF000425 cLST1A剪接变体
202 204670_x_at HLA-DRB5 NM_002125 MHC,II类,DRβ5
203 208306_x_at HLA-DRB4 NM_021983 MHC,II类,DRβ4
聚合酶(RNA)III(DNA指导的)
204 206654_s_at RPC32 NM_006467
(32kD)
205 218360_at RAB22A NM_020673 RAB22A,成员RAS癌基因家族
206 209380_s_at CFTRMRP AF146074 ABC蛋白,TP结合盒,亚族C
proteasome(prosome,macropain)亚
207 201114_x_at PSMA7 NM_002792
基,α型,7
proteasome(prosome,macropain)亚
208 202243_s_at PSMB4 NM_002796
基,β型,4
proteasome(prosome,macropain)亚
209 202244_at PSMB4 NM_002796
基,β型,4
210 203878_s_at MMP11 NM_005940 基质金属蛋白酶11(stromelysin3)
211 216474_x_at AF206667 肥大细胞βI类胰蛋白酶,选择性剪接的
染色体6p12-21.3上来自克隆RP3-
212 217009_at AL121974
417L20的DNA序列
213 202968_s_at Dyrk2 Y09216 蛋白激酶的mRN A,Dyrk2
214 202969_at AI216690 双特异性酪氨酸(Y)磷酸化调节激酶2
215 204092_s_at STK15 NM_003600 丝氨酸苏氨酸激酶15
216 204171_at RPS6KB1 NM_003161 核糖体蛋白S6激酶,70kD,多肽1
217 204825_at KIAA0175 NM_014791 KIAA0175基因产物
218 208079_s_at STK6 NM_003158 丝氨酸苏氨酸激酶6
219 219148_at TOPK NM_018492 PDZ结合激酶;T细胞来源的蛋白激酶
220 219813_at LATS1 NM_004690 LATS(大肿瘤抑制物,果蝇)同源物1
221 202779_s_at E2-EPF NM_014501 遍在蛋白载体蛋白
222 217978_s_at HSA243666 NM_017582 NICE-5蛋白
223 210413_x_at SCCA2 U19557 鳞状细胞癌抗原2
224 219478_at WFDC1 NM_021197 WAP四二硫化物核心结构域1
225 204319_s_at RGS10 NM_002925 G蛋白信号调节物10
KDEL(Lys-Asp-Glu-Leu)内质网蛋白
226 204017_at KDELR3 NM_006855
保留受体3
227 206150_at TNFRSF7 NM_001242 肿瘤坏死因子受体超家族,成员7
228 205926_at WSX-1 NM_004843 I类细胞因子受体
Wiskott-Aldrich综合症(湿疹-血小板减
229 205400_at WAS NM_000377
少)
230 209539_at KIAA0006 D25304 KIAA0006基因的mRNA
231 221922_at AW195581 KIAA0761蛋白
232 200614_at CLTC NM_004859 内涵蛋白,重的多肽(Hc)
VAMP(囊相关膜蛋白)相关蛋白B和
233 202550_s_at VAPB NM_004738
C
234 212159_x_at AI125280 衔接头相关蛋白复合物2,α2亚基
前胶原-脯氨酸2-戊二酸4-加双氧酶
235 202733_at P4HA2 NM_004199
(脯氨酸4-羟化酶)α多肽II
236 208905_at BC005299 细胞色素C,克隆MGC:12367
237 32137_at JAG2 AF029778 Jagged2
亲核蛋白α2(RAG群组1,输入蛋白
238 201088_at KPNA2 NM_002266
α1)
转录延伸因子B(SIII),多肽1(15kD,
239 202824_s_at TCEB1 NM_005648
elongin C)
核RNA解旋酶,DEAD盒家族的DECD
240 201584_s_at DDXL NM_005804
变体
241 218461_at LOC51184 NM_016301 蛋白x0004(LOC51184)
242 204489_s_at CD44 NM_000610 CD44
243 204490_s_at CDw44 M24915 CDw44抗原
244 207165_at HMMR NM_012485 透明质酸介导的运动受体(RHAMM)
245 210916_s_at CD44 AF098641 CD44同种型RC
246 212063_at CMPX1 BE903880 锌指蛋白6
GRO1癌基因(黑素瘤生长刺激活性,
247 204470_at GRO1 NM_001511
α)
248 207430_s_at MSMB NM_002443 microseminoprotein,β
249 210297_s_at U22178 前列腺分泌蛋白57
250 213009_s_at FLJ12639 AK022701 cDNA FLJ12639
251 203536_s_at CIAO1 NM_004804 WD40蛋白Ciaol
252 204026_s_at ZWINT NM_007057 ZW10互作因子
253 204435_at KIAA0410 NM_014778 KIAA0410基因产物
溴结构域PHD指转录因子的BPTF
254 209271_at AB032251
mRNA
255 212074_at KIAA0810 BE972774 KIAA0810蛋白
256 218009_s_at PRC1 NM_003981 胞质分裂1的蛋白调节物
257 218768_at NUP107 NM_020401 核孔复合体蛋白
258 M331973_at GAPDH M33197 甘油醛-3-磷酸脱氢酶
259 203524_s_at MPST NM_021126 巯基丙酮酸硫酸转移酶
半乳糖胺(N-乙酰基)-6-硫酸盐硫酸酯
260 206335_at GALNS NM_000512
酶(Morquio综合症,粘多糖病IVA型)
261 203503_s_at PEX14 NM_004565 过氧化物酶体发生因子14
长-磷酸盐甘露糖基转移酶多肽1,催化
262 202673_at DPM1 NM_003859
亚基1
前胶原-脯氨酸,2-酮戊二酸4-加双氧酶
263 207543_s_at P4HA1 NM_000917
(脯氨酸4羟化酶),α多肽I
264 204192_at CD37 NM_001774 CD37抗原
蛋白酪氨酸磷酸酶,受体型,C相关蛋
265 204960_at PTPRCAP NM_005608

266 211991_s_at M27487 MHC II类DPw3-α-1链
267 200822_x_at TPI1 NM_000365 磷酸丙糖异构酶1
268 219502_at FLJ10858 NM_018248 假定的蛋白FLJ10858
269 219499_at FLJ10578 NM_018144 假定的蛋白FLJ10578
270 209238_at BE966922 syntaxin3A
271 212593_s_at N92498
272 201598_s_at INPPL1 NM_001567 环己六醇多磷酸磷酸酶样1
273 201760_s_at LOC55884 NM_018639 含CS盒的WD蛋白
274 222077_s_at AU153848 GTPase活化蛋白
275 203764_at KIAA0008 NM_014750 KIAA0008基因产物
276 59705_at AA911739
277 204070_at RARRES3 NM_004585 视黄酸受体效应器(tazarotene诱导的)3
278 212149_at AW470003
DKFZp586E1
279 214039_s_at T15777 DKFZp586E1124
124
280 217956_s_at MASA NM_021204 E-1酶
281 200994_at BG291787 RAN结合蛋白7
282 200995_at AI741392
283 205106_at MTCP1 NM_014221 成熟T细胞增殖1
284 209035_at hMK-1 M69148 Midkine(生长促进因子2)
285 210311_at FGF5 AF171928 纤维细胞生长因子5短变体
286 211251_x_at NFY-C U78774 NFY-C mRNA
287 220406_at TGFB2 NM_003238 转化生长因子,β2
288 206967_at CCNT1 NM_001240 cyclin T1
289 204252_at M68520 cdc2相关蛋白激酶mRNA
290 205955_at FLJ11136 NM_018336 假定的蛋白FLJ11136
291 203258_at DRAP1 NM_006442 DR1-assoc.蛋白1(阴性辅助因子2α)
292 204022_at AI668780
营养不良蛋白(肌营养不良,Duchenne
293 207660_at NM_004019
和Becker型),
促分裂素活化蛋白激酶-活化的蛋白激酶
294 215050_x_at BG325734
2
295 204337_at AL514445 G蛋白信号调节物4
296 217687_at AA224446
类似于S.cerevisiae Prp18的前mRNA
297 221546_at BC000794
剪接因子
298 206546_at SYCP2 NM_014258 联会复合体蛋白2
299 206278_at D10202 血小板活化因子受体的mRNA
300 206429_at F2RL1 NM_005242 凝结因子II(凝血酶)受体样1
301 216408_at AJ302584 嗅感受蛋白的基因,细胞系BM28.7
302 221306_at GPR27 NM_018971 G蛋白联结受体27
303 221442_at MC3R NM_019888 melanocortin3受体
304 201446_s_at BF692742
C3H型锌指蛋白;类似于D.melanogaster
305 205018_s_at NM_005757
muscleblind B蛋白(MBLL)
306 214379_at AI954458
307 214698_at AW190873
308 219336_s_at NM_015947 CGI-18蛋白(LOC51008)
309 220760_x_at FLJ14345 NM_024733 假定的蛋白FLJ14345
310 221480_at BG180941
311 221615_at PPIE AF104013 肽酰-脯氨酰顺-反异构酶E
nucleophosmin(核仁磷蛋白B23,
312 221923_s_at AA191576
numatrin)
313 201211_s_at DDX3 AF061337 DEAD盒RNA解旋酶DDX3
314 205638_at BAI3 NM_001704 脑特异性血管生成抑制物3
315 205881_at ZNF74 NM_003426 锌指蛋白74(Cos52)
316 206179_s_at NM_007030 脑特异性蛋白质p25α(p25)
317 206308_at AJ223333 推定的DNA甲基转移酶的mRNA
318 207361_at HBP1 NM_012257 含HMG盒的蛋白1
319 208902_s_at BF431363
320 209603_at AI796169
321 214174_s_at BE043700
322 215747_s_at X06130 细胞周期基因RCC1的mRNA
323 216480_x_at AF10CALM AF060927 I型AF10CALM融合蛋白
324 216711_s_at M73444 CCG1p mRNA
325 222115_x_at BC003693 类似于RIKEN cDNA3930401K13基因
DKFZp434J0
326 221686_s_at AL136869 DKFZp434J0450
450
327 210533_at MSH4 AF104243 减数分裂特异性MutS同源物
328 217485_x_at hPMS3 D38435 hPMS3mRNA
329 202162_s_at AI769416 CCR4-NOT转录复合物,亚基8
血清响应因子(c-fos血清响应元件结合
330 202401_s_at SRF NM_003131
转录因子)
331 206067_s_at NM_024426 Wilms瘤1(WT1),转录产物变体D
332 206127_at ELK3 NM_005230 ETS结构域蛋白(SRF附属蛋白2)
333 207402_at ZNF132 NM_003433 锌指蛋白132
334 207768_at EGR4 NM_001965 早期生长反应4
335 208414_s_at HOXB3 NM_002146 相似盒B3
克隆TCCCIA00046,上游转录因子2,
336 214879_x_at AY007087
c-fos相互作用
337 219314_s_at ZNF219 NM_016423 锌指蛋白219
338 219779_at FLJ20980 NM_024721 假定的蛋白FLJ20980
339 220653_at ZIM2 NM_015363 锌指,印记2
340 219778_at FOG2 NM_012082 GATA2的朋友
341 203947_at CSTF3 NM_001326 裂解刺激因子,3前RNA,亚基3,77kD
342 220096_at FLJ20378 NM_017795 假定的蛋白FLJ20378
chaperonin cont′ing TCP1,亚基6A
343 201326_at BE737030
(zeta1)
344 206769_at TMSB4Y NM_004202 胸腺素,β4,Y染色体
345 211197_s_at KIAA0653 AL355690 来自克隆34465的EST,完全插入物
346 204994_at MX2 NM_002463 粘病毒(流感)抗性2,鼠同源物
347 201662_s_at D89053 Acyl-CoA合成酶3
348 206141_at MOCS3 NM_014484 molybdopterin合酶硫酸化酶
349 209992_at AB044805 6-phosphofructo-2-激酶心脏同种型
血小板活化因子乙酰基水解酶,同种型
350 210160_at BC000398
Ib,β亚基(30kD),
351 218016_s_at FLJ10509 NM_018119 假定的蛋白FLJ10509
352 220582_at FLJ12190 NM_025071 假定的蛋白FLJ12190
353 222294_s_at AW971415
ADP-核糖基转移酶(NAD+;聚(ADP-
354 202239_at ADPRTL1 NM_006437
核糖)聚合酶)样1
355 205342_s_at AF026303 磺基转移酶家族,cytosolic,1C,成员1
356 202294_at AI126490
357 201597_at COX7A2 NM_001865 Cyt C氧化酶亚基VIIa多肽2(肝脏)
358 206353_at COX6A2 NM_005205 Cyt C氧化酶亚基VIa多肽2
359 218739_at LOC51099 NM_016006 CGI-58蛋白
360 217557_s_at AV710357
361 202413_s_at USP1 NM_003368 遍在蛋白特异性蛋白酶1
362 213661_at AI671186 DKFZP586H2123蛋白
363 212729_at AI916274 KIAA1232蛋白
364 202951_at BE048506 丝氨酸苏氨酸蛋白激酶
365 207667_s_at MAP2K3 NM_002756 促分裂素活化蛋白激酶3
366 212565_at BE302191 KIAA0965蛋白
367 212740_at BF740111 磷酸肌醇-3-激酶,调节亚基4,p150
368 213490_s_at AI762811 促分裂素活化蛋白激酶2
369 213595_s_at KIAA0451 AA127643 KIAA0451基因产物
370 220640_at CSNK1G1 NM_022048 酪蛋白激酶1,γ1
371 207569_at ROS1 NM_002944 v-ros禽类UR2肉瘤病毒癌基因同源物1
372 209041_s_at BG395660 遍在蛋白共轭物酶E2G2
373 207214_at PEC-60 NM_014471 胃肠肽
374 214425_at AV645756 α-1-mic roglobulinbikunin前体
375 203650_at EPCR NM_006404 蛋白C受体,内皮的
376 210733_at PRO1292 AF130055 FLB4941PRO1292,转位链相关膜蛋白
377 220056_at IL22R NM_021258 白细胞介素22受体
CD79A抗原(免疫球蛋白相关α)转录
378 205049_s_at CD79A NM_001783
产物变体1
杀伤细胞抑制的受体同源物cl-9
379 211245_x_at AF002256 mRNA,FEAn样受体,两个结构域,
长细胞质尾部,4
380 212128_s_at AW411370 dystroglycan1(dystrophin相关糖蛋白1)
381 205019_s_at VIPR1 NM_004624 血管活性肠肽受体1
382 206001_at NPY NM_000905 神经肽Y
MAMMA100
383 216289_at AU148039 MAMMA1002427
2427
384 208250_s_at DMBT1 NM_004406 在恶性脑肿瘤中的删除1
[0301]385 202091_at BC003087 Arl Two的粘合物,克隆MGC:1121
与病灶粘附激酶pp125相关的GTPase
386 205068_s_at BE671084
调节物(FAK)
387 221136_at GDF2 NM_016204 生长变异因子2
388 202688_at TNFSF10 NM_003810 肿瘤坏死因子(配体)超家族,成员10
coatomer蛋白质复合物,亚基α,TNF
389 214336_s_at TNFSF10 AI621079
(配体)超家族,成员10
CD47抗原(Rh相关抗原,整联蛋白相
390 213055_at BF693956
关信号传感器)
391 201719_s_at EPB41L2 NM_001431 红血球膜蛋白带4.1样2
392 208353_x_at ANK1 NM_020480 锚蛋白1,红血球的转录产物变体7
393 215717_s_at X62009 肌原纤维蛋白5的部分mRNA
394 206826_at PMP2 NM_002677 周围的=髓鞘质蛋白2
395 207542_s_at AQP1 NM_000385 aquaporin1(通道形成整合蛋白,28kD)
396 207596_at PRO2176 NM_018515 假定的蛋白PRO2176
397 208297_s_at EVI5 NM_005665 亲嗜性病毒整合位点5
398 217289_s_at G6PT AF097831 葡糖-6-磷酸转运蛋白
转运蛋白;系统N1联结Na+和H+的谷
399 205972_at NM_006841
399
氨酰胺转运蛋白(G17)
400 218835_at SFTPA2 NM_006926 表面活性剂部相关蛋白A2
401 219716_at APOL6 NM_030641 载脂蛋白L,6
溶质载体家族37(甘油-3-磷酸盐转运蛋
402 218928_s_at SLC37A1 NM_018964
白),成员1
403 214205_x_at FLJ12069 AK022131 FLJ12069
DNA依赖性蛋白激酶催化亚单位相互作
404 205008_s_at KIP2 NM_006383
用蛋白2
405 211272_s_at DAGK1 AF064771 克隆24甘油二酯激酶α
406 206316_s_at KIAA0166 NM_014708 KIAA0166基因产物
407 209737_at KIAA0705 AB014605 KIAA0705蛋白
408 213117_at FLJ10262 AW138594 假定的蛋白FLJ10262
409 217161_x_at X17406 软骨特异性蛋白多糖
410 209436_at KIAA0762 AB018305 KIAA0762蛋白
411 213993_at AI885290 spondin1,(f-spondin)细胞外基质蛋白
N-酰基鞘氨醇氨基水解酶(酸性神经酰
412 214354_x_at T91506
胺酶)样
413 205799_s_at M95548 氨基酸转运蛋白
溶质载体家族16(一元羧酸转运蛋白),
414 213522_s_at AA527578
成员3
染色体22上来自克隆579N16的DNA
415 212393_at AL096767
序列
416 219179_at LOC51339 NM_016651 肝细胞癌新基因-3蛋白
B细胞抑制物中kappa轻多肽基因增强
417 201502_s_at AI078167
子的核因子,α
外线粒体膜70的移位酶(酵母)同源物
418 201512_s_at BC003633
A
419 201576_s_at GLB1 NM_000404 半乳糖苷酶,β1
420 201765_s_at AL523158
421 215155_at HEXA J04178 异常β-氨基己糖苷酶α链
422 203518_at CHS1 NM_000081 Chediak-Higashi综合症1
423 220801_s_at HAO2 NM_016527 醇酸氧化酶2(长链)
424 204690_at STX8 NM_004853 syntaxin8
甘露糖基(α-,3-)-糖蛋白β-2-N-乙酰
425 201126_s_at MGAT1 NM_002406
基glucosaminyl转移酶
唾液酸转移酶8(α-28-聚唾液酸转移
426 206925_at SIAT8D NM_005668
酶)D
427 205319_at PSCA NM_005672 前列腺干细胞抗原
428 206199_at CEACAM7 NM_006890 癌胚抗原rel.细胞粘附分子7
429 207695_s_at IGSF1 NM_001555 免疫球蛋白超家族,成员1
430 219249_s_at FLJ22041 NM_021939 假定的蛋白FLJ22041
431 213413_at FLJ13555 BG434174 FLJ13555
432 219793_at SNX16 NM_022133 sorting nexin16
433 212035_s_at KIAA1067 AI817079 KIAA1067蛋白
434 202730_s_at PDCD4 NM_014456 程序化细胞死亡4
bimD6的抑制物,Aspergillus nidulans
435 202130_at sudD AA725102
同源物
磷酸二酯酶6A,cGMP特异性,rod,
436 206623_at PDE6A NM_000440
α
437 222201_s_at KIAA1315 AB037736 KIAA1315蛋白
438 221752_at KIAA1298 AL041728 KIAA1298蛋白
439 205003_at KIAA0716 NM_014705 KIAA0716基因产物
441 205006_s_at NMT2 NM_004808 N-肉豆蔻酰转移酶2
442 205677_s_at DLEU1 NM_005887 淋巴细胞白血症中的删除,1
443 204947_at E2F1 NM_005225 E2F转录因子1
444 207505_at PRKG2 NM_006259 蛋白激酶,cGMP依赖性,II型
后期促进复合物亚基5,克隆
445 211036_x_at BC006301
MGC:13295,
446 211269_s_at K03122 白细胞介素-2受体mRNA(短形式)
447 202610_s_at TRAP170 AF135802 甲状腺激素受体相关蛋白质复合物成分
苷酸结合蛋白(G蛋白),α活化活性
448 204762_s_at BE670563
多肽O
449 201313_at ENO2 NM_001975 烯醇酶2,(γ,神经元的)
450 203225_s_at FLJ11149 NM_018339 假定的蛋白FLJ11149
451 221567_at NOP AF064599 nucleolar蛋白Nop30
452 201518_at CBX1 NM_006807 chromobox同源物1(果蝇HP1β)
v-maf肌膜的纤维肉瘤(禽类)癌基
453 204970_s_at NM_002359
因家族,蛋白G(MAFG),
454 214615_at P2Y10 NM_014499 推定的purinergic受体
455 221386_at OR3A2 NM_002551 嗅感受蛋白家族3亚族A,成员2
456 200014_s_at HNRPC NM_004500 核不均一核糖核蛋白C(C1C2)
457 200053_at SPAG7 NM_004890 精子相关抗原7
458 203462_x_at EIF3S9 NM_003751 翻译起始因子3sub9(eta116kD)
459 205917_at ZNF264 NM_003417 锌指蛋白264
460 207753_at ZNF304 NM_020657 锌指蛋白304
461 209751_s_at AF291676 MBP-1相互作用蛋白-2A
462 217403_s_at BC228680 AC074331 染色体19,BAC CIT-HSPC_204F22
促性腺激素可诱导转录阻遏物-3的
463 219571_s_at GIOT-3 NM_016265
GIOT-3
464 203119_at MGC2574 NM_024098 假定的蛋白MGC2574
465 203721_s_at LOC51096 NM_016001 CGI-48蛋白
466 204880_at MGMT NM_002412 O-6-甲基鸟嘌呤-DNA甲基转移酶
467 205664_at KIN NM_012311 recA蛋白的抗原决定簇(小鼠)同源物
468 212597_s_at AL079310 定位到染色体22的新的人类基因
转录因子7样2(T细胞特异性,HMG-
469 212759_s_at AI703074
盒)
470 213824_at AF221520 蛋白激酶C结合蛋白2
471 218137_s_at FLJ13159 NM_021940 假定的蛋白FLJ13159
472 220445_s_at TRAG3 NM_004909 紫杉酚抗性相关基因3
切除修复交叉互补啮齿动物修复缺陷,
473 203720_s_at NM_001983
互补群1
474 201046_s_at RAD23A NM_005053 RAD23(S.cerevisiae)同源物A
475 202344_at HSF1 NM_005526 热激转录因子1
476 202580_x_at FOXM1 NM_021953 叉头盒M1
477 205690_s_at G10 NM_003910 母系的G10转录产物
478 206307_s_at FOXD1 NM_004472 叉头盒D1
479 213090_s_at AI744029 TATA盒结合蛋白(TBP)相关因子
480 218215_s_at NR1H2 NM_007121 核受体亚族1,组H,成员2
481 207469_s_at PIR NM_003662 Pirin
482 209062_x_at RAC3 AF010227 受体相关共活化物3
483 200823_x_at RPL29 NM_000992 核糖体蛋白L29
POP4(前体的加工,S.cerevisiae)同
484 202868_s_at POP4 NM_006627
源物
485 217747_s_at RPS9 NM_001013 核糖体蛋白S9
(克隆pZ50-19)裂解刺激因子50kDa
486 32723_at L02547
亚基
DEADH(Asp-Glu-Ala-AspHis)盒多肽
487 212105_s_at BE910323
9
staufen(果蝇,RNA结合蛋白)
488 207320_x_at NM_004602
(STAU),转录产物v.T4,
489 200081_s_at BE741754 核糖体蛋白S6
高度类似于A42735核糖体蛋白L10,
490 217559_at AI001784
cytosolic
491 217907_at HSPC071 NM_014161 HSPC071蛋白
492 213504_at W63732 COP9亚基6(MOV34同源物,34kD)
493 204102_s_at EEF2 NM_001961 真核的翻译延伸因子2
494 208696_at AF275798 PNAS-102
495 209275_s_at CLN3 AF015593 CLN3蛋白
496 214591_at BF215673 果蝇Kelch样蛋白
497 201642_at IFNGR2 NM_005534 干扰素γ受体2(干扰素γ转导物1)
498 219080_s_at CTPS2 NM_019857 CTP合成酶II
499 202282_at HADH2 NM_004493 羟基酰基辅酶A脱氢酶II型
500 201453_x_at RHEB2 NM_005614 在脑中富集的Ras同源物2
501 208733_at NM_002865 RAB2,成员RAS癌基因家族
502 211004_s_at BC002553 类似于醛脱氢酶7
蛋白酶体(prosome,macropain)subβ
503 201400_at PSMB3 NM_002795
3型
蛋白酶体(prosome,macropain)subβ
504 208799_at BC004146
5型
染色体20上来自RP5-1005f21的DNA
505 216088_s_at AL078633
序列
506 213912_at KIAA0984 AW134976 KIAA0984蛋白
507 213913_s_at KIAA0984 AW134976 KIAA0984蛋白
508 205356_at USP13 NM_003940 遍在蛋白spec蛋白酶13(异肽酶T-3)
基质金属蛋白酶16(膜-插入的)转录产
509 208166_at MMP16 NM_022564
物v.2,
510 202018_s_at LTF NM_002343 乳运蛋白
[0302]511 213829_x_at FLJ20478 AK000485 FLJ20478
512 212766_s_at AW294587 Similar to假定的蛋白FLJ12484,
513 202969_at Y09216 双特异性酪氨酸(Y)磷酸化调节激酶2
514 203218_at W37431 促分裂素活化蛋白激酶9
515 204171_at RPS6KB1 NM_003161 核糖体蛋白S6激酶,
516 204906_at BC002363 核糖体蛋白S6激酶,90kD,多肽2
517 205126_at VRK2 NM_006296 痘相关激酶2
DKFZp434P0
518 214716_at AW504018 假定的蛋白DKFZp434P0116
116
519 37170_at HRIHFB2017 AB015331 HRIHFB2017
520 211474_s_at BC004948 MGC:10846,
521 204237_at CED-6 NM_016315 CED-6蛋白
淋巴细胞毒素β受体(TNFR超家族,
522 203005_at LTBR NM_002342
成员3
带有类风湿性关节炎抗原肽的gp130,
523 211000_s_at gp130-RAPS AB015706
可溶形式
524 202679_at NPC1 NM_000271 Niemann-Pick疾病,C1型
密度脂蛋白受体相关蛋白8,载脂蛋
525 205282_at LRP8 NM_004631
白e受体
526 207270_x_at CMRF35 NM_006678 CMRF35白细胞免疫球蛋白样受体
527 211846_s_at AF110314 疱疹病毒免疫球蛋白样受体HIgR
528 201810_s_at AL562152 SH3结构域结合蛋白5(BTK-assoc)
LIM蛋白(类似于大鼠蛋白激酶C结合
529 213684_s_at BF671400
enigma)
530 206636_at RASA2 NM_006506 RAS p21蛋白活化物2
sucl相关神经营养因子靶点2(FGFR
531 219907_at SNT-2 NM_006653
信号连接物)
细胞膜糖蛋白,110000M(r)(表面抗
532 201281_at GP110 NM_007002
原)
533 209462_at U48437 淀粉样蛋白前体样蛋白1
534 210880_s_at AB001467 Efs2,
535 212567_s_at AL523310 CS0DC001YN06(3prime)
536 202222_s_at DES NM_001927 结蛋白
537 219615_s_at KCNK5 NM_003740 通道,亚族K,成员5(TASK-2)
染色体22q13.1-13.31上的克隆RP3-
538 214210_at AL049764
362J20
539 52078_at AI828080
540 203765_at GCL NM_012198 grancalcin
541 213308_at AB028945 cortactin SH3结构域结合蛋白
542 203082_at KIAA0187 NM_014753 KIAA0187基因产物
543 212543_at AIM1 U83115 非晶状βγ-晶状体蛋白样蛋白
544 209709_s_at RHAMM U29343 hyaluronan受体
545 205807_s_at TUFT1 NM_020127 tuftelin1
546 213895_at BF445047 上皮膜蛋白1
DNA结合2的抑制物,主要阴性螺旋-
547 201565_s_at ID2 NM_002166
环-螺旋蛋白
548 202639_s_at AI689052 RAN结合蛋白3
549 209230_s_at COM1 AF135266 p8蛋白同源物
550 218626_at 4E-T NM_019843 eIF4E转运蛋白
551 221506_s_at BG258639 亲核蛋白β2b,转运蛋白
552 221521_s_at BC003186 HSPC037蛋白,克隆MGC:673,
553 202069_s_at AI826060 异柠檬酸脱氢酶3(NAD+)α
554 203524_s_at MPST NM_021126 巯基丙酮酸硫酸转移酶
SEC63,内质网转位子成分(S.
555 201916_s_at SEC63L NM_007214
cerevisiae)样
雄激素调节短链dehydrogenasereductase
556 217776_at ARSDR1 AF167438
1
557 218623_at LOC51617 NM_015980 HMP19蛋白
558 208777_s_at AF001212 26S蛋白酶体亚基9
559 203971_at SLC31A1 NM_001859 溶质载体家族31(转运蛋白),成员1
560 215243_s_at AF099730 连接蛋白31(GJB3)基因,
561 201591_s_at NM_007184 咪唑啉受体候选物(I-1),
硫酸乙酰肝素(葡糖胺)3-O-磺基转移
562 205466_s_at HS3ST1 NM_005114
酶1
Bcl-2腺病毒E1B19kD相互作用蛋白1
563 207829_s_at BNIP1 NM_013978
转录产物变体BNIP1-a,
564 205742_at TNNI3 NM_000363 肌钙蛋白I,心脏的
565 211178_s_at AF038602 CD2结合蛋白1短形式
视网膜短链dehydrogenasereductase
566 219113_x_at LOC51171 NM_016246
retSDR3
567 217807_s_at GLTSCR2 NM_015710 胶质瘤抑制物候选物区域基因2
568 206133_at HSXIAPAF1 NM_017523 XIAP相关因子-1
569 201379_s_at TPD52L2 NM_003288 肿瘤蛋白D52样2
570 209373_at BC003179 MGC:4419,
571 210142_x_at AF117234 flotillin
572 218942_at FLJ22055 NM_024779 假定的蛋白FLJ22055
573 216716_at U15197 组血型ABO蛋白,部分3UTR序列
574 218185_s_at FLJ10511 NM_018120 假定的蛋白FLJ10511
575 219215_s_at FLJ20327 NM_017767 假定的蛋白FLJ20327
576 214683_s_at AI251890 CDC样激酶1
Sp1转录活化所需的辅助因子,亚基2
577 202612_s_at CRSP2 NM_004229
(150kD)
578 208932_at BC001416 蛋白磷酸酶4(以前的X),催化亚单位,
579 206766_at ITGA10 AF112345 整联蛋白α10亚基
580 216213_at AF155113 NY-REN-55抗原
581 205609_at ANGPT1 NM_001146 angiopoietin1
582 204644_at tNOX AF207881 肿瘤相关对苯二酚(NADH)氧化酶
583 206812_at ADRB3 NM_000025 肾上腺素的,β-3-,受体
切除修复交叉-互补啮齿动物修复缺陷,
584 202176_at ERCC3 NM_000122
互补群3(着色性干皮病B组互补)
585 219816_s_at FLJ10482 NM_018107 假定的蛋白FLJ10482
586 200934_at DEK NM_003472 DEK癌基因(DNA结合)
587 206098_at ZID NM_006626 具有相互作用结构域的锌指蛋白
588 206987_x_at FGF18 NM_003862 成纤维细胞生长因子18
589 208392_x_at IFI75 NM_004510 干扰素诱导蛋白75,52kD
590 213048_s_at W26593 SET转位(骨髓性白血病相关)
591 220861_at AF118067 PRO1578
类似于RIKEN cDNA3930401K13基
592 222115_x_at BC003693
因,
593 222236_s_at FLJ20246 AK000253 FLJ20246
594 41644_at KIAA0790 AB018333 KIAA0790蛋白,
595 204107_at NM_002505 核转录因子Y,α
596 209706_at AF247704 间源盒蛋白NKX3.1
597 210174_at AF228413 肝细胞转录因子
598 213844_at HOXA5 NM_019102 相似盒A5
599 214108_at AI346181 MAX蛋白
MYC-相关锌指蛋白(嘌呤结合转录因
600 212064_x_at AI471665
子)
601 214316_x_at AI348935 calreticulin
Ras-GTPase-活化蛋白SH3结构域结合
602 201514_s_at G3BP NM_005754
蛋白
603 203092_at hTIM44 AF026030 推定的线粒体内膜蛋白输入受体
染色体20q11.21-11.23上来自克隆RP1-
604 208725_at AL031668
64K7的DNA序列
605 219819_s_at HSPC007 NM_014018 HSPC007蛋白
606 200724_at BC003358 核糖体蛋白L10,
Syntrophin,β2(dystrophin相关蛋白
607 214350_at AI762021
A1,59kD,基本成分2)
608 210197_at BC003622 类似于1,3,4-三磷酸盐56激酶,
609 218150_at ARL5 NM_012097 ADP-核糖基化因子样5
NADH脱氢酶(泛醌)1β子复合物,8
610 214241_at AA723057
(19kD,ASHI)
discs large(Dros)同源物2(chapsyn-
611 206253_at DLG2 NM_001364
110)
612 205435_s_at KIAA1048 NM_014911 KIAA1048蛋白
DKFZp434G0
613 215154_at AL080134 DKFZp434G043
43
614 215771_x_at X15786 ret-II基因
615 213795_s_at BF740139 克隆RP4-534B8染色体20
类似于遍在蛋白共轭酶E2G2(与酵母
616 209042_s_at BC001738
UBC7同源),
617 201602_s_at NM_002480 肌球蛋白磷酸酶,靶点亚基1
618 211133_x_at AF009643 克隆6免疫球蛋白样转录产物5蛋白
619 211245_x_at AF002256 杀伤细胞抑制受体同源物cl-9
620 210713_at U61166 含有SH3结构域的蛋白SH3P17
621 210840_s_at KIAA0051 D29640 KIAA0051
622 218157_x_at SPEC1 NM_020239 Cdc42的小蛋白效应物1
623 208292_at BMP10 NM_014482 骨骼形态发生蛋白10
624 210518_at AB035305 cadherin-8的CDH8mRNA,
625 205064_at SPRR1B NM_003125 富含小脯氨酸蛋白1B(cornifin)
626 206990_at TNR NM_003285 tenascin R(restrictin,j anusin)
627 211304_x_at D50134 内调整K通道,
628 203950_s_at ClC-6a NM_001286 氯化物通道6(CLCN6),转录产物变体
629 214211_at AA083483 铁蛋白,重多肽1
630 211056_s_at BC006373 克隆MGC:12762
631 212185_x_at MT2A NM_005953 金属硫蛋白2A
632 203415_at PDCD6 NM_013232 程序化细胞死亡6
633 205388_at TNNC2 NM_003279 肌钙蛋白C2,快
634 208871_at D31840 DRPLA
635 218840_s_at FLJ10631 NM_018161 假定的蛋白FLJ10631
凝集素半乳糖苷结合可溶的7(galectin
636 206400_at LGALS7 NM_002307
7)
637 207733_x_at PSG9 NM_002784 妊娠特异性β-1-糖蛋白9
638 207850_at GRO3 NM_002090 GRO3癌基因
639 210884_s_at AF168619 HE2gammal
640 220162_s_at LOC64170 NM_022352 caspase补充结构域9
血管紧张素I转化酶(肽酰-二肽酶A)
641 209749_s_at AI623989
1
642 216010_x_at D89324 α(1,31,4)岩藻糖基转移酶的DNA,
643 203970_s_at PEX3 NM_003630 过氧化物酶体发生因子3
644 203972_s_at AB035307 Pex3p的mRNA,
645 217749_at LOC51137 NM_016128 外被蛋白γ-cop
646 207022_s_at LDHC1 NM_002301 乳酸脱氢酶C,转录产物变体1
647 209905_at AI246769 相似盒A9
648 209099_x_at HJ1 U73936 Jagged1
649 222201_s_at KIAA1315 AB037736 KIAA1315蛋白,
650 201335_s_at KIAA0382 NM_015313 KIAA0382蛋白;
651 221748_s_at tensin AL046979 tensin
652 205139_s_at UST NM_005715 uronyl2-磺基转移酶
653 210678_s_at U56418 溶血磷脂酸酰基转移酶-β
DKFZp564E0
654 215293_s_at AL049261 DKFZp564E053
53
DKFZp564E0
655 41858_at AL049261 DKFZp564E053
53
656 218047_at FLJ12492 NM_024586 假定的蛋白FLJ12492
657 215069_at FLJ21412 AK025065 FLJ21412
658 201095_at DAP NM_004394 死亡相关蛋白
ATPase,H(+)转运,溶酶体,非催化
659 220197_at ATP6N1B NM_020632
附属蛋白1B
660 213351_s_at KIAA0779 AI934469 KIAA0779
661 203285_s_at HS2ST1 NM_012262 硫酸乙酰肝素2-O-磺基转移酶
662 204326_x_at MT1L NM_002450 金属硫蛋白1L
663 208581_x_at MT1X NM_005952 金属硫蛋白1X
650 212690_at KIAA0725 AB018268 KIAA0725蛋白,
[0303] 引用的参考文献
[0304]5,242,974 20030069180 WO01053312 WO02094988 WO04030615
5,384,261 20030073623 WO01054472 WO02095010 WO04031413
5,405,783 20030087818 WO01055322 WO02102235 WO04031414
5,412,087 20030096982 WO01057182 WO02102993 WO04033637
5,424,186 20030104366 WO01057188 WO02102994 WO04037996
5,429,807 20030124128 WO01059063 WO03000735 WO04039943
5,436,327 20030124148 WO01060860 WO03003906 WO04039956
5,445,934 20030128884 WO01070979 WO03004622 WO04041170
5,472,672 20030166064 WO01073027 WO03004989 WO04042022
5,527,681 20030194704 WO01075067 WO03010336 WO04043361
5,529,756 20030219744 WO01077168 WO03016475 WO04047728
5,532,128 20030219767 WO01077288 WO03016476 WO04048938
5,545,531 20030236392 WO01077291 WO03016500 WO04053081
5,554,501 20040005560 WO01088088 WO03018807 WO04060270
5,556,752 20040009478 WO01090154 WO03025138 WO04063355
5,561,071 20040009491 WO01090304 WO03027258 WO04070062
5,571,639 20040013663 WO01094629 WO03038063 WO04072265
5,593,839 20040034196 WO02002623 WO03042661 WO04074301
5,599,695 20040037842 WO02004514 WO03042661 WO04076613
5,624,711 20040058340 WO02012235 WO03042661 WO04079014
5,658,734 20040110194 WO02012328 WO03046152 WO91001999
5,700,637 20040115636 WO02024956 WO03054152 WO92019745
5874283 DE432977 WO02028999 WO03062379 WO94023039
6,004,755 EP1104808 WO02029086 WO03064589 WO95014772
6060283 WO00021991 WO02031198 WO03072035 WO97012967
6,136,182 WO00026244 WO02036766 WO03078572 WO97024441
6171787 WO00032776 WO02050279 WO03081201 WO97033902
6,218,114 WO00036107 WO02057414 WO03091388 WO98010067
6,218,122 WO00055320 WO02059260 WO03094848 WO98045437
6,271,002 WO00055350 WO02059271 WO03101283 WO99026976
[0305]6440694 WO00056880 WO02059377 WO04003162 W990033980
200200131971 WO00058473 WO02060317 WO04018641 WO99033981
20020055474 WO00060078 WO02068652 WO04020497 WO99035158
20020064872 WO00061610 WO02070737 WO04020593 WO99035170
20030065157 WO00063438 WO02074237 WO04022059 WO99038972
20020072089 WO00078961 WO02076488 WO04023973 WO99047540
20020081659 WO01000828 WO02081498 WO04024097 WO99050416
20020110547 WO01025256 WO02081517 WO04024892 WO99054460
20020123619 WO01027158 WO02081731 WO04028479 WO99058642
20020150581 WO01040466 WO02083876 WO99064576
20020151681 WO01042451 WO02083898
20020168637 WO01042467 WO02086443
20020192678 WO01044448 WO02090526
20030194734 WO01046697 WO02094629
20030022239 WO01049716
[0306] Ahr et al.(2002)″Identification of high risk breast-cancer patientsbygene-expression profiling″Lancet359:131-132
[0307] Chang et al.(2003)″Gene expression profiling for the predictionoftherapeutic response to docetaxel in patients with breast cancer″Lancet362:
362-9
[0308] Early Breast Cancer Trialists’Collaborative Group(1995)″Effects ofradiotherapy and surgery in early breast cancer.Anoverview of the randomized
trials″N Engl J Med333:1444-1455
[0309] Early Breast Cancer Trialists’CollaborativeGroup(1998a) ″ Polychemotherapy for early breast cancer:an overview of
therandomized trials″Lancet352:930-942
[0310] Early Breast Cancer Trialists’Collaborative Group(1998b)″Tamoxifenfor early breast cancer:an overview of randomizedtrials″Lancet351:1451-1467
[0311] Efron(1981) ″Censored data and the bootstrap ″ J Am Stat Assoc76:312-319
[0312] Eifel et al.(2001)″National Institutes of Health ConsensusDevelopmentConference Statement:adjuvant therapy for breastcancer,November1-3,2000″J
Natl Cancer Inst93:979-989
[0313] Foekens et al.(1989b)″Prognostic value of estrogen andprogesteronereceptors measured by enzyme immunoassays in humanbreast tumor cytosols ″
Cancer Res49:5823-5828
[0314] Foekens et al.(1989a)″Prognostic value of receptors forinsulin-likegrowth factor1,somatostatin,and epidermal growthfactor in human breast
cancer″Cancer Res49:7002-7009
[0315] Goldhirsch et al.(2003) ″ Meetinghig hlights:UpdatedInternationalExpert Consensus on the Primary Therapy of EarlyBreast Cancer″J Clin Oncol21:
3357-3365
[0316] Golub et al.(1999)″Molecular classification of cancer:classdiscoveryand class prediction by gene expression monitoring″Science286:531-537
[0317] Gruvberger et al.(2001)″Estrogen receptor status in breastcancer isassociated with remarkably distinct gene expressionpatterns″ Cancer Res61:
5979-5984
[0318] Hedenfalk et al.(2001)″Gene-expression profiles in hereditarybreastcancer″N EnglJ Med344:539-548
[0319] Herrera-Gayol et al.(1999)″Adhesion proteins in the biology ofbreastcancer:contribution of CD44″Exp Mol Pathol66:149-156
[0320] Huang et al.(2003) ″ Gene expression predictors of breastcanceroutcomes″Lancet361:1590-1596
[0321] Kaplan et al.(1958) ″ Non-parametric estimation ofincompleteobservations″J Am Stat Assoc53:457-481
[0322] Keyomarsi et al.(2002)″Cyclin E and survival in patients withbreastcancer″N EnglJ Med347:1566-1575
[0323] Lipshutz et al.(1999) ″ High density syntheticoligonucleotidearrays″Nat Genet21:20-24
[0324] Ma et al.(2003) ″ Gene expression profiles of human breastcancerprogression″Proc NatlAcad Sci USA100:5974-5979
[0325] Ntzani et al.(2003)″Predictive ability of DNA microarrays forcanceroutcomes and correlates:an empirical assessment″Lancet362:1439-1444
[0326] Perou et al.(2000)″Molecular portraits of human breast tumors″Nature406:747-752
[0327] Ramaswamy et al.(2001)″Multiclass cancer diagnosis usingtumor geneexpression signatures″Proc Natl Acad Sci USA 98:15149-15154
[0328] Ramaswamy et al.(2003)″A molecular signature of metastasis inprimarysolid tumors″Nat Genet 33:1-6
[0329] Ransohoff(2004) ″ Rules of evidence for cancermolecular-markerdiscovery and validation″Nat Rev Cancer 4:309-314
[0330] Sorlie et al.(2001) ″ Gene expression patterns of breastcarcinomasdistinguish tumor subclasses with clinical implications ″ Proc
NatlAcad Sci USA 98:10869-10874
[0331] Sorlie et al.(2003)″Repeated observation of breast tumorsubtypes inindependent gene expression data sets″Proc Natl AcadSci USA 100:8418-8423
[0332] Sotiriou et al.(2003) ″ Gene expression profiles derived fromfineneedle aspiration correlate with response to systemic chemotherapy inbreast
cancer″Breast Cancer Res 4:R3
[0333] Sotiriou et al.(2003)″Breast cancer classification and prognosisbasedon gene expression profiles from a population-based study″Proc Natl Acad Sci
USA 100:10393-10398
[0334] Su et al.(2001)″Molecular classification of human carcinomas byuse ofgene expression signatures″Cancer Res 61:7388-7393
[0335] van de Vijver et al.(2002)″A gene expression signature as apredictorof survival in breast cancer″N Engl J Med 347:1999-2009
[0336] van ′ t Veer et al.(2002) ″ Gene expression profiling predictsclinicaloutcome of breast cancer″Nature 415:530-536
[0337] Wang et al.(2004)″Gene expression profiles and molecularmarkers topredict recurrence of Dukes’B colon cancer″J Clinncol 22:1564-1571
[0338] Woelfie et al.(2003)″Molecular signature associated with bonemarrowmicrometastasis in human breast cancer″Cancer Res63:5679-5684
相关专利内容
标题 发布/更新时间 阅读量
乳腺癌标志物 2020-05-11 52
一种预防乳腺癌的内衣 2020-05-12 376
一种治疗乳腺癌的中药 2020-05-13 408
一种乳腺癌防治药物 2020-05-13 558
乳腺癌保乳标本取量台 2020-05-13 204
乳腺癌标志物 2020-05-11 212
乳腺癌治疗剂 2020-05-12 605
用于乳腺癌的piRNA 2020-05-11 575
乳腺癌标志物 2020-05-12 635
乳腺癌标志物 2020-05-11 552
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈