基于细胞的探询式分析及其应用专利检索-细胞增殖生物学专利检索查询-专利查询网

基于细胞的探询式分析及其应用

阅读：208发布：2023-01-31

专利汇可以提供基于细胞的探询式分析及其应用专利检索，专利查询，专利分析的服务。并且本文公开了基于细胞的探询式分析及其应用，具体描述的是一个用于通过建模来分析生物系统或过程(例如，疾病状态，如癌症)的发现平台技术。，下面是基于细胞的探询式分析及其应用专利的具体信息内容。

权利要求

1.一种用于鉴别生物系统的调节子的方法，所述方法包括：
(1)使用与该生物系统相关的细胞建立该生物系统的模型来代表该生物系统的特征性方面；
(2)从所述模型获得第一数据集，其中所述第一数据集代表与该生物系统相关的细胞中的总体蛋白质组学改变；
(3)从所述模型获得第二数据集，其中所述第二数据集代表与该生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应包括与该生物系统相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应；
(4)用编程的计算设备，仅仅基于所述第一数据集和第二数据集，生成与所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应相关的第一因果关系网络，其中所述第一因果关系网络是包括关于所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应之中的关系的定量概率定向信息的因果关系贝叶斯网络，且其中所述第一因果关系网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系；
(5)从所述第一因果关系网络和基于对照细胞数据的第二因果关系网络生成差异因果关系网络；和
(6)从所述生成的差异因果关系网络鉴别在该生物系统中独特的因果关系，其中与该独特的因果关系相关的至少一种酶被确定为该生物系统的调节子。
2.如权利要求1的方法，其中所述第一数据集还代表表征与所述生物系统相关的细胞的脂质组学数据。
3.如权利要求2的方法，其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据和所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
4.如权利要求1的方法，其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种。
5.如权利要求1的方法，其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更多种。
6.如权利要求4或5的方法，其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
7.如权利要求1-6中任一项的方法，其中所述总体酶学活性包括总体激酶活性。
8.如权利要求1-7中任一项的方法，其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。
9.如权利要求1-8中任一项的方法，其中所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
10.如权利要求1-8中任一项的方法，其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应且还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
11.如权利要求1-10中任一项的方法，其中所述对照细胞数据包括代表对照细胞中的总体蛋白质组学改变的第一对照数据集和代表对照细胞的一种或多种功能活性或细胞反应的第二对照数据集，其中所述对照细胞的一种或多种功能活性或细胞反应包括对照细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应；和
其中该方法进一步包括，在步骤(5)之前，用编程的计算设备，仅仅基于所述第一对照数据集和第二对照数据集，生成与所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应相关的第二因果关系网络，其中所述第二因果关系网络的生成不基于所述第一对照数据集和第二对照数据集以外的任何已知的生物学关系。
12.如权利要求11的方法，其中所述与生物系统相关的细胞经受环境扰动，且所述对照细胞是没有经受环境扰动的与生物系统相关的相同细胞。
13.如权利要求12的方法，其中所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。
14.如权利要求13的方法，其中所述环境扰动包括使所述细胞与酶活性抑制剂接触。
15.如权利要求14的方法，其中所述酶活性抑制剂是激酶抑制剂。
16.如权利要求13的方法，其中所述环境扰动包括使所述细胞与CoQ10接触。
17.如权利要求14的方法，其中所述环境扰动还包括使所述细胞与CoQ10接触。
18.如权利要求1的方法，其中所述生成步骤通过基于人工智能(AI)的信息学平台完成。
19.如权利要求18的方法，其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。
20.如权利要求1的方法，其中所生成的第一因果关系网络是第一模拟因果关系网络，且其中步骤(4)进一步包括：
(i)仅基于所述第一数据集和第二数据集生成第一一致因果关系网络；和
(ii)通过基于输入数据的计算机模拟优化所述第一一致因果关系网络到第一模拟因果关系网络，以对于所述第一因果关系网络内的一个或多个因果关系提供预测的置信水平。
21.如权利要求1-20中任一项的方法，其中所述确定的独特因果关系是选自下组的至少一对之间的关系：基因的表达和脂质的水平；基因的表达和转录物的水平；基因的表达和代谢产物的水平；第一基因的表达和第二基因的表达；基因的表达和SNP的存在；基因的表达和功能活性；脂质的水平和转录物的水平；脂质的水平和代谢产物的水平；第一脂质的水平和第二脂质的水平；脂质的水平和SNP的存在；脂质的水平和功能活性；第一转录物的水平和第二转录物的水平；转录物的水平和代谢产物的水平；转录物的水平和SNP的存在；第一转录物的水平和功能活性的水平；第一代谢产物的水平和第二代谢产物的水平；代谢产物的水平和SNP的存在；代谢产物的水平和功能活性；第一SNP的存在和第二SNP的存在；及SNP的存在和功能活性。
22.如权利要求1-21中任一项的方法，其中所述确定的独特因果关系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关系，其中所述功能活性是总体激酶活性。
23.如权利要求1的方法，其中所述生物系统是疾病过程；
其中使用疾病相关细胞建立该疾病过程的模型以代表该疾病过程的特征性方面；
其中所述第一数据集代表疾病相关细胞中的总体蛋白质组学改变；
其中所述第二数据集代表所述疾病相关细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应；和
其中从所述生成的差异因果关系网络鉴别在所述生物系统中独特的因果关系包括鉴别在所述疾病过程中独特的因果关系，其中与该独特的因果关系相关的至少一种酶被确定为所述疾病过程的调节子。
24.如权利要求23的方法，其中所述第一数据集还代表表征所述疾病相关细胞的脂质组学数据。
25.如权利要求24的方法，其中所述第一因果关系网络在所述总体蛋白质组学改变、脂质组学数据和所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应。
26.如权利要求23的方法，其中所述第一数据集还代表表征所述疾病相关细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种。
27.如权利要求26的方法，其中所述第一数据集还代表表征所述疾病相关细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更多种。
28.如权利要求26或27的方法，其中所述因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
29.如权利要求23-28中任一项的方法，其中所述总体酶学活性包括总体激酶活性，且其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。
30.如权利要求23-29中任一项的方法，其中所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
31.如权利要求30的方法，其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
32.如权利要求23-31中任一项的方法，其中所述疾病过程是癌症、糖尿病、肥胖症、心血管疾病、年龄相关性黄斑变性、糖尿病性视网膜病或炎性疾病。
33.如权利要求23-31中任一项的方法，其中所述疾病过程包括血管生成。
34.如权利要求23-31中任一项的方法，其中所述疾病过程包括肝细胞癌、肺癌、乳腺癌、前列腺癌、黑色素瘤、癌瘤、肉瘤、淋巴瘤、白血病、鳞状细胞癌、结肠直肠癌、胰腺癌、甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体瘤、白血病、非霍奇金淋巴瘤或耐药性癌症。
35.如权利要求23-31任一项的方法，其中所述对照细胞数据包括代表对照细胞中的总体蛋白质组学改变的第一对照数据集和代表对照细胞的一种或多种功能活性或细胞反应的第二对照数据集，其中所述对照细胞的一种或多种功能活性或细胞反应包括对照细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应；和
其中该方法在步骤(5)之前进一步包括用编程的计算设备，仅仅基于所述第一对照数据集和第二对照数据集，生成与所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应相关的第二因果关系网络，其中所述第二因果关系网络的生成不基于所述第一对照数据集和第二对照数据集以外的任何已知的生物学关系。
36.如权利要求35的方法，其中所述疾病相关细胞经受环境扰动，且所述对照细胞是没有经受环境扰动的相同疾病相关细胞。
37.如权利要求36的方法，其中所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。
38.如权利要求37的方法，其中所述环境扰动包括使所述细胞与酶活性抑制剂接触。
39.如权利要求38的方法，其中所述酶活性抑制剂是激酶抑制剂。
40.如权利要求37的方法，其中所述环境扰动包括使所述细胞与CoQ10接触。
41.如权利要求23的方法，其中所述疾病过程的特征性方面包括缺氧状态、高血糖状态、富乳酸培养条件或它们的组合。
42.如权利要求23的方法，其中所述生成步骤通过基于人工智能(AI)的信息学平台完成。
43.如权利要求23的方法，其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。
44.如权利要求23的方法，其中所述生成的第一因果关系网络是第一模拟因果关系网络，且其中步骤(4)包括：
(i)仅基于所述第一数据集和第二数据集生成第一一致因果关系网络；和
(ii)通过基于输入数据的计算机模拟优化所述第一一致因果关系网络到第一模拟因果关系网络，以对于所述第一因果关系网络内的一个或多个因果关系提供预测的置信水平。
45.如权利要求1的方法，其中所述第一数据集还代表表征与该生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种；
其中所述与该生物系统相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应是与该生物系统相关的细胞中的总体激酶活性和/或总体激酶活性对激酶代谢产物或底物的效应；
其中所述因果关系网络使用编程的计算设备，仅仅基于所述第一数据集和第二数据集在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述一种或多种功能活性或细胞反应之中生成；
其中与该独特的因果关系相关的至少一种激酶被确定为该生物系统的调节子。

说明书全文

基于细胞的探询式分析及其应用

[0001] 本申请是申请日为2012年9月7日和发明名称为“基于细胞的探询式分析及其应用”的201280073683.2号发明专利申请的分案申请。

[0002] 相关申请

[0003] 本申请要求2012年4月2日提交的61/619326号美国临时申请、 2012年7月6日提交的61/668617号美国临时申请、2012年4月4 日提交的61/620305号美国临时申请、2012年6
月28日提交的 61/665631号美国临时申请、2012年8月1日提交的61/678596号美国临时申
请和2012年8月1日提交的61/678590号美国临时申请的优先权，其中各自的全部内容明确
地通过引用在此引入。

[0004] 发明背景

[0005] 自从我们今天称为分子生物学先驱的James Watson和Francis Crick在1964年发现了DNA以来，新药开发已有很大的发展。分子生物学的工具和产品使得能够在DNA和RNA
水平快速、详细和精确地测量基因调控。在该范式变革性的发现后的三十年间从上述平台
出现了敲除动物模型、关键酶联反应及发病机制和病理生理学的新知识。在2000年春季，
当Craig Ventor和Francis Collins宣布了人类基因组的最初测序时，科学界掀起了医药
学的新浪潮。

[0006] 基因组作图立即点燃了例如能够控制疾病(甚至在疾病起始之前)、使用基因治疗来逆转导致阿尔兹海默氏病或帕金森氏疾病的退化性脑进程和可以被引入到肿瘤的部
位并在恢复正常的组织结构和生理的同时导致疾病消灭的构建体的希望。其他人则采取
了有争议的纠结态度并提出产生在眼睛或头发的颜色、身高等方面想要的后代的概念。
然而十年后，我们仍然没有看到特别的途径使得能够期待基因治疗的持续成功，或甚至遗
传过程的基本控制。

[0007] 因此，一个显而易见的现实是，遗传学(至少独立于支持结构) 没有推动生理学的终点。事实上，许多过程如转录后修饰、突变、单核苷酸多态性(SNP)和翻译后修饰可以改
变基因和/或其编码的互补蛋白质的本性(providence)，并因而造成疾病过程。

[0008] 发明概述

[0009] 信息化时代和互联网的建立已经允许信息过载，同时也促进了国际性合作和评判。具有讽刺意味的是，上述的现实也可能是科学界忽略了几个简单的点的原因，包括细
胞和/或组织内部及之间的信号级联和交互(cross-talk)的通讯允许在出差错时发生用
于纠正机制的体内稳态和消息发送。

[0010] 一个恰当的例子涉及到心血管疾病(CVD)，这仍然是在美国和许多发达国家中的主要死亡原因，仅在美国每2.8例死亡中占1例。此外，CVD作为基础的病理造成相关的并发
症，如慢性肾脏病(～ 1900万US病例)、慢性疲劳综合征和代谢综合征的关键因素。与诊断
学、微创外科技术、药物洗脱支架和有效的临床监测相关的重大技术进步已经在介入心脏
病学领域中开创了空前增长的时期，也使得 CVD的管控更加有效。然而，与CVD及其并发症
(如糖尿病和周围血管疾病)相关的疾病病因尚未完全阐明。

[0011] 仍然缺乏探索涉及生物学过程如疾病状态(例如，CVD)的病因学的机制和途径，以及鉴别关键的调控途径和/或目标分子(如“药物靶标”)和/或用于更好的疾病诊断、管
控和/或治疗的标志物的新方法。

[0012] 本文所描述的发明至少部分地基于网络生物学、基因组学、蛋白质组学、代谢组学、转录组学和生物信息学的工具和方法的新型的协同应用，它们在结合时可利用系统生
物学方法而用于研究任何目标生物系统，如所选的疾病状态，包括癌症、糖尿病、肥胖症、心血管疾病和血管生成。在第一步骤中，开发了细胞建模系统以探测各种不同生物系统，
如疾病过程，其中包含经受各种疾病相关环境刺激(例如，高血糖症、缺氧、免疫应激和脂
质过氧化、细胞密度、血管生成激动剂和拮抗剂)的疾病相关细胞。在一些实施方式中，细
胞建模系统涉及各种相互作用的细胞类型(如主动脉平滑肌细胞(HASMC)、近端小管肾细
胞(HK-2)、主动脉内皮细胞(HAEC)和真皮成纤维细胞(HDFa))之间的细胞交互机制。通过
使用几种技术的组合，包括例如，切割边界质谱(cutting edge mass spectrometry)(LC/
MSMS)、流式细胞术、基于细胞的分析和功能分析，获得来自细胞模型系统的高通量生物
学读数。然后通过体外、体内和计算机建模对高通量生物学读数进行生物信息学分析来研
究叠合数据趋势(congruent data trend)。由此产生的矩阵允许其中开发线性和非线性回
归分析以达到确证压力点(conclusive pressure point)(或“枢纽(hub)”)的交叉相关数
据挖掘。本文所提出的这些“枢纽”都是药物开发的候选者。特别是，这些枢纽代表潜在的药物靶标和/或疾病标志物。

[0013] 差别的分子印记使得能够深入了解规定了导致疾病发作和发展的组织微环境中的改变的机制。总的来说，上述技术平台与战略性细胞建模的结合赋予了可被用于进一步
建立对疾病的理解而同时建立可临床强化医疗标准的生物标志物文库和候选药物的确实
的情报。

[0014] 此外，这种方法不仅可用于疾病的诊断或干预，也对生物系统中的几乎所有病理或非病理状态具有普遍的适用性，如其中两个或更多个细胞系统相互作用的生物系统。例
如，这种方法可以用于获得对与药物毒性相关联或具有因果关系的机制的深入了解。因
此，本发明提供了可以在广泛情况中普遍适用的用于探询式生物学评估的框架。

[0015] 本发明的平台的显著特征是，基于AI的系统是基于从细胞模型系统获得的数据集而不诉诸或考虑本领域中的任何现有知识，如涉及该生物学过程的已知的生物学关系
(即没有数据点是人为的)。因此，从该平台生成的所得统计模型是无偏的。本发明的平台
及其成分(例如，由其获得的细胞模型系统和数据集)的另一个显著的特点是它允许随着
时间在细胞模型上继续构建(例如，通过引入新的细胞和/或条件)，以使得从生物系统或
过程的细胞模型生成的初始的“第一代”一致因果关系网络(consensus causal network)
可以与细胞模型自身的演变一起进化至多代因果关系网络(及由此获得的增量或增量-增
量网络)。以这种方式，细胞模型、来自细胞模型的数据集及通过使用该平台技术方法从
细胞模型生成的因果关系网络可以在从平台技术获得的以前的知识上不断演化和构建。

[0016] 本发明提供用于鉴别生物系统的调节子的方法，所述方法包括：

[0017] 使用与该生物系统相关的细胞建立该生物系统的模型以代表该生物系统的特征性方面；

[0018] 从该模型获得第一数据集，其中该第一数据集代表与生物系统相关的细胞中的总体蛋白质组学改变；

[0019] 从该模型获得第二数据集，其中所述第二数据集代表与生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应包括
与该生物系统相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的
效应；

[0020] 用编程的计算设备仅基于所述第一和第二数据集生成所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果关
系网络的生成不是基于所述第一和第二数据集以外的任何已知的生物学关系；和

[0021] 从该一致因果关系网络鉴别在所述生物系统中独特的因果关系，其中与该独特的因果关系相关的至少一种酶被确定为该生物系统的调节子。

[0022] 在某些实施方式中，所述第一数据集是单一蛋白质组数据集。在某些实施方式中，所述第二数据集代表与生物系统相关的细胞的单一功能活性或细胞反应。在某些实施
方式中，所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据。在某些
实施方式中，所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据和
所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能
活性或细胞反应包括总体酶学活性。

[0023] 在某些实施方式中，所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种。
在某些实施方式中，所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学
数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更多种。在某些实施方式中，所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代
谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种及所述细胞的一种
或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细胞反应
包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。

[0024] 在某些实施方式中，所述总体酶学活性包括总体激酶活性。在某些实施方式中，所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。

[0025] 在某些实施方式中，所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因
型- 表型相关性中的一种或多种。在某些实施方式中，所述一致因果关系网络在所述总体
蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP
数据中的一种或多种及所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述
细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一
种酶代谢产物或底物的效应且还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0026] 在本发明的某些实施方式中，生物系统的模型包括与生物系统相关的细胞的体外培养物。在本发明的某些实施方式中，生物系统的模型任选地还包含匹配的对照细胞的
体外培养物。

[0027] 在本发明的某些实施方式中，生物系统的模型细胞的体外培养物经受环境扰动，且匹配的对照细胞的体外培养物是没有经受环境扰动的相同的细胞。在某些实施方式中，
生物系统模型的所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突
变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。在某些实施方式中，生物
系统模型的所述环境扰动包括使所述细胞与酶活性抑制剂接触。在某些实施方式中，生物
系统模型中所述酶活性抑制剂是激酶抑制剂。在某些实施方式中，所述环境扰动包括使所
述细胞与CoQ10接触。在某些实施方式中，所述环境扰动还包括使所述细胞与CoQ10 接触。

[0028] 在本发明的某些实施方式中，所述生成步骤是由基于人工智能 (AI)的信息学平台完成的。在某些实施方式中，基于AI的信息学平台接收来自第一和第二数据集的所有数
据输入而没有应用统计截止点。在本发明的某些实施方式中，在鉴别步骤之前，在生成步
骤中建立的一致因果关系网络基于输入的数据通过计算机模拟进一步优化为模拟因果
关系网络，以对一致因果关系网络中的一个或多个因果关系提供预测的置信水平。

[0029] 在本发明的某些实施方式中，所述独特因果关系被确定为独特地存在于与生物系统相关的细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。在某些实
施方式中，所述独特因果关系被确定为独特地存在于与生物系统相关的细胞中且不存在
于匹配的对照细胞中的差异因果关系网络的部分。

[0030] 在本发明的某些实施方式中，所确定的独特因果关系是选自下组的至少一对之间的关系：基因的表达和脂质的水平；基因的表达和转录物的水平；基因的表达和代谢产
物的水平；第一基因的表达和第二基因的表达；基因的表达和SNP的存在；基因的表达和功
能活性；脂质的水平和转录物的水平；脂质的水平和代谢产物的水平；第一脂质的水平和
第二脂质的水平；脂质的水平和SNP的存在；脂质的水平和功能活性；第一转录物的水平和
第二转录物的水平；转录物的水平和代谢产物的水平；转录物的水平和SNP的存在；第一转
录物的水平和功能活性的水平；第一代谢产物的水平和第二代谢产物的水平；代谢产物
的水平和SNP的存在；代谢产物的水平和功能活性；第一SNP的存在和第二SNP的存在；及
SNP的存在和功能活性。在某些实施方式中，所确定的独特因果关系是至少脂质的水平、基
因的表达和一种或多种功能活性之间的关系，其中所述功能活性是激酶活性。

[0031] 本发明提供用于鉴别疾病过程的调节子的方法，所述方法包括：

[0032] 使用疾病相关细胞建立疾病过程的模型以代表疾病过程的特征性方面；

[0033] 从所述模型获得第一数据集，其中所述第一数据集代表疾病相关细胞中的总体蛋白质组学改变；

[0034] 从所述模型获得第二数据集，其中所述第二数据集代表与生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应包
括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应；

[0035] 用编程的计算设备仅基于第一和第二数据集生成所述总体蛋白质组学改变和所述细胞的一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果
关系网络的生成不是基于第一和第二数据集以外的任何已知的生物学关系；和

[0036] 从该一致因果关系网络鉴别在疾病过程中独特的因果关系，其中与该独特的因果关系相关的至少一种酶被确定为疾病过程的调节子。

[0037] 在某些实施方式中，所述第一数据集是单一蛋白质组数据集。在某些实施方式中，所述第二数据集代表与生物系统相关的细胞的单一功能活性或细胞反应。在某些实施
方式中，所述第一数据集还代表表征与所述生物系统相关的细胞的脂质组学数据。在某些
实施方式中，所述一致因果关系网络在总体蛋白质组学改变、脂质组学数据和所述细胞
的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能活性或细
胞反应包括总体酶学活性。在某些实施方式中，所述第一数据集还代表表征所述与生物系
统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据
中的一种或多种。在某些实施方式中，所述第一数据集还代表表征所述与生物系统相关的
细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或
更多种。在某些实施方式中，所述一致因果关系网络在所述总体蛋白质组学改变、所述脂
质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种及
所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种功能
活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的
效应。

[0038] 在本发明的某些实施方式中，所述总体酶学活性包括总体激酶活性，且其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。在某些实施
方式中，所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量
学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的
一种或多种。在某些实施方式中，所述一致因果关系网络在所述总体蛋白质组学改变、所
述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多
种及所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种
功能活性或细胞反应包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0039] 在某些实施方式中，所述疾病过程是癌症、糖尿病、肥胖症、心血管疾病、年龄相关性黄斑变性、糖尿病性视网膜病或炎性疾病。在某些实施方式中，所述疾病过程包括血
管生成。在某些实施方式中，所述疾病过程包括肝细胞癌、肺癌、乳腺癌、前列腺癌、黑色素瘤、癌瘤、肉瘤、淋巴瘤、白血病、鳞状细胞癌、结肠直肠癌、胰腺癌、甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体瘤、白血病、非霍奇金淋巴瘤或耐药性癌症。

[0040] 在本发明的某些实施方式中，所述疾病模型包含疾病细胞的体外培养物，任选地进一步包含匹配的对照或正常细胞的体外培养物。在某些实施方式中，疾病细胞的体外培
养物经受环境扰动，且匹配的对照细胞的体外培养物是未经受环境扰动的相同的疾病细
胞。在某些实施方式中，所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传
修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。在某些实施方式
中，所述环境扰动包括使所述细胞与酶活性抑制剂接触。在某些实施方式中，所述酶活性
抑制剂是激酶抑制剂。在某些实施方式中，所述环境扰动进一步包括使所述细胞与CoQ10
接触。在某些实施方式中，所述环境扰动包括使所述细胞与CoQ10接触。

[0041] 在某些实施方式中，所述的疾病过程的特征性方面包括缺氧状态、高血糖状态、富乳酸培养条件或它们的组合。在某些实施方式中，所述生成步骤通过基于人工智能(AI)
的信息学平台完成。在某些实施方式中，所述基于AI的信息学平台接受来自所述第一和第
二数据集的所有数据输入而不应用统计截止点。

[0042] 在某些实施方式中，在所述鉴别步骤之前，在所述生成步骤中建立的所述一致因果关系网络基于输入数据通过计算机模拟进一步优化到模拟因果关系网络，以对于一致
因果关系网络内的一个或多个因果关系提供预测的置信水平。在某些实施方式中，所述独
特因果关系被确定为独特地存在于疾病细胞的模型中且不存在于匹配的对照细胞中的
差异因果关系网络的部分。在某些实施方式中，所述独特因果关系被确定为独特地存在于
所述经受环境扰动的细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0043] 本发明提供了用于鉴别生物系统的调节子的方法，所述方法包括：

[0044] 使用与该生物系统相关的细胞建立该生物系统的模型来代表该生物系统的特征性方面；

[0045] 从所述模型获得第一数据集，其中所述第一数据集代表所述细胞的总体蛋白质组学改变及表征与该生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数
据、基因组学数据和SNP数据中的一种或多种；

[0046] 从所述模型获得第二数据集，其中所述第二数据集代表与该生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应
包括与该生物系统相关的细胞中的总体激酶活性和/或总体激酶活性对激酶代谢产物或
底物的效应；

[0047] 使用编程的计算设备，仅仅基于所述第一和第二数据集生成所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的
一种或多种及所述一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述
一致因果关系网络的生成不基于所述第一和第二数据集以外的任何已知的生物学关系；
和

[0048] 从该一致因果关系网络鉴别在所述生物系统中独特的因果关系，其中与该独特的因果关系相关的至少一种激酶被确定为该生物系统的调节子。

[0049] 本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展、预防、诊断或预后该疾病的方法，所述方法包括：

[0050] 向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，所述生物活性物质影响通过本文提供的任何方法所鉴别的调节子，从而治疗所述疾病、改善其症
状、抑制其进展、预防、诊断或预后所述疾病。

[0051] 本发明提供了用于诊断或预后哺乳动物受试者的疾病的方法，所述方法包括：

[0052] 测定从所述受试者获得的生物样品中通过本文中提供的任何方法鉴别的一种或多种调节子的表达或活性水平；和

[0053] 将所述受试者中的水平与对照样品中所述一种或多种调节子的表达或活性水平比较，

[0054] 其中所述受试者中的水平和所述对照样品中一种或多种调节子的表达或活性水平之间的差异是所述受试者患有疾病、易于发生疾病或有利地对疾病治疗发生反应的指
示，从而诊断或预后所述哺乳动物受试者的疾病。

[0055] 本发明提供了鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物的方法，所述方法包括：

[0056] 使来自所述哺乳动物受试者的生物样品与测试化合物接触；

[0057] 测定所述生物样品中通过本文中提供的任何方法鉴别的一种或多种调节子的表达水平；

[0058] 将所述生物样品中一种或多种调节子的表达水平与未与测试化合物接触的对照样品比较；和

[0059] 选择调节所述生物样品中一种或多种调节子的表达水平的测试化合物，

[0060] 从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物。

[0061] 本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防所述疾病的方法，所述方法包括：

[0062] 向需要的哺乳动物施用治疗有效量的包含使用本文中提供的任何方法鉴别的治疗化合物的药物组合物，从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。

[0063] 本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防所述疾病的方法，所述方法包括：

[0064] 向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，所述生物活性物质影响TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种的表达或活性，

[0065] 从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。在某些实施方式中，所述疾病是肝细胞癌。

[0066] 本发明提供了用于诊断或预后哺乳动物受试者的疾病的方法，所述方法包括：

[0067] 测定从所述受试者获得的生物样品中TCOF1、TOP2A、CAMK2A、 CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中的任何一种或多种蛋白质的表达或活性水平；和

[0068] 将所述受试者中的水平与对照样品中所述一种或多种蛋白质的表达或活性水平比较，

[0069] 其中所述受试者中的水平和所述对照样品中一种或多种蛋白质的表达或活性水平之间的差异是所述受试者患有疾病或易于发生疾病或有利地对疾病治疗发生反应的指
示，从而诊断或预后所述哺乳动物受试者的疾病。在某些实施方式中，所述疾病是肝细胞
癌。

[0070] 本发明提供了鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物的方法，所述方法包括：

[0071] 使来自所述哺乳动物受试者的生物样品与测试化合物接触；

[0072] 测定所述生物样品中TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种蛋白质的表达水平；

[0073] 将所述生物样品中一种或多种蛋白质的表达水平与未与测试化合物接触的对照样品比较；和

[0074] 选择调节所述生物样品中一种或多种蛋白质的表达水平的测试化合物，

[0075] 从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物。在某些实施方式中，所述疾病是肝细胞癌。

[0076] 本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防所述疾病的方法，所述方法包括：

[0077] 向需要的哺乳动物施用治疗有效量的包含本文中提供的任何方法鉴别的治疗化合物的药物组合物，从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。

[0078] 本发明提供了用于鉴别血管生成的调节子的方法，所述方法包括：

[0079] (1)使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面；

[0080] (2)从所述血管生成的模型获得第一数据集，其中所述第一数据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；

[0081] (3)从所述血管生成的模型获得第二数据集，其中所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应；

[0082] (4)使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种及所述与血管生成相关的细
胞的一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果关系
网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系；

[0083] (5)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与该独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物或SNP被确定为血管生成的调节子。

[0084] 本发明提供了用于鉴别血管生成的调节子的方法，所述方法包括：

[0085] (1)使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面；

[0086] (2)从所述血管生成的模型获得第一数据集，其中所述第一数据集代表脂质组学数据；

[0087] (3)从所述血管生成的模型获得第二数据集，其中所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应；

[0088] (4)使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述脂质组学数据及所述功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果关系
网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系；

[0089] (5)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与该独特的因果关系相关的脂质被确定为血管生成的调节子。

[0090] 在某些实施方式中，所述代表与血管生成相关的细胞的一种或多种功能活性或细胞反应的第二数据集包括所述与血管生成相关的细胞中的总体酶学活性和/或总体酶
学活性对酶代谢产物或底物的效应。

[0091] 本发明提供了用于鉴别血管生成的调节子的方法，所述方法包括：

[0092] (1)使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面；

[0093] (2)从所述血管生成的模型获得第一数据集，其中所述第一数据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；

[0094] (3)从所述血管生成的模型获得第二数据集，其中所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应激酶活性，其中所述一种或多种功能活
性或细胞反应包括所述与血管生成相关的细胞中的总体酶学活性和/或总体酶学活性对
酶代谢产物或底物的效应；

[0095] (4)使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种及所述与血管生成相关的细
胞的一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果关系
网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系；

[0096] (5)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与该独特的因果关系相关的酶被确定为血管生成的调节子。

[0097] 在本发明的某些实施方式中，所述总体酶学活性包括总体激酶活性且所述与血管生成相关的细胞中总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋
白质组。在某些实施方式中，所述总体酶学活性包括总体蛋白酶活性。

[0098] 在本发明的某些实施方式中，所述调节子刺激或促进血管生成。在本发明的某些实施方式中，所述调节子抑制血管生成。

[0099] 在某些实施方式中，所述包含与血管生成相关的细胞的血管生成模型选自体外细胞培养血管生成模型、大鼠主动脉微血管模型、新生小鼠视网膜模型、鸡胚绒毛尿囊膜
(CAM)模型、角膜血管生成生长因子囊袋模型、皮下海绵血管生成生长因子植入模型、
血管生成生长因子植入模型和肿瘤植入模型；且其中所述血管生成模
型任选地进一步包括包含对照细胞的匹配对照血管生成模型。在某些实施方式中，所述
体外培养血管生成模型选自管形成分析、迁移分析、伯伊登室分析、划
痕分析。

[0100] 在某些实施方式中，所述体外培养血管生成模型中与血管生成相关的细胞是人血管内皮细胞(HUVEC)。在某些实施方式中，所述角膜血管生成生长因子囊袋模型、皮下海
绵血管生成生长因子植入模型或血管生成生长因子植入模型中的血管
生成生长因子选自FGF-2和VEGF。

[0101] 在本发明的某些实施方式中，所述血管生成模型中的细胞经受环境扰动，且所述匹配的血管生成模型中的细胞是没有经受环境扰动的相同细胞。在某些实施方式中，所述
环境扰动包括与试剂的接触、培养条件的变化、引入的遗传修饰或突变、引起遗传修饰或
突变的媒介和局部缺血的诱导中的一种或多种。

[0102] 在某些实施方式中，所述试剂是促血管生成剂或抗血管生成剂。在某些实施方式中，所述促血管生成剂选自FGF-2和VEGF。在某些实施方式中，所述抗血管生成剂选自VEGF
抑制剂、整联蛋白拮抗剂、血管抑素、内皮抑素、肿瘤抑素、阿瓦斯汀、索拉非尼、舒尼替尼、帕唑帕尼和依维莫司、可溶性VEGF受体、血管生成素2、血小板反应蛋白1、血小板反应蛋白
2、血管形成抑制素、钙网织蛋白、凝血酶原(kringle结构域-2)、抗凝血酶III片段、血管内皮生长抑制剂 (VEGI)、富含半胱氨酸的酸性分泌蛋白(SPARC)和对应于蛋白质的卵泡抑
素结构域的SPARC肽(FS-E)及辅酶Q10。

[0103] 在任何实施方式中，所述试剂是酶活性抑制剂。在任何实施方式中，所述试剂是激酶活性抑制剂。

[0104] 在本发明的任何实施方式中，所述第一数据集包括基因组数据集中多个基因的蛋白质和/或mRNA表达水平。在本发明的某些实施方式中，所述第一数据集包括基因组学
数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性
(SNP)数据中的两种或更多种。在本发明的某些实施方式中，所述第一数据集包括基因组
学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的三种或更多种。

[0105] 在本发明的任何实施方式中，所述代表与血管生成相关的细胞的一种或多种功能活性或细胞反应的第二数据集包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和
Seahorse 分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0106] 在本发明的任何实施方式中，所述第一数据集可以是单一数据集如基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性
(SNP)数据之一。在任何实施方式中，所述第一数据集可以是两个数据集。在任何实施方式
中，所述第一数据集是三个数据集。在任何实施方式中，所述第一数据集可以是四个数据
集。在任何实施方式中，所述第一数据集可以是五个数据集。在任何实施方式中，所述第一数据集可以是六个数据集。

[0107] 在本发明的任何实施方式中，所述第二数据集是单一数据集如与血管生成相关的细胞的一种或多种功能活性或细胞反应之一，包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化性、细胞外基质降解、出芽及通过选自ATP、ROS、 OXPHOS和Seahorse分析数据的功能模型实现的基因型-表型相关性中的一种或多种。在任
何实施方式中，所述第二数据集可以是两个数据集。在任何实施方式中，所述第二数据集
可以是三个数据集。在某些实施方式中，所述第二数据集可以是四个数据集。在任何实施
方式中，所述第二数据集可以是五个数据集。在任何实施方式中，所述第二数据集可以是
六个数据集。在任何实施方式中，所述第二数据集可以是七个数据集。在任何实施方式中，所述第二数据集可以是八个数据集。在任何实施方式中，所述第二数据集可以是九个数据
集。在某些实施方式中，所述第二数据集可以是十个数据集。

[0108] 在本发明的任何实施方式中，所述酶活性可以是激酶活性。在本发明的任何实施方式中，所述酶活性可以是蛋白酶活性。

[0109] 在本发明的某些实施方式中，步骤(4)是由基于人工智能(AI) 的信息学平台完成的。在某些实施方式中，所述基于AI的信息学平台包括REFS(TM)。在某些实施方式中，所述基于AI的信息平台接收来自第一数据集和第二数据集的所有数据输入而没有应用统计
截止点。在某些实施方式中，在第(5)步之前，在步骤(4)中建立的一致因果关系网络基于
输入的数据通过计算机模拟进一步优化到模拟因果关系网络，以对一致因果关系网络中
的一个或多个因果关系提供预测的置信水平。

[0110] 在本发明的某些实施方式中，所述独特因果关系被确定为独特地存在于细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0111] 在本发明中，所确定的独特因果关系是选自下组的至少一对之间的关系：基因的表达和脂质的水平；基因的表达和转录物的水平；基因的表达和代谢产物的水平；第一基
因的表达和第二基因的表达；基因的表达和SNP的存在；基因的表达和功能活性；脂质的水
平和转录物的水平；脂质的水平和代谢产物的水平；第一脂质的水平和第二脂质的水平；
脂质的水平和SNP的存在；脂质的水平和功能活性；第一转录物的水平和第二转录物的水
平；转录物的水平和代谢产物的水平；转录物的水平和SNP的存在；第一转录物的水平和功
能活性的水平；第一代谢产物的水平和第二代谢产物的水平；代谢产物的水平和SNP的存
在；代谢产物的水平和功能活性；第一SNP的存在和第二SNP的存在；及SNP的存在和功能活
性。

[0112] 在某些实施方式中，所述功能活性选自生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化性、细胞外基质降解、和出芽及通过选自ATP、ROS、OXPHOS和Seahorse 分析的功能模型实现的基因型-表型相关性。在某些实施方式中，所述
功能活性是激酶活性。在某些实施方式中，所述功能活性是蛋白酶活性。

[0113] 在本发明的某些实施方式中，所述确定的独特因果关系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关系，其中所述功能活性是激酶活性。

[0114] 在本发明中，该方法还可以包括验证在血管生成中所鉴别的独特因果关系。

[0115] 本发明提供了用于提供在平台方法中使用的血管生成模型的方法，包括：

[0116] 使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面，其中所述血管生成的模型可用于生成在平台方法中使用的数据集；

[0117] 从而提供在平台方法中使用的血管生成的模型。

[0118] 本发明提供了用于从在平台方法中使用的血管生成模型获得第一数据集和第二数据集的方法，包括：

[0119] (1)从在平台方法中使用的血管生成模型获得第一数据集，其中所述血管生成模型包含与血管生成相关的细胞，和其中所述第一数据集代表表征与血管生成相关的细胞
的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；

[0120] (2)从在平台方法中使用血管生成模型获得第二数据集，其中所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应；

[0121] 由此从在平台方法中使用的血管生成模型获得第一数据集和第二数据集。

[0122] 本发明提供了用于鉴别血管生成的调节子的方法，所述方法包括：

[0123] (1)用编程的计算设备生成在从血管生成模型获得的第一数据集和第二数据集之中的一致因果关系网络，其中所述模型包含与血管生成相关的细胞，且其中所述第一数
据集代表表征与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、
代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；和第二数据
集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应，其中所述一致因果关
系网络的生成不是基于第一数据集和第二数据集以外的任何已知的生物学关系；

[0124] (2)从一致因果关系网络鉴别血管生成中独特的因果关系，其中与独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物或SNP的至少一种被确定为血管生成的调
节子；

[0125] 从而鉴别血管生成的调节子。

[0126] 本发明提供了用于鉴别血管生成的调节子的方法，所述方法包括：

[0127] (1)提供从血管生成模型生成的一致因果关系网络；

[0128] (2)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物或SNP的至少一种被确定为血管生成
的调节子；

[0129] 从而鉴别血管生成的调节子。

[0130] 在某些实施方式中，一致因果关系网络是用编程的计算设备在从血管生成模型获得的第一数据集和第二数据集之中生成的，其中所述模型包含与血管生成相关的细胞，
和其中所述第一数据集代表表征与血管生成相关的细胞的基因组学数据、脂质组学数据、
蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或
多种；和

[0131] 第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应，其中所述一致因果关系网络的生成不是基于第一数据集和第二数据集以外的任何已知的生
物学关系。

[0132] 在某些实施方式中，血管生成模型选自体外细胞培养血管生成模型、大鼠主动脉微血管模型、新生小鼠视网膜模型、鸡胚绒毛尿囊膜 (CAM)模型、角膜血管生成生长因子囊
袋模型、皮下海绵血管生成生长因子植入模型、血管生成生长因子植入
模型和肿瘤植入模型；且其中所述血管生成模型任选地进一步包括包含对照细胞的匹配
对照血管生成模型。

[0133] 在某些实施方式中，第一数据集包括脂质组学数据。在某些实施方式中，第一数据集仅包括脂质组学数据。

[0134] 在某些实施方式中，第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应，包括与血管生成相关的细胞中的总体酶学活性和总体酶学活性对酶代
谢产物或底物的效应。

[0135] 在某些实施方式中，第二数据集包括激酶活性或蛋白酶活性。在某些实施方式中，第二数据集仅包括激酶活性或蛋白酶活性。

[0136] 在某些实施方式中，第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应，包括生物能量学谱、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、激酶活性和蛋白酶活性，及通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0137] 在本发明的某些实施方式中，血管生成与疾病状态相关。

[0138] 本发明提供用于调节哺乳动物受试者的血管生成的方法，所述方法包括：

[0139] 向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，所述生物活性物质影响通过本文中提供的任一方法鉴别的调节子，从而调节血管生成。

[0140] 本发明提供检测哺乳动物受试者中调节的血管生成的方法，所述方法包括：

[0141] 测定从所述受试者获得的生物样品中通过本文中提供的任一方法鉴别的一种或多种调节子的水平、活性或存在；和

[0142] 比较所述受试者中的水平、活性或存在与对照样品中所述一种或多种调节子的水平、活性或存在，

[0143] 其中所述受试者中的水平、活性或存在与所述对照样品中所述一种或多种调节子的水平、活性或存在之间的差异是所述哺乳动物受试者中血管生成受到调节的指示。

[0144] 本发明提供鉴别用于调节哺乳动物受试者中的血管生成的治疗化合物的方法，所述方法包括：

[0145] 使来自哺乳动物受试者的生物样品与测试化合物接触；

[0146] 测定所述生物样品中通过本文中提供的任一方法鉴别的一种或多种调节子的表达水平；

[0147] 将所述生物样品的一种或多种调节子的水平、活性或存在与未接触所述测试化合物的对照样品比较，和

[0148] 选择调节所述生物样品中一种或多种调节子的水平、活性或存在的测试化合物，

[0149] 从而鉴别用于调节哺乳动物受试者中的血管生成的治疗化合物。

[0150] 本发明提供用于调节哺乳动物受试者中的血管生成的方法，所述方法包括：

[0151] 向需要的哺乳动物施用治疗有效量的包含通过本文中提供的任何方法鉴别的治疗化合物的药物组合物，从而治疗所述疾病、改善其症状、抑制其进展或预防、诊断或预后所述疾病。

[0152] 在某些实施方式中，“环境扰动”，本文也称为“外部刺激成分”，是治疗剂。在某些实施方式中，外部刺激成分是小分子(例如，不超过5kDa、4kDa、3kDa、2kDa、1kDa、500道尔顿或250道尔顿的小分子)。在某些实施方式中，外部刺激成分是生物剂。在某些实施方式中，外部刺激成分是化学剂。在某些实施方式中，外部刺激成分对于细胞是内源性的或外
源性的。在某些实施方式中，外部刺激成分是MIM或表观代谢转变剂(epishifter)。在某些
实施方式中，外部刺激成分是细胞系统的应激因素，如缺氧、高血糖症、高脂血症、高胰岛素血症和/或富乳酸状态。

[0153] 在某些实施方式中，外部刺激成分可包括用于治疗疾病状态的治疗剂或候选治疗剂，包括化疗剂、蛋白质基的生物药物、抗体、融合蛋白质、小分子药物、脂质、多糖、核酸等等。

[0154] 在某些实施方式中，外部刺激成分可以是一个或多个应激因素，如那些通常在各种疾病状态下在体内遇到的，包括缺氧、高血糖状态、酸性环境(可通过乳酸处理模拟)等。

[0155] 在其它实施方式中，外部刺激成分可以包括一种或多种MIM和/ 或表观代谢转变剂，如本文下面所定义的。示例性的MIM包括辅酶 Q10(本文也称为CoQ10)和维生素B族中的
化合物，或者包含维生素B族中的化合物的核苷、单核苷酸或二核苷酸。在某些实施方式
中，外部刺激不是CoQ10。在某些实施方式中，外部刺激不是维生素B 或维生素B族中的化
合物。

[0156] 在进行细胞输出测量(如蛋白质表达、脂质水平)中，可以使用绝对量(例如，表达或总量)或相对水平(例如，相对表达水平或量)。在一个实施方式中，使用绝对量(例如，表达或总量)。在一个实施方式中，使用相对水平或量(例如，相对表达水平)。例如，为了确定细胞系统的蛋白质的相对表达水平，可以将细胞系统中(对细胞系统有或没有外部刺
激)任何给定的蛋白质的量与合适的对照细胞系或细胞系的混合物(如在同一实验中使用
的所有细胞)相比较，并给出倍数增加或倍数减少值。本领域技术人员将会理解，可以在任
何细胞输出测量(如基因和/或RNA的转录水平、脂质水平或者任何功能输出，例如，如本
文所述的细胞凋亡水平、毒性水平或ECAR或OCR) 中使用绝对量或相对量。预先确定的倍数
增加(例如，至少1.2、1.3、 1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、4.5、5、6、7、8、 9、
10、15、20、25、30、35、40、45、50、75或100或者更多倍的增加)或倍数减少(例如，至少减少至0.9、0.8、0.75、0.7、0.6、0.5、 0.45、0.4、0.35、0.3、0.25、0.2、0.15、0.1或0.05倍、或者减少到 90％、80％、75％、70％、65％、60％、55％、50％、45％、40％、 35％、30％、25％、
20％、15％、10％或5％或更少)的阈值水平可以被用于选择显著差异，和然后该显著差异
的细胞输出数据可包括在用于本发明的平台技术方法中的数据集(例如，第一和第二数据
集) 中。存在于前述列表中的所有的值也可以是范围的上限或下限，例如，在1.5至5倍、5
至10倍、2至5倍之间、或0.9至0.7、0.9至0.5、 0.7至0.3倍之间的范围意图为本发明的部
分。

[0157] 在整个本申请中，显示在列表中的所有值，例如，如上述的那些，也可以是确定为本发明中的一部分的范围的上限或下限。

[0158] 在本发明的方法的一个实施方式中，不是因果关系网络中观察到的每一个因果关系都有生物学意义。对于所述探询生物评价被应用的任何给定的生物系统，一些(或者
也许全部)的因果关系(以及与其相关的基因)相对于特定的所讨论的生物问题是“确定性
的”，例如导致引起疾病状态(治疗性干预的潜在靶标)或疾病状态的生物标志物 (潜在的
诊断或预后的因素)。在一个实施方式中，观察的在生物系统中独特的因果关系对于所讨
论的特定生物问题是确定性的。在一个实施方式中，并非每一个在生物系统中观察到的独
特的因果关系对于所讨论的特定生物问题是确定性的。

[0159] 可以由所述方法的最终用户来选择这样的确定性的因果关系，或者可以由生物信息学软件程序来选择，如REFS、DAVID实现的比较途径分析程序或者KEGG途径分析程序。
在某些实施方式中，使用一个以上的生物信息学软件程序，和来自两个或更多生物信息学
软件程序的一致结果是优选的。

[0160] 如本文所用的细胞输出的“差异”包括任何一个或多个细胞输出参数中的差异(例如，增加或减少的水平)。在某些实施方式中，差异各自独立地选自于mRNA转录、蛋白质表达、蛋白质活性、代谢物/ 中间体水平和/或配体-靶相互作用中的差别。例如，就蛋白质
表达水平而言，可以通过使用本领域公认的技术，如以质谱分析为基础的检测(例如，
iTRAQ、2D-LC-MSMS等)测量和定量两个细胞输出之间的差异，例如在外部刺激成分处理之
前和之后与细胞系统相关的输出。

[0161] 在一个方面，生物系统的细胞模型包含细胞交互系统，其中具有含外部刺激成分的第一细胞环境的第一细胞系统产生第一改变的细胞环境，以使得通过将具有第二细胞
环境的第二细胞系统暴露于第一改变的细胞环境而建立交互细胞系统。

[0162] 在一个实施方式中，产生至少一个与交互细胞系统的显著细胞交互差异，和鉴别至少一个确定性的细胞交互差异以使得进行探询式生物学评估。在某些实施方式中，所述
至少一个显著的细胞交互差异是多个差异。

[0163] 在某些实施方式中，所述至少一个确定性的细胞交互差异是由最终用户选择的。或者，在另一个实施方式中，所述至少一个确定性的细胞交互差异是基于定量蛋白质组学
数据通过生物信息学软件程序 (如，例如，REFS、KEGG途径分析或DAVID实现的比较途径分
析) 而选择的。

[0164] 在某些实施方式中，所述方法进一步包括产生用于第一细胞系统的显著细胞输出差异。

[0165] 在某些实施方式中，差异各自独立地选自于mRNA转录、蛋白质表达、蛋白质活性、代谢物/中间体水平和/或配体-靶相互作用的差异。

[0166] 在某些实施方式中，所述第一细胞系统和第二细胞系统独立地选自于原代细胞的同质群体、癌细胞系或正常细胞系。

[0167] 在某些实施方式中，第一改变的细胞环境包含由第一细胞系统分泌到第一细胞环境中的因子，其作为第一细胞系统与外部刺激成分接触的结果。该因子可以包含分泌的
蛋白质或其他的信号分子。在某些实施方式中，该第一改变的细胞环境基本上没有原来的
外部刺激成分。

[0168] 在某些实施方式中，交互细胞系统包含具有插入隔室和由膜分隔的杯状隔室的侵袭实验装置(transwell)。例如，第一细胞系统可在插入隔室(或杯状隔室)中生长，和所
述第二细胞系统可在杯状隔室 (或插入隔室)中生长。

[0169] 在某些实施方式中，交互细胞系统包含用于第一细胞系统生长的第一培养物和用于第二细胞系统生长的第二培养物。在这种情况下，第一改变的细胞环境可以是来自第
一细胞系统的条件培养基。

[0170] 在某些实施方式中，所述第一细胞环境和第二细胞环境可以相同。在某些实施方式中，所述第一细胞环境和第二细胞环境可以不同。

[0171] 在某些实施方式中，交互细胞系统包含所述第一细胞系统和第二细胞系统的共培养。

[0172] 本发明的方法可用于或应用于多种“探询式生物学评估”。本发明的方法应用于探询式生物学评估以使其能够鉴别生物系统的一个或多个调节子或者生物系统或过程的
确定性的细胞过程“驱动子”。

[0173] 本发明的方法可用于进行广泛的探询式生物学评估。在某些实施方式中，探询式生物学评估是疾病状态的诊断。在某些实施方式中，探询式生物学评估是确定药物疗效。
在某些实施方式中，探询式生物学评估是药物毒性测定。在某些实施方式中，探询式生物
学评估是疾病状态的分期。在某些实施方式中，探询式生物学评估鉴别抗衰老化妆品的
靶标。

[0174] 如本文所用的“探询式生物学评估”可包括鉴别生物系统中的一个或多个调节子，例如，确定性的细胞过程“驱动子”(例如，生物途径，或途径的关键成员，或途径成员的主要调节子的活性的增加或减少)，其与环境扰动或外部刺激成分或者生物系统或过程中
独有的独特因果关系相关。它可以进一步包括涉及额外的步骤来测试或验证确定的确定
性细胞过程驱动子是否需要和/或足够用于与环境扰动外部刺激成分相关联的下游事件，
包括体内动物模型和/或体外组织培养实验。

[0175] 在某些实施方式中，探询式生物学评估是疾病状态的诊断或分期，其中所鉴别的生物系统的调节子，例如，细胞过程的确定性驱动子(例如，交互差异或生物系统或过程中
的独特因果关系)代表疾病标志物或可以进行治疗干预的治疗靶标。所述探询式生物学评
估在理论上适合任何病情，但可能会发现在某些领域特别有用，如肿瘤/癌症生物学、糖
尿病、肥胖症、心血管疾病和神经系统疾病(尤其是神经退行性疾病，例如，不限于，阿尔茨海默氏病、帕金森氏病、亨廷顿氏病、肌萎缩性脊髓侧索硬化症(ALS)和衰老相关的神经退
行性疾病)及与血管生成相关的病症。

[0176] 在某些实施方式中，探询式生物学评估是药物疗效的确定，其中所鉴别的生物系统的调节子，例如，确定性的细胞过程驱动子(例如，交互差异或者生物系统或过程中独特
的因果关系)可以是成功药物的标志，并可随之用于鉴别另外的用于治疗相同疾病状况的
试剂，如 MIM或表观代谢转变剂。

[0177] 在某些实施方式中，探询式生物学评估是鉴别用于预防或治疗感染的药物靶标，其中所鉴别的确定性细胞过程驱动子(例如，细胞交互差异或者生物系统或过程中独特的
因果关系)可以是标志物/指标或导致感染状态的关键生物分子，并可以随之被用来鉴别
抗感染剂。

[0178] 在某些实施方式中，探询式生物学评估是试剂(例如药物)对给定的疾病谱的分子效应的评估，其中所鉴别的生物系统的调节子，例如，确定性的细胞过程驱动子(例如，
细胞交互差异或者生物系统或过程中独特的因果关系)可以是一个或多个生物途径、途径
的主要成员或途径成员的主要调节子的活性的增加或减少，且可随之被用于，例如，预测
该试剂对于给定疾病的疗效。

[0179] 在某些实施方式中，探询式生物学评估是试剂(例如药物)对于细胞、组织、器官或有机体的毒理学特性的评估，其中所鉴别的生物系统调节子，例如，确定性的细胞过程
驱动子(例如，细胞交互差异或者生物系统或过程中独特的因果关系)可以是毒性(例如，
细胞毒性)的指示剂，且因而可以用来预测或确定试剂的毒理学特性。在一个实施方式
中，鉴别的生物系统调节子，例如，确定性的细胞过程驱动子(例如，细胞交互差异或者生
物系统或过程中独特的因果关系) 是药物或药物候选物的心脏毒性的指示剂，并可随之用
来预测或确定药物或药物候选物的心脏毒性特性。

[0180] 在某些实施方式中，探询式生物学评估是鉴别用于预防或治疗由生物武器(如导致疾病的原生动物、真菌、细菌、病菌(protests)、病毒或毒素)引起的疾病或病症的药物
靶标，其中所鉴别的生物系统调节子，例如，确定性的细胞过程驱动子(例如，细胞交互差
异或者生物系统或过程中独特的因果关系)可以是标志物/指标或引起所述疾病或病症
的关键生物分子，且因而可以用来鉴别生物防御剂。

[0181] 在某些实施方式中，探询式生物学评估是鉴别抗老化剂(如抗老化化妆品)的靶标，其中所鉴别的生物系统调节子，例如，确定性的细胞过程驱动子(例如，细胞交互差异
或者生物系统或过程中独特的因果关系)可以是老化过程的标志物或指示剂，特别是皮肤
的老化过程，并可随之用于鉴别抗老化剂。

[0182] 在用于鉴别抗衰老化妆品靶标的本发明方法中的一个示例性衰老细胞模型中，该细胞模型包含用例如UV光(环境扰动或外部刺激成分)处理的老化的上皮细胞和/或任
选地也用UV光处理的新生细胞。在一个实施方式中，老化的细胞模型包括细胞交互系统。
在为鉴别抗衰老化妆品的靶标而建立的一个示例性的双细胞交互系统中，可以用UV光
(外部刺激成分)处理老化上皮细胞(第一细胞系统)，且由于与处理的老化上皮细胞的条
件培养基接触而导致的新生细胞 (第二细胞系统)的变化(例如蛋白质组变化和/或功能变
化)可被测量，例如，可以使用常规的定量质谱法测定蛋白质组的变化，或可以从由数据
生成的因果关系网络鉴别老化过程中独特的因果关系。

[0183] 在另一个方面，本发明提供了一种试剂盒，其用于使用发现平台技术进行探询式生物学评估，其包含用于检测作为由本发明的方法生成的因果关系网络的主题的分析物
是否存在和/或用于定量其量的一种或多种试剂。在一个实施方式中，所述分析物是生物
系统中独特的因果关系的对象，例如，与生物系统中独特的因果关系相关的基因。在某些
实施方式中，分析物是蛋白质，且该试剂包含针对该蛋白质的抗体、该蛋白质的标记物和/
或一种或多种制备用于高通量分析(例如，基于质谱的测序)的该蛋白质的试剂。

[0184] 在又另一个方面，所述技术提供一种用于治疗哺乳动物受试者的疾病、缓解其症状、抑制其进展、预防、诊断或预后该疾病的方法。所述方法包括向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，该生物活性物质影响TCOF1、TOP2A、CAMK2A、 CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种的表达或活性，从而治疗哺乳动物受试者的疾病、缓解其症状、抑制其进展、预防、诊断或预后该疾病。在一些实施方式中，所述疾病是癌症，例如肝细胞癌。在各种实施方式中，所述方法可以使用1、2、3、4、5、6、
7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、
33或34种激酶。在一种实施方式中，所述组合物提高一种或多种激酶的表达和/或活性。在
另一种实施方式中，所述组合物降低一种或多种激酶的表达和/或活性。

[0185] 在再另一个方面中，所述技术提供一种诊断哺乳动物受试者的疾病的方法。所述方法包括：(i)测定从所述受试者获得的生物样品中 TCOF1、TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、ENO1、 FBL、GSK3B、HDLBP、HIST1H2BA、HMGB2、HNRNPK、HNRPDL、 HSPA9、MAP2K2、LDHA、MAP4、MAPK1、MARCKS、NME1、 NME2、PGK1、PGK2、RAB7A、RPL17、RPL28、RPS5、RPS6、SLTM、 TMED4、TNRCBA、TUBB和UBE21中任何一种或多种的表达或活性水平；和(ii)将所述受试者
中的水平与对照样品中所述一种或多种蛋白质的表达或活性水平比较，其中所述受试者
中的水平和所述对照样品中一种或多种蛋白质的表达或活性水平之间的差异是所述受试
者患有疾病或易于发生疾病或有利地对疾病治疗发生反应的指示，从而诊断所述哺乳动
物受试者的疾病。在一些实施方式中，所述疾病是癌症，例如肝细胞癌。在各种实施方式
中，所述方法可以使用1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、
22、23、24、25、26、27、28、29、30、31、32、33或34 种激酶。在一种实施方式中，所述差异是一种或多种激酶的表达和/ 或活性的提高。在另一种实施方式中，所述差异是一种或多种激
酶的表达和/或活性的降低。

[0186] 在再另一个方面中，所述技术提供一种鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展、预防、诊断或预后该疾病的治疗化合物的方法。所述方法包括(i)
使来自所述哺乳动物受试者的生物样品与测试化合物接触；(ii)测定所述生物样品中
TCOF1、 TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、 HDLBP、HIST1H2BA、HMGB2、HNRNPK、HNRPDL、HSPA9、 MAP2K2、LDHA、MAP4、MAPK1、MARCKS、NME1、NME2、PGK1、 PGK2、RAB7A、RPL17、RPL28、RPS5、RPS6、SLTM、TMED4、 TNRCBA、TUBB和UBE21中任何一种或多种的表达水平；(iii)将所述生物样品中一种或多种蛋白质的表达水平与未与测试化合物接
触的对照样品比较；和(iv)选择调节所述生物样品中一种或多种蛋白质的表达水平的测
试化合物，从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展、预防、诊断或预后该疾病的治疗化合物。在一些实施方式中，所述疾病是癌症，例如肝细胞癌。在各种实施方式中，所述方法可以使用1、2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、
19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33或34种激酶。在一种实施方式中，所述化合物提高一种或多种激酶的表达和/或活性。在另一种实施方式中，所述化合物降低
一种或多种激酶的表达和/或活性。

[0187] 在再另一个方面中，所述技术提供一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展、预防、诊断或预后所述疾病的方法。所述方法包括向需要的哺乳动物施用治疗有效量的包含通过上述方面(即，利用TCOF1、TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、 ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、HMGB2、HNRNPK、 HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、MAPK1、MARCKS、 NME1、NME2、PGK1、PGK2、RAB7A、RPL17、RPL28、RPS5、 RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21中任何一种或多种)鉴别的治疗化合物的药物组合物，从而治疗所述
疾病、改善其症状、抑制其进展、预防、诊断或预后所述疾病。在一些实施方式中，所述疾病是癌症，例如肝细胞癌。在各种实施方式中，所述方法可以使用1、2、3、4、5、6、7、8、9、10、
11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33或34种激酶。

[0188] 特别地，本发明涉及以下各项：

[0189] 1.一种用于鉴别生物系统的调节子的方法，所述方法包括：

[0190] 使用与该生物系统相关的细胞建立该生物系统的模型来代表该生物系统的特征性方面；

[0191] 从所述模型获得第一数据集，其中所述第一数据集代表与该生物系统相关的细胞中的总体蛋白质组学改变；

[0192] 从所述模型获得第二数据集，其中所述第二数据集代表与该生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应
包括与该生物系统相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底
物的效应；

[0193] 用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述
一致因果关系网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学
关系；

[0194] 从该一致因果关系网络鉴别在该生物系统中独特的因果关系，其中与该独特的因果关系相关的至少一种酶被确定为该生物系统的调节子。

[0195] 2.如第1项的方法，其中所述第一数据集还代表表征与所述生物系统相关的细胞的脂质组学数据。

[0196] 3.如第2项的方法，其中所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据和所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞
的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶
代谢产物或底物的效应。

[0197] 4.如第1项的方法，其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多
种。

[0198] 5.如第1项的方法，其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更多
种。

[0199] 6.如第4或5项的方法，其中所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多
种及所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种
功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底
物的效应。

[0200] 7.如第1-6项中任一项的方法，其中所述总体酶学活性包括总体激酶活性。

[0201] 8.如第1-7项中任一项的方法，其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。

[0202] 9.如第1-8项中任一项的方法，其中所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0203] 10.如第1-8项中任一项的方法，其中所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中
的一种或多种及所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的
一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代
谢产物或底物的效应且还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0204] 11.如第1-10项中任一项的方法，其中所述生物系统的模型包括与所述生物系统相关的细胞的体外培养物，任选地进一步包括匹配的对照细胞的体外培养物。

[0205] 12.如第11项的方法，其中所述细胞的体外培养物经受环境扰动，且所述匹配的对照细胞的体外培养物是没有经受环境扰动的相同细胞。

[0206] 13.如第12项的方法，其中所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。

[0207] 14.如第13项的方法，其中所述环境扰动包括使所述细胞与酶活性抑制剂接触。

[0208] 15.如第14项的方法，其中所述酶活性抑制剂是激酶抑制剂。

[0209] 16.如第13项的方法，其中所述环境扰动包括使所述细胞与 CoQ10接触。

[0210] 17.如第14项的方法，其中所述环境扰动还包括使所述细胞与 CoQ10接触。

[0211] 18.如第1项的方法，其中所述生成步骤通过基于人工智能 (AI)的信息学平台完成。

[0212] 19.如第18项的方法，其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。

[0213] 20.如第1项的方法，其中在所述鉴别步骤之前，在所述生成步骤中建立的所述一致因果关系网络通过基于输入数据的计算机模拟进一步优化到模拟因果关系网络，以对
于一致因果关系网络内的一个或多个因果关系提供预测的置信水平。

[0214] 21.如第11项的方法，其中所述独特因果关系被确定为独特地存在于所述与生物系统相关的细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0215] 22.如第12项的方法，其中所述独特因果关系被确定为独特地存在于所述经受环境扰动的细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0216] 23.如第1-22项中任一项的方法，其中所述确定的独特因果关系是选自下组的至少一对之间的关系：基因的表达和脂质的水平；基因的表达和转录物的水平；基因的表达
和代谢产物的水平；第一基因的表达和第二基因的表达；基因的表达和SNP的存在；基因的
表达和功能活性；脂质的水平和转录物的水平；脂质的水平和代谢产物的水平；第一脂质
的水平和第二脂质的水平；脂质的水平和SNP的存在；脂质的水平和功能活性；第一转录物
的水平和第二转录物的水平；转录物的水平和代谢产物的水平；转录物的水平和SNP的存
在；第一转录物的水平和功能活性的水平；第一代谢产物的水平和第二代谢产物的水平；
代谢产物的水平和SNP的存在；代谢产物的水平和功能活性；第一SNP的存在和第二SNP的
存在；及SNP的存在和功能活性。

[0217] 24.如第1-23项中任一项的方法，其中所述确定的独特因果关系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关系，其中所述功能活性是总体激酶活性。

[0218] 25.一种用于鉴别疾病过程的调节子的方法，所述方法包括：

[0219] 使用疾病相关细胞建立该疾病过程的模型以代表该疾病过程的特征性方面；

[0220] 从所述模型获得第一数据集，其中所述第一数据集代表疾病相关细胞中的总体蛋白质组学改变；

[0221] 从所述模型获得第二数据集，其中所述第二数据集代表与所述生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反
应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应；

[0222] 使用编程的计算设备，仅基于所述第一数据集和第二数据集生成所述总体酶学活性与所述细胞的一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述
一致因果关系网络的生成不是基于所述第一数据集和第二数据集以外的任何已知的生物
学关系；和

[0223] 从该一致因果关系网络鉴别在所述疾病过程中独特的因果关系，其中与该独特的因果关系相关的至少一种酶被确定为所述疾病过程的调节子。

[0224] 26.如第25项的方法，其中所述第一数据集还代表表征与所述生物系统相关的细胞的脂质组学数据。

[0225] 27.如第26项的方法，其中所述一致因果关系网络在所述总体蛋白质组学改变、脂质组学数据和所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的
一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活
性对酶代谢产物或底物的效应。

[0226] 28.如第25项的方法，其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多
种。

[0227] 29.如第28项的方法，其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更
多种。

[0228] 30.如第28或29项的方法，其中所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种
或多种及所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或
多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对至
少一种酶代谢产物或底物的效应。

[0229] 31.如第25-30项中任一项的方法，其中所述总体酶学活性包括总体激酶活性，且其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。

[0230] 32.如第25-31项中任一项的方法，其中所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0231] 33.如第32项的方法，其中所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多
种及所述细胞的一种或多种功能活性或细胞反应之中生成，其中所述细胞的一种或多种
功能活性或细胞反应包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、 ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0232] 34.如第25-33项中任一项的方法，其中所述疾病过程是癌症、糖尿病、肥胖症、心血管疾病、年龄相关性黄斑变性、糖尿病性视网膜病或炎性疾病。

[0233] 35.如第25-33项中任一项的方法，其中所述疾病过程包括血管生成。

[0234] 36.如第25-33项中任一项的方法，其中所述疾病过程包括肝细胞癌、肺癌、乳腺癌、前列腺癌、黑色素瘤、癌瘤、肉瘤、淋巴瘤、白血病、鳞状细胞癌、结肠直肠癌、胰腺癌、甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体瘤、白血病、非霍奇金淋巴瘤或耐药性癌症。

[0235] 37.如第25-33项任一项的方法，其中所述疾病模型包括疾病细胞的体外培养物，任选地进一步包括匹配的对照或正常细胞的体外培养物。

[0236] 38.如第37项的方法，其中所述疾病细胞的体外培养物经受环境扰动，且所述匹配的对照细胞的体外培养物是没有经受环境扰动的相同疾病细胞。

[0237] 39.如第38项的方法，其中所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。

[0238] 40.如第39项的方法，其中所述环境扰动包括使所述细胞与酶活性抑制剂接触。

[0239] 41.如第40项的方法，其中所述酶活性抑制剂是激酶抑制剂。

[0240] 42.如第39项的方法，其中所述环境扰动包括使所述细胞与 CoQ10接触。

[0241] 43.如第25项的方法，其中所述疾病过程的特征性方面包括缺氧状态、高血糖状态、富乳酸培养条件或它们的组合。

[0242] 44.如第25项的方法，其中所述生成步骤通过基于人工智能 (AI)的信息学平台完成。

[0243] 45.如第25项的方法，其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。

[0244] 46.如第25项的方法，其中在所述鉴别步骤之前，在所述生成步骤中建立的所述一致因果关系网络通过基于输入数据的计算机模拟进一步优化到模拟因果关系网络，以
对于所述一致因果关系网络内的一个或多个因果关系提供预测的置信水平。

[0245] 47.如第37项的方法，其中所述独特因果关系被确定为独特地存在于疾病细胞的模型中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0246] 48.如第38项的方法，其中所述独特因果关系被确定为独特地存在于所述经受环境扰动的细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0247] 49.一种用于鉴别生物系统的调节子的方法，所述方法包括：

[0248] 使用与该生物系统相关的细胞建立该生物系统的模型来代表该生物系统的特征性方面；

[0249] 从所述模型获得第一数据集，其中所述第一数据集代表所述细胞中的总体蛋白质组学改变及表征与该生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数
据、基因组学数据和SNP数据中的一种或多种；

[0250] 从所述模型获得第二数据集，其中所述第二数据集代表与该生物系统相关的细胞的一种或多种功能活性或细胞反应，其中所述细胞的一种或多种功能活性或细胞反应
包括与该生物系统相关的细胞中的总体激酶活性和/或总体激酶活性对激酶代谢产物或
底物的效应；

[0251] 使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数
据中的一种或多种及所述一种或多种功能活性或细胞反应之中的一致因果关系网络，其
中所述一致因果关系网络的生成不基于所述第一数据集和第二数据集以外的任何已知
的生物学关系；

[0252] 从该一致因果关系网络鉴别在所述生物系统中独特的因果关系，其中与该独特的因果关系相关的至少一种激酶被确定为该生物系统的调节子。

[0253] 50.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展、预防、诊断或预后该疾病的方法，所述方法包括：

[0254] 向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，所述生物活性物质影响通过第1-18项中任一项所鉴别的调节子，从而治疗所述疾病、改善其症
状、抑制其进展、预防、诊断或预后所述疾病。

[0255] 51.一种诊断或预后哺乳动物受试者的疾病的方法，所述方法包括：

[0256] 测定从所述受试者获得的生物样品中一种或多种通过第1-48项中任一项鉴别的调节子的表达或活性水平；和

[0257] 将所述受试者中的水平与对照样品中所述一种或多种调节子的表达或活性水平比较，

[0258] 其中所述受试者中的水平和所述对照样品中一种或多种调节子的表达或活性水平之间的差异是所述受试者患有疾病、易于发生疾病或有利地对疾病治疗发生反应的指
示，从而诊断或预后所述哺乳动物受试者的疾病。

[0259] 52.一种鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物的方法，所述方法包括：

[0260] 使来自所述哺乳动物受试者的生物样品与测试化合物接触；

[0261] 测定所述生物样品中一种或多种通过第1-48项中任一项鉴别的调节子的表达水平；

[0262] 将所述生物样品中一种或多种调节子的表达水平与未与测试化合物接触的对照样品比较；和

[0263] 选择调节所述生物样品中一种或多种调节子的表达水平的测试化合物，

[0264] 从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物。

[0265] 53.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防所述疾病的方法，所述方法包括：

[0266] 向需要的哺乳动物施用治疗有效量的包含第52项的治疗化合物的药物组合物，从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。

[0267] 54.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防所述疾病的方法，所述方法包括：

[0268] 向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，所述生物活性物质影响TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种的表达或活性，

[0269] 从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。

[0270] 55.如第54项的方法，其中所述疾病是肝细胞癌。

[0271] 56.一种诊断或预后哺乳动物受试者的疾病的方法，所述方法包括：

[0272] 测定从所述受试者获得的生物样品中TCOF1、TOP2A、CAMK2A、 CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中的任何一种或多种蛋白质的表达或活性水平；和

[0273] 将所述受试者中的水平与对照样品中所述一种或多种蛋白质的表达或活性水平比较，

[0274] 其中所述受试者中的水平和所述对照样品中一种或多种蛋白质的表达或活性水平之间的差异是所述受试者患有疾病或易于发生疾病或有利地对疾病治疗发生反应的指
示，从而诊断或预后所述哺乳动物受试者的疾病。

[0275] 57.如第56项的方法，其中所述疾病是肝细胞癌。

[0276] 58.一种鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物的方法，所述方法包括：

[0277] 使来自所述哺乳动物受试者的生物样品与测试化合物接触；

[0278] 测定所述生物样品中TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种蛋白质的表达水平；

[0279] 将所述生物样品中一种或多种蛋白质的表达水平与未与测试化合物接触的对照样品比较；和

[0280] 选择调节所述生物样品中一种或多种蛋白质的表达水平的测试化合物，

[0281] 从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防该疾病的治疗化合物。

[0282] 59.如第58项的方法，其中所述疾病是肝细胞癌。

[0283] 60.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制其进展或预防所述疾病的方法，所述方法包括：

[0284] 向需要的哺乳动物施用治疗有效量的包含第58项的治疗化合物的药物组合物，从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。

[0285] 61.一种用于鉴别血管生成的调节子的方法，所述方法包括：

[0286] (1)使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面；

[0287] (2)从所述血管生成的模型获得第一数据集，其中所述第一数据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；

[0288] (3)从所述血管生成的模型获得第二数据集，其中所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应；

[0289] (4)使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种及所述与血管生成相关的细
胞的一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果关系
网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系；

[0290] (5)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与该独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物或SNP被确定为血管生成的调节子。

[0291] 62.一种用于鉴别血管生成的调节子的方法，所述方法包括：

[0292] (1)使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面；

[0293] (2)从所述血管生成的模型获得第一数据集，其中所述第一数据集代表脂质组学数据；

[0294] (3)从所述血管生成的模型获得第二数据集，其中所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应；

[0295] (4)使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述脂质组学数据及所述一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一
致因果关系网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关
系；

[0296] (5)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与该独特的因果关系相关的脂质被确定为血管生成的调节子。

[0297] 63.如第61或62项的方法，其中所述代表与血管生成相关的细胞的一种或多种功能活性或细胞反应的第二数据集包括与血管生成相关的细胞中的总体酶学活性和/或总
体酶学活性对酶代谢产物或底物的效应。

[0298] 64.一种用于鉴别血管生成的调节子的方法，所述方法包括：

[0299] (1)使用与血管生成相关的细胞建立血管生成的模型来代表血管生成的特征性方面；

[0300] (2)从所述血管生成的模型获得第一数据集，其中所述第一数据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；

[0301] (3)从所述血管生成的模型获得第二数据集，其中所述第二数据集代表所述与血管生成相关的细胞的一种或多种功能活性或细胞反应，其中所述一种或多种功能活性或
细胞反应包括所述与血管生成相关的细胞中的总体酶学活性和/或总体酶学活性对酶代
谢产物或底物的效应；

[0302] (4)使用编程的计算设备，仅仅基于所述第一数据集和第二数据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种及所述与血管生成相关的细
胞的一种或多种功能活性或细胞反应之中的一致因果关系网络，其中所述一致因果关系
网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系；

[0303] (5)从该一致因果关系网络鉴别在血管生成中独特的因果关系，其中与该独特的因果关系相关的酶被确定为血管生成的调节子。

[0304] 65.如第63或64项的方法，其中所述总体酶学活性包括总体激酶活性且所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。

[0305] 66.如第63或64项的方法，其中所述总体酶学活性包括总体蛋白酶活性。

[0306] 67.如第61-66项任一项的方法，其中所述调节子刺激或促进血管生成。

[0307] 68.如第61-66项任一项的方法，其中所述调节子抑制血管生成。

[0308] 69.如第61-68项任一项的方法，其中所述包含与血管生成相关的细胞的血管生成模型选自体外细胞培养血管生成模型、大鼠主动脉微血管模型、新生小鼠视网膜模型、
鸡胚绒毛尿囊膜(CAM)模型、角膜血管生成生长因子囊袋模型、皮下海绵血管生成生长因
子植入模型、血管生成生长因子植入模型和肿瘤植入模型；且其中所
述血管生成模型任选地进一步包括包含对照细胞的匹配对照血管生成模型。

[0309] 70.如第69项的方法，其中所述体外培养血管生成模型选自管形成分析、迁移分析、伯伊登室分析、划痕分析。

[0310] 71.如第69或70项的方法，其中所述体外培养模型中与血管生成相关的细胞是人血管内皮细胞(HUVEC)。

[0311] 72.如第69项的方法，其中所述角膜血管生成生长因子囊袋模型、皮下海绵血管生成生长因子植入模型或血管生成生长因子植入模型中的血管生成生
长因子选自FGF-2和VEGF。

[0312] 73.如第69项的方法，其中所述血管生成模型中的细胞经受环境扰动，且所述匹配的血管生成模型中的细胞是没有经受环境扰动的相同细胞。

[0313] 74.如第73项的方法，其中所述环境扰动包括与试剂的接触、培养条件的变化、引入的遗传修饰或突变、引起遗传修饰或突变的媒介和局部缺血的诱导中的一种或多种。

[0314] 75.如第74项的方法，其中所述试剂是促血管生成剂或抗血管生成剂。

[0315] 76.如第75项的方法，其中所述促血管生成剂选自FGF-2和 VEGF。

[0316] 77.如第75项的方法，其中所述抗血管生成剂选自VEGF抑制剂、整联蛋白拮抗剂、血管抑素、内皮抑素、肿瘤抑素、阿瓦斯汀、索拉非尼、舒尼替尼、帕唑帕尼和依维莫司、可溶性VEGF受体、血管生成素2、血小板反应蛋白1、血小板反应蛋白2、血管形成抑制素、钙网织蛋白、凝血酶原(kringle结构域-2)、抗凝血酶III片段、血管内皮生长抑制剂(VEGI)、富含半胱氨酸的酸性分泌蛋白(SPARC)和对应于蛋白质的卵泡抑素结构域的SPARC肽(FS-
E)和辅酶Q10。

[0317] 78.如第74项的方法，其中所述试剂是酶活性抑制剂。

[0318] 79.如第74项的方法，其中所述试剂是激酶活性抑制剂。

[0319] 80.如第61或64项的方法，其中所述第一数据集包括基因组数据集中多个基因的蛋白质和/或mRNA表达水平。

[0320] 81.如第61或64项的方法，其中所述第一数据集包括基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的两种
或更多种。

[0321] 82.如第61或64项的方法，其中所述第一数据集包括基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的三种
或更多种。

[0322] 83.如第61-64项任一项的方法，其中所述代表与血管生成相关的细胞的一种或多种功能活性或细胞反应的第二数据集进一步包括生物能量学、细胞增殖、细胞凋亡、细
胞器功能、细胞迁移、管形成、酶活性、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、 OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0323] 84.如第83项的方法，其中所述酶活性是激酶活性。

[0324] 85.如第83项的方法，其中所述酶活性是蛋白酶活性。

[0325] 86.如第61-64项任一项的方法，其中步骤(4)通过基于人工智能(AI)的信息学平台完成。

[0326] 87.如第86项的方法，其中所述基于AI的信息学平台包括 REFS(TM)。

[0327] 88.如第86项的方法，其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。

[0328] 89.如第61-64项任一项的方法，其中在步骤(5)之前，在步骤 (4)中建立的所述一致因果关系网络基于输入的数据通过计算机模拟进一步优化到模拟因果关系网络，以对
于一致因果关系网络内的一个或多个因果关系提供预测的置信水平。

[0329] 90.如第61-64项任一项的方法，其中所述独特因果关系被确定为独特地存在于细胞中且不存在于匹配的对照细胞中的差异因果关系网络的部分。

[0330] 91.如第61-90项任一项的方法，其中所述确定的独特因果关系是选自下组的至少一对之间的关系：基因的表达和脂质的水平；基因的表达和转录物的水平；基因的表达
和代谢产物的水平；第一基因的表达和第二基因的表达；基因的表达和SNP的存在；基因的
表达和功能活性；脂质的水平和转录物的水平；脂质的水平和代谢产物的水平；第一脂质
的水平和第二脂质的水平；脂质的水平和SNP的存在；脂质的水平和功能活性；第一转录物
的水平和第二转录物的水平；转录物的水平和代谢产物的水平；转录物的水平和SNP的存
在；第一转录物的水平和功能活性的水平；第一代谢产物的水平和第二代谢产物的水平；
代谢产物的水平和SNP的存在；代谢产物的水平和功能活性；第一SNP的存在和第二SNP的
存在；及SNP的存在和功能活性。

[0331] 92.如第91项的方法，其中所述功能活性选自生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化性、细胞外基质降解和出芽及通过选自ATP、ROS、OXPHOS和 Seahorse分析的功能模型实现的基因型-表型相关性。

[0332] 93.如第91或92项的方法，其中所述功能活性是激酶活性。

[0333] 94.如第91或92项的方法，其中所述功能活性是蛋白酶活性。

[0334] 95.如第61-93项中任一项的方法，其中所述确定的独特因果关系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关系，其中所述功能活性是激酶活性。

[0335] 96.如第61-95项中任一项的方法，进一步包括验证所述鉴别的血管生成中的独特因果关系。

[0336] 97.一种用于提供平台方法中使用的血管生成模型的方法，包括：

[0337] 使用与血管生成相关的细胞建立血管生成的模型以代表血管生成的特征性方面，其中所述血管生成的模型可用于生成在平台方法中使用的数据集；

[0338] 从而提供在平台方法中使用的血管生成的模型。

[0339] 98.一种用于从在平台方法中使用的血管生成模型获得第一数据集和第二数据集的方法，包括：

[0340] (1)从在平台方法中使用的血管生成模型获得第一数据集，其中所述血管生成模型包含与血管生成相关的细胞，和其中所述第一数据集代表表征所述与血管生成相关的
细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；

[0341] (2)从在平台方法中使用的血管生成模型获得第二数据集，其中所述第二数据集代表所述与血管生成相关的细胞的一种或多种功能活性或细胞反应；

[0342] 从而从在平台方法中使用的所述血管生成模型获得第一数据集和第二数据集。

[0343] 99.一种用于鉴别血管生成的调节子的方法，所述方法包括：

[0344] (1)用编程的计算设备生成在从血管生成模型获得的第一数据集和第二数据集之中的一致因果关系网络，其中所述模型包含与血管生成相关的细胞，和其中所述第一数
据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数
据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种；和所述
第二数据集代表所述与血管生成相关的细胞的一种或多种功能活性或细胞反应，其中所
述一致因果关系网络的生成不是基于所述第一数据集和第二数据集以外的任何已知的生
物学关系；

[0345] (2)从所述一致因果关系网络鉴别血管生成中独特的因果关系，其中与所述独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物或SNP中的至少一种被确定为血
管生成的调节子；

[0346] 从而鉴别血管生成的调节子。

[0347] 100.一种用于鉴别血管生成的调节子的方法，所述方法包括：

[0348] 1)提供从血管生成的模型生成的一致因果关系网络；

[0349] 2)从该一致因果关系网络鉴别血管生成中独特的因果关系，其中与所述独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物或SNP中的至少一种被确定为血管
生成的调节子；

[0350] 从而鉴别血管生成的调节子。

[0351] 101.如第90项的方法，其中所述一致因果关系网络用编程的计算设备在从血管生成模型获得的第一数据集和第二数据集之中生成，其中所述模型包含与血管生成相关
的细胞，和其中所述第一数据集代表表征所述与血管生成相关的细胞的基因组学数据、脂
质组学数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性 (SNP)数
据中的一种或多种；和

[0352] 所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应，其中所述一致因果关系网络的生成不是基于所述第一数据集和第二数据集以外的任
何已知的生物学关系。

[0353] 102.如第97-101项任一项的方法，其中所述血管生成模型选自体外细胞培养血管生成模型、大鼠主动脉微血管模型、新生小鼠视网膜模型、鸡胚绒毛尿囊膜(CAM)模型、
角膜血管生成生长因子囊袋模型、皮下海绵血管生成生长因子植入模型、
血管生成生长因子植入模型和肿瘤植入模型；且其中所述血管生成模
型任选地进一步包括包含对照细胞的匹配对照血管生成模型。

[0354] 103.如第97-102项任一项的方法，其中所述第一数据集包括脂质组学数据。

[0355] 104.如第97-103项任一项的方法，其中所述代表与血管生成相关的细胞的一种或多种功能活性或细胞反应的第二数据集包括与血管生成相关的细胞中的总体酶学活性
和/或总体酶学活性对酶代谢产物或底物的效应。

[0356] 105.如第104项的方法，其中所述第二数据集包括激酶活性或蛋白酶活性。

[0357] 106.如第97-103项中任一项的方法，其中所述代表与血管生成相关的细胞的一种或多种功能活性或细胞反应的第二数据集包括生物能量学谱、细胞增殖、细胞凋亡、细
胞器功能、细胞迁移、管形成、激酶活性和蛋白酶活性及通过选自ATP、ROS、OXPHOS和
Seahorse 分析的功能模型实现的基因型-表型相关性中的一种或多种。

[0358] 107.如第61-106项中任一项的方法，其中所述血管生成与疾病状态相关。

[0359] 108.一种用于调节哺乳动物受试者的血管生成的方法，所述方法包括：

[0360] 向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物组合物，所述生物活性物质影响通过第61-107项中任一项鉴别的调节子，从而调节血管生成。

[0361] 109.一种检测哺乳动物受试者中受调节的血管生成的方法，所述方法包括：

[0362] 测定从所述受试者获得的生物样品中通过第61-107项中任一项鉴别的一种或多种调节子的水平、活性或存在；和

[0363] 比较所述受试者中的所述水平、活性或存在与对照样品中所述一种或多种调节子的水平、活性或存在，

[0364] 其中所述受试者中的所述水平、活性或存在与所述对照样品中所述一种或多种调节子的水平、活性或存在之间的差异是所述哺乳动物受试者中血管生成受到调节的指
示。

[0365] 110.一种鉴别用于调节哺乳动物受试者中的血管生成的治疗化合物的方法，所述方法包括：

[0366] 使来自哺乳动物受试者的生物样品与测试化合物接触；

[0367] 测定所述生物样品中通过第61-107项中任一项鉴别的一种或多种调节子的水平、活性或存在；

[0368] 将所述生物样品中所述一种或多种调节子的水平、活性或存在与未接触所述测试化合物的对照样品比较，

[0369] 选择调节所述生物样品中所述一种或多种调节子的水平、活性或存在的测试化合物，

[0370] 从而鉴别用于调节哺乳动物受试者中的血管生成的治疗化合物。

[0371] 111.一种用于调节哺乳动物受试者中的血管生成的方法，所述方法包括：

[0372] 向需要的哺乳动物施用治疗有效量的包含第110项的治疗化合物的药物组合物，从而治疗所述疾病、改善其症状、抑制其进展或预防、诊断或预后所述疾病。

[0373] 应当理解的是，本文所描述的所有实施方式，包括仅在实施例中描述的那些，是本发明的一般描述的部分，并可以结合本发明的任何其它实施方式，除非明确排除或不适
用。

[0374] 附图简要说明

[0375] 本公开的各种实施方式将在本文下面根据附图进行描述，其中：

[0376] 图1：用于鉴别治疗剂的方法的图解。

[0377] 图2：癌症系统生物学和整合的多生理相互作用输出调节的结果的图解。

[0378] 图3：使用MIMS的生物相关性系统探询的图解。

[0379] 图4：建模癌症网络以使得能够进行探询式生物学查询的图解。

[0380] 图5：探询式生物学平台技术的图解。

[0381] 图6：平台技术中使用的技术的图解。

[0382] 图7：平台的成分(包括数据采集、数据整合和数据挖掘)的示意图。

[0383] 图8：使用MIMS的系统性探询和从“组学”级联收集响应数据的示意图。

[0384] 图9：建立表示正常和糖尿病状态的体外模型使用的成分的略图。

[0385] 图10：用来生成蛋白质的因果网络(因为它们涉及疾病病理生理学)的信息学平TM
台REFS 的示意图。

[0386] 图11：导致生成糖尿病状态对于正常状态以及通过用MIMS治疗恢复到正常状态的糖尿病节点的差异网络的途径的示意图。

[0387] 图12：糖尿病状态与正常状态的代表性差异网络。

[0388] 图13：节点和感兴趣的相关边界(中心的Node1)的示意图。表示出与每个边界有关的细胞功能性。

[0389] 图14：根据一些实施方式，示例性方法的高水平流程图。

[0390] 图15A-15D：可以用于示例性实施方式的基于AI的信息学系统的成分和过程的高水平示意图。

[0391] 图16：可以用于示例性实施方式的基于AI的信息学系统中的方法的流程图。

[0392] 图17：示意性地描绘了适合于实施本文所教导的示例性实施方式的示例性计算环境。

[0393] 图18：实施例1中描述的案例研究设计的图示。

[0394] 图19：辅酶Q10治疗对下游节点的影响。

[0395] 图20：辅酶Q10治疗降低癌症细胞系HepG2中的LDHA表达。

[0396] 图21：基于来自Paca2、HepG2和THLE2细胞系的数据，在70 ％片段频率下的示例性蛋白质相互作用一致网络。

[0397] 图22：使用平台技术鉴别两个癌症细胞系中响应于LDHA表达模拟的蛋白质。

[0398] 图23：LDHA-PARK7网络的独创途径协助(Ingenuity Pathway )分析鉴别TP53为上游中枢。

[0399] 图24：辅酶Q10治疗对SKMEL28癌细胞系中TP53表达水平的影响。

[0400] 图25：与SKMEL28癌细胞系中导致细胞凋亡的BCL-2蛋白质的表达改变相关的TP53的激活和辅酶Q10治疗对SKMEL28中Bcl-2、 Bax和胱天蛋白酶3表达水平的影响。

[0401] 图26：导致生成Δ-Δ网络的数学途径的图解。

[0402] 图27：驱动ECAR和OCR的癌症健康差(Δ-Δ)网络。各个驱动子对边界的厚度代表的终点具有差异效应。Cytoscape中边界的厚度表示倍数变化的强度。

[0403] 图28：使用IPA对来自探询式平台技术输出的PARK7及相关节点作图：灰色的形状包括所有来自输入IPA中的探询生物学输出的与 PARK7相关的节点。未填充的形状(带有名
称)是由IPA整合的新连接以创建完整的图谱。

[0404] 图29：本发明的探询式平台技术，其展现了与PARK7相关的节点的新相关性。虚线所示的边界是具有中间节点但在IPA中没有中间节点的模拟中两个节点之间的连接。点线
所示的边界是具有中间节点但在IPA中有不同的中间节点的模拟中两个节点之间的连接。

[0405] 图30：导致生成Δ-Δ网络的数学途径的图解。将来自NG∩HGΔ 网络中NG的独特边界与HG∩HGT1Δ网络中的HGT1的独特边界相比较。NG和HGT1的交集中的边界是利用T1
恢复到NG的HG边界。

[0406] 图31：叠加到NG∩HGΔ网络上的利用辅酶Q10处理恢复到正常的糖尿病边界的Δ-Δ网络。

[0407] 图32：叠加在正常血脂∩高血脂Δ网络上的利用辅酶Q10处理恢复到正常的高血脂边界的Δ-Δ网络。

[0408] 图33：表示疾病和药物治疗中改变的脂肪酸命运的示意图。利用游离脂肪酸(FFA)来产生ATP和对膜生物学破坏做出响应的膜重建之间的平衡牵涉到药物导致的心脏
毒性。

[0409] 图34：表示用于研究糖尿病心肌细胞中药物诱导毒性的实验设计和建模参数的示意图。

[0410] 图35：药物治疗(T)导致的糖尿病心肌细胞中人线粒体能量代谢基因的转录网络和表达的失调：救援分子(R)使基因表达正常化。

[0411] 图36：A.药物治疗(T)诱导来自高血糖症中条件化的心肌细胞的线粒体中GPAT1和TAZ的表达。与救援分子结合(T+R)，GPAT1 和TAZ水平正常化。B.从G3P合成TAG。

[0412] 图37：A.药物治疗(T)降低高血糖症条件化的心肌细胞中的线粒体OCR(耗氧率)。救援分子(T+R)使OCR正常化。B.药物治疗(T)抑制高血糖症中条件化的心肌细胞中线粒体
ATP的合成。

[0413] 图38：通过药物治疗下调蛋白质的GO注释。用药物治疗下调参与线粒体能量代谢的蛋白质。

[0414] 图39：导致生成Δ网络的数学方法的图解。比较来自T与UT的独特边界，这两个模型均处于糖尿病环境中。

[0415] 图40：代表驱动药物诱导毒性的病理生理学的潜在蛋白质中枢和网络的示意图。

[0416] 图41显示用于鉴别生物系统或疾病过程的调节子的方法。

[0417] 图42显示用索拉非尼处理的HepG2中ENO1活性而非蛋白质表达的显著降低。

[0418] 图43显示用索拉非尼处理的HepG2中PGK1活性而非蛋白质表达的显著降低。

[0419] 图44显示用索拉非尼处理的HepG2中LDHA活性的显著降低。

[0420] 图45显示可以通过使用基于AI的REFSTM系统分析数据集产生的因果分子相互作用网络。

[0421] 图46显示采用贝叶斯网络推理算法的多组学数据整合可以如何导致对肝细胞癌中信号传导途径的更好理解。黄色方块代表转录后修饰(磷酸化)数据，蓝色三角形代表基
于活性(激酶)的数据，和绿色圆形代表蛋白质组学数据。

[0422] 图47显示肝细胞癌信号传导途径中的自动调节和逆反馈调节可以如何通过平台推断。方块代表转录后修饰(磷酸化)数据(灰/黑＝激酶，黄/浅–无激酶活性)，方块代表基于活性(激酶)+蛋白质组学数据(灰/黑＝激酶，黄/浅–无激酶活性)。

[0423] 图48-51显示通过平台推断的信号传导途径中因果相关性的实例。激酶同工型在代表性的方块和圆形上表示，因果相关性通过连接体表示。

[0424] 图52A-B显示在(A)汇合或(B)亚汇合培养物中生长的人脐静脉内皮细胞(HUVEC)用所示浓度范围的CoQ10处理24小时。汇合的细胞密切地近似于“正常”细胞而亚汇合的细
胞更密切地代表增殖细胞的血管生成表型。在汇合培养物中，添加提高浓度的CoQ10导致
EC的更密切的关联、延长和排列。5000μM导致圆形细胞的细微增加。

[0425] 图53A-C显示HUVEC细胞的汇合(A)或亚汇合(B)培养物用100或1500μM CoQ10处理24小时并测定碘丙锭阳性凋亡细胞。 CoQ10对汇合时处理的EC是保护性的，而亚汇合的
细胞对于是敏感的且在1500μM CoQ10下显示增加的细胞凋亡。(C)亚汇合的对照 EC(左)、
100μM CoQ10(中)和1500μM CoQ10(右)的代表性柱状图。

[0426] 图54A-C显示亚汇合的HUVEC细胞培养物用100或1500μM CoQ10处理72小时并使用碘丙锭掺入分析(检测G2/M期DNA)测定细胞数(A)和增殖(B)。高浓度的CoQ10导致细胞数
的显著提高且对于EC增殖具有剂量依赖性的作用。细胞周期的G2/M期细胞 [对照EC(左)、
100μM CoQ10(中)和1500μM CoQ10(右)]的细胞增殖分选的代表性柱状图显示于(C)中。

[0427] 图55显示HUVEC细胞生长到汇合以使用“划痕”分析测试迁移。 100或1500μM CoQ10在刻划时施加且清除区域的封闭在48小时内监测。100μM CoQ10与对照相比延迟内
皮封闭。添加1500μM CoQ10 阻止封闭，甚至直到48小时(数据未显示)。

[0428] 图56显示在3-D基质胶中生长的内皮细胞随时间形成管。观察到100μM和1500μM CoQ10对管形成的不同效应。受损的细胞-细胞关联和早期管结构的破坏在1500μM CoQ10
下是显著的。显示的图像在72小时时获取。

[0429] 图57A-B显示内皮细胞在亚汇合和汇合的培养物中生长，其在正常和缺氧条件下在CoQ10存在和不存在下生长。评估了响应于CoQ10 和缺氧的一氧化氮(NO)(A)和反应性氧
物质(ROS)(B)的产生。

[0430] 图58A-D显示内皮细胞在亚汇合和汇合的培养物中在CoQ10存在和不存在下生长以评估在所示生长条件下的线粒体氧消耗。显示了总OCR(A)、线粒体OCR(B)、ATP产生(C)、ECAR(D)的评估。

[0431] 图59A-C显示用于通过CoQ10对内皮细胞功能的调节鉴别关键生物功能节点的探询式生物学平台的结果。这些节点由完全多组学网络(A)、富蛋白质网络的中枢(B)及激
酶、脂质组学和功能终点网络的中枢(C)代表。图59B和59C是图59A的分解部分。

[0432] 发明详述

[0433] I、概述

[0434] 本发明的示例性实施方式中结合了可以使用探询式生物学平台 (“该平台”)实施的方法，该平台是用于理解各种各样的生物学过程 (如疾病病理生理学或血管生成)和作
为这种生物学过程基础的关键分子驱动子(包括使疾病过程得以发生的因子)的工具。一
些示例性实施方式包括可以结合该平台的至少一部分或全部的系统。一些示例性方法可
以采用该平台的至少一部分或全部。涉及该平台的一些示例性实施方式的目标和目的出
于说明性的目的一般地概述如下：

[0435] i)建立作为生物学过程(例如，疾病过程、血管生成)的关键组成的驱动子的特定分子印记，因为它们与总体生物学过程相关；

[0436] ii)生成与生物学过程相关的分子印记或差异图谱，这可有助于鉴别区分一个生物学状态(例如，疾病状态、血管生成状态)与不同生物学阶段(例如，正常状态)的差异分
子印记，和发展对于印记或分子实体的理解，因为它们裁断两种生物学状态之间的变化
(例如，从正常到疾病状态或血管生成状态)的机制；和

[0437] ⅲ)研究分子活性的“中枢”作为用于生物学过程的外部控制的潜在干预靶标(例如，使用该中枢作为潜在的治疗靶标或血管生成调节的靶标)或作为所讨论的生物学过程
的潜在生物标志物(例如，疾病特异性生物标志物和血管生成特异性标志物，用于预后和/
或治疗诊断用途中)的作用。

[0438] 涉及该平台的一些示例性的方法可以包括一个或多个以下特征：

[0439] 1)在一个或多个模型中，优选在体外模型或实验室模型(例如， CAM模型、角膜囊袋模型、模型)中，使用与生物学过程相关的细胞对生物学过程(例如，疾
病过程、血管生成过程)和/或生物学过程的成分(例如，疾病生理及病理生理学、血管生成
的生理学)建模。例如，细胞可以是人类来源的细胞，其正常地参与所讨论的生物学过程。
该模型可包括对于该生物学过程(例如，疾病、血管生成)特异性的各种细胞提示/状态/扰
动。在理想的情况下，该模型代表各种(疾病、血管生成)状态和通量成分而不是生物学(疾
病、血管生成)状况的静态评估。

[0440] 2)使用领域公认的任何手段确定mRNA和/或蛋白质印记的特征。例如，定量聚合酶链反应(qPCR)和蛋白质组学分析工具如质谱 (MS)。这种mRNA和蛋白质数据集代表对环
境/扰动的生物学反应。在适用和可能的情况下，脂质组学、代谢组学和转录组学数据也可
被整合作为用于所讨论的生物学过程的补充或替代测量值。SNP分析是在该过程中有时
可以使用的另一成分。它可以有助于研究，例如，SNP 或特定突变是否对生物学过程有任何
影响。这些变量可以用于描述生物学过程，无论是作为静态的“瞬象”或作为动态过程的表现。

[0441] 3)测定对提示和扰动的一个或多个细胞反应，包括但不限于生物能量学谱、细胞增殖、细胞凋亡和细胞器功能。真正的基因型-表型相关性是通过采用功能模型(如ATP、
ROS、OXPHOS、Seahorse分析、胱天蛋白酶分析、迁移分析、趋化性分析、管形成分析等等)实现的。这样的细胞反应代表生物学过程(或其模型)中对相应的mRNA/ 蛋白质表达的状态以
及上面2)中的任何其他相关状态做出响应的细胞反应。

[0442] 4)通过采用基于人工智能(基于AI)的信息学系统或平台，整合在3)中获得的功能分析数据和在2)中获得的蛋白质组学和其它数据，并确定由因果关系驱动的蛋白质相
关性。这样的基于AI的系统是基于，优选仅基于，2)和/或3)中得到的数据集，而不采用关于该生物学过程的现有知识。优选地，没有数据点被统计地或人为地切除。相反，所有得到的数据被送入AI系统中用于确定蛋白质相关性。整合过程的一个目标或输出是不同生物
学状态(例如，疾病对正常状态)之间的一个或多个差异网络(另外在本文中可称为“Δ网
络”，或者在某些情况下视情况而称为“Δ-Δ网络”)。

[0443] 5)确定基于AI的信息学平台的输出的特征以考察各活性中枢作为潜在治疗靶标和/或生物标志物。这样的谱分析可以基于所获得的数据集完全在计算机中进行而无需采
用任何实际的湿式实验室试验 (wet-lab experiment)。

[0444] 6)通过采用分子和细胞技术验证活性中枢。这种用基于细胞的湿式实验室实验对输出进行的信息后验证(post-informatic validation) 可以是任选的，但它们有助于
建立全循环的探询。

[0445] 以上概述的任何或所有途径可以用在涉及任何生物学过程的任何特定应用中，其取决于(至少部分地取决于)具体应用的性质。也就是说，上文所述的一个或多个途径可
以被省略或修改，并且可以采用一个或多个附加的途径，其取决于具体的应用。

[0446] 提供了说明该平台的各种图表。特别是，在图1中描述了使用该平台鉴别治疗剂的示例性途径的图解。图2中描述了癌症的系统生物学和综合的多生理交互式输出调节的
结果的图解。图3中描述了使用 MIMS的生物相关性系统探询的图解。图4中描述了建模癌症
网络以实现探询式生物查询的图解。图5和6中描述了探询式生物学平台和平台中所使用
的技术的图解。图7中描述了包括数据采集、数据整合和数据挖掘的平台成分的示意图。图
8中描述了使用MIMS的系统探询和来自“组学”级联的响应数据收集的示意图。

[0447] 图14是示例性方法10的高水平流程图，其中显示了可以被用来执行该示例性方法的示例性系统的成分。首先，使用通常与生物学过程相关联的细胞建立生物学过程(例
如，疾病过程)和/或生物学过程的成分(例如，疾病生理学和病理生理学)的模型(例如，体
外模型) (步骤12)。例如，细胞可以是通常参与生物学过程(例如，疾病) 的人来源的细胞。
细胞模型可包括该生物学过程(例如，疾病)特定的各种细胞提示、状态和/或扰动。在理想
的情况下，细胞模型表示各种(疾病)状态和生物学过程(例如，疾病)的通量成分而不是生
物学过程的静态评估。对比细胞模型可包括对照细胞或正常(如非病变的)细胞。细胞模
型的附加说明出现在下面的III.A和IV部分中。

[0448] 第一数据集是使用任何已知的方法或系统(例如，定量的聚合酶链反应(qPCR)和蛋白质组学分析工具，如质谱(MS))从生物学过程的细胞模型获得，其包括表示多个基因
(例如，mRNA和/或蛋白质印记)的表达水平的信息(步骤16)。

[0449] 第三数据集从生物学过程的对比细胞模型获得(步骤18)。第三数据集包括代表来自对比细胞模型的对比细胞中多个基因的表达水平的信息。

[0450] 在本发明方法的某些实施方式中，这些第一和第三数据集在本文中统称为“第一数据集”，其表示与生物系统相关的细胞(包括对比细胞的所有细胞)中多个基因的表达水
平。

[0451] 可以从一个或多个mRNA和/或蛋白质印记分析系统得到第一数据集和第三数据集。第一和第三数据集中的mRNA和蛋白质数据可以代表对环境和/或扰动的生物反应。在
适用和可能的情况下，脂质组学、代谢组学和转录组学数据也可以被整合作为生物学过程
的补充或替代测量。SNP分析是可以有时使用在该方法中的另一成分。它可以有助于调
查，例如，单核苷酸多态性(SNP)或特定的突变对生物学过程是否有任何影响。数据变量可
以被用于描述生物学过程，无论是作为静态的“瞬象”，还是作为动态过程的表示。有关获取表示细胞中多个基因的表达水平的其他描述见以下的III.B部分。

[0452] 第二数据集从生物学过程的细胞模型获得，其包括表示细胞的功能活性或反应的信息(步骤20)。类似地，第四数据集从生物学过程的对比细胞模型获得，其包括表示对
比细胞的功能活性或反应的信息 (步骤22)。

[0453] 在本发明方法的某些实施方式中，这些第二和第四数据集在本文中统称为“第二数据集”，其表示与生物系统相关的细胞(包括对比细胞的所有细胞)的功能活性或细胞反
应。

[0454] 可以使用一个或多个功能分析系统以获得有关细胞或对比细胞的功能活性或反应的信息。关于对提示和扰动的功能性细胞反应的信息可包括，但不限于，生物能量学谱、细胞增殖、细胞凋亡和细胞器功能。过程和途径的功能模型(例如，三磷酸腺苷(ATP)、活性氧物质(ROS)、氧化磷酸化(OXPHOS)、Seahorse分析、胱光蛋白酶分析、迁移分析、趋化性分析、管形成分析等)可以被用来获得真正的基因型-表型相关性。功能活性或细胞反应表
示在生物学过程(或其模型)中的细胞响应于mRNA/蛋白质表达的相应状态以及任何其他
相关应用的状态或扰动的反应。在下面III.B部分中提供有关获得表示细胞的功能活性或
反应的信息的附加信息。

[0455] 该方法还包括在细胞和对照细胞中生成生物学过程的计算机执行的模型。例如，可对于细胞模型从第一数据集和第二数据集生成在所述多个基因的表达水平与所述功能
活性或细胞反应之间的一个或多个(例如，一整套)因果关系的贝叶斯网络(“生成的细胞
模型网络”)(步骤24)。生成的细胞模型网络(单独或共同地)包括关于关系的定量概率定
向信息。所生成的细胞模型网络不是基于来自第一数据集和第二数据集的信息以外的基
因表达和/或功能活性或细胞反应之间的已知生物学关系。一个或多个生成的细胞模型网
络可统称为一致细胞模型网络。

[0456] 可对于对比细胞模型从第一数据集和第二数据集生成在多个基因的表达水平与功能活性或细胞反应之间的一个或多个(例如，一整套)因果关系的贝叶斯网络(“生成的
对比细胞模型网络”)(步骤26)。生成的对比细胞模型网络(单独地或共同地)包括关于关
系的定量概率定向信息。所生成的细胞网络不是基于第一数据集和第二数据集中的信息
以外的基因表达和/或功能活性或细胞反应之间的已知生物学关系。一个或多个生成的对
比模型网络可统称为一致细胞模型网络。

[0457] 可以使用基于人工智能(基于AI)的信息学平台建立所述生成的细胞模型网络和生成的对比细胞模型网络。关于建立生成的细胞模型网络、建立生成的对比细胞模型网络
和基于AI的信息学系统的进一步细节出现在下面III.C部分和图15A-16的描述中。

[0458] 应当指出的是，可以采用许多不同的基于AI的平台或系统来生成包括定量概率定向信息的因果关系的贝叶斯网络。虽然本文所描述的某些实施例采用一个特定的可商
业获得的系统，即，来自GNS(剑桥，MA)的REFSTM(逆向工程/正向模拟)，但对于实施方式并没有限制。适合实施一些实施方式的基于AI的系统或平台采用数学算法以在输入变量
(例如，第一和第二数据集)之间建立因果关系，其仅仅基于输入的数据而没有考虑到之前
存在的关于任何潜在的、已建立的和/或验证的生物学关系的知识。

[0459] 例如，基于AI的REFSTM信息学平台利用实验得到的粗的(原始的)或最少加工的输入生物学数据(如遗传、基因组学、外遗传、蛋白质组学、代谢组学和临床数据)，并迅速执行万亿次计算以确定在完整系统中分子如何相互作用。基于AI的REFSTM信息学平台执行逆
向工程过程，其旨在基于定量表示基础生物系统的输入数据建立计算机实施的细胞模型
(例如，生成的细胞模型网络)。另外，为获得预测，可以在计算机执行的细胞模型的基础上开发和快速模拟关于基础生物系统的假设，伴有关于假设的相关的置信水平。

[0460] 通过这种方式，由定量的计算机实施的细胞模型表示生物系统，其中模拟“干扰”来了解生物系统(例如，疾病)的详细机制、有效的干预策略和/或确定哪些患者会对给定
的治疗方案做出反应的临床生物标志物。传统的生物信息学和统计学方法，以及基于已知
生物学的建模的方法，通常不能提供这些类型的见解。

[0461] 建立了生成的细胞模型网络和生成的对比细胞模型网络后，对它们进行比较。鉴别至少存在于一些所生成的细胞模型网络中且在生成的对比细胞模型网络中不存在或具
有至少一个显著不同的参数的一个或多个因果关系(步骤28)。这样的对比可以导致建立
差异网络。可以使用差异网络建立模块进行对比、鉴别和/或差异(Δ)网络建立，其在下
面的III.D部分和针对图26的说明进一步详细描述。

[0462] 在一些实施方式中，输入数据集是来自一种细胞类型和一种对比细胞类型，其基于该一种细胞类型建立一套细胞模型网络和基于该一种对比对照细胞类型建立另一套对
比细胞模型网络。可以在该一种细胞类型的该整套网络和对比细胞类型的该整套网络之
间进行差分。

[0463] 在其它实施方式中，输入数据集是来自多种细胞类型(例如，两种或更多种癌症细胞类型、两种或更多种不同血管生成状态的细胞类型，例如通过不同促血管生成刺激诱
导的)和多种对比细胞类型(例如，两种或更多种正常的非癌性细胞类型、两种或更多种非
血管生成和血管生成细胞类型)。可以分别对于每个细胞类型和每个对比细胞类型单独
地生成一整套细胞模型网络，和/或来自多种细胞类型和多种对比细胞类型的数据可以组
合成各自的复合数据集。复合数据集生成与多种细胞类型(复合数据)对应的一整套网络，
和生成与多种对比细胞类型(对比复合数据)对应的另一整套网络。可以对用于复合数据
的该整套网络对比于用于对比复合数据的该整套网络执行差分。

[0464] 在一些实施方式中，可以在两个不同的差异网络之间执行差分。该输出可被称为Δ-Δ网络，并且在下面针对图26进行描述。

[0465] 可以为生成的细胞模型网络中的每个关系确定定量关系信息(步骤30)。类似地，可以确定生成的对比细胞模型网络中每个关系的定量关系信息(步骤32)。有关该关系的
定量信息可以包括表示因果关系的指令、有关该关系的统计不确定性的量度(例如，曲线
下面积 (AUC)的统计测量)和/或该关系的强度的定量幅度(例如，一倍) 的表示。可以使用
定量关系信息确定生成的细胞模型网络中的各种关系的特性，来探索网络中作为潜在治
疗靶标和/或生物标志物的每个活性中枢。这样的分析可以完全在计算机中基于来自生成
的细胞模型网络的结果进行而没有采用任何实际的湿式实验室实验。

[0466] 在一些实施方式中，可以通过采用分子和细胞技术对网络中活性的中枢进行验证。这种用湿式实验室的基于细胞的实验对输出的信息后验证不需要执行，但它可以帮助
建立探询的完整循环。图15示意性地描绘了示例性的基于AI的信息学系统(例如，基于AI
的REFSTM信息学系统)的功能性和基于AI的系统与探询式生物学平台(“平台”) 的其他成分
或部分之间相互作用的简化高水平图示。在图15A中，从生物学过程的模型(例如，疾病模
型)获得的各种数据集，如药物的剂量、治疗剂量、蛋白质表达、mRNA表达和许多相关功能
测量(如 OCR、ECAR)的任何一种被送入基于AI的系统中。如图15B所示， AI系统在被称为贝
叶斯片段计数(Bayesian Fragment Enumeration)的过程中从输入的数据集创建“网络片
段”文库，其包括驱动生物学过程 (例如，疾病)中的分子机制的变量(蛋白质、脂质和代谢
物)(图 15B)。

[0467] 在图15C中，基于AI的系统选择文库中的网络片段的子集，并从该片段构建初始试验网络。基于AI的系统也选择文库中网络片段的不同子集来构建另一初始试验网络。最
终从文库中网络片段的不同子集建立一整套初始试验网络(例如，1000个网络)。该过程可
以被称为平行总体采样。整体中的各个试验网络通过从文库中增加、减去和/或替代额外
的网络片段进行进化或优化。如果得到附加数据，该附加数据可被结合到网络文库的网络
片段中，并且可以通过各个试验网络的进化被结合到整套试验网络中。优化/进化过程完
成后，整套试验网络可以被描述为生成的细胞模型网络。

[0468] 如图15D中所示，整套生成的细胞模型网络可以用来模拟生物系统的行为。模拟可用于预测生物系统对于条件变化的行为，这可以使用基于细胞的或基于动物的湿式实
验室实验来验证。另外，可以使用模拟功能，通过向每个节点单独地施加模拟的扰动而同
时观察对所生成的细胞模型网络中其他节点的影响，来得到在所生成的细胞模型网络中
关系的定量参数。在下面的III.C部分中提供进一步的细节。

[0469] 在图15A-15D中描绘的基于AI的信息学系统的自动化逆向工程过程建立了一整套生成的细胞模型网络，它是该细胞的无偏的和系统的基于计算机的模型。

[0470] 该逆向工程决定了数据中的分子测量之间概率定向网络连接，和感兴趣的表型结果。分子测量中的变异使得能够学习这些实体和终点变化之间的概率的原因和效应关
系。平台的机器学习特性也使得交叉训练和不断进化的基于数据集的预测成为可能。

[0471] 数据中分子测量之间的网络连接是“概率性的”，部分地因为连接可以基于由计算机算法“学习”的观察数据集之间的相关性。例如，如果基于数据集的统计分析，蛋白质X和蛋白质Y的表达水平是正相关或负相关的，则可以分配因果关系以建立蛋白质X和Y之间
的网络连接。这种推定的因果关系的可靠性可以由该连接的似然性进一步定义，其可以
通过p值测定(例如，p<0.1、0.05、0.01等)。

[0472] 数据中分子测量之间的网络连接是“定向的”，部分地是因为分子测量之间的网络连接，如由反向工程过程所确定的，反映连接的基因 /蛋白质之间关系的原因和效应，以
使得提高一种蛋白质的表达水平可能导致其他蛋白质的表达水平上升或下降，这取决于
该连接是刺激性的还是抑制性的。

[0473] 数据中分子测量之间的网络连接是“定量的”，部分地因为分子测量之间的网络连接，如通过该方法所确定的，可以在计算机中基于现有的数据集和与其相关的概率测量
来模拟。例如，在分子测量之间所建立的网络连接中，理论上可能会增加或减少(例如，增
加或减少1、 2、3、5、10、20、30、50、100倍或更高)给定蛋白质的表达水平(或在网络中的“节点”)，和定量模拟其对网络中其它连接的蛋白质的影响。

[0474] 数据中分子测量之间的网络连接是“无偏的”，至少部分地因为没有数据点被统计地或人为地切除，和部分地因为该网络连接是仅基于输入的数据，而不涉及关于所讨论
的生物学过程的现有知识。

[0475] 数据中分子测量之间的网络连接是“系统的”和(无偏的)，部分地因为所有输入变量之间的所有潜在连接已被系统地考察，例如，以成对的方式。执行这种系统性探测的
计算能力的可靠性随着输入变量数的增加而呈指数地提高。

[0476] 在一般情况下，一整套约1000个网络通常足以预测所有被测实体之间的概率因果定量关系。该整套网络捕获数据中的不确定性，且使得对于每个模型预测计算置信度量
成为可能。使用该整套网络一起产生预测，其中整套中单个网络的预测中的差异代表预测
的不确定性程度。此特征使得能够对于从模型生成的临床反应的预测分配置信量度。

[0477] 一旦模型进行逆向工程，可以对整套模型进行进一步模拟质询以确定所讨论的生物学过程如疾病状态的关键分子驱动子。

[0478] 图9中描述了用于建立代表正常和糖尿病状态的示例性体外模型的成分的略图。图10描述了用来生成蛋白质(因为它们涉及到疾病的病理生理学)的因果网络的示例性信
息学平台REFSTM的示意图。图11中描述了导致生成糖尿病与正常状态的差异网络的示例性
方法和通过用MIMS治疗恢复到正常状态的糖尿病节点的示意图。图12 描述了糖尿病与正
常状态的代表性差异网络。图13中描述了感兴趣的节点和相关边界(中心的Node1)以及与
各个边界相关的细胞功能性的示意图。

[0479] 已在上面概述了本发明，下面的章节中提供了结合可以使用本发明的方法分析的一个或多个特定的生物系统对于总体发明的各个方面或元素的更详细描述。然而，应当
指出，对以下仅供说明之用的特定的生物系统没有限制。与此相反，其意图是可以同样使
用所述的平台技术分析包括任何的替代、修改及其等同物的其他不同的生物系统。

[0480] II、定义

[0481] 如本文所用的，旨在特别地定义但在本说明书的其他部分中尚未定义有某些术语在此进行定义。

[0482] 在本文中使用的冠词“一”和“一个”指一个或一个以上的(即，至少一个)该冠词的语法对象。通过举例的方式，“一元素”是指一个元素或一个以上的元素。

[0483] 本文所用的术语“包括”的意思是短语“包括但不限于”并可与之互换使用。

[0484] 本文所使用的术语“或”的意思是术语“和/或”，并可与之互换使用，除非上下文另有明确说明。

[0485] 本文所用的术语“例如”是指短语“例如但不限于”，并可与之互换使用。

[0486] “代谢途径”指的是将一种化合物转化为另一种化合物并为细胞功能提供中间体和能量的酶介导的反应序列。代谢途径可以是直链的或环状的或支链的。

[0487] “代谢状态”是指在给定时间点，通过各种化学和生物指标(因为它们涉及健康或疾病的状态)测量的特定细胞、多细胞或组织环境的分子含量。

[0488] “血管生成”指的是涉及从预先存在的血管生长新血管的生理过程。血管生成包括至少血管内皮细胞的增殖、(通常响应于趋化剂的) 血管内皮细胞的迁移、(通常通过基
质金属蛋白酶产生导致的)细胞外基质的降解、基质金属蛋白酶产生、管形成、血管内腔形
成、血管出芽、粘附分子表达(通常整联蛋白表达)和分化。取决于培养系统 (例如，一维对三维)和细胞类型，血管生成的各个方面可以在体外以及体内生长的细胞中观察到。血管
生成细胞或呈现血管生成细胞的至少一种特性的细胞表现出如上所述的1、2、3、4、5、6、7、
8、9 种或更多种特性。血管生成的调节子提高或降低至少一种本文中提供的特性。血管生
成不同于作为血管的自发形成的血管发生 (vasculogenesis)或者套迭是通过现有血管的
分裂形成新血管的术语。

[0489] 术语“微阵列”指的是在基材，如纸、尼龙或其他类型的膜、过滤器、芯片、玻璃载片或任何其它合适的固体支持物上合成的不同多核苷酸、寡核苷酸、多肽(例如，抗体)或肽的阵列。

[0490] 术语“紊乱”和“疾病”包含地使用且指与身体的任何部分、器官或系统(或它们的任意组合)的正常结构或功能的任何偏离。特定的疾病是通过特征性症状和体征表现的，包括生物的、化学的和物理的变化，并往往与多种其他因素相关，包括但不限于，人口统计学、环境、职业、遗传和医疗史因素。可以通过多种方法量化一定的特征性体征、症状及相关因素以得到重要的诊断信息。

[0491] 术语“表达”包括通过其从多核苷酸，如DNA产生多肽的过程。该过程可以包括基因转录成mRNA，和该mRNA翻译成多肽。根据其使用的上下文，“表达”可以指RNA、蛋白质或两者的产生。

[0492] 术语“基因的表达水平”或“基因表达水平”是指在细胞中由该基因编码的mRNA以及前mRNA新生转录本、转录加工中间体、成熟 mRNA和降解产物的水平，或蛋白质的水平。

[0493] 术语“调节”指反应的上调(即，激活或刺激)、下调(即，阻遏或抑制)，或其组合或分开的两者。“调节子”是调节的化合物或分子，并且可以是，例如，激动剂、拮抗剂、活化剂、刺激剂、阻遏物或抑制剂。

[0494] 短语“影响调节子”理解为改变调节子的表达、改变调节子的水平或改变调节子的活性。

[0495] 如本文所用的术语“三乙醇胺(Trolamine)”是指Trolamine NF、 Triethanolamine、 TEAlan 99％、Triethanolamine 99％、
Triethanolamine NF或Triethanolamine 99％NF。这些术语在本文中可互换使用。

[0496] 术语“基因组”是指生物实体(细胞、组织、器官、系统、生物体) 的遗传信息的全部。它是以DNA或RNA(例如，在某些病毒中)编码的。基因组包括基因和DNA的非编码序列。

[0497] 术语“蛋白质组”是指由基因组、细胞、组织或生物体在给定时间表达的蛋白质的整个集合。更具体地说，它可以指在限定的状态下在给定时间给定类型的细胞或生物体中
表达的蛋白质的整个集合。蛋白质组可以包括由于例如，基因的选择性剪接和/或翻译后
修饰(如糖基化或磷酸化)导致的蛋白质变体。

[0498] 术语“转录组”是指在给定的时间一个或一群细胞中产生的转录 RNA分子的整个集合，包括mRNA、rRNA、tRNA、微RNA、dicer 底物RNA和其他非编码RNA。该术语可被应用于给定的生物体中转录本的总集，或应用于在特定细胞类型中存在的转录本的特定子集。与
对于给定的细胞系大致固定(不包括突变)的基因组不同，转录组可以随外部环境条件而
变化。因为细胞中包括了所有的mRNA转录物，转录组反映了在任何给定的时间活跃地表达
的基因，除了mRNA 降解现象，如转录弱化。

[0499] 转录组学的研究(也被称为表达谱)考察给定的细胞群中mRNA 的表达水平，通常采用基于DNA微阵列技术的高通量技术。

[0500] 术语“代谢组”是指在给定状态下在给定时间在生物样品内，如单一有机体中，发现的小分子代谢物(如代谢中间体、激素和其他信号分子和次级代谢产物)的完整集合。代
谢组是动态的，且可以随时地 (from second to second)改变。

[0501] 术语“脂质组”是指在给定状态下在给定时间在生物样品(如单一生物体中)发现的脂质的完整集合。脂质组是动态的，且可以随时改变。

[0502] 术语“相互作用组(interactome)”是指在研究中的生物系统(例如，细胞)中分子相互作用的整个集合。它可以被显示为定向的图形。分子相互作用可以发生在属于不同的
生物化学家族(蛋白质、核酸、脂质、碳水化合物等)且也在给定家族内的分子之间发生。当在蛋白质组学方面来说，相互作用组是指蛋白质-蛋白质相互作用网络(PPI)，或蛋白质
相互作用网络(PIN)。另一个广泛研究的相互作用组类型是蛋白质-DNA相互作用组(转录
因子形成的网络(和DNA或染色质调节蛋白质)和其靶基因)。

[0503] 术语“细胞输出”包括涉及细胞状态的参数的集合，优选可测量的参数，所述细胞的状态包括(不限于)：一个或多个基因的转录水平 (例如，通过RT-PCR、qPCR、微阵列等可
测量的)、一种或多种蛋白质的表达水平(例如，通过质谱法或蛋白质印迹等可测量的)、一种或多种酶或蛋白质的绝对活性(例如，作为底物转化率可测量的) 或相对活性(例如，作
为与最大活性相比的％值可测量的)、一种或多种代谢物或中间体的水平、氧化磷酸化水
平(例如，通过耗氧率或 OCR可测量的)、糖酵解水平(例如，通过细胞外酸化率或ECAR 可测
量的)、配体-靶结合或相互作用的程度、细胞外分泌分子的活性等。细胞输出可以包括预
先确定数的靶基因或蛋白质等的数据，或者可以包括对所有可检测的基因或蛋白质的整
体评估。例如，可使用质谱法来确定和/或定量在给定的样品或细胞群体中表达的所有可
检测的蛋白质，而没有在样品或细胞群体是否可以表达任何特定蛋白质的先前知识。

[0504] 如本文所用的“细胞系统”包括同质的或异质的细胞群体。在系统内的细胞可以在自然的或生理的环境下在体内生长，或者可以在体外生长，例如，在受控的组织培养环
境中。在系统内的细胞可以是相对同质的(例如，不低于70％、80％、90％、95％、99％、
99.5％、99.9 ％同质的)，或者可以包含两种或更多种细胞类型，如通常发现在体内密切
接近生长的细胞类型，或可以通过例如旁分泌或其他长距离细胞间通讯在体内彼此相互
作用的细胞类型。细胞系统内的细胞可以源自建立的细胞系，包括癌细胞系、永生细胞系
或正常细胞系，或可以是原代细胞或新从活组织或器官分离的细胞。

[0505] 细胞系统中的细胞通常与可以提供营养物、气体(氧气或二氧化碳等)、化学品或蛋白质性的/非蛋白质性的刺激物(其可以限定影响细胞行为的条件)的“细胞环境”接触。
细胞环境可以是具有限定的化学成分和/或不太明确限定的组织提取物或血清成分的化
学介质，并且可以包括细胞在其中生长的特定pH、CO2含量、压力和温度。或者，细胞环境可以是在体内发现的对于特定细胞系统的天然的或生理的环境。

[0506] 在某些实施方式中，细胞环境包括模拟生物系统或过程的方面的条件，例如，模拟疾病状态、过程或环境。这样的培养条件包括，例如，高血糖、缺氧或富乳酸条件。本文描述了许多其他此类条件。

[0507] 在某些实施方式中，特定细胞系统的细胞环境还包括细胞系统的某些细胞表面特征，如细胞表面上的受体或配体的类型和它们各自的活性、碳水化合物或脂质分子的结
构、膜极性或流动性、某些膜蛋白质的成簇状态等。这些细胞表面特征可以影响附近细胞
的功能，如属于不同细胞系统的细胞。然而，在某些其它实施方式中，细胞系统的细胞环
境不包括细胞系统的细胞表面特征。

[0508] 细胞环境可以被改变成为“改变的细胞环境”。变化可以包括在细胞环境中发现的任何一个或多个成分的改变(例如，增加或减少)，包括向细胞环境添加一种或多种“外
部刺激成分”。环境扰动或外部刺激成分可以是细胞环境内源的(例如，细胞环境包含了某
些水平的刺激物，和添加更多相同的刺激物以提高其水平)，或者可以是细胞环境外源的
(例如刺激物大多不存在于改变前的细胞环境中)。细胞环境还可以通过添加外部刺激成
分导致的继发性变化而改变，由于外部刺激成分可以改变细胞系统的细胞输出，包括通过
细胞系统分泌到细胞环境中的分子。

[0509] 如本文所用的“外部刺激成分”，在这里也称为“环境扰动”，包括可能影响细胞功能的任何外部的物理和/或化学刺激。这可以包括任何大或小的有机或无机分子、天然或人工合成的化学物质、温度转变、 pH变化、辐射、光(UVA，UVB等)、微波、声波、电流、调制的或未调制的磁场等。

[0510] 术语“多维细胞内分子(MIM)”是身体自然产生的和/或存在于人的至少一个细胞中的内源性分子的分离形式或合成产生的形式。MIM 能够进入细胞，且进入细胞包括完全
或部分进入细胞，只要分子的生物活性部分整体进入细胞。MIM能够诱导细胞内的信号转
导和/或基因表达机制。MIM是多维的，因为分子具有治疗剂和载体(例如，药物递送)效果
两者。MIM是多维的，还因为分子在疾病状态中以一种方式起作用和在正常状态中以不同
方式起作用。例如，在辅酶 Q10的情况下，在VEGF存在下向黑色素瘤细胞施用辅酶Q10导致
Bcl2水平下降，这随之导致黑色素瘤细胞的致癌潜力降低。与此相反，在正常的成纤维细
胞中，共同施用辅酶Q-10和VEFG对Bcl2水平没有影响。

[0511] 在一个实施方式中，MIM也是表观代谢转变剂。在另一个实施方式中，MIM不是表观代谢转变剂。在另一个实施方式中，MIM特征在于一个或多个上述功能。在另一个实施方
式中，MIM特征在于两个或更多个上述功能。在进一步的实施方式中，MIM特征在于三个或
更多个上述功能。而在另一实施方式中，MIM特征在于上述的所有功能。本领域技术人员将
会理解，本发明的MIM还意图包括两种或更多种内源性分子的混合物，其中所述混合物特
征在于一个或多个上述功能。在该混合物中的内源性分子以一定比率存在以使得该混合
物作为MIM发挥功能。

[0512] MIM可以是基于脂质或非基于脂质的分子。MIM的例子包括，但不限于，辅酶Q10、乙酰Co-A、棕榈酰Co-A、左旋肉碱、氨基酸如，例如，酪氨酸、苯丙氨酸和半胱氨酸。在一个实施方式中，MIM 是小分子。在本发明的一个实施方式中，MIM不是辅酶Q10。本领域技术人员可以使用本文中详细描述的任何分析方法常规在鉴别MIM。在US 12/777,902(US 2011-
0110914)中进一步详细描述了MIM，其全部内容明确地并入本文作为参考。

[0513] 如本文所用的“表观代谢转变剂”(表观转换剂)是调节从健康(或正常)的状态转变为疾病状态(反之亦然)的代谢转换的分子，从而在人体内保持或重建细胞、组织、器官、系统和/或宿主健康。表观代谢转变剂能够完成组织微环境的正常化。例如，表观代谢转变
剂包括当被添加到细胞中或从细胞耗尽时能够影响细胞的微环境(例如，代谢状态)的任
何分子。本领域技术人员将会理解，本发明的表观代谢转变剂还意图包括两种或更多种分
子的混合物，其中所述混合物特征在于一个或多个上述功能。该混合物中的分子以一定比
例存在以使得该混合物作为表观代谢转变剂发挥功能。表观代谢转变剂的实例包括，但
不限于，辅酶Q10；维生素D3；ECM成分如纤连蛋白；免疫调节剂，如TNFα或任何白细胞介素，如IL-5、IL-12、IL-23；血管生成因子和细胞凋亡因子。

[0514] 在一个实施方式中，表观代谢转变剂也是MIM。在一个实施方式中，表观代谢转变剂不是辅酶Q10。本领域技术人员可以使用本文中详细描述的任何分析常规地鉴别表观代
谢转变剂。US 12/777,902(US 2011-0110914)中进一步详细描述了表观代谢转变剂，其全
部内容明确地并入本文作为参考。

[0515] 其他在本申请中未明确定义的术语具有与本领域普通技术人员所理解的相同的含义。

[0516] III、平台技术的示例性步骤和成分

[0517] 仅用于说明目的，所述平台技术的以下步骤可以在下文作为用于整合从定制的癌模型获得的数据和用于鉴别驱动癌症发病的新蛋白质/途径的示例性用途被描述。从这
一分析所得的关系图谱提供癌症治疗靶标以及与癌症相关的诊断/预后标志物。然而，所
述平台技术具有对于任何生物系统或过程的普遍适用性，并不限于任何特定的癌症或其
他特定的疾病模型。

[0518] 此外，虽然下面的描述在某些部分中作为离散的步骤呈现，但它是用于说明的目的和简单的原因，因此，在现实中，这并不意味着这样的严格的步骤顺序和/或分界。此外，本发明的步骤可以独立地进行，且此处提供的本发明意图单独地包含各单个步骤，以及所
述平台技术的一个或多个步骤(例如，任何一个、两个、三个、四个、五个、六个或所有七个步骤)的组合，其可以独立于其余的步骤而进行。

[0519] 本发明还意图包括作为本发明的独立成分和实施方式的平台技术的所有方面。例如，所生成的数据集意图是本发明的实施方式。作为进一步的例子，生成的因果关系网
络、生成的一致因果关系网络和 /或生成的模拟因果关系网络也意图是本发明的实施方
式。确定为生物系统中独特的因果关系意图是本发明的实施方式。另外，对于特定生物系
统定制的模型也意图是本发明的实施方式。例如，用于疾病状态或过程定制的模型，如，例如，血管生成模型、癌症、肥胖症/糖尿病 /心血管疾病的细胞模型或者药物的毒性(如心脏
毒性)的定制模型也意图是本发明的实施方式。

[0520] A、定制模型构建

[0521] 平台技术的第一步是建立用于生物系统或过程的模型。

[0522] 1.血管生成模型

[0523] 体外和体内血管生成模型是已知的。例如，在实施例中详细地提供了使用人脐带血管内皮细胞(HUVEC)的体外模型。简而言之，当 HUVEC在亚汇合培养物中生长时，它们呈
现血管生成细胞的特性。当HUVEC在汇合培养物中生长时，它们不呈现血管生成细胞的特
性。血管生成级联中的大多数步骤可以在体外分析，包括内皮细胞增殖、迁移和分化。增
殖研究是基于细胞计数、胸苷掺入或细胞增殖(通过测量PCNA)或细胞死亡(通过末端脱氧
核苷酸转移酶介导的dUTP 缺刻末端标记或Tunel分析)的免疫组织化学染色。趋化性可以
在由滤膜分隔的上孔和下孔组成的博伊登室中检验。趋化性溶液置于下孔中，细胞添加
到上孔，且在孵育期后，已经朝向趋化刺激迁移的细胞在膜的下表面上计数。细胞迁移也
可以使用在以下实施例中提供的 “划痕”分析进行研究。分化可以在体外通过在不同ECM成
分(包括二维和三维纤维蛋白凝块、胶原凝胶和基质胶)中培养内皮细胞诱导。微血管也
已证明从嵌入三维纤维蛋白凝胶中的大鼠主动脉环生成。基质金属蛋白酶表达可以通过
酶原分析方法进行分析。

[0524] 视网膜脉管系统在小鼠中在出生时未完全形成。血管生长和血管生成已在这一模型中详细研究。分段的视网膜可以用于分析作为正常生物学过程的血管生成。

[0525] 鸡绒毛尿囊膜(CAM)分析是本领域中公知的。鸡幼胚缺乏成熟的免疫系统且因此用于研究肿瘤诱导的血管生成。组织移植物通过蛋壳中形成的窗口置于CAM上。这引起血
管朝向移植物的典型径向重排和植入后四天内移植物周围血管的明显增加。进入移植物
的血管在立体显微镜下计数。为评估测试物质的抗血管生成和血管生成活性，化合物在
慢释聚合物药丸中制备，通过明胶海绵吸附或在塑料盘上空气干燥且随后植入到CAM上。
已经描述了CAM分析的几种变型，包括无壳胚在皮氏皿中的培养和不同定量方法(即，使用
放射标记的脯氨酸测量基底膜生物合成的速率、在显微镜下计数血管数目或成像分析)。

[0526] 角膜呈现体内无血管位点。因此，从边缘穿透到角膜基质中的任何血管可以确定为新形成的。为诱导血管生成反应，缓释聚合物药丸[即，聚-2-羟基乙基-甲基丙烯酸酯
(Hydron)或乙烯-乙酸乙烯酯共聚物 (ELVAX)](包含血管生成物质(即，VEGF的FGF-2))植
入在兔的角膜基质中形成的“囊袋”中。并且，多种多样的组织、细胞、细胞提取物和条件化培养基已经检验其对角膜中血管生成的作用。血管反应可以在用India墨水灌注角膜后
通过计算机图像分析进行定量。角膜可以使用本文中提供的平台方法收获和分析。

[0527] 是称为Engelbreth-Holm-Swarm鼠肉瘤的小鼠基底膜肿瘤的基质。它是基底膜蛋白质(包括层粘连蛋白、IV型胶原蛋白、硫酸乙酰肝素、纤维蛋白)和生长因子(包括EGF、TGF-b、PDGF 和IGF-1)的复杂混合物。其先前开发用于研究体外内皮细胞分
化。但是，含FGF-2的可以皮下注射到小鼠中。在4℃下
是液体但在37℃下形成固体凝胶，其封闭生长因子以使其缓慢释放。通常，在10天后，
塞除去且血管生成在塞切片中通过组织学或形态测量方式定量。
塞可以使用本文中提供的平台方法收获和分析。

[0528] 2.体外疾病模型

[0529] 生物系统或过程的实例是癌症。如任何其他复杂的生物学过程或系统一样，癌症是复杂的病理状态，其特征在于多个独特的方面。例如，由于其高生长率，许多癌细胞适应于在缺氧状态下生长、具有上调的糖酵解和降低的氧化磷酸化代谢途径。其结果是，与正
常细胞响应于相同处理的反应相比较，癌细胞可以对环境的扰动(例如潜在药物的治疗)
做出不同的反应。因此，与正常细胞的反应相比，破译癌症对药物治疗的独特反应是有利
的。为此，可以建立定制的癌症模型以通过建立与癌症细胞在体内癌症中的条件非常接近
的细胞培养条件(例如，在体内的肿瘤内)模拟癌细胞的环境，或通过分离癌细胞的不同
生长条件模仿癌生长的各个方面。

[0530] 一个这样的癌症“环境”或生长应激状态是缺氧状态，这是通常在实体瘤内发现的状态。缺氧可以使用该领域公认的方法在细胞中诱导。例如，缺氧可以通过将细胞系统
放置在模块化培养箱(MIC-101, Billups-Rothenberg Inc.Del Mar,CA)中诱发，其可以用
含5％CO2、2 ％O2和93％氮的工业气体混合物冲洗。可以在预先确定的时期后，如在缺氧处理后24小时，在具有或没有额外的外部刺激成分(例如， 0、50或100μM的辅酶Q10)的情况下测量效果。

[0531] 同样，细胞的乳酸处理模仿其中糖酵解活性高的细胞环境，如体内癌症环境中存在的。可以在预先确定的时间，例如，在24小时时，在具有或没有额外的外部刺激成分(例
如，0、50或100μM的辅酶 Q10)的情况下在约12.5mM的最终乳酸浓度下调查乳酸诱导的应
激。

[0532] 高血糖是通常见于糖尿病中的状态，然而，高血糖也在一定程度上模仿癌生长的一个方面，因为许多癌细胞依赖于葡萄糖作为其主要的能量来源。将所述细胞暴露于典型
的高血糖条件可包括向合适的培养基加入10％的培养级的葡萄糖，以使得培养基中的葡
萄糖的终浓度为约22mM。

[0533] 可以在定制的癌症模型中独立地研究反映癌生长的不同方面的单独情况，和/或可以结合在一起研究。在一个实施方式中，在定制的癌模型中研究了至少2、3、4、5、6、7、8、
9、10、15、20、25、30、 40、50或更多的反映或模拟癌的生长/状态的不同方面的状态的组合。在一个实施方式中，在定制的癌模型中研究反映或模拟癌生长/状态的不同方面的状态的
单个状态和另外地至少2、3、4、5、6、7、8、9、 10、15、20、25、30、40、50或更多状态的组合。在前述列表中给出的所有值也可以是范围的上限或下限，其意图是本发明的部分，例如， 1
至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、 5至20、10至20、10至25、10至30或10至50个不同的状态。

[0534] 本文下面列出的是一些示例性的状态组合，其可用于处理细胞。其它组合可以很容易地根据进行的特定探询式生物学评估而制订。

[0535] 1、仅培养基

[0536] 2、50μM CTL辅酶Q10(CoQ10)

[0537] 3、100μM CTL辅酶Q10

[0538] 4、12.5mM乳酸

[0539] 5、12.5mM乳酸+50μM CTL辅酶Q10

[0540] 6、12.5mM乳酸+100μM CTL辅酶Q10

[0541] 7、缺氧

[0542] 8、缺氧+50μM CTL辅酶Q10

[0543] 9、缺氧+100μM CTL辅酶Q10

[0544] 10、缺氧+12.5mM乳酸

[0545] 11、缺氧+12.5mM乳酸+50μM CTL辅酶Q10

[0546] 12、缺氧+12.5mM乳酸+100μM CTL辅酶Q10

[0547] 13、培养基+22mM葡萄糖

[0548] 14、50μM CTL辅酶Q10+22mM葡萄糖

[0549] 15、100μM CTL辅酶Q10+22mM葡萄糖

[0550] 16、12.5mM乳酸+22mM葡萄糖

[0551] 17、12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10

[0552] 18、12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10

[0553] 19、缺氧+22mM葡萄糖

[0554] 20、缺氧+22mM葡萄糖+50μM CTL辅酶Q10

[0555] 21、缺氧+22mM葡萄糖+100μM CTL辅酶Q10

[0556] 22、缺氧+12.5mM乳酸+22mM葡萄糖

[0557] 23、缺氧+12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10

[0558] 24、缺氧+12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10

[0559] 作为对照，在类似的状态下培养一个或多个正常细胞系(例如， THLE2和HDFa)，以便确定癌症独特的蛋白质或途径(见下文)。对照可以是上述的对比细胞模型。

[0560] 相同或不同起源的多个癌细胞(例如，癌细胞系PaCa2、HepG2、 PC3和MCF7)，而不是单一癌细胞类型，可以被包括在癌症模型中。在某些情况下，不同的癌细胞(例如，HepG2和PaCa2)之间的交互式或ECS实验可以针对几种相互关联的目的而进行。

[0561] 在一些涉及交互的实施方式中，在定义的处理条件下(例如，高血糖，缺氧(缺血))，在细胞模型上进行的实验设计为通过另一个细胞系统或群体(如胰腺癌PaCa2)确定
一个细胞系统或群体(如肝癌细胞HepG2)的细胞状态或功能的调制。根据典型的设置，第
一细胞系统/群体接触外部刺激成分，如候选分子(例如，小的药物分子、蛋白质)或候选
条件(例如，缺氧、高糖环境)。作出响应，第一细胞系统/群体改变其转录组、蛋白质组、代谢组和/或相互作用组，从而导致可以很容易地在细胞内和细胞外检测的变化。例如，转录
的变化可以通过多个目标mRNA的转录水平测量；蛋白质组的变化可以通过多个目标蛋白
质的表达水平测量；以及代谢组的变化可以通过对给定代谢物特别设计的分析通过多个
目标代谢物的水平测量。可选择地，上述所指的代谢组和/或蛋白质组(至少关于某些分泌
的代谢物或蛋白质)的变化也可以通过他们对第二细胞系统/群体的效应进行测量，包括
第二细胞系统/群体的转录组、蛋白质组、代谢组、相互作用组的调节。因此，该实验可用于确定第一细胞系统/群体分泌的目标分子在不同处理条件下对第二细胞系统/群体的影
响。该实验也可以用于通过，例如，蛋白质组学差分筛选用来鉴别作为第一细胞系统(响应于外部刺激成分处理)对另一细胞系统的信号传导的结果而调节的任何蛋白质。相同实验
设置也可以适应于反向设置，以至于也可以评估两个细胞系统间的相互影响。通常，对于
这种类型的实验，细胞系对的选择主要是基于例如来源、疾病状态和细胞功能的因素。

[0562] 虽然双细胞系统通常包括在这种类型的实验设置中，但类似的实验也可以被设计用于两个以上的细胞系统，例如，通过在单独的固相支持物上固定各个不同的细胞系
统。

[0563] 定制的模型一旦建立，可以将一个或多个“扰动”应用到该系统，如从病人与病人之间的遗传变异，或具有/没用某些药物或前药的处理。见图15D。可以使用本领域公认的
或专有的各种方法测量这种扰动对系统的影响，包括对疾病相关的癌症细胞和疾病相关
的正常对照细胞的影响，如下文III.B节中所描述的。

[0564] 在示例性的实验中，癌细胞系PaCa2、HepG2、PC3和MCF7及正常细胞系THLE2和HDFa在高血糖、缺氧、富乳酸条件的各种条件中以及在这些条件中两种或三种条件的所有
组合中，并且另外在具有或没有环境扰动(特别是辅酶Q10的治疗)的情况下适应。

[0565] 通过实施本文中所描述的步骤，可以在本发明的平台技术的整个步骤中建立和使用定制的细胞模型以最终确定在该生物系统中独特的因果关系。但是，本领域技术人员
可以理解，用来生成生物学过程的初始的“第一代”一致因果关系网络的定制建立的细胞
模型可以随着时间不断地进化或扩展，例如，通过引入另外的癌症或正常细胞系和/或另
外的癌症条件。可以收集来自进化的细胞模型的另外的数据，即来自细胞模型的新增加部
分的数据。然后可以将从扩展或进化的细胞模型(即，从细胞模型的新增加部分)收集的新
数据引入先前用来生成“第一代”一致因果关系网络的数据集，以便生成更强大的“第二
代”一致因果关系网络。然后可以从“第二代”一致因果关系网络确定该生物系统独特的新因果关系。以这种方式，细胞模型的进化提供了一致因果关系网络的演变，从而提供对于
该生物系统的调节子的新的和/或更可靠的深入了解。

[0566] 本文中详细描述了定制的细胞模型的其他实例。

[0567] B、数据收集

[0568] 在一般情况下，可从任何定制的模型系统收集两种类型的数据。一种类型的数据(例如，第一数据集，第三数据集)通常涉及某些大分子的水平，如DNA、RNA、蛋白质、脂质等，此类别的示例性数据集是蛋白质组学数据(例如，涉及来自样品的所有或基本上所有
可测量蛋白质的表达的定性和定量数据)。其他类型的数据一般是功能数据(例如，第二
数据集，第四数据集)，其反映了第一类型数据中的变化导致的表型改变。

[0569] 对于第一类型的数据，在一些示例性实施方式中，进行定量聚合酶链反应(qPCR)和蛋白质组学分析来通过定量聚合酶链反应(qPCR) 和蛋白质组学确定细胞mRNA和蛋白质
表达的变化的特征。可以使用市售的RNA分离试剂盒分离总RNA。cDNA合成后，可以使用用
于疾病区域或细胞过程(如血管生成、细胞凋亡和糖尿病)的特定市售qPCR阵列(例如，那
些购自SA Biosciences的)，按照制造商的说明来确定一组预定基因的特征。例如，Biorad CFX-384扩增系统可用于所有的转录谱分析实验。数据收集(Ct)后，可以使用如制造商的
说明中列出的δCt方法确定相对于对照的最终倍数变化。可以按后续章节中所描述的进行
蛋白质组学样品分析。

[0570] 所述方法可以采用数百个具有类似性质的样品的大规模高通量的定量蛋白质组学分析，并提供用于确认细胞输出差异所必需的数据。

[0571] 有许多适合这一目的本领域公认的技术。下面简要地描述示例性的技术，与质谱结合的iTRAQ分析。

[0572] 定量蛋白质组学方法是基于采用8-重iTRAQ试剂的稳定同位素标记和用于肽鉴别和定量的2D-LC MALDI MS/MS。使用这种技术的定量是相对的：肽和蛋白质被赋予相对
于参比样品的丰度比。多重 iTRAQ实验中常用的参比样品有利于整个多重iTRAQ实验中样
品的对比。

[0573] 例如，要实施这种分析方案，可以按照制造商的建议将6个初始样品和两个对照池样品组合成一个8-重iTRAQ混合物。然后可以由二维液相色谱法将这一8样品的混合物
分离，第一维度中的强阳离子交换(SCX)和第二维度中的反相HPLC，然后可以进行质谱分
析。

[0574] 本文提供了可以使用的示例性实验室程序的简要概述。

[0575] 蛋白质的提取：可以用8 M尿素裂解缓冲液与蛋白酶抑制剂(不含EDTA的Thermo Scientific Halt蛋白酶抑制剂)裂解细胞，并在冰上孵育30分钟，每10分钟涡旋(vertex)
5秒。可以以5秒的脉冲通过超声波完成裂解。可以将细胞裂解物在14000×g下离心15分钟
(4 ℃)以除去细胞碎片。可以进行Bradford分析以确定蛋白质的浓度。取自各个样品的
100ug蛋白质可以还原(10mM的二硫苏糖醇 (DTT)，55℃，1小时)、烷基化(25mM的碘乙酰胺，室温，30 分钟)和用胰蛋白酶消化(1:25w/w，200mM三乙基碳酸氢铵 (TEAB)，37℃，16小
时)。

[0576] 分泌组样品的制备：1)在一个实施方式中，可以将细胞培养在无血清培养基中：可以通过冷冻干燥器浓缩条件化的培养基、还原(10 mM的二硫苏糖醇(DTT)，55℃，1小时)、烷基化(25mM的碘乙酰胺，在室温下，孵育30分钟)和然后用丙酮沉淀脱盐。可以用胰蛋白
酶(1:25w/w，200mM三乙基碳酸氢铵(TEAB)，37℃，16 小时)消化来自浓缩的条件化培养基
的等量蛋白质。

[0577] 在一个实施方式中，细胞可以培养在含血清培养基中：可以使用 3k MWCO Vivaspin柱(GE Healthcare Life Sciences)减小培养基的体积，然后可以用1xPBS
(Invitrogen)重构。可以按照制造商的说明使用带有缓冲交换的改进以优化条件培养基
应用的AlbuVoid柱 (Biotech Support Group,LLC)从所有样品中耗尽血清白蛋白质。

[0578] iTRAQ 8重标记：可以将来自各实验组中各个胰蛋白酶消化的试样汇集在一起以建立汇集的对照样品。可以根据制造商的方案(AB Sciex)将来自各个样品和汇集的对照样
品的相等试样用iTRAQ 8重试剂标记。反应物可以组合，真空至干，通过添加0.1％甲酸再
悬浮，并通过LC-MS/MS进行分析。

[0579] 2D-NanoLC-MS/MS：所有的标记肽混合物可以通过在线 2D-nanoLC分离并通过电喷雾串联质谱进行分析。实验可以在与配备有纳米电喷射离子源(Thermo Electron,
Bremen,Germany)的LTQ Orbitrap Velos质谱仪连接的Eksigent 2D nanoLC Ultra系统上
进行。

[0580] 可以将肽混合物以4μL/分钟的流量注入5厘米SCX柱(300μm ID，5μm，聚SULFOETHYL Aspartamide柱，来自PolyLC列，哥伦比亚，MD)，和在10个离子交换洗脱片段
中洗脱到C18捕获柱(2.5 厘米，100μm ID，5μm，300埃ProteoPepII，来自New Objective, Woburn,MA)中并用H2O/0.1％FA洗涤5分钟。然后可以进一步用 2-45％B(H2O/0.1％FA(溶剂
A)和ACN/0.1％FA(溶剂B))梯度在15厘米熔融石英柱(75μm ID，5μm，300埃ProteoPepII，来自New Objective,Woburn,MA)上以300nL/分钟进行分离120分钟。

[0581] 可以在Orbitrap中以30,000分辨率获得全扫描MS谱(m/z 300-2000)。可以对于使用高能C-阱解离(HCD)的片段化顺序地分离最强的离子(最多10个)和动态排除
(dynamically exclude)30秒。可以用1.2 Da的分离宽度进行HCD。可以在分辨率为7500的
Orbitrap 中扫描所产生的碎片离子。可以通过Xcalibur 2.1用foundation 1.0.1 控制
LTQ Orbitrap Velos。

[0582] 多肽/蛋白质鉴定和定量：可以通过使用Proteome Discoverer软件 (Thermo Electron)用Mascot搜索引擎对SwissProt数据库的自动数据库检索鉴别多肽和蛋白质。
检索参数可以包括对于MS公差(MS tolerance)的10ppm、对于MS2公差的0.02 Da和完全胰
蛋白酶消化，从而允许最多2个缺失的裂隙。脲基甲基化(C)可以设置为固定的修饰。氧化
(M)、TMT6和脱酰胺化(NQ)可以设置为动态的修饰。肽和蛋白质的鉴定可以用Mascot显著
性阈值(P<0.05)过滤。过滤器可以容许蛋白质鉴别的99％置信水平(1％FDA)。

[0583] Proteome Discoverer软件可以对报告离子应用校正因子，且如果不是所有定量通道都存在，可以拒绝所有的定量值。可以通过平均强度的标准化获得相对蛋白质定量。

[0584] 关于第二类型的数据，在一些示例性实施方式中，癌和正常模型的生物能量学谱分析可以采用SeahorseTMXF24分析仪来实现对糖酵解和氧化磷酸化成分的理解。

[0585] 具体而言，可以将细胞以最佳密度接种在Seahorse培养板上。这些细胞可以被接种在100μl的培养基或处理溶液中并置于含5％CO2的37℃培养箱中。两小时后，当细胞附着
到24孔板上，可以添加另外的150μl的培养基或处理溶液且板可留在培养温育箱内过夜。
这一两步接种程序允许细胞在培养板中均匀分布。包含氧和pH 传感器的 Seahorse盒可以
在37℃的无二氧化碳培养箱中在校准流体中水化过夜。通常将三个线粒体药物加载到该
盒的三个端口上。可以将寡霉素 (复合体III抑制剂)、FCCP(解偶联剂)和鱼藤酮(复合体I
抑制剂)分别加载到该盒的端口A、B和C中。可以在非缓冲的DMEM 培养基中以10倍浓度制
备所有药物原液。在测定前,可以先将盒与线粒体化合物在无CO2培养箱中孵育约15分钟。
可以在含有在正常的生长培养基中发现的浓度的葡萄糖的DMEM基非缓冲培养基中洗涤
Seahorse培养板。细胞可以用630μl非缓冲培养基成层，并可以在将其置于具有预校准盒
的Seahorse仪中之前在无CO2培养箱中平衡。可以在通过端口启动药物注射前，将该仪器
运行具有混合、等待和测量周期的三四个循环以获得基线。在引入下一药物之前可以有两
个循环。

[0586] OCR(耗氧率)和ECAR(细胞外酸化率)可以通过电极在7μl 室中记录且可以用推靠seahorse培养板的盒来建立。

[0587] C、数据整合与计算机模型生成

[0588] 一旦已获得相关的数据集，可以使用基于AI的信息学系统或平台(例如，REFSTM平台)进行数据集的整合和计算机执行的统计模型的生成。例如，示例性的基于AI的系统可
以产生蛋白质相关性的基于模拟的网络作为代谢终点(ECAR/OCR)的关键驱动子。见图15。
关于REFSTM系统的一些背景细节可见于Xing等,“Causal Modeling Using Network
Ensemble Simulations of Genetic and Gene Expression Data Predicts Genes
Involved in Rheumatoid Arthritis”,PLoS Computational Biology,vol.7,issue.3,1-
19(2011年3月)(e100105)和Periwal的 7,512,497号美国专利，其各自的全部内容以其整
体明确地通过引用并入本文。在本质上，如前面所述，REFSTM系统是基于AI的系统，它采用数学算法来建立输入变量(例如，蛋白质表达水平、mRNA表达水平以及相应的功能数据，如
在Seahorse培养板上测量的OCR/ECAR 值)之间的因果关系。这个过程只基于单独的输入数
据，而没有考虑之前存在的关于任何潜在的、已建立的和/或验证的生物学关系的知识。

[0589] 特别是，本发明的平台的显著优势是，基于AI的系统是基于从细胞模型获得的数据集，而不诉诸于或考虑涉及该生物学过程的本领域中的任何现有的知识。此外，优选地，没有统计地或人为地切除数据点，而是所有获得的数据被送入用于确定蛋白质相关性的
AI系统中。因此，从平台产生的所得统计模型是无偏的，因为他们不考虑任何已知的生物
学关系。

[0590] 具体来说，可以将来自蛋白质组学和ECAR/OCR的数据输入到基于AI的信息系统中，其如上所述地基于数据关联构建统计模型。然后使用以下方法对各种疾病与正常情况
(包括处理和条件)得到蛋白质相关性的基于模拟的网络。

[0591] 在下面相对于图16呈现用于构建生成的(例如，优化或进化的) 网络的示例性过程的详细描述。如上所述，将来自蛋白质组学的数据和功能细胞数据输入到基于AI的系统
中(步骤210)。预处理输入数据(其可能是原始数据或最低处理的数据)，其可以包括标准
化(例如，使用分位函数或内部标准)(步骤212)。预处理还可以包括输入缺失的数据值
(例如，通过使用K最近邻(K-NN)算法)(步骤 212)。

[0592] 预处理的数据用来构建网络片段文库(步骤214)。网络片段定义测量的变量(输入数据)的所有可能的小集合(如2-3个成员集合或2-4个成员集合)之间的定量的、连续的
关系。在片段中变量之间的关系可以是线性的、逻辑的、多项的、显性或隐性纯合的等。各个片段中的关系被赋以反映候选关系可能如何给予输入数据的贝叶斯概率得分，且还对
于其数学复杂性而惩罚该关系。通过为从输入数据推断的所有可能的成对和三元关系(且
在一些实施方式中，还有四元关系)评分，可以识别文库中最有可能的片段(很可能片段)。
也基于输入的数据计算关系的定量参数并对于各个片段进行储存。可以在片段列举中使
用各种模型类型，包括但不限于线性回归、逻辑回归分析、(方差分析)ANOVA模型、(协方差分析)ANCOVA模型、非线性/多项式回归模型和甚至非参数回归。对模型参数的先验假定可
以假设与模型中使用的参数的数目相关的Gull分布或贝叶斯信息标准(BIC)罚分。在网络
推论过程中，从片段文库中的片段子集构建在一套初始试验网络中的各个网络。该套初始
试验网络中的各个初始试验网络用片段文库中不同片段子集构建(步骤216)。

[0593] 构成贝叶斯网络和网络片段的基础的数学表达式的概述介绍如下，其基于Xing等“, Causal Modeling Using Network Ensemble Simulations of Genetic and Gene
Expression Data Predicts Genes Involved in Rheumatoid Arthritis,”PLoS
Computational Biology,vol.7,issue.3,1-19 (2011年3月)(e100105)。

[0594] 具有随机变量X＝X1,...,Xn的多元系统可以以多元概率分布函数 P(X1,...,Xn；Θ)为特征，其包括了大量的参数Θ。该多元概率分布函数可以分解为因数并由局部条件
概率分布的积表示：

[0595]

[0596] 其中各个变量Xi独立于给出其Ki父变量(parent variable)(其是 )的其非派生变量。分解为因数后，各个局部概率分布具有其自己的参数Θi。

[0597] 多元概率分布函数可以以不同的方式利用各特定因数分解和相应的作为不同概率模型的参数来分解因数。各特定的因数分解(模型) 可以由具有各个变量Xi的顶点和表
示局部条件分布中变量之间的相关性的顶点之间的有向边的有向非循
环图(DAC)表示。各包括顶点和相关有向边的DAG子图是网络片段。

[0598] 通过确定最可能的因数分解和给出输入数据的最可能的参数对模型进行进化或优化。这可以被描述为“学习贝叶斯网络”，或者换句话说，给出输入数据的训练集，找到最佳匹配输入数据的网络。这是通过使用相对于输入数据评估各网络的评分函数完成的。

[0599] 贝叶斯框架被用于确定给出输入数据的因数分解的可能性。贝叶斯定律阐明，模型M的后验概率P(D|M)，给定数据D，是与给定模型假设的数据的后验概率P(D|M)的积乘以
模型的先验概率(P(M)) 的积成比例的，假定数据的概率(P(D))在模型间是恒定的。这由
下面的公式表示：

[0600]

[0601] 假设模型的数据的后验概率是参数先验分布上数据似然性的积分：

[0602] P(D|M)＝∫P(D|M(Θ))P(Θ|M)dΘ。

[0603] 假设所有模型是等可能的(即，P(M)是恒定的)，给定数据D 的模型M的后验概率可以因数分解成各个局部网络片段Mi的参数积分的积，如下所示：

[0604]

[0605] 请注意，在上述等式中，主要的常数项已被略去。在一些实施方式中，可以将取模型P(D|M)的后验概率的负对数的贝叶斯信息标准 (BIC)用于如下所示地对各个模型“评
分”：

[0606]

[0607] 其中模型M的总评分Stot是各个网络片段的局部评分的和。BIC 进一步给出用来确定各单个网络片段的评分的表达式：

[0608]

[0609] 其中κ(Mi)是模型Mi中拟合参数的数目和N是样品(数据点)的数目。SMLE(Mi)是网络片段的似然函数的负对数，其可以从用于各个网络片段的函数关系计算出来。对于BIC
评分，得分越低，模型越有可能拟合输入数据。

[0610] 整套试验网被全局地优化，它可以被描述为优化或进化网络(步骤218)。例如，试验网络可以根据Metropolis Monte Carl采样算法进化和优化。模拟退火可用于通过局部
转化来优化或进化整体中的各个实验网络。在一个示例的模拟退火过程中，通过从文库中
添加网络片段，通过从试验网络删除网络片段，通过取代网络片段或通过以其他方式改
变网络的拓扑结构来改变各个试验网络，且然后计算网络的新评分。一般来讲，如果评分
改善，则保持这种变化，和如果评分恶化，则拒绝该变化。“温度”参数允许保持恶化评分的一些局部变化，这有助于在避免一些局部极小值的优化过程。“温度”参数随着时间降低，以允许优化/进化过程会聚。

[0611] 所有或部分网络推理过程也可以与不同试验网络平行进行。各个网络可以在单独的处理器和/或在单独的计算设备上平行优化。在一些实施方式中，优化过程可以在包
括并行操作的数百到数千个处理器的超级计算机上进行。可以在并行处理器上进行的优
化过程之间共享信息。

[0612] 优化过程可以包括从整体中放弃无法满足总体评分的阈值标准的任何网络的网络过滤器。放弃的网络可被新的初始网络代替。此外，任何不是“无尺度”的网络可以从整体中放弃。整套网络已被优化或进化后，其结果可被称一整套生成的细胞模型网络，它可
以被统称为生成的一致网络。

[0613] D、模拟以提取定量关系信息和用于预测

[0614] 模拟可以被用来提取关于生成的细胞模型网络中的各关系的定量参数信息(步骤220)。例如，用于定量信息提取的模拟可以涉及扰动(增加或减少)网络中的各个节点10
倍，并计算模型中的其他节点(例如，蛋白质)的后验分布。通过t检验比较终点与每组100
个样品的假设和0.01显著性截止值。t检验统计值是100个t检验的中值。通过使用这种模
拟技术，为整套网络中的各个关系生成代表预测强度的AUC(曲线下面积)和代表驱动终点
的节点的计算机计算幅度的倍数变化。

[0615] 可采用本地计算机系统的关系量化模块来指导基于AI的系统进行扰动及提取AUC信息和倍数信息。提取的定量信息对于连接父节点与子节点的各个边界可包括倍数变
化和AUC。在一些实施方式中，定制的R程序可用于提取定量信息。

[0616] 在一些实施方式中，可以使用整套生成的细胞模型网络来通过模拟预测对条件变化的反应，其可以随后通过基于细胞的，或基于动物的湿式实验室实验证实。

[0617] 基于AI的系统的输出可以是定量关系参数和/或其他的模拟预测 (222)。

[0618] E、生成差异(Δ)网络

[0619] 也可以使用差异网络建立模块来产生在生成的细胞模型网络和生成的对比细胞模型网络之间的差异(Δ)网络。如上所述，在一些实施方式中，差异网络比较所生成的细
胞模型网络和生成的对比细胞模型网络中关系的所有定量参数。在差异网络中用于各个
关系的定量参数是基于该对比。在一些实施方式中，可以在各种差异网络之间执行差分，
这可称为Δ-Δ网络。在下面的实施例部分中相对于图26描述了Δ-Δ网络的例子。差异网
络创建模块可以是程序或用PERL编写的脚本。

[0620] F、网络的可视化

[0621] 用于整套网络和差异网络的关系值可以使用网络可视化程序(例如，来自Cytoscape consortium的用于复杂的网络分析和可视化的 Cytoscape开源平台)而可视
化。在网络的视觉描绘中，各个边界的厚度(例如，连接蛋白质的各条线)表示倍数变化的
强度。边界也是有向的以表明因果性，和各个边界有相关的预测置信水平。

[0622] G、示例性的计算机系统

[0623] 图17示意性地描述了可以在一些实施方式中用于与基于AI的信息学系统进行通讯以生成差异网络、用于可视化网络、用于保存和存储数据和/或用于与用户进行交互的
示例性计算机系统/环境。如上面所解释的，用于基于AI的信息学系统的计算可以在拥有
数百或数千个直接或间接地与示例性计算机系统交互的并行处理器的单独超级计算机
上进行。该环境包括具有相关外周设备的计算设备100。计算设备100是可编程的以实施用
于执行本文所教导的各种方法或方法部分的可执行代码150。计算设备100包括存储装置
116，如硬盘驱动器、CD-ROM或其他的非临时性计算机可读介质。存储设备116可以存储操
作系统118和其他相关软件。计算设备100还可以包括存储器 106。存储器106可包括计算机
系统存储器或随机存取存储器，例如 DRAM、SRAM、EDO RAM等。存储器106还可以包括其它类型的存储器，或它们的组合。计算设备100可以在存储设备116和/或存储器106中存储用
于执行和处理可执行代码150的各个部分的指令。

[0624] 可执行代码150可以包括用于与基于AI的信息学系统190通讯、用于生成差异网络(例如，差异网络创建模块)、用于从基于AI的信息学系统提取定量关系信息(例如，关系
定量模块)和用于可视化网络(例如，Cytoscape)的代码。

[0625] 在一些实施方式中，计算设备100可以直接或间接地与基于AI 的信息学系统190(例如，用于执行REFS的系统)通讯。例如，计算设备100可以通过利用网络将数据文件(例
如，数据帧)传送到基于AI的信息学系统190而与基于AI的信息学系统190通讯。另外，计
算设备100可以具有可执行代码150，其提供了基于AI的信息学系统190的接口和指令。

[0626] 在一些实施方式中，计算设备100可以直接或间接地与一个或多个为输入数据集提供数据的实验系统180通讯。用于生成数据的实验系统180可以包括用于基于质谱的蛋
白质组学、微阵列基因表达、 qPCR基因表达、基于质谱的代谢组学和基于质谱的脂质组学、SNP 微阵列、功能分析组和其他体外生物学平台和技术的系统。

[0627] 计算设备100还包括处理器102，并且可包括一个或多个附加的处理器102'，用于执行存储在存储器106中的软件和用于控制系统硬件、外周设备和/或外周硬件的其他程
序。处理器102和处理器102' 各自可以是单核处理器或多核(104和104')处理器。可以在计
算设备100中采用虚拟化，以便计算设备中的基础结构和资源可动态共享。虚拟化处理器
也可以与可执行代码150和存储装置116中的其他软件一起使用。可提供虚拟机114来操纵
在多个理器上运行的过程，以使得该过程表现为只使用一个计算资源而不是多个。多个虚
拟机也可以用于一个处理器。

[0628] 用户可以通过可以显示用户界面124或任何其他界面的可视显示装置122，如计算机监视器，与计算设备100互动。显示装置122的用户界面124可用于显示原始数据、网络
的可视化表现等。可视显示装置122也可以显示示例性实施方式的其他的方面或元件(例
如，用于存储装置116的图标)。计算设备100可以包括其他I/O设备，例如键盘或多点触控
界面(例如，触摸屏)108和点击设备110(例如，鼠标、轨迹球和/或触控板)，以用于从用户
接收输入。键盘108和点击设备110可通过有线和/或无线连接与可视显示装置122和/或计
算设备100连接。

[0629] 计算设备100可以包括经由局域网(LAN)、广域网(WAN)或互联网，通过多种连接(包括但不限于，标准电话线、局域网或广域网连接(例如，802.11,T1,T3,56kb,X.25)、宽
带连接(如ISDN、帧中继、ATM)、无线连接、控制器局域网络(CAN)或一些上述中任何或所
有连接的组合)的与网络设备126的网络接口112。网络接口112可以包含内置的网络适配
器、网络接口卡、PCMCIA网卡、卡式总线网络适配器(card bus network adapter)、无线网络适配器、 USB网络适配器、调制解调器或适用于实现计算设备100与能够通讯的任何类
型的网络接口和执行在此描述的操作的任何其他设备。

[0630] 此外，计算设备100可以是任何计算机系统，如工作站、台式计算机、服务器、笔记本电脑、手持式计算机或其他形式的能够通讯和并具有足够的处理器能力和存储容量以执行本文所描述的操作的计算或通讯装置。

[0631] 计算设备100可以运行任何操作系统118如任何版本的微软 Windows操作系统、不同版本的Unix和Linux操作系统、用于 Macintosh电脑的任何版本的MACOS、任何嵌入式操
作系统、任何实时操作系统、任何开源操作系统、任何专有操作系统、任何用于移动计算
设备的操作系统或能够运行在计算设备上并执行本文描述的操作的任何其他操作系统。
操作系统可以以原始模式或仿真模式运行。

[0632] IV、生物系统的模型及其用途

[0633] A、建立生物系统的模型

[0634] 实质上所有的生物系统或过程都涉及不同细胞类型和/或器官系统之间复杂的相互作用。在一个细胞类型或器官中关键功能的扰动可以导致对其他相互作用的细胞类
型和器官的次生效应，且这样的下游变化可以随之反馈于初始变化并导致进一步的复杂
化。因此，将给定生物系统或过程解析为其组成成分(如细胞或器官对之间的相互作用)
并系统地探查这些成分之间的相互作用以获得该生物系统或过程的更完整的、全面的认
识是有利的。

[0635] 因此，本发明提供了用于生物系统的细胞模型。为此，申请人已构建了用于在所述的发现平台技术中的几个示例性生物系统的细胞模型。申请人使用所述的发现平台技
术用该细胞模型进行实验以生成一致因果关系网络，包括生物系统中独特的因果关系，并
因此确定对特定生物系统或程序重要的“调节子”或关键分子“驱动子”。

[0636] 平台技术及其成分(例如，定制的细胞模型和从细胞模型获得的数据集)的一个显著的优势是，为生物系统或过程生成的初始的“第一代”一致因果关系网络可以随着时
间不断进化或扩展，例如，通过引入另外的细胞系/类型和/或另外的条件。可以收集来自
进化的细胞模型的另外的数据，即来自细胞模型的新增加部分的数据。然后可以将从扩
展或进化的细胞模型(即，从细胞模型的新增加部分)收集的新数据引入先前用来生成“第
一代”一致因果关系网络的数据集中，以便生成更强力的“第二代”一致因果关系网络。然后可以从“第二代”一致因果关系网络确定生物系统独特的新因果关系。以这种方式，细胞模型的进化提供了一致因果关系网络的进化，从而提供新的和/或更可靠的对于生物系统
的调节子的理解。以这种方式，细胞模型、来自细胞模型的数据集和通过使用平台技术方
法从细胞模型生成的因果关系网络都能够不断进化和构建在先前从平台技术获得的知识
上。

[0637] 因此，本发明提供了从平台技术中采用的细胞模型生成的一致因果关系网络。这些一致因果关系网络可以是第一代的一致因果关系网络，或者可以是多代一致因果关系
网络，例如，第2代、第3代、第 4代、第5代、第6代、第7代、第8代、第9代、第10代、第11 代、第
12代、第13代、第14代、第15代、第16代、第17代、第 18代、第19代、第20代或更高代的一致因果关系网络。另外，本发明提供了从平台技术中采用的细胞模型生成的模拟一致因果关系
网络。这些模拟一致因果关系网络可以是第一代模拟一致因果关系网络，或可以是多代
模拟一致因果关系网络，例如，第2代、第3代、第4代、第5代、第6代、第7代、第8代、第9代、第
10代、第 11代、第12代、第13代、第14代、第15代、第16代、第17代、第18代、第19代、第20代或更高代的模拟一致因果关系网络。本发明还提供从本发明的任何一致因果关系网络生
成的Δ网络和Δ-Δ 网络。

[0638] 生物系统或过程的定制细胞模型包括与生物系统相关的一种或多种细胞。通过建立模仿生物系统或过程的特征性方面的条件(例如，细胞培养条件)可以建立用于生物
系统/过程的模型来模拟生物系统的环境，例如，癌细胞在体内的环境。

[0639] 在细胞模型中可包括相同或不同来源的多种细胞，而不是单一的细胞类型。在一个实施方式中，至少1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、25、30、
35、40、 50或更多种不同的细胞系或细胞类型被包括在细胞模型中。在一个实施方式中，
细胞全是相同的类型，例如，全部乳腺癌细胞或植物细胞，但是是确立的不同细胞系，例
如，乳腺癌细胞或植物细胞的确立的不同细胞系。在前述列表中给出的所有值也可以是范
围的上限或下限，其意图属于本发明的部分，例如，1至5、1至10、2至5、或5至15 种不同的细胞系或细胞类型。

[0640] 可以被包括在本发明的细胞模型中的细胞类型的实例，包括但不限于，人体细胞、动物细胞、哺乳动物细胞、植物细胞、酵母、细菌或真菌。在一个实施方式中，细胞模型的细胞可以包括病变细胞，如癌细胞或者细菌或病毒感染的细胞。在一个实施方式中，细
胞模型的细胞可以包括疾病相关的细胞，如涉及糖尿病、肥胖症或心血管疾病状态的细
胞，例如，主动脉平滑肌细胞或肝细胞。技术人员会认识到涉及特定的生物状态/过程或与
其相关的那些细胞，例如，疾病状态/ 过程，且任何此类细胞可包括在本发明的细胞模型
中。

[0641] 本发明的细胞模型可以包括一种或多种“对照细胞”。在一个实施方式中，对照细胞可以是未处理的或无扰动的细胞。在另一个实施方式中，“对照细胞”可以是正常的，例如，非病变的细胞。在一个实施方式中，细胞模型中包括至少1、2、3、4、5、6、7、8、9、10、11、
12、13、14、15、16、17、18、19、20、25、30、35、40、45、50 种或更多种不同的对照细胞。在前述列表中给出的所有值也可以是范围的上限或下限，其意图属于本发明的部分，例如，1至5、
1至10、 2至5、或5至15种不同的对照细胞系或对照细胞类型。在一个实施方式中，对照细
胞全部是相同的类型，但是是该细胞类型的确立的不同细胞系。在一个实施方式中，作为
对照，将一种或多种正常的，例如，非病变的，细胞系培养在类似的条件下和/或暴露于相
同的扰动，作为细胞模型的原代细胞，以便确定生物状态或过程独特的蛋白质或途径。

[0642] 本发明的定制细胞模型也可以包含模仿生物状态或过程的特征性方面的条件。例如，可以选择密切近似于体内肿瘤环境中的癌细胞的条件，或患心血管疾病的患者的主
动脉平滑肌细胞的条件的细胞培养条件。在某些情况下，所述条件是应激条件。本发明的
细胞模型中可以采用各种不同的条件/应激源。在一个实施方式中，这些应激源/ 条件可
以构成细胞系统的“扰动”，例如，外部刺激。一个示例性的应激条件是缺氧，例如，通常在实体癌症中发现的状态。缺氧可使用本领域内公认的方法诱导。例如，可以通过将细胞系
统置于模块化培养箱(MIC-101,Billups-Rothenberg Inc.Del Mar,CA)中诱发缺氧，该
模块化培养箱可以用含5％CO2、2％O2和93％的氮的工业气体混合物填充。可以在预定的时
间后，如在缺氧处理后24小时时，在有或没有额外的外部刺激成分(例如，0、50或100μM辅酶Q10)的情况下，测量其效果。同样，乳酸处理模拟糖酵解活性高的细胞环境。可以在预
定的时间处，如在24小时时，在有或没有额外的外部刺激成分(例如，0、50或100μM辅酶
Q10)的情况下，在约12.5mM 的最终乳酸浓度下研究乳酸诱导的应激。高血糖是在糖尿病以
及在癌症中发现的状态。可以用来处理所述细胞的典型高血糖条件包括加入到合适培养
基中的10％培养级葡萄糖以产生培养基中约22mM的最终葡萄糖浓度。高脂血症是在例如，
在肥胖症和心血管疾病中发现的状态。可以通过在含有0.15mM棕榈酸钠的培养基中培养
细胞来提供高脂血条件。高胰岛素血症是在例如，糖尿病中发现的状态。可以通过在含有
1000nM胰岛素的培养基中培养细胞来诱导高胰岛素条件。

[0643] 可以在本发明的定制细胞模型中单独地研究单个条件，和/或可以结合在一起研究。在一个实施方式中，在定制的细胞模型中研究至少 2、3、4、5、6、7、8、9、10、15、20、25、
30、40、50或更多种反映或模拟生物系统的不同特征性方面的条件。在一个实施方式中，在定制的细胞模型中研究单个条件和另外地至少2、3、4、5、6、7、8、 9、10、11、12、13、14、15、
20、25、30、35、40、45、50种或更种反映或模拟生物系统的不同特征性方面的条件的组合。
在前述列表中给出的所有值也可以是范围的上限或下限，其意图属于本发明的部分，例
如，1至5、1至10、2至5、2至10、5至10、1至20、5至 20、10至20、10至25、10至30或10至50种不同条件。

[0644] 一旦建立定制的细胞模型，可以将一种或多种“扰动”应用于系统，如病人与病人之间的遗传变异或者有/无某些药物或前药的治疗。见图15D。可以使用各种本领域认可的
或专有的方式测量这种扰动对细胞模型系统的影响，如在下文的III.B节中所描述的。

[0645] 可以将定制的细胞模型暴露于扰动，例如，“环境扰动”或“外部刺激成分”。“环境扰动”或“外部刺激成分”可以是细胞环境内源性的(例如，细胞环境包含了一些水平的刺激物，和添加更多的刺激物以提高其水平)，或可以是细胞环境外源性的(例如，刺激物/
扰动改变前基本不存在于细胞环境中)。可以通过由添加环境扰动或外部刺激成分而导致
的继发性改变进一步改变细胞环境，因为外部刺激成分可以改变细胞系统的细胞输出，包
括由细胞系统分泌到细胞环境中的分子。环境扰动或外部刺激成分可包括可以影响细胞
功能的任何外部的物理和/或化学刺激。这可以包括任何大或小的有机或无机分子、天然
或合成的化学物质、温度变换、pH值变化、辐射、光(UVA、 UVB等)、微波、声波、电流、调制的或未调制的磁场等。环境扰动或外部刺激成分还可以包括引入的遗传修饰或突变或者导
致遗传修饰/突变的媒介(例如，载体)。

[0646] (i)交互细胞系统

[0647] 在其中需要研究两个或更多个细胞系统之间的相互作用的某些情况下，可以通过，例如，使第一细胞系统的改变的细胞环境与第二细胞系统接触以影响第二细胞系统的
细胞输出而形成“交互细胞系统”。

[0648] 如本文所用的“交互细胞系统”包含两个或更多个细胞系统，其中至少一个细胞系统的细胞环境接触到第二细胞系统，使得第二细胞系统中至少一个细胞输出被改变或
受影响。在某些实施方式中，交互细胞系统内的细胞系统可以彼此直接接触。在其它实施
方式中，没有细胞系统彼此直接接触。

[0649] 例如，在某些实施方式中，交互细胞系统可以是侵袭实验装置的形式，其中第一细胞系统生长在插入物中和第二细胞系统生长在相应的小室隔间中。该两个细胞系统可
以接触相同的或不同的培养基，并可以交换部分或全部的培养基成分。添加到一个细胞系
统的外部刺激成分可以基本上被一个细胞系统吸收和/或在它有机会扩散到其他细胞系
统之前降解。或者，外部刺激成分最终可以在两个细胞系统内接近或达到平衡。

[0650] 在某些实施方式中，交互细胞系统可采取单独培养的细胞系统的形式，其中各个细胞系统可以有其自身的培养基和/或培养条件(温度、 CO2含量、pH值等)或者类似或相同
的培养条件。可以通过例如，从一个细胞系统获取条件化的培养基并使其与另一个细胞系
统接触来使两个细胞系统形成接触。如果需要的话，也可以在两个细胞系统之间实现直
接的细胞-细胞接触。例如，如果需要的话，可在任何点上共培养两个细胞系统的细胞，且
当至少一个细胞系统中的细胞具有可分选标志物或标记(如稳定表达的荧光标记蛋白
GFP)时，可以随后通过，例如，FACS分选分离共培养的细胞系统。

[0651] 类似地，在某些实施方式中，交互细胞系统可以仅仅是共培养。对一个细胞系统中的细胞的选择性处理可以通过在培养与另一个细胞系统的细胞共培养的处理细胞之
前，首先处理该细胞系统中的细胞来实现。当需要研究，例如，由第一细胞系统受外部刺激成分的刺激后在第一细胞系统中的细胞表面变化引起的对第二细胞系统的效应时，共培
养的交互细胞系统设置可能是有用的。

[0652] 本发明的交互细胞系统特别适合于探索某些预先确定的外部刺激成分对一个或两个细胞系统的细胞输出的影响。这样的刺激物对第一细胞系统(其与刺激物直接接触)
的初级影响可以通过比较在第一细胞系统与外部刺激接触之前和之后的细胞的输出(例
如，蛋白质表达水平)而确定，其如本文所用的可以称为“(显著的)细胞输出差异”。通过第一细胞系统的改变的细胞环境(如其分泌组)介导的这样的刺激物对第二细胞系统的次
生效应也可以类似地测定。可以在具有对第一细胞系统的外部刺激处理的第二细胞系统
的蛋白质组和没有对第一细胞系统的外部刺激处理的第二细胞系统的蛋白质组之间进
行，例如，第二细胞系统的蛋白质组的对比。观察到的任何显著的变化(在蛋白质组或任何
其它目标细胞输出中)可被称为“显著的细胞交互差异”。

[0653] 在进行细胞输出测量(如蛋白质表达)中，可使用绝对表达量或相对表达水平。例如，为测定第二细胞系统的相对蛋白质表达水平，第二细胞系统中任何给定的蛋白质的量
(有或没有对第一细胞系统的外部刺激)可以与合适的对照细胞系和细胞系的混合物对
比，并给出倍数增加或倍数减少值。可以使用对于这种倍数增加(例如，至少1.2、 1.3、
1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、4.5、5、6、 7、8、9、10、15、20、25、30、35、40、45、
50、75或100或更多倍增加)或倍数减少(例如，至少0.95、0.9、0.8、0.75、0.7、0.6、 0.5、
0.45、0.4、0.35、0.3、0.25、0.2、0.15、0.1或0.05倍，或90 ％、80％、75％、70％、65％、60％、
55％、50％、45％、40％、35 ％、30％、25％、20％、15％、10％或5％或更少的减少)的预先确定的阈值水平来选择显著的细胞交互差异。在前述列表中给出的所有值也可以是范围的
上限或下限，例如，在1.5至5倍之间、在2至10 倍之间、在1至2倍之间或在0.9至0.7倍之间，其意图属于本发明的部分。

[0654] 在整个本申请中，在列表中显示的所有值，例如，如上述的那些，也可以是意图属于本发明的部分的范围的范围的上限或下限。

[0655] 为了进行说明，在建立用来模仿心血管疾病模型的方面的一个示例性的两细胞系统中，可以用缺氧条件(外部刺激成分)处理心平滑肌细胞系(第一细胞系统)，且可以使
用常规的定量质谱法测定将肾细胞与心平滑肌的条件化培养基接触导致的肾细胞系(第
二细胞系统)中蛋白质组变化。在与适当的对照(例如，与来自没有经过缺氧条件处理的
类似培养的心平滑肌细胞的条件化培养基接触的类似培养的肾细胞)相比较的基础上，可
以确定这些肾细胞中显著的细胞交互差异。

[0656] 并不是每一个观察到的显著的细胞交互差异都可以具有有生物学意义。对于应用所述探询式生物学评估的任何给定的生物系统，一些(或者可能全部)显著的细胞交互
差异对于讨论的特定生物学问题可能是“确定性的”，例如，引起疾病状态的原因(治疗性
干预的潜在靶标)，或者作为疾病状态的生物标志物(潜在的诊断或预后因子)。

[0657] 这样的确定性交互差异可以由所述方法的最终用户进行选择，或者它可以通过生物信息学软件程序，如DAVID可执行的比较途径分析程序或KEGG通路分析程序选择。在
某些实施方式中，使用一个以上的生物信息学软件程序，且来自两个或更多个生物信息学
软件程序的一致结果是优选的。

[0658] 如本文所用的，细胞输出“差异”包括细胞输出中的任何一种或多种参数的差异(例如，提高或降低的水平)。例如，就蛋白质表达水平而言，两个细胞输出之间的差异可以通过使用本领域公认的技术，如基于质谱的分析(例如，iTRAQ、2D-LC-MS-MS等)测量和定
量，例如，与外部刺激成分处理之前和之后的细胞系统相关的输出。

[0659] (ii)癌症特异性模型

[0660] 生物系统或过程的实例是癌症。像任何其他复杂的生物学过程或系统一样，癌症是复杂的病理状态，其特征在于多个独特的方面。例如，由于其高生长速率，许多癌细胞适应于在缺氧条件下生长，具有上调的糖酵解和降低的氧化磷酸化代谢途径。其结果是，与
正常细胞对相同处理的反应相比，癌细胞可以对环境的扰动(例如潜在药物的治疗)有不
同的反应。因此，破译癌症与正常细胞的反应相比独特的对药物治疗的反应是有意义的。
为此，可以通过选择合适的癌细胞系和建立仿真疾病状态或过程的特征性方面的细胞培
养条件来建立定制的癌症模型以模拟癌细胞的环境，例如，在体内的肿瘤中。例如，可以
选择密切近似于癌细胞在体内肿瘤环境中的状态的细胞培养条件，或通过分离癌细胞的
不同生长条件模仿癌生长的各个方面。

[0661] 相同的或不同起源的多种癌细胞(例如，癌细胞系PaCa2、HepG2、 PC3和MCF7)而不是单一的癌细胞类型可以被包括在癌症模型中。在一个实施方式中，至少2、3、4、5、6、7、8、
9、10、11、12、13、 14、15、16、17、18、19、20、25、30、35、40、45、50种或更多种不同的癌症细胞系或癌症细胞类型被包括在癌症模型中。在前述列表中给出的所有值也可以是范围的
上限或下限，其意图属于本发明的部分，例如，1至5、1至10、2至5或5至15个之间的不同癌症细胞系或细胞类型。

[0662] 在一个实施方式中，癌细胞都是相同的类型，例如，全部乳腺癌细胞，但是为确立的不同细胞系，例如，乳腺癌的确立的不同细胞系。

[0663] 可以被包括在癌症模型中的癌症细胞类型的实例包括，但不限于，肺癌、乳腺癌、前列腺癌、黑色素瘤、鳞状细胞癌、结肠直肠癌、胰腺癌、甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体肿瘤、白血病、非霍奇金淋巴瘤。在一个实施方式中，药物抗性的癌细胞可被包括在癌症模型中。可以被包括在癌症模型中的细胞系的具体实例包括但不限于，PaCa2、
HepG2、PC3和MCF7细胞。众多的癌细胞系在本领域中是已知的，并且任何这样的癌细胞系
可以被包括在本发明的癌症模型中。

[0664] 本发明的细胞模型可以包括一种或多种“对照细胞”。在一个实施方式中，对照细胞可以是未处理的或未扰动的癌细胞。在另一个实施方式中，“对照细胞”可以是正常的非癌性细胞。许多正常的非癌性细胞系中的任何一种可以被包括在细胞模型中。在一个实施
方式中，正常细胞是THLE2和HDFa细胞中的一种或多种。在一个实施方式中，至少1、2、3、
4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、25、30、35、40、45、50种或更多种不同的正常细胞类型被包括在癌症模型中。在前述列表中给出的所有值也可以是意图属于本
发明的部分的范围的上限或下限，例如，1至5、1至 10、2至5或5至15个不同的正常细胞系或细胞类型。在一个实施方式中，正常细胞全都是相同的类型，例如，所有健康的上皮细胞或乳腺细胞，但是为确立的不同细胞系，例如，上皮细胞或乳腺细胞的确立的不同细胞系。
在一个实施方式中，作为对照，一种或多种正常的非癌性细胞系(例如，THLE2和HDFa)被培
养在与细胞模型的癌细胞类似的条件下和/或暴露于相同的扰动，以便确定癌症特有的蛋
白质或途径。

[0665] 定制的癌症模型也可以包含模仿癌性状态或过程的特征性方面的细胞培养条件。例如，可以选择密切近似癌细胞在体内肿瘤环境中的状态的细胞培养条件，或通过分
离癌细胞的不同生长条件而模拟癌生长的各个方面。在某些情况下，细胞培养条件是应激
状态。

[0666] 一种这样的癌症“环境”或应激条件是缺氧，一种通常在实体肿瘤内发现的状态。可以使用本领域公认的方法在细胞中诱导缺氧。例如，缺氧可以通过将细胞系统置于模块
化培养箱(MIC-101, Billups-Rothenberg Inc.Del Mar,CA)中诱导，该培养箱可以充满含
5 ％CO2、2％O2和93％氮的工业气体混合物。可以在预定的时间后，如在缺氧处理后24小时时，在具有或没有另外的外部刺激成分(例如，0、50或100μM的辅酶Q10)的情况下测量其效应。

[0667] 同样，细胞的乳酸处理模仿其中糖酵解活性高的细胞环境，如存在于体内肿瘤环境中一样。可以在预先确定的时间，例如，在24小时时，在具有或没有另外的外部刺激成分(例如，0、50或100μM 的辅酶Q10)的情况下在约12.5mM的最终乳酸浓度下研究乳酸诱导的
应激。

[0668] 高血糖症是通常见于糖尿病中的状态，然而，高血糖也在一定程度上模拟癌生长的一个方面，因为许多癌细胞依赖于葡萄糖作为其主要的能量来源。将所述细胞暴露于典
型的高血糖条件可包括向合适的培养基加入10％的培养级葡萄糖，以使得培养基中葡萄
糖的终浓度为约22mM。

[0669] 可以在定制的癌症模型中单独地研究反映癌生长的不同方面的单个条件，和/或可以结合在一起研究。在一个实施方式中，在定制的癌模型中研究至少2、3、4、5、6、7、8、9、
10、15、20、25、30、 40、50或更多种反映或模拟不同的癌生长方面/条件的条件的组合。在一个实施方式中，在定制的癌模型中研究反映或模拟不同的癌生长方面/条件的单个条件
和另外地至少2、3、4、5、6、7、8、9、10、 15、20、25、30、40、50或更多个条件的组合。在前述列表中给出的所有值也可以是范围的上限或下限，其意图属于本发明的部分，例如， 1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、 5至20、10至20、10至25、10至30或10至50个不同的条件。

[0670] 一旦定制细胞模型建立，可以将一种或多种“扰动”应用于系统，如病人与病人之间的遗传变异，或有/没有某些药物或前药的治疗。见图15D。可以使用各种本领域公认的
或专有的手段测量这种扰动对系统的影响，包括对疾病相关癌症细胞和疾病相关的正常
对照细胞的影响，如下文III.B节中所描述的。

[0671] 在示例性的实验中，癌细胞系PaCa2、HepG2、PC3和MCF7及正常细胞系THLE2和HDFa在高血糖、缺氧和富乳酸条件中各种条件中以及在这些条件的两种或三种的所有组
合中，且在另外具有或没有环境扰动(特别是辅酶Q10的治疗)的情况下条件化。本文下面
列出的是条件的这种示例性组合，有或没有扰动(辅酶Q10处理)，其可用于处理癌症细胞
模型中的癌细胞和/或对照(例如，正常)细胞。根据所进行的特定探询式生物学评估，可以
很容易地得到其它组合。

[0672] 1、仅培养基

[0673] 2、50μM CTL辅酶Q10(CoQ10)

[0674] 3、100μM CTL辅酶Q10

[0675] 4、12.5mM的乳酸

[0676] 5、12.5mM的乳酸+50μM CTL辅酶Q10

[0677] 6、12.5mM的乳酸+100μM CTL辅酶Q10

[0678] 7、缺氧

[0679] 8、缺氧+50μM CTL辅酶Q10

[0680] 9、缺氧+100μM CTL辅酶Q10

[0681] 10、缺氧+12.5mM乳酸

[0682] 11、缺氧+12.5mM乳酸+50μM CTL辅酶Q10

[0683] 12、缺氧+12.5mM乳酸+100μM CTL辅酶Q10

[0684] 13、培养基+22mM葡萄糖

[0685] 14、50μM CTL辅酶Q10+22mM葡萄糖

[0686] 15、100μM CTL辅酶Q10+22mM葡萄糖

[0687] 16、12.5mM的乳酸+22mM葡萄糖

[0688] 17、12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10

[0689] 18、12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10

[0690] 19、缺氧+22mM葡萄糖

[0691] 20、缺氧+22mM葡萄糖+50μM CTL辅酶Q10

[0692] 21、缺氧+22mM葡萄糖+100μM CTL辅酶Q10

[0693] 22、缺氧+12.5mM乳酸+22mM葡萄糖

[0694] 23、缺氧+12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10

[0695] 24、缺氧+12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10

[0696] 在某些情况下，也可以几种相关联的目的进行不同癌细胞(例如， HepG2和PaCa2)之间的交互式或ECS实验。在一些涉及交互的实施方式中，设计在细胞模型上进行的实验
以确定在确定的处理条件 (例如，高血糖、缺氧(缺血))下，另一个细胞系统或群体(例如，胰腺癌PaCa2)对细胞系统或群体(例如，肝癌细胞HepG2)的细胞状态或功能的调节。根据
典型的设置，第一细胞系统/群体与外部刺激成分接触，如候选分子(例如，小的药物分子、蛋白质)或候选条件 (例如，缺氧、高葡萄糖环境)。作为回应，第一细胞系统/群体改变其
转录组、蛋白质组、代谢组和/或相互作用组，从而导致可以很容易地在细胞内和外检测的
变化。例如，转录组的变化可以通过多个目标 mRNA的转录水平测定；蛋白质组的变化可以
通过多个目标蛋白质的表达水平测量；以及可以通过对于给定代谢物特别设计的分析通
过多个目标代谢物的水平测量代谢组的变化。可选地，上述所指的代谢组和/或蛋白质组
的变化，至少对于某些分泌的代谢物或蛋白质，也可以通过他们对第二细胞系统/群体的
效应(包括对第二细胞系统/群体的转录组、蛋白质组、代谢组和相互作用组的调节)测量。
因此，该实验可用于确定第一细胞系统/群体分泌的目标分子在不同处理条件下对第二
细胞系统/群体的效应。该实验也可以通过，例如，蛋白质组的差分筛选用来鉴别作为从第
一细胞系统(响应于外部刺激成分处理) 到另一个细胞系统的信号传导的结果而调节的任
何蛋白质。相同的实验设置也可以适应于反向设置，以使得也可以评估两个细胞系统间的
相互效应。通常，对于这种类型的实验，细胞系对的选择主要是基于例如起源、疾病状态和细胞功能的因素。

[0697] 虽然双细胞系统通常包括在这种类型的实验设置中，类似的实验也可以被设计用于两个以上的细胞系统，通过例如在单独的固相支持物上固定各个不同的细胞系统。

[0698] 定制的癌症模型可以建立并用在本发明的平台技术的整个步骤中以通过实施本文中所描述的步骤最终确定在生物系统中独特的因果关系。但是，本领域技术人员能理
解，例如，通过引入另外的癌或正常细胞系和/或另外的癌症条件，用来生成初始的“第一
代”一致因果关系网络的定制癌症模型可以随着时间不断地进化或扩展。来自进化的癌
症模型的另外的数据，即来自癌症模型的新增加部分的数据，可以被收集。然后可以将从
扩展或进化的癌症模型(即，从癌症模型的新增加部分)收集的新数据引入先前用来生成
“第一代”一致因果关系网的数据集中，以便生成更稳定的“第二代”一致因果关系网络。然后可以从第二代”一致因果关系网络鉴别癌症状态独特的(或对于癌症状态对扰动的响
应独特的)新因果关系。以这种方式，癌症模型的进化提供了一致因果关系网络的进化，从
而提供新的和/或更可靠的对癌症状态的确定性驱动子(或调节子)的理解。

[0699] (iii)糖尿病/肥胖症/心血管疾病细胞模型

[0700] 生物系统或过程的其它实例是糖尿病、肥胖症和心血管疾病。与癌症一样，糖尿病、肥胖症、心血管疾病的相关疾病状态是复杂的病理状态，其特征在于多个独特的方面。
确定驱动糖尿病/肥胖症/心血管疾病的疾病发生的蛋白质/途径是有意义的。破译与糖尿
病/肥胖症/ 心血管疾病相关的细胞相比于正常细胞反应的对药物治疗的独特反应是有
意义的。为此，可以通过选择合适的细胞系和建立仿真疾病状态或过程的特征性方面的细
胞培养条件来建立定制的糖尿病/肥胖症/ 心血管疾病模型以模拟疾病相关细胞所经历的
环境。例如，可以选择密切近似于高血糖、高血脂、高胰岛素血、缺氧或富乳酸条件的细胞培养条件。

[0701] 与糖尿病/肥胖症/心血管疾病有关的任何细胞都可以包括在糖尿病/肥胖症/心血管疾病模型中。与糖尿病/肥胖症/心血管疾病相关的细胞的实例包括，例如，脂肪细胞、肌管、肝细胞、主动脉平滑肌细胞 (HASMC)和近端肾小管上皮细胞(例如，HK2)。相同或不同起源的多种细胞类型，而不是单一细胞类型，可包括在糖尿病/肥胖症/ 心血管疾病模型
中。在一个实施方式中，至少2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、25、
30、35、 40、45、50种或更多种不同的细胞类型被包括在糖尿病/肥胖症/心血管疾病模型
中。在前述列表中给出的所有值也可以是范围的上限或下限，其意图属于本发明的部分，
例如，1至5、1至10、2至5或5 至15种不同细胞类型。在一个实施方式中，细胞都是相同类型的，例如，全部是脂肪细胞，但是属于已确立的不同细胞系，例如，确立的不同脂肪细胞
系。糖尿病/肥胖症/心血管疾病状态中所涉及的众多的其他细胞类型在本领域中是已知
的，且任何这样的细胞可以被包括在本发明的糖尿病/肥胖症/心血管疾病模型中。

[0702] 本发明的糖尿病/肥胖症/心血管疾病细胞模型可包括一种或多种 “对照细胞”。在一个实施方式中，对照细胞可以是未处理的或未扰动的疾病相关细胞，例如，未暴露于
高血脂或高胰岛素条件的细胞。在另一个实施方式中，“对照细胞”可以是非疾病相关细
胞，如上皮细胞。许多非疾病相关细胞中的任一种可以被包括在细胞模型中。在一个实施
方式中，至少2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、25、30、35、40、45、
50种或更多种不同的非疾病相关细胞类型被包括在细胞模型中。在前述列表中给出的所
有值也可以是意图属于本发明的部分的范围的上限或下限，例如，1 至5、1至10、2至5或5至
15种不同的非疾病相关细胞系或细胞类型。在一个实施方式中，非疾病相关细胞都是相同
的类型，例如，全部健康的上皮细胞或乳腺细胞，但是属于已确立的不同细胞系，例如，上皮细胞或乳腺细胞的确立的不同细胞系。在一个实施方式中，作为对照，一个或多个非疾
病相关细胞系被培养在与细胞模型的疾病相关细胞类似的条件下，和/或暴露于相同的扰
动，以便确定糖尿病/肥胖症/心血管疾病独特的蛋白质或途径。

[0703] 定制的糖尿病/肥胖症/心血管疾病模型也可以包括模仿糖尿病/肥胖症/心血管疾病的状态或过程的特征性方面(代表其病理生理)的细胞培养条件。例如，可以选择密切
近似于糖尿病/肥胖症/心血管疾病相关细胞在体内环境中的状态的细胞培养条件，或模
仿糖尿病/肥胖症 /心血管疾病的各个方面的状态。在某些情况下，细胞培养条件是应激
条件。

[0704] 代表糖尿病/肥胖症/心血管疾病的病理生理的示例性条件包括，例如，缺氧、富乳酸条件、高血糖、高血脂和高胰岛素血中的任何一个或多个。可以使用本领域公认的方
法在细胞中诱导缺氧。例如，缺氧可以通过将细胞系统置于模块化培养箱(MIC-101,
Billups-Rothenberg Inc.Del Mar,CA)中诱导，该培养箱可以充满含5 ％CO2、2％O2和93％
氮的工业气体混合物。可以在预定的时间后，如在缺氧处理后24小时时，在具有或没有额
外的外部刺激成分(例如，0、50或100μM的辅酶Q10)的情况下，测量其效应。

[0705] 同样，细胞的乳酸处理模仿糖酵解活性高的细胞环境。可以在预定的时间，例如，在24小时时，在具有或不具有额外的外部刺激成分(例如，0、50或100μM的辅酶Q10)的情况下，在约12.5mM 的最终乳酸浓度下研究乳酸诱导的应激。高血糖是通常见于糖尿病的状
态。将所述细胞暴露于典型的高血糖条件可包括向合适的培养基加入10％的培养级葡萄
糖，使得培养基中葡萄糖的终浓度为约22mM。高脂血症是在肥胖症和心血管疾病中存在的
状态。可以通过在含有 0.15mM棕榈酸钠的培养基中培养细胞来提供高血脂状态。高胰岛素
血症是在糖尿病中发现的状态。可以通过在含有1000nM的胰岛素的培养基中培养细胞诱
导高胰岛素状态。

[0706] 表示糖尿病/肥胖症/心血管疾病的病理生理的另外的条件包括，例如，炎症、内质网应激、线粒体应激和过氧化物酶体应激中的任何一个或多个。在细胞中建立炎症样状
态的方法在本领域中是已知的。例如，可以通过在TNFα和/或IL-6存在下培养细胞模拟炎
症状态。用于建立模拟内质网应激的状态的方法在本领域中也是已知的。例如，可以通过
在毒胡萝卜素和/或衣霉素存在下培养细胞建立模拟内质网应激的状态。用于建立模拟线
粒体应激的方法在本领域中也是已知的。例如，可以通过在雷帕霉素和/或半乳糖存在下
培养细胞建立模拟线粒体应激的状态。用于建立模拟过氧化物酶体应激的方法在本领域
中也是已知的。例如，可以通过在脱落酸存在下培养细胞建立模拟过氧化物酶体应激的状
态。

[0707] 可以在定制的糖尿病/肥胖症/心血管疾病模型中单独研究反映糖尿病/肥胖症/心血管疾病的不同方面的单个条件，和/或可以结合在一起研究。在一个实施方式中，在定
制的糖尿病/肥胖症/心血管疾病模型中研究至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、
50或更多种反映或模拟糖尿病/肥胖症/心血管疾病的不同方面的条件的组合。在一个实
施方式中，在定制的糖尿病/肥胖症/心血管疾病模型中研究反映或模拟糖尿病/肥胖症/
心血管疾病的不同方面的单个条件，和另外地，至少2、3、4、5、6、7、8、9、10、15、20、25、30、
40、50或更多个条件的组合。在前述列表中给出的所有值也可以是范围的上限或下限，该
范围意图属于本发明的部分，例如，1至5、1 至10、1至20、1至30、2至5、2至10、5至10、1至20、
5至20、 10至20、10至25、10至30或10至50个不同的条件。

[0708] 一旦建立定制的细胞模型，可以将一种或多种“扰动”应用于系统，如病人与病人之间的遗传变异或有/没有某些药物或前药的治疗。见图15D。可以使用各种本领域认可的
或专有的手段测量这种扰动对系统的影响，包括对糖尿病/肥胖症/心血管疾病相关细胞
的影响，如在下文的III.B节中所描述的。

[0709] 在示例性的实验中，将脂肪细胞、肌管、肝细胞、主动脉平滑肌细胞(HASMC)和近端肾小管细胞(HK2)各自在高血糖、缺氧、高血脂、高胰岛素血和富乳酸条件的各种条件
下，以及在两种、三种、四种和所有五种条件的所有组合中，以及另外有或没有环境扰动
(特别是辅酶Q10的治疗)的情况下条件化。除了在癌模型的上下文中描述的条件的示例
性组合，本文以下列出的是另外的一些示例性的条件组合，有或没有可用于处理糖尿病/
肥胖症/心血管疾病模型的糖尿病/ 肥胖症/心血管疾病相关细胞(和/或对照细胞)的扰
动，例如辅酶Q10 的治疗。这些仅仅意图是示例性的，本领域技术人员将会理解，代表糖尿病/肥胖症/心血管疾病的病理生理的任何单个的上述条件和/或组合可以用在细胞模型
中以产生输出数据集。根据进行的具体探询式生物学评估，可以很容易地制订其它组合。

[0710] 1、仅培养基

[0711] 2、50μM CTL辅酶Q10(CoQ10)

[0712] 3、100μM CTL辅酶Q10

[0713] 4、0.15mM棕榈酸钠

[0714] 5、0.15mM棕榈酸钠+50μM CTL辅酶Q10

[0715] 6、0.15mM棕榈酸钠+100μM CTL辅酶Q10

[0716] 7、1000nM胰岛素

[0717] 8、1000nM胰岛素+50μM CTL辅酶Q10

[0718] 9、1000nM胰岛素+100μM CTL辅酶Q10

[0719] 10、1000nM胰岛素+0.15mM棕榈酸钠

[0720] 11、1000nM胰岛素+0.15mM棕榈酸钠+50μM CTL辅酶Q10

[0721] 12、1000nM胰岛素+0.15mM棕榈酸钠+100μM CTL辅酶Q10

[0722] 在某些情况下，也可以为了几种相关的目的在不同的疾病相关细胞(例如，HASMC和HK2细胞或者肝细胞和脂肪细胞)之间进行交互式或ECS实验。在一些涉及交互的实施方
式中，设计了在细胞模型上进行的实验以确定在明确的处理条件(例如，高血糖、缺氧、高血脂、高胰岛素)下，另一个细胞系统或群体(例如，脂肪细胞)对一个细胞系统或群体(如
肝细胞)的细胞状态或功能的调节。根据典型的设置，第一细胞系统/群体与外部刺激成分
接触，如候选分子(例如，小的药物分子、蛋白质)或候选条件(例如，缺氧、高糖环境)。作为响应，第一细胞系统/群体改变其转录组、蛋白质组、代谢组和/ 或相互作用组，从而导致可以很容易地在细胞内和细胞外检测的变化。例如，转录组的变化可以通过多个目标mRNA
的转录水平测量；蛋白质组的变化可以通过多个目标蛋白质的表达水平测量；代谢组的
变化以及可以通过对给定代谢物特别设计的分析根据多个目标代谢物的水平测量。可选
地，上述所指的代谢组和/或蛋白质组的变化，至少关于某些分泌的代谢物或蛋白质，也可
以通过他们对第二细胞系统 /群体的影响测量，包括第二细胞系统/群体的转录组、蛋白质
组、代谢组和相互作用组的调节。因此，该实验可用于确定第一细胞系统/ 群体分泌的目
标分子在不同处理条件下对第二细胞系统/群体的影响。该实验也可以通过，例如，蛋白质
组学的差异筛选来鉴别作为从第一细胞系统(响应于外部刺激成分处理)对另一细胞系统
的信号传导的结果而调节的任何蛋白质。相同实验设置也可以适应于反向设置，以至于
也可以评估两个细胞系统间的相互影响。通常，对于这种类型的实验，细胞系对的选择主
要是基于如起源、疾病状态和细胞功能的因素。

[0723] 虽然双细胞系统通常包括在这种类型的实验设置中，但类似的实验也可以被设计用于两个以上的细胞系统，例如通过在单独的固相支持物上固定各个不同的细胞系统。

[0724] 通过实施本文中所描述的步骤，定制的糖尿病/肥胖症/心血管疾病模型可以在本发明的平台技术的整个步骤中建立和使用以最终确定对于糖尿病/肥胖症/心血管疾病
状态独特的因果关系。但是，本领域技术人员能理解，正如癌症模型一样，用来生成初始的“第一代”一致因果关系网络的定制糖尿病/肥胖症/心血管疾病模型可以随着时间不断
地进化或扩展，例如，通过引入另外的疾病相关细胞系和/或另外的疾病相关条件。来自进
化的糖尿病/肥胖症/心血管疾病模型的另外的数据，即来自癌症模型的新增加部分的数
据，可以被收集。然后可以将来自扩展或进化的模型，即，来自模型的新增加的部分的新数据引入先前用来生成“第一代”一致因果关系网络的数据集中，以便产生更稳定的“第二
代”一致因果关系网络。然后可以从“第二代”一致因果关系网络确定对于糖尿病/肥胖症/心血管疾病状态独特的(或对于糖尿病/肥胖症/心血管疾病状态对扰动的响应独特的)新
因果关系。以这种方式，糖尿病/肥胖症/心血管疾病模型的进化提供了一致因果关系网
络的进化，从而提供新的和/或更可靠的对于糖尿病/肥胖症/心血管疾病状态的确定性驱
动子(或调节子)的认识。

[0725] B、细胞模型用于探询式生物学评估的用途

[0726] 在本发明中提供的方法和细胞模型可用于或应用于多种“探询式生物学评估”。本发明的用于探询式生物学评估的方法的使用有利于生物系统的“调节子”或确定性细胞
过程“驱动子”的鉴别。

[0727] 如本文所用的，“探询式生物学评估”可包括鉴别生物系统的一个或多个调节子，例如，与环境扰动或外部刺激成分相关的确定性的细胞过程“驱动子”(例如，生物途径的
活性的提高或降低，或者途径的主要成员，或途径成员的主要调节子)，或者确定生物系统
或过程中独特的因果关系。它可以进一步包括设计用于测试或验证所鉴别的确定性细胞
过程驱动子对于与环境扰动或外部刺激成分相关的下游事件是否是必要和/或充分的额
外步骤，包括体内动物模型和/或体外组织培养实验。

[0728] 在某些实施方式中，探询式生物学评估是疾病状态的诊断或分期，其中鉴别的生物系统的调节子，例如确定性的细胞过程驱动子(例如，生物系统或过程中的交互差异或
独特的因果关系)代表可经历治疗干预的疾病标志物或者治疗靶标。所述的探询式生物学
评估在理论上适合于任何疾病状况，但可能发现在如肿瘤/癌症生物学、糖尿病、肥胖症、心血管疾病和神经系统疾病(尤其是神经退行性疾病，例如但不限于，阿尔茨海默氏病、帕
金森氏病、亨廷顿氏病、肌萎缩性脊髓侧索硬化症(ALS)和衰老相关的神经退行性疾病)的
领域中特别有用。

[0729] 在某些实施方式中，探询式生物学评估是对药物疗效的确定，其中确定的生物系统调节子，例如，确定性的细胞过程驱动子(例如，生物系统或过程中的交互差异或独特的
因果关系)可以是成功的药物的标志，并可以相应地用于鉴别用于治疗相同疾病状态的另
外的药剂，如MIM或表观代谢转变剂。

[0730] 在某些实施方式中，探询式生物学评估是鉴别用于预防或治疗感染(例如，细菌或病毒感染)的药物靶标，其中所鉴别的确定性细胞过程驱动子(例如，生物系统或过程中
的细胞交互差异或独特的因果关系)可以是引起感染状态的标志物/指示剂或关键的生物
分子，且可以相应地被用来鉴别抗感染剂。

[0731] 在某些实施方式中，探询式生物学评估是药剂(例如，药物)对给定疾病谱的分子效应的评价，其中鉴别的生物系统的调节子，例如确定性的细胞过程驱动子(例如，生物系
统或过程中的细胞交互差异或独特的因果关系)，可以是一个或多个生物途径的活性提高
或降低，或者途径的关键成员，或途径成员的关键调节子，且可相应地用于，例如，预测药剂对于给定疾病的疗效。

[0732] 在某些实施方式中，探询式生物学评估是药剂(例如，药物)对细胞、组织、器官或有机体的毒理特性的评价，其中鉴别的生物系统的调节子，例如确定性的细胞过程驱动子
(例如，生物系统或过程中的细胞交互差异或独特的因果关系)，可以是毒性(例如，细胞毒
性) 的指示物，且可以相应地被用来预测或确定试剂的毒理特性。在一个实施方式中，鉴
别的生物系统的调节子，例如确定性的细胞过程驱动子(例如，生物系统或过程中的细胞
交互差异或独特的因果关系)是药物或药物候选者的心脏毒性的指示物，并可相应地用来
预测或确定药物或药物候选者的心脏毒性特性。

[0733] 在某些实施方式中，探询式生物学评估是用于预防或治疗由生物武器(如导致疾病的原生动物、真菌、细菌、病菌、病毒或毒素)引起的疾病或病症的药物靶标的鉴定，其中鉴别的生物系统调节子，例如，确定性的细胞过程驱动子(例如，生物系统或过程中的细胞
交互差异或独特的因果关系)可以是所述疾病或病症的标志物/指示剂或引起所述疾病
或病症的关键生物分子，且可以相应地用于鉴别生物防御剂。

[0734] 在某些实施方式中，探询生物评价是鉴别用于抗老化剂(如抗老化化妆品)的靶标，其中鉴别的生物系统调节子，例如，确定性的细胞过程驱动子(例如，生物系统或过程
中的细胞交互差异或独特的因果关系)可以是老化过程的标志物或指示剂，特别是皮肤的
老化过程，并可以相应地用于鉴别抗老化剂。

[0735] 在用于本发明方法中用来鉴别用于抗衰老化妆品的靶标的一个示例性的老化细胞模型中，该细胞模型包含老化的上皮细胞(其例如用UV光处理(环境扰动或外部刺激成
分))和/或新生细胞(其也任选地用UV光处理)。在一个实施方式中，用于老化的细胞模型
包含细胞交互系统。在一个为了鉴别抗衰老化妆品的靶标而建立的示例性的双细胞交互
系统中，可以用UV光(外部刺激成分)处理老化的上皮细胞(第一细胞系统)，和可以测量将
新生细胞(第二细胞系统) 中由于与处理的老化上皮细胞的条件化培养基相接触而产生的
新生细胞的变化，例如，蛋白质组和/或功能变化，例如，可以使用常规的定量质谱法测定蛋白质组的变化，或者可以从由数据生成的因果关系网络中确定老化的独特的因果关系。

[0736] V.蛋白质组学样品分析

[0737] 在某些实施方式中，所述方法采用具有相似性质的数百个样品的大规模高通量定量蛋白质组学分析，并提供确定细胞输出差异所需的数据。

[0738] 有许多本领域认可的技术适合于这一目的。下面简要地介绍一个示例性的技术，与质谱相结合的iTRAQ分析。

[0739] 为了用iTRAQ技术提供用于相对定量的参比样品，创建了多个 QC池。从Cell#1和Cell#2样品产生由各个样品的等分试样组成的两个独立的QC池，这些样品对于上清液和
沉淀分别记为QCS1和 QCS2及QCP1和QCP2。为了允许在两个细胞系间进行蛋白质浓度比
较，来自如上所述的QC池的细胞沉淀等份试样以等体积混合以产生参比样品(QCP)。

[0740] 定量蛋白质组学方法是基于用8-重iTRAQ试剂的稳定同位素标记和用于肽识别和定量的2D-LC MALDI MS/MS。使用这种技术的定量是相对的：肽和蛋白质被赋予相对于
参比样品的丰度比率。多重 iTRAQ实验中的共同参比样品有助于多个iTRAQ实验之间的样
品的比较。

[0741] 要实施这个分析方案，根据制造商的说明，将6个原始样品和两个对照池样品组合成8-重iTRAQ混合物，对照池样品用113和117 试剂标记。然后，将这一8样品的混合物通
过二维液相色谱法分离；第一维度中的强阳离子交换(SCX)和第二维度中的反相HPLC。将
HPLC洗脱液直接分馏到MALDI板上，并在MDS SCIEX/AB 4800 MALDI TOF/TOF质谱仪分析上
分析该板。

[0742] 在没有附加信息的情况下，假定蛋白质表达中的最重要变化是在不同处理条件下的相同细胞类型内的那些变化。出于这个原因，在单独的iTRAQ混合物中对来自Cell#1
和Cell#2的原始样品进行分析。为了便于比较Cell#1与Cell#2样品中的蛋白质表达，在没
被原始或细胞系特异性的QC样品(QC1和QC2)占用的可用“iTRAQ槽” 中分析通用QCP样品。

[0743] 本文提供使用的实验室程序的简要概述。

[0744] A、从细胞上清液样品提取蛋白质

[0745] 对于细胞上清液样品(CSN)，培养基的蛋白质的存在量大大超过由培养的细胞所分泌的蛋白质。为了试图降低这一背景，实施丰富蛋白质的前期耗减。由于没有可用于牛
或马血清蛋白质的特定亲和柱，因此使用了抗-人IgY14柱。尽管抗体是针对人蛋白质的，
但预计由该抗体的多克隆性质所提供的广谱特异性以完成存在于所使用的细胞培养基
中的牛和马蛋白质的耗减。

[0746] 在研究开始之前，在10毫升IgY14耗减柱上加载200μl等分的 CSN QC材料以测定流过材料中的总蛋白质浓度(二喹啉甲酸(BCA) 分析)。然后选择加载体积以实现含约40μg
总蛋白质的贫化级分。

[0747] B、从细胞沉淀提取蛋白质

[0748] Cell#1和Cell#2的等份试样在用于BGM的组织样品分析的“标准”裂解缓冲液中裂解，并通过BCA法测定总蛋白质含量。在确定了这些代表性细胞裂解物的蛋白质含量后，
将所有的细胞沉淀样品(包括1.1节中所描述的QC样品)处理成细胞裂解物。将约40μg总蛋
白质的裂解物量在处理流程中继续。

[0749] C、用于质谱的样品制备

[0750] 样品制备遵循标准操作程序，并由如下构成：

[0751] ·蛋白质的还原和烷基化

[0752] ·反相柱上的蛋白质清洁(仅细胞沉淀)

[0753] ·用胰蛋白酶消化

[0754] ·iTRAQ标记

[0755] ·强阳离子交换色谱-六个级分的收集(Agilent 1200系统)

[0756] ·HPLC分离和点样至MALDI板(Dionex Ultimate3000/Probot系统)

[0757] D、MALDI MS和MS/MS

[0758] HPLC-MS通常采用在线ESI MS/MS策略。BG Medicine使用离线的LC-MALDI MS/MS平台，其导致在原始样品间观察到的蛋白质集合的更好的一致性，而不需要注射同一样品
多次。在所有iTRAQ 混合物第一手数据收集之后，因为肽部分保留在MALDI目标板上，可以
第二次使用定向的MS/MS采集模式(其来自在第一次采集中获得的知识)分析样品。以这种
方式，完成所有识别的蛋白质的最大观测频率(理想情况下，应当在每一个iTRAQ混合中测
量每一个蛋白质)。

[0759] E、数据处理

[0760] 在BGM蛋白质组学工作流程内的数据处理过程可以被分成如初步肽识别和定量的那些程序(其对于每个iTRAQ混合物单独地完成) (1.5.1节)和如将肽最终分配至蛋白质
和蛋白质的最后定量的那些过程(其直到项目数据采集完成时才完成)(1.5.2节)。

[0761] BGM蛋白质组学工作流程中的主要数据处理步骤是：

[0762] ·使用Mascot(Matrix Sciences)数据库搜索引擎识别肽

[0763] ·Mascot ID的自动内部验证

[0764] ·肽的定量和蛋白质的初步定量

[0765] ·最终数据集的专家监护

[0766] ·使用自动化PVT工具最终分配各个混合物的肽到一组共同的蛋白质中

[0767] ·消除离群点和蛋白质的最终定量

[0768] (i)单个iTRAQ混合物的数据处理

[0769] 由于各个iTRAQ混合物是通过工作流程处理的，MS/MS谱使用专有的BGM软件工具分析以用于肽和蛋白质的鉴别以及定量信息的初步评估。基于这一初步分析的结果，针对
一组BGM性能量度来判断用于混合物中各原始样品的工作流程的质量。如果给定的样品
(或混合物)没通过指定的最小性能量度，且可获得另外的材料，该样品以其整体重复，且
它是被并入最后的数据集中的来自该二次实施的工作流程的数据。

[0770] (ii)肽识别

[0771] MS/MS谱针对包含被常见的污染序列(如猪胰蛋白酶)增强的人、牛、马序列的UniProt蛋白质序列数据库进行检索。在表3中给出了 Mascot检索参数的细节，包括修饰的
完整列表。

[0772] 表3：Mascot检索参数

[0773]

[0774]

[0775] Mascot检索完成后，使用自动验证程序来促进(即验证)特定 Mascot肽匹配。有效和无效匹配之间的区分是基于相对于预期的 Mascot得分达到的Mascot得分及等级1的肽
和等级2的肽的Mascot 得分的差异。如果肽是与iTRAQ混合物中单一蛋白质相匹配的几个
之一，或者如果肽存在于之前验证的肽的目录中，验证所需的标准有所放松。

[0776] (iii)肽和蛋白质定量

[0777] 用于各个混合物的一组验证的肽被用来计算各混合物的初步蛋白质量化量度。通过从用于各个验证肽的iTRAQ标记(例如，m/z 114、 115、116、118、119或121)的峰面积除以通过参比池(QC1或QC2) 的峰面积的最佳表示计算肽比率。此峰面积是113和117峰的平
均值，条件是两个样品都通过QC接受标准。通过计算与该蛋白质相匹配的所有“有用的”
验证肽的中位比率来确定初步蛋白质比率。“有用的”肽是完全iTRAQ标记的(所有的N-端
用赖氨酸或PyroGlu标记)和完全半胱氨酸标记的(即所有Cys残基用脲基甲基或N-端
Pyro-cmc烷基化)。

[0778] (iv)获取后处理

[0779] 一旦对于项目中的每一个组合物完成所有轮的MS/MS数据采集，则使用如下讨论的三个步骤校对数据，其目的是使来自各原始样品的结果能够简单地和有意义地与另一
个样品的结果比较。

[0780] (v)肽序列到蛋白质的总体分配

[0781] 通过专有的蛋白质验证工具(PVT)进行肽序列到蛋白质登录号的最终分配。该PVT程序确定最好的、最小的非冗余蛋白质组以描述在方案中识别的肽的整个集合。这是
已被优化以处理来自同种分类的数据的自动程序。

[0782] 人工监护用于上清液实验的蛋白质分配以便处理在数据库中混合分类的复杂性。由于自动范式对于在牛和马血清补充的培养基中生长的细胞培养物是无效的，所以需
要大量的人工监护以使任何给定蛋白质的来源的不确定性最小化。

[0783] (vi)肽比率的标准化

[0784] 基于Vandesompele等人，Genome Biology,2002,3(7),research 0034.1-11中的方法对各个样品的肽比率标准化。这一程序仅用于细胞沉淀的测量。对于上清液样品，考
虑到来自培养基的对肽识别的最大影响，定量数据没有标准化。

[0785] (vii)蛋白质比率的最终计算

[0786] 使用标准统计离群消除过程从各蛋白质中位比率周围去除离群值，对数变换的数据集中超出1.96σ水平。该去除过程之后，(再) 计算蛋白质比率的最终集合。

[0787] VI、本发明的标志物及其用途

[0788] 本发明是基于(至少部分地)与生物系统(如疾病过程)相关的新生物标志物或生物系统对扰动(例如治疗剂)的反应的鉴别。

[0789] 特别地，本发明涉及在实施例中所描述的标志物(以下简称为“标志物”或“本发明的标志物”)。本发明提供被标志物编码的或与标志物对应的核酸和蛋白质(以下分别简
称为“标志物核酸”和“标志物蛋白质)。这些标志物在诊断疾病状态，预后疾病状态，开发用于不同疾病状态的药物靶标，筛选毒性的存在(优选药物引起的毒性，例如，心脏毒
性)，鉴别引起或具有引起毒性的风险的试剂，鉴别可以降低或防止药物引起的毒性的试
剂，缓解、降低或防止药物引起的心脏毒性和鉴别预测药物引起的心脏毒性中是特别有用
的。

[0790] “标志物”是其表达水平相比于正常或健康的组织或细胞中的表达水平发生改变的与疾病状态(如癌症、糖尿病、肥胖症、心血管疾病或毒性状态，如药物引起的毒性，如心脏毒性)相关的基因。“标志物核酸”是由本发明的标志物编码的或与其对应的核酸(例如
mRNA， cDNA)。这种标志物核酸包括DNA(如cDNA)，其包含作为本发明的标志物的任何基因
的全部或部分序列或者这样的序列的互补序列。这样的序列是本技术领域的技术人员已
知的且可以在，例如，NIH 的政府PubMed网站上找到。标志物核酸还包括包含本发明的任何
基因标志物的全部或部分序列或者这样的序列的互补序列的RNA(其中所有胸苷残基被
尿苷残基取代)。“标志物蛋白质”是本发明的标志物编码的或与之对应的蛋白质。标志物
蛋白质包含本发明的任何标志物蛋白质的全部或部分序列。这样的序列是本技术领域的
技术人员已知的且可以在，例如，NIH的政府PubMed网站上找到。术语“蛋白质”和“多肽”可以互换使用。

[0791] “疾病状态或毒性状态相关的”体液是当在病人体内时，其接触或经过肉瘤细胞或从肉瘤细胞脱落的细胞或蛋白质能够进入其中的流体。示例性的疾病状态或毒性状态
相关的体液包括血液流体(如全血、血清、去除血小板的血液)，并在下面更详细地描述。疾病状态或毒性状态相关的体液不限于，全血、去除血小板的血液、淋巴、前列腺液、尿液和精液。

[0792] 标志物的“正常”表达水平是标志物在没有遭受疾病状态或毒性状态的人类受试者或患者的细胞中的表达水平。

[0793] 标志物的“过表达”或“较高的表达水平”指的是测试样品中大于用来评估表达的分析法的标准误差的表达水平，且优选至少是对照样品 (例如，没有与疾病状态或毒性状
态，例如，癌症、糖尿病、肥胖症、心血管疾病和心脏毒性相关的标志物的来自健康受试者的样品)中标志物表达水平和优选地，几个对照样品中标志物的平均表达水平的两倍，更
优选为三、四、五、六、七、八、九或十倍。

[0794] 标志物的“较低表达水平”是指测试样品中的表达水平，其比对照样品(例如，没有与疾病状态或毒性状态，例如，癌症、糖尿病、肥胖症、心血管疾病和心脏毒性相关的标志物的来自健康受试者的样品)中的标志物表达水平，和优选地几个对照样品中标志物的
平均表达水平低至少两倍，更优选三、四、五、六、七、八、九或十倍。

[0795] “转录的多核苷酸”或“核苷酸转录物”是与通过本发明标志物的转录和RNA转录物的正常转录后加工(如剪接)(如果有的话)及RNA 转录物的反转录产生的成熟mRNA的全
部或一部分互补或同源的多核苷酸(例如，mRNA、hnRNA、cDNA，或这种DNA或cDNA的类似
物)。

[0796] “互补”是指两条核酸链的区域之间或同一核酸链的两个区域之间的序列互补性的广义概念。已知第一核酸区域的腺嘌呤残基能够与反平行于第一区域的第二核酸区域
的残基(如果该残基是胸腺嘧啶或尿嘧啶)形成特定氢键(“碱基配对”)。类似地，已知第一核酸区域的胞嘧啶残基能够与反平行于第一区域的第二核酸区域的残基(如果该残基是
鸟嘌呤)配对。如果当两个区域以反平行的方式排列时，第一区域的至少一个核苷酸残基
能够与第二区域的残基碱基配对，那么核酸的第一区域互补于相同或不同核酸的第二区
域。优选地，第一区域包含第一部分和第二区域包含第二部分，由此，当第一和第二部分以反平行方式排列时，第一部分的至少约50％和优选至少约75％、至少约90％或至少约95％
的核苷酸残基能够与第二部分中的核苷酸残基碱基配对。更优选地，第一部分的所有核苷
酸残基能够与第二部分中的核苷酸残基碱基配对。

[0797] 如本文所用的“同源的”是指相同核酸链的两个区域之间或两个不同核酸链的区域之间的核苷酸序列相似性。当两个区域中的核苷酸残基位置被相同的核苷酸残基占据，
那么该区域在那个位置是同源的。如果各个区域的至少一个核苷酸残基位置被相同的残
基占据，则第一区域与第二区域是同源的。两个区域之间的同源性以被相同的核苷酸残
基所占据的两个区域的核苷酸残基位置的比例表示。举例来说，具有核苷酸序列5'-
ATTGCC-3'的区域和具有核苷酸序列5'-TATGGC-3' 的区域有50％的同源性。优选地，第一
区域包含第一部分和第二区域包含第二部分，由此，各个部分的至少约50％，优选至少约
75％、至少约90％或至少约95％的核苷酸残基位置被相同的核苷酸残基所占据。更优选
的是，各个部分的所有核苷酸残基位置被相同的核苷酸残基占据。

[0798] “本发明的蛋白质”包含标志物蛋白质及其片段、变体标志物蛋白质及其片段、含有标志物或变体标志物蛋白质的至少15个氨基酸的片段的肽和多肽和含有标志物或变体
标志物蛋白质或者标志物或变体标志物蛋白质的至少15个氨基酸的片段的融合蛋白质。

[0799] 本发明进一步提供了与本发明的标志物蛋白质和标志物蛋白质的片段特异性结合的抗体、抗体衍生物和抗体片段。除非其中另有规定，术语“抗体”和“多个抗体”广义地包含天然存在的抗体形式(例如， IgG、IgA、IgM、IgE)和重组抗体(如单链抗体、嵌合抗体和人源化抗体及多特异性抗体)以及所有上述形式的片段和衍生物，该片段和衍生物至少
具有抗原结合位点。抗体衍生物可以包含与抗体偶联的蛋白质或化学部分。

[0800] 在某些实施方式中，本发明的标志物包括选自于HSPA8、FLNB、 PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、 LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、 PARP1、HADHA、PHB2、ATP5A1、CANX、GRP78、GRP75、TIMP1、 PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ的一种或多种基因(或蛋白质)。在一些实施方式中，标志物是上述基因(或蛋白质)中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个、二十五个、三十个或更多个的组合。在前述列表中给出的所有值也可以是意图属于本发明的部分的
范围的上限或下限，例如，1至5、1至10、1至20、1至30、2至5、2至10、 5至10、1至20、5至20、
10至20、10至25、10至30个上述基因 (或蛋白质)。

[0801] 在一个实施方式中，本发明的标志物是与癌症相关的或涉及癌症的基因或蛋白质。这样的涉及癌症的基因或蛋白质包括，例如，HSPA8、FLNB、PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、 KARS、NARS、LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、 CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和/或CANX。在一些实施方式中，本发明的标志物是上述基因(或蛋白
质)中至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个的组合。在前述列表中给出的所有值也可以是意图属于本发明的部分的范围的上限或下限，例如，1至5、1至10、1 至20、1至30、2至5、2至10、5至10、1至20、5至20、10至20、 10至25、10至30个上述基因(或蛋白质)。

[0802] 在一个实施方式中，本发明的标志物是与药物引起的毒性相关的或涉及药物引起的毒性的基因或蛋白质。这样的涉及药物引起的毒性的基因或蛋白质包括，例如，
GRP78、GRP75、TIMP1、PTX3、HSP76、 PDIA4、PDIA1、CA2D1、GPAT1和/或TAZ。在一些实施方式中，本发明的标志物是上述基因(或蛋白质)中至少两个、三个、四个、五个、六个、七个、八个、九个、十个的组合。在前述列表中给出的所有值也可以是意图属于本发明的部分的范
围的上限或下限，例如， 1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、 5至20、10至20、10至25、10至30个上述基因(或蛋白质)。

[0803] A、心脏毒性相关的标志物

[0804] 本发明是基于(至少部分地)与药物诱导的心脏毒性相关的新型生物标志物的鉴别。本发明进一步基于(至少部分地)辅酶Q10能够减少或防止药物诱导的心脏毒性的发
现。

[0805] 因此，本发明提供用于鉴别引起或具有引起毒性的风险的试剂的方法。在一个实施方式中，该试剂是药物或药物候选物。在一个实施方式中，该毒性是药物诱导的毒性，例如，心脏毒性。在一个实施方式中，该试剂是用于治疗糖尿病、肥胖症或心血管疾病的药物或药物候选物。在这些方法中，对一对样品(第一样品没有经历药物治疗和第二样品经历
了药物治疗)中的一个或多个生物标志物/蛋白质的量进行评估。与第一样品相比，第二样
品中一个或多个生物标志物的表达水平中的调节是药物引起导致药物诱导的毒性(例如，
心脏毒性)或者具有导致药物诱导的毒性(例如，心脏毒性)的风险的指示。在一个实施方
式中，所述一个或多个生物标志物选自于GRP78、GRP75、 TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。本发明的方法可以与熟练技术人员使用的任何其他方法结合实施以
鉴别具有引起药物诱导的心脏毒性的风险的药物。

[0806] 因此，在一个方面中，本发明提供了一种用于鉴别导致药物诱导的毒性(例如，心脏毒性)或具有导致药物诱导的毒性(例如，心脏毒性)的风险的药物的方法，其包括：比较
(i)在用药物处理前得到的第一细胞样品中存在的一个或多个生物标志物的表达水平与
(ii) 在用药物处理后得到的第二细胞样品中存在的该一个或多个生物标志物的表达水
平，其中该一个或多个生物标志物选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ；其中与第一样品相比，第二样品中该一个或多个生物标志物的表达
水平的调节是药物导致或具有导致药物诱导的毒性(例如，心脏毒性)的风险的指示。

[0807] 在一个实施方式中，药物诱导的毒性是药物诱导的心脏毒性。在一个实施方式中，所述细胞是心血管系统的细胞，例如，心肌细胞。在一个实施方式中，所述细胞是糖尿病患者的心肌细胞。在一个实施方式中，药物是用于治疗糖尿病、肥胖症或心血管疾病的
药物或候选药物。

[0808] 在一个实施方式中，与第一样品相比，第二样品中选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ的一个、两个、三个、四个、五个、六个、七个、八个、九个或全部十个生物标志物的表达水平的调节(例如，提高或降低)是药物导致或
者具有导致药物诱导的毒性的风险的指示。

[0809] 本发明也提供了用于鉴别可以减少或防止药物诱导的毒性的试剂的方法。在一个实施方式中，药物诱导的毒性是心脏毒性。在一个实施方式中，药物是用于治疗糖尿病、肥胖症或心血管疾病的药物或药物候选物。在这些方法中，对三个样品(第一样品未经历
药物处理，第二样品经历药物处理，和第三样品经历药物和试剂两者的处理)中一个或多
个生物标志物的量进行评估。第三样品中与第一样品相比一个或多个生物标志物的大致
相同的表达水平是该试剂可以减少或防止药物诱导的毒性，例如，药物诱导的心脏毒性的
指示。在一个实施方式中，所述一个或多个生物标志物选自于GRP78、GRP75、TIMP1、 PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。

[0810] 使用本文所述的方法，可筛选多种分子，特别地包括足够小以能够跨过细胞膜的分子，以便鉴别调节(例如，增加或减少)本发明标志物的表达和/或活性的分子。可以向受
试者提供如此鉴别的化合物以减少、减轻或防止受试者中药物诱导的毒性。

[0811] 因此，在另一个方面中，本发明提供了一种用于鉴别可以减少或防止药物诱导毒性的试剂的方法，其包括：(i)测定在用毒性诱导药物处理之前获得的第一样品中存在的
一个或多个生物标志物的表达水平，(ii)测定在用毒性诱导药物处理后获得的第二样品
中存在的一个或多个生物标志物的表达水平，(iii)测定在用毒性诱导药物和所述试剂
处理后获得的第三样品中存在的一个或多个生物标志物的表达水平，以及(iv)比较第一
样品中与第三样品中存在的一个或多个生物标志物的表达水平，其中所述一个或多个生
物标志物选自于 GRP78、GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、 GPAT1和TAZ，且其中第三样品中与第一样品相比一个或多个生物标志物的大致相同的表达水平表明该试
剂可以减少或防止药物诱导的毒性。

[0812] 在一个实施方式中，药物诱导的毒性是药物诱导的心脏毒性。在一个实施方式中，所述细胞是心血管系统的细胞，例如，心肌细胞。在一个实施方式中，所述细胞是糖尿病患者的心肌细胞。在一个实施方式中，药物是用于治疗糖尿病、肥胖症或心血管疾病的
药物或候选药物。

[0813] 在一个实施方式中，与第一样品相比，第三样品中选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ中的一个、两个、三个、四个、五个、六个、七个、八个、九个或全部十个生物标志物的大约相同的表达水平是该试剂可以减少或防止
药物诱导的毒性的指示。

[0814] 本发明还提供了用于在需要的受试者中缓解、减轻或防止药物诱导的心脏毒性的方法，其包括向受试者(例如，哺乳动物、人或非人类动物)施用由本文提供的筛选方法
鉴别的试剂，从而减少或防止受试者中药物诱导的心脏毒性。在一个实施方式中，所述试
剂被施用给已经用心脏毒性诱导药物治疗的受试者。在一个实施方式中，在心脏毒性诱
导药物治疗受试者的同时将该试剂施用于受试者。在一个实施方式中，在用心脏毒性诱导
药物治疗受试者之前将该试剂施用于受试者。

[0815] 本发明还提供了用于在需要的受试者中缓解、减轻或防止药物诱导的心脏毒性的方法，其包括向受试者(例如，哺乳动物、人或非人类动物)施用辅酶Q10，从而减少或防
止受试者中药物诱导的心脏毒性。在一个实施方式中，辅酶Q10被施用给已经用心脏毒性
诱导药物治疗的受试者。在一个实施方式中，在用心脏毒性诱导药物治疗受试者的同时
将辅酶Q10施用于受试者。在一个实施方式中，在用心脏毒性诱导药物治疗受试者之前将
辅酶Q10施用于受试者。在一个实施方式中，药物诱导的心脏毒性与选自于GRP78、GRP75、
TIMP1、PTX3、 HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ的一个、两个、三个、四个、五个、六个、七个、八个、九个或全部十个生物标志物的表达水平的调节相关。在前述列表中给出的所有值也可以是意图属于本发明的部分的范围的上限或下限，例如，1至5、1至10、2至5、 2至10或5至10个上述基因(或蛋白质)。

[0816] 本发明还提供了可用作心脏毒性(例如，药物诱导的心脏毒性) 的预测标志物的生物标志物(例如，基因和/或蛋白质)。这些生物标志物包括GRP78、GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、 CA2D1、GPAT1和TAZ。但是，普通技术人员能够通过采用本文所述的方法(例如，通过进行实施例3中描述的方法)但使用已知诱导心脏毒性的不同药物来鉴别
预测药物诱导的心脏毒性的另外的生物标志物。下面进一步描述本发明的示例性的药物
诱导心脏毒性生物标志物。

[0817] GRP78和GRP75也被称为葡萄糖反应蛋白质。这些蛋白质与心肌细胞的内/肌质网2+
应激(ER应激)相关。SERCA或肌/内质网钙ATP 酶调控心肌细胞中的Ca 动态平衡。这些ATP
酶的任何破坏可导致心功能不全和心力衰竭。根据本文提供的数据，GRP75和GRP78及他
们周围的边界是药物诱导的心脏毒性的新预测子。

[0818] TIMP1，也被称为TIMP金属蛋白质酶抑制剂1，参与细胞外基质与MMP结合的重建。TIMP1的表达与心脏纤维化相关联，且血管内皮细胞的缺氧也诱导TIMP1表达。根据本文所
提供的数据，TIMP1 是药物诱导的心脏毒性的新预测子。

[0819] PTX3，也称为穿透素(Pentraxin)3，属于C反应蛋白质(CRP) 家族且是心脏的炎症状态的良好标志物。然而，血浆PTX3也可能是由于败血症或其他医学状态产生的全身性炎
症反应的表现。根据本文所提供的数据，PTX3可以是心功能或心脏毒性的新标志物。此外，网络中与PTX3相关的边界可以形成新的生物标志物小组。

[0820] HSP76，也被称为HSPA6，仅已知在内皮细胞和B淋巴细胞中表达。这种蛋白质在心脏功能没有已知的作用。根据本文所提供的数据， HSP76可以是药物诱导的心脏毒性的新
的预测子。

[0821] PDIA4，PDIA1，也被称为蛋白质二硫键异构酶家族A蛋白，与 ER应激反应相关，如GRP一样。这些蛋白质在心脏功能中没有已知的作用。根据本文提供的数据，这些蛋白质可
以是药物诱导的心脏毒性的新的预测子。

[0822] CA2D1也称为钙通道、电压依赖性、α-2/δ亚基。电压依赖性钙通道的α-2/δ亚基调节钙通道的钙电流密度和活化/灭活动力学。CA2D1在心脏中的兴奋收缩偶联中起着重要的作用。这种蛋白质在心脏功能没有已知的作用。根据本文提供的数据，CA2D1是药物诱导
的心脏毒性的新预测子。

[0823] GPAT1是四个已知的甘油-3-磷酸酰基转移酶同功型之一，且位于线粒体外膜上，从而允许与肉碱棕榈酰转移酶1的相互调节。 GPAT1由胰岛素和SREBP-1c转录上调和由
AMP-活化蛋白激酶急性下调，与三酰基甘油合成中的作用一致。根据本文提供的数据，
GPAT1 是药物诱导的心脏毒性的新的预测子。

[0824] TAZ，也被称为Tafazzin，在心脏和骨骼肌中高度表达。TAZ参与心磷脂的代谢并作为磷脂-溶血磷脂转酰基酶发挥功能。Tafazzin负责磷脂心磷脂(CL)(线粒体内膜的标
志脂质)的重建。基于本文所提供的数据，TAZ是药物诱导的心脏毒性的新的预测子。

[0825] B、癌症相关标志物

[0826] 本发明是基于(至少部分地)与癌症相关的新型生物标志物的鉴别。这样的与癌症相关的标志物包括，例如，HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和/或CANX。在一些实施方式中，本发明的标志物是至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个上述标志物的组合。

[0827] 因此，本发明提供用于鉴别引起或具有引起癌症的风险的试剂的方法。在一个实施方式中，该试剂是药物或药物候选物。在这些方法中，对一对样品(第一样品没有经历药
物处理和第二样品经历了药物处理)中一个或多个生物标志物/蛋白质的量进行评估。与
第一样品相比，第二样品中一个或多个生物标志物的表达水平的调节是药物导致或者具
有导致癌症的风险的指示。在一个实施方式中，所述一个或多个生物标志物选自于HSPA8、
FLNB、PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、DDX17、EIF5A、 HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、 PHB2、ATP5A1和CANX。本发明的方法可以与熟练技术人员使用的任何其他方法结合使用以鉴别具有导致癌症的风险的药物。

[0828] 在一个方面中，本发明提供了用于评估在受试者中治疗癌症的疗法的效力的方法，该方法包括：比较在向受试者施用至少一部分治疗方案前从受试者得到的第一样品中
存在的一个或多个标志物的表达水平与施用至少一部分治疗方案后从受试者得到的第二
样品中存在的一个或多个标志物的表达水平，其中所述一个或多个标志物选自于 HSPA8、
FLNB、PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、 KARS、NARS、LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、 CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX，其中与第一样品相比，第二样品中一个或多个生物标志物的表达水平的调节表明该疗法对于在受试者中治疗癌症
是有效的。

[0829] 在一个实施方式中，样品包括从受试者得到的流体。在一个实施方式中，该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0830] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0831] 在一个实施方式中，受试者是人。

[0832] 在一个实施方式中，在生物样品中的所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多
核苷酸包括扩增转录的多聚核苷酸。

[0833] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与该蛋白质特异性结合的试剂分析该蛋
白质。

[0834] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0835] 在一个实施方式中，样品中标志物的表达水平是使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法中的技术测定的。

[0836] 在一个实施方式中，测定多个标志物的表达水平。

[0837] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子、化疗、同种异体干细胞疗法中的疗法治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0838] 本发明进一步提供了用于评估受试者是否患有癌症的方法，所述方法包括：测定获自受试者的生物样品中存在的一个或多个标志物的表达水平，其中所述一个或多个标
志物选自于HSPA8、FLNB、 PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、 LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、 HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX；和对比获自受试者的生物样品中存在的一个或多个标志物的表达水平与对照样品中存在的
一个或多个标志物的表达水平，其中相对于对照样品中一个或多个标志物的表达水平，从
受试者获得的生物样品中所述一个或多个标志物的表达水平的调节表明受试者患有癌
症，从而评定受试者是否患有癌症。

[0839] 在一个实施方式中，所述样品包括从受试者得到的流体。在一个实施方式中，流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0840] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0841] 在一个实施方式中，受试者是人。

[0842] 在一个实施方式中，在生物样品中所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多核
苷酸包括扩增转录的多聚核苷酸。

[0843] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与该蛋白质特异性结合的试剂分析蛋白
质。

[0844] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0845] 在一个实施方式中，样品中标志物的表达水平是通过使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测定的。

[0846] 在一个实施方式中，测定多个标志物的表达水平。

[0847] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0848] 本发明还提供了预测受试者是否易于发生癌症的方法，所述方法包括：测定获自受试者的生物样品中存在的一个或多个标志物的表达水平，其中所述一个或多个标志物
选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX；和比较获自受试者的生物样品中存在的一个或多个标志物的表达水平与对照样品中存在的一个或
多个标志物的表达水平，其中相对于对照样品中的一个或多个标志物的表达水平，从受试
者获得的生物样品中所述一个或多个标志物的表达水平的调节表明受试者易于发生癌
症，从而预测受试者是否易于发生癌症。

[0849] 在一个实施方式中，所述样品包括从受试者得到的流体。在一个实施方式中，该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0850] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0851] 在一个实施方式中，受试者是人。

[0852] 在一个实施方式中，在生物样品中的所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多
核苷酸包括扩增转录的多聚核苷酸。

[0853] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与蛋白质特异性结合的试剂分析该蛋白
质。

[0854] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0855] 在一个实施方式中，样品中标志物的表达水平是使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测定的。

[0856] 在一个实施方式中，测定多个标志物的表达水平。

[0857] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0858] 本发明进一步提供了预测受试者中癌症复发的方法，该方法包括：测定获自受试者的生物样品中存在的一个或多个标志物的表达水平，其中所述一个或多个标志物选自
于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX；和比较获自受试者的生物样品中存在的一个或多个标志物的表达水平与对照样品中存在的一个或
多个标志物的表达水平，其中相对于对照样品中的一个或多个标志物的表达水平，从受试
者获得的生物样品中所述一个或多个标志物的表达水平的调节是癌症复发的指示，从而
预测受试者中癌症的复发。

[0859] 在一个实施方式中，所述样品包括从受试者得到的流体。在一个实施方式中，流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0860] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0861] 在一个实施方式中，受试者是人。

[0862] 在一个实施方式中，在生物样品中的所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多
核苷酸包括扩增转录的多聚核苷酸。

[0863] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与蛋白质特异性结合的试剂分析该蛋白
质。

[0864] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0865] 在一个实施方式中，样品中标志物的表达水平是通过使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法中的技术测定的。

[0866] 在一个实施方式中，测定多个标志物的表达水平。

[0867] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0868] 本发明还提供了预测患有癌症的受试者的生存的方法，该方法包括：测定获自受试者的生物样品中存在的一个或多个标志物的表达水平，其中所述一个或多个标志物选
自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX；和比较获自受试者的生物样品中存在的一个或多个标志物的表达水平与对照样品中存在的一个或
多个标志物的表达水平，其中相对于对照样品中的一个或多个标志物的表达水平，从受试
者获得的生物样品中所述一个或多个标志物的表达水平的调节是受试者生存的指示，从
而预测患有癌症的受试者的生存。

[0869] 在一个实施方式中，样品包括从受试者得到的流体。在一个实施方式中，该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的液体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0870] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0871] 在一个实施方式中，受试者是人。

[0872] 在一个实施方式中，在生物样品中的所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多
核苷酸包括扩增转录的多聚核苷酸。

[0873] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与蛋白质特异性结合的试剂分析该蛋白
质。

[0874] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0875] 在一个实施方式中，样品中标志物的表达水平是使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测定的。

[0876] 在一个实施方式中，测定多个标志物的表达水平。

[0877] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0878] 本发明还提供了监测受试者中癌症的进展的方法，该方法包括：比较在向受试者施用至少一部分治疗方案前从受试者得到的第一样品中存在的一个或多个标志物的表达
水平与施用至少一部分治疗方案后从受试者得到的第二样品中存在的一个或多个标志物
的表达水平，其中所述一个或多个标志物选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、
ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX，从而监测受试者中癌症的进展。

[0879] 在一个实施方式中，样品包括从受试者得到的流体。在一个实施方式中，该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的液体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0880] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0881] 在一个实施方式中，受试者是人。

[0882] 在一个实施方式中，在生物样品中的所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多
核苷酸包括扩增转录的多聚核苷酸。

[0883] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与蛋白质特异性结合的试剂分析该蛋白
质。

[0884] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测法、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0885] 在一个实施方式中，样品中标志物的表达水平是使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测定的。

[0886] 在一个实施方式中，测定多个标志物的表达水平。

[0887] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0888] 本发明进一步提供鉴别用于在受试者中治疗癌症的化合物的方法，该方法包括：从受试者获得生物样品；将生物样品与测试化合物相接触，测定获自受试者的生物样品中
存在的一个或多个标志物的表达水平，其中所述一个或多个标志物选自于HSPA8、FLNB、
PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX，其具有正倍数变化和/或负倍数变化；将生物样品中多个标志物之一的表达水平与适合的对照比较；和选择以负倍数变化
降低生物样品中存在的一个或多个标志物的表达水平和/或以正倍数变化提高生物样品
中存在的一个或多个标志物的表达水平的测试化合物，从而鉴别在受试者中用于治疗癌
症的化合物。

[0889] 在一个实施方式中，样品包括从受试者得到的流体。在一个实施方式中，流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、从支气管肺泡灌洗收集的液体、从腹腔清洗收集的流体和妇科液体。在一个实施方式中，样品是血液样品或其组分。

[0890] 在另一个实施方式中，样品包括获自受试者的组织或成分。在一个实施方式中，该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、肌肉组织、心脏、胰腺和皮肤。

[0891] 在一个实施方式中，受试者是人。

[0892] 在一个实施方式中，在生物样品中的所述一个或多个标志物的表达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个实施方式中，其中分析转录的多
核苷酸包括扩增转录的多聚核苷酸。

[0893] 在一个实施方式中，受试者样品中标志物的表达水平是通过分析样品中的蛋白质或其一部分而确定的。在一个实施方式中，使用与蛋白质特异性结合的试剂分析该蛋白
质。

[0894] 在一个实施方式中，样品中所述一个或多个标志物的表达水平是使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、
错配切割检测、异源双链分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合或子组合的技术测定
的。

[0895] 在一个实施方式中，样品中标志物的表达水平是使用选自于免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测定的。

[0896] 在一个实施方式中，测定多个标志物的表达水平。

[0897] 在一个实施方式中，受试者正在用选自于环境影响剂化合物、外科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中，环境影响剂化合物是辅酶Q10分子。

[0898] 本发明还提供了用于评估用于治疗癌症的疗法的疗效的试剂盒，该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来评估用于治疗癌症的疗法
的疗效的说明。

[0899] 本发明还提供了一种用于评估受试者是否患有癌症的试剂盒，该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来评估受试者是否患有癌症的说明。

[0900] 本发明还提供了一种用于预测受试者是否易于发生癌症的试剂盒，该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来预测受试者是否易于发生
癌症的说明。

[0901] 本发明还提供了一种用于预测癌症在受试者中的复发的试剂盒，该试剂盒包括用于评估至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来预测癌症的复发的说明。

[0902] 本发明还提供了一种用于预测癌症复发的试剂盒，该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、HSPA1A/HSPA1B、 ST13、TUBB3、MIF、KARS、NARS、LGALS1、DDX17、EIF5A、 HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、 PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来预测癌症复发的说明。

[0903] 本发明进一步提供用于预测患有癌症的受试者的生存的试剂盒，该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来预测患有癌症的受试者的
生存的说明。

[0904] 本发明还提供了一种用于监测受试者中癌症进展的试剂盒，该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂，和使用该试剂盒来预测受试者中癌症的进展的说明。

[0905] 本发明的试剂盒可以进一步包含用于从受试者获取生物样品的装置、对照样品和/或环境影响剂化合物。

[0906] 用于测定至少一个标志物的表达水平的手段可以包括用于分析样品中转录的多核苷酸或其一部分的手段和/或用于分析样品中蛋白质或其一部分的手段。

[0907] 在一个实施方式中，试剂盒包含用于测定多个标志物的表达水平的试剂。

[0908] 本发明的各方面在下面的小节中进一步详细描述。

[0909] C、分离的核酸分子

[0910] 本发明的一个方面涉及分离的核酸分子，包括编码标志物蛋白质或其一部分的核酸。本发明的分离的核酸还包括足以用作杂交探针来确定标志物核酸分子及标志物核
酸分子的片段的核酸分子，例如，那些适合用作标志物核酸分子的扩增或突变的PCR引物
的核酸分子。如本文所用的术语“核酸分子”旨在包括DNA分子(例如，cDNA或基因组DNA)
和RNA分子(例如，mRNA)及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是
单链的或双链的，但优选为双链DNA。

[0911] “分离的”核酸分子是与存在于该核酸分子的天然来源中的其他核酸分子分离的核酸分子。在一个实施方式中，“分离的”核酸分子不含核酸所来源的生物体的基因组DNA
中自然侧邻该核酸的序列(即，位于该核酸的5'和3'端的序列)(优选蛋白质编码序列)。例
如，在各种实施方式中，分离的核酸分子可以包含少于约5kB、4kB、3kB、 2kB、1kB、0.5kB或
0.1kB的该核酸所来源的细胞的基因组DNA 中自然侧邻该核酸分子的核苷酸序列。在另一
个实施方式中，“分离的”核酸分子，如cDNA分子，可以基本上不含其他细胞物质，或当通过重组技术产生时基本上不含培养基，或当化学合成时基本上不含化学前体或其他化学
物质。基本上不含细胞物质的核酸分子包括具有小于约30％、20％、10％或5％的异源核酸
(这里也称为“污染核酸”) 的制剂。

[0912] 可以使用标准的分子生物学技术和本文所描述的数据库记录中的序列信息分离本发明的核酸分子。使用这样的核酸序列的全部或一部分，可以使用标准杂交和克隆技术
(例如，如Sambrook等编辑, Molecular Cloning:A Laboratory Manual,2nd ed.,Cold
Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中所描述的)分离本发
明的核酸分子。

[0913] 可以使用作为模板的cDNA、mRNA或基因组DNA和适当的寡核苷酸引物根据标准PCR扩增技术来扩增本发明的核酸分子。如此扩增的核酸可以被克隆到合适的载体中，和
通过DNA序列分析鉴定。此外，对应于本发明的核酸分子的全部或一部分的核苷酸可以通
过标准合成技术，例如，使用自动DNA合成仪制备。

[0914] 在另一个优选的实施方式中，本发明的分离的核酸分子包含的核酸分子具有与标志物核酸的核苷酸序列或与编码标志物蛋白质的核酸的核苷酸序列互补的核苷酸序
列。与给定的核苷酸序列互补的核酸分子是与给定的核苷酸序列充分互补的核酸分子，它
可以与给定的核苷酸序列杂交从而形成稳定的双链体。

[0915] 此外，本发明的核酸分子可以只包含核酸序列的一部分，其中全长核酸序列包含标志物核酸或它编码标志物蛋白质。这样的核酸可用作，例如，探针或引物。该探针/引物
通常作为一个或多个基本上纯化的寡核苷酸使用。该寡核苷酸典型地包含在严格条件下
与本发明核酸的至少约7个、优选约15个、更优选为约25、50、75、100、125、 150、175、200、
250、300，350或400个或更多个连续核苷酸杂交的核苷酸序列的区域。

[0916] 基于本发明核酸分子的序列的探针可用于检测对应于本发明的一个或多个标志物的转录本或基因组序列。该探针包含连接在其上的标记基团，例如，放射性同位素、荧光化合物、酶或酶辅因子。这样的探针可用作用于识别错误表达蛋白质的细胞或组织的诊断
测试试剂盒的部分，如通过测量来自受试者的细胞样品中编码蛋白质的核酸分子的水
平，例如，检测mRNA水平或测定编码该蛋白质的基因是否已突变或缺失。

[0917] 本发明还包含由于遗传密码的简并性而与编码标志物蛋白质的核酸的核苷酸序列不同的并因此编码相同的蛋白质的核酸分子。

[0918] 本领域技术人员将能理解，导致氨基酸序列变化的DNA序列多态性可能存在于群体(例如，人类群体)中。由于自然等位基因变异，这种基因多态性可能存在于群体内的个
体之间。等位基因是在给定的基因座处交替出现的一组基因之一。此外，应该理解的是，影响RNA 表达水平的DNA多态性也可以存在，其可以影响该基因的整体表达水平(例如，通过
影响调节或降解)。

[0919] 如本文所用的，术语“等位基因变异体”是指存生于给定基因座处的核苷酸序列，或指由核苷酸序列编码的多肽。

[0920] 如本文所用的，术语“基因”和“重组基因”指含有编码与本发明的标志物对应的多肽的开放阅读框的核酸分子。通常，这样的天然等位基因变异可以导致给定基因的核苷
酸序列中1-5％的变异。可选等位基因可以通过测序多个不同个体中的目标基因来识别。
这可以通过使用杂交探针很容易地进行以识别多个个体中的相同基因座。任何及所有这
样的核苷酸变异及所产生的氨基酸多态性或变异(其为天然等位基因变异的结果且不改
变功能活性)意图在本发明的范围之内。

[0921] 在另一个实施方式中，本发明的分离核酸分子长度是至少7、15、 20、25、30、40、60、80、100、150、200、250、300、350、400、 450、550、650、700、800、900、1000、1200、1400、
1600、1800、 2000、2200、2400、2600、2800、3000、3500、4000、4500或更多个核苷酸，且在严格条件下与标志物核酸或与编码标志物蛋白质的核酸杂交。如本文所用的，术语“在严格
条件下杂交”意图描述用于杂交和洗涤的条件，其中在该条件下，至少60％(65％、70％、优选75 ％)彼此相同的核苷酸序列通常保持彼此杂交。这种严格条件是本技术领域的技术
人员已知的，并且可以在Current Protocols in Molecular Biology,John Wiley&Sons,
N.Y.(1989)的6.3.1-6.3.6节中发现。严格杂交条件的优选的非限制性的例子是在约45℃
下6X的氯化钠/柠檬酸钠(SSC)中杂交，然后在0.2X SSC，0.1％SDS中于50-65℃下洗涤一
次或多次。

[0922] 除了可以存在于群体中的天然存在的本发明核酸分子的等位基因变异体，本领域技术人员将进一步理解，序列变化可以由突变引入，从而导致所编码的蛋白质的氨基酸
序列的变化，而不改变由此编码的蛋白质的生物学活性。例如，一种变化可以导致在“非必需”氨基酸残基处的氨基酸置换的核苷酸取代。“非必需”氨基酸残基是可以在不改变生
物活性的情况下从野生型序列发生改变的残基，而“必需”氨基酸残基是生物活性所必需
的。例如，各种不同物种的同源物之间非保守的或仅半保守的氨基酸残基对于活性可能是
非必需的且因此很可能是进行改变的目标。或者，在各种不同物种(例如，鼠和人)的同源
物之间保守的氨基酸残基可能是活性必需的，且因此不太可能是改变的目标。

[0923] 因此，本发明的另一个方面涉及到编码包含对于活性非必需的氨基酸残基中的变化的变异标志物蛋白质的核酸分子。这样的变异标志物蛋白质与天然存在的标志物蛋
白质的氨基酸序列不同，但仍保留生物活性。在一个实施方式中，这样的变异标志物蛋白
质具有与标志物蛋白质的氨基酸序列至少约40％相同的、50％、60％、70％、80％、 90％、
91％、92％、93％、94％、95％、96％、97％、98％或99％相同的氨基酸序列。

[0924] 通过向标志物核酸的核苷酸序列中引入一个或多个核苷酸取代、添加或缺失可以产生编码变异标志物蛋白质的分离的核酸分子，以使得一个或多个氨基酸残基置换、添
加或缺失被引入到编码的蛋白质中。突变可以通过标准技术(如定点诱变和PCR介导的诱
变)引入。优选地，在一个或多个预测的非必需氨基酸残基处进行保守氨基酸置换。“保守氨基酸置换”是在其中氨基酸残基用具有类似侧链的氨基酸残基代替的置换。具有类似侧
链的氨基酸残基的家族已在本领域中定义。在这些家族包括具有碱性侧链的氨基酸(例如
赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳族侧链的氨基酸(例如，酪氨酸、苯丙氨酸、色氨酸、组氨酸)。或者，突变可以沿全部或部分编码序列随机引入，例如通过饱和诱变，且得到的突变体可进行生物活性的筛选以鉴别
保留活性的突变体。诱变后，可重组表达编码的蛋白质并可测定蛋白质的活性。

[0925] 本发明包括反义核酸分子，即与本发明的正义核酸互补的分子，例如，与双链标志物cDNA分子的编码链互补的或与标志物mRNA 序列互补的。因此，本发明的反义核酸可以
与本发明的正义核酸氢键结合(即与之退火)。反义核酸可与整个编码链互补，或者只与其
一部分互补，例如，蛋白质编码区的全部或部分(或开放阅读框)。反义核酸分子也可以与
编码标志物蛋白质的核苷酸序列的编码链的全部或部分非编码区是反义的。非编码区
(“5'和3'非翻译区”)是侧邻编码区的5'和3'序列且未被翻译成氨基酸。

[0926] 反义寡核苷酸长度可以是，例如，约5、10、15、20、25、30、 35、40、45或50个或更多个核苷酸。可以使用本领域中已知的方法利用化学合成和酶促连接反应构造本发明的反义核酸。例如，可以使用天然存在的核苷酸或设计用于提高分子的生物稳定性或提高反义
和正义的核酸之间形成的双链体的物理稳定性的不同地修饰的核苷酸来化学合成反义核
酸(例如，反义寡核苷酸)，例如，可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修饰核苷酸的例子包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧
啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧羟基甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿核苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D- 半乳糖基Q核苷、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧
啶、2-甲硫基-N6-异戊烯腺嘌呤、尿嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、Q核
苷、2-硫代胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧
丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。或者，可以使用核酸已经按反义方向(即，由所
插入的核酸转录的 RNA将是所需靶核酸的反义方向，在以下小节进一步描述)亚克隆至其
中的表达载体以生物方法产生反义核酸。

[0927] 如本文中所用的“核酸”抑制剂是任何基于核酸的抑制剂，其通过与来自靶基因的RNA转录物的至少一部分杂交引起靶标表达的下降以导致靶标表达的下降。核酸抑制剂
包括，例如，单链核酸分子(例如，反义核酸)和双链核酸(如siRNA、shRNA、dsiRNA)(参见，例如美国专利申请20070104688)。如本文中所用的，双链核酸分子设计为在至少12、优选
至少15个核苷酸上是双链的。双链核酸分子可以是设计为与其本身杂交的单核酸链，例如
shRNA。据理解，靶标的核酸抑制剂可以作为分离的核酸施用。或者，核酸抑制剂可以作为表达构建体施用以在细胞中产生抑制剂。在某些实施方式中，核酸抑制剂包括一个或多个
化学修饰以提高核酸抑制剂的活性和/或稳定性。这类修饰是本领域中公知的。例如，待使
用的特定修饰将取决于核酸抑制剂的类型。

[0928] 反义核酸治疗剂单链核酸疗法，长度通常约16-30个核苷酸且与靶细胞(在培养物中或在生物体中)中的靶核酸序列互补。

[0929] 针对反义核酸、化学修饰和治疗用途的专利提供在例如涉及包含化学修饰的RNA的治疗化合物的美国专利No.5,898,031和涉及作为治疗剂使用这些化合物的方法的美国
专利No.6,107,094中。美国专利No.7,432,250涉及通过施用单链的化学修饰RNA样化合物
治疗患者的方法和美国专利No.7,432,249涉及包含单链的化学修饰RNA样化合物的药物
组合物。美国专利No.7,629,321涉及使用具有多个RNA 核苷和至少一个化学修饰的单链寡
核苷酸切割靶mRNA的方法。本段落中所列的各专利通过引用并入本文。

[0930] 在许多实施方式中，双链体区域长度是15-30个核苷酸对。在一些实施方式中，双链体区域长度是17-23个核苷酸对，长度是17-25 个核苷酸对，长度是23-27个核苷酸对，长
度是19-21个核苷酸对或长度是21-23个核苷酸对。

[0931] 在某些实施方式中，各链具有15-30个核苷酸。

[0932] 可用于本发明的方法中的RNAi剂包括如例如2011年11月18 日提交的美国临时申请No.61/561,710、2010年9月15日提交的国际申请No.PCT/US2011/051597和PCT公开WO
2009/073809中公开的具有化学修饰的试剂，上述各专利申请的内容通过引入并入本文。

[0933] “RNAi剂”、“双链RNAi剂”、双链RNA(dsRNA)分子也称为“dsRNA剂”、“dsRNA”、“siRNA”、“iRNA剂”，如在本文中可互换使用的，指的是核糖核酸分子的复合物，其具有包含两条反平行的和如以下定义的基本互补的核酸链的双链体结构。如本文中使用的，RNAi剂也可以包括dsiRNA(参见，例如美国专利公开 20070104688，通过引用并入本文)。一
般地，各链的大多数核苷酸是核糖核苷酸，但如本文中描述的，各链或两条链也可以包括
一个或多个非-核糖核苷酸，例如脱氧核糖核苷酸和/或修饰的核苷酸。另外，如本说明书
中使用的，“RNAi剂”可以包括具有化学修饰的核糖核苷酸；RNAi剂可以包括多个核苷酸处的实质修饰。这类修饰可以包括本文中公开的或本领域中已知的所有类型的修饰。任何这
类修饰 (如siRNA类型的分子中使用的)为本说明书和权利要求的目的涵盖在“RNAi剂”
内。

[0934] 形成双链体结构的两条链可以是一个较大的RNA分子的不同部分，或者它们可以是单独的RNA分子。在两条链是一个较大分子的部分且因此通过形成双链体结构的一条链
的3’末端和相应的另一条链的5’末端之间的非间断核苷酸链连接的情况下，连接的RNA链
称为“发夹环”。在两条链通过形成双链体结构的一条链的3’末端和相应的另一条链的5’末端之间的非间断核苷酸链以外方式共价连接的情况下，连接的结构称为“接头”。RNA链
可以具有相同或不同数目的核苷酸。最大碱基对数目是dsRNA的最短链中核苷酸的数目减
去双链体中存在的任何悬端。除了双链体结构外，RNAi剂可以包含一个或多个悬端。在本
文中使用的术语“siRNA”也指上文描述的RNAi 剂。

[0935] 在另一个方面，试剂是单链反义RNA分子。反义RNA分子与靶 mRNA内的序列互补。反应RNA可以通过与mRNA碱基配对和物理阻碍翻译机制以化学计量的方式抑制翻译，参见
Dias,N.等,(2002) Mol Cancer Ther 1:347-355。反义RNA分子可以具有与靶mRNA互补的
约15-30个核苷酸。例如，反义RNA分子可以具有来自表1的一个反义序列的至少15、16、17、
18、19、20或更多个连续核苷酸的序列。术语“反义链”指的是包括与靶序列基本上互补的区域的双链 RNAi剂的链。如本文中使用的，术语“与编码目标蛋白质的部分互补的区域”
是指与编码蛋白质的靶mRNA序列的部分基本上互补的反义链上的区域。在互补性区域不
与靶序列完全互补的情况下，失配在末端区域中且(如果存在的话)一般在一个或多个末
端区域中是最耐受的，例如在5’和/或3’末端的6、5、4、3或2个核苷酸内。

[0936] 如本文中使用的术语“反义链”指的是包括与反义链的区域基本上互补的区域的dsRNA的链。

[0937] 在各种实施方式中，可以在碱基部分、糖基部分或磷酸骨架处修饰本发明的核酸分子以改善，例如，分子的稳定性、杂交或溶解性。例如，核酸的脱氧核糖磷酸酯骨架可以被修饰以产生肽核酸(参见 Hyrup等，1996,Bioorganic&Medicinal Chemistry 4(1):5-
23)。如本文所用的，术语“肽核酸”或“PNA”是指核酸模拟物，例如，DNA模拟物，其中脱氧核糖磷酸酯骨架被假肽骨架替换，且只有四种天然核碱基被保留。PNA的中性骨架已被证
明允许在低离子强度的条件下与DNA 和RNA特异性杂交。可使用标准的固相肽合成方案进
行PNA寡聚体的合成，如Hyrup等，(1996),同上；Perry-O'Keefe等(1996)Proc.Natl.
Acad.Sci.USA 93:14670-675中所描述的。

[0938] PNA可用于治疗和诊断应用中。例如，PNA可被用作反义或反基因剂而用于基因表达的序列特异性调节，例如，通过诱导转录或翻译抑止或抑制复制。PNA也可以用于，例如，基因中单碱基对突变的分析，例如通过PNA定向的PCR夹钳，当与其他酶(例如，S1核酸酶)
组合使用时作为人工限制性内切酶(Hyrup(1996)，同上)；或作为探针或引物用于DNA测序
和杂交(Hyrup，1996年，同上； Perry-O'Keefe等人，1996,Proc.Natl.Acad.Sci.USA 93:
14670-675)。

[0939] 在另一个实施方式中，可以通过将亲脂性的或其他辅助基团连接到PNA上，通过形成PNA-DNA嵌合体或通过使用脂质体或本领域中已知的其它药物递送技术修饰PNA，例
如，为提高它们的稳定性或细胞摄取。例如，可以生成PNA-DNA嵌合体，其可以结合PNA和
DNA的有利性质。这种嵌合体允许DNA识别酶(例如，RNA酶H 和DNA聚合酶)与DNA部分相互作
用，而PNA部分将提供高结合亲和力和特异性。可以使用根据碱基堆积、核碱基之间的键数
和定向选择的具有适当长度的接头来连接PNA-DNA嵌合体(Hyrup，1996，同上)。PNA-DNA
嵌合体的合成可以如Hyrup(1996)，同上和Finn 等(1996)Nucleic Acids Res.24(17):
3357-63中所描述的进行。例如，可使用标准的亚磷酰胺偶联化学作用和修饰的核苷类似
物在固体载体上合成DNA链。化合物如5'-(4-甲氧基三苯甲基)氨基-5'-脱氧-胸腺嘧啶
亚磷酰胺可以被用作PNA与DNA的5'末端之间的连接(Mag 等,1989,Nucleic Acids
Res.17:5973-88)。然后PNA 单体以逐步的方式偶合以产生带有5'PNA片段和3'DNA片段的
嵌合分子(Finn等人， 1996,Nucleic Acids Res.24(17):3357-63)。或者，可以合成带有5'
DNA 片段和3'PNA片段的嵌合分子(Peterser等，1975,Bioorganic Med. Chem.Lett.5:
1119-11124)。

[0940] 在其它实施方式中，寡核苷酸可以包括其他附接的基团，如肽(例如，用于体内靶向宿主细胞受体)，或有助于运输穿过细胞膜(见，例如，Letsinger等,1989,
Proc.Natl.Acad.Sci.USA 86:6553-6556； Lemaitre等,1987,Proc.Natl.Acad.Sci.USA
84:648-652；PCT公开号 WO 88/09810)或血脑屏障(见例如，PCT公开号WO 89/10134)的试
剂。此外，寡核苷酸可以用杂交触发的裂解剂(见，例如，Krol等, 1988,Bio/Techniques 6:
958-976)或嵌入剂(见，例如Zon,1988,Pharm. Res.5:539-549)修饰。为此，该寡核苷酸可
以与另一种分子偶联，例如，肽、杂交触发交联剂、运输剂、杂交触发的裂解剂等。

[0941] 本发明还包括具有至少一个与本发明的核酸互补的区域的分子信标核酸，以使得该分子信标可用于定量样品中本发明核酸的存在。 “分子信标”核酸是包含一对互补区
域并具有荧光团和与其相关的荧光淬灭剂的核酸。荧光团和淬灭剂与核酸的不同部分相
结合，其方向使得当互补区域彼此退火时，荧光团的荧光被淬灭剂淬灭。当核酸的互补区
域未与彼此退火时，荧光团的荧光以较小程度淬灭。分子信标核酸在例如5,876,930号美
国专利中描述。

[0942] D、分离的蛋白质和抗体

[0943] 本发明的一个方面涉及分离的标志物蛋白质及其生物活性部分，以及适合用作免疫原以产生针对标志物蛋白质或其片段的抗体的多肽片段。在一个实施方式中，可以使
用标准的蛋白质纯化技术通过适当的纯化方案从细胞或组织来源分离原始的标志物蛋白
质。在另一个实施方式中，通过重组DNA技术产生含有标志物蛋白质的全部或片段的蛋白
质或肽。替代重组表达，这样的蛋白质或肽可以使用标准的肽合成技术化学合成。

[0944] “分离的”或“纯化的”蛋白质或其生物活性部分基本上不含来自于该蛋白质所来源的细胞或组织源的细胞物质或其它污染蛋白质，或当化学合成时基本上不含化学前体
或其他化学物质。词语“基本上不含细胞物质”包括其中蛋白质与它所分离或重组产生的
细胞的细胞组分分离的蛋白质制剂。因此，基本上不含细胞物质的蛋白质包括具有小于
约30％、20％、10％或5％(以干重计)的异源蛋白质(这里也称为“污染蛋白质”)的蛋白质
制剂。当重组产生蛋白质或其生物活性部分时，也优选基本上不含培养基，即培养基占蛋
白质制剂的小于约20 ％、10％或5％的体积。当通过化学合成制备蛋白质时，优选基本上
不含化学前体或其他化学物质，即，它与参与蛋白质合成的化学前体或者其他化学物质分
离。因此，这类蛋白质的制剂具有少于约30％、 20％、10％、5％(以干重计)的化学前体或目标多肽以外的化合物。

[0945] 标志物蛋白质的生物活性部分包括包含与标志物蛋白质的氨基酸序列足够相同的或者是源自于标志物蛋白质的氨基酸序列的氨基酸序列的多肽，其包括比全长蛋白质
较少的氨基酸并表现相应的全长蛋白质的至少一种活性。通常情况下，生物活性部分包含
具有相应的全长蛋白质的至少一种活性的结构域或基序。本发明的标志物蛋白质的生物
活性部分可以是，例如，长度10、25、50、100或更多个氨基酸的多肽。此外，其中标志物蛋白质的其他区域被删除的其它生物活性部分可以通过重组技术制备并评价天然形式的标志
物蛋白质的一个或多个功能活性。

[0946] 优选的标志物蛋白质是由含有编码实施例中所述的任何基因的序列的核苷酸序列编码的。其它有用的蛋白质与这些序列之一基本上相同的(例如，至少约40％，优选
50％、60％、70％、80％、90％、 91％、92％、93％、94％、95％、96％、97％、98％或99％)并保持相应的天然存在的标志物蛋白质的功能活性，但由于天然的等位基因变异或诱突而在
氨基酸序列上不同。

[0947] 为了确定两个氨基酸序列或两个核酸的百分同一性，序列为最佳比较的目的而进行比对(例如，空位可以被引入第一氨基酸或核酸序列的序列中以与第二氨基酸或核酸
序列最优比对)。然后比较相应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当
第一序列中的位置由与第二序列中的相应位置中的相同氨基酸残基或核苷酸占据时，则
分子在该位置上是相同的。优选地，使用全局比对计算两个序列之间的百分同一性。或者
使用局部比对计算两个序列之间的百分同一性。在两个序列之间的百分同一性是序列所
共有的相同位置数的函数(即，％同一性＝相同位置#/总的位置#(例如，重叠的位置)×
100)。在一个实施方式中，两个序列是相同的长度。在另一个实施方式中，两个序列是不
相同的长度。

[0948] 可以使用数学算法来完成两个序列之间的百分同一性的确定。用于比较两个序列的数学算法的一种优选的非限制性的例子是Karlin 和Altschul(1990)
Proc.Natl.Acad.Sci.USA 87:2264-2268的算法，其在Karlin和Altschul(1993)
Proc.Natl.Acad.Sci.USA 90:5873-5877中改进。这样的算法被整合入Altschul等(1990)
J.Mol.Biol.215:403-410 的BLASTN和BLASTX程序中。可以用BLASTN(得分＝100，字长＝
12)程序执行BLAST核苷酸检索以得到与本发明的核酸分子同源的核苷酸序列。可以用
BLASTP程序(得分＝50，字长＝3)进行BLAST 蛋白质检索以得到与本发明的蛋白质分子同
源的氨基酸序列。为了获得用于比较目的的带空位比对，可以使用称为带空位BLAST的新
版 BLAST算法，如Altschul等(1997)Nucleic Acids Res.25:3389-3402中所描述的，其能
够执行用于程序BLASTN、BLASTP和BLASTX的带空位局部比对。或者，可以使用PSI-Blast执
行迭代搜索，其检测分子之间的远缘关系。当利用BLAST、带空位BLAST和PSI-Blast程序
时，可以使用的相应程序(例如，BLASTX和BLASTN)的默认参数。见http://
www.ncbi.nlm.nih.gov。用于序列比较的数学算法的另一个优选的非限制性的例子是
Myers和Miller，(1988)CABIOS 4:11-17 的算法。这样的算法被整合到ALIGN程序(版本
2.0)中，这是GCG 序列比对软件包的部分。当将ALIGN程序用于比较氨基酸序列时，可以使
用PAM120权重残差表(weight residue table)，12的空位长度罚分和4的空位罚分。用于
确定局部序列相似性和比对的区域的再另一种有用的算法是FASTA算法，如Pearson和
Lipman(1988)Proc. Natl.Acad.Sci.USA 85:2444-2448中所描述的。当将FASTA算法用于
比较核苷酸或氨基酸序列时，PAM120权重残差表可以与，例如，2 的k-重值使用。

[0949] 可以使用与上述类似的技术在有或没有允许的空位的情况下确定两个序列之间的百分同一性。在计算百分同一性中，仅计算精确的匹配。

[0950] 本发明还提供了包含标志物蛋白质或其片段的嵌合的或融合的蛋白质。如本文所用的，“嵌合蛋白质”或“融合蛋白质”包含可操作地与异源多肽(即，标志物蛋白质以外的多肽)连接的标志物蛋白质的全部或部分(优选生物活性部分)。在融合蛋白质中，术语
“可操作地连接”是为了表明标志物蛋白质或其片段与异源多肽彼此同框融合。异源多肽
可以与标志物蛋白质或片段的氨基末端或羧基末端融合。

[0951] 一种有用的融合蛋白质是其中的标志物蛋白质或片段融合于 GST序列的羧基末端的GST融合蛋白质。这样的融合蛋白质可以帮助本发明的重组多肽的纯化。

[0952] 在另一个实施方式中，融合蛋白质在其氨基末端包含异源信号序列。例如，标志物蛋白质的天然信号序列可以被移除和被来自另一个蛋白质的信号序列替换。例如，杆状
病毒包膜蛋白的gp67分泌序列可以被用作异源信号序列(Ausubel等编辑，Current
Protocols in Molecular Biology,John Wiley&Sons,NY,1992)。真核异源信号序列的其
他例子包括蜂毒肽和人类胎盘碱性磷酸酶的分泌序列(Stratagene； La Jolla,
California)。在再另一个示例中，可使用的原核异源信号序列包括phoA分泌信号
(Sambrook等，同上)和蛋白A分泌信号 (Pharmacia Biotech；Piscataway,New Jersey)。

[0953] 在再另一个实施方式中，融合蛋白质是其中标志物蛋白质的全部或部分与来自免疫球蛋白家族成员的序列融合的免疫球蛋白融合蛋白。本发明的免疫球蛋白融合蛋白
可合并到药物组合物中，并向受试者施用以抑制配体(可溶的或膜结合的)与细胞表面上
的蛋白质(受体)之间的相互作用，从而在体内抑制信号转导。免疫球蛋白融合蛋白可用
于影响标志物蛋白质的同源配体的生物利用度。配体/受体相互作用的抑制可以是治疗上
有用的，用于治疗增殖性和分化性障碍和用于调节(例如，促进或抑制)细胞的存活。此外，本发明的免疫球蛋白融合蛋白可以被用作免疫原而产生针对受试者中的标志物蛋白质
的抗体以纯化配体，并在筛选试验中，以鉴别抑制标志物蛋白质与配体的相互作用的分
子。

[0954] 可通过标准的重组DNA技术产生本发明的嵌合和融合蛋白质。在另一个实施方式中，可以通过常规技术(包括自动DNA合成仪) 来合成融合基因。或者，可以使用锚定引物进
行基因片段的PCR扩增，其中锚定引物导致两个连续的基因片段之间产生互补悬端，其可
随后进行退火并重新扩增以产生嵌合的基因序列(见，例如，Ausubel 等人，同上)。此外，许多表达载体是市售的，其已编码融合部分(例如，GST多肽)。编码本发明多肽的核酸可以被
克隆到这样的表达载体中以至于融合部分被与本发明的多肽同框地连接。

[0955] 可以使用信号序列来促进标志物蛋白质的分泌和分离。信号序列通常特征是疏水性氨基酸的核心，其一般在一个或多个裂解事件中从分泌过程中的成熟蛋白上被切割。
这种信号肽包含加工位点，其允许在成熟蛋白通过分泌途径时信号序列从成熟蛋白切割。
因此，本发明涉及具有信号序列的标志物蛋白质、融合蛋白或其片段，以及信号序列已经
从其上中被蛋白水解地裂解的这种蛋白质(即，切割产物)。在一个实施方式中，编码信号
序列的核酸序列可以被可操作地连接于表达载体中的目标蛋白质，例如标志物蛋白质或
其片段。信号序列指导蛋白质的分泌，如从表达载体转化到其中的真核宿主分泌，和随后
或同时切割信号序列。然后可以通过本领域公知的方法从细胞外培养基中很容易地纯化
蛋白质。或者，可以使用有利于纯化的序列(如用 GST结构域)将信号序列连接到目标蛋白
质上。

[0956] 本发明还涉及到标志物蛋白质的变体。这样的变体具有改变的氨基酸序列，其可以作为激动剂(模拟物)或拮抗剂发挥功能。变体可以通过诱变产生，例如，离散的点突变
或截短。激动剂可以保留天然存在形式的蛋白质的基本相同的生物活性或生物活性的子
集。蛋白质的拮抗剂可以抑制天然存在形式的蛋白质的一个或多个活性，例如，竞争结合
于其中包括目标蛋白质的细胞信号级联中的下游或上游成员。因此，特定的生物效应可通
过用具有有限功能的变体处理而引起。相对于用天然存在形式的蛋白质进行治疗，用具有
蛋白质天然存在形式的一部分生物活性的变体治疗受试者可以在受试者中有较少的副
作用。

[0957] 可以通过针对激动剂或拮抗剂活性筛选本发明的蛋白质的突变体(例如，截短的突变体)的组合文库鉴别作为激动剂(模拟物)或作为拮抗剂发挥功能的标志物蛋白质的
变体。在一个实施方式中，变体的杂色文库(variegated library)是通过核酸水平的组合
诱变产生的，且由杂色基因文库编码。变体的杂色文库可以通过，例如，将合成寡核苷酸
的混合物酶促接合至基因序列中而产生，以使得潜在蛋白质序列的简并集可作为单个多
肽或可选地作为一组较大的融合蛋白质(例如，对于噬菌体展示)表达。有很多种方法可用
于从简并寡核苷酸序列产生标志物蛋白质的潜在变体的文库。合成简并寡核苷酸的方法
在本领域中是已知的(参见，例如，Narang,1983,Tetrahedron 39:3；Itakura 等,1984,
Annu.Rev.Biochem.53:323；Itakura等,1984,Science 198:1056； Ike等,1983 Nucleic
Acid Res.11:477)。

[0958] 此外，标志物蛋白质片段的文库可用于产生多肽的杂色群体以用于筛选和随后选择变体标志物蛋白或其片段。例如，可以通过在其中每个分子只存在一个切口
(nicking)的条件下用核酸酶处理目的编码序列的双链PCR片段，而使双链DNA变性，使DNA
复性以形成其可以包括来自不同的切口产物的正义/反义对的双链DNA，通过用S1 核酸酶
处理从改组的双链体去除单链部分，和将所获得的片段文库接合至表达载体中来产生编
码序列片段的文库。通过该方法，可以得到编码目标蛋白质的氨基末端和各种尺寸的内部
片段的表达文库。

[0959] 本领域中已知用于筛选通过点突变或截短产生的组合文库的基因产物和用于筛选具有选定的属性的基因产物的cDNA文库的几种技术。用于筛选大基因文库的适合于高
通量分析的最广泛使用的技术通常包括将基因文库克隆到可复制的表达载体中，用得到
的载体文库转化适当的细胞，和在检测所需的活性有利于分离编码其产物被检测的基因
的载体的条件下表达该组合基因。递归集合诱变(REM)，一种提高功能突变在文库中的频
率的技术，可以结合筛选分析使用以鉴别本发明蛋白质的变体(Arkin和Yourvan,1992,
Proc.Natl.Acad.Sci. USA 89:7811-7815；Delgrave等,1993,Protein Engineering 6
(3):327- 331)。

[0960] 本发明的另一个方面涉及针对本发明蛋白质的抗体。在优选的实施方式中，所述抗体特异性结合标志物的蛋白质或其片段。本文中可互换使用的术语“抗体”和“多个抗
体”指免疫球蛋白分子及包含免疫球蛋白分子的免疫学活性部分的其片段和衍生物(即，
这样的部分含有特异性结合抗原如标志物蛋白质(例如标志物蛋白质的表位)的抗原结
合位点)。特异性结合本发明蛋白质的抗体是结合该蛋白质但基本上不结合天然含有该蛋
白质的样品(例如，生物样品)中的其它分子的抗体。免疫球蛋白分子的免疫活性部分的例
子包括，但不限于，单链抗体(scAb)、F(ab)和F(ab')2片段。

[0961] 本发明的分离的蛋白质或其片段可用作免疫原以产生抗体。可以使用全长蛋白质，或可替代地，本发明提供用作免疫原的抗原性肽片段。本发明蛋白质的抗原性肽包含
本发明的蛋白质之一的氨基酸序列的至少8个(优选为10、15、20或30个或更多个)氨基酸
残基，和包括至少一个蛋白质的表位，以至于针对该肽产生的抗体与该蛋白质形成特异
性的免疫复合物。抗原性肽所包含的优选表位是位于蛋白质表面上的区域，例如，亲水性
区域。可以使用疏水性序列分析、亲水性序列分析或类似分析来识别亲水性区域。在优选
的实施方式中，分离的标志物蛋白质或其片段用作免疫原。

[0962] 免疫原通常用来通过免疫合适的(即具有免疫能力的)主体如兔子、山羊、小鼠或其他哺乳动物或脊椎动物制备抗体。合适的免疫原性制剂可以包含，例如，重组表达或化
学合成的蛋白质或肽。该制剂还可以包括佐剂，如弗氏完全或不完全佐剂，或类似的免疫
刺激剂。优选的免疫原组合物是不含其他人类蛋白质的那些，诸如，例如，使用非人类宿
主细胞重组表达本发明蛋白质而形成的免疫原组合物。以这样的方式，获得的抗体组合物
具有减少或没有本发明蛋白质之外的人类蛋白质的结合。

[0963] 本发明提供了多克隆抗体和单克隆抗体。本文所用的术语“单克隆抗体”或“单克隆抗体组合物”是指抗体分子群体，其只包含能够与特定表位免疫反应的一类抗原结合位
点。优选的多克隆抗体和单克隆抗体组合物是已被选择为针对本发明蛋白质的抗体的组
合物。特别优选的多克隆抗体和单克隆抗体制剂是只含有针对标志物蛋白质或其片段的
抗体的制剂。

[0964] 可以通过使用本发明蛋白质作为免疫原对合适的主体进行免疫来制备多克隆抗体。可以通过标准技术，如用酶联免疫吸附试验 (ELISA)，使用固定化多肽随着时间监测免
疫主体中的抗体效价。在免疫后的适当时间，例如，当特定的抗体效价最高时，可以从受试者获得产生抗体的细胞，并通过标准技术，例如最初由Kohler和 Milstein(1975)Nature
256:495-497描述的杂交瘤技术、人B细胞杂交瘤技术(参见Kozbor等，1983,
Immunol.Today 4:72)、EBV-杂交瘤技术(见Cole等，第77-96页，Monoclonal Antibodies
and Cancer Therapy,Alan R.Liss,Inc.,1985)或三元杂交瘤技术，来制备单克隆抗体
(mAb)。用于产生杂交瘤的技术是众所周知的(一般参见Current Protocols in
Immunology,Coligan等编辑,John Wiley&Sons,New York, 1994)。产生本发明的单克隆抗
体的杂交瘤细胞是通过，例如，使用标准的ELISA分析筛选用于结合目标多肽的抗体的杂
交瘤培养物上清液进行检测的。

[0965] 作为用于制备分泌单克隆抗体的杂交瘤的可选方式，可以通过用目标多肽筛选重组组合免疫球蛋白文库(例如，抗体噬菌体展示文库) 来鉴别和分离针对本发明蛋白质
的单克隆抗体。用于产生和筛选噬菌体展示文库的试剂盒是市售可得的(例如，Pharmacia
Recombinant Phage Antibody System,Catalog No.27-9400-01和Stratagene SurfZAP
Phage Display Kit,Catalog No.240612)。此外，特别适合产生和筛选抗体展示文库的方
法和试剂的例子可以在例如，5,223,409号美国专利、PCT公开号WO 92/18619、PCT公开号
WO 91/17271；PCT公开号WO 92/20791、PCT公开号WO 92/15679、PCT公开号WO 93/01288、
PCT公开号WO 92/01047、PCT公开号WO 92/09690、PCT 公开号WO 90/02809；Fuchs等(1991)
Bio/Technology 9:1370-1372；Hay 等(1992)Hum.Antibod.Hybridomas 3:81-85；Huse等，
(1989)Science 246:1275-1281；Griffiths等，(1993)EMBO J.12:725-734中找到。

[0966] 本发明还提供了特异性结合本发明蛋白质的重组抗体。在优选的实施方式中，重组抗体特异性结合标志物蛋白质或其片段。重组抗体包括但不限于，嵌合和人源化单克隆
抗体(其包含人和非人部分)、单链抗体和多特异性抗体。嵌合抗体是其中不同部分是来自
于不同动物物种的分子，如具有源自于鼠mAb的可变区和人免疫球蛋白恒定区的那些
(见，例如，Cabilly等，4,816,567号美国专利和Boss等， 4,816,397号美国专利，其全文通过引用的方式并入本文)。单链抗体具有抗原结合位点和由单一多肽组成。它们可以通过
本领域中已知的技术产生，例如，使用Ladner等，4,946,778号美国专利(通过引用将其全
部并入本文)；Bird等，(1988)Science 242:423-426；Whitlow 等，(1991)Methods in
Enzymology 2:1-9；Whitlow等，(1991)Methods in Enzymology 2:97-105和Huston等,
(1991)Methods in Molecular Design and Modeling:Concepts and Applications 203:
46-88k描述的方法。多特异性抗体是具有至少两个特异性结合不同抗原的抗原结合位点
的抗体分子。这样的分子可以通过本领域已知的技术生产，例如使用在 Segal,4,676,980
号美国专利(其公开的内容通过引用全部并入本文)， Holliger等，(1993)
Proc.Natl.Acad.Sci.USA 90:6444-6448；Whitlow等， (1994)Protein Eng.7:1017-1026
和6,121,424号美国专利中描述的方法。

[0967] 人源化抗体是具有一个或多个来自非人类物种的互补性决定区 (CDR)和来自人免疫球蛋白分子的框架区的来自非人类物种的抗体分子(见，例如，Queen，5,585,089号美
国专利，通过引用将其全部并入本文)。人源化单克隆抗体可以通过本领域中已知的重组
DNA 技术生产，例如，使用PCT公开号WO 87/02671、欧洲专利申请 184,187、欧洲专利申请
171,496、欧洲专利申请173,494、PCT公开号 WO 86/01533、4,816,567号美国专利、欧洲专
利申请125,023、Better 等(1988)Science 240:1041-1043；Liu等(1987)
Proc.Natl.Acad.Sci.USA 84:3439-3443；Liu等(1987)J.Immunol.139:3521-3526；Sun等
(1987) Proc.Natl.Acad.Sci.USA 84:214-218；Nishimura等(1987)Cancer Res. 47:999-
1005；Wood等(1985)Nature 314:446-449和Shaw等(1988)J. Natl.Cancer Inst.80:1553-
1559)；Morrison(1985)Science 229:1202-1207； Oi等(1986)Bio/Techniques 4:214；5,
225,539号美国专利；Jones等(1986) Nature 321:552-525；Verhoeyan等(1988)Science
239:1534和Beidler等 (1988)J.Immunol.141:4053-4060中所述的方法。

[0968] 更具体地，人源化抗体可以例如，使用不能表达内源性免疫球蛋白重链和轻链基因但是可以表达人重链和轻链基因的转基因小鼠产生。用所选择的抗原(例如，对应于本
发明标志物的多肽的全部或部分)以正常的方式免疫转基因小鼠。针对该抗原的单克隆抗
体可以使用常规杂交瘤技术获得。转基因小鼠携带的人免疫球蛋白转基因在B 细胞分化
过程中重新排列，并随后发生类别转换和体细胞突变。因此，使用这样的技术，有可能产生治疗上有用的IgG、IgA和IgE抗体。对于用于产生人抗体的这项技术的综述，参见Lonberg
和Huszar (1995)Int.Rev.Immunol.13:65-93。对于用于产生人抗体和人单克隆抗体的这
种技术和用于产生这样的抗体的方案的详细讨论，参见，例如，5,625,126号美国专利、5,
633,425号美国专利、5,569,825号美国专利、5,661,016号美国专利和5,545,806号美国专
利。此外，公司如 Abgenix Inc.(Freemont,CA)可从事于使用类似上述的技术提供针对选
择的抗原的人类抗体。

[0969] 可以使用被称为“导向选择”的技术产生识别选定的表位的完全的人抗体。在这种方法中，选定的非人单克隆抗体，例如，鼠抗体，被用于指导选择识别相同表位的完全的人抗体(Jespers等，1994, Bio/technology 12:899-903)。

[0970] 可以在生产(例如，从受试者的血液或血清)或合成后分离本发明的抗体和通过熟知的技术进一步纯化。例如，可以使用蛋白A色谱纯化IgG抗体。可以通过，例如，亲和层析选择(例如，部分纯化) 或纯化对本发明的蛋白质特异性的抗体。例如，如本文所述的产
生本发明的重组表达和纯化(或部分纯化)的蛋白质，和共价或非共价地结合到固体支持
物(如，例如，层析柱)上。然后该柱可以用于从含有针对大量的不同表位的抗体的样品中
亲和纯化对本发明的蛋白质特异性的抗体，从而产生基本上纯化的抗体组合物，即基本上
不含污染抗体的抗体组合物。在上下文中，基本上纯化的抗体组合物是指抗体样品中含
有至多仅30％(以干重计算)的针对本发明所需蛋白质的表位以外的表位的污染抗体，且
优选最多20％，还更优选最多10％，并且最优选最多5％(以干重计算)的样品是污染的抗
体。纯化的抗体组合物是指组合物中至少99％的抗体是针对本发明的所需蛋白质。

[0971] 在优选的实施方式中，本发明的基本上纯化的抗体可特异性地结合本发明蛋白质的信号肽、分泌序列、胞外结构域、跨膜或胞质域或者胞质膜。在特别优选的实施方式
中，本发明的基本上纯化的抗体特异性结合本发明蛋白质的氨基酸序列的分泌序列或胞
外结构域。在更优选的实施方式中，本发明的基本上纯化的抗体特异性结合标志物蛋白
质的氨基酸序列的分泌序列或胞外结构域。

[0972] 通过标准技术，如亲和色谱法或免疫沉淀，可以将针对本发明蛋白质的抗体用于分离该蛋白质。此外，这样的抗体可用于检测标志物蛋白质或其片段(例如，在细胞溶解产
物或细胞上清液中)，以评估标志物的表达水平和表达谱。该抗体也可在诊断上被用于监
测组织或人体体液中(例如，疾病或毒性状态相关的体液中)的蛋白质水平而作为临床检
验的部分，例如用于，例如，测定给定的治疗方案的疗效。通过使用抗体衍生物可以有助于检测，其中该抗体衍生物包含与可检测物质偶联的本发明的抗体。可检测物质的例子包括
各种酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的例子包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶；合适的辅基复合体的例子包
括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素；合适的荧光材料的例子包括伞形酮、
荧光素、异硫氰酸荧光素、若丹明、二氯三嗪基胺荧光素、丹磺酰氯或藻红蛋白；发光材料的例子包括鲁米诺；生物发光材料的例子包括萤光素酶、萤光素和水母蛋白；合适的放射
性物质的例子包括125I、131I、35S或3H。

[0973] 本发明的抗体也可以用作治疗癌症的治疗剂。在优选的实施方式中，将本发明的完全人抗体用于治疗性治疗人类癌症患者，特别是那些患有癌症的患者。在另一个优选的
实施方式中，特异性结合标志物蛋白质或其片段的抗体被用于治疗性治疗。另外，这样的
治疗性抗体可以是抗体衍生物或免疫毒素，其包含与治疗性基团如细胞毒素、治疗剂或
放射性金属离子偶联的抗体。细胞毒素或细胞毒性剂包括任何对细胞有害的试剂。其实例
包括紫杉醇、细胞松弛素B、短杆菌肽D、溴化乙锭、吐根碱、丝裂霉素、依托泊苷，替尼泊苷、长春新碱、长春碱、秋水仙素、阿霉素、柔红霉素、二羟基蒽二酮(dihydroxy anthracin
dione)、米托蒽醌、光辉霉素、放线菌素D、1-脱氢睾酮、糖皮质激素、普鲁卡因、丁卡因、利多卡因、心得安和嘌呤霉素及其类似物或同源物。治疗剂包括但不限于，抗代谢物(例如，
氨甲喋呤、6-巯基嘌呤、6-硫鸟嘌呤、阿糖胞苷、5-氟尿嘧啶、氮烯唑胺)、烷基化剂 (如氮芥、塞替派(thioepa)、苯丁酸氮芥、美法仑、卡莫司汀(BSNU) 和洛莫司汀(CCNU)、环磷酰胺(cyclothosphamide)、白消安、二溴甘露醇、链脲佐菌素、丝裂霉素C和顺二氯二胺铂(II)
(DDP)顺铂)、蒽环类抗生素(如，道诺红霉素(原道诺霉素)和阿霉素)、抗生素(如放线菌
素D(原放线菌素)、博莱霉素、光神霉素和氨茴霉素(AMC)) 和抗有丝分裂剂(例如，长春新
碱和长春花碱)。

[0974] 本发明的偶联抗体可用于改变给定的生物反应，因为药物部分不应理解为限于经典的化学治疗剂。例如，该药物部分可以是具有所需的生物学活性的蛋白质或多肽。这
些蛋白质可以包括，例如，毒素如核糖体抑制蛋白质(参见Better等，6,146,631号美国专
利，在此全部引入其公开内容)、相思豆毒蛋白、蓖麻蛋白质A、假单胞菌外毒素或白喉毒
素；蛋白质如肿瘤坏死因子、α-干扰素、β-干扰素、神经生长因子、血小板源生长因子、组织纤溶酶原激活剂或生物反应调节剂；或生物反应调节剂如，例如，淋巴因子、白介素1(“IL-
1”)、白细胞介素2(“IL-2”)、白细胞介素6(“IL-6”)、粒细胞巨噬细胞集落刺激因子(“GM-CSF”)、粒细胞集落刺激因子(“G-CSF”)或其它生长因子。

[0975] 用于将这些治疗部分与抗体相偶联的技术是众所周知的，见例如，Arnon等,"Monoclonal Antibodies For Immunotargeting Of Drugs In Cancer Therapy",
Monoclonal Antibodies And Cancer Therapy,Reisfeld等 (eds.),pp.243-56(Alan
R.Liss,Inc.1985)；Hellstrom等,"Antibodies For Drug Delivery",Controlled Drug
Delivery(2nd Ed.),Robinson等(eds.),pp. 623-53(Marcel Dekker,Inc.1987)；
Thorpe,"Antibody Carriers Of Cytotoxic Agents In Cancer Therapy:A Review",
Monoclonal Antibodies '84:Biological And Clinical Applications,Pinchera等
(eds.),pp.475-506 (1985)；"Analysis,Results,And Future Prospective Of The
Therapeutic Use Of Radiolabeled Antibody In Cancer Therapy",Monoclonal
Antibodies For Cancer Detection And Therapy,Baldwin等(eds.),pp.303-16
(Academic Press 1985)和Thorpe等,"The Preparation And Cytotoxic Properties Of
Antibody-Toxin Conjugates",Immunol.Rev.,62:119-58(1982)。

[0976] 因此，在一个方面，本发明提供了基本上纯化的抗体、抗体片段和衍生物，其全部特异性结合本发明的蛋白质和优选地标志物蛋白质。在各种实施方式中，本发明的基本上
纯化的抗体或它们的片段或衍生物可以是人抗体、非人抗体、嵌合抗体和/或人源化抗体。
在另一个方面，本发明提供了非人抗体、抗体片段和衍生物，其全部特异性结合本发明的
蛋白质和优选标志物蛋白质。这种非人抗体可以是山羊、小鼠、绵羊、马、鸡、兔或大鼠抗体。或者，本发明的非人抗体可以是嵌合的和/或人源化的抗体。此外，本发明的非人抗体
可以是多克隆抗体或单克隆抗体。在再进一步的方面，本发明提供了单克隆抗体、抗体片
段和衍生物，其全部特异性结合本发明的蛋白质和优选标志物蛋白质。该单克隆抗体可以
是人抗体、人源化抗体、嵌合抗体和 /或非人抗体。

[0977] 本发明还提供了含有与可检测物质相结合的本发明抗体及其使用说明的试剂盒。本发明的再另一个方面是药物组合物，其含有本发明的抗体。在一个实施方式中，该药物组合物包含本发明的抗体和药学上可接受的载体。

[0978] E、预测医学

[0979] 本发明涉及预测医学领域，其中诊断分析、预后分析、药物基因组学和监测临床试验被用于预后(预测)的目的，从而预防性地治疗个体。因此，本发明的一个方面涉及用
于测定一种或多种标志物蛋白质或核酸的表达水平的诊断分析，以确定个体是否有发生
某种疾病或药物诱导的毒性的危险。这些分析可用于预后或预测的目的，从而在疾病发
病前预防性地治疗个体。

[0980] 本发明的再另一个方面涉及在临床试验中监测试剂(例如，施用以抑制或者以治疗或预防疾病或药物诱导的毒性的药物或其他化合物{即，为了了解这种治疗可能有的任
何药物诱导的毒性效应})对本发明的标志物的表达或活性的影响。在下面的章节中更详
细地描述这些和其它试剂。

[0981] F、诊断分析

[0982] 用于检测在生物样品中标志物蛋白质或核酸存在或不存在的示例性方法包括从测试对象获得生物样品(例如，毒性相关的体液或组织样品)和将生物样品与能够检测多
肽或核酸(例如，mRNA、基因组DNA或cDNA)的化合物或试剂相接触。因此，本发明的检测方法可以用于，例如，在体外生物样品中和在体内检测mRNA、蛋白质、 cDNA或基因组DNA。例
如，用于检测mRNA的体外技术包括RNA 杂交和原位杂交。用于检测标志物蛋白质的体外技
术包括酶联免疫吸附分析(ELISA法)、蛋白质印迹、免疫沉淀和免疫荧光。用于检测基因
组DNA的体外技术包括DNA杂交。用于检测mRNA的体内技术包括聚合酶链反应(PCR)、RNA杂
交和原位杂交。此外，用于检测标志物蛋白质的体内技术包括向受试者体内引入针对该蛋
白质或其片段的标记抗体。例如，可以用其在受试者中的存在和位置可以通过标准的成
像技术检测的放射性标记来标记该抗体。

[0983] 这种诊断和预后分析的一般原理涉及在适当条件下和经过足够允许标志物和探针相互作用和结合的时间制备其中可以包含标志物和探针的样品或反应混合物，从而形
成可以从反应混合物中被去除和 /或检测的复合物。可以以各种不同的方式进行这些分
析。

[0984] 例如，进行这样的分析的一种方法涉及将标志物或探针锚定在固相载体(也称为基底)上，和在反应结束时检测锚定固相上的目标标志物/探针复合物。在这样的方法的一
个实施方式中，可以将用来测定标志物的存在和/或浓度的来自受试者的样品锚定到载体
或固相支持物上。在另一个实施方式中，相反的情况是可能的，其中探针可以被锚定到固
相上和可以允许来自受试者的样品作为该分析的未锚定组分进行反应。

[0985] 有许多已建立的方法用于将测定组分锚定到固相上。这些包括，但不限于，通过生物素和抗生蛋白链菌素的偶联被固定的标志物或探针分子。可以使用本领域中已知的
技术(例如，生物素化试剂盒，Pierce Chemicals,Rockford,IL)从生物素-NHS(N-羟基琥珀
酰亚胺)制备这样的生物素化分析成分，并固定在抗生蛋白链菌素涂布的96孔板 (Pierce
Chemical)的孔中。在某些实施方式中，可以预先制备并存储具有固定的分析成分的表面。

[0986] 用于这些分析的其它合适的载体或固相支持物包括能够结合标志物或探针所属的分子种类的任何材料。众所周知的支持物或载体包括，但不限于，玻璃、聚苯乙烯、尼龙、聚丙烯、尼龙、聚乙烯、葡聚糖、淀粉酶、天然和改性的纤维素、聚丙烯酰胺、辉长岩和磁铁矿。

[0987] 为了用上述的方法进行分析，将非固定的成分添加到第二成分被锚定于其上的固相上。反应完成后，可以在使得所形成的任何复合物将保持固定在固相上的条件下移除
(例如，通过洗涤)未复合的成分。检测锚定在固相上的标志物/探针复合物可以通过本文
中概述的多种方法来完成。

[0988] 在优选的实施方式中，当探针是未锚定的分析成分时，其可以用本文所讨论的并且是本领域技术人员公知的可检测标记直接或间接地标记以用于检测和分析读出的目
的。

[0989] 也可能不经过任一成分(标志物或探针)的进一步操作或标记而直接检测标志物/探针复合物形成，例如，通过利用荧光能量转移的技术(参见，例如，Lakowicz等，5,
631,169号美国专利；Stavrianopoulos 等，4,868,103号美国专利)。第一“供体”分子上的荧光团标记经选择以使得在用适当波长的入射光激发时，其发射的荧光能量将被第二
“受体”分子上的荧光标记吸收，其随之能够由于所吸收的能量而发荧光。可选地，“供体”蛋白质分子可以简单地利用色氨酸残基的自然荧光能量。选择发射不同光波长的标记，这
样可以将“受体”分子标记与“供体”的标记区分开来。由于标记之间的能量转移效率与分隔分子的距离有关，可以对分子之间的空间关系进行评估。在分子间发生结合的情况下，
在分析中“受体”分子标记的荧光发射应该是最大的。可以通过本领域中公知的标准荧光
检测装置(例如，使用荧光计)很方便地测量FET结合事件。

[0990] 在另一个实施方式中，可以通过利用如实时生物分子相互作用分析(BIA)的技术在不标记任何分析成分(探针或标志物)的情况下完成探针识别标志物的能力的测定(见，
例如，Sjolander,S.和 Urbaniczky,C.,1991,Anal.Chem.63:2338-2345和Szabo等,1995,
Curr. Opin.Struct.Biol.5:699-705)。如本文所用的“BIA”或“表面等离子体激元共振”是用于研究实时生物特异性相互作用而不标记任何的相互作用物的技术(例如，
BIAcore)。在结合表面处的质量变化(结合事件的表示)导致表面附近的光的折射率的改
变(表面等离激元共振 (SPR)的光学现象)，从而产生可检测的信号，该信号可以用作生物
分子之间的实时反应的指示。

[0991] 或者，在另一个实施方式中，可以用标志物和探针作为液相中的溶质进行类似的诊断和预测分析。在这样的分析中，通过多种标准技术中的任何一种(包括但不限于：差速
离心法、色谱法、电泳和免疫沉淀)将复合的标志物和探针与未复合的成分分离。在差速离
心中，由于复合物根据其不同尺寸和密度而具有的不同的沉降平衡，可通过一系列的离
心步骤将标志物/探针复合物与未复合的分析成分分离(参见，例如，Rivas,G.和Minton,
A.P.,1993,Trends Biochem Sci. 18(8):284-7)。也可以利用标准的色谱技术将复合的分
子与未复合的分子分离。例如，凝胶过滤色谱法基于大小分离分子，并例如，通过利用柱
形式的适当凝胶过滤树脂，可以将相对较大的成分与相对较小的未复合的成分分离。类似
地，可利用与未复合的成分相比标记/探针复合物相对不同的电荷性质将复合物与未复合
的成分区分开，例如，通过利用离子交换色谱树脂。这样的树脂和色谱技术是本领域的技
术人员众所周知的(见，例如，Heegaard，NH，1998，J.Mol.Recognit. Winter 11(1-6):
141-8；Hage,D.S.和Tweed,S.A.J Chromatogr B Biomed Sci Appl 1997 Oct 10；699(1-
2):499-525)。也可以使用凝胶电泳将复合的分析成分与未结合的成分分离(见，例如，
Ausubel等编辑，Current Protocols in Molecular Biology,John Wiley&Sons,New
York, 1987-1999)。在该技术中，例如，根据大小或电荷分离蛋白质或核酸复合物。为了在电泳过程中维持结合相互作用，非变性凝胶基质材料和没有还原剂存在的条件通常是优
选的。对于特定的分析适当的条件和其成分是本领域的技术人员众所周知的。

[0992] 在特定实施方式中，可以使用在本领域中已知的方法，通过原位和体外形式在生物样品中测定标志物mRNA的水平。术语“生物样品” 意在包括从受试者分离的组织、细胞、生物流体及其分离物，以及受试者中存在的组织、细胞和流体。许多表达检测方法使用分
离的RNA。对于体外方法，可以利用任何不是针对mRNA的分离而选择的RNA 分离技术用于
从细胞中纯化RNA(见，例如，Ausubel等编辑，Current Protocols in Molecular Biology,
John Wiley&Sons,New York 1987-1999)。此外，可以通过在本技术领域的技术人员公知的
技术很容易地处理大量的组织样品，如，例如，Chomczynski(1989，4,843,155 号美国专
利)的单步RNA分离方法。

[0993] 分离的mRNA可被用于杂交或扩增分析中，其包括，但不限于， DNA印迹或RNA印迹分析、聚合酶链反应分析和探针阵列。用于 mRNA水平检测的一个优选的诊断方法包括将分
离的mRNA与核酸分子(探针)接触，该核酸分子(探针)可以与待检测的基因所编码的mRNA
杂交。该核酸探针可以是，例如，全长cDNA或其一部分，如长度至少为7、15、30、50、100、250或500个核苷酸和足以在严格条件下与编码本发明标志物的mRNA或基因组DNA特异性杂交
的寡核苷酸。此处描述了本发明的诊断分析法中使用的其它合适的探针。mRNA与探针的
杂交表明所关注的标志物正被表达。

[0994] 在一种形式中，mRNA被固定在固体表面上并与探针接触，例如通过在琼脂糖凝胶上运行分离的mRNA和将mRNA从凝胶中转移到膜(如硝酸纤维素)上。在替代的形式中，探针
被固定在固体表面上，并且mRNA与探针接触，例如，在Affymetrix基因芯片阵列中。本领
域技术人员可以很容易地将已知的mRNA检测方法适应用于检测本发明的标志物所编码的
mRNA的水平。

[0995] 用于测定样品中的mRNA标志物的水平的替代方法涉及核酸扩增的过程，例如，通过RT-PCR(试验性实施方式在Mullis，1987， 4,683,202号美国专利中给出)、连接酶链反应
(Barany,1991,Proc.Natl. Acad.Sci.USA,88:189-193)、自持序列复制(Guatelli等，
1990,Proc. Natl.Acad.Sci.USA 87:1874-1878)、转录扩增系统(Kwoh等，1989,Proc.
Natl.Acad.Sci.USA 86:1173-1177)、Q-β复制酶(Lizardi等,1988, Bio/Technology 6:
1197)、滚环复制(Lizardi等，5,854,033号美国专利) 或任何其他的核酸扩增方法，随后用
本领域技术人员熟知的技术检测扩增的分子。如果这样的分子以非常低的数量存在，这些
检测方案对核酸分子的检测是特别有用的。如本文所用的，扩增引物被定义为可以与基
因的5'或3'区域(分别是正负链，或反之亦然)退火并包含其间的短区域的一对核酸分子。
在一般情况下，扩增引物长度是从约10 至30个核苷酸且和侧邻约50至200个核苷酸长度的
区域。在适当条件下和使用适当的试剂，这样的引物允许扩增含有引物侧邻的核苷酸序
列的核酸分子。

[0996] 对于原位方法，不需要在检测前分离mRNA。在这样的方法中，使用已知的组织学方法制备/处理细胞或组织样品。然后将样品固定在支持物上，通常是载玻片上，和然后与
可以与编码标志物的mRNA 杂交的探针接触。

[0997] 作为基于标志物的绝对表达水平进行测定的一种替代方法，可以基于标志物的标准化表达水平进行测定。通过将其表达水平与非标志物的基因(例如，组成型表达的管
家基因)的表达进行比较来校正标志物的绝对表达水平而使表达水平标准化。用于标准化
的合适的基因包括管家基因，例如肌动蛋白基因或上皮细胞特异性基因。这种标准化允
许在一个样品(例如，患者样品)与另一样品(例如，非疾病或非毒性样品)中或者来自不同
来源的样品之间表达水平的比较。

[0998] 或者表达水平可提供为相对表达水平。为确定标志物的相对表达水平，在测定关注的样品的表达水平之前，测定10个或更多个样品，优选50个或更多个样品的正常与疾病
或毒性细胞分离物的标志物表达水平。测定在该多个样品中分析的各个基因的平均表达
水平，且将其用作标志物的基线表达水平。然后将对于测试样品测定的标志物的表达水
平(绝对表达水平)除以对该标志物获得的平均表达值。这提供了相对表达水平。

[0999] 优选地，在基线测定中所用的样品来自非疾病或非毒性的细胞。细胞来源的选择取决于相对表达水平的用途。使用在正常组织中建立的表达作为平均表达评分有助于验
证分析的标志物是否是疾病或毒性特异性的(相对于正常细胞)。此外，随着更多的数据被
积累，平均表达值可以被修正，从而提供基于累积的数据的改进的相对表达值。来自疾病
细胞或毒性细胞的表达数据提供了用于分级疾病或毒性状态的严重程度的手段。

[1000] 在本发明的另一个实施方式中，检测标志物蛋白质。用于检测本发明的标志物蛋白质的一种优选的试剂是能够结合这种蛋白质或其片段的抗体，优选具有可检测标记的
抗体。抗体可以是多克隆的，或更优选单克隆的。可以使用完整的抗体或者其片段或衍生
物(例如， Fab或F(ab')2)。关于探针或抗体的术语“标记的”意图包括通过将可检测物质
与探针或抗体偶联(即物理连接)直接标记探针或抗体，以及通过与直接标记的另一种试
剂的反应性而间接标记探针或抗体。间接标记的实例包括用荧光标记的第二抗体检测第
一抗体和用生物素末端标记DNA探针以使得其可以用荧光标记的抗生蛋白链菌素检测。

[1001] 可以使用本领域的技术人员公知的技术从细胞分离蛋白质。所使用的蛋白质分离方法可以是，例如，如Harlow和Lane(Harlow和 Lane，1988,Antibodies:A Laboratory
Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York)中所描
述的那些。

[1002] 可以采用多种形式来检测样品是否含有结合给定抗体的蛋白质。这些形式的例子包括，但不限于，酶免疫分析法(EIA)、放射免疫分析(RIA)、蛋白质印迹分析和酶联免疫吸附试验(ELISA)。技术人员可以很容易地将已知的蛋白质/抗体检测方法适应用于测定
细胞是否表达了本发明的标志物。

[1003] 在一种形式中，可以在如蛋白质印迹或免疫荧光技术的方法中使用抗体或者抗体片段或衍生物来检测所表达的蛋白质。在这类用途中，通常优选的是在固体载体上固定
抗体或蛋白质。合适的固相支持物或载体包括能结合抗原或抗体的任何支持物。众所周知
的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然和修饰的纤维素、聚丙烯酰胺、辉长岩和磁铁矿。

[1004] 本领域技术人员知道用于结合抗体或抗原的许多其它合适的载体，且能够使这样的支持物适应用于本发明。例如，可以在聚丙烯酰胺凝胶电泳上运行从疾病或毒性细胞
中分离的蛋白质，并固定到固相支持物如硝酸纤维素上。然后，可以用合适的缓冲液洗涤
支持物，接着用可检测地标记的抗体进行处理。然后可以用缓冲液第二次洗涤固相支持
物以除去未结合的抗体。然后，可以通过常规方法检测固体支持物上的结合标记的量。

[1005] 本发明还包括用于检测生物样品中标志物蛋白质或核酸的存在的试剂盒。这种试剂盒可用于测定患者是否患有某些疾病或药物诱导的毒性或存在增高的风险。例如，该
试剂盒可以包含能够检测生物样品中的标志物蛋白质或核酸的标记的化合物或试剂，以
及用于测定样品中蛋白质或mRNA量的手段(例如，结合蛋白质或其片段的抗体，或结合编
码该蛋白质的DNA或mRNA的寡核苷酸探针)。试剂盒还可以包括解释使用试剂盒获得的结
果的说明。

[1006] 对于基于抗体的试剂盒，试剂盒可以包括，例如：(1)结合于标志物蛋白质的第一抗体(例如，连接于固体支持物)，以及任选地， (2)结合蛋白质或第一抗体且与可检测的标
记偶联的不同的第二抗体。

[1007] 对于基于寡核苷酸的试剂盒，该试剂盒可以包含，例如：(1) 寡核苷酸，例如可检测地标记的寡核苷酸，其与编码标志物蛋白质的核酸序列杂交，或(2)用于扩增标志物核
酸分子的一对引物。该试剂盒还可以包含，例如，缓冲剂、防腐剂或蛋白质稳定剂。该试剂盒可以进一步包含用于检测可检测标记所需的成分(例如，酶或底物)。该试剂盒还可以
包含可进行测定和与测试样品比较的对照样品或一系列对照样品。试剂盒中的各种成分
可以封闭在单个容器中，且所有的各种不同容器可以与用于解释使用试剂盒进行分析的
结果的说明一起置于单一包装内。

[1008] G、药物基因组学

[1009] 本发明的标志物也可用作药物基因组学标志物。如本文所用的， “药物基因组学标志物”是其表达水平与特定的临床药物反应或在患者体内的易感性相关的客观生化标
志物(参见，例如，McLeod等(1999) Eur.J.Cancer 35(12):1650-1652)。药物基因组学标志
物表达的存在或量与患者的预测响应和更具体地与患者的疾病或毒性细胞对特定的药
物或药物种类的治疗的预测响应相关。通过评估在患者体内一种或多种药物基因组学标
志物的存在或表达量，最适合患者的或预计将有更大程度的成功的药物治疗可以被选择。
例如，基于在患者中特异性癌症标志物所编码的RNA或蛋白质的存在或量，可以选择被优
化用于很可能存在于患者中的特定肿瘤的治疗的药物或治疗过程。因此利用药物基因组
学标志物允许选择或设计对于各个癌症患者的最适合治疗而不用尝试不同的药物或方
案。

[1010] 药物基因组学的另一个方面涉及改变身体作用于药物的方式的遗传学状态。这些药物遗传学状态可作为罕见的缺陷或作为多态性存在。例如，葡萄糖-6-磷酸脱氢酶
(G6PD)缺陷是一种常见的遗传性酶病，其中主要临床并发症是摄入氧化剂药物(抗疟疾药
物、磺胺类药物、止痛药、硝基呋喃)和食用蚕豆后的溶血。

[1011] 作为说明性的实施方式，药物代谢酶的活性是药物作用的强度和持续时间的主要决定因素。药物代谢酶(如N-乙酰基转移酶2(NAT2) 和细胞色素P450酶CYP2D6和
CYP2C19)的基因多态性的发现已经给为什么有些患者在服用了标准和安全剂量的药物后
无法获得预期的药物效果或表现出过大的药物反应和严重的毒性提供了一个解释。这些
多态性在人群中表现为两种表型，强代谢者(EM)和弱代谢者 (PM)。PM的患病率在不同人群
中不同。例如，编码CYP2D6的基因是高度多态性的，并已在PM中确定了几种突变，其中所有这些都导致功能性CYP2D6的缺失。当他们接受标准剂量时，CYP2D6和 CYP2C19弱代谢者非
常经常地发生过大的药物反应和副作用。如果代谢产物是活性的治疗成分，PM不显示治疗
效应，如由CYP2D6形成的可待因代谢产物吗啡介导的可待因镇痛效果所证明的。另一个极
端是所谓的超快代谢者，其对标准剂量无反应。最近，超快代谢的分子基础已被确定为是
由于CYP2D6基因的扩增。

[1012] 因此，可以测定在个体中本发明的标志物的表达水平，从而选择用于该个体的治疗或预防性治疗的适当药剂。此外，药物遗传学研究可用于将编码药物代谢酶的多态性等
位基因的基因分型应用于识别个体的药物反应表型。当这一知识被应用至剂量定量或药
物选择时，可避免不良反应或治疗失败，且因此当治疗具有本发明标志物的表达的调节
子的受试者时提高治疗或预防的效率。

[1013] H、监测临床试验

[1014] 监测药剂(如，药物化合物)对本发明的标志物的表达水平的影响不仅可以被应用于基本的药物筛选，而且可以应用于临床试验。例如，可以在接受某些疾病(如癌症、糖
尿病、肥胖症、心血管疾病和心脏毒性)或药物诱导毒性的治疗的受试者的临床试验中，监
测试剂影响标志物的表达的有效性。在优选的实施方式中，本发明提供了用于监测用药
剂(例如，激动剂、拮抗剂、拟肽、蛋白质、肽、核酸、小分子或其他的药物候选物)治疗受试者的有效性的方法，包括以下步骤：(i)在施用药剂前，从受试者获得给药前样品；(ii)检
测给药前样品中本发明的一个或多个选择的标志物的表达水平；(iii)从受试者获得一
个或多个给药后样品；(iv)检测给药后样品中标志物的表达水平；(v)将给药前样品中标
志物的表达水平与一个或多个给药后样品中标志物的表达水平相比较；及(vi)相应地改
变药剂对受试者的施用。例如，在治疗过程中增加的标志物基因的表达可以表明无效的
剂量和需要提高剂量。相反，标志物基因的表达下降可以表明有效的治疗和无需改变剂
量。

[1015] H、阵列

[1016] 本发明还包括含有本发明的标志物的阵列。该阵列可用于分析在阵列中的一个或多个基因的表达。在一个实施方式中，该阵列可以用于分析在组织中的基因表达以确定
阵列中的基因的组织特异性。以这种方式，高达约7600个基因可以被同时用于表达的分
析。这允许开发显示在一种或多种组织中特异性表达的一组基因的图谱。

[1017] 除了这样的定性测定，本发明还允许基因表达定量。因此，不仅组织特异性，而且在组织中一组基因的表达水平是可确定的。因此，基因可以基于其本身的组织表达和在该
组织中的表达水平被分组。这可用于，例如，确定组织之间或组织中的基因表达的关系。因此，一个组织可以被扰动，且可确定对第二组织中基因表达的影响。在这方面，响应于生
物刺激的一种细胞类型对另一种细胞类型的影响可以被确定。这样的确定可用于，例如，
了解基因表达水平上细胞-细胞相互作用的影响。如果药剂被治疗性地施用以处理一种细
胞类型，但对另一种细胞类型具有不希望的效应，则本发明提供了用于确定不希望的效
应的分子基础的分析方法并因此提供共同施用对抗试剂或以其他方式处理不希望的效应
的机会。类似地，即使在单一的细胞类型中，可以在分子水平上确定不希望的生物效应。因此，可以确定试剂对靶基因以外的表达的影响和抵消该影响。

[1018] 在另一个实施方式中，阵列可以用来监测阵列中一个或多个基因的表达的时间过程。这可能发生在各种生物背景下发生，如本文所公开的，例如药物诱导的毒性的发生，药物诱导的毒性的发展，以及过程，如与药物诱导的毒性相关的细胞转化。

[1019] 阵列也可用于确定基因的表达对同一细胞中或不同细胞中的其他基因的表达的影响。这提供了例如，用于治疗干预的可选分子靶标的选择，如果不能调节最终或下游的
靶标。

[1020] 阵列也可用于确定在正常和异常的细胞中的一种或多种基因的差异表达模式。这提供了可以作为诊断或治疗性干预的分子靶标的一组基因。

[1021] VII、获取样品的方法

[1022] 在本发明的方法中有用的样品包括表达本发明的标志物的任何组织、细胞、组织活检或体液样品。在一个实施方式中，样品可以是组织、细胞、全血、血清、血浆、口腔刮取物、唾液、脑脊液、尿、大便或支气管肺泡灌洗液。在优选的实施方式，组织样品是疾病状态或毒性状态样品。在更优选的实施方式中，组织样品是癌症样品、糖尿病样品、肥胖症样
品、心血管样品或药物诱导毒性样品。

[1023] 可以通过多种本领域中已知的技术从受试者获得身体样品，包括，例如，通过使用活组织检查或通过刮取或擦拭一个区域或通过利用针头吸取体液。收集各种身体样品
的方法在本领域中是众所周知的。

[1024] 适用于检测和定量本发明的标志物的组织样品可以是新鲜的、冷冻的或根据本技术领域的技术人员已知的方法固定的。合适的组织样品优选被切片和置于显微镜载片
上作进一步分析。另外，固体样品，即，组织样品，可以被溶解和/或均质化，并随后作为可溶性提取物进行分析。

[1025] 在一个实施方式中，使用，例如，液态氮或二氟二氯甲烷冷冻新得到的组织活检样品。冷冻样品被安装用于使用例如OCT切片，并在低温恒温器中连续切片。连续的切片被
收集在玻璃显微镜载片上。对于免疫组化染色，切片可涂覆有，例如，铬明矾、明胶或聚-L-赖氨酸以确保切片粘着到载片上。在另一个实施方式中，在切片之前固定和包埋样品。例
如，组织样品可以在例如福尔马林中固定，连续脱水，并包埋在例如石蜡中。

[1026] 一旦得到样品，可以使用在本领域中已知适合用于检测和定量分析本发明的标志物的任何方法(无论是在核酸或在蛋白质水平上)。这类方法是众所周知的，且包括但不
限于蛋白质印迹、RNA杂交、 DNA杂交、免疫组织化学、ELISA例如，扩增的ELISA、免疫沉淀、免疫荧光、流式细胞术、免疫细胞化学、质谱分析例如，MALDI-TOF 和SELDI-TOF、核酸杂交技术、核酸逆转录方法和核酸扩增方法。在特定的实施方式中，使用例如，与这些蛋白质特异性结合的抗体在蛋白质水平上检测本发明标志物的表达。

[1027] 样品可能需要被改变以使本发明的标志物易于被抗体结合。在免疫细胞化学或免疫组织化学方法的特定方面，载片可被转移到预处理缓冲液中和任选地加热以增加抗
原可达性。加热预处理缓冲液中的样品迅速地破坏了细胞的脂质双层，和使得抗原(可以
是新鲜标本中的情况，但通常不是发生在固定标本中的情况)更易于为抗体结合。本文中
可互换地使用术语“预处理缓冲液”和“制备缓冲液”，其指用于制备用于免疫染色的细胞学或组织学样品，尤其是通过提高本发明标志物用于抗体结合的可达性的缓冲液。预处理
缓冲液可以包含pH特异性的盐溶液、聚合物、洗涤剂或者非离子或阴离子表面活性剂，例
如，乙氧基化的阴离子型或非离子型表面活性剂、链烷酸或烷氧基化物或甚至这些表面
活性剂的共混物或甚至使用胆汁盐。预处理缓冲液可以是，例如，0.1％至1％的脱氧胆酸、钠盐的溶液、或月桂醇醚-13-羧酸酯钠(例如，Sandopan LS)或和乙氧基化的阴离子复合
物的溶液。在一些实施方式中，预处理缓冲液也可以被用作载片存储缓冲液。

[1028] 使本发明的标志物蛋白质更易于为抗体结合的任何方法可以被用在本发明的实践中，包括本领域中已知的抗原修复方法。参见，例如，Bibbo等(2002)Acta.Cytol.46:25-
29；Saqi等(2003)Diagn. Cytopathol.27:365-370；Bibbo等(2003)
Anal.Quant.Cytol.Histol. 25:8-11，其各自的全部内容通过引用并入本文。

[1029] 在预处理以增加标志物蛋白质的可达性之后，可以使用合适的封闭剂，例如，如过氧化物酶封闭剂，如过氧化氢来封闭样品。在一些实施方式中，可以使用蛋白质封闭剂
封闭样品以防止抗体的非特异性结合。蛋白质封闭剂可以包含，例如，纯化的酪蛋白。然后将抗体(特别是特异性结合本发明的标志物的单克隆抗体或多克隆抗体)与样品一起孵
育。本领域的技术人员将会理解，在某些情况下，可以通过检测患者样品中本发明的标志
物蛋白质上的多个表位而得到更准确的诊断或预后。因此，在具体的实施方式中，使用针
对本发明标志物的不同表位的至少两个抗体。在使用超过一个抗体时，可以依次将这些
抗体作为单独的抗体试剂添加到单一样品中，或作为抗体混合物同时加入。或者，可以将
各单个抗体添加到来自同一病人的单独样品中，并汇集所得到的数据。

[1030] 用于检测抗体结合的技术在本技术领域是众所周知的。可以通过使用产生可检测信号的化学试剂检测结合本发明标志物的抗体，其中该可检测的信号对应于抗体结合
的水平，和因此对应于标志物蛋白质的表达水平。在本发明的免疫组织化学或免疫细胞化
学方法中，通过使用与标记的聚合物偶联的第二抗体来检测抗体结合。标记的聚合物的
例子包括但不限于聚合物-酶偶联物。这些复合物中的酶通常被用于催化发色团沉积在抗
原-抗体结合位点处，从而导致对应于目的生物标志物的表达水平的细胞染色。特别感兴
趣的酶包括，但不限于，辣根过氧化物酶(HRP)和碱性磷酸酶(AP)。

[1031] 在本发明的特定免疫组织化学或免疫细胞化学方法中，通过使用与第二抗体偶联的HRP-标记的聚合物检测抗体与本发明标志物的结合。也可以通过使用结合单克隆抗
体或多克隆抗体的物种特异性探针试剂以及结合物种特异性探针试剂的与HRP偶联的聚
合物检测抗体结合。使用任何发色团对载片进行抗体结合的染色，例如，发色团3,3- 二氨
基联苯胺(DAB)，然后用苏木精和任选地上蓝剂(例如氢氧化铵或TBS/Tween-20)复染。其
它合适的发色团包括，例如，3-氨基-9- 乙基咔唑(AEC)。在本发明的一些方面，通过细胞学技师和/或病理学家显微镜检验载片以评估细胞染色，例如，荧光染色(即，标志物表达)。
或者，可以通过自动显微镜检或借助于帮助识别阳性染色细胞的计算机软件人工检验样
品。

[1032] 可以通过将抗标志物抗体与可检测物质偶联来促进抗体结合的检测。可检测物质的实例包括各种酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的例子包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶；合适的辅基复
合体的例子包括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素；合适的荧光材料的例
子包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三嗪基胺荧光素、丹磺酰氯或藻红蛋白；发光材料的例子包括鲁米诺；生物发光材料的例子包括萤光素酶、虫萤光素和水母
发光蛋白；且合适的放射性物质的例子包括125I、131I、35S、14C或3H。

[1033] 在本发明的一个实施方式中，按上述方法制备冷冻样品，和随后用针对本发明标志物的抗体染色，该抗体使用，例如，Tris-缓冲盐水 (TBS)稀释至适当的浓度。通过将载片在生物素化的抗免疫球蛋白中温育检测初级抗体。这个信号可以任选地放大和用抗原的
二氨基联苯胺沉淀使其可视化。此外，载片可以任选地用，例如，苏木精复染以使细胞可
视化。

[1034] 在另一个实施方式中，用针对本发明标志物的抗体染色经固定和包埋的样品，并对冰冻切片如上所述进行复染。此外，可任选地用试剂处理样品以放大信号，从而可视化
抗体染色。例如，可利用生物素 -酪胺(tyramide)的过氧化物酶催化的沉积，生物素-酪胺
随后与过氧化物酶偶联的抗生蛋白链菌素反应(催化信号放大(CSA)系统， DAKO，
Carpinteria，CA)。

[1035] 基于组织的分析(即，免疫组织化学)是检测和定量本发明标志物的优选的方法。在一个实施方式中，可以通过免疫组织化学确定是否存在本发明的标志物。在一个实施方
式中，免疫组织化学分析使用低浓度的抗标志物抗体，以使得缺乏标志物的细胞不染色。
在另一个实施方式中，本发明的标志物是否存在使用利用了高浓度的抗标志物抗体的免
疫组织化学方法测定，以使得缺乏标志物蛋白质的细胞重度染色。不染色的细胞包含突变
的标志物而不能产生可抗原识别的标志物蛋白质，或者是其中调节标志物水平的途径失
调的细胞，从而导致可忽略的标志物蛋白质的稳态表达。

[1036] 本领域的技术人员将认识到，用于实施本发明方法的特定抗体的浓度将取决于如结合时间、抗体对于本发明标志物的特异性水平和样品制备方法等因素而变化。此外，
当使用多个抗体时，所需要的浓度可能受样品被施用于抗体上的顺序影响，例如，作为混
合物同时施加或作为单独的抗体试剂顺序地施加。此外，用于可视化抗体与本发明标志
物的结合的检测化学作用还必须进行优化以产生所需的信噪比。

[1037] 在本发明的一个实施方式中，将蛋白质组学的方法，例如，质谱法，用于检测和定量本发明的标志物蛋白质。例如，其中涉及将生物样品(如血清)应用于蛋白质结合芯片的
基质辅助激光解析/电离飞行时间质谱法(MALDI-TOF MS)或表面增强激光解析/电离飞行
时间质谱法(SELDI-TOF MS)(Wright,G.L.,Jr.等(2002)Expert Rev Mol Diagn 2:549；
Li,J.等(2002)Clin Chem 48:129；Laronga,C.等(2003)Dis Markers 19:229；Petricoin,
E.F.等(2002)359:572；Adam,B.L.等(2002) Cancer Res 62:3609；Tolson,J.等(2004)Lab
Invest 84:845；Xiao,Z.等 (2001)Cancer Res 61:6029)可用于检测和定量PY-Shc和/或
p66-Shc 蛋白。质谱方法被描述于，例如，5,622,824、5,605,798和5,547,835 号美国专利
中，其各自的全部内容并入本文作为参考。

[1038] 在其它实施方式中，在核酸水平检测本发明标志物的表达。用来评估表达的基于核酸的技术在本领域中是众所周知的，并包括，例如，测定来自受试者样品中标志物mRNA
的水平。许多表达检测方法使用分离的RNA。任何不是针对mRNA的分离选择的RNA分离技术
可以用于从表达本发明标志物的细胞纯化RNA(参见，例如，Ausubel 等编，(1987-1999)
Current Protocols in Molecular Biology(John Wiley& Sons,New York))。此外，可以
使用那些本领域的技术人员熟知的技术如，例如，Chomczynski(1989，4,843,155号美国专
利)的单步RNA 分离过程，很容易地处理大量组织样品。

[1039] 术语“探针”是指能够选择性地结合本发明标志物(例如，核苷酸转录物和/或蛋白质)的任何分子。探针可以由本技术领域的技术人员合成，或来自于适当的生物制剂。探
针可以特别地设计为被标记的。可以被用作探针的分子的实例包括，但不限于，RNA、DNA、蛋白质、抗体和有机分子。

[1040] 分离的mRNA可以被用在杂交或扩增分析中，其包括但不限于， DNA或RNA印迹分析、聚合酶链反应分析和探针阵列。用于检测 mRNA水平的一种方法涉及将分离的mRNA与可
以与标志物mRNA 杂交的核酸分子(探针)相接触。该核酸探针可以是，例如，全长cDNA 或其
一部分，如至少为7、15、30、50、100、250或500个核苷酸长度和足以在严格条件下与标志物基因组DNA特异性杂交的寡核苷酸。

[1041] 在一个实施方式中，mRNA被固定在固体表面上，并与探针接触，例如通过在琼脂糖凝胶上运行分离的mRNA，和将mRNA从凝胶转移到膜上，如硝酸纤维素。在替代的实施方
式中，探针被固定在固体表面上，并将mRNA与探针接触，例如，在Affymetrix基因芯片阵
列中。熟练的技术人员可以很容易地将已知的mRNA检测方法适应用于检测标志物mRNA的
水平。

[1042] 用于确定样品中标志物mRNA的水平的替代方法涉及核酸扩增的过程，例如，通过RT-PCR(Mullis，1987年，4,683,202号美国专利中公开的实验实施方式)、连接酶链反应
(Barany(1991)Proc.Natl. Acad.Sci.USA 88:189-193)、自持的序列复制(Guatelli等
(1990)Proc. Natl.Acad.Sci.USA 87:1874-1878)、转录扩增系统(Kwoh等(1989)Proc.
Natl.Acad.Sci.USA 86:1173-1177)、Q-β复制(Lizardi等(1988) Bio/Technology 6:
1197)、滚环复制(Lizardi等人，5,854,033号美国专利)或任何其他的核酸扩增方法，随后
使用本领域的技术人员熟知的技术检测扩增的分子。如果这样的分子以非常低的数量存
在，则这些检测方案对于核酸分子的检测是特别有用的。在本发明的特定方面中，通过定
量荧光RT-PCR(即，TaqManTM系统)评估标志物的表达。这类方法通常利用对于本发明的标
志物特异性的寡核苷酸引物对。设计对于已知序列特异性的寡核苷酸引物的方法是本领
域中众所周知的。

[1043] 可以使用膜印迹(如用于杂交分析中的，例如RNA印迹、DNA 印迹、点印迹等)或微孔、样品管、凝胶、珠或纤维(或任何包含结合的核酸的固体支持物)监测本发明标志物的
表达水平。见5,770,722、 5,874,219、5,744,305、5,677,195和5,445,934号美国专利，其通过引用的方式并入本文。检测标志物的表达也可包括使用在溶液中的核酸探针。

[1044] 在本发明的一个实施方式中，微阵列被用于检测本发明标志物的表达。因为不同的实验之间的可重复性，微阵列特别适合用于此目的。 DNA微阵列提供了一种用于同时测
量大量基因的表达水平的方法。各个阵列由可附着到固体支持物上的捕获探针的重复图
案组成。标记的RNA或DNA与在阵列上的互补探针杂交，然后通过激光扫描检测。阵列上各
个探针的杂交强度被确定并转换为代表相对基因表达水平的定量值。见6,040,138、5,
800,992和6,020,135、6,033,860和6,344,316 号美国专利，本文通过引用引入。高密度寡
核苷酸阵列对于测定样品中大量RNA的基因表达谱是特别有用的。

[1045] 使用本发明的方法，其中可包括本领域技术人员已知的回归分析的方法，可以利用本发明标志物的量和/或标志物量的数学关系来计算在进行疾病状态或毒性状态治疗
的受试者中疾病状态(例如，癌症、糖尿病、肥胖症、心血管疾病或毒性状态，例如，药物诱导的毒性或心脏毒性)复发的风险，对于疾病状态或毒性状态正在接受治疗的受试者的
生存，疾病状态或毒性状态是否是侵袭性的、治疗方案对于治疗疾病状态或毒性状态的功
效等。例如，适当的回归模型包括但不限于，CART(例如，Hill,T和Lewicki,P.(2006)
“STATISTICS Methods and Applications”StatSoft,Tulsa,OK)、Cox(例如，
www.evidence-based-medicine.co.uk)、指数、正态和对数正态(例如，
www.obgyn.cam.ac.uk/mrg/statsbook/stsurvan.html)、逻辑(例如，
www.en.wikipedia.org/wiki/Logistic_regression)、参数、非参数、半参数 (例如，
www.socserv.mcmaster.ca/jfox/Books/Companion)、线性(例如，
www.en.wikipedia.org/wiki/Linear_regression)或加性(例如，
www.en.wikipedia.org/wiki/Generalized_additive_model)。

[1046] 在一个实施方式中，回归分析包括标志物的量。在另一个实施方式中，回归分析包括标志物数学关系。在再另一实施方式中，标志物的量和/或标志物数学关系的回归分
析可以包括附加的临床和/或分子协变量。这种临床协变量包括但不限于，淋巴结状态、肿
瘤阶段、肿瘤分级、肿瘤大小、治疗方案，如化疗和/或放射治疗、临床结果(例如，复发、疾病特异性生存率、治疗失败)和/或随诊断后时间变化的临床结果、治疗开始后的时间和/
或完成治疗后的时间。

[1047] VIII、试剂盒

[1048] 本发明还提供了组合物和试剂盒，其用于预后疾病状态(如癌症、糖尿病、肥胖病、心血管疾病或毒性状态，例如，药物诱导的毒性或心脏毒性)、疾病状态或毒性状态的
复发或正在接受疾病状态或毒性状态治疗的受试者的生存。这些试剂盒包括以下的一种
或多种：特异性结合本发明的标志物的可检测抗体、特异性结合本发明的标志物的可检
测抗体、用于获得和/或制备受试者目标组织样品用于染色的试剂和使用说明。

[1049] 本发明的试剂盒可任选地包含可用于执行本发明的方法的附加成分。举例来说，试剂盒可以包含适于退火互补的核酸或用于将抗体与其特异性结合的蛋白质相结合的流
体(如SSC缓冲液)、一个或多个样品室、说明材料(其描述了本发明方法的性能)和组织特
异性的对照/标准品。

[1050] IX、筛选分析

[1051] 本发明的靶标包括，但不限于，本文中所列的基因和/或蛋白质。基于本文中申请人所描述的实验结果，可以将疾病状态或毒性状态中调节的关键蛋白质与不同的途径或
分子组相关联或分类到不同的途径或分子组中，包括细胞骨架成分、转录因子、凋亡反应、戊糖磷酸途径、生物合成途径、氧化应激(促氧化剂)、膜改变和氧化磷酸化代谢。因此，在本发明的一个实施方式中，标志物可以包括一个或多个基因(或蛋白质)，其选自于HSPA8、
FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1、CANX、GRP78、GRP75、TIMP1、PTX3、 HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。在一个实施方式中，标志物可以包括一个或多个基因(或蛋白质)，其选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ。在一些实施方式中，标志物是上述基因或蛋白质中至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个、二十五个、三十个或更多个的组合。

[1052] 用于鉴别所鉴定的标志物的调节子的筛选分析描述如下。

[1053] 本发明还提供了用于鉴别调节子，即，候选或测试化合物或试剂 (如蛋白质、肽、拟肽、类肽、小分子或其他药物)的方法(在此也称为“筛选分析”)，该调节子用于通过调节本发明标志物的表达和/ 或活性来治疗或预防疾病状态或毒性状态。这些分析典型地包括
本发明的标志物和一个或多个分析成分之间的反应。其它成分可以是测试化合物本身，
或测试化合物和本发明标志物的天然结合伴体的组合。通过试验(如本文所述的那些)鉴
别的化合物可能例如，用于调节(例如，抑制、缓解、治疗或预防)疾病状态或毒性状态的侵袭性。

[1054] 可以从任何可得来源得到用于本发明的筛选试验中的测试化合物，包括天然和/或合成化合物的系统的文库。测试化合物也可以通过本领域中已知的组合文库方法中的
众多途径中的任何一种获得，包括：生物学文库、类肽文库(具有肽的功能，但具有新型的
非肽主链的分子的文库，该非肽主链具有对酶降解的抗性但仍然保持活性；见，例如，
Zuckermann等，1994,J.Med.Chem.37:2678-85)；可空间定址的平行固相或液相文库；需要
去卷积的合成文库方法；“一珠一化合物”文库方法；和采用亲和层析选择的合成文库方
法。生物学文库和类肽文库途径限于肽文库，而其他四个途径适用于肽、非肽低聚物或化
合物的小分子文库(Lam,1997,Anticancer Drug Des.12:145)。

[1055] 可以在现有技术中找到用于合成分子文库的方法的例子，例如： DeWitt等(1993)Proc.Natl.Acad.Sci.U.S.A.90:6909；Erb等(1994)Proc. Natl.Acad.Sci.USA 91:11422；
Zuckermann等(1994).J.Med.Chem. 37:2678；Cho等(1993)Science 261:1303；Carrell等
(1994)Angew.Chem. Int.Ed.Engl.33:2059；Carell等(1994)Angew.Chem.Int.Ed.Engl.
33:2061；和Gallop等(1994)J.Med.Chem.37:1233。

[1056] 化合物的文库可以存在于溶液中(例如，Houghten，1992 Biotechniques 13:412-421)或珠(Lam,1991,Nature 354:82-84)、芯片 (Fodor,1993,Nature 364:555-556)、细菌
和/或孢子(Ladner的5,223,409 号美国专利)、质粒(Cull等1992,Proc Natl Acad Sci
USA 89:1865-1869) 或噬菌体(Scott和Smith，1990,Science 249:386-390；Devlin,1990,
Science 249:404-406；Cwirla等，1990,Proc.Natl.Acad.Sci.87:6378-6382； Felici,
1991,J.Mol.Biol.222:301-310；Ladner，同上)上。

[1057] 本发明的筛选方法包括将疾病状态细胞或毒性状态细胞与测试化合物接触，并确定测试化合物调节细胞中本发明的标志物的表达和 /或活性的能力。可如本文所述地测
定本发明的标志物的表达和/或活性。

[1058] 在另一个实施方式中，本发明提供了用于筛选候选物或测试化合物的分析方法，其是本发明标志物或其生物活性部分的底物。在再另一实施方式中，本发明提供用于筛选
候选物或测试化合物的分析方法，该候选物或测试化合物结合本发明的标志物或其生物
活性部分。可以例如，通过将测试化合物与放射性同位素或酶标记偶联以使得化合物与
标志物的结合可以通过检测复合物中标记的标志物化合物而测定，从而完成测试化合物
直接结合标志物的能力的测定。例如，可以用131I、125I、35S、14C或3H直接或间接地标记化合物(例如，标志物底物)，并通过射电辐射的直接计数或通过闪烁计数检测放射性同位素。
或者，可以用，例如，辣根过氧化物酶、碱性磷酸酶或荧光素酶酶学标记分析成分，并通过测定适当的底物向产物的转化而检测酶标记。

[1059] 本发明还涉及由上述筛选分析鉴别的新型药剂。因此，进一步在适当的动物模型中使用如本文所述的鉴别的试剂在本发明的范围之内。例如，可以在动物模型中使用如本
文所述地鉴别的能够调节本发明标志物的表达和/或活性的试剂，以确定用该试剂进行治
疗的疗效、毒性或副作用。或者，可以在动物模型中使用如本文所述被鉴别的试剂以确定
这种试剂的作用机制。此外，本发明涉及通过如上所述的方法鉴别的新型药剂用于如上所
述的治疗。

[1060] 本发明的示例

[1061] 实施例1：采用平台技术来建立癌症一致网络和模拟网络

[1062] 在这个实施例中，采用在上面详细描述的平台技术来整合从定制的体外肿瘤模型获得的数据，从而确定驱动癌症发病的新的蛋白质/ 途径。从该分析得到的关系图谱已
经提供了癌症治疗靶标以及与癌症相关的诊断/预后标志物。

[1063] 在图18中描绘了研究设计。简单地说，使2个癌症细胞系(PaCa2、 HepG2)和一个正常的细胞系(THLE2)经历模拟体内癌细胞所经历的环境的七种条件之一。具体而言，将细
胞暴露于高血糖条件、低氧条件、乳酸条件、高血糖+低氧组合条件、高血糖+乳酸组合条
件、低氧+乳酸组合条件或高血糖+缺氧+乳酸组合条件。不同的条件如下所示建立：

[1064] -高血糖条件通过在含有22mM的葡萄糖的培养基中培养细胞建立。

[1065] -低氧条件通过将细胞置于模块化培养箱(MIC-101， Billups-Rothenberg Inc.Del Mar,CA)中而诱导，该模块化培养箱充满含有5％的CO2，2％的O2和93％的氮的工
业气体混合物。

[1066] -乳酸条件通过将细胞培养在含有12.5mM的乳酸的培养基中而建立。

[1067] -高血糖+低氧组合条件通过在含有22mM的葡萄糖的培养基中培养细胞和将细胞置于其中充满含有5％的CO2、2％的O2和93％的氮的工业气体混合物的模块化培养箱中建
立。

[1068] -高血糖+乳酸组合条件通过将细胞培养在含有22mM的葡萄糖和12.5mM的乳酸的培养基中建立。

[1069] -低氧+乳酸组合条件通过在含有12.5mM的乳酸的培养基中培养细胞和将细胞置于其中充满含有5％的CO2、2％的O2和93％的氮的工业气体混合物的模块化培养箱中建立。

[1070] -高血糖+低氧+乳酸组合条件通过将细胞培养在含有22mM的葡萄糖和12.5mM的乳酸的培养基中和将细胞置于其中充满含有5％的 CO2、2％的O2和93％的氮的工业气体混
合物的模块化培养箱中建立。

[1071] 含有上述细胞的细胞模型通过将暴露于上述各条件的细胞用辅酶Q10处理而暴露于环境扰动另外地探询。具体而言，用0、50μM 或100μM的辅酶Q10处理细胞。

[1072] 在处理后的不同时间收集细胞样品以及具有各种条件和各辅酶 Q10处理的各个细胞系的培养基样品，包括处理的24小时和48小时后。

[1073] 此外，进行两种不同的癌细胞(PaCa2和HepG2细胞)之间的交互实验，其中PaCa2和HepG2细胞是共培养的。此共培养方法被称作为细胞外分泌组(ECS)实验。第一细胞系统
(PaCa2)首先接种在侵袭实验型生长室的孔的插入体中。使用6孔板来实现更好的统计分
析。在插入体中接种第一细胞系统时，插入体被置于单独的6孔板中。第二细胞系统(HepG2
细胞)接种于主盘上。包含所述第一细胞系统的插入盘和包含所述第二细胞系统的主盘在
37℃孵育过夜。各细胞系统都生长在特定的细胞特异性培养基中(其中可选地，各个细胞
系统可以生长在适应于支持两种细胞类型的生长的培养基中)，在第二天，通过培养基更
换进行预定的处理。具体而言，包含所述第一细胞系统的插入体被放置到包含第二细胞系
统的主盘中。然后将盘孵育预定的时间段，例如，24小时或48小时。设置具有相同的条件的重复孔，并合并细胞以产生足够的材料用于2D分析。收获培养基(1 毫升等份)、来自插入体
的细胞和来自主盘的孔的细胞作为单独的样品。实验一式三份进行以便提供更好的统计
分析能力。

[1074] 还通过“培养基交换”实验进行交互实验。具体而言，在如上所述的扰动或条件化后的24小时或48小时之后，收集来自所述第一细胞系统(PaCa2)的经过培养的培养基或
“分泌组”并然后加入到第二细胞系统(HepG2)中24-48小时。然后收集来自第二细胞系统
的最终经过培养的培养基或“分泌组”。对所有最终分泌组进行蛋白质组学分析。

[1075] 使用上述的发明详述中所描述的技术，对于各种条件下和具有各种“环境扰动”(即，辅酶Q10处理)的各细胞系所收集的细胞和培养基样品进行通过定量蛋白质组学的总
细胞蛋白质表达变化的 iProfiling分析。同样地对在各种条件下具有各种处理的各共培
养细胞系收集的细胞和培养基样品进行通过定量蛋白质组学的总细胞蛋白质表达变化
的iProfiling分析。

[1076] 此外，基本上按制造商推荐的通过使用Seahorse分析仪生成暴露于各种条件和具有或不具有辅酶Q10扰动的癌症、正常细胞和交互实验中的细胞的生物能量学谱型分
析。在用推靠Seahorse培养板的盒产生的7微升室中的电极记录OCR(耗氧率)和ECAR(细胞
外酸化率)。

[1077] 将为在各种条件下和经受各种扰动的各细胞系(包括交互实验中的细胞)收集的蛋白质组学数据及为在各种条件下和经受各种扰动的各细胞系收集的生物能量学谱型数
据全部通过REFSTM系统输入和处理。然后使用标准化的命名法将Paca2、HepG2、THLE2和交
互实验的原始数据组合。滤出具有15％以上的蛋白质组学数据丢失的基因。制定了数据
归集策略。例如，使用内重复误差模型(within replicates error model)来归结来自具有
重复的实验条件的数据。基于10个邻近的K-NN算法被用来归结没有重复的数据。对于三个
生物系统一起建立不同的REFSTM模型，仅Paca2系统或仅HepG2系统关联于表型数据。

[1078] 使用R编程语言，通过定制的程序对于在模拟网络中连接父节点和子节点的各个边界提取曲线下面积和倍数变化，其中R编程语言是用于统计计算和制图的开源软件环
境。

[1079] 将来自R程序的输出输入到Cytoscape(一种开源程序)中，以生成一致网络的可视化表示。

[1080] 在所有的构建的模型之间，70％片段频率的示例性蛋白质相互作用REFS一致网络显示在图21中。

[1081] 通过增加或减少LDHA的表达4倍以使用REFSTM生成模拟网络而模拟图21中所示的一致网络中的各个节点，如在上面的发明详述中所详细描述的。

[1082] 研究在图21所示的示例性一致网络中模拟的LDHA表达的变化对PARK7和以高水平与PARK7相关的节点(notes)中的蛋白质的影响。使用REFSTM(参见图22)识别两个癌症细
胞系(即Paca2和HepG2) 中响应于LDHA模拟的蛋白质。数字表示特定的蛋白质表达水平的
倍数变化。

[1083] 为了用上面的方法验证识别的蛋白质联系，被识别为在模拟网络中直接接近LDHA的标志物被输入IPA(一种基于以前出版的文献利用神经网络来确定输出到网络的实
验输出之间的分子连接的软件程序)。IPA程序的输出如图23中所示，其中灰色形状中的标
志物被确定为平台生成的模拟网络中直接接近LDHA，且未填充形状中的标志物是基于先
前发表的文献中的公知的知识由IPA确定的连接。

[1084] 观察到来自探询生物学平台技术(如图21所示)的输出中鉴别的标志物(即DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、 PHB2、ATP5A1和CANX)与公知的癌症标志物关联，如IPA生成网络内(如图23所示)的TP53和PARK7。通过使用探询生物学平台确定的因子与科
学文献中发表的已知因子共有连接性的事实证实了通过使用探询生物学平台创建的网络
的精确度。此外，通过使用探询生物学平台输出创建的LDHA子网络内的网络相关性证明了
各因子的定向影响的存在，这与IPA网络相反(其中分子实体之间的连接不提供相互作用
节点之间的功能定向性)。因此，通过采用一种无偏的方法来生成数据，集成和逆向工程来
创建计算模型，然后进行模拟和差分网络分析，探询生物学发现平台使得能够了解迄今在
癌症病理生理学中未知的机制，其与已为大家接受的对疾病病理生理的科学认识一致。

[1085] 图19显示了在来自iProfiling分析的蛋白质表达数据基础上辅酶 Q10处理对下游节点(在图19中列出了PubMed蛋白质检索号)的影响。蛋白质检索号P00338是LDHA。对
HepG2细胞中LDHA表达进行蛋白质组学数据的湿式实验室验证(见图20)。如图20中所示，
当用50uM的辅酶Q10或100uM的辅酶Q10处理HepG2 24或48 小时时，LDHA表达水平降低。

[1086] 用于众所周知的癌症标志物TP53、BCL-2、Bax和Caspase3，进行辅酶Q10处理对SKMEL28细胞中这些标志物的表达水平的影响的湿式实验室验证(参见图24和图25)。

[1087] 实施例2：采用平台技术建立癌症Δ-Δ网络

[1088] 在此实施例中，采用在上面详细描述的平台技术整合从定制体外癌症模型获得的数据，并从而鉴别驱动癌症发病的新蛋白质/途径。从这样的分析得到的关系图谱已经
提供了癌症的治疗靶标以及与癌症相关的诊断/预后标志物。

[1089] 简单地说，使四种癌细胞系(PaCa2、HepG2、PC3和MCF7)和两种正常细胞系(THLE2和HDFa)经受模拟癌症细胞在体内所经历的环境的各种条件。具体而言，细胞独立地暴露
于高血糖条件、低氧条件和乳酸处理中的各条件。例如，高血糖条件是通过在含有22mM 的
葡萄糖的培养基中培养细胞建立的。低氧条件是通过将细胞置于模块化培养箱(MIC-101，
Billups-Rothenberg Inc.Del Mar,CA)(其中充满含有5％的CO2、2％的O2和93％的氮的工
业气体混合)中而诱导的。对于乳酸处理，用0或12.5mM的乳酸处理各个细胞系。除了将细
胞单独地暴露于上述三个条件中的各条件外，也将细胞暴露于这些条件中的两个或全部
三个的组合(即，高血糖和低氧条件、高血糖条件和乳酸、低氧条件和乳酸及高血糖和低氧
条件和乳酸)。

[1090] 此外，通过将细胞暴露于用辅酶Q10处理的环境扰动探询其中各类型的细胞暴露于上述的各个条件的包含上述细胞的细胞模型。具体而言，用0、50μM或100μM的辅酶Q10处理细胞。

[1091] 在处理后的不同时间(包括处理后24小时和48小时)收集在有或没有辅酶Q10处理的情况下对于暴露于各个条件(或条件组合)的细胞系的细胞样品以及含有来自细胞的
分泌组的培养基样品。

[1092] 此外，进行两种不同的癌细胞(PaCa2和HepG2细胞)之间的交互实验，在其中PaCa2和HepG2细胞是共培养的。此共培养方法被称作为细胞外分泌组(ECS)实验。第一细
胞系统(PaCa2)首先接种在侵袭实验型生长室的孔的插入体中。一般使用6孔板来实现更
好的统计分析。在第一细胞系统接种在插入体中时，插入体被放置在单独的6孔板中。第
二细胞系统(HepG2)接种于主盘中。包含含有所述第一细胞系统的插入体和含有所述第二
细胞系统的主盘的6孔板在 37℃下孵育过夜。各细胞系统生长在其相应的细胞特异性培养
基中 (其中可选地，各细胞系统可以生长在适应于支持两种细胞类型的生长的培养基
中)。在第二天，通过培养基更换进行预定的处理。具体而言，将包含所述第一细胞系统的
插入体和第一细胞系统的相应培养基置于包含第二细胞系统和第二细胞系统的相应培养
基的主盘中。然而，在所有共培养的情况中，共培养细胞在共培养前的第一天中已经暴露
于相同的“癌症条件”(例如，高血糖、低氧、乳酸或它们的组合)，尽管是单独地。即是说，将插入体中的第一细胞系统和盘内的第二细胞系统暴露于相同的条件，然后被移动到“共培
养”设置中。然后将盘孵育预先确定的时间，例如，24小时或48小时。用相同的条件建立重复的孔，并且汇合细胞以产生足够的材料进行随后的蛋白质组学分析。收获含分泌组的培
养基(1毫升等份)、来自插入体的细胞和来自主盘的孔的细胞作为单独的样品。实验一式
三份地进行以便提供更好的统计分析能力。

[1093] 还通过“培养基交换”实验进行交互实验。具体而言，在如上所述的扰动或条件化后的24小时或48小时之后，收集来自所述第一细胞系统(PaCa2)的经培养的培养基或“分
泌组”，且然后加入到第二细胞系统(HepG2)中24-48小时。然后收集来自第二细胞系统的
最终的经过培养的培养基或“分泌组”。对所有最终分泌组进行蛋白质组学分析。

[1094] 在将细胞系统暴露于如上所述的“癌症条件”之后，通过分析来自细胞系统的各种读数分析扰动(即，辅酶Q10处理)和/或来自共培养实验的成对细胞的分泌组中产生的
条件、细胞的响应。读数包括蛋白质组学数据，特别是细胞内蛋白质表达以及分泌到细胞
培养基中的蛋白质和功能的数据，特别是细胞生物能量学。

[1095] 使用上面发明详述中所描述的技术，对有或没有“环境扰动”(即，辅酶Q10处理)的情况下暴露在各种条件(或条件组合)的各种细胞系(正常和癌症细胞系)收集的细胞和
培养基样品进行通过定量蛋白质组学的总细胞蛋白质表达变化的iProfiling分析。

[1096] 此外，基本上按制造商推荐的通过使用Seahorse分析仪生成在有或没有“环境扰动”(即，辅酶Q10处理)的情况下，暴露于各种条件(或条件组合)的各种细胞系(正常和癌
症细胞系)的生物能量学谱。用推靠Seahorse培养板的盒形成的7微升室中的电极记录OCR
(耗氧率)和细胞外酸化率(ECAR)。

[1097] 然后通过REFSTM系统处理在各种条件下和有或没有各种扰动的情况下对各种细胞系收集的蛋白质组学数据及各种条件下和有或没有各种扰动的情况下对各细胞系收集
的生物能量学谱数据。“复合癌症摄动网络”从对于所有的癌症细胞系获得的组合数据生
成，其中各癌症细胞系已暴露于各特定的条件(和条件组合)，且进一步暴露于扰动(辅酶
Q10)。“复合癌症未扰动网络”从对于所有的癌症细胞系获得的组合数据生成，其中各癌症细胞系暴露于各特定的条件(和条件的组合)而没有扰动(没有辅酶Q10)。类似地，“复合正
常扰动网络”从对于所有的正常细胞系获得的组合数据生成，其中各正常细胞系暴露于
各特定的条件(和条件的组合)，且另外地暴露于扰动 (辅酶Q10)。“复合正常未扰动网络”
从对于所有的正常细胞系获得的组合数据生成，其中各正常细胞系暴露于各特定的条件
(和条件的组合)而没有扰动(没有辅酶Q10)。

[1098] 接着使用REFSTM对于如上所述的四个复合网络中的各个网络生成“模拟复合网络”(在这里也被称为“模拟网络”)。为此，模拟了给定的一致复合网络中的各个节点(通过增加或减少10倍)以使用 REFSTM生成模拟网络，如在上面的发明详述中所详细描述的。

[1099] 使用R编程语言，通过定制的程序提取对于在模拟网络中连接父节点和子节点的各个边界的曲线下面积和倍数变化，其中R编程语言是用于统计计算和制图的开源软件环
境。

[1100] 最后，生成Δ网络，其中该Δ网络代表两个模拟复合网络之间的差异。Δ网络从模拟复合网络生成。为生成响应于辅酶Q10的癌症对正常的差异网络(Δ-网络)，如图26中
所示的用PERL编程语言通过定制的程序进行连续的比较步骤。

[1101] 首先，使用R程序对比未处理的癌症(T0)和处理的癌症(T1) 网络，和分离独特的癌症处理T1网络(参见图26中的深灰色的月牙形状)。这代表癌症T1∩(交集)癌症T0“Δ”
网络。这个Δ网络中的蛋白质相互作用/相关性可以被看作是代表对辅酶Q10处理的独特
癌症反应。

[1102] 类似地，使用R程序比较未处理的正常(T0)和处理的正常(T1) 网络，和分离独特的处理的正常T1网络(参见图26中浅灰色的月牙形状)。这代表正常T1∩正常T0“Δ”网络。
这个Δ网络中的蛋白质相互作用/相关性可以被看作是代表对辅酶Q10处理的独特的正常
细胞反应。

[1103] 最后，使用R程序比较独特的癌症T1网络(参见图26中深灰色的月牙形状)和独特的正常T1网络(参见图26中浅灰色的月牙形状)，和生成响应于辅酶Q10的仅对癌症独特的
而不存在于正常细胞中的网络(参见图26)。蛋白质相互作用/相关性的这个集合代表癌细
胞内的独特途径，其在辅酶Q10处理时不存在于正常细胞中。蛋白质相互作用/相关性的
这个集合被称为“Δ-Δ网络”，因为它是由来自癌症细胞的差异图谱和来自正常对照细胞
的差异图谱的比较产生的差异图谱。

[1104] 将来自PERL和R程序的输出输入到Cytoscape(一种开源程序) 中以生成Δ-Δ网络的可视化表示。

[1105] 使用本文所述的方法确定的Δ-Δ网络对于鉴别用于癌症治疗的靶标是非常有用的。例如，根据图27中所示的Δ-Δ网络，蛋白A抑制 OCR3(氧化应激磷酸化的量度)和增
强ECAR3(糖酵解的量度)。由于这种相互作用是癌细胞中独特的(因为Δ-Δ网络已减去辅
酶Q10 处理时通常存在于正常细胞中的任何相互作用)，预计抑制蛋白A的表达将减少基
于糖酵解的能量代谢(这是癌症代谢途径的标志)和将细胞朝基于氧化磷酸化的能量代谢
(这是与正常细胞更紧密地相关的表型)切换。因此，预期使用辅酶Q10和蛋白A抑制剂的联
合治疗对于治疗癌症是有效的，至少部分地通过将癌细胞的能量代谢谱切换至类似于正
常细胞的情况。

[1106] 通过使用实质性的示例进一步说明了本发明的探询式生物学平台技术的优点，其中来自因果关系网络的子网络与使用IPA的分子网络相比较，IPA是利用神经网络来基
于先前发表的文献确定到网络的实验输出之间的分子联系的软件程序。使用探询式生物
学平台(如图 29中所示)生成的包含PARK7的因果关系子网络被用作实质性的示例。来自
探询式生物学平台的PARK7网络的所有分子印记被整合到 IPA中以生成基于已知/现有文
献证据的网络。然后对比探询生物学输出与通过使用IPA生成的输出之间的网络输出。

[1107] 观察到通过来自探询式生物学平台技术的输出鉴别的六个标志物(如图29中所示)，即在图27-29中的A、B、C、X、Y和Z，与 IPA生成网络内的TP53(图28)关联。在六个标志物中，文献中已经报道A、B和C与癌症以及HSPA1A/HSPA1B相关。X、Y和Z被确定为癌症状态的“枢纽”或关键驱动子，且因此被确定为新的癌症标志物。此外，MIF1和KARS也被确定为癌症状态的“枢纽”或关键驱动子，且因此被确定为新的癌症标志物。通过使用探询式生物学平台识别的因子与在科学文献中公布的已知因子共有连接性的事实证实了通过使用探
询式生物学平台创建的网络的精确度。此外，通过使用探询式生物学平台输出创建的
PARK7子网络内的网络关联(如图29 所示)表明存在各因子的定向影响，这与IPA网络(如图
28所示) 相反(其中分子实体之间的关联不提供相互作用节点之间的功能定向性)。此外，
来自探询式生物学平台的输出(如图29中的虚线所示) 展示了这些成分的关联，导致通过
PARK7的潜在机制。蛋白C、蛋白A和PARK7的其他节点被观察为癌症代谢的关键驱动子(图
27)。

[1108] 如本实施例所表明的，通过采用无偏的途径进行数据生成、集成和逆向工程以建立计算模型，然后通过模拟和差异网络分析，探询式生物学发现平台使得能够理解在癌症
病理生理学中迄今未知的机制，其与对疾病的病理生理的已确立的科学认识一致。

[1109] 实施例3：采用平台技术建立糖尿病/肥胖症/心血管疾病的Δ-Δ 网络

[1110] 在这个实施例中，使用在上面的发明详述中详细描述的平台技术整合从定制的糖尿病/肥胖症/心血管疾病(CVD)模型获得的数据，和鉴别驱动糖尿病/肥胖症/CVD的发
病的新蛋白质/途径。从这一分析所得的关系图谱已经提供了糖尿病/肥胖症/CVD的治疗
靶标以及与糖尿病/肥胖症/CVD相关的诊断/预后标志物。

[1111] 使五个原代人类细胞系，即脂肪细胞、肌管、肝细胞、主动脉平滑肌细胞(HASMC)和近端肾小管细胞(HK2)经历模拟这些疾病相关的细胞在体内所经历的环境中的五种条
件之一。具体而言，将五个细胞系各自暴露于下列条件：高血糖条件、高血脂条件、高胰岛素血症条件、低氧条件和乳酸暴露。高血糖条件是通过在含有22mM 的葡萄糖的培养基中
培养细胞诱导的。高血脂条件是通过将细胞培养在含有0.15mM的棕榈酸钠的培养基中诱
导的。高胰岛素血条件是通过将细胞培养在含有1000nM的胰岛素的培养基中诱导的。低氧
状态是通过将细胞置于模块化培养箱(MIC-101，Billups-Rothenberg Inc. Del Mar,CA)
(其中充满含有5％的CO2、2％的O2和93％的氮的工业气体混合物)中而诱导的。还用0或
12.5mM的乳酸处理各个细胞系。

[1112] 此外，在两个不同的细胞对，HASMC(细胞系统1)和HK2细胞(细胞系统2)或者肝细胞(细胞系统1)和脂肪细胞(细胞系统2) 之间进行交互实验，其中成对的细胞被共培养。此
共培养方法被称为细胞外分泌组(ECS)实验。第一细胞系统(例如，HASMC)首先接种在侵
袭实验型生长室的孔的插入体中。使用6孔板来实现更好的统计分析。在用第一细胞系统
接种插入体时，插入体被置于单独的6 孔板中。第二细胞系统(例如，HK2)接种于主盘上。包含所述第一细胞系统的插入盘和包含所述第二细胞系统的主盘在37℃下孵育过夜。各个
细胞系统生长在特定的细胞特异性培养基中(其中可选地，各细胞系统可以生长在适应于
支持两种细胞类型的生长的培养基中)。在第二天，通过培养基交换进行预定的处理。具体
而言，包含所述第一细胞系统的插入体被置于包含第二细胞系统的主盘中。然后将盘孵
育预定的时间段，例如，24小时或48小时。用相同的条件设置重复的孔，并合并细胞以产生足够的材料用于2D分析。收获培养基(1毫升等份)、来自插入体的细胞和来自主盘的孔的
细胞作为单独的样品。实验一式三份地进行以便提供更好的统计分析能力。

[1113] 还通过“培养基交换”实验进行交互实验。具体而言，在扰动或条件化后的24小时或48小时后，收集来自第一细胞系统HASMC的经培养的培养基或“分泌组”，然后加入到第
二细胞系统脂肪细胞中 24-48小时。然后收集来自第二细胞系统的最终经过培养的培养基
或 “分泌组”。对所有最终分泌组进行蛋白质组学分析。

[1114] 通过将细胞暴露于用辅酶Q10处理的“环境扰动”另外地“探询” 包含上述细胞的细胞模型，其中细胞暴露于上面所描述的各个条件。具体而言，用0、50μM或100μM的辅酶Q10处理细胞。

[1115] 在处理后不同的时间(包括处理后24小时和48小时)收集对于各个细胞系、条件和辅酶Q10处理的细胞样品。对于特定细胞且在一定的条件下，还收集和分析培养基样品。

[1116] 使用上面的发明详述中所描述的技术对在各种条件下和具有各 “环境扰动”(即，辅酶Q10处理)的各细胞系收集的细胞和培养基样品进行通过定量蛋白质组学的总细胞蛋
白质表达变化的iProfiling分析。

[1117] 然后通过REFSTM系统处理在各个条件和具有每种扰动的上面列出的各细胞系收集的蛋白质组学数据及在各个条件和具有各种扰动的各细胞系收集的生物能量学谱数
据。复合扰动网络从对于暴露于扰动(辅酶Q10)的一个特定条件(例如，高血糖)的所有细
胞系获得的组合数据生成。复合未扰动网络从对于相同的一个特定的条件(例如，高血
糖)而没有扰动(没有辅酶Q10)的所有细胞系获得的组合数据生成。类似地，复合扰动网络
从对于暴露于扰动(辅酶Q10)的第二对照条件(例如，正常血糖)的所有细胞系获得的组合
数据生成。复合未扰动网络从对于相同的第二对照条件(例如，正常血糖)而没有扰动(没
有辅酶Q10)的所有细胞系获得的组合数据生成。

[1118] 如在上面的发明详述中所详细描述的，模拟上述的一致复合网络中的各个节点(通过增加或减少10倍)以使用REFSTM生成模拟网络。

[1119] 使用R编程语言通过定制的程序提取在模拟网络中连接父节点和子节点的各个边界的曲线下面积和倍数变化，其中R编程语言是用于统计计算和制图的开源软件环境。

[1120] 从模拟复合网络生成Δ网络。为生成响应于辅酶Q10的糖尿病/ 肥胖症/心血管疾病状态对正常状态的差异网络(Δ-Δ网络)，使用 PERL编程语言通过定制的程序如图30中
所示地进行对比的步骤。

[1121] 具体而言，如图30所示，处理T1指的是辅酶Q10处理且NG和 HG指的是正常和高血糖作为条件。来自NG∩HGΔ网络中的NG的独特边界与HG∩HGT1Δ网络中HGT1的独特边界
对比。NG和HGT1 的交集中的边界是恢复到T1的NG的HG边界。恢复到T1的NG的 HG边界被叠
加到NG∩HGΔ网络上(图31中的较暗颜色的圆圈所示)。

[1122] 具体来说，使用定制的Perl程序对比正常血糖(NG)条件的模拟复合图谱与高血糖(HG)条件的模拟复合图谱以产生正常血糖条件的独特边界。使用定制的Perl程序对比
没有辅酶Q10处理的高血糖条件(HG)的模拟复合图谱与具有辅酶Q10处理的高血糖状态条
件(HGT1)的模拟复合图谱以产生具有辅酶Q10处理的高血糖条件 (HGT1)的独特边界。使用
Perl程序识别来自正常血糖条件(NG) 的独特边界与具有辅酶Q10处理的高血糖条件
(HGT1)的独特边界的交集的边界。这些边界代表通过辅酶Q10处理从高血糖状态恢复到
正常血糖状态的因子/网络。经过辅酶Q10处理恢复到正常的高血糖边界的Δ-Δ网络被叠
加到正常血糖∩高血糖Δ网络。叠加的网络的样品如图31中所示。图31是示例性的响应于
辅酶Q10处理的糖尿病/ 肥胖症/心血管疾病状态与正常状态的差异网络(Δ-Δ网络)。在
图 31中较深色的圆圈被确定为通过辅酶Q10处理从高血糖状态恢复到正常血糖状态的边
界。图31中的较浅色圆圈被确定为独特的正常血糖边界。

[1123] 将来自PERL和R程序的输出输入到Cytoscape(一种开源程序) 中以生成Δ-Δ网络的可视化表示。

[1124] 与上述的用于高血糖对正常血糖状态的实验相似，使用Perl程序对比没有辅酶Q10处理的高脂血症状态的模拟复合网络(如上所述来自所有的糖尿病/肥胖症/心血管疾
病相关细胞的组合数据)和具有辅酶Q10处理的高脂血状态的模拟复合网络(如上所述来
自所有的糖尿病/肥胖症/心血管疾病相关细胞的组合数据)以产生具有辅酶Q10处理的
独特的高脂血状态的边界。使用Perl程序确定来自正常血脂状态的独特边界和来自具有
辅酶Q10处理的高血脂状态的独特边界的交集的边界。这些边界代表通过辅酶Q10处理从
高血脂状态恢复到正常血脂状态的因子/网络。经过辅酶Q10处理恢复到正常的高血脂边
界的Δ-Δ网络被叠加到正常血脂∩高血脂Δ网络上。叠加的网络的样本如图32所示。图
32中较深色圆圈被确定为通过辅酶Q10处理从高血脂状态恢复到正常血脂状态的边界。图
32中的较浅色圆圈被确定为独特的正常血脂边界。FASN被确定为调节辅酶Q10的将高血脂
恢复到正常血脂状态的效应的信号传导途径中的一个重要因子。

[1125] 脂肪酸合酶-脂肪酸合成酶如FASN牵涉到人体代谢改变的几乎所有方面，如肥胖症、胰岛素抵抗或血脂异常。FASN抑制剂已被提议作为治疗肥胖症的首要分子，虽然其分
子机制是未知的(Mobbs等人2002)。浅蓝菌素和合成化合物C75-FASN抑制剂已被证明具有
减少食物摄入量的效果和实现体重减轻(Loftus等人，2000)。

[1126] 如图32中所示的，FASN被本文所描述的平台技术确定为调节辅酶Q10将糖尿病恢复到正常状态的效应的信号传导途径中的一个重要因子的事实验证了该Δ-Δ网络的准
确性。因此，在这个Δ-Δ网络中鉴别的其他新的因子将是用于进一步研究的潜在的治疗
因子或药物靶标。

[1127] 实施例4：采用平台技术建立药物诱导心脏毒性的模型

[1128] 在这个实施例中，使用在上面的发明详述中所详细描述的平台技术整合从定制的心脏毒性模型得到的数据并确定驱动发病机制/药物毒性的新蛋白质/途径。从这样的
分析所得的关系图谱提供了毒性生物标志物。

[1129] 健康心脏中，收缩功能取决于脂肪酸和碳水化合物氧化的平衡。摄取、利用、细胞器生物合成和非脂肪组织(心脏和肝脏)中的分泌的慢性失调被认为是线粒体损伤和功能
障碍的核心和药物诱导的心脏毒性中的关键角色。申请人在此描述了将蛋白质和脂质印
记与专门着眼于细胞生物能量学和线粒体膜功能的功能终点分析相结合的系统途径。用
一组药物处理补充有过度脂肪酸和高血糖的包含糖尿病和正常心肌细胞的体外模型以创
建毒性的印记和潜在机制。申请人证实了药物在通过在各种水平上破坏能量代谢成分使
线粒体失稳中的变化的效应，包括：(i)控制线粒体能量代谢基因的表达的转录网络的失
调；(ii)诱导糖尿病心肌细胞中的GPAT1和taffazin，从而开始磷脂的从头合成和在线粒
体膜中改造；及(iii)糖尿病心肌细胞中脂肪酸的命运改变，从而影响摄取、脂肪酸氧化和
ATP合成。此外，申请人将湿式实验室生物学的能力与基于人工智能的数据挖掘平台相结
合以生成基于贝叶斯模型的因果网络。导致正常细胞功能丧失的蛋白质和脂肪的网络被
用来分辨诱导药物毒性的机制与细胞保护机制。这种新途径将作为强大的新工具来了解
毒性的机制，同时允许开发校正改变的表型的更安全的疗法。

[1130] 人心肌细胞经受模拟疾病相关细胞在体内经历的糖尿病环境的条件。具体而言，将细胞暴露于高血糖条件和高血脂条件。高血糖条件是通过在含有22mM的葡萄糖的培养
基中培养细胞诱导的。高血脂条件是通过将细胞培养在含有1mM L-肉碱，0.7mM的油酸和
0.7 mM的亚油酸的培养基中诱导的。

[1131] 通过将细胞暴露于用已知导致心脏毒性的糖尿病药物(T)、救援分子(R)或者糖尿病药物和救援分子两者(T+R)处理的“环境扰动”，另外地“探询”含有上述细胞的细胞模型，其中该细胞暴露于上面所描述的各种条件。具体而言，细胞用糖尿病的药物处理或用
0、50μM或100μM的救援分子辅酶Q10处理；或用糖尿病药物和救援分子辅酶Q10两者处理。

[1132] 在治疗后的不同的时间(包括在处理6个小时后)收集来自具有各种扰动处理的各个条件的细胞样品。对于某些条件，还收集和分析培养基样品。

[1133] 使用上面的发明详述中详细描述的技术，对于为各个条件和具有各种“环境扰动”(即，糖尿病药物处理、辅酶Q10处理或两者)收集的细胞和培养基样品进行通过定量蛋
白质组学的总细胞蛋白质表达变化的iProfiling分析。使用Biorad CFX-384扩增系统进
行转录谱实验。数据收集(Ct)后，使用如制造商的说明中列出的δCt方法测定相对于对照
的最终倍数变化。用质谱进行脂质组学实验。基本上按制造商推荐的通过使用Seahorse分
析仪测定功能分析，如耗氧率OCR。通过由推靠Seahorse培养板墨形成的7微升室中的电极
记录OCR。

[1134] 如图35所示，对比了扰动和未扰动处理之间糖尿病心肌细胞(高血糖和高血脂条件化的心肌细胞)中的人线粒体能量代谢基因的转录网络和表达。具体而言，比较用糖尿
病药物处理的糖尿病心肌(T) 与未经治疗的糖尿病心肌细胞样品(UT)之间人线粒体能量
代谢基因的转录网络和表达的数据。比较用糖尿病药物和救援分子辅酶Q10 两者处理的
糖尿病心肌细胞(T+R)和未经处理的糖尿病心肌细胞样品(UT)之间人线粒体能量代谢基
因的转录网络和表达的数据。与来自未处理的糖尿病心肌细胞的数据相比，当用糖尿病药
物处理糖尿病心肌细胞时，某些基因的表达和转录发生改变。证明救援分子辅酶 Q10逆转
糖尿病药物的毒性作用并使基因表达和转录正常化。

[1135] 如图36A所示，心肌细胞在正常血糖(NG)或高血糖(HG)条件中培养，和用单独的糖尿病药物(T)或糖尿病药物和救援分子辅酶Q10两者(T+R)进行处理。用蛋白质印迹测试
各种条件和各个治疗的GPAT1和TAZ的蛋白质表达水平。在高血糖条件化的和糖尿病药物
处理的心肌细胞中GPAT1和TAZ均上调。当用糖尿病药物和救援分子辅酶Q10两者处理高血
糖条件化的心肌细胞时，GPAT1和TAZ 的上调的蛋白质表达水平被正常化。

[1136] 如图37A所示，对高血糖条件化的心肌细胞样品进行线粒体耗氧率(％)实验。高血糖条件化的心肌细胞未进行处理(UT)、用已知引起心脏毒性的糖尿病药物T1处理、用已
知引起心脏毒性的糖尿病药物T2处理、用糖尿病药物T1和救援分子辅酶Q10两者处理 (T1
+R)或者用糖尿病药物T2和救援分子辅酶Q10两者处理 (T2+R)。与未处理的对照样品相比，
当用糖尿病药物T1或T2处理高血糖条件化的心肌细胞时，线粒体OCR下降。然而，当用糖尿病药物和救援分子辅酶Q10两者(T1+R或T2+R)处理高血糖条件化的心肌细胞时，线粒体
OCR正常化。

[1137] 如图37B所示，对高血糖条件化的心肌细胞样品进行线粒体ATP 合成实验。高血糖条件化的心肌细胞未经处理(UT)、用糖尿病药物处理(T)或用糖尿病药物和救援分子辅酶
Q10两者(T+R)处理。与未处理的对照样品相比，当用糖尿病药物(T)处理高血糖条件化的
心肌细胞时，线粒体ATP合成被抑制。

[1138] 如图38所示，根据收集的蛋白质组学数据，通过药物处理下调的蛋白质由术语GO注释。当用已知导致心脏毒性的糖尿病药物处理高血糖条件化的心肌细胞时，参与线粒体
能量代谢的蛋白质被下调。

[1139] 然后由REFSTM系统处理为各种条件和具有各个扰动收集的蛋白质组学、脂质组学、转录谱分析、功能分析和蛋白质印迹数据。从对于暴露于各个扰动(例如，糖尿病药物、辅酶Q10或两者)的一种特定条件(例如，高血糖或高血脂)获得的组合数据生成复合扰动
网络。从对于没有扰动(未处理的)的相同的一种特定条件(例如，高血糖或高血脂)获得
的组合数据生成复合未扰动网络。类似地，从对于暴露于各个扰动(例如，糖尿病药物、辅
酶Q10或两者)的第二对照条件(例如，正常血糖)获得的组合数据生成复合扰动网络。从对
于无扰动(未处理)的相同的第二对照条件(例如，正常血糖)获得的组合数据生成复合未
扰动网络。

[1140] 如在上面的发明详述中所详细描述的，模拟(通过增加或减少10 倍)上述一致复合网络中的各个节点以使用REFSTM生成模拟网络。

[1141] 使用R编程语言通过定制的程序提取在模拟网络中连接父节点和子节点的各个边界的曲线下面积和倍数变化，其中R编程语言是用于统计计算和制图的开源软件环境。

[1142] 从模拟的复合网络生成Δ网络。为生成响应于糖尿病药物的药物诱导毒性条件与正常条件的差异网络(Δ网络)，使用PERL编程语言通过定制的程序如图39中所说明的
进行比较步骤。

[1143] 具体而言，如图39中所示，UT是指在高血糖条件下未处理的对照心肌细胞的蛋白质表达网络。处理T是指在高血糖条件下糖尿病药物处理的心肌细胞的蛋白质表达网络。
来自UT∩TΔ网络中T的独特边界如图40所示。

[1144] 具体来说，使用定制的Perl程序对比高血糖条件下未处理的心肌细胞的模拟复合图谱与高血糖条件下经糖尿病药物处理的心肌细胞的模拟复合图谱以生成高血糖条件
下糖尿病药物处理的心肌细胞的独特边界。将来自PERL和R程序的输出输入到Cytoscape
(一种开源程序)中以生成Δ网络的可视化表示。如图40中所示，该网络代表高血糖条件
下心肌细胞/心脏毒性模型中糖尿病药物相对于未处理所驱动的Δ网络。

[1145] 从图40所示的药物诱导毒性条件对正常条件的差异网络中，鉴别了驱动药物诱导心脏毒性的病理生理的蛋白质，如GRP78、GRP75、 TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1。这些蛋白质可以充当用于鉴别其他心脏毒性诱导药物的生物标志物。这些蛋白质
也可以用作用于鉴别可以减轻心脏毒性的试剂的生物标志物。

[1146] 在本实施例中所描述的实验表明，在暴露于药物处理的糖尿病心肌细胞中扰动的膜生物学和改变的游离脂肪酸的命运代表药物诱导毒性的中心部分。数据集成和网络
生物学使人们更好地了解心脏毒性和鉴别预测心脏毒性的新的生物标志物。

[1147] 实施例5：采用平台技术实现多蛋白质组学模型以阐明酶活性

[1148] 一般，上述实施例-4中描述的平台技术可以适应于实施用于鉴别生物系统或疾病过程的调节子的进一步方法。该方法利用了使用与生物系统相关的细胞的生物系统的
模型以代表生物系统的特征性方面。模型用于获得至少三个水平的数据，即(i)代表与生
物系统相关的细胞中的总体酶学活性的第一数据集，(ii)代表总体酶学活性对与生物系
统相关的细胞中的酶代谢产物或底物的效应的第二数据集，和(iii) 代表与生物系统相关
的细胞中的总体蛋白质组学改变的第三数据集。该数据用于生成总体酶学活性、总体酶学
活性的效应和总体蛋白质组学改变之中的一致因果关系网络。一致因果关系网络是仅基
于使用编程的计算装置的第一、第二和第三数据集(即，不基于任何其它已知的生物学关
系)。一致因果关系网络然后用于鉴别生物系统独特的因果关系，其中与独特的因果关系
相关的至少一种基因或蛋白质确定为生物系统或疾病过程的调节子。

[1149] 在该实施例中，平台技术适应于实施用于测量酶活性和该活性对蛋白质组的直接效应的多蛋白质组学技术，从而提供可以用于在细胞蛋白质组总体改变的情况中理解
酶与其代谢产物/底物之间的因果关系的系统。这种技术可以提供有价值的理解，因为如
本实施例中证明的，酶活性可以与酶表达正交(例如，下调的活性和上调的表达)。由这种
分析得到的关系图谱可以提供疾病治疗靶标以及与疾病相关的诊断/预后标志物。这类靶
标和标志物可以提供治疗组合物和方法。用于建立模型、获得数据集、生成一致因果关系
网络和鉴别生物系统独特的因果关系的技术在以上发明概述、发明详述和实施例中讨论。
用于建立模型和获得代表总体酶学活性和总体酶学活性对酶代谢产物或底物的效应的数
据集的进一步技术在以下提供。

[1150] 图41A显示用于鉴别生物系统或疾病过程的调节子的方法，其采用了用于阐明酶(例如，激酶)活性的多蛋白质组技术。首先，模型按照平台技术建立，其中细胞系经历模拟疾病的条件并通过暴露于环境扰动(例如，在以下提供的肝细胞癌的特定实施例中暴露于
索拉非尼)进行探询。提供对照用于对比。其次，酶活性及其下游效应在总体蛋白质组学
改变的情况中通过分析(i)总体酶学活性，(ii)酶学活性对蛋白质组(例如，酶活性的代谢
产物/底物)的特定效应和(iii)对细胞蛋白质组的总体效应来追踪。第三，数据集按照平
台技术进行分析以鉴别目标调节子。例如，癌症模型可以通过已知的抗癌症药物激酶抑
制剂探询；系统的这种扰动对总体激酶活性的效应可以与对磷酸化蛋白质组和全蛋白质
组的最终效应一起进行分析；且数据集可以通过基于AI的REFSTM系统进行分析。

[1151] 在该实施例中，选择肝细胞癌(HCC)以提供平台技术的说明性实施方式。HCC是全世界的癌症相关死亡的主要原因，列为肺癌和胃癌之后的第三大致死性癌症。多样的病
因、高发病率/致死率、缺乏用于早期诊断的诊断标志物及HCC的高度可变的临床过程阻碍
诊断和治疗的进展。在多年研究HCC后，对HCC中运行的分子机制的理解仍然是不完全的。
基因组、转录组和对比蛋白质组谱产生了对于HCC 研究的一些重要的见解。但是，许多研究
集中于与HCC相关的细胞改变的单一方面，从而妨碍了对生物系统的真正复杂性和动态方
面的完全理解。

[1152] 这一说明性实施例结合了(i)细胞生物学、(ii)集成的蛋白质组学平台和生成因果蛋白质网络的信息学平台的能力以描绘翻译后修饰 (例如磷酸化)和参与这种机制的酶
(例如，激酶)在HCC的病理生理学中的作用。特别地，这种途径采用ATP结合结构域富集探
针和HCC细胞模型中总蛋白质的磷酸化蛋白质组图谱而结合基于活性的蛋白质组学。

[1153] 多重激酶抑制剂索拉非尼(用于晚期HCC患者的一线化疗剂) 用于探测总体激酶活性和与这种治疗相关的蛋白质磷酸化改变的作用。HepG2(ATCC登录号HB-8065)细胞系
选择以形成HCC细胞模型和THLE2(ATCC登录号CRL-10149)细胞系选择以形成正常肝细胞
模型。

[1154] 图41B显示用于总体酶(例如，激酶)富集谱分析的方法。首先，制备包括所靶向的酶(例如，激酶)的细胞裂解产物。第二步是探针结合(例如，激酶情况中的ATP探针)。然后
酶被消化且捕获探针结合的片段。这些片段可以进行分析(例如，通过LC-MS/MS)且因此
相应的蛋白质被鉴别(例如，通过LC-MS/MS数据的数据库检索)。

[1155] THERMO 激酶富集试剂盒和探针(可从THERMO 和 Biotechnology www.thermoscientific.com/
pierce获得的说明书)用于总体酶活性分析。简而言之，这些试剂盒和类似的试剂盒使得
能够选择性标记和富集 ATP酶(包括激酶)、伴侣蛋白和代谢酶。ATP和ADP探针一般是核苷
酸衍生物，其共价修饰在核苷酸结合位点中具有保守的赖氨酸残基的酶活性位点。例如，
脱硫生物素-ATP和-ADP的结构由通过不稳定的酰基-磷酸酯键连接于核苷酸的修饰生物
素组成。取决于酶活性位点内赖氨酸的位置，脱硫生物素-ATP或-ADP可以优选用于标记特
定的ATP酶。

[1156] 脱硫生物素-ATP和-ADP都可以选择性地对样品中的靶酶类别进行富集、鉴别和分型或评估酶抑制剂的特异性和亲和力。许多ATP 酶和其它核苷酸结合蛋白质结合核苷酸
或抑制剂，甚至在它们被酶促失活时；这些试剂结合复杂样品中的无活性或活性酶两者。
样品与竞争活性位点探针的小分子抑制剂预孵育可以用于测定抑制剂结合亲和力和靶
标特异性。

[1157] 活性位点标记的评估可以通过蛋白质印迹或质谱(MS)完成。对于蛋白质印迹工作流程，脱硫生物素标记的蛋白质富集用于SDS-PAGE 分析和利用特定抗体的后续检测。对
于MS工作流程，脱硫生物素标记的蛋白质被还原、烷基化和酶促消化成为肽。仅脱硫生物
素标记的活性位点肽被富集用于通过LC-MS/MS的分析。两种工作流程都可以用于测定抑
制剂靶标结合，但仅MS工作流程可以鉴别总体抑制剂靶标和脱靶。

[1158] THERMO TiO2磷肽富集和清洁试剂盒 (可从THERMO 和 Biotechnology www.thermoscientific.com/
pierce获得的说明书)用于磷酸化蛋白质组分析。简而言之，这些试剂盒和类似的试剂盒
可以使得能够有效地从复杂的和分级的蛋白质消化物分离磷酸化的肽用于通过质谱(MS)
进行分析。与优化的缓冲液组合的球形多孔二氧化钛以最低非特异性结合提供增强的磷
肽富集和鉴别。离心柱形式是快速的和方便使用的且可以从300-1000μg的消化蛋白质样
品富集最多100μg的磷肽。试剂盒的优化方案、缓冲液成分和石墨离心柱获得高产率的清
洁磷肽样品准备用于MS分析。

[1159] 磷酸化是对于生物功能(如细胞信号传导、生长、分化和分裂及程序化细胞死亡)关键的蛋白质修饰。但是，磷肽具有高亲水性且丰度较低，从而导致不良的色谱、离子化和片段化。磷肽富集因此对于成功的MS分析是关键的。磷肽富集和清洁试剂盒可以与裂解、
还原、烷基化、消化和石墨离心柱相容以提供用于磷肽富集和鉴别的完整工作流程。

[1160] 对比的蛋白质学、磷酸化蛋白质组和酶活性数据集成到基于AI 的REFSTM信息学平台中。然后生成特别地从功能性观点(即激酶/酶活性和激酶可以磷酸化的潜在靶标)的蛋
白质相互作用的因果网络。另外，使用细胞功能读数，确定调节靶标的磷酸化和机械地驱
动病理生理学细胞行为的酶/激酶。本文中概述的说明性实施方式有利于对细胞反应、对
化学灵敏性机制的认识和HCC临床控制的潜在靶标/生物标志物的总体表征。

[1161] 材料和方法

[1162] 细胞按照以下方案培养。第1天：HepG2/Hep3B–在T-75培养瓶中接种3.2x106个细胞；在T-175培养瓶中接种7.4x106个细胞；或在T-225培养瓶中接种9.5x106个细胞。THLE-
2–在T-75培养瓶中接种1.3x106个细胞。第2天：16-24小时后，50-70％汇合时，添加处理。对照：终浓度0.01％的DMSO。EGF：10mM乙酸中500ng/mL。索拉非尼：DMSO中0.1％体积的1μM。第3天：处理后24小时，通过胰蛋白酶消化收获细胞。在冷冻前用PBS洗涤细胞团2次。

[1163] 总体酶活性分析按照以下方案进行。

[1164] 细胞裂解：

[1165] 新制备的裂解缓冲液-5 M尿素，50mM Tris-HCL pH 8.4,0.1％ SDS,1％蛋白酶抑制剂混合物，1％磷酸酶抑制剂混合物

[1166] 1)通过以2000g离心5分钟在1.5-2mL Eppendorf微管中沉淀细胞并除去上清液。

[1167] 2)通过在PBS中重悬细胞团洗涤细胞。重复洗涤一次。

[1168] 3)添加适宜量的裂解缓冲液到各样品中并涡旋。

[1169] 4)在冰上孵育10分钟，伴有定期混合。

[1170] 5)超声处理各样品直到裂解完成。

[1171] 6)以最高速度离心15分钟。

[1172] 7)转移溶解产物(上清液)到新管中。

[1173] 裂解缓冲液-交换：

[1174] 使用Pierce’s预制反应缓冲液。

[1175] 反应缓冲液–20mM HEPES pH 7.4,150mM NaCl,0.1％ TritonX-100

[1176] 1)拧开Zeba离心脱盐柱的底封并松开盖子。

[1177] 2)置于15mL锥形管中。

[1178] 3)室温下以1000g离心柱2分钟以除去储存溶液。

[1179] 4)添加3mL反应缓冲液到柱中。以1000g离心2分钟以除去缓冲液。再重复2次，弃去缓冲液。

[1180] a.如果在最后洗涤时存在过量缓冲液，另外1000g离心2-3 分钟。

[1181] 5)转移柱到新锥形管。

[1182] 6)缓冲施加整个裂解产物到树脂床的中心。

[1183] 7)以1000g离心2分钟以收集样品。弃去柱。

[1184] 8)添加1:100蛋白酶/磷酸酶抑制剂混合物到样品并置于冰上。

[1185] a.样品可以在-80℃冰箱中冷冻。

[1186] 终止点

[1187] 用探针的样品标记：

[1188] 使用来自Pierce的预制1 M MgCl2。

[1189] 制备新鲜的1 M MnCl2。

[1190] 1)使用Bradford分析测定蛋白质浓度。

[1191] 2)用水稀释裂解产物至2mg/mL(2μg/μL)，如果可能。

[1192] 3)转移2mg到新的微离心管。

[1193] 4)添加20μL的1 M MgCl2到各样品，混合，在室温下孵育1min。

[1194] 注：终浓度是0.02 M MgCl2

[1195] 5)添加10μL的1 M MgCl2到各样品，混合，在室温下孵育1min。

[1196] 注：终浓度是10mM MgCl2

[1197] 6)用干燥剂平衡ATP/ADP试剂到室温。储存残留物在-80℃下。

[1198] 7)对于20μM反应-添加10μL的超纯水到试剂中以制备1mM 原液。

[1199] 8)添加20μL的ATP/ADP原液到各样品并在室温下孵育1小时。

[1200] 标记的蛋白质的还原和烷基化：

[1201] 制备新鲜的10 M尿素/50mM Tris-HCl pH 8.4。

[1202] 1)添加1mL的10 M尿素/50mM Tris-HCl到各反应中。

[1203] 2)添加100μL的200mM TCEP到各样品中。在55℃下孵育1 hr。

[1204] 3)添加100μL的375mM碘乙酰胺到各样品中。在室温下黑暗中孵育30分钟。

[1205] 缓冲液交换：

[1206] 制备新鲜的消化缓冲液–2 M尿素，200mM Tris-HCL pH 8.4。

[1207] 1)拧开Zeba离心脱盐柱的底封并松开盖子。

[1208] 2)置于15mL锥形管中。

[1209] 3)在室温下以1000g离心柱2分钟以除去储存溶液。

[1210] 4)添加3mL的消化缓冲液到柱中。以1000g离心2分钟以除去缓冲液。再重复2次，弃去缓冲液。

[1211] a.如果在最后洗涤时存在过量的缓冲液，以1000g再离心2-3 分钟。

[1212] 5)转移柱到新的锥形管中。

[1213] 6)缓慢施加整个样品到树脂床的中心。

[1214] 7)以1000g离心2分钟以收集样品。弃去柱。

[1215] 标记的蛋白质的消化：

[1216] 1)以1:50的比率(胰蛋白酶：蛋白质)添加胰蛋白酶。

[1217] 2)在37℃下伴随振摇孵育过夜。

[1218] 标记的肽的捕获和洗脱：

[1219] 制备新鲜的洗脱缓冲液(50％CAN；0.1％甲酸)。

[1220] 1)添加50μL的浆料到各消化的样品中。在室温下稳定搅拌情况下孵育1.5小时。

[1221] 2)将样品转移到Pierce离心柱。以1000g离心1分钟。收集穿流液并保存。

[1222] 3)每次洗涤以1000g离心1分钟。

[1223] a.用500μL的4 M尿素/50mM Tris-HCl pH 8.4洗涤树脂3次。

[1224] b.用500μL的PBS洗涤树脂4次。

[1225] c.用500μL的水洗涤树脂4次。

[1226] 4)用75μL的洗脱缓冲液洗脱肽并孵育3分钟。再重复2次，合并洗脱液级分。

[1227] 5)在真空浓缩器中冻干样品。

[1228] 无标记的1-D分离用于LCMSMS分析

[1229] 1)一旦样品通过冻干干燥，重悬各样品在25μL的0.1％甲酸中。

[1230] 2)转移10μL到小瓶中用于LCMSMS。

[1231] iTRAQ标记

[1232] 1)剩余的15μL样品完全干燥。

[1233] 2)重悬样品在30μL的200mM TEAB中。

[1234] 3)15μL的样品用30μL的iTRAQ试剂标记并在室温下孵育2小时。

[1235] a.每样品6μL汇合用于QCP。

[1236] 4)标记后，添加8μL的5％羟胺用于在4℃下淬灭15分钟。

[1237] 5)所有MP汇合在一起，干燥，脱盐并重悬在20μL的0.1％甲酸中。

[1238] Eksigent/LTQ Orbitrap仪存在问题，因此MP干燥并重悬在18μL 的20mM甲酸铵中。

[1239] 每样品的残留物：

[1240] -在-80℃下200mM TEAB中的9μL洗脱液

[1241] -仪器上20mM甲酸铵中的MP

[1242] 磷蛋白分析按照以下方案进行。

[1243] 样品制备方案：

[1244] 1.细胞裂解

[1245] a.裂解缓冲液–5 M尿素，50mM Tris-HCL,0.1％SDS,1％蛋白酶抑制剂混合物，1％磷酸酶抑制剂混合物。

[1246] b.重悬细胞团在适宜量的裂解缓冲液中。

[1247] c.涡旋并在冰上孵育10分钟。重复。

[1248] d.超声处理并在冰上孵育10分钟。

[1249] e.以最高速度离心15分钟。

[1250] f.如果溶解产物仍是粘性/粘稠的，则再超声处理。

[1251] g.转移溶解产物到新管中。

[1252] 2.进行Bradford分析以测定蛋白质浓度。

[1253] 3.转移700μg的蛋白质(对于THLE-2为400μg)到具有45μL 的200mM TEAB的新微管中。

[1254] 4.55℃下以5μL TCEP:100μL体积用200mM TCEP还原1小时。

[1255] 5.室温下以5μL碘:100μL体积用375mM碘乙酰胺在黑暗中烷基化30分钟。

[1256] 6.在-20℃下以7X体积丙酮沉淀。

[1257] 7.以50μg/μL将蛋白质重悬在200mM TEAB中。37℃下用胰蛋白酶以1:40(胰蛋白酶:蛋白质)消化过夜。

[1258] 在柱制备过程中，重悬肽样品在150μL的缓冲液B中。

[1259] 柱制备：

[1260] 1.将离心柱连接器置于收集管中并将TiO2旋转尖头插入连接器中。

[1261] 2.添加20μL的缓冲液A。以3000g离心2分钟。弃去FT。

[1262] 3.添加20μL的缓冲液B。以3000g离心2分钟。弃去FT。

[1263] 磷肽结合：

[1264] 1.转移旋转尖头到清洁微管。

[1265] 2.施加悬浮的样品到旋转尖头。以1000g离心10分钟。

[1266] 3.重施加样品到旋转尖头并以1000g离心10分钟。保存FT。

[1267] 4.转移旋转尖头到新的微管。

[1268] 5.通过添加20μL的缓冲液B洗涤柱。以3000g离心2分钟。

[1269] 6.通过添加20μL的缓冲液A洗涤柱。以3000g离心2分钟。再重复一次。

[1270] 洗脱：

[1271] 1.将旋转尖头置于新的收集管中。添加50μL的洗脱缓冲液1。以1000g离心5分钟。

[1272] 2.使用相同的收集管，添加50μL的洗脱缓冲液2到旋转尖头。以1000g离心5分钟。

[1273] 3.通过添加100μL的2.5％甲酸酸化洗脱级分。

[1274] 磷肽的石墨清洁

[1275] **用甲酸取代TFA，因为这是LC/MS/MS分析之前的最终清洁。

[1276] 柱准备：

[1277] 1.从石墨离心柱除去顶盖和底盖。将柱置于1.5mL微管中。以 2000g离心1分钟以除去储存缓冲液。

[1278] 2.添加100μL的1 M NH4OH。以2000g离心1分钟。弃去FT。再重复一次。

[1279] 3.通过添加100μL的丙酮活化石墨。以2000g离心1分钟。弃去FT。

[1280] 4.添加100μL的1％甲酸。以2000g离心1分钟。弃去FT。再重复一次。

[1281] 样品结合和洗脱：

[1282] 洗脱＝0.1％FA+50％CAN

[1283] 1.将柱置于新的收集管中。将样品施加于树脂床的顶部。允许在周期性涡旋混合的情况下结合10分钟。

[1284] 2.以1000g离心3分钟。弃去FT。

[1285] 3.将柱置于新的收集管中。通过添加200μL的1％FA洗涤柱。以2000g离心1分钟。弃去FT。再重复一次。

[1286] 4.将柱置于新的收集管中。添加100μL的1％FA/50％CAN以洗脱样品。以2000g离心1分钟。再重复3次以达到总洗脱400μL。

[1287] 5.在真空蒸发器(SpeedVac)中干燥样品。

[1288] HepG2和Hep3B：

[1289] ·用700μg的蛋白质开始

[1290] ·在TiO2富集和石墨清洁后，磷肽在400μL的0.1％甲酸 /50％ACN中洗脱。

[1291] ·从洗脱液获取(400/700)*400μL等份的比率并完全干燥。其重悬在20μL的200mM TEAB中用于iTRAQ标记。

[1292] ·在标记后，样品脱盐、干燥和重悬在20μL的0.1％甲酸中。

[1293] ·剩余的等份试样完全干燥并重悬在20μL的0.1％甲酸中。

[1294] ·10μL转移到小瓶中用于无标记LCMSMS分析。

[1295] THLE-2：

[1296] ·仅收获400μg的蛋白质。

[1297] ·所有蛋白质用TiO2柱富集并用石墨柱清洁。

[1298] ·洗脱液干燥，重悬在20μL的200mM TEAB中用于 iTRAQ标记。

[1299] ·在标记后，样品脱盐、干燥和重悬在20μL的0.1％甲酸中。

[1300] 样品残留物：

[1301] iTRAQ样品–仪器上20mM甲酸铵中

[1302] 无标记HepG2/Hep3B–-80℃下0.1％甲酸中10μL；仪器上0.1％甲酸中10μL

[1303] 结果

[1304] 图42显示用索拉非尼处理的HepG2中ENO1活性而非蛋白质表达的显著降低。图43显示用索拉非尼处理的HepG2中PGK1活性而非蛋白质表达的显著降低。图44显示用索拉非
尼处理的HepG2中 LDHA活性的显著降低。在各种情况中，ENO1表达以相对于QC样品的单位
计量且ENO1活性改变以相对于对照的未处理样品的单位计量。

[1305] 图42-44中的数据表明，对于HCC疾病模型中的ENO1、LDHA 和PGK1，细胞用索拉非尼处理导致蛋白质表达的上调和蛋白质的酶活性的伴随下调。因此，磷酸化蛋白质组提供
另外的信息层次，其可用于阐明细胞外信号(例如，药物分子)对激酶活性的效应与总细胞
蛋白质之间的复杂关系，从而有助于疾病治疗靶标以及与疾病相关的诊断/预后标志物的
鉴别。

[1306] 图45显示可以通过使用基于AI的REFSTM系统分析所得数据集产生的因果性分子相互作用网络(参见左图)。该网络可用于例如鉴别在正常和癌细胞中差异地调节的目的
网络(分别参见中图和右图)。这类信息可以用于提供HCC治疗靶标以及与HCC相关的诊断/
预后标志物。

[1307] 图46-51显示致癌系统的二维化学探询和印记的多组学探询可以如何揭示参与癌症的病理生理学的新型信号传导途径，从而鉴别治疗靶标、相关标志物和/或治疗剂。特
别地，图46-51显示图41中所示的且按照本文描述的各种方法的一般方法的实施。如图41
中显示的，该途径通过“二维化学探询”推动，其中体外癌症和对照模型通过第一维的激
酶抑制剂(索拉非尼)探询。激酶活性的整体改变通过采用基于活性的激酶富集探针的第
二维的化学探询捕获。激酶通过LC-MS 鉴别。另外，磷酸化蛋白质组响应于激酶抑制剂的暴
露的改变使用磷蛋白富集方法捕获，接着进行用于蛋白质鉴别的LC-MS。最后，获得总蛋
白质表达的定量改变。所得的多组学数据使用基于AI的信息学整合，从而导致生成代表驱
动蛋白质磷酸化的差异激酶活性的数据驱动的因果网络，其在癌症模型中是起作用的但
在“正常”模型中则否。这些补充分析的整合显示于图46和47的推导途径中。该技术导致与癌症的病理生理学机制相关的新激酶和关系的发现(例如，图48-50)。

[1308] 图46显示采用贝叶斯网络推理算法的多组学数据的整合可以如何导致对肝细胞癌中信号传导途径的更好理解。黄色方块代表转录后修饰(磷酸化)数据，蓝色三角形代表
基于活性的(激酶)数据，和绿色圆形代表蛋白质组学数据。图47显示肝细胞癌信号传导途
径中的自动调节和逆反馈调节可以如何通过平台推导。方块代表PMT(磷酸化)数据(灰
色/黑色＝激酶，黄色/浅色–无激酶活性)，方块代表基于活性的(激酶)+蛋白质组学数据
(灰色/黑色＝激酶，黄色/ 浅色–无激酶活性)。这些分析使用如上所述和图41中概述的三
层多蛋白质组学方法进行。这些分析的结果显示于图48-51中并在以下更详细地讨论。

[1309] 图48-50显示通过平台推导的信号传导途径中因果相关性的实例。激酶名称在代表性的方块和圆形上表示，因果相关性通过连接体表示。图48鉴定CLTCL1、MAPK1、NME1、
HIST1H2BA、RPS5、 TMED4和MAP4激酶同工型并显示其间推导的关系。图49鉴定 HNRPDL、
HNRNPK、RAB7A、RPL28、HSPA9、MAP2K2、RPS6、 FBL、TCOF1、PGK1、SLTM、TUBB、PGK2、CDK1、MARCKS、 HDLBP和GSK3B激酶同工型并显示其间推导的关系。图50鉴定 RPS5、TNRCBA、
CLTCL1、NME1、MAPK1、RPL17、CAMK2A、 NME2、UBE21、CLTCL1、HMGB2和NME2激酶同工型并显示其间推导的关系。这些激酶同工型呈现潜在的治疗靶标、标志物和治疗方法。

[1310] 图51显示由平台导出的因果相关性。特别地，图51鉴定EIF4G1、 MAPK1和TOP2A激酶同工型并显示其间推导的关系。这一关系提供模型和方法的验证，因为它与EIF、MAPK和
TOP激酶之间公布的关系一致。

[1311] 总之，酶(例如，激酶)活性的基于多组学的分析代表用于确定随细胞行为变化的代谢物和底物之间的下游因果关系的有用方法。同样地，响应于治疗性处理的总体酶活性
变化的基于活性的蛋白质组监测与仅监测蛋白质(例如，酶)的总体细胞表达相比可以提
供对细胞信号传导动力学的关键认识。此外，已证明平台可以稳定地推导信号传导途径
和致癌环境相对正常环境的逆反馈调节，且因此鉴定致癌信号传导途径中的新型因果相
关性。因此，该技术提供新激酶的鉴定和破译激酶抑制剂作用机制。

[1312] 实施例6：血管生成的体外模型和CoQ10的调节

[1313] 引言：大于2-5mm的肿瘤尺寸的进展需要诱导血管生成以向肿瘤供应氧和营养物。血管生成由于内皮有丝分裂因子响应于缺氧或遗传突变的肿瘤内细胞释放而发生，且
在临床发展中当前存在众多的内源蛋白质作为治疗性抗血管生成靶标，例如VEGF和PlGF。
此处，我们已经在体外研究了辅酶Q10(CoQ10)，其当前处于癌症进展的人体研究中。

[1314] 方法：调节血管生成表型的人脐静脉内皮细胞(HUVEC)命运决定在100或1500μM CoQ10或赋形剂的存在下检验并与未处理的对照细胞比较。在内针对细
胞凋亡、增殖、迁移和3-D管形成进行了内皮细胞命运分析。

[1315] 结果：膜联蛋白V/碘丙锭阳性细胞的形态学和流式细胞分析揭示了与赋形剂或对照细胞相比1500μM CoQ10存在下HUVEC细胞凋亡的增加。伴随由于CoQ10导致的细胞死
亡增加，HUVEC细胞计数在 1500μM CoQ10存在下显著降低。为评估CoQ10对内皮迁移的潜在效应，HUVEC迁移在内皮划痕分析中细胞清除后5小时检验。CoQ10 和赋形剂在100和1500μM
浓度下显著影响HUVEC迁移，表明赋形剂和CoQ10两者的抗迁移活性。为了确定CoQ10抗肿
瘤活性是否是由于对内皮出芽血管生成的影响，我们在3-D 培养物中
随时间检验了管形成。赋形剂添加到凝胶和覆盖介质中与对照相比损害管形成。而且，添
加1500μM CoQ10与赋形剂和对照未处理细胞相比进一步损害HUVEC管形成。这些效应早在
接种后24小时和在培养中最长96小时注意到。总体来看，这些研究证明CoQ10效应很可能
(至少部分地)由于抑制对于新血管形成的局部血液供应的肿瘤募集。

[1316] CoQ10对内皮形态的效应：人脐静脉内皮细胞(HUVEC细胞) 用一定浓度范围的CoQ10处理24小时。药物应用于紧密类似于“正常”细胞的汇合细胞和同样应用于更密切地
代表增殖细胞的血管生成表型的亚汇合细胞。在汇合的培养物中，添加提高浓度的CoQ10
导致EC的更紧密关联、延长和排列。5000μM导致圆形细胞的轻微增加(图52A)。亚汇合的
内皮细胞对CoQ10的反应与汇合细胞反应相异(图52B)。内皮在1000μM CoQ10及以上可见
为不健康的。增加的细胞死亡对于提高浓度的CoQ10可见。

[1317] CoQ10对于内皮细胞存活具有相异的效应：HUVEC细胞的汇合和亚汇合培养物用100或1500μM CoQ10处理24小时并对碘丙锭阳性凋亡细胞进行分析。结果分别显示于图
53A和53B中。CoQ10对于汇合时处理的EC是保护性的，而亚汇合细胞对于CoQ10是敏感的
并在1500μM CoQ10下显示提高的细胞凋亡。显示随提高浓度的 CoQ10增加的细胞凋亡水平
的亚汇合对照EC(左)、100μM CoQ10 (中)和1500μM(右)的代表性图谱显示于图53C中。

[1318] CoQ10降低内皮细胞数和增殖：HUVEC细胞的亚汇合培养物用 100或1500μM CoQ10处理72小时并使用碘丙锭掺入分析(检测 G2/M相DNA)对细胞数(图54A)和增殖(图54B)进
行分析。高浓度的CoQ10导致细胞数的显著降低并对EC增殖具有剂量依赖性的效应。针对
细胞周期的G2/M期的细胞分选的细胞增殖的代表性图谱显示随提高浓度的CoQ10降低的
细胞增殖[图54C，对照EC(左)， 100μM CoQ10(中)和1500μM CoQ10(右)]。

[1319] CoQ10降低内皮细胞迁移：HUVEC细胞生长到汇合以使用“划痕”分析测试迁移。100或1500μM CoQ10在刻划时应用并在48小时内监测清除区域的闭合。100μM CoQ10与对
照相比延迟内皮闭合。 0、12、24和36小时时的代表性图像提供于图55中。添加1500μM
CoQ10阻止闭合，甚至直到48小时(数据未显示)。

[1320] CoQ10影响内皮管形成：在3-D基质胶中生长的内皮细胞随时间形成管。观察到100μM和1500μM CoQ10对管形成的差异效应。受损的细胞-细胞关联和早期管结构的破坏
在1500μM CoQ10下是显著的。有趣的是，管形成在1500μM CoQ10存在下不开始，但导致管生长和形成的过程48小时受到影响。显示于图56中的图像在72小时时获得。

[1321] 结果和结论：

[1322] 我们研究了CoQ10的潜在血管生成调节效应。CoQ10是当前在人实体肿瘤研究中进行研究的调节细胞能量代谢的抗癌剂。

[1323] 低剂量的CoQ10对于汇合的内皮细胞是保护性的，而添加CoQ10 到亚汇合细胞中导致增加的细胞凋亡、降低的细胞数且是内皮增殖的强效抑制剂。我们证明了对于汇合和
亚汇合细胞的相异效应，其保护 “正常”脉管系统。

[1324] 对于内皮在2-D划痕分析中迁移的能力的功能性评估揭示了内皮迁移的强力抑制。延时摄影揭示在2天的培养/处理期间未能闭合清除区域的动态内皮“前缘”。

[1325] 3-D基质胶中内皮细胞的悬浮导致随时间的管形成。使用重现在肿瘤血管生成中发挥作用的许多因素的这一良好描述的分析，我们检验CoQ10对内皮管形成的效应。添加
100μM CoQ10具有适度的管形成效应，但添加1500μM CoQ10导致内皮管形成的急剧破坏。

[1326] 总之，这些结果表明CoQ10对内皮出芽、迁移和增殖的影响并选择性地诱导血管生成内皮细胞中的细胞死亡。

[1327] 实施例7：辅酶Q10差异地调节汇合和亚汇合HUVEC细胞的功能性反应

[1328] 既然已经证明了CoQ10对汇合和亚汇合条件下生长的HUVEC细胞中细胞增殖和迁移的差异影响，研究CoQ10对HUVEC细胞的生物化学途径的影响。

[1329] 评估了CoQ10存在或不存在的情况下HUVEC细胞对常氧和缺氧的反应。具体地，HUVEC细胞如本文所描述的在常氧或缺氧条件下在亚汇合和汇合培养物中生长。细胞也暴
露于0、100或1500μM CoQ10。一氧化氮(NO)和反应性氧物质(ROS)水平使用本文中提供的
方法测定。如图57中所示，HUVEC细胞显示出差异的一氧化氮(NO) 和反应性氧物质(ROS)响
应于CoQ10和缺氧的剂量依赖性产生。

[1330] HUVEC细胞的生物能量学在各种浓度的CoQ10存在下评估。具体地，HUVEC细胞在CoQ10不存在或存在(10、100、1500μM)下在亚汇合和汇合条件中生长。耗氧率(OCR)(总耗
氧率和线粒体耗氧率)、 ATP产生和细胞外酸化率(ECAR)使用Seahorse分析评估。在亚汇合
培养物中生长的HUVEC细胞与汇合培养物相比限制线粒体氧消耗，如图58A-D中所示((A)
总OCR；(B)线粒体OCR；(C)ATP；(D) ECAR)。CoQ10添加到亚汇合培养物中将线粒体OCR恢复
到汇合水平OCR(图58B)。

[1331] 实施例8：功能性蛋白质组学和脂质组学应用于阐明CoQ10的抗血管生成机制

[1332] 血管生成是提供肿瘤细胞生长所需的氧和营养物的关键的肿瘤进展赋能特征。我们研究了CoQ10(当前在癌进展的人体研究中进行研究的抗肿瘤药物)的抗血管生成性
能。CoQ10影响“划痕”分析中的内皮迁移和3-D 管形成分析中的管形成。
CoQ10的添加也影响内皮增殖，如通过G2/M期细胞和增殖细胞核抗原(pCNA) 蛋白检测的。
CoQ10诱导胱天蛋白酶3的激活并增加血管生成/增殖内皮细胞的细胞凋亡，而非增殖的汇
合内皮细胞培养物的细胞死亡与对照相比下降。

[1333] 为了确定血管生成性增殖内皮细胞和非增殖内皮细胞的细胞内蛋白质组学特征，我们使用了蛋白质组学、脂质组学和功能性蛋白质组学途径。分别在LTQ-OrbiTrap-
Velos和Vantage-QqQ上进行蛋白质组学和鸟枪脂质组学分析。功能性蛋白质组学途径与
对比蛋白质组学结合采用基于活性的探针。激酶和其它ATP酶特别地用与处于原始构象
的酶的活性位点相互作用的ATP-结合结构域富集探针标记。富集通过抗生蛋白链菌素树
脂的免疫沉淀进行。

[1334] 使用集成的脂质组学和蛋白质组学平台及生成因果脂质/蛋白质/ 功能蛋白质组学网络的基于AI的贝叶斯信息学平台，鉴别了调节血管生成的新的蛋白质、脂质和酶。
CoQ10处理的细胞及正常和血管生成细胞的比较用于探测总体激酶活性。对比蛋白质组学
和酶活性数据整合到基于AI的贝叶斯信息学平台中以研究功能性蛋白质-蛋白质相互作
用的因果网络以阐明血管生成的复杂性和动力学。因果相互作用性网络显示于图59A-C
中。具体地，图59A是脂质、蛋白质和激酶的完全多组学因果相互作用网络。图59B显示蛋白质富集网络的中枢，和图59C显示激酶、脂质组学和功能性终点网络的中枢。在该网络中，蛋白质通过圆形表示，激酶通过方块表示，脂质通过菱形表壳，和功能活性或细胞反应通
过八角形表示。提供了一些蛋白质和激酶名称。平台的输出证实了已知的蛋白质相互作
用。

[1335] 总之，使用平台技术，通过应用整合的功能性蛋白质组学分析以确定酶活性的总体改变研究了CoQ10的抗血管生成机制和增殖内皮细胞的独特特征。基于探询式“组学”的
平台稳定地推导细胞情报。用于数据挖掘以推导因果关系的基于AI的网络工程途径产生
可发挥作用的(actionable)生物学情报。此外，发现平台允许更好地理解内皮细胞响应
于环境刺激、代谢状态的改变和适应性分子的产生以缓和生理扰乱的病理生理学。

[1336] 实施例9：采用平台技术构建血管生成模型

[1337] 在本实施例中，上面发明详述部分中详细描述的平台技术用于整合从专门构建的血管生成模型获得的数据并鉴别驱动血管生成的新蛋白质/途径。由这种分析获得的关
系图谱提供血管生成生物标志物。

[1338] 血管生成是未完全理解的一系列复杂信号传导途径的结果。血管生成在多种病理状况中发挥作用，包括，但不限于癌症。本文中提供了将蛋白质和脂质印记与特别地考
察细胞生物能量学和线粒体膜功能的功能性终点分析结合的系统途径。如以上证明的，亚
汇合的 HUVEC细胞可以用于模拟血管生成状态，而汇合的HUVEC细胞可以用于模拟非血管
生成的(即正常的)状态。

[1339] 在体外模型中，HUVEC细胞在接触抑制(例如，汇合培养物) 的条件下或在缺乏接触抑制(例如，亚汇合培养物，例如，低于约60％汇合，低于约70％汇合，低于约80％汇合，低于约90％汇合；三维培养物；或其中通过“刻划”培养物除去细胞斑片的培养物)在环境
影响剂如血管生成抑制剂(例如，CoQ10)存在或不存在下生长以产生印记和阐明血管生
成的潜在机制。蛋白质组和脂质组印记使用本文提供的平台方法分析。血管生成的生物标
志物进一步使用湿式实验室方法确认。这一途径用作用于理解血管生成的机制的有力工
具，从而允许鉴别新的血管生成生物标志物及开发和测试调节血管生成的药剂。

[1340] 人脐静脉内皮细胞经历模拟体内疾病相关细胞所经受的血管生成环境的条件。具体地，细胞在其中生长由于接触抑制而受到抑制 (即，正常细胞)的条件下或在其中在至
少一部分培养物中生长未由于接触抑制而受到抑制(即，血管生成细胞)的条件下生长。为
了简单的原因，在其中在至少一部分培养物中生长未由于接触抑制而受到抑制的条件下
生长的这类细胞称为非汇合培养物。

[1341] 包含上述细胞的细胞模型另外地通过用调节血管生成的药剂(例如，抑制血管生成的药剂)处理而将细胞暴露于“环境扰动”进行“探询”，其中所述细胞在汇合或非汇合培养物中生长。例如，细胞以各种浓度的辅酶Q10处理，例如，0、50μM、100μM、250μM、500μM、
750μM、1000μM、1250μM或1500μM的一种或多种。如本文中提供的，扰动可以包括细胞的机械破坏，例如通过“刻划”培养物或以低密度分培养细胞。

[1342] 来自具有各扰动处理的各种情况的细胞样品在处理后的各时间收集，例如处理6、12、18、24、36、48、60、72、84、96、108或 120小时后或者其间的一些时间点。对于特定情况，也收集和分析培养基样品。然后可以分析样品的蛋白质表达或活性水平、基因表达和
脂质水平中的一种或多种。

[1343] 通过定量蛋白质组学对总细胞蛋白质表达改变的iProfiling分析使用以上发明详述中描述的技术对于在各情况下和各“环境扰动” (即，辅酶Q10处理)收集的细胞和培养
基样品进行。转录谱试验例如使用 CFX-384扩增系统进行。在数据收集(Ct)后，
相对于对照的最终倍数变化使用例如制造商的方案中概述的δCt方法确定。脂质组学试
验使用质谱进行。基本上如制造商推荐的采用Seahorse分析仪测定功能性分析如耗氧率
(OCR)。OCR可以在用推靠Seahorse培养板的盒形成的7μl腔室中的电极记录。

[1344] 总之，形态学、酶学和流式细胞分析揭示响应于CoQ10处理的细胞凋亡、迁移、一氧化氮和ROS产生及生物能量容量的显著改变。脂质组学分析揭示通过改变线粒体功能和
细胞密度减轻的脂质途径的新改变。利用平台方法的蛋白质组学整合揭示细胞内适应和
通过线粒体调节指导的信号传导的未表征相关性。总体来看，这些研究揭示 CoQ10改变内
皮迁移、增殖、细胞凋亡、一氧化氮、ROS和蛋白质/ 脂质体系结构。新的机制在本文中提供，其中CoQ10的抗肿瘤活性是由于血管生成和细胞凋亡因子的代谢交互，其抑制用于新血管
形成的局部血管供应的肿瘤募集。另外，蛋白质组学和脂质组学适应与支持内皮细胞响
应于环境刺激的生理学要求的相互作用网络相关。这些数据提供对于由于失调的线粒体
代谢控制元件导致肿瘤血管生成的选择性适应的特征性认识。

[1345] 实施例10：采用平台技术实施用于阐明酶活性的多蛋白质组学模型

[1346] 一般，以上实施例5中描述的酶学平台技术可以适应于实施用于鉴别生物系统或疾病过程如血管生成的调节子的进一步方法。该方法采用血管生成的模型(包含与血管生
成相关的细胞)以代表血管生成的特征性方面。该模型用于获得至少三个水平的数据，即
(i)代表与血管生成相关的细胞中的总体酶活性的第一数据集；(ii)代表与血管生成相
关的细胞中总体酶活性对酶代谢产物或底物的效应的第二数据集；和(iii)代表与血管生
成相关的细胞中总体蛋白质改变的第三数据集。另外的数据集如脂质组学、转录组学、代
谢组学和SNP数据。该数据用于使用编程的计算装置生成总体酶活性、总体酶活性的效应
和总体蛋白质组学改变之中的一致因果关系网络。一致因果关系网络是仅基于第一、第二
和第三数据集(即不基于任何其它已知的生物学关系)。一致因果关系网络然后用于鉴别
血管生成独特的因果关系，其中与独特的因果关系相关的至少一种基因或蛋白质确认为
血管生成的调节子。

[1347] 在这一实施例中，平台技术适应于实施用于测量与血管生成相关的酶活性及该活性对于蛋白质组的直接效应的多蛋白质组学技术，且因此提供可用于理解在血管生成
过程中细胞蛋白质组总体改变的背景中酶(例如，激酶和/或蛋白酶)与其代谢产物/底物
之间的因果关系的系统。这类技术可以提供有价值的见解，因为酶活性可以与酶表达正
交(例如，活性下调和表达上调)。由这样的分析产生的关系图谱可以提供通过调节血管生
成的疾病治疗靶标以及与血管生成相关的诊断/预后标志物。这些靶标和标志物可以用于
治疗组合物和方法中。用于建立模型、获得数据集、生成一致因果关系网络和鉴别血管生
成独特的因果关系的技术在发明概述、发明详述和以上实施例中讨论。用于建立模型及获
得代表总体酶活性和总体酶活性对酶代谢产物或底物的效应的数据集的进一步技术在以
下提供。

[1348] 首先，按照平台技术建立模型，其中例如细胞系经历模拟疾病的条件并通过暴露于环境扰动(例如，暴露于血管生成的调节子，例如， CoQ10、阿瓦斯汀、VEGF抑制剂、血管形成抑制素、贝伐单抗、HUVEC 细胞汇合的改变)进行探询。第二，酶活性及其下游效应通过分析(i) 总体酶学活性；(ii)酶学活性对蛋白质组(例如，酶学活性的代谢产物/底物)的特
定效应；和(iii)对细胞蛋白质组的总体效应在总体蛋白质组学改变的背景中追踪。第三，
按照平台技术分析数据集以鉴别目标调节子。例如，血管生成模型可以通过已知的血管生
成调节子探询；对系统的这一扰动对于总体激酶活性的效应与对于磷酸化蛋白质组和总
蛋白质组的最终效应一起进行分析；且数据集可以通过基于 AI的REFSTM系统分析。

[1349] 例如，在各种不同条件下生长的HUVEC细胞可以用于模拟血管和正常(例如，非血管生成)状态。因为除了在特定情况下(例如，妊娠、伤口愈合等)血管生成不会在成人中出
现，因此通过这一方法鉴别的血管生成标志物的存在可用作指示疾病状态(例如，癌症、类风湿性关节炎、年龄相关性黄斑变性或糖尿病性肾病)的标志物。

[1350] 这一说明性实施例结合了(i)细胞生物学、(ii)集成的蛋白质组学平台和生成因果蛋白质网络的信息学平台的能力以描绘血管生成中翻译后修饰(例如，磷酸化)和参与
这种机制的酶(例如，激酶)的作用。特别地，这种途径采用ATP结合结构域富集探针和血管
生成模型中总蛋白质的磷酸化蛋白质组图谱结合基于活性的蛋白质组学。

[1351] 对比蛋白质组学、磷酸化蛋白质组和酶活性数据整合到基于AI 的REFSTM信息学平台中。然后特别地从功能性观点(即激酶/酶活性和激酶可以磷酸化的潜在靶标)生成蛋白
质相互作用的因果网络。另外，使用细胞功能读数，确定了调节靶标的磷酸化和机械驱动
病理生理细胞行为的酶/激酶。本文中概述的说明性实施方式有助于细胞反应、对血管生
成机制的认识和用于血管生成临床管控的潜在靶标/生物标志物的总体表征。

[1352] 作为说明性实例，代表正常细胞的细胞和血管生成细胞选择用于比较。如本文中说明的，HUVEC细胞在亚汇合培养物中生长时显示血管生成特征，而汇合的HUVEC细胞不显
示血管生成特征。HUVEC 细胞的亚汇合培养物用CoQ10处理将HUVEC细胞切换至非血管生成
状态，如本文中说明的。利用以上提供的蛋白质组学方法，酶学活性的分析方法可以包括
在任何条件下生长的HUVEC细胞的成对分析，和任选地从与来自第三数据集的结果配对比
较的结果的进一步分析。

[1353] 作为示例性实施方式，在汇合和非汇合培养物中培养的等同数量的HUVEC细胞被收获且细胞对于目标肽(例如，磷肽)的存在进行富集。如实施例5中进行比较分析以检测
与血管生成相关的酶学活性的变化。

[1354] 通过引用引入

[1355] 可能在本申请全文中引用的所有被引用文献(包括参考文献、专利、专利申请、在本申请的提交日可得的版本的GenBank号和网站) 的内容以及其中所引用的文献以其整体
在此明确通过引用并入本文。除非另有说明，本发明的实施将采用在本技术领域是众所周
知的蛋白质制剂的常规技术。

[1356] 等同

[1357] 本发明可以以其它的具体形式实施而不背离其精神或实质特征。因此，前述的实施方式在所有方面被视为说明性的而不是限制本文所描述的发明。因此，本发明的范围是
由所附权利要求而不是由前面的描述决定，因此被包含在本发明的权利要求书的等价物
的含义和范围内的所有变化意图包含在本发明范围之内。

[1358] 附录A:相关蛋白质的氨基酸和cDNA序列

[1359] 1.TCOF1:Treacher Collins-Franceschetti综合征1

[1360] 基因座NM_000356

[1361] AA:MAEARKRRELLPLIYHHLLRAGYVRAAREVKEQSGQKCFLAQPV TLLDIYTHWQQTSELGRKRKAEEDAALQAKKTRVSDPISTSESSEEEEEAEAETAKAT PRLASTNSSVLGADLPSSMKEKAKAETEKAGKTGNSM
PHPATGKTVANLLSGKSPRKS AEPSANTTLVSETEEEGSVPAFGAAAKPGMVSAGQADSSSEDTSSSSDETDVEV
KASE KILQVRAASAPAKGTPGKGATPAPPGKAGAVASQTKAGKPEEDSESSSEESSDSEEET PAAKALLQAKAS
GKTSQVGAASAPAKESPRKGAAPAPPGKTGPAVAKAQAGKREEDSQ SSSEESDSEEEAPAQAKPSGKAPQVRAAS
APAKESPRKGAAPAPPRKTGPAAAQVQVG KQEEDSRSSSEESDSDREALAAMNAAQVKPLGKSPQVKPASTMGMG
PLGKGAGPVPPG KVGPATPSAQVGKWEEDSESSSEESSDSSDGEVPTAVAPAQEKSLGNILQAKPTSSPA KGPP
QKAGPVAVQVKAEKPMDNSESSEESSDSADSEEAPAAMTAAQAKPALKIPQTKA CPKKTNTTASAKVAPVRVGTQ
APRKAGTATSPAGSSPAVAGGTQRPAEDSSSSEESDS EEEKTGLAVTVGQAKSVGKGLQVKAASVPVKGSLGQGT
APVLPGKTGPTVTQVKAEKQ EDSESSEEESDSEEAAASPAQVKTSVKKTQAKANPAAARAPSAKGTISAPGKVVT
AAA QAKQRSPSKVKPPVRNPQNSTVLARGPASVPSVGKAVATAAQAQTGPEEDSGSSEEES DSEEEAETLAQVK
PSGKTHQIRAALAPAKESPRKGAAPTPPGKTGPSAAQAGKQDDSG SSSEESDSDGEAPAAVTSAQVIKPPLI
FVDPNRSPAGPAATPAQAQAASTPRKARASE STARSSSSESEDEDVI PATQCLTPGIRTNVVTMPTAHPRIAPK
ASMAGASSSKESSRI SDGKKQEGPATQVSKKNPASLPLTQAALKVLAQKASEAQPPVARTQPSSGVDSAVGTL P
ATSPQSTSVQAKGTNKLRKPKLPEVQQATKAPESSDDSEDSSDSSSGSEEDGEGPQG AKSAHTLGPTPSRTETLV
EETAAESSEDDVVAPSQSLLSGYMTPGLTPANSQASKATP KLDSSPSVSSTLAAKDDPDGKQEAKPQQAAGMLSP
KTGGKEAASGTTPQKSRKPKKGA GNPQASTLALQSNITQCLLGQPWPLNEAQVQASVVKVLTELLEQERKKVVDT
TKESSR KGWESRKRKLSGDQPAARTPRSKKKKKLGAGEGGEASVSPEKTSTTSKGKAKRDKASG DVKEKKGKGS
LGSQGAKDEPEEELQKGMGTVEGGDQSNPKSKKEKKKSDKRKKDKEKK EKKKKAKKASTKDSESPSQKKKKKKKK
TAEQTV

[1362]

[1363]

[1364] 2.TOP2A:人拓扑异构酶

[1365] 基因座NM_001067

[1366] AA翻译＝"MEVSPLQPVNENMQVNKIKKNEDAKKRLSVERIYQKKTQLEHIL LRPDTYIGSVELVTQQMWVYDEDVGINYREVTFVPGLYKIFDEILVNAADNKQRDPKM SCIRVTIDPENNLISIWNNGKGIPVVEHKVE
KMYVPALIFGQLLTSSNYDDDEKKVTG GRNGYGAKLCNIFSTKFTVETASREYKKMFKQTWMDNMGRAGEMELKP
FNGEDYTCIT FQPDLSKFKMQSLDKDIVALMVRRAYDIAGSTKDVKVFLNGNKLPVKGFRSYVDMYLK DKLDET
GNSLKVIHEQVNHRWEVCLTMSEKGFQQISFVNSIATSKGGRHVDYVADQIV TKLVDVVKKKNKGGVAVKAHQVK
NHMWIFVNALIENPTFDSQTKENMTLQPKSFGSTC QLSEKFIKAAIGCGIVESILNWVKFKAQVQLNKKCSAVKH
NRIKGIPKLDDANDAGGR NSTECTLILTEGDSAKTLAVSGLGVVGRDKYGVFPLRGKILNVREASHKQIMENAEIN
NIIKIVGLQYKKNYEDEDSLKTLRYGKIMIMTDQDQDGSHIKGLLINFIHHNWPSLLR HRFLEEFITPIVKVSKN
KQEMAFYSLPEFEEWKSSTPNHKKWKVKYYKGLGTSTSKEA KEYFADMKRHRIQFKYSGPEDDAAISLAFSKKQI
DDRKEWLTNFMEDRRQRKLLGLPE DYLYGQTTTYLTYNDFINKELILFSNSDNERSIPSMVDGLKPGQRKVLFTC
FKRNDKR EVKVAQLAGSVAEMSSYHHGEMSLMMTIINLAQNFVGSNNLNLLQPIGQFGTRLHGGK DSASPRYIF
TMLSSLARLLFPPKDDHTLKFLYDDNQRVEPEWYIPIIPMVLINGAEGI GTGWSCKIPNFDVREIVNNIRRLMDG
EEPLPMLPSYKNFKGTIEELAPNQYVISGEVA ILNSTTIEISELPVRTWTQTYKEQVLEPMLNGTEKTPPLITDY
REYHTDTTVKFVVKM TEEKLAEAERVGLHKVFKLQTSLTCNSMVLFDHVGCLKKYDTVLDILRDFFELRLKYY G
LRKEWLLGMLGAESAKLNNQARFILEKIDGKIIIENKPKKELIKVLIQRGYDSDPVK AWKEAQQKVPDEEENEES
DNEKETEKSDSVTDSGPTFNYLLDMPLWYLTKEKKDELCR LRNEKEQELDTLKRKSPSDLWKEDLATFIEELEAV
EAKEKQDEQVGLPGKGGKAKGKK TQMAEVLPSPRGQRVIPRITIEMKAEAEKKNKKKIKNENTEGSPQEDGVELE
GLKQRL EKKQKREPGTKTKKQTTLAFKPIKKGKKRNPWSDSESDRSSDESNFDVPPRETEPRRA ATKTKFTMDL
DSDEDFSDFDEKTDDEDFVPSDASPPKTKTSPKLSNKELKPQKSVVSD LEADDVKGSVPLSSSPPATHFPDETEI
TNPVPKKNVTVKKTAAKSQSSTSTTGAKKRA APKGTKRDPALNSGVSQKPDPAKTKNRRKRKPSTSDDSDSNFEK
IVSKAVTSKKSKGE SDDFHMDFDSAVAPRAKSVRAKKPIKYLEESDEDDLF

[1367]

[1368]

[1369]

[1370] 3.CAMK2A:CAMK2A钙/钙调蛋白依赖性蛋白质激酶IIα[人]

[1371] 基因座:NM_015981.3(同工型1)

[1372] AA/翻译＝"MATITCTRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKII NTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIV AREYYSEADASHCIQQILEAVLHCHQMGVV
HRDLKPENLLLASKLKGAAVKLADFGLA IEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILL
VGYPPFWDEDQ HRLYQQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHRST VASCM
HRQETVDCLKKFNARRKLKGAILTTMLATRNFSGGKSGGNKKSDGVKKRKSSS SVQLMESSESTNTTIEDEDTKV
RKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFE PEALGNLVEGLDFHRFYFENLWSRNSKPVHTTILNPHIH
LMGDESACIAYIRITQYLD AGGIPRTAQSEETRVWHRRDGKWQIVHFHRSGAPSVLPH

[1373]

[1374]

[1375] 基因座NM_171825(同工型2)

[1376] AA/翻译＝"MATITCTRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKII NTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIV AREYYSEADASHCIQQILEAVLHCHQMGVV
HRDLKPENLLLASKLKGAAVKLADFGLA IEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILL
VGYPPFWDEDQ HRLYQQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHRST VASCM
HRQETVDCLKKFNARRKLKGAILTTMLATRNFSGGKSGGNKKSDGVKESSEST NTTIEDEDTKVRKQEIIKVTEQ
LIEAISNGDFESYTKMCDPGMTAFEPEALGNLVEGL DFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAY
IRITQYLDAGGIPRTAQSE ETRVWHRRDGKWQIVHFHRSGAPSVLPH

[1377]

[1378]

[1379] 4.CDK1:CDK1细胞周期蛋白依赖性激酶1[人]

[1380] 基因座NM_001170406(同工型4)

[1381] AA/翻译＝"MEDYTKIEKIGEGTYGVVYKGRHKTTGQVVAMKKIRLESEEEGV PSTAIREISLLKELRHPNIVSLQDVLMQDSRLYLIFEFLSMDLKKYLDSIPPGQYMDS SLVKVKA

[1382]

[1383] 基因座NM_001786(同工型1)

[1384] AA/翻译＝"MEDYTKIEKIGEGTYGVVYKGRHKTTGQVVAMKKIRLESEEEGV PSTAIREISLLKELRHPNIVSLQDVLMQDSRLYLIFEFLSMDLKKYLDSIPPGQYMDS SLVKSYLYQILQGIVFCHSRRVLHRDLKPQ
NLLIDDKGTIKLADFGLARAFGIPIRVY THEVVTLWYRSPEVLLGSARYSTPVDIWSIGTIFAELATKKPLFHGD
SEIDQLFRIFR ALGTPNNEVWPEVESLQDYKNTFPKWKPGSLASHVKNLDENGLDLLSKMLIYDPAKRI
SGKMALNHPYFNDLDNQIKKM

[1385]

[1386] 基因座NM_033379(同工型2)

[1387] AA/翻译＝"MEDYTKIEKIGEGTYGVVYKGRHKTTGQVVAMKKIRLESEEEGV PSTAIREISLLKELRHPNIVSLQDVLMQDSRLYLIFEFLSMDLKKYLDSIPPGQYMDS SLVKVVTLWYRSPEVLLGSARYSTPVDIWS
IGTIFAELATKKPLFHGDSEIDQLFRIF RALGTPNNEVWPEVESLQDYKNTFPKWKPGSLASHVKNLDENGLDLL
SKMLIYDPAKR ISGKMALNHPYFNDLDNQIKKM

[1388]

[1389]

[1390] 5.CLTCL1:CLTCL1网格蛋白,重链样-1[人]

[1391] 基因座NM_001835(同工型2)

[1392] AA/翻译＝"MAQILPVRFQEHFQLQNLGINPANIGFSTLTMESDKFICIREKV GEQAQVTIIDMSDPMAPIRRPISAESAIMNPASKVIALKAGKTLQIFNIEMKSKMKAH TMAEEVIFWKWVSVNTVALVTETAVYHWSM
EGDSQPMKMFDRHTSLVGCQVIHYRTDE YQKWLLLVGISAQQNRVVGAMQLYSVDRKVSQPIEGHAAAFAEFKME
GNAKPATLFCF AVRNPTGGKLHIIEVGQPAAGNQPFVKKAVDVFFPPEAQNDFPVAMQIGAKHGVIYLI TKYGY
LHLYDLESGVCICMNRISADTIFVTAPHKPTSGIIGVNKKGQVLSVCVEEDNI VNYATNVLQNPDLGLRLAVRSN
LAGAEKLFVRKFNTLFAQGSYAEAAKVAASAPKGIL RTRETVQKFQSIPAQSGQASPLLQYFGILLDQGQLNKLE
SLELCHLVLQQGRKQLLEK WLKEDKLECSEELGDLVKTTDPMLALSVYLRANVPSKVIQCFAETGQFQKIVLYAK
KV GYTPDWIFLLRGVMKISPEQGLQFSRMLVQDEEPLANISQIVDIFMENSLIQQCTSFL LDALKNNRPAEGLL
QTWLLEMNLVHAPQVADAILGNKMFTHYDRAHIAQLCEKAGLLQ QALEHYTDLYDIKRAVVHTHLLNPEWLVNFF
GSLSVEDSVECLHAMLSANIRQNLQLC VQVASKYHEQLGTQALVELFESFKSYKGLFYFLGSIVNFSQDPDVHLK
YIQAACKTGQ IKEVERICRESSCYNPERVKNFLKEAKLTDQLPLIIVCDRFGFVHDLVLYLYRNNLQR YIEIYV
QKVNPSRTPAVIGGLLDVDCSEEVIKHLIMAVRGQFSTDELVAEVEKRNRLK LLLPWLESQIQEGCEEPATHNAL
AKIYIDSNNSPECFLRENAYYDSSVVGRYCEKRDP HLACVAYERGQCDLELIKVCNENSLFKSEARYLVCRKDPE
LWAHVLEETNPSRRQLID QVVQTALSETRDPEEISVTVKAFMTADLPNELIELLEKIVLDNSVFSEHRNLQNLLIL
TAIKADRTRVMEYISRLDNYDALDIASIAVSSALYEEAFTVFHKFDMNASAIQVLIEH IGNLDRAYEFAERCNEP
AVWSQLAQAQLQKDLVKEAINSYIRGDDPSSYLEVVQSASR SNNWEDLVKFLQMARKKGRESYIETELIFALAKT
SRVSELEDFINGPNNAHIQQVGDR CYEEGMYEAAKLLYSNVSNFARLASTLVHLGEYQAAVDNSRKASSTRTWKE
VCFACMD GQEFRFAQLCGLHIVIHADELEELMCYYQDRGYFEELILLLEAALGLERAHMGMFTEL AILYSKFKP
QKMLEHLELFWSRVNIPKVLRAAEQAHLWAELVFLYDKYEEYDNAVLTM MSHPTEAWKEGQFKDIITKVANVELC
YRALQFYLDYKPLLINDLLLVLSPRLDHTWTV SFFSKAGQLPLVKPYLRSVQSHNNKSVNEALNHLLTEEEDYQD
AMQHAAESRDAELAQ KLLQWFLEEGKRECFAACLFTCYDLLRPDMVLELAWRHNLVDLAMPYFIQVMREYLSK
VDKLDALESLRKQEEHVTEPAPLVFDFDGHE

[1393]

[1394]

[1395]

[1396] 基因座NM_007098(同工型1)

[1397] AA/翻译＝"MAQILPVRFQEHFQLQNLGINPANIGFSTLTMESDKFICIREKV GEQAQVTIIDMSDPMAPIRRPISAESAIMNPASKVIALKAGKTLQIFNIEMKSKMKAH TMAEEVIFWKWVSVNTVALVTETAVYHWSM
EGDSQPMKMFDRHTSLVGCQVIHYRTDE YQKWLLLVGISAQQNRVVGAMQLYSVDRKVSQPIEGHAAAFAEFKME
GNAKPATLFCF AVRNPTGGKLHIIEVGQPAAGNQPFVKKAVDVFFPPEAQNDFPVAMQIGAKHGVIYLI TKYGY
LHLYDLESGVCICMNRISADTIFVTAPHKPTSGIIGVNKKGQVLSVCVEEDNI VNYATNVLQNPDLGLRLAVRSN
LAGAEKLFVRKFNTLFAQGSYAEAAKVAASAPKGIL RTRETVQKFQSIPAQSGQASPLLQYFGILLDQGQLNKLE
SLELCHLVLQQGRKQLLEK WLKEDKLECSEELGDLVKTTDPMLALSVYLRANVPSKVIQCFAETGQFQKIVLYAK
KV GYTPDWIFLLRGVMKISPEQGLQFSRMLVQDEEPLANISQIVDIFMENSLIQQCTSFL LDALKNNRPAEGLL
QTWLLEMNLVHAPQVADAILGNKMFTHYDRAHIAQLCEKAGLLQ QALEHYTDLYDIKRAVVHTHLLNPEWLVNFF
GSLSVEDSVECLHAMLSANIRQNLQLC VQVASKYHEQLGTQALVELFESFKSYKGLFYFLGSIVNFSQDPDVHLK
YIQAACKTGQ IKEVERICRESSCYNPERVKNFLKEAKLTDQLPLIIVCDRFGFVHDLVLYLYRNNLQR YIEIYV
QKVNPSRTPAVIGGLLDVDCSEEVIKHLIMAVRGQFSTDELVAEVEKRNRLK LLLPWLESQIQEGCEEPATHNAL
AKIYIDSNNSPECFLRENAYYDSSVVGRYCEKRDP HLACVAYERGQCDLELIKVCNENSLFKSEARYLVCRKDPE
LWAHVLEETNPSRRQLID QVVQTALSETRDPEEISVTVKAFMTADLPNELIELLEKIVLDNSVFSEHRNLQNLLIL
TAIKADRTRVMEYISRLDNYDALDIASIAVSSALYEEAFTVFHKFDMNASAIQVLIEH IGNLDRAYEFAERCNEP
AVWSQLAQAQLQKDLVKEAINSYIRGDDPSSYLEVVQSASR SNNWEDLVKFLQMARKKGRESYIETELIFALAKT
SRVSELEDFINGPNNAHIQQVGDR CYEEGMYEAAKLLYSNVSNFARLASTLVHLGEYQAAVDNSRKASSTRTWKE
VCFACMD GQEFRFAQLCGLHIVIHADELEELMCYYQDRGYFEELILLLEAALGLERAHMGMFTEL AILYSKFKP
QKMLEHLELFWSRVNIPKVLRAAEQAHLWAELVFLYDKYEEYDNAVLTM MSHPTEAWKEGQFKDIITKVANVELC
YRALQFYLDYKPLLINDLLLVLSPRLDHTWTV SFFSKAGQLPLVKPYLRSVQSHNNKSVNEALNHLLTEEEDYQG
LRASIDAYDNFDNIS LAQQLEKHQLMEFRCIAAYLYKGNNWWAQSVELCKKDHLYKDAMQHAAESRDAELAQK L
LQWFLEEGKRECFAACLFTCYDLLRPDMVLELAWRHNLVDLAMPYFIQVMREYLSKV
DKLDALESLRKQEEHVTEPAPLVFDFDGHE

[1398]

[1399]

[1400] 6.EIF4G1:EIF4G1真核翻译起始因子4γ,1[人]

[1401] 基因座NM_001194946(同工型6)

[1402] AA/翻译＝"MNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTP SQPRQGGFRSLQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQIS YPASQGAYYIPGQGRSTYVVPTQQYPVQPG
APGFYPGASPTEFGTYAGAYYPAQGVQQ FPTGVAPAPVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGA
RTASTPTPPQT GGGLEPQANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPS PVLEP
GSEPNLAVLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEV EVTLSKPVPESEFSSSPLQAPT
PLASHTVEIHEPNGMVPSEDLEPEVESSPELAPPPA CPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQ
AKEVTASMAPPTIPSATPA TAPSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNL
EA AAATQVAVSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESE GSGVPPRPEEADET
WDSKEDKIHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFL LGFQFIFASMQKPEGLPHISDVVLDKANKTP
LRPLDPTRLQGINCGPDFTPSFANLGR TTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTE
DIKLNKAEKA WKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTE ERLKGV
IDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQK EFEKDKDDDEVFEKKQKEMDEAA
TAEERGRLKEELEEARDIARRRSLGNIKFIGELFK LKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLD
FEKAKPRMDQYFNQMEKI IKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQL
MAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSN NQLFAPGGRLSWGKGSS
GGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRR VVQRSSLSRERGEKAGDRGDRLERSERGGDRGDR
LDRARTPATKRSFSKEVEERSRER PSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKA
IIEEYLH LNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTA QYYQGLYEI
LELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGK AASLLLEILGLLCKSMGPKKVGTLWR
EAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEE SEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQ
IVSNTLVRALMTAVC YSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMF F
DALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN

[1403]

[1404]

[1405] 基因座NM_004953(同工型4)

[1406] AA/翻译＝"MSGARTASTPTPPQTGGGLEPQANGETPQVAVIVRPDDRSQGAI IADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGSEPNLAVLSIPGDTMTTIQMSVE ESTPISRETGEPYRLSPEPTPLAEPILEVE
VTLSKPVPESEFSSSPLQAPTPLASHTV EIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPVPIAPTAQPEEL
LNGAPSPPAVD LSPVSEPEEQAKEVTASMAPPTIPSATPATAPSATSPAQEEEMEEEEEEEEGEAGEAG EAESE
KGGEELLPPESTPIPANLSQNLEAAAATQVAVSVPKRRRKIKELNKKEAVGDL LDAFKEANPAVPEVENQPPAGS
NPGPESEGSGVPPRPEEADETWDSKEDKIHNAENIQ PGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIFASM
QKPEGLPHISDVVLDKANK TPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPQAGLGP
RR SQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLF RRVRSILNKLTPQM
FQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMC RCLMALKVPTTEKPTVTVNFRKLLLNRCQKE
FEKDKDDDEVFEKKQKEMDEAATAEER GRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLK
NHDEESLECL CRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPR RGDQGP
KTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGG WNTVPISKGSRPIDTSRLTKITK
PGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAA SEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRE
RGEKAGDRGDRLERSERG GDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREA
ALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGV ESTLERSAIAREHMGQL
LHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLA ELVTPILQEGGVPMGELFREITKPLRPLGKAASL
LLEILGLLCKSMGPKKVGTLWREA GLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKL
LKEGSSN QRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYL CDEQKELQA
LYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQ GKGVALKSVTAFFKWLREAEEESDHN"

[1407]

[1408]

[1409] 基因座NM_182917(同工型1)

[1410] AA/翻译＝"MNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTP SQPRQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQISYPASQGA YYIPGQGRSTYVVPTQQYPVQPGAPGFYPG
ASPTEFGTYAGAYYPAQGVQQFPTGVAP APVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPT
PPQTGGGLEPQ ANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGS EPNLA
VLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEVEVTLSKP VPESEFSSSPLQAPTPLASHTV
EIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPV PIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTAS
MAPPTIPSATPATAPSATS PAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNLEAAAATQ
VA VSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESEGSGVPPR PEEADETWDSKEDK
IHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIF ASMQKPEGLPHISDVVLDKANKTPLRPLDPT
RLQGINCGPDFTPSFANLGRTTLSTRG PPRGGPGGELPRGPQAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNK
AEKAWKPSSK RTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGV IDLIFE
KAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDK DDDEVFEKKQKEMDEAATAEERG
RLKEELEEARDIARRRSLGNIKFIGELFKLKMLTE AIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKP
RMDQYFNQMEKIIKEKKT SSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSD
KRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAP GGRLSWGKGSSGGSGAK
PSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSS LSRERGEKAGDRGDRLERSERGGDRGDRLDRART
PATKRSFSKEVEERSRERPSQPEG LRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYL
HLNDMKE AVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGL YEILELAED
MEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLL EILGLLCKSMGPKKVGTLWREAGLSW
KEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQ RALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTL
VRALMTAVCYSAIIF ETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYD E
DVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN

[1411]

[1412]

[1413] 基因座NM_198241(同工型5)

[1414] AA/翻译＝"MNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTP SQPRQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQISYPASQGA YYIPGQGRSTYVVPTQQYPVQPGAPGFYPG
ASPTEFGTYAGAYYPAQGVQQFPTGVAP APVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPT
PPQTGGGLEPQ ANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGS EPNLA
VLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEVEVTLSKP VPESEFSSSPLQAPTPLASHTV
EIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPV PIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTAS
MAPPTIPSATPATAPSATS PAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNLEAAAATQ
VA VSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESEGSGVPPR PEEADETWDSKEDK
IHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIF ASMQKPEGLPHISDVVLDKANKTPLRPLDPT
RLQGINCGPDFTPSFANLGRTTLSTRG PPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKA
EKAWKPSSKR TAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVI DLIFEK
AISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKD DDEVFEKKQKEMDEAATAEERGR
LKEELEEARDIARRRSLGNIKFIGELFKLKMLTEA IMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPR
MDQYFNQMEKIIKEKKTS SRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDK
RRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPG GRLSWGKGSSGGSGAKP
SDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSL SRERGEKAGDRGDRLERSERGGDRGDRLDRARTP
ATKRSFSKEVEERSRERPSQPEGL RKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLH
LNDMKEA VQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLY EILELAEDM
EIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLE ILGLLCKSMGPKKVGTLWREAGLSWK
EFLPEGQDIGAFVAEQKVEYTLGEESEAPGQR ALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLV
RALMTAVCYSAIIFE TPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDE D
VVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN

[1415]

[1416]

[1417]

[1418] 基因座NM_198242(同工型3)

[1419] AA/翻译＝"MNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPTP PQTGGGLEPQANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTP SPSPVLEPGSEPNLAVLSIPGDTMTTIQMS
VEESTPISRETGEPYRLSPEPTPLAEPI LEVEVTLSKPVPESEFSSSPLQAPTPLASHTVEIHEPNGMVPSEDLE
PEVESSPELAP PPACPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTASMAPPTIPSA TPATA
PSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQN LEAAAATQVAVSVPKRRRKIKE
LNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGP ESEGSGVPPRPEEADETWDSKEDKIHNAENIQPGEQKYE
YKSDQWKPLNLEEKKRYDR EFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSF
AN LGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKA EKAWKPSSKRTAAD
KDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAI DTEERLKGVIDLIFEKAISEPNFSVAYANMC
RCLMALKVPTTEKPTVTVNFRKLLLNR CQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRR
SLGNIKFIGE LFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQM EKIIKE
KKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKV QQLMAKGSDKRRGGPPGPPISRG
LPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSI DSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATS
TLNRFSALQQAVPTESTD NRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERS
RERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEE YLHLNDMKEAVQCVQEL
ASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHL STAQYYQGLYEILELAEDMEIDIPHVWLYLAELV
TPILQEGGVPMGELFREITKPLRP LGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAE
QKVEYTL GEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMT AVCYSAIIF
ETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLL RMFFDALYDEDVVKEDAFYSWESSKD
PAEQQGKGVALKSVTAFFKWLREAEEESDHN

[1420]

[1421]

[1422]

[1423] 基因座NM_198244(同工型2)

[1424] AA/翻译＝"MMIPSQISYPASQGAYYIPGQGRSTYVVPTQQYPVQPGAPGFYP GASPTEFGTYAGAYYPAQGVQQFPTGVAPAPVLMNQPPQIAPKRERKTIRIRDPNQGG KDITEEIMSGARTASTPTPPQTGGGLEPQA
NGETPQVAVIVRPDDRSQGAIIADRPGL PGPEHSPSESQPSSPSPTPSPSPVLEPGSEPNLAVLSIPGDTMTTIQ
MSVEESTPISR ETGEPYRLSPEPTPLAEPILEVEVTLSKPVPESEFSSSPLQAPTPLASHTVEIHEPNG MVPSE
DLEPEVESSPELAPPPACPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEP EEQAKEVTASMAPPTIPSATPA
TAPSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKG GEELLPPESTPIPANLSQNLEAAAATQVAVSVPKRRRKI
KELNKKEAVGDLLDAFKEA NPAVPEVENQPPAGSNPGPESEGSGVPPRPEEADETWDSKEDKIHNAENIQPGEQK
YE YKSDQWKPLNLEEKKRYDREFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLD PTRLQGINCGPDFT
PSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKE PRKIIATVLMTEDIKLNKAEKAWKPSSKRTA
ADKDRGEEDADGSKTQDLFRRVRSILN KLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYAN
MCRCLMALKV PTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELE EARDIA
RRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIG KDLDFEKAKPRMDQYFNQMEKII
KEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKT IDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPIS
RGLPLVDDGGWNTVPISK GSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPAT
STLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLD RARTPATKRSFSKEVEE
RSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPL KAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQ
ELASPSLLFIFVRHGVESTLERSA IAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAE
LVTPILQ EGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFL PEGQDIGAF
VAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIE ANLSEQQIVSNTLVRALMTAVCYSAI
IFETPLRVDVAVLKARAKLLQKYLCDEQKELQ ALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESS
KDPAEQQGKGVALKS VTAFFKWLREAEEESDHN

[1425]

[1426]

[1427] 7.ENO1:ENO1烯醇化酶1,(α)[人]

[1428] 基因座NM_001428

[1429] AA/翻译＝"MSILKIHAREIFDSRGNPTVEVDLFTSKGLFRAAVPSGASTGIY EALELRDNDKTRYMGKGVSKAVEHINKTIAPALVSKKLNVTEQEKIDKLMIEMDGTEN KSKFGANAILGVSLAVCKAGAVEKGVPLYR
HIADLAGNSEVILPVPAFNVINGGSHAG NKLAMQEFMILPVGAANFREAMRIGAEVYHNLKNVIKEKYGKDATNV
GDEGGFAPNIL ENKEGLELLKTAIGKAGYTDKVVIGMDVAASEFFRSGKYDLDFKSPDDPSRYISPDQL ADLYK
SFIKDYPVVSIEDPFDQDDWGAWQKFTASAGIQVVGDDLTVTNPKRIAKAVNE KSCNCLLLKVNQIGSVTESLQA
CKLAQANGWGVMVSHRSGETEDTFIADLVVGLCTGQ IKTGAPCRSERLAKYNQLLRIEEELGSKAKFAGRNFRNP
LAK

[1430]

[1431] 8.FBL:FBL纤维蛋白[人]

[1432] 基因座NM_001436

[1433] AA/翻译＝"MKPGFSPRGGGFGGRGGFGDRGGRGGRGGFGGGRGRGGGFRGRG RGGGGGGGGGGGGGRGGGGFHSGGNRGRGRGGKRGNQSGKNVMVEPHRHEGVFICRGK EDALVTKNLVPGESVYGEKRVSISEGDDKI
EYRAWNPFRSKLAAAILGGVDQIHIKPG AKVLYLGAASGTTVSHVSDIVGPDGLVYAVEFSHRSGRDLINLAKKR
TNIIPVIEDAR HPHKYRMLIAMVDVIFADVAQPDQTRIVALNAHTFLRNGGHFVISIKANCIDSTASAE AVFAS
EVKKMQQENMKPQEQLTLEPYERDHAVVVGVYRPPPKVKN

[1434]

[1435]

[1436] 9.GSK3B:GSK3B糖原合酶激酶3β[人]

[1437] 基因座NM_001146156(同工型2)

[1438] AA/翻译＝"MSGRPRTTSFAESCKPVQQPSAFGSMKVSRDKDGSKVTTVVATP GQGPDRPQEVSYTDTKVIGNGSFGVVYQAKLCDSGELVAIKKVLQDKRFKNRELQIMR KLDHCNIVRLRYFFYSSGEKKDEVYLNLVL
DYVPETVYRVARHYSRAKQTLPVIYVKL YMYQLFRSLAYIHSFGICHRDIKPQNLLLDPDTAVLKLCDFGSAKQL
VRGEPNVSYIC SRYYRAPELIFGATDYTSSIDVWSAGCVLAELLLGQPIFPGDSGVDQLVEIIKVLGTP TREQI
REMNPNYTEFKFPQIKAHPWTKVFRPRTPPEAIALCSRLLEYTPTARLTPLEA CAHSFFDELRDPNVKLPNGRDT
PALFNFTTQELSSNPPLATILIPPHARIQAAASTPT NATAASDANTGDRGQTNNAASASASNST

[1439]

[1440]

[1441]

[1442] 基因座NM_002093(同工型1)

[1443] AA/翻译＝"MSGRPRTTSFAESCKPVQQPSAFGSMKVSRDKDGSKVTTVVATP GQGPDRPQEVSYTDTKVIGNGSFGVVYQAKLCDSGELVAIKKVLQDKRFKNRELQIMR KLDHCNIVRLRYFFYSSGEKKDEVYLNLVL
DYVPETVYRVARHYSRAKQTLPVIYVKL YMYQLFRSLAYIHSFGICHRDIKPQNLLLDPDTAVLKLCDFGSAKQL
VRGEPNVSYIC SRYYRAPELIFGATDYTSSIDVWSAGCVLAELLLGQPIFPGDSGVDQLVEIIKVLGTP TREQI
REMNPNYTEFKFPQIKAHPWTKDSSGTGHFTSGVRVFRPRTPPEAIALCSRLL EYTPTARLTPLEACAHSFFDEL
RDPNVKLPNGRDTPALFNFTTQELSSNPPLATILIP PHARIQAAASTPTNATAASDANTGDRGQTNNAASASASN
ST

[1444]

[1445]

[1446]

[1447] 10.HDLBP:HDLBP高密度脂蛋白结合蛋白[人]

[1448] 基因座NM_001243900(同工型b)

[1449] AA/翻译＝"MHLAERDRWLFVATVMMHFVSIKSGFPGLCVGVRSTMSSVAVLT QESFAEHRSGLVPQQIKVATLNSEEESDPPTYKDAFPPLPEKAACLESAQEPAGAWGN KIRPIKASVITQVFHVPLEERKYKDMNQFG
EGEQAKICLEIMQRTGAHLELSLAKDQG LSIMVSGKLDAVMKARKDIVARLQTQASATVAIPKEHHRFVIGKNGE
KLQDLELKTAT KIQIPRPDDPSNQIKITGTKEGIEKARHEVLLISAEQDKRAVERLEVEKAFHPFIAGP YNRLV
GEIMQETGTRINIPPPSVNRTEIVFTGEKEQLAQAVARIKKIYEEKANSFTVS SVAAPSWLHRFIIGKKGQNLAK
ITQQMPKVHIEFTEGEDKITLEGPTEDVNVAQEQIE GMVKDLINRMDYVEINIDHKFHRHLIGKSGANINRIKDQ
YKVSVRIPPDSEKSNLIRI EGDPQGVQQAKRELLELASRMENERTKDLIIEQRFHRTIIGQKGERIREIRDKFPE
VI INFPDPAQKSDIVQLRGPKNEVEKCTKYMQKMVADLVENSYSISVPIFKQFHKNIIGK GGANIKKIREESNT
KIDLPAENSNSETIIITGKRANCEAARSRILSIQKDLANIAEVE VSIPAKLHNSLIGTKGRLIRSIMEECGGVHI
HFPVEGSGSDTVVIRGPSSDVEKAKKQ LLHLAEEKQTKSFTVDIRAKPEYHKFLIGKGGGKIRKVRDSTGARVIF
PAAEDKDQDL ITIIGKEDAVREAQKELEALIQNLDNVVEDSMLVDPKHHRHFVIRRGQVLREIAEEYG GVMVSF
PRSGTQSDKVTLKGAKDCVEAAKKRIQEIIEDLEAQVTLECAIPQKFHRSVM GPKGSRIQQITRDFSVQIKFPDR
EENAVHSTEPVVQENGDEAGEGREAKDCDPGSPRR CDIIIISGRKEKCEAAKEALEALVPVTIEVEVPFDLHRYV
IGQKGSGIRKMMDEFEVN IHVPAPELQSDIIAITGLAANLDRAKAGLLERVKELQAEQEDRALRSFKLSVTVDPKY
HPKIIGRKGAVITQIRLEHDVNIQFPDKDDGNQPQDQITITGYEKNTEAARDAILRIV GELEQMVSEDVPLDHRV
HARIIGARGKAIRKIMDEFKVDIRFPQSGAPDPNCVTVTGL PENVEEAIDHILNLEEEYLADVVDSEALQVYMKP
PAHEEAKAPSRGFVVRDAPWTASS SEKAPDMSSSEEFPSFGAQVAPKTLPWGPKR

[1450]

[1451]

[1452]

[1453] 基因座NM_005336(同工型a)

[1454] AA/翻译＝"MSSVAVLTQESFAEHRSGLVPQQIKVATLNSEEESDPPTYKDAF PPLPEKAACLESAQEPAGAWGNKIRPIKASVITQVFHVPLEERKYKDMNQFGEGEQAK ICLEIMQRTGAHLELSLAKDQGLSIMVSGK
LDAVMKARKDIVARLQTQASATVAIPKE HHRFVIGKNGEKLQDLELKTATKIQIPRPDDPSNQIKITGTKEGIEK
ARHEVLLISAE QDKRAVERLEVEKAFHPFIAGPYNRLVGEIMQETGTRINIPPPSVNRTEIVFTGEKEQ LAQAV
ARIKKIYEEKKKKTTTIAVEVKKSQHKYVIGPKGNSLQEILERTGVSVEIPPS DSISETVILRGEPEKLGQALTE
VYAKANSFTVSSVAAPSWLHRFIIGKKGQNLAKITQ QMPKVHIEFTEGEDKITLEGPTEDVNVAQEQIEGMVKDL
INRMDYVEINIDHKFHRHL IGKSGANINRIKDQYKVSVRIPPDSEKSNLIRIEGDPQGVQQAKRELLELASRMEN
ER TKDLIIEQRFHRTIIGQKGERIREIRDKFPEVIINFPDPAQKSDIVQLRGPKNEVEKC TKYMQKMVADLVEN
SYSISVPIFKQFHKNIIGKGGANIKKIREESNTKIDLPAENSNS ETIIITGKRANCEAARSRILSIQKDLANIAE
VEVSIPAKLHNSLIGTKGRLIRSIMEE CGGVHIHFPVEGSGSDTVVIRGPSSDVEKAKKQLLHLAEEKQTKSFTV
DIRAKPEYHK FLIGKGGGKIRKVRDSTGARVIFPAAEDKDQDLITIIGKEDAVREAQKELEALIQNLD NVVEDS
MLVDPKHHRHFVIRRGQVLREIAEEYGGVMVSFPRSGTQSDKVTLKGAKDCV EAAKKRIQEIIEDLEAQVTLECA
IPQKFHRSVMGPKGSRIQQITRDFSVQIKFPDREE NAVHSTEPVVQENGDEAGEGREAKDCDPGSPRRCDIIIIS
GRKEKCEAAKEALEALVP VTIEVEVPFDLHRYVIGQKGSGIRKMMDEFEVNIHVPAPELQSDIIAITGLAANLDRA
KAGLLERVKELQAEQEDRALRSFKLSVTVDPKYHPKIIGRKGAVITQIRLEHDVNIQF PDKDDGNQPQDQITITG
YEKNTEAARDAILRIVGELEQMVSEDVPLDHRVHARIIGAR GKAIRKIMDEFKVDIRFPQSGAPDPNCVTVTGLP
ENVEEAIDHILNLEEEYLADVVDS EALQVYMKPPAHEEAKAPSRGFVVRDAPWTASSSEKAPDMSSSEEFPSFGA
QVAPKTL PWGPKR

[1455]

[1456]

[1457]

[1458] 基因座NM_203346(同工型a,转录物变体2)

[1459] AA/翻译＝"MSSVAVLTQESFAEHRSGLVPQQIKVATLNSEEESDPPTYKDAF PPLPEKAACLESAQEPAGAWGNKIRPIKASVITQVFHVPLEERKYKDMNQFGEGEQAK ICLEIMQRTGAHLELSLAKDQGLSIMVSGK
LDAVMKARKDIVARLQTQASATVAIPKE HHRFVIGKNGEKLQDLELKTATKIQIPRPDDPSNQIKITGTKEGIEK
ARHEVLLISAE QDKRAVERLEVEKAFHPFIAGPYNRLVGEIMQETGTRINIPPPSVNRTEIVFTGEKEQ LAQAV
ARIKKIYEEKKKKTTTIAVEVKKSQHKYVIGPKGNSLQEILERTGVSVEIPPS DSISETVILRGEPEKLGQALTE
VYAKANSFTVSSVAAPSWLHRFIIGKKGQNLAKITQ QMPKVHIEFTEGEDKITLEGPTEDVNVAQEQIEGMVKDL
INRMDYVEINIDHKFHRHL IGKSGANINRIKDQYKVSVRIPPDSEKSNLIRIEGDPQGVQQAKRELLELASRMEN
ER TKDLIIEQRFHRTIIGQKGERIREIRDKFPEVIINFPDPAQKSDIVQLRGPKNEVEKC TKYMQKMVADLVEN
SYSISVPIFKQFHKNIIGKGGANIKKIREESNTKIDLPAENSNS ETIIITGKRANCEAARSRILSIQKDLANIAE
VEVSIPAKLHNSLIGTKGRLIRSIMEE CGGVHIHFPVEGSGSDTVVIRGPSSDVEKAKKQLLHLAEEKQTKSFTV
DIRAKPEYHK FLIGKGGGKIRKVRDSTGARVIFPAAEDKDQDLITIIGKEDAVREAQKELEALIQNLD NVVEDS
MLVDPKHHRHFVIRRGQVLREIAEEYGGVMVSFPRSGTQSDKVTLKGAKDCV EAAKKRIQEIIEDLEAQVTLECA
IPQKFHRSVMGPKGSRIQQITRDFSVQIKFPDREE NAVHSTEPVVQENGDEAGEGREAKDCDPGSPRRCDIIIIS
GRKEKCEAAKEALEALVP VTIEVEVPFDLHRYVIGQKGSGIRKMMDEFEVNIHVPAPELQSDIIAITGLAANLDRA
KAGLLERVKELQAEQEDRALRSFKLSVTVDPKYHPKIIGRKGAVITQIRLEHDVNIQF PDKDDGNQPQDQITITG
YEKNTEAARDAILRIVGELEQMVSEDVPLDHRVHARIIGAR GKAIRKIMDEFKVDIRFPQSGAPDPNCVTVTGLP
ENVEEAIDHILNLEEEYLADVVDS EALQVYMKPPAHEEAKAPSRGFVVRDAPWTASSSEKAPDMSSSEEFPSFGA
QVAPKTL PWGPKR

[1460]

[1461]

[1462]

[1463] 11.HIST1H2BA:HIST1H2BA组蛋白簇1,H2ba[人]

[1464] 基因座NM_170610

[1465] AA/翻译＝"MPEVSSKGATISKKGFKKAVVKTQKKEGKKRKRTRKESYSIYIY KVLKQVHPDTGISSKAMSIMNSFVTDIFERIASEASRLAHYSKRSTISSREIQTAVRL LLPGELAKHAVSEGTKAVTKYTSSK

[1466]

[1467] 12.HMGB2:HMGB2高迁移率组盒2[人]

[1468] 基因座NM_001130688(同工型2)

[1469] AA/翻译＝"MGKGDPNKPRGKMSSYAFFVQTCREEHKKKHPDSSVNFAEFSKK CSERWKTMSAKEKSKFEDMAKSDKARYDREMKNYVPPKGDKKGKKKDPNAPKRPPSAF FLFCSEHRPKIKSEHPGLSIGDTAKKLGEM
WSEQSAKDKQPYEQKAAKLKEKYEKDIA AYRAKGKSEAGKKGPGRPTGSKKKNEPEDEEEEEEEEDEDEEEEDED
EE

[1470]

[1471]

[1472] 基因座NM_001130689(同工型3)

[1473] AA/翻译＝"MGKGDPNKPRGKMSSYAFFVQTCREEHKKKHPDSSVNFAEFSKK CSERWKTMSAKEKSKFEDMAKSDKARYDREMKNYVPPKGDKKGKKKDPNAPKRPPSAF FLFCSEHRPKIKSEHPGLSIGDTAKKLGEM
WSEQSAKDKQPYEQKAAKLKEKYEKDIA AYRAKGKSEAGKKGPGRPTGSKKKNEPEDEEEEEEEEDEDEEEEDED
EE

[1474]

[1475] 基因座NM_002129(同工型1)

[1476] AA/翻译＝"MGKGDPNKPRGKMSSYAFFVQTCREEHKKKHPDSSVNFAEFSKK CSERWKTMSAKEKSKFEDMAKSDKARYDREMKNYVPPKGDKKGKKKDPNAPKRPPSAF FLFCSEHRPKIKSEHPGLSIGDTAKKLGEM
WSEQSAKDKQPYEQKAAKLKEKYEKDIA AYRAKGKSEAGKKGPGRPTGSKKKNEPEDEEEEEEEEDEDEEEEDED
EE

[1477]

[1478]

[1479] 13.HNRNPK:HNRNPK异质核核糖核蛋白K[人]

[1480] 基因座NM_002140(同工型a变体1)

[1481] AA/翻译＝"METEQPEETFPNTETNGEFGKRPAEDMEEEQAFKRSRNTDEMVE LRILLQSKNAGAVIGKGGKNIKALRTDYNASVSVPDSSGPERILSISADIETIGEILK KIIPTLEEGLQLPSPTATSQLPLESDAVEC
LNYQHYKGSDFDCELRLLIHQSLAGGII GVKGAKIKELRENTQTTIKLFQECCPHSTDRVVLIGGKPDRVVECIK
IILDLISESPI KGRAQPYDPNFYDETYDYGGFTMMFDDRRGRPVGFPMRGRGGFDRMPPGRGGRPMPPS RRDYD
DMSPRRGPPPPPPGRGGRGGSRARNLPLPPPPPPRGGDLMAYDRRGRPGDRYD GMVGFSADETWDSAIDTWSPSE
WQMAYEPQGGSGYDYSYAGGRGSYGDLGGPIITTQV TIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSE
DRIITITGTQDQIQNAQYL LQNSVKQYADVEGF

[1482]

[1483]

[1484] 基因座NM_031262(同工型3变体3)

[1485] AA/翻译＝"METEQPEETFPNTETNGEFGKRPAEDMEEEQAFKRSRNTDEMVE LRILLQSKNAGAVIGKGGKNIKALRTDYNASVSVPDSSGPERILSISADIETIGEILK KIIPTLEEGLQLPSPTATSQLPLESDAVEC
LNYQHYKGSDFDCELRLLIHQSLAGGII GVKGAKIKELRENTQTTIKLFQECCPHSTDRVVLIGGKPDRVVECIK
IILDLISESPI KGRAQPYDPNFYDETYDYGGFTMMFDDRRGRPVGFPMRGRGGFDRMPPGRGGRPMPPS RRDYD
DMSPRRGPPPPPPGRGGRGGSRARNLPLPPPPPPRGGDLMAYDRRGRPGDRYD GMVGFSADETWDSAIDTWSPSE
WQMAYEPQGGSGYDYSYAGGRGSYGDLGGPIITTQV TIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSE
DRIITITGTQDQIQNAQYL LQNSVKQYSGKFF

[1486]

[1487]

[1488] 基因座NM_031263(同工型a变体2)

[1489] AA/翻译＝"METEQPEETFPNTETNGEFGKRPAEDMEEEQAFKRSRNTDEMVE LRILLQSKNAGAVIGKGGKNIKALRTDYNASVSVPDSSGPERILSISADIETIGEILK KIIPTLEEGLQLPSPTATSQLPLESDAVEC
LNYQHYKGSDFDCELRLLIHQSLAGGII GVKGAKIKELRENTQTTIKLFQECCPHSTDRVVLIGGKPDRVVECIK
IILDLISESPI KGRAQPYDPNFYDETYDYGGFTMMFDDRRGRPVGFPMRGRGGFDRMPPGRGGRPMPPS RRDYD
DMSPRRGPPPPPPGRGGRGGSRARNLPLPPPPPPRGGDLMAYDRRGRPGDRYD GMVGFSADETWDSAIDTWSPSE
WQMAYEPQGGSGYDYSYAGGRGSYGDLGGPIITTQV TIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSE
DRIITITGTQDQIQNAQYL LQNSVKQYADVEGF

[1490]

[1491]

[1492] 14.HNRPDL:HNRPDL异质核核糖核蛋白D-样[人]

[1493] 基因座NM_001207000(同工型B)

[1494] AA/翻译＝"MEVPPRLSHVPPPLFPSAPATLASRSLSHWRPRPPRQLAPLLPS LAPSSARQGARRAQRHVTAQQPSRLAGGAAIKGGRRRRPDLFRRHFKSSSIQRSAAAA AATRTARQHPPADSSVTMEDMNEYSNIEEF
AEGSKINASKNQQDDGKMFIGGLSWDTS KKDLTEYLSRFGEVVDCTIKTDPVTGRSRGFGFVLFKDAASVDKVLE
LKEHKLDGKLI DPKRAKALKGKEPPKKVFVGGLSPDTSEEQIKEYFGAFGEIENIELPMDTKTNERRGF CFITY
TDEEPVKKLLESRYHQIGSGKCEIKVAQPKEVYRQQQQQQKGGRGAAAGGRGG
TRGRGRGQQSTYGKASRGGGNHQNNYQPY

[1495]

[1496]

[1497] 基因座NM_031372(同工型a)

[1498] AA/翻译＝"MEVPPRLSHVPPPLFPSAPATLASRSLSHWRPRPPRQLAPLLPS LAPSSARQGARRAQRHVTAQQPSRLAGGAAIKGGRRRRPDLFRRHFKSSSIQRSAAAA AATRTARQHPPADSSVTMEDMNEYSNIEEF
AEGSKINASKNQQDDGKMFIGGLSWDTS KKDLTEYLSRFGEVVDCTIKTDPVTGRSRGFGFVLFKDAASVDKVLE
LKEHKLDGKLI DPKRAKALKGKEPPKKVFVGGLSPDTSEEQIKEYFGAFGEIENIELPMDTKTNERRGF CFITY
TDEEPVKKLLESRYHQIGSGKCEIKVAQPKEVYRQQQQQQKGGRGAAAGGRGG TRGRGRGQGQNWNQGFNNYYDQ
GYGNYNSAYGGDQNYSGYGGYDYTGYNYGNYGYGQG YADYSGQQSTYGKASRGGGNHQNNYQPY

[1499]

[1500]

[1501] 15.HSPA9:HSPA9热休克70kDa蛋白9(mortalin)[人]

[1502] 基因座NM_004134

[1503] AA/翻译＝"MISASRAAAARLVGAAASRGPTAARHQDSWNGLSHEAFRLVSRR DYASEAIKGAVVGIDLGTTNSCVAVMEGKQAKVLENAEGARTTPSVVAFTADGERLVG MPAKRQAVTNPNNTFYATKRLIGRRYDDPE
VQKDIKNVPFKIVRASNGDAWVEAHGKL YSPSQIGAFVLMKMKETAENYLGHTAKNAVITVPAYFNDSQRQATKD
AGQISGLNVLR VINEPTAAALAYGLDKSEDKVIAVYDLGGGTFDISILEIQKGVFEVKSTNGDTFLGGE DFDQA
LLRHIVKEFKRETGVDLTKDNMALQRVREAAEKAKCELSSSVQTDINLPYLTM DSSGPKHLNMKLTRAQFEGIVT
DLIRRTIAPCQKAMQDAEVSKSDIGEVILVGGMTRM PKVQQTVQDLFGRAPSKAVNPDEAVAIGAAIQGGVLAGD
VTDVLLLDVTPLSLGIETL GGVFTKLINRNTTIPTKKSQVFSTAADGQTQVEIKVCQGEREMAGDNKLLGQFTLI
GI PPAPRGVPQIEVTFDIDANGIVHVSAKDKGTGREQQIVIQSSGGLSKDDIENMVKNAE KYAEEDRRKKERVE
AVNMAEGIIHDTETKMEEFKDQLPADECNKLKEEISKMRELLAR KDSETGENIRQAASSLQQASLKLFEMAYKKM
ASEREGSGSSGTGEQKEDQKEEKQ

[1504]

[1505]

[1506] 16.MAP2K2:MAP2K2有丝分裂原激活蛋白激酶激酶2[人]

[1507] 基因座NM_030662

[1508] AA/翻译＝"MLARRKPVLPALTINPTIAEGPSPTSEGASEANLVDLQKKLEEL

[1509] ELDEQQKKRLEAFLTQKAKVGELKDDDFERISELGAGNGGVVTKVQHRPSGLIMARKL IHLEIKPAIRNQIIRELQVLHECNSPYIVGFYGAFYSDGEISICMEHMDGGSLDQVLK EAKRIPEEILGKVSIAVLRGLAYLRE
KHQIMHRDVKPSNILVNSRGEIKLCDFGVSGQ LIDSMANSFVGTRSYMAPERLQGTHYSVQSDIWSMGLSLVELA
VGRYPIPPPDAKELE AIFGRPVVDGEEGEPHSISPRPRPPGRPVSGHGMDSRPAMAIFELLDYIVNEPPPKLP N
GVFTPDFQEFVNKCLIKNPAERADLKMLTNHTFIKRSEVEEVDFAGWLCKTLRLNQP GTPTRTAV

[1510]

[1511]

[1512] 17.LDHA:LDHA乳酸脱氢酶A[人]

[1513] 基因座NM_001135239(同工型2)

[1514] AA/翻译＝"MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVL
GEHGDSSVPVWSGMNVAGVSLKTLHPDL GTDKDKEQWKEVHKQVVESAYEVIKLKGYTSWAIGLSVADLAESIMK
NLRRVHPVSTM IKGLYGIKDDVFLSVPCILGQNGISDLVKVTLTSEEEARLKKSADTLWGIQKELQF

[1515]

[1516]

[1517] 基因座NM_001165414(同工型3)

[1518] AA/翻译＝"MGEPSGGYTYTQTSIFLFHAKIPFGSKSNMATLKDQLIYNLLKE EQTPQNKITVVGVGAVGMACAISILMKDLADELALVDVIEDKLKGEMMDLQHGSLFLR TPKIVSGKDYNVTANSKLVIITAGARQQEG
ESRLNLVQRNVNIFKFIIPNVVKYSPNC KLLIVSNPVDILTYVAWKISGFPKNRVIGSGCNLDSARFRYLMGERL
GVHPLSCHGWV LGEHGDSSVPVWSGMNVAGVSLKTLHPDLGTDKDKEQWKEVHKQVVESAYEVIKLKGY TSWAI
GLSVADLAESIMKNLRRVHPVSTMIKGLYGIKDDVFLSVPCILGQNGISDLVK
VTLTSEEEARLKKSADTLWGIQKELQF

[1519]

[1520] 基因座NM_001165415(同工型4)

[1521] AA/翻译＝"MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQQE GESRLNLVQRNVNIFKFIIPNVVKYSPNCK
LLIVSNPVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVA
GVSLKTLHPDL GTDKDKEQWKECRYTLGDPKGAAILKSSDVISFHCLGYNRILGGGCACCPFYLICD

[1522]

[1523] 基因座NM_001165416(同工型5)

[1524] AA/翻译＝"MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQQE GESRLNLVQRNVNIFKFIIPNVVKYSPNCK
LLIVSNPVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVA
GVSLKTLHPDL GTDKDKEQWKEVHKQVVERVFTE

[1525]

[1526]

[1527] 基因座NM_005566(同工型1)

[1528] AA/翻译＝"MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQQE GESRLNLVQRNVNIFKFIIPNVVKYSPNCK
LLIVSNPVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVA
GVSLKTLHPDL GTDKDKEQWKEVHKQVVESAYEVIKLKGYTSWAIGLSVADLAESIMKNLRRVHPVSTM IKGLY
GIKDDVFLSVPCILGQNGISDLVKVTLTSEEEARLKKSADTLWGIQKELQF

[1529]

[1530] 18.MAP4:MAP4微管相关蛋白4[人]

[1531] 基因座NM_001134364(同工型4)

[1532] AA/翻译＝"MADLSLADALTEPSPDIEGEIKRDFIATLEAEAFDDVVGETVGK TDYIPLLDVDEKTGNSESKKKPCSETSQIEDTPSSKPTLLANGGHGVEGSDTTGSPTE FLEEKMAYQEYPNSQNWPEDTNFCFQPEQV
VDPIQTDPFKMYHDDDLADLVFPSSATA DTSIFAGQNDPLKDSYGMSPCNTAVVPQGWSVEALNSPHSESFVSPE
AVAEPPQPTAV PLELAKEIEMASEERPPAQALEIMMGLKTTDMAPSKETEMALAKDMALATKTEVALAK DMESP
TKLDVTLAKDMQPSMESDMALVKDMELPTEKEVALVKDVRWPTETDVSSAKNV VLPTETEVAPAKDVTLLKETER
ASPIKMDLAPSKDMGPPKENKKETERASPIKMDLAP SKDMGPPKENKIVPAKDLVLLSEIEVAQANDIISSTEIS
SAEKVALSSETEVALARDM TLPPETNVILTKDKALPLEAEVAPVKDMAQLPETEIAPAKDVAPSTVKEVGLLKDM
SP LSETEMALGKDVTPPPETEVVLIKNVCLPPEMEVALTEDQVPALKTEAPLAKDGVLTL ANNVTPAKDVPPLS
ETEATPVPIKDMEIAQTQKGISEDSHLESLQDVGQSAAPTFMIS PETVTGTGKKCSLPAEEDSVLEKLGERKPCN
SQPSELSSETSGIARPEEGRPVVSGTG NDITTPPNKELPPSPEKKTKPLATTQPAKTSTSKAKTQPTSLPKQPAP
TTIGGLNKKP MSLASGLVPAAPPKRPAVASARPSILPSKDVKPKPIADAKAPEKRASPSKPASAPASR SGSKST
QTVAKTTTAAAVASTGPSSRSPSTLLPKKPTAIKTEGKPAEVKKMTAKSVPA DLSRPKSTSTSSMKKTTTLSGTA
PAAGVVPSRVKATPMPSRPSTTPFIDKKPTSAKPS STTPRLSRLATNTSAPDLKNVRSKVGSTENIKHQPGGGRA
KVEKKTEAAATTRKPESN AVTKTAGPIASAQKQPAGKVQIVSKKVSYSHIQSKCGSKDNIKHVPGGGNVQIQNKKV
DISKVSSKCGSKANIKHKPGGGDVKIESQKLNFKEKAQAKVGSLDNVGHLPAGGAVKI ETYRLTFRANARARTDH
GADIVSRPPHFPGGPNSGSRVLGPLSRAVH

[1533]

[1534]

[1535] 基因座NM_002375(同工型1)

[1536] AA/翻译＝"MADLSLADALTEPSPDIEGEIKRDFIATLEAEAFDDVVGETVGK TDYIPLLDVDEKTGNSESKKKPCSETSQIEDTPSSKPTLLANGGHGVEGSDTTGSPTE FLEEKMAYQEYPNSQNWPEDTNFCFQPEQV
VDPIQTDPFKMYHDDDLADLVFPSSATA DTSIFAGQNDPLKDSYGMSPCNTAVVPQGWSVEALNSPHSESFVSPE
AVAEPPQPTAV PLELAKEIEMASEERPPAQALEIMMGLKTTDMAPSKETEMALAKDMALATKTEVALAK DMESP
TKLDVTLAKDMQPSMESDMALVKDMELPTEKEVALVKDVRWPTETDVSSAKNV VLPTETEVAPAKDVTLLKETER
ASPIKMDLAPSKDMGPPKENKKETERASPIKMDLAP SKDMGPPKENKIVPAKDLVLLSEIEVAQANDIISSTEIS
SAEKVALSSETEVALARDM TLPPETNVILTKDKALPLEAEVAPVKDMAQLPETEIAPAKDVAPSTVKEVGLLKDM
SP LSETEMALGKDVTPPPETEVVLIKNVCLPPEMEVALTEDQVPALKTEAPLAKDGVLTL ANNVTPAKDVPPLS
ETEATPVPIKDMEIAQTQKGISEDSHLESLQDVGQSAAPTFMIS PETVTGTGKKCSLPAEEDSVLEKLGERKPCN
SQPSELSSETSGIARPEEGRPVVSGTG NDITTPPNKELPPSPEKKTKPLATTQPAKTSTSKAKTQPTSLPKQPAP
TTIGGLNKKP MSLASGLVPAAPPKRPAVASARPSILPSKDVKPKPIADAKAPEKRASPSKPASAPASR SGSKST
QTVAKTTTAAAVASTGPSSRSPSTLLPKKPTAIKTEGKPAEVKKMTAKSVPA DLSRPKSTSTSSMKKTTTLSGTA
PAAGVVPSRVKATPMPSRPSTTPFIDKKPTSAKPS STTPRLSRLATNTSAPDLKNVRSKVGSTENIKHQPGGGRA
KVEKKTEAAATTRKPESN AVTKTAGPIASAQKQPAGKVQIVSKKVSYSHIQSKCGSKDNIKHVPGGGNVQIQNKKV
DISKVSSKCGSKANIKHKPGGGDVKIESQKLNFKEKAQAKVGSLDNVGHLPAGGAVKT EGGGSEAPLCPGPPAGE
EPAISEAAPEAGAPTSASGLNGHPTLSGGGDQREAQTLDSQ IQETSI

[1537]

[1538]

[1539] 基因座NM_030885(同工型3)

[1540] AA/翻译＝"MADLSLADALTEPSPDIEGEIKRDFIATLEAEAFDDVVGETVGK TDYIPLLDVDEKTGNSESKKKPCSETSQIEDTPSSKPTLLANGGHGVEGSDTTEA

[1541]

[1542]

[1543] 19.MAPK1:MAPK1有丝分裂原激活蛋白激酶1[人]

[1544] 基因座NM_002745(同工型1)

[1545] AA/翻译＝"MAAAAAAGAGPEMVRGQVFDVGPRYTNLSYIGEGAYGMVCSAYD NVNKVRVAIKKISPFEHQTYCQRTLREIKILLRFRHENIIGINDIIRAPTIEQMKDVY IVQDLMETDLYKLLKTQHLSNDHICYFLYQ
ILRGLKYIHSANVLHRDLKPSNLLLNTT CDLKICDFGLARVADPDHDHTGFLTEYVATRWYRAPEIMLNSKGYTK
SIDIWSVGCIL AEMLSNRPIFPGKHYLDQLNHILGILGSPSQEDLNCIINLKARNYLLSLPHKNKVPWN RLFPN
ADSKALDLLDKMLTFNPHKRIEVEQALAHPYLEQYYDPSDEPIAEAPFKFDME
LDDLPKEKLKELIFEETARFQPGYRS

[1546]

[1547]

[1548]

[1549] 基因座NM_138957(同工型2)

[1550] AA/翻译＝"MAAAAAAGAGPEMVRGQVFDVGPRYTNLSYIGEGAYGMVCSAYD NVNKVRVAIKKISPFEHQTYCQRTLREIKILLRFRHENIIGINDIIRAPTIEQMKDVY IVQDLMETDLYKLLKTQHLSNDHICYFLYQ
ILRGLKYIHSANVLHRDLKPSNLLLNTT CDLKICDFGLARVADPDHDHTGFLTEYVATRWYRAPEIMLNSKGYTK
SIDIWSVGCIL AEMLSNRPIFPGKHYLDQLNHILGILGSPSQEDLNCIINLKARNYLLSLPHKNKVPWN RLFPN
ADSKALDLLDKMLTFNPHKRIEVEQALAHPYLEQYYDPSDEPIAEAPFKFDME
LDDLPKEKLKELIFEETARFQPGYRS

[1551]

[1552]

[1553] 20.MARCKS:MARCKS豆蔻酰化富丙氨酸蛋白激酶C底物[人]

[1554] 基因座NM_002356

[1555] AA/翻译＝"MGAQFSKTAAKGEAAAERPGEAAVASSPSKANGQENGHVKVNGD ASPAAAESGAKEELQANGSAPAADKEEPAAAGSGAASPSAAEKGEPAAAAAPEAGASP VEKEAPAEGEAAEPGSPTAAEGEAASAASS
TSSPKAEDGATPSPSNETPKKKKKRFSF KKSFKLSGFSFKKNKKEAGEGGEAEAPAAEGGKDEAAGGAAAAAAEA
GAASGEQAAAP GEEAAAGEEGAAGGDPQEAKPQEAAVAPEKPPASDETKAAEEPSKVEEKKAEEAGASA AACEA
PSAAGPGAPPEQEAAPAEEPAAAAASSACAAPSQEAQPECSPEAPPAEAAE

[1556]

[1557]

[1558] 21.NME1:NME1 NME/NM23核苷二磷酸激酶1[人]

[1559] 基因座NM_000269(同工型b)

[1560] AA/翻译＝"MANCERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVGLKFMQAS EDLLKEHYVDLKDRPFFAGLVKYMHSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVESAEKEIGL
WFHPEELVDYTSCAQNWIYE

[1561]

[1562] 基因座NM_198175(同工型1)

[1563] AA/翻译＝"MVLLSTLGIVFQGEGPPISSCDTGTMANCERTFIAIKPDGVQRG LVGEIIKRFEQKGFRLVGLKFMQASEDLLKEHYVDLKDRPFFAGLVKYMHSGPVVAMV WEGLNVVKTGRVMLGETNPADSKPGTIRGD
FCIQVGRNIIHGSDSVESAEKEIGLWFH PEELVDYTSCAQNWIYE

[1564]

[1565]

[1566] 22.NME2:NME2 NME/NM23核苷二磷酸激酶2[人]

[1567] 基因座NM_001018137(同工型a变体2)

[1568] AA/翻译＝"MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISL
WFKPEELVDYKSCAHDWVYE

[1569]

[1570] 基因座NM_001018138(同工型a变体3)

[1571] AA/翻译＝"MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISL
WFKPEELVDYKSCAHDWVYE

[1572]

[1573] 基因座NM_001018139(同工型a变体4)

[1574] AA/翻译＝"MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISL
WFKPEELVDYKSCAHDWVYE

[1575]

[1576]

[1577] 基因座NM_001198682(同工型b变体5)

[1578] AA/翻译＝"MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMEHHSWQ

[1579]

[1580] 基因座NM_002512(同工型a变体1)

[1581] AA/翻译＝"MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISL
WFKPEELVDYKSCAHDWVYE

[1582]

[1583] 23.PGK1:PGK1磷酸甘油酸激酶1[人]

[1584] 基因座NM_000291

[1585] AA/翻译＝"MSLSNKLTLDKLDVKGKRVVMRVDFNVPMKNNQITNNQRIKAAV PSIKFCLDNGAKSVVLMSHLGRPDGVPMPDKYSLEPVAVELKSLLGKDVLFLKDCVGP EVEKACANPAAGSVILLENLRFHVEEEGKG
KDASGNKVKAEPAKIEAFRASLSKLGDV YVNDAFGTAHRAHSSMVGVNLPQKAGGFLMKKELNYFAKALESPERP
FLAILGGAKVA DKIQLINNMLDKVNEMIIGGGMAFTFLKVLNNMEIGTSLFDEEGAKIVKDLMSKAEKN GVKIT
LPVDFVTADKFDENAKTGQATVASGIPAGWMGLDCGPESSKKYAEAVTRAKQI VWNGPVGVFEWEAFARGTKALM
DEVVKATSRGCITIIGGGDTATCCAKWNTEDKVSHV STGGGASLELLEGKVLPGVDALSNI

[1586]

[1587]

[1588] 24.PGK2:PGK2磷酸甘油酸激酶2[人]

[1589] 基因座NM_138733

[1590] AA/翻译＝"MSLSKKLTLDKLDVRGKRVIMRVDFNVPMKKNQITNNQRIKASI PSIKYCLDNGAKAVVLMSHLGRPDGVPMPDKYSLAPVAVELKSLLGKDVLFLKDCVGA EVEKACANPAPGSVILLENLRFHVEEEGKG
QDPSGKKIKAEPDKIEAFRASLSKLGDV YVNDAFGTAHRAHSSMVGVNLPHKASGFLMKKELDYFAKALENPVRP
FLAILGGAKVA DKIQLIKNMLDKVNEMIIGGGMAYTFLKVLNNMEIGASLFDEEGAKIVKDIMAKAQKN GVRIT
FPVDFVTGDKFDENAQVGKATVASGISPGWMGLDCGPESNKNHAQVVAQARLI VWNGPLGVFEWDAFAKGTKALM
DEIVKATSKGCITVIGGGDTATCCAKWNTEDKVSHV STGGGASLELLEGKILPGVEALSNM

[1591]

[1592]

[1593] 25.RAB7A:RAB7A RAB7A,成员RAS致癌基因家族[人]

[1594] 基因座NM_004637

[1595] AA/翻译＝"MTSRKKVLLKVIILGDSGVGKTSLMNQYVNKKFSNQYKATIGAD FLTKEVMVDDRLVTMQIWDTAGQERFQSLGVAFYRGADCCVLVFDVTAPNTFKTLDSW RDEFLIQASPRDPENFPFVVLGNKIDLENR
QVATKRAQAWCYSKNNIPYFETSAKEAI NVEQAFQTIARNALKQETEVELYNEFPEPIKLDKNDRAKASAESCSC

[1596]

[1597] 26.RPL17:RPL17核糖体蛋白L17[人]

[1598] 基因座NM_000985(同工型A变体1)

[1599] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1600]

[1601] 基因座NM_001035006(同工型a变体2)

[1602] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1603]

[1604] 基因座NM_001199340(同工型a变体3)

[1605] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1606]

[1607] 基因座NM_001199341(同工型a变体4)

[1608] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1609]

[1610] 基因座NM_001199342(同工型A变体5)

[1611] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1612]

[1613] 基因座NM_001199343(同工型a变体6)

[1614] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1615]

[1616]

[1617] 基因座NM_001199344(同工型a变体7)

[1618] AA/翻译＝"MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRA
HGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE

[1619]

[1620] 基因座NM_001199345(同工型b变体8)

[1621] AA/翻译＝"MHIRKATKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGR WPKKSAEFLLHMLKNAESNAELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYM SSPCHIEMILTEKEQIVPKPEEEVAQKKKI
SQKKLKKQKLMARE

[1622]

[1623] 27.RPL28:RPL28核糖体蛋白L28[人]

[1624] 基因座NM_000991(同工型2)

[1625] AA/翻译＝"MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGQRKPATSYVRTTINKNARATLSSIRHMIRKNKY RPDLRMAAIRRASAILRSQKPVMVKRKRTR
PTKSS

[1626]

[1627]

[1628] 基因座NM_001136134(同工型1)

[1629] AA/翻译＝"MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGQRKPATSYVRTTINKNARATLSSIRHMIRKNKY RPDLRMVSWGLGIRLGETGQCCGEGPPTTG
CNMGWRGMDSCFQPTPHTQHWPRGRLVE CMG

[1630]

[1631]

[1632] 基因座NM_001136135(同工型3)

[1633] AA/翻译＝"MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGQRKPATSYVRTTINKNARATLSSIRHMIRKNKY RPDLRMDMLASTGSGLCCSVAVQPWASSST
SLCLRTLICNMRVDRPYYSGLMRRLNVQ NLLDCAHKS

[1634]

[1635] 基因座NM_001136136(同工型4)

[1636] AA/翻译＝"MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGEFCLVWARERPLSRVWEL

[1637]

[1638] 基因座NM_001136137(同工型5)

[1639] AA/翻译＝"MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSE

[1640]

[1641]

[1642] 28.RPS5:RPS5核糖体蛋白S5[人]

[1643] 基因座NM_001009

[1644] AA/翻译＝"MTEWETAAPAVAETPDIKLFGKWSTDDVQINDISLQDYIAVKEK YAKYLPHSAGRYAAKRFRKAQCPIVERLTNSMMMHGRNNGKKLMTVRIVKHAFEIIHL LTGENPLQVLVNAIINSGPREDSTRIGRAG
TVRRQAVDVSPLRRVNQAIWLLCTGARE AAFRNIKTIAECLADELINAAKGSSNSYAIKKKDELERVAKSNR

[1645]

[1646] 29.RPS6:RPS6核糖体蛋白S6[人]

[1647] 基因座NM_001010

[1648] AA/翻译＝"MKLNISFPATGCQKLIEVDDERKLRTFYEKRMATEVAADALGEE WKGYVVRISGGNDKQGFPMKQGVLTHGRVRLLLSKGHSCYRPRRTGERKRKSVRGCIV DANLSVLNLVIVKKGEKDIPGLTDTTVPRR
LGPKRASRIRKLFNLSKEDDVRQYVVRK PLNKEGKKPRTKAPKIQRLVTPRVLQHKRRRIALKKQRTKKNKEEAA
EYAKLLAKRMK EAKEKRQEQIAKRRRLSSLRASTSKSESSQK

[1649]

[1650] 30.SLTM:SLTM SAFB-样,转录调节子[人]

[1651] 基因座NM_001013843(同工型b)

[1652] AA/翻译＝"MAAATGAVAASAASGQAEGKKITDLRVIDLKSELKRRNLDITGV KTVLISRLKQAIEEEGGDPDNIELTVSTDTPNKKPTKGKGKKHEADELSGDASVEDDA FIKDCELENQEAHEQDGNDELKDSEEFGEN
EEENVHSKELLSAEENKRAHELIEAEGI EDIEKEDIESQEIEAQEGEDDTFLTAQDGEEEENEKEGSLAEADHTA
HEEMEAHTTVK EAEDDNISVTIQAEDAITLDFDGDDLLETGKNVKITDSEASKPKDGQDAIAQSPEKES KDYEM
NANHKDGKKEDCVKGDPVEKEARESSKKAESGDKEKDTLKKGPSSTGASGQAK SSSKESKDSKTSSKDDKGSTSS
TSGSSGSSTKNIWVSGLSSNTKAADLKNLFGKYGKV LSAKVVTNARSPGAKCYGIVTMSSSTEVSRCIAHLHRTE
LHGQLISVEKVKGDPSKKE MKKENDEKSSSRSSGDKKNTSDRSSKTQASVKKEEKRSSEKSEKKESKDTKKIEGK
DE KNDNGASGQTSESIKKSEEKKRISSKSPGHMVILDQTKGDHCRPSRRGRYEKIHGRSK EKERASLDKKRDKD
YRRKEILPFEKMKEQRLREHLVRFERLRRAMELRRRREIAERER RERERIRIIREREERERLQRERERLEIERQK
LERERMERERLERERIRIEQERRKEAE RIAREREELRRQQQQLRYEQEKRNSLKRPRDVDHRRDDPYWSENKKLS
LDTDARFGHG SDYSRQQNRFNDFDHRERGRFPESSAVQSSSFERRDRFVGQSEGKKARPTARREDPSF ERYPKN
FSDSRRNEPPPPRNELRESDRREVRGERDERRTVIIHDRPDITHPRHPREAG PNPSRPTSWKSEGSMSTDKRETR
VERPERSGREVSGHSVRGAPPGNRSSASGYGSREG DRGVITDRGGGSQHYPEERHVVERHGRDTSGPRKEWHGPP
SQGPSYHDTRRMGDGRAG AGMITQHSSNASPINRIVQISGNSMPRGSGSGFKPFKGGPPRRF

[1653]

[1654]

[1655] 基因座NM_024755(同工型a)

[1656] AA/翻译＝"MAAATGAVAASAASGQAEGKKITDLRVIDLKSELKRRNLDITGV KTVLISRLKQAIEEEGGDPDNIELTVSTDTPNKKPTKGKGKKHEADELSGDASVEDDA FIKDCELENQEAHEQDGNDELKDSEEFGEN
EEENVHSKELLSAEENKRAHELIEAEGI EDIEKEDIESQEIEAQEGEDDTFLTAQDGEEEENEKDIAGSGDGTQE
VSKPLPSEGSL AEADHTAHEEMEAHTTVKEAEDDNISVTIQAEDAITLDFDGDDLLETGKNVKITDSEA SKPKD
GQDAIAQSPEKESKDYEMNANHKDGKKEDCVKGDPVEKEARESSKKAESGDKE KDTLKKGPSSTGASGQAKSSSK
ESKDSKTSSKDDKGSTSSTSGSSGSSTKNIWVSGLS SNTKAADLKNLFGKYGKVLSAKVVTNARSPGAKCYGIVT
MSSSTEVSRCIAHLHRTEL HGQLISVEKVKGDPSKKEMKKENDEKSSSRSSGDKKNTSDRSSKTQASVKKEEKRS
SE KSEKKESKDTKKIEGKDEKNDNGASGQTSESIKKSEEKKRISSKSPGHMVILDQTKGD HCRPSRRGRYEKIH
GRSKEKERASLDKKRDKDYRRKEILPFEKMKEQRLREHLVRFER LRRAMELRRRREIAERERRERERIRIIRERE
ERERLQRERERLEIERQKLERERMERE RLERERIRIEQERRKEAERIAREREELRRQQQQLRYEQEKRNSLKRPR
DVDHRRDDPY WSENKKLSLDTDARFGHGSDYSRQQNRFNDFDHRERGRFPESSAVQSSSFERRDRFVG QSEGKK
ARPTARREDPSFERYPKNFSDSRRNEPPPPRNELRESDRREVRGERDERRTV IIHDRPDITHPRHPREAGPNPSR
PTSWKSEGSMSTDKRETRVERPERSGREVSGHSVR GAPPGNRSSASGYGSREGDRGVITDRGGGSQHYPEERHVV
ERHGRDTSGPRKEWHGPP SQGPSYHDTRRMGDGRAGAGMITQHSSNASPINRIVQISGNSMPRGSGSGFKPFKGGP
PRRF

[1657]

[1658]

[1659] 31.TMED4:TMED4跨膜emp24蛋白含转运结构域4[人]

[1660] 基因座NM_182547

[1661] AA/翻译＝"MAGVGAGPLRAMGRQALLLLALCATGAQGLYFHIGETEKRCFIE EIPDETMVIGNYRTQMWDKQKEVFLPSTPGLGMHVEVKDPDGKVVLSRQYGSEGRFTF TSHTPGDHQICLHSNSTRMALFAGGKLRVH
LDIQVGEHANNYPEIAAKDKLTELQLRA RQLLDQVEQIQKEQDYQRYREERFRLTSESTNQRVLWWSIAQTVILI
LTGIWQMRHLK SFFEAKKLV

[1662]

[1663]

[1664] 32.TNRCBA:ADRBK1肾上腺素能,β,受体激酶1[人]

[1665] 基因座NM_001619

[1666] AA/翻译＝"MADLEAVLADVSYLMAMEKSKATPAARASKKILLPEPSIRSVMQ KYLEDRGEVTFEKIFSQKLGYLLFRDFCLNHLEEARPLVEFYEEIKKYEKLETEEERV ARSREIFDSYIMKELLACSHPFSKSATEHV
QGHLGKKQVPPDLFQPYIEEICQNLRGD VFQKFIESDKFTRFCQWKNVELNIHLTMNDFSVHRIIGRGGFGEVYG
CRKADTGKMYA MKCLDKKRIKMKQGETLALNERIMLSLVSTGDCPFIVCMSYAFHTPDKLSFILDLMNG GDLHY
HLSQHGVFSEADMRFYAAEIILGLEHMHNRFVVYRDLKPANILLDEHGHVRIS DLGLACDFSKKKPHASVGTHGY
MAPEVLQKGVAYDSSADWFSLGCMLFKLLRGHSPFR QHKTKDKHEIDRMTLTMAVELPDSFSPELRSLLEGLLQR
DVNRRLGCLGRGAQEVKES PFFRSLDWQMVFLQKYPPPLIPPRGEVNAADAFDIGSFDEEDTKGIKLLDSDQELY
RN FPLTISERWQQEVAETVFDTINAETDRLEARKKAKNKQLGHEEDYALGKDCIMHGYMS KMGNPFLTQWQRRY
FYLFPNRLEWRGEGEAPQSLLTMEEIQSVEETQIKERKCLLLKI RGGKQFILQCDSDPELVQWKKELRDAYREAQ
QLVQRVPKMKNKPRSPVVELSKVPLVQ RGSANGL

[1667]

[1668]

[1669] 33.TUBB:TUBB微管蛋白,βI类[人]

[1670] 基因座NM_178014

[1671] AA/翻译＝"MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGTYHGDSDLQL DRISVYYNEATGGKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWA KGHYTEGAELVDSVLDVVRKEAESCDCLQG
FQLTHSLGGGTGSGMGTLLISKIREEYP DRIMNTFSVVPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEAL
YDICFRTLKLT TPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSR GSQQY
RALTVPELTQQVFDAKNMMAACDPRHGRYLTVAAVFRGRMSMKEVDEQMLNVQ NKNSSYFVEWIPNNVKTAVCDI
PPRGLKMAVTFIGNSTAIQELFKRISEQFTAMFRRK AFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATAE
EEEDFGEEAEEEA

[1672]

[1673]

[1674] 34.UBE21:UBE2I遍在蛋白偶联酶E2I[人]

[1675] 基因座NM_003345(变体1)

[1676] AA/翻译＝"MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAE
AYTIYCQNRVEYEKRVRAQAKKFAPS

[1677]

[1678] 基因座NM_194259(变体2)

[1679] AA/翻译＝"MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAE
AYTIYCQNRVEYEKRVRAQAKKFAPS

[1680]

[1681] 基因座NM_194260(变体3)

[1682] AA/翻译＝"MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAE
AYTIYCQNRVEYEKRVRAQAKKFAPS

[1683]

[1684]

[1685] 基因座NM_194261(变体4)

[1686] AA/翻译＝"MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAE
AYTIYCQNRVEYEKRVRAQAKKFAPS

[1687]

[1688]

标题	发布/更新时间	阅读量
阻断肺癌细胞增殖的中药组合物	2020-05-12	639
皮肤角质干细胞增殖用组合物	2020-05-13	692
嗅鞘细胞增殖试剂的连续给药方案	2020-05-13	797
干细胞增殖因子	2020-05-11	398
检测体外细胞增殖用载体及体外细胞增殖动态检测方法	2020-05-12	77
平滑肌细胞增殖的调节	2020-05-12	294
细胞增殖因子Fwap10576	2020-05-11	249
肌细胞增殖抑制因子Fwa267	2020-05-12	1001
抑制EGFR导致的癌症中细胞增殖的方法	2020-05-13	116
细胞增殖用组合物	2020-05-12	303

基于细胞的探询式分析及其应用

基于细胞的探询式分析及其应用

该功能需要专业版企业版VIP权限，您可以：