首页 / 专利库 / 医疗服务 / 医疗干预 / 一种用于肿瘤个体化基因检测智能解读的系统

一种用于肿瘤个体化基因检测智能解读的系统

阅读:89发布:2020-11-20

专利汇可以提供一种用于肿瘤个体化基因检测智能解读的系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种用于 肿瘤 个体化基因检测智能解读的系统,其包括实验平台、 知识库 平台、 云 计算平台和终端登陆平台;所述实验平台将收集到的 生物 样本上机测序后,将测序数据传输至所述云计算平台,同时用户在所述终端登录平台将样本信息及分析需求录入后将信息传输至所述云计算平台;所述知识 数据库 平台用于收集解读知识数据;所述云计算平台对样本测序数据进行生物信息分析并调用所述知识库平台内的数据解读后,将生成的解读报告传输至所述终端登陆平台,由所述终端登录平台下载报告和进行反馈。本发明能针对大规模测序结果的肿瘤个体化解读,能更好的为患者提供更近准的 治疗 信息,节约治疗的成本。,下面是一种用于肿瘤个体化基因检测智能解读的系统专利的具体信息内容。

1.一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:该系统包括实验平台、知识库平台、计算平台和终端登陆平台;所述实验平台将收集到的生物样本上机测序后,将测序数据传输至所述云计算平台,同时用户在所述终端登录平台将样本信息及分析需求录入后将信息传输至所述云计算平台;所述知识数据库平台用于收集解读知识数据;所述云计算平台对样本测序数据进行生物信息分析并调用所述知识库平台内的数据解读后,将生成的解读报告传输至所述终端登陆平台,由所述终端登录平台下载报告和进行反馈。
2.如权利要求1所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述实验平台包括样本收集模、样本实验处理模块、上机测序模块和测序数据质量制模块;
所述样本收集模块包括对不同样本的收集;
所述样本实验处理模块对收集到的样本进行样本提取、捕获和文库构建;样品送至检测实验室后开始提取,文库构建需要将生物样本中提取的游离核酸/RNA经过末端修复和加“A”后进行带有分子标签的接头连接,连接产物进行PCR扩增,扩增产物与探针进行杂交捕获反应,捕获产物经过PCR扩增后环化,然后进行质量评估;
所述上机测序模块用于对实验处理后的样本进行测序,并将测序得到下机数据传输至所述测序数据质量控制模;
所述测序数据质量控制模块对下机数据进行评估,符评估标准的下机数据传输至所述云计算平台。
3.如权利要求1所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述知识库平台包括需求分析对象确定模块、数据管理系统构建模块、数据收集下载模块、数据抽提及整理模块、数据录入模块、证据分级模块、证据审核机制模块、数据库安全管理模块和数据库维护机制模块;
所述需求分析对象确定模块用于确定需求分析对象;
所述数据管理系统构建模块是依据需求分析结果设置一个独立于具体数据库管理系统的关系实体,并完成数据库框架的搭建;
所述数据收集下载模块是根据数据来源从各种公共来源数据进行下载收集数据,并将收集到的数据分别传输至所述数据抽提及整理模块和数据管理系统构建模块,由所述数据管理系统构建模块进行存储和管理;
所述数据抽提及整理模块是将收集下载的数据按可识别模式抽提信息,并将抽提的信息根据定义的属性以及每个字段的有效规则整理成规范模式;整理每个实体集的数据表;
所述数据录入模块是将收集整理的记录通过脚本程序自动录入数据库构建模块;
所述证据分级模块是将已录入的数据按证据来源的重要性以及证据支持数目分为不同的等级,每个记录都会有一个与之匹配的等级属性;
所述证据审核机制模块是依据录入的信息的每个记录都有且只有一个ID,靠脚本和人工同时实现信息的审核;对于提取的位点变异信息,将通过脚本变异基因对应的基因组,转录本,核酸变异位置基酸变异位置以及染色体位置全部转换成对应的数据校正,如有不一致的对应位点将会移除;对于描述类的信息,通过标准化模式识别处理后再经过人工核实;
所述数据库安全管理模块包括配置管理模块、账户管理模块、操作系统的安全管理模块、运行监控模块、数据备份管理模块和日志管理模块;
所述数据库维护机制模块中数据库的内容采用定期更新及审核机制,定期收集相关来源的最新数据,采用自动化流程并结合人工检查的方式定期更新数据。
4.如权利要求3所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述数据收集下载模块下载收集数据信息为:
1)从NCCN,ESMO以及ASCO网站治疗指南中提取肿瘤基因变异相关治疗信息;
2)从FDA药给物标签中提取肿瘤基因变异相关治疗信息;
3)从COSMIC数据库下载肿瘤患者变异信息,筛选出高频突变基因;
4)从KEGG生物通路数据库以及文献查询查找肿瘤通路相关基因;
5)从PGKB,My cancer genome,PharmGKB数据库下载基因药物治疗,代谢,毒性以及其他适应症相关信息;
6)从NCBI gene,GenBank、EMBL、Gene Ontology,Drug bank,HGMD基因组相关数据库下载数据基因、药物数据,提取基因,药物相关信息;
7)对NCBI Pubmed文献进行筛选,选出基因变异与药物相关文献,并提取基因变异与干预治疗相关信息。
5.如权利要求3所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述数据录入模块中,在数据录入中会对每个录入的字段进行标准化识别及审核,对于不符合录入条件的数据会系统报错并输出到报错文件夹。
6.如权利要求3所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述证据分级模块中证据等级的划分参考目前主流数据库以及临床实验分级标准设计,分为A,B,C,D四类:A类为被医学会认可的指南或某些重大卫生系统的认可的信息,包括NCCN指南推荐检测的基因,FDA批准药物的靶向基因,即伴随诊断基因;B类为多项或一项人的研究中,临床三期以上,且统计检验结果显著的研究;C类为少1项临床二期以上三期以下研究中显著或是多个二期以上研究中具有相关性但不显著,同时也包括达不到统计学要求的少量患者的实验研究、Case report、动物实验或细胞实验研究;D类为目前无治疗相关研究报道的肿瘤基因,包括抑癌/致癌基因,驱动基因,险基因,高频突变基因,肿瘤通路相关基因或肿瘤家族基因。
7.如权利要求3或6所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述证据分级模块中基因变异信息按精准医疗解析指南分为I-V类:Ⅰ类为食品药监局批准的用于该癌种的药物治疗靶点;写入该癌种权威诊疗指南中有明确诊断/治疗/疾病监测意义的变异;Ⅱ类为尚未进入诊疗指南,但已经写入该领域的专家共识的变异位点;Ⅲ类为食品药监局批准用于其他肿瘤能预测疗效的基因变异;或写入其它癌种权威诊疗指南中有明确诊断/治疗/疾病监测的变异;Ⅳ类为非权威研究、或正在进行中的临床试验、或临床前研究中的相关变异位点;Ⅴ类为临床相关性未明或之前在肿瘤中未有报道的相关变异。
8.如权利要求3所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述数据库安全管理模块中配置管理模块负责系统维护的管理;所述账户管理模块对数据库的账户及其口令进行变更,同时也包括建立、删除、修改数据库账户权限的管理;
所述操作系统的安全管理模块是将数据库中的数据必须经由DBMS才能进行访问,通过DBMS提供的安全措施检查启用的身份是否合法;每个有使用权限的用户在系统中有一个标识的身份名称和密码,当用户进入系统时,由系统识别身份和密码,通过鉴定后提供使用权;并对第三方数据库使用者以及超级权限用户进行控制,设置其访问数据库的操作权限,即每个用户只能访问有权限设置的数据,对其所做的操作进行全面的审计;
所述运行监控模块包括监测数据库运行状况,及时处理解决运行过程中的问题,以及定期反馈数据库运行报告;
所述数据备份管理模块定期对数据进行备份和恢复测试;
所述日志管理模块中的系统日志保存期限按系统的风险等级确定,不能随意修改和删除日志,日志的存储采用加密形式进行保存。
9.如权利要求1所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:所述云计算平台包括数据传输模块、生物信息自动化分析模块、调用模块、决策树实施模块、结果输出模块、报告自动生成模块和报告审核模块;
所述数据传输模块是将生物样本在所述实验平台检测得到测序数据传输至所述生物信息自动化分析模块进行自动化分析;
所述生物信息自动化分析模块是将患者的原始检测数据通过程序包自动分析生成各种类型变异检测数据;
所述调用模块是调用检测者基本信息,并通过检测者变异信息及从数据库中提取变异对应的关系数据;
所述决策实施模块是将提取的信息经自动化判断对信息进行决策输出,过程为:1)将检测者的变异信息通过访问数据库变异筛选;2)筛选符合治疗相关的变异信息,将变异信息对应的治疗方法和治疗疗效信息提取;3)将与治疗方法相关的信息按治疗药物分类:如果治疗方法里面有靶向药物治疗,则按靶向药物规则判断,如果治疗药物里面没有靶向药物而有化疗药物,则按化疗药物规则判断;4)对于与药物治疗关系不明确的基因变异则通过高频突变信息子库筛选,与检测者对应癌症种类匹配的高频突变被筛选出来;5)将检测的变异信息通过肿瘤通路基因子库,driver gene子库以及致癌/抑癌基因子库查找,有相应癌症的基因变异则被筛选出;
所述结果输出模块是将每个决策树实施模块的数据结果按对应分析模块命名,输出统计文件。
10.如权利要求9所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:
所述生物信息自动化分析模块中自动分析程序包包括以下步骤:
(Ⅰ)对下机数据低质量的reads进行过滤,并采用fastqc工具进行质控;
(Ⅱ)过滤后的数据采用paligner/BWA比对方法与人类参考基因组比对,再对由于PCR造成的重复reads进行去除;
(Ⅲ)对去重前后的bam格式文件做比对情况的统计;
(Ⅳ)用Varscan变异检测工具进行DNA的SNP及INDEL的检测,并进行Fusion和CNV分析;
(V)由RNA检测对进行RPKM值进行分析。
11.如权利要求1所述的一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:
所述终端登陆平台内包括生物样本信息数据录入模块、报告下载模块和结果反馈模块;所述生物样本信息数据录入模块用于输入样本信息和分析需求,并将输入信息分别传输至所述云计算平台和报告下载模块;所述报告下载模块将所述云计算平台生成的报告进行下载,并传输至所述结果反馈模块;所述结果反馈模块是送检者或机构得到数据报告后,根据报告信息给送检者提供治疗方案或者健康建议。

说明书全文

一种用于肿瘤个体化基因检测智能解读的系统

技术领域

[0001] 本发明涉及一种基因检测解读系统,特别是关于一种用于肿瘤个体化基因检测智能解读的系统。

背景技术

[0002] 随着个体化肿瘤精准治疗的发展,国内外众多的机构提供这类医疗技术服务,有Foundation One这种同时提供检测和解读服务的公司,也有单独提供检测或者解读的公司,如Ampliseq主要提供肿瘤检测服务,N-of-one主要提供解读服务。国内起步较晚,大部分肿瘤解读大多还处于手工收集数据上,或者采用国外的技术服务。总的来说,能结合大规模检测数据提供的针对大数据的个体化肿瘤知识解读服务的公司目前还很少,现有服务都存在以下一些局限性:
[0003] 1)手工知识积累的局限性:有部分产品解读范围片面,不能依靠大规模循证医学证据,主要依靠人工收集整理知识,一方面效率低下,另一方面不能充分体现证据的可靠性和实时性。2)解读变异信息的局限性:目前一些解读产品,大部分集中在肿瘤的DNA变异分析(主要是单基突变SNV,插入缺失突变INDEL,拷贝数变异CNV,基因融合Fusion),有部分涉及到RNA变异。但结合germline的单核甘酸多态性SNP及其他变异类型的较少。解读变异信息比较单一和局限。3)知识内容的局限性:目前肿瘤治疗的方式有手术介入,药物介入等多种。在药物治疗中除了靶向药物治疗,还有化疗,放疗,激素疫苗等治疗方法,在近几年免疫治疗的效果非常显著。这些治疗效果与基因变异都有一定的关联。在药物治疗过程中,除了药效,药物代谢也与基因变异相关。但目前的提供的解读方案大多都集中于靶向药物,涉及化疗及其他治疗方案的很少,解读内容比较片面,不完整。4)解读方法的合理性:目前市面的肿瘤检测产品检测基因数据相对简单,很多芯片的基因较少,涉及的解读证据也不丰富,主要通过简单的判断或者手工解读完成。这些解读结果不够全面,也不够严谨,没有统一的标准,依赖解读人员的知识平和经验水平较多,容易形成偏差。在面对大规模多种测序数据时往往显得不从心,无法为检测者提供批量有效高质量的服务。

发明内容

[0004] 针对上述问题,本发明的目的是提供一种用于肿瘤个体化基因检测智能解读的系统,该系统能针对大规模测序结果的肿瘤个体化解读,能更好的为患者提供更近准的治疗信息,节约治疗的成本,进而为患者提供更多治疗方案。
[0005] 为实现上述目的,本发明采取以下技术方案:一种用于肿瘤个体化基因检测智能解读的系统,其特征在于:该系统包括实验平台、知识库平台、计算平台和终端登陆平台;所述实验平台将收集到的生物样本上机测序后,将测序数据传输至所述云计算平台,同时用户在所述终端登录平台将样本信息及分析需求录入后将信息传输至所述云计算平台;所述知识数据库平台用于收集解读知识数据;所述云计算平台对样本测序数据进行生物信息分析并调用所述知识库平台内的数据解读后,将生成的解读报告传输至所述终端登陆平台,由所述终端登录平台下载报告和进行反馈。
[0006] 优选地,所述实验平台包括样本收集模、样本实验处理模块、上机测序模块和测序数据质量控制模块;所述样本收集模块包括对不同样本的收集;所述样本实验处理模块对收集到的样本进行样本提取、捕获和文库构建;样品送至检测实验室后开始提取,文库构建需要将生物样本中提取的游离核酸/RNA经过末端修复和加“A”后进行带有分子标签的接头连接,连接产物进行PCR扩增,扩增产物与探针进行杂交捕获反应,捕获产物经过PCR扩增后环化,然后进行质量评估;所述上机测序模块用于对实验处理后的样本进行测序,并将测序得到下机数据传输至所述测序数据质量控制模;所述测序数据质量控制模块对下机数据进行评估,符评估标准的下机数据传输至所述云计算平台。
[0007] 优选地,所述知识库平台包括需求分析对象确定模块、数据管理系统构建模块、数据收集下载模块、数据抽提及整理模块、数据录入模块、证据分级模块、证据审核机制模块、数据库安全管理模块和数据库维护机制模块;所述需求分析对象确定模块用于确定需求分析对象;所述数据管理系统构建模块是依据需求分析结果设置一个独立于具体数据库管理系统的关系实体,并完成数据库框架的搭建;所述数据收集下载模块是根据数据来源从各种公共来源数据进行下载收集数据,并将收集到的数据分别传输至所述数据抽提及整理模块和数据管理系统构建模块,由所述数据管理系统构建模块进行存储和管理;所述数据抽提及整理模块是将收集下载的数据按可识别模式抽提信息,并将抽提的信息根据定义的属性以及每个字段的有效规则整理成规范模式;整理每个实体集的数据表;所述数据录入模块是将收集整理的记录通过脚本程序自动录入数据库构建模块;所述证据分级模块是将已录入的数据按证据来源的重要性以及证据支持数目分为不同的等级,每个记录都会有一个与之匹配的等级属性;所述证据审核机制模块是依据录入的信息的每个记录都有且只有一个ID,靠脚本和人工同时实现信息的审核;对于提取的位点变异信息,将通过脚本变异基因对应的基因组,转录本,核酸变异位置基酸变异位置以及染色体位置全部转换成对应的数据校正,如有不一致的对应位点将会移除;对于描述类的信息,通过标准化模式识别处理后再经过人工核实;所述数据库安全管理模块包括配置管理模块、账户管理模块、操作系统的安全管理模块、运行监控模块、数据备份管理模块和日志管理模块;所述数据库维护机制模块中数据库的内容采用定期更新及审核机制,定期收集相关来源的最新数据,采用自动化流程并结合人工检查的方式定期更新数据。
[0008] 优选地,所述数据收集下载模块下载收集数据信息为:1)从NCCN,ESMO以及ASCO网站的治疗指南中提取肿瘤基因变异相关治疗信息;2)从FDA药给物标签中提取肿瘤基因变异相关治疗信息;3)从COSMIC数据库下载肿瘤患者变异信息,筛选出高频突变基因;4)从KEGG生物通路数据库以及文献查询查找肿瘤通路相关基因;5)从PGKB,My cancer genome,PharmGKB数据库下载基因药物治疗,代谢,毒性以及其他适应症相关信息;6)从NCBI gene,GenBank、EMBL、Gene Ontology,Drug bank,HGMD基因组相关数据库下载数据基因、药物数据,提取基因,药物相关信息;7)对NCBI Pubmed文献进行筛选,选出基因变异与药物相关文献,并提取基因变异与干预治疗相关信息。
[0009] 优选地,所述数据录入模块中,在数据录入中会对每个录入的字段进行标准化识别及审核,对于不符合录入条件的数据会系统报错并输出到报错文件夹。
[0010] 优选地,所述证据分级模块中证据等级的划分参考目前主流数据库以及临床实验分级标准设计,分为A,B,C,D四类:A类为被医学会认可的指南或某些重大卫生系统的认可的信息,包括NCCN指南推荐检测的基因,FDA批准药物的靶向基因,即伴随诊断基因;B类为多项或一项人的研究中,临床三期以上,且统计检验结果显著的研究;C类为少1项临床二期以上三期以下研究中显著或是多个二期以上研究中具有相关性但不显著,同时也包括达不到统计学要求的少量患者的实验研究、Case report、动物实验或细胞实验研究;D类为目前无治疗相关研究报道的肿瘤基因,包括抑癌/致癌基因,驱动基因,险基因,高频突变基因,肿瘤通路相关基因或肿瘤家族基因。
[0011] 优选地,所述证据分级模块中基因变异信息按精准医疗解析指南分为I-V类:Ⅰ类为食品药监局批准的用于该癌种的药物治疗靶点;写入该癌种权威诊疗指南中有明确诊断/治疗/疾病监测意义的变异;Ⅱ类为尚未进入诊疗指南,但已经写入该领域的专家共识的变异位点;Ⅲ类为食品药监局批准用于其他肿瘤能预测疗效的基因变异;或写入其它癌种权威诊疗指南中有明确诊断/治疗/疾病监测的变异;Ⅳ类为非权威研究、或正在进行中的临床试验、或临床前研究中的相关变异位点;Ⅴ类为临床相关性未明或之前在肿瘤中未有报道的相关变异。
[0012] 优选地,所述数据库安全管理模块中配置管理模块负责系统维护的管理;所述账户管理模块对数据库的账户及其口令进行变更,同时也包括建立、删除、修改数据库账户权限的管理;所述操作系统的安全管理模块是将数据库中的数据必须经由DBMS才能进行访问,通过DBMS提供的安全措施检查启用的身份是否合法;每个有使用权限的用户在系统中有一个标识的身份名称和密码,当用户进入系统时,由系统识别身份和密码,通过鉴定后提供使用权;并对第三方数据库使用者以及超级权限用户进行控制,设置其访问数据库的操作权限,即每个用户只能访问有权限设置的数据,对其所做的操作进行全面的审计;所述运行监控模块包括监测数据库运行状况,及时处理解决运行过程中的问题,以及定期反馈数据库运行报告;所述数据备份管理模块定期对数据进行备份和恢复测试;所述日志管理模块中的系统日志保存期限按系统的风险等级确定,不能随意修改和删除日志,日志的存储采用加密形式进行保存。
[0013] 优选地,所述云计算平台包括数据传输模块、生物信息自动化分析模块、调用模块、决策树实施模块、结果输出模块、报告自动生成模块和报告审核模块;所述数据传输模块是将生物样本在所述实验平台检测得到测序数据传输至所述生物信息自动化分析模块进行自动化分析;所述生物信息自动化分析模块是将患者的原始检测数据通过程序包自动分析生成各种类型变异检测数据;所述调用模块是调用检测者基本信息,并通过检测者变异信息及从数据库中提取变异对应的关系数据;所述决策实施模块是将提取的信息经自动化判断对信息进行决策输出,过程为:1)将检测者的变异信息通过访问数据库变异筛选;2)筛选符合治疗相关的变异信息,将变异信息对应的治疗方法和治疗疗效信息提取;3)将与治疗方法相关的信息按治疗药物分类:如果治疗方法里面有靶向药物治疗,则按靶向药物规则判断,如果治疗药物里面没有靶向药物而有化疗药物,则按化疗药物规则判断;4)对于与药物治疗关系不明确的基因变异则通过高频突变信息子库筛选,与检测者对应癌症种类匹配的高频突变被筛选出来;5)将检测的变异信息通过肿瘤通路基因子库,driver gene子库以及致癌/抑癌基因子库查找,有相应癌症的基因变异则被筛选出;所述结果输出模块是将每个决策树实施模块的数据结果按对应分析模块命名,输出统计文件。
[0014] 优选地,所述生物信息自动化分析模块中自动分析程序包包括以下步骤:(Ⅰ)对下机数据低质量的reads进行过滤,并采用fastqc工具进行质控;(Ⅱ)过滤后的数据采用paligner/BWA比对方法与人类参考基因组比对,再对由于PCR造成的重复reads进行去除;(Ⅲ)对去重前后的bam格式文件做比对情况的统计;(Ⅳ)用Varscan变异检测工具进行DNA的SNP及INDEL的检测,并进行Fusion和CNV分析;(V)由RNA检测对进行RPKM值进行分析。
[0015] 优选地,所述终端登陆平台内包括生物样本信息数据录入模块、报告下载模块和结果反馈模块;所述生物样本信息数据录入模块用于输入样本信息和分析需求,并将输入信息分别传输至所述云计算平台和报告下载模块;所述报告下载模块将所述云计算平台生成的报告进行下载,并传输至所述结果反馈模块;所述结果反馈模块是送检者或机构得到数据报告后,根据报告信息给送检者提供治疗方案或者健康建议。
[0016] 本发明由于采取以上技术方案,其具有以下优点:1、本发明建立一个综合解读数据库,此数据库信息来源丰富,覆盖全面,不仅方便肿瘤个体化解读的需要,也能满足其他肿瘤相关知识的查询,如肿瘤基因信息的查询,肿瘤变异信息的查询以及肿瘤相关知识的查询等,在芯片设计,科研分析数据调研等多方面都可以参考本数据库。2、本发明能建立一个针对大数据检测结果综合分析的方法,解决目前日益复杂数据解读。本发明包含了目前肿瘤检测中采用的DNA,RNA检测模块,同时也可加入蛋白质,甲基化等个性化分析模块,能覆盖目前全部主流检测方法的数据分析和解读。3、本发明能克服解读手工解读时的低效率和质量低的问题,提高效率和准确性。4、本发明的解读系统能根据证据的分级除了提供本癌症种类的解读信息同时也能根据患者的变异类型提供于其相关的其他治疗方案,大大提高了患者的选择性。在解读内容上,同时能解读药物相关的靶点,高频突变位点,驱动基因,抑癌/致癌基因,肿瘤通路基相关基因等信息。为检测者提供一个相对全面的解读信息。5、本发明能建立一个从检测到报告生成的自动化系统,实现全自动化,提高效率,普及更多的患者。从检测样本送样开始,分析自动化,解读自动化,报告自动化。从样本送检开始到下载报告全程标准化处理,无需人工干预,方便简洁,节省人工成本和时间成本。6、本发明实施的平台多样化,标准人性化,能与多种检测数据接口连接。同时数据库及自动分析流程搭建在云计算平台,因此只需要网络连接和权限管理即可在在多个地区和单位实施,不受场地限制,适用性广。7、本发明建立的人工智能解读系统,依托自动化程序文本挖掘构建的数据库,依靠决策树标准判断适合检测者的条件输出,不但能解决效率问题,同时也能提高解读质量,不会因人工判断失误而提供错误的结果。8、本发明的云计算平台中的解读能根据证据的分级除了提供本癌症种类的解读信息同时也能根据患者的变异类型提供于其相关的其他治疗方案,大大提高了患者的选择性。附图说明
[0017] 图1是本发明的整体结构示意图。

具体实施方式

[0018] 下面结合附图和实施例对本发明进行详细的描述。
[0019] 如图1所示,本发明提供一种用于肿瘤个体化基因检测智能解读的系统,该系统包括实验平台、知识库平台、云计算平台和终端登陆平台。实验平台将收集到的生物样本上机测序后,将测序数据传输至云计算平台,同时用户在终端登录平台将样本信息及分析需求录入后将信息传输至云计算平台;知识数据库平台用于收集解读知识数据;云计算平台对样本测序数据进行生物信息分析并调用知识库平台内的数据解读后,将生成的解读报告传输至终端登陆平台,由终端登录平台下载报告和进行反馈。
[0020] 在一个优选地实施例中,实验平台包括样本收集模块,样本实验处理模块、上机测序模块和测序数据质量控制模块。其中:
[0021] 样本收集模块包括对不同样本的收集,不同的样本有不同的收集和保存方法,常用样本包括但不限于新鲜癌组织、石蜡包埋/切片组织和外周血/骨髓等,以下标准适用目前检测方法,但也可根据需要调整。
[0022] 1)新鲜组织收样标准:A.组织样本总量不低于60mg,肿瘤细胞比例>70%,坏死细胞比例<10%;B.活检穿刺组织,样本量不少于3针(微量样本检测有风险);C.样本采集后立即放入液氮完全冷冻,低温(-80℃)保存,运输。
[0023] 2)石蜡包埋/切片组织收样标准:A.切取10-15张石蜡包埋标本切片。保存时间半年以内,每张面积>10mm×10mm、厚度约5-10μm,用载玻片片盒或离心管保存;B.常温保存、运输。
[0024] 3)外周血/骨髓收样标准:A.采用EDTA抗凝管,外周血10ml,骨髓5ml;B.APL患者常存在凝血异常,抽骨髓不当容易凝血影响检测,抽取骨髓血时快速而匀速的移到EDTA抗凝管后,迅速晃动;C.样本运输:2-8℃储存,冰袋冷藏运输,72小时内送检,不可冷冻。
[0025] 样本实验处理模块对收集到的样本进行样本提取、捕获和文库构建。其中,检测样本处理可在送检机构搭建的实验室进行,也可由第三方或者是解读机构的实验室进行。
[0026] 样品送至检测实验室后开始提取(如提取DNA或RNA)。文库构建需要将血浆/组织等生物样本中提取的游离核酸/RNA经过末端修复和加“A”后进行带有分子标签的接头连接,连接产物进行PCR扩增。扩增产物与探针进行杂交捕获反应,捕获产物经过PCR扩增后环化,然后进行质量评估。不同的检测方法质控会有相应标准(如:杂交前PCR产物浓度≥15ng/ul。杂交后PCR产物浓度≥4ng/ul),质控点为提取生物分子的浓度。
[0027] 上机测序模块用于对实验处理后的样本进行测序,并将测序得到下机数据传输至测序数据质量控制模。测序检测使用的仪器包括Illumina HiSeq 2000/2500,Illumina MiSeq,Life Technologies Ion Proton,Complete Genomics,ABi SOLiD,ABi 3730xl,BGIseq等。原始下机数据通过平台数据接口上传,测序下机数据包括Raw Reads、Q20Reads、Q30Reads、Filtered Reads、Aligned Reads、Mapping Rate。
[0028] 测序数据质量控制模块对下机数据进行评估,符合评估标准的下机数据传输至云计算平台。评估标准主要是涉及测序的容错率,产量和Q30等:0容错90%以上,1容错95%,数据产量≥100G,Q30%≥80。
[0029] 在一个优选地实施例中,知识库平台包括需求分析对象确定模块、数据管理系统构建模块、数据收集下载模块、数据抽提及整理模块、数据录入模块、证据分级模块、证据审核机制模块、数据库安全管理模块和数据库维护机制模块。其中:
[0030] 需求分析对象确定模块用于确定需求分析对象,主要包括基因,变异,疾病,基因与疾病的关系,参考文献,实验信息,以及各种定义的解释等多个字段;以及这些字段的值域、字段的类型和字段的有效规则(如小数位数,字段长度),制定完整性约束的命名规范,选择每个字段的来源及规则的实现方式。
[0031] 数据管理系统构建模块是依据需求分析结果设置一个独立于具体DBMS(数据库管理系统)的关系实体,并完成数据库框架的搭建。数据库使用MySQL系统构建。在数据库的构建中,通过确定每个实体集中主键以及外键,进而确定实体集之间的联系。
[0032] 数据收集下载模块是根据数据来源从各种公共来源数据进行下载收集,并将收集到的数据分别传输至数据抽提及整理模块和数据管理系统构建模块,由数据管理系统构建模块进行存储和管理,主要包括以下数据信息:1)从NCCN,ESMO以及ASCO等网站的治疗指南中提取肿瘤基因变异相关治疗信息。
[0033] 2)从FDA药给物标签中提取肿瘤基因变异相关治疗信息。
[0034] 3)从COSMIC数据库下载肿瘤患者变异信息,筛选出高频突变基因。
[0035] 4)从KEGG等生物通路数据库以及文献查询查找肿瘤通路相关基因。
[0036] 5)从PGKB,My cancer genome,PharmGKB等数据库下载基因药物治疗,代谢,毒性以及其他适应症相关信息。
[0037] 6)从NCBI gene,GenBank、EMBL、Gene Ontology,Drug bank,HGMD等基因组相关数据库下载数据基因、药物数据,提取基因,药物等相关信息。
[0038] 7)对NCBI Pubmed文献进行筛选,选出基因变异与药物相关文献,并提取基因变异与干预治疗相关信息;其中,文献筛选是通过基因,变异,疾病,疾病干预方法以及效果等多类关键词进行文本挖掘,从而对文献进行筛选。数据抽提及整理模块是将收集下载的数据按可识别模式抽提信息,并将抽提的信息根据定义的属性以及每个字段的有效规则整理成规范模式;整理每个实体集的数据表。
[0039] 数据录入模块是将收集整理的记录通过脚本程序自动录入数据库构建模块。其中,录入脚本可用PERL语言实现,在大型机/本地计算机等都可运行。在数据录入中会对每个录入的字段进行标准化识别及审核,对于不符合录入条件的数据会系统报错并输出到报错文件夹。
[0040] 证据分级模块是将已录入的数据按证据来源的重要性(即证据等级)以及证据支持数目分为不同的等级,每个记录都会有一个与之匹配的等级属性。证据等级的划分参考目前主流数据库以及临床实验分级标准设计,分为A,B,C,D四类。其中A类为被医学会认可的指南或某些重大卫生系统的认可的信息,包括NCCN等指南推荐检测的基因,FDA批准药物的靶向基因,即伴随诊断基因;B类为多项或一项人的研究中,临床三期(或参与人数>100人)以上,且统计检验结果显著的研究;C类为少1项临床二期以上三期以下(或参与人数>20)研究中显著或是多个二期以上(参与人数>20)研究中具有相关性但不显著,同时也包括达不到统计学要求的少量患者的实验研究、Case report、动物实验或细胞实验研究;D类为目前无治疗相关研究报道的肿瘤基因,包括抑癌/致癌基因,驱动基因,风险基因,高频突变基因,肿瘤通路相关基因或是肿瘤家族基因等。其中,显著是指统计值p<0.05或p<0.01。
[0041] 证据审核模块是依据录入的信息的每个记录都有且只有一个ID,靠脚本和人工同时实现信息的审核。对于提取的位点变异信息,将通过脚本变异基因对应的基因组,转录本,核酸变异位置,氨基酸变异位置以及染色体位置等全部转换成对应的数据校正。如有不一致的对应位点将会移除。对于描述类的信息,通过标准化模式识别处理后再经过人工核实。每项记录录入后将会保留信息供后期复查,审核判断后会根据需要改变记录状态,“Y”为记录保留,“N”为记录不可使用。同时也会保留修改的日志,记录修改人员名字和日期以及修改内容的类型描述。
[0042] 其中,标准化模式是通过脚本程序审核基因名、转录本和变异位置碱基/氨基酸等提取信息,以与UCSC,NCBI等公共数据库的格式以及录入数据之间具有相互一致性。
[0043] 基因变异信息按精准医疗解析指南分为I-V类:Ⅰ类为食品药监局(US.FDA或CFDA)批准的用于该癌种的药物治疗靶点(包括说明中提到的具体变异,以及药物靶点基因的所有变异);写入该癌种权威诊疗指南(如NCCN)中有明确诊断/治疗/疾病监测意义的变异;Ⅱ类为尚未进入诊疗指南,但已经写入该领域的专家共识的变异位点。Ⅲ类为食品药监局(US.FDA或CFDA)批准用于其他肿瘤可预测疗效的基因变异;或写入其它癌种权威诊疗指南(如NCCN)中有明确诊断/治疗/疾病监测等意义的变异;Ⅳ类为非权威研究、或正在进行中的临床试验、或临床前研究中的相关变异位点。Ⅴ类为临床相关性未明或之前在肿瘤中未有报道的相关变异。
[0044] 数据库安全管理模块包括配置管理模块、账户管理模块、操作系统的安全管理模块、运行监控模块、数据备份管理模块和日志管理模块。其中:
[0045] 配置管理模块负责数据库的安装(升级、卸载)、服务启停、操作系统版本、文件系统容量、内存交换区使用率、系统性能等系统维护的管理。通过对数据库进行合理配置、测试、调整,最大限度发挥数据库资源优势;
[0046] 账户管理模块在数据库管理员授权下,对数据库的账户及其口令进行变更,同时也包括建立、删除、修改数据库账户权限的管理;
[0047] 操作系统的安全管理模块是将数据库中的数据必须经由DBMS才能进行访问,通过DBMS提供的安全措施检查启用的身份是否合法。每个有使用权限的用户在系统中有一个标识的身份名称和密码。当用户进入系统时,由系统识别身份和密码,通过鉴定后提供使用权。并对第三方数据库使用者以及超级权限用户进行控制,设置其访问数据库的操作权限,即每个用户只能访问有权限设置的数据,对其所做的操作进行全面的审计,保证重要数据的不丢失不泄密;
[0048] 运行监控模块包括监测数据库运行状况,及时处理解决运行过程中的问题,以及定期反馈数据库运行报告。定期对各类的数据库进行安全扫描,在发现配置或安全漏洞时提供有限的解决建议,保证数据库的可靠性;
[0049] 数据备份管理模块定期对数据进行备份和恢复测试;
[0050] 日志管理模块中的日志是由操作系统、数据库管理系统、防火墙、入侵检测系统和路由器等生成,内容包括管理登录尝试、系统事件、网络事件和错误信息等。系统日志保存期限按系统的风险等级确定。不能随意修改和删除日志,日志的存储采用加密形式进行保存。
[0051] 数据库维护机制模块中数据库的内容采用定期更新及审核机制,定期收集相关来源的最新数据,采用自动化流程并结合人工检查的方式定期更新数据。同时对数据库内容进行专业的审核评估,保证数据库的完成性和全面性。
[0052] 在一个优选地实施例中,终端登录平台包括生物样本信息数据录入模块、报告下载模块和结果反馈模块。生物样本信息数据录入模块用于输入样本信息和分析需求,并将输入信息分别传输至云计算平台和报告下载模块;报告下载模块将云计算平台生成的报告进行下载,并传输至结果反馈模块。结果反馈模块是送检者或机构得到数据报告后,根据报告信息给送检者提供治疗方案或者健康建议。对于实际的治疗方案和结果以及后期的健康恢复状况可通过终端登录平台提供反馈信息。数据录入回访数据库。
[0053] 检测者生物样本信息数据录入是将检测者进行检测时提供的基本信息,送检者登录平台客户端录入的基本信息进行文字或选项录入。检测者基本信息包括检测者姓名,检测者编号,出生日期,性别,年龄,国家,送检机构,送检医生,送检时间,疾病类型(系统提供备选癌症类型供选择,癌症为NCCN的分类标准,如不在选择范围内癌症则手工输入),送检标本类型(血液/骨髓/新鲜组织/石蜡切片样本(FFPE)/唾液/尿液/粪便/其他),送检部位以及采样日期,如有其他背景材料或描述类信息可以其他选项录入。检测者编号按流程顺序生成编号(projectID),每个projectID有且只有唯一,患者的变异检测信息以及基本信息文件与projectID号一一对应,依据此号可访问各种分析数据。为保证检测者隐私和数据安全,在患者信息录入后,需有权限后才能查阅患者基本信息,其他中间监控流程只能通过检测者编号识别数据。
[0054] 在一个优选地实施例中,云计算平台包括数据传输模块、生物信息自动化分析模块、调用模块、决策树实施模块、结果输出模块、报告自动生成模块和报告审核模块。
[0055] 数据传输模块是将生物样本在实验平台检测得到测序数据传输至生物信息自动化分析模块进行自动化分析。生物信息自动化分析模块是将患者的测序数据通过程序包自动分析生成各种类型变异检测数据。程序包安装在云计算平台上,测序仪检测的原始数据上传后,按云计算平台自动完成信息分析分析步骤。目前主要检测的单核苷酸变异(SNV/SNP)分析流程,插入缺失突变(INDEL)分析流程,拷贝数变异(CNV)分析流程,基因融合变异(Fusion)分析流程,表达量变异(mRNA)分析流程。
[0056] 自动分析程序包包括以下步骤:(Ⅰ)对下机数据低质量的reads(序列)进行过滤,并采用fastqc工具进行质控;(Ⅱ)过滤后的数据采用Paligner/BWA比对方法与人类参考基因组(hg19/hg20)比对,再对由于PCR(聚合酶链式反应)造成的重复reads进行去除;(Ⅲ)对去重前后的bam格式文件做比对情况的统计;(Ⅳ)用Varscan变异检测工具进行DNA的SNP及INDEL的检测,用SOAPfusion软件进行Fusion分析,CNVkit软件完成CNV分析;(V)由RNA检测对进行RPKM值进行分析:A.原始下机数据的过滤,包括对低质量reads的过滤和rRNA序列的过滤;B.全基因组的比对(参考序列为hg19/hg20);C.基因reads计数及表达量的定量计算,统计各基因的reads,计算RPKM(每kb基因长度,每Mb数据量的reads数)来反映基因的表达水平。其中,RPKM计算公式为:
[0057]
[0058] 式中,C为比对到目标基因上的reads数目,N为比对到所有基因上的reads数目,L为目标基因外显子的总长。
[0059] 不同测序平台的下机数据有不同的自动化分析流程接口,变异分析后输出固定格式的VCF文件。送检者和平台管理员可通过客户端登陆平台观测流程执行进度,只有平台管理员可访问后台数据和修改流程权限。
[0060] 调用模块是调用检测者基本信息,并通过检测者变异信息及从知识库平台中提取变异对应的关系数据;在云计算平台执行,且调用模块经知识库平台中的证据审核模块提取关系数据。
[0061] 在基因变异-药物治疗效果对应关系数据中,如果知识库平台中一个证据对应的变异是一个以上突变,则需要这些突变信息同时存在才能提取此条记录,如果证据对应的变异只是一个突变,则只需要此突变单独存在及可提取词条记录。如果一种变异信息对应一个单独的药物治疗关系,则只需提取一种药物,如果一种变异信息对应的是联合用药的治疗效果,则需要将记录的多种药物同时提取。每个证据都会同时关联并提取相关的参考文献信息。
[0062] 决策树实施模块是将提取的信息经自动化判断对信息进行决策输出,过程如下:
[0063] 1)将检测者的变异信息通过访问数据库变异筛选。
[0064] 2)筛选符合治疗相关的变异信息,将变异信息对应的治疗方法(主要为药物治疗)和治疗疗效信息提取。对于变异与治疗方法一对一关系的可直接提取,对于一对多或者多对多关系的,则需要检测到多种变异同时存在才能提取对应药物治疗的结果。如果对应的治疗方法为多种药物联合治疗,则需要将联合治疗的药物同时提取,并在后续步骤进行判断。
[0065] 3)将与治疗方法相关的信息按治疗药物分类:如果治疗方法里面有靶向药物治疗,则按靶向药物规则判断,如果治疗药物里面没有靶向药物而有化疗药物,则按化疗药物规则判断;如有激素,放疗,疫苗,免疫等治疗方法,则按激素,疫苗,免疫治疗方法判断。
[0066] (A)靶向药物规则:靶向药物对应的变异信息,先按检测者对应的癌症种类分类,将与检测者提供的癌症一致的治疗信息按证据可信度分级,再将药物治疗效果按是否敏感分类,将敏感和耐药的信息分别按信息可信度等级排序后输出癌症一致性的敏感和耐药信息。与检测者提供的癌症不一致的信息则按跨癌种证据解读,也将信息按证据可信度分级,在按敏感和耐药信息分类,将跨癌症种类解读信息按可信度排序后输出敏感和耐药信息。
[0067] (B)化疗药物规则:化疗药物对应的解读要判断变异与药物治疗效果的关系和药物毒性的关系。首先信息按证据可信度分级,再将药物治疗效果按敏感和耐药筛选。如果药物治疗效果敏感且有毒性相关变异信息则输出药物敏感、有毒性的建议;如果敏感且无毒性相关变异则只输出药物敏感建议;如果有耐药且有毒相关性变异,则输出耐药、有毒性建议;如果有耐药且无毒性相关变异信息,则输出耐药证据;如果与治疗效果不明确,但有毒性相关变异信息,则只输出毒性相关建议。
[0068] (C)对于激素,放疗,疫苗,免疫相关治疗,检测出药效相关变异信息后按癌症类型分类,然后按药物是否敏感或者耐药输出建议。
[0069] (D)药物代谢信息多与CYP家族基因的多态相关,基因检测结果与相应的基因型匹配后输出对应的药物代谢结果。
[0070] 4)对于与药物治疗关系不明确的基因变异则通过高频突变信息子库(COSMIC,检测变异患者>20或检测突变基因TOP20)筛选,与检测者对应癌症种类匹配的高频突变被筛选出来。
[0071] 5)将检测的变异信息通过肿瘤通路基因子库,driver gene子库以及致癌/抑癌基因子库查找,有相应癌症的基因变异则被筛选出。
[0072] 结果输出模块是将每个决策树实施模块的数据结果按对应分析模块命名,输出统计结果文件。
[0073] 报告自动生成模块中报告格式根据不同检测要求有对应的设计和模块选择,送测机构可先选择模板类型或者设计报告模板,以报告模板输出参考文献信息,将输出的表格文件编辑成PDF报告模式,报告生成后发送后台路径。按设计的报告模块调用结果输出文件。报告模块包括患者基本信息(姓名,患者编号,性别,年龄,国家,检测疾病,采样日期,送检机构,送检医生,报告日期),检测患者基因突变信息,检测患者突变的解读信息。突变解读信息按有药物相关,高频突变,致癌/抑癌突变,Pathway及其他分类模块输出,每个模块可按实际的检测需要选择输出与否。其中突变药物相关信息按药物输出,如果联合治疗用药信息则会在两种药物信息中同时输出。
[0074] 报告审核模块是审核数据流程完整性及报告完整性及准确性,确定无误后批准传输至终端登录平台。送检机构人员可登录终端登录平台下载报告。
[0075] 实施例:
[0076] 在本发明的一个具体的实施方式中,展示了肿瘤个体化解读系统数据库的构建信息,主要体现为:通过从各公共网站收集提取各种信息,并通过从公共文献数据库挖掘信息,数据库录入解读数据库。数据库中涉及到的1949-2017年目前为止肿瘤治疗批准药物,历年批准临床实验治疗信息;肿瘤条通路相关的基因信息来自于文献数据库和KEGG数据,筛选了12条重要通路的重要基因;高频突变相关信息来自COSMIC数据库,选取统计人数>20的突变信息;抑癌/致癌基因信息来自于文献数据库。另外基因的解释分类来自于文献及其他数据库信息。
[0077] 在实施例中以肿瘤个体化治疗检测数据为基础,并展示了肿瘤个体化解读系系统的使用及结果展示。
[0078] 1.在一案例中患者从检测到解读包括以下步骤:
[0079] 1)患者信息录入
[0080] 患者经医院诊断为癌(右上肺为大细胞神经内分泌癌原发灶(晚期肺肿瘤IV期);右胸壁,左膝盖均发现转移灶。
[0081] 患者其他信息确认后系统录入。
[0082] 2)患者样本收集:取得肺、胸壁病灶组织标本,可提取肺肿瘤、转移灶的DNA与RNA,适于检测其基因组及RNA-seq。
[0083] 3)经DNA,RNA提取后上机测序。
[0084] 表1案例1原发灶检测数据评估
[0085]
[0086]
[0087] 表2案例1转移灶检测数据评估
[0088]
[0089] 4)自动分析数据流程
[0090] 经流程自动化分析,检测出患者原发灶和转移灶的变异信息。
[0091] 表3案例1原发灶变异信息统计
[0092]
[0093] 表4案例1转移灶变异信息统计
[0094]
[0095]
[0096] 5)患者信息的读取和变异数据调用,相关信息自动访问数据库,搜索变异相关信息。通过人工智能解读系统解读,并生成解读报告。
[0097] 表5案例1药物治疗解读信息(重要的部分信息)
[0098]
[0099]
[0100] TKIs药物代谢
[0101] 1.Cytochrome P450 3A4:未突变
[0102] Actions:substrate
[0103] 2.Cytochrome P450 2D6:未突变
[0104] Actions:substrate,inhibitor
[0105] 6)报告审核后发送。
[0106] 经反馈,选择TKIs治疗后右上肺病灶在-段时间内减少,后出现转移,新转移灶检测出现耐药变异。
[0107] 2.在另一实施案例中,患者收样及检测结果步骤如下:
[0108] 1)患者信息录入
[0109] 细胞学诊断结果为非小细胞肺癌,既往检测结果及用药史为EGFR E18,E19,E20,E21阴性;ALK 10%区域阳性,ROS1阴性。
[0110] 患者其他信息确认后系统录入。
[0111] 2)患者样本收集
[0112] 收集样本为肺癌切片样本。
[0113] 3)经DNA提取后上机测序。
[0114] 检测针对单样本DNA水平,包括点突变、小片段插入或缺失、拷贝数变化及融合基因。提取DNA后,对目标区域的Panel捕获,测序。
[0115] 表6案例2突变数据检测结果
[0116]
[0117] 4)自动分析数据流程
[0118] 经流程自动化分析,检测出患者单样本突变变异信息。
[0119] 表7案例2患者突变检测信息
[0120]
[0121] 5)患者信息的读取和变异数据调用,相关信息自动访问数据库,搜索变异相关信息。通过人工智能解读系统解读,并生成解读报告。
[0122] 表8案例2患者信息解读(部分重要信息)
[0123]
[0124] 6)报告审核发送。
[0125] 上述各实施例仅用于说明本发明,各部件的结构、尺寸、设置位置及形状都是可以有所变化的,在本发明技术方案的基础上,凡根据本发明原理对个别部件进行的改进和等同变换,均不应排除在本发明的保护范围之外。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈