首页 / 专利库 / 生物学 / 生物 / 哺乳动物 / 一种组织特异性差异甲基化区域检测方法和系统

一种组织特异性差异甲基化区域检测方法和系统

阅读:1发布:2022-06-19

专利汇可以提供一种组织特异性差异甲基化区域检测方法和系统专利检索,专利查询,专利分析的服务。并且本 发明 公开一种组织特异性差异甲基化区域tDMR检测方法和系统,该方法包括:通过全基因组测序获得全基因组上单点甲基化信息;根据全基因组上单点甲基化信息基于预选条件确定全基因组上 种子 tDMR;对种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR;基于过滤条件对候选tDMR进行过滤获得tDMR结果。本发明的方法和系统能明确全基因组上每一个位点的甲基化状态,在全基因组范围确定tDMR,大大提高了检测效率,降低了成本。经后续验证,本发明找到的tDMR准确率在85%以上,经在多物种中验证(不仅限于 哺乳动物 ),本发明的方法较Vardhman Rakyan等的方法有更高的精确度和敏感度。,下面是一种组织特异性差异甲基化区域检测方法和系统专利的具体信息内容。

1.一种组织特异性差异甲基化区域tDMR检测方法,其特征在于,包括:
通过全基因组测序获得全基因组上单点甲基化信息;
根据所述全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR;
对所述种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR;
基于过滤条件对所述候选tDMR进行过滤,获得tDMR结果。
2.根据权利要求1所述的检测方法,其特征在于,根据所述全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR包括:
通过滑动窗口扫描所述全基因组上单点甲基化信息,基于预选条件确定全基因组上种子tDMR。
3.根据权利要求2所述的检测方法,其特征在于,以5个CpG为长度、1个CpG为步长的滑动窗口来扫描所述全基因组上单点甲基化信息;所述预选条件包括:
(1)卡方检验的p<=0.05;
(2)二倍甲基化平的显著差异;和
(3)至少一个样本的甲基化水平在20%以上。
4.根据权利要求1所述的检测方法,其特征在于,所述延伸终止条件包括:
(1)两个连续的CpG之间的距离超过200bp;
(2)两个样本的平均甲基化水平小于二倍差异;
(3)两个样本的该区域的甲基化水平都小于20%;
(4)卡方检验的p>0.01。
5.根据权利要求1所述的检测方法,其特征在于,所述过滤条件包括:
(1)FDR<=0.05;
(2)得到的tDMR区域的平均覆盖度大于20个reads;
(3)得到的CG位点单点的覆盖度大于10个reads;
(4)对得到的tDMR中的CpG位点进行有放回抽样检验结果的正确率在95%以上。
6.根据权利要求1所述的检测方法,其特征在于,通过全基因组测序获得全基因组上单点甲基化信息包括:
通过重亚硫酸盐使基因组的DNA中未发生甲基化的胞嘧啶脱基转变成尿嘧啶,而甲基化的胞嘧啶保持不变;
对经过处理的全基因组进行测序,并且与未经处理的全基因组序列比较,确定全基因组上发生甲基化的CpG位点。
7.一种组织特异性差异甲基化区域tDMR检测系统,其特征在于,包括:
甲基化信息获取模,用于通过全基因组测序获得全基因组上单点甲基化信息;
种子区域确定模块,用于根据所述全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR;
种子区域延伸模块,用于对所述种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR;
候选区域过滤模块,用于基于过滤条件对所述候选tDMR进行过滤,获得tDMR结果。
8.根据权利要求7所述的检测系统,其特征在于,所述种子区域确定模块通过滑动窗口扫描所述全基因组上单点甲基化信息,基于预选条件确定全基因组上种子tDMR;其中,以5个CpG为长度、1个CpG为步长的滑动窗口来扫描所述全基因组上单点甲基化信息;所述预选条件包括:
(1)卡方检验的p<=0.05;
(2)二倍甲基化水平的显著差异;和
(3)至少一个样本的甲基化水平在20%以上。
9.根据权利要求7所述的检测系统,其特征在于,所述延伸终止条件包括:
(1)两个连续的CpG之间的距离超过200bp;
(2)两个样本的平均甲基化水平小于二倍差异;
(3)两个样本的该区域的甲基化水平都小于20%;
(4)卡方检验的p>0.01。
和/或
所述过滤条件包括:
(1)FDR<=0.05;
(2)得到的tDMR区域的平均覆盖度大于20个reads;
(3)得到的CG位点单点的覆盖度大于10个reads;
(4)对得到的tDMR中的CpG位点进行有放回抽样检验结果的正确率在95%以上。
10.根据权利要求7所述的检测方法,其特征在于,所述甲基化信息获取模块包括:
亚硫酸氢钠处理设备,用于通过重亚硫酸盐使全基因组的DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变;
全基因组比对设备,用于对经过处理的全基因组进行测序,并且与未经处理的全基因组序列比较,确定全基因组上发生甲基化的CpG位点。

说明书全文

一种组织特异性差异甲基化区域检测方法和系统

技术领域

[0001] 本发明涉及基因组学和生物信息学领域,尤其涉及一种组织特异性差异甲基化区域(tissue-specific differentially methylated region,tDMR)检测方法和系统。

背景技术

[0002] 在哺乳动物中,DNA甲基化是基因组功能实现所必须的。现有许多全基因组的研究表明哺乳动物的DNA甲基化profiles(译成图谱)具有组织特异性。tDMR(参考文献[1])是组织之间差异功能的重要实现方法,寻找不同组织之间的tDMR对基因组功能的研究具有重要意义。
[0003] 常规方法通常在基因组的个别基因或者部分区域上对甲基化进行检查。现有的基于芯片技术检测tDMR实验方法操作复杂,成功率低,成本高。目前基因芯片技术只能对已知个别基因的调控区进行研究,而不能对大量基因尤其是未知基因的甲基化分析,且靶基因和探针制备等芯片制作和检测过程操作复杂,实验成功率低,成本高。Vardhman Rakyan等[1]的研究方法表明,用芯片找到感兴趣的区域,如果一个组织中的平均甲基化率在60%以上,而另一个组织组织在40%以下就被定义为tDMR,阈值选取较武断,tDMR的阳性预测值(positive predictive value)和敏感度(sensitivity)分别为78%与61%,误差较大。
[0004] 参考文献:
[0005] [1]Vardhman Rakyan,Thomas Down,Natalie Thorne,et al.An integrated resource for genome-wide identification and analysis of human tissue-specific differentially methylated regions(tDMRs)Genome Res.published online June 24,2008
[0006] [2]Petra Haj kova,Osman El-Maarri,DNA-Methylation Analysis by the Bisulfite-Assisted Genomic Sequencing Method Methods in Molecular Biology,2002,Volume 200,143-154,DOI:10.1385/1-59259-182-5:143

发明内容

[0007] 本发明要解决的一个技术问题是提供一种组织特异性差异甲基化区域检测方法,实现了基于全基因组进行tDMR检测,且准确度高。
[0008] 本发明提供一种组织特异性差异甲基化区域tDMR检测方法,包括:
[0009] 通过全基因组测序获得全基因组上单点甲基化信息;
[0010] 根据全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR;
[0011] 对种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR;
[0012] 基于过滤条件对候选tDMR进行过滤,获得tDMR结果。
[0013] 根据本发明的检测方法的一个实施例,根据全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR包括:通过滑动窗口扫描全基因组上单点甲基化信息,基于预选条件确定全基因组上种子tDMR。
[0014] 根据本发明的检测方法的一个实施例,以5个CpG为长度、1个CpG为步长的滑动窗口来扫描全基因组上单点甲基化信息;该预选条件包括:
[0015] (1)卡方检验(结合fisher精确检验)的p<=0.05;
[0016] (2)二倍甲基化平的显著差异;和
[0017] (3)至少一个样本的甲基化水平在20%以上。
[0018] 根据本发明的检测方法的一个实施例,延伸终止条件包括:
[0019] (1)两个连续的CpG之间的距离超过200bp;
[0020] (2)两个样本的平均甲基化水平小于二倍差异;
[0021] (3)两个样本的该区域的甲基化水平都小于20%;
[0022] (4)卡方检验的p>0.01。
[0023] 过滤条件包括:
[0024] (1)FDR<=0.05;
[0025] (2)得到的tDMR区域的平均覆盖度要大于20个reads;
[0026] (3)得到的CG位点单点的覆盖度要大于10个reads;
[0027] (4)对得到的tDMR中的CpG位点进行有放回抽样检验结果的正确率要在95%以上。
[0028] 根据本发明的检测方法的一个实施例,通过全基因组测序获得全基因组上单点甲基化信息包括:通过重亚硫酸盐使基因组的DNA中未发生甲基化的胞嘧啶脱基转变成尿嘧啶,而甲基化的胞嘧啶保持不变;对经过处理的全基因组进行测序,并且与未经处理的全基因组序列比较,确定全基因组上发生甲基化的CpG位点。
[0029] 本发明提供的检测方法,通过全基因组测序技术获得样本的全基因组上的单点甲基化信息,在全基因组测序的基础上对两个测序样本进行分析处理,可以在全基因组范围内提取tDMR;通过种子tDMR选择、种子tDMR延伸、候选tDMR过滤等步骤,提高了检测的准确度。
[0030] 本发明要解决的一个技术问题是提供一种组织特异性差异甲基化区域检测系统,实现了基于全基因组进行tDMR检测,且准确度高。
[0031] 本发明提供一种组织特异性差异甲基化区域tDMR检测系统,包括:
[0032] 甲基化信息获取模,用于通过全基因组测序获得全基因组上单点甲基化信息;
[0033] 种子区域确定模块,用于根据所述全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR;
[0034] 种子区域延伸模块,用于对所述种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR;
[0035] 候选区域过滤模块,用于基于过滤条件对所述候选tDMR进行过滤,获得tDMR结果。
[0036] 根据本发明检测系统的一个实施例,种子区域确定模块通过滑动窗口扫描所述全基因组上单点甲基化信息,基于预选条件确定全基因组上种子tDMR;其中,以5个CpG为长度、1个CpG为步长的滑动窗口来扫描所述全基因组上单点甲基化信息;预选条件包括:(1)卡方检验(结合fisher精确检验)的p<=0.05;(2)二倍甲基化水平的显著差异;和(3)至少一个样本的甲基化水平在20%以上。
[0037] 根据本发明检测系统的一个实施例,延伸终止条件包括:(1)两个连续的CpG之间的距离超过200bp;(2)两个样本的平均甲基化水平小于二倍差异;(3)两个样本的该区域的甲基化水平都小于20%;(4)卡方检验的p>0.01。过滤条件包括:(1)FDR<=0.05;(2)得到的tDMR区域的平均覆盖度要大于20个reads;(3)得到的CG位点单点的覆盖度要大于10个reads;(4)对得到的tDMR中的CpG位点进行有放回抽样检验结果的正确率要在95%以上。
[0038] 根据本发明检测系统的一个实施例,甲基化信息获取模块包括:亚硫酸氢钠处理设备,用于通过重亚硫酸盐使全基因组的DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变;全基因组比对设备,用于对经过处理的全基因组进行测序,并且与未经处理的全基因组序列比较,确定全基因组上发生甲基化的CpG位点。
[0039] 本发明提供的检测系统,甲基化信息获取模块通过全基因组测序技术获得样本的全基因组上的单点甲基化信息,后续各个模块在全基因组测序的基础上对两个测序样本进行分析处理,可以在全基因组范围内提取tDMR;通过种子区域确定模块进行种子tDMR选择、通过种子区域延伸模块进行种子tDMR延伸,通过候选区域过滤模块对候选tDMR进行过滤,提高了检测的准确度。附图说明
[0040] 图1示出本发明的组织特异性差异甲基化区域检测方法的一个实施例的流程图
[0041] 图2示出本发明的组织特异性差异甲基化区域检测方法的另一个实施例的流程图;
[0042] 图3示出本发明的组织特异性差异甲基化区域检测系统的一个实施例的框图
[0043] 图4示出本发明的组织特异性差异甲基化区域检测系统的另一个实施例的框图。

具体实施方式

[0044] 下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。在附图中,相同的标号表示相同或者相似的组件或者元素。
[0045] 图1示出本发明的组织特异性差异甲基化区域检测方法的一个实施例的流程图。
[0046] 如图1所示,在步骤102,通过全基因组测序获得样本全基因组上单点甲基化信息。例如,在第二代高通量全基因组测序基础上,通过亚硫酸氢钠测序法(Bisulfite-sequencing)(参考文献〔2〕)获得样本在全基因组上的单点甲基化信息。经过步骤102的处理后,下面步骤104至108用于提取两个样本的差异甲基化区域。
[0047] 在步骤104,根据两个样本全基因组上单点甲基化信息基于预选条件确定两个样本的全基因组上种子tDMR。
[0048] 在步骤106,对种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR。
[0049] 在步骤108,基于过滤条件对候选tDMR进行过滤,获得最终的tDMR结果。
[0050] 针对现有芯片技术检测tDMR实验方法操作复杂,成功率低,成本高等问题,上述实施例通过全基因组测序技术获得样本的全基因组上的单点甲基化信息,在全基因组测序的基础上对两个测序样本进行分析处理,可以在全基因组范围内寻找tDMR,简便、快速地从全基因组中提取出tDMR,大大提高了检测效率,降低了成本。此外,通过种子tDMR选择、种子tDMR延伸、候选tDMR过滤等步骤,提高了检测的准确度和灵敏度。
[0051] 图2示出本发明的组织特异性差异甲基化区域检测方法的另一个实施例的流程图。
[0052] 如图2所示,在步骤202,通过重亚硫酸盐使基因组的DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变。
[0053] 在步骤204,对经过处理的全基因组进行测序,并且与未经处理的全基因组序列比较,确定全基因组上发生甲基化的CpG位点。
[0054] 在步骤206,通过滑动窗口扫描所述全基因组上单点甲基化信息,基于预选条件确定全基因组上种子tDMR。
[0055] 以5个CpG为长度、1个CpG为步长的滑动窗口来扫描所述全基因组上单点甲基化信息;预选条件包括:
[0056] (1)卡方检验(结合fisher精确检验)的p<=0.05;
[0057] 当p<=0.05的时候,可以认为该区域中两两样本间的甲基化存在显著性的差异。
[0058] (2)二倍甲基化水平的显著差异;和
[0059] (3)至少一个样本的甲基化水平在20%以上;找到的tDMR区域的其中一个甲基化率需在20%以上,使所找到的区域具有生物学意义。
[0060] 在步骤208,对种子tDMR向两侧延伸获得候选tDMR,延伸终止条件为:
[0061] (1)两个连续的CpG之间的距离超过200bp;
[0062] 如果两个连续的CpG之间的距离过长,这两个CpG之间的关联性不大,所以当这种情况出现时,终止延伸,从而尽可能保证检测结果的可靠性。
[0063] (2)两个样本的平均甲基化水平小于二倍差异;
[0064] (3)两个样本的该区域的甲基化水平都小于20%;
[0065] (4)卡方检验的p>0.01。
[0066] 在步骤210,基于过滤条件对候选tDMR进行过滤,过滤条件包括:
[0067] (1)FDR(false discovery rate,错误发现率)<=0.05
[0068] (2)得到的tDMR区域的平均覆盖度要大于20个reads(read,利用新一代测序技术测序得到的具有一定读长的DNA序列)。
[0069] (3)得到的CpG位点单点的覆盖度要大于10个reads
[0070] (4)对得到的tDMR中的CpG位点进行有放回抽样检验(即从所有的CpG位点中中抽取任意一个位点,进行检验,完成后,再放回总体中参加下一次抽选的方法),结果的正确率要在95%以上。
[0071] 步骤212,通过过滤获得最终的tDMR结果。
[0072] 需要指出,上述实施例中检测CG位点,本领域的技术人员应当理解,本发明的方法同样可以适用于CHH、CHG位点,其中H表示A、C、T中任意一个。
[0073] 上述实施例中,通过大量的实验研究和创造性工作,确定具体采用了tDMR的预选条件、延伸终止条件和过滤条件,准确性高。经后续验证,通过上述方法找到的tDMR准确率在85%以上。
[0074] 图3示出本发明的组织特异性差异甲基化区域检测系统的一个实施例的框图。如图3所示,该实施例中检测系统包括甲基化信息获取模块31、种子区域确定模块32、种子区域延伸模块33和候选区域过滤模块34。其中,甲基化信息获取模块31通过全基因组测序获得全基因组上单点甲基化信息;种子区域确定模块32根据全基因组上单点甲基化信息基于预选条件确定全基因组上种子tDMR;种子区域延伸模块33对种子tDMR向两侧延伸,基于延伸终止条件获得候选tDMR;候选区域过滤模块34基于过滤条件对候选tDMR进行过滤,获得tDMR结果。
[0075] 上述实施例中,甲基化信息获取模块通过全基因组测序技术获得样本的全基因组上的单点甲基化信息,后续各个模块在全基因组测序的基础上对两个测序样本进行分析处理,可以在全基因组范围内寻找tDMR,简便、快速地从全基因组中提取出tDMR,大大提高了检测效率,降低了成本。而通过种子区域确定模块进行种子tDMR选择、通过种子区域延伸模块进行种子tDMR延伸,通过候选区域过滤模块对候选tDMR进行过滤,提高了检测的准确度和灵敏度。
[0076] 在一个实施例中,种子区域确定模块32通过滑动窗口扫描全基因组上单点甲基化信息,基于预选条件确定全基因组上种子tDMR;其中,以5个CpG为长度、1个CpG为步长的滑动窗口来扫描所述全基因组上单点甲基化信息;预选条件包括:(1)卡方检验(结合fisher精确检验)的p<=0.05;(2)二倍甲基化水平的显著差异;(3)至少一个样本的甲基化水平在20%以上。根据本发明的检测系统的一个实施例,上述延伸终止条件包括:两个连续的CpG之间的距离超过200bp;两个样本的平均甲基化水平小于二倍差异;两个样本的该区域的甲基化水平都小于20%;卡方检验的p>0.01。根据本发明的检测系统的一个实施例,过滤条件包括:FDR<=0.05;得到的tDMR区域的平均覆盖度要大于20个reads;得到的CG位点单点的覆盖度要大于10个reads;对得到的tDMR中的CpG位点进行有放回抽样检验结果的正确率要在95%以上。
[0077] 上述实施例中,通过大量的实验研究和创造性工作,确定具体采用了tDMR的预选条件、延伸终止条件和过滤条件,准确性高。经后续验证,通过上述方法找到的tDMR准确率在85%以上。
[0078] 图4示出本发明的组织特异性差异甲基化区域检测系统的另一个实施例的框图。图4中和图3具有相同标号的模块可以参见图3中的对应描述,为简洁起见,在此不再详细描述。和图3相比,图4中的甲基化信息获取模块41包括亚硫酸氢钠处理设备411和全基因组比对设备412。其中,亚硫酸氢钠处理设备411通过重亚硫酸盐使全基因组的DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变;全基因组比对设备412对经过处理的全基因组进行测序,并且与未经处理的全基因组序列比较,确定全基因组上发生甲基化的CpG位点。
[0079] 上述实施例中,亚硫酸氢钠处理设备以重亚硫酸盐使DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变;全基因组比对设备对经过处理的全基因组进行测序,并且与未经处理的序列比较,判断是否CpG位点发生甲基化,能明确基因组上每一个CpG位点的甲基化状态,有很高的可靠性和精确度。
[0080] 经过在多物种中验证(不仅限于哺乳动物),本发明的方法和系统较Vardhman Rakyan等的方法有更高的精确度和敏感度,有很高的可靠性和精确度。
[0081] 下面介绍本发明的一个应用例
[0082] 在该应用例中所用的样本数据为纤维细胞imr90及YH一号的fasta数据。成纤维细胞imr90及YH一号的fasta数据下载地址分别为:
[0083] imr90:http://neomorph.salk.edu/human_methylome/data.html[0084] YH:http://www.ncbi.nlm.nih.gov/Traces/wgs/?val=ADDF
[0085] 在该应用例中,将技术方案中的多个处理步骤通过软件实现,软件的运行环境可以是Unix/Linux操作系统,通过Unix/Linux命令行运行该软件。在下面的描述同时提供软件运行的命令行参数。
[0086] 首先进行数据准备处理。数据下载后经过比对、去重复、提取甲基化信息等步骤处理,得到YH和imr90的cout文件(记录胞嘧啶C位点的甲基化情况的文件),提取tDMR的样本输入文件即为这两个cout文件。需要指出,本发明的方法可以用于任何能够得到cout文件的物种,并不限于实施例中列举的内容,所以应用范围极广。
[0087] Cout文件的具体格式如下:
[0088]
[0089] 表1
[0090] 第一步:选取种子tDMR
[0091] 以5个CpG为长度、1个CpG为步长的滑动窗口来扫描两个样本文件count文件中包含的全基因组上单点甲基化信息;预选条件为:(1)卡方检验(结合fisher精确检验)的p<=0.05;(2)二倍甲基化水平的显著差异;和(3)至少一个样本的甲基化水平在20%以上。
[0092] 计算机命令行参数为:
[0093] ″ ./tdmr slide-c CG YH.cout/chr$i.cout imr90.cout/chr$i.cout >outfile/CG/chr$i.CG;echo slide done;
[0094] 参数-c代表要寻找的胞嘧啶C的形式。通常有三种情况可选:CG、CHH、CHG,此处研究的是CpG位点,所以在这里选择CG。
[0095] 输出结果:共得到916949个tDMR的种子
[0096] 输出结果文件格式如下:
[0097]
[0098] 表2
[0099] 在上述步骤中,可以在全基因组上分染色体并行寻找tDMR的种子,从而可以减少运算时间,提高效率。
[0100] 第二步:种子tDMR的双向延伸
[0101] 对种子tDMR向两侧延伸获得候选tDMR,延伸终止条件为:(1)两个连续的CpG之间的距离超过200bp;(2)两个样本的平均甲基化水平小于二倍差异;(3)两个样本的该区域的甲基化水平都小于20%;(4)卡方检验的p>0.01。
[0102] 计算机命令行参数为:
[0103] ./tdmr extend-t 8-c CG YH.cout/chr$i.cout imr90.cout/chr$i.coutoutfile/CG/chr$i.CG>outfile/CG/chr$i.CG.ext;echo extend done;
[0104] 参数-t代表在程序运行的时候,所要用到的CPU个数,
[0105] 参数-c代表胞嘧啶C的形式(有三种可选,CG、CHH、CHG,在这里选取CG)。
[0106] 输出结果:经过延伸后的tDMR共279004个
[0107] 输出文件格式的前10列如下:
[0108]
[0109] 表3
[0110] 后8列如下:
[0111]
[0112] 表4
[0113] 第三步:对候选tDMR进行过滤
[0114] 基于过滤条件对候选tDMR进行过滤,过滤条件包括:(1)FDR<=0.05;(2)得到的tDMR区域的平均覆盖度要大于20个reads;(3)得到的CG位点单点的覆盖度要大于10个reads;(4)对得到的tDMR中的CpG位点进行有放回抽样检验结果的正确率要在95%以上。
[0115] 利用linux下的命令完成对tDMR进行过滤:
[0116] sort-k 2-n outfile/CG/chr$i.CG.ext |awk′\$16>0.95{a=\$1;for(i=2;i<16;i++){a=a\″\t\″\$i}{print a}}′|uniq>outfile/CG/chr$i.CG.ext.filter;echo filter done″
[0117] 输出结果:经过过滤最后共得到36924个tDMR。经tDMR和基因表达关系的相关性验证,即将所有在tDMR中出现的基因找到,运用信息分析方法,找到基因表达量和甲基化率的关系是否与已知的关系相同,统计即可。本方法找到的tDMR准确率可在85%以上。
[0118] 共15列:
[0119] 输出文件格式的前8列如下:
[0120]
[0121] 表5
[0122] 后7列如下:
[0123]
[0124] 表6
[0125] 在上述应用例中,确定了全基因组上每一个CpG位点的甲基化状态,在此基础上开发的tDMR软件能够从全基因组水平上对两个测序样本进行分析,简单、快速的找出组织间差异甲基化区域,大大提高了检测效率,降低了成本。上述处理在全基因组上可以分染色体并行运行,从而提高速度和效率,本发明在全基因组上分染色体并行运行,可以进一步提高速度和效率,速度快,效率高。
[0126] 本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈