专利汇可以提供一种将多个重叠组装结果合并的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种将多个重叠组装结果合并的方法,其特征在于,包括以下步骤:获得多个重叠组装结果;根据所述多个重叠组装结果的数据特征确定前景和背景;将所述前景与所述背景进行比对,得到比对结果;根据所述比对结果,将所述前景与所述背景合并,即得到合并后的重叠组装结果。通过本发明的方法,可大大提高组装过程中的连接效率,并在一定程度上提高连接准确率,并且本发明的可以广泛适用于 微 生物 、动物、 植物 的基因组辅助组装,其运行速度也比同类方法和 软件 更快。,下面是一种将多个重叠组装结果合并的方法专利的具体信息内容。
1.一种将多个重叠组装结果合并的方法,其特征在于,包括以下步骤:
S1:获得多个重叠组装结果,所述重叠组装结果为至少三个;
S2:根据所述多个重叠组装结果的数据特征确定前景和背景,将所述重叠组装结果中的一个确定为所述前景,将其余重叠组装结果确定为背景,并根据所述多个背景的数据特征确定每个所述背景与所述前景的合并顺序,按所述合并顺序,将所述前景依次与相应的背景进行比对、合并,每次合并后的重叠组装结果作为下一次比对、合并的前景,通过以下方法确定所述前景、背景和合并顺序:将所述多个重叠组装结果中碱基水平一致性最高的重叠组装结果作为前景,其他重叠组装结果作为背景,按照N50长度从小到大的顺序与所述前景合并,当多个背景N50相等时,按所述背景中的序列数量从小到大的顺序将所述多个背景依次与所述前景合并;
S3:将所述前景与所述背景进行比对,得到比对结果;
S4:根据所述比对结果,将所述前景与所述背景合并,即得到合并后的重叠组装结果。
2.根据权利要求1所述的方法,其特征在于,S3包括以下步骤:
S31:将所述前景比对到所述背景;
S32:对前景中同一条读序的比对进行聚类和处理,选取总比对长度最长的一类作为最终比对,合并离散比对,得到所述比对结果。
3.根据权利要求2所述的方法,其特征在于,S32中聚类的前后还分别进行了一次过滤。
4.根据权利要求3所述的方法,其特征在于,S32中,聚类前的过滤剔除比对长度小于
20-100bp的比对,剔除比对长度占自身比对长度的比例小于0.05-0.2的比对,并且剔除比对一致性低于85-95%的比对;聚类后的过滤剔除比对长度占自身比对长度的比例小于
0.7-0.9的比对。
5.根据权利要求1所述的方法,其特征在于,S4包括以下步骤:
S41:对所述比对结果中有关联的序列构建有向无环图,选择最长路径处理分枝;
S42:根据所述最长路径连接序列,根据所述比对结果中的比对位置信息回填所述前景序列中的gap区域,或延伸序列首尾,得到合并后的重叠组装结果。
6.根据权利要求5所述的方法,其特征在于,S42包括以下步骤:
S421:根据所述比对结果中的比对位置信息,找到大致的比对区域;
S422:截取所述大致比对区域进行精细比对,确定精确的比对边界。
7.根据权利要求1-6中任一项所述的方法,其特征在于,在S4后,还包括步骤S5:评估所述合并后的重叠组装结果的可靠性。
8.根据权利要求7所述的方法,其特征在于,S5中根据所述前景与背景的一致性来评估所述合并后的重叠组装结果是否可靠;
所述一致性为除背景两端位置外,前景完整比对到背景的比例,当一致性大于95%时,认为所述合并后的重叠组装结果可靠。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
杀真菌组合物 | 2020-05-08 | 661 |
美洲黑杨的促雌基因FERR和抑雌基因FERR-R及其应用 | 2020-05-08 | 963 |
乙烯利在促进白僵菌产孢中的应用 | 2020-05-08 | 971 |
一种微波高温裂解植物油的方法 | 2020-05-11 | 295 |
检测平菇中吲哚乙酸含量的方法 | 2020-05-08 | 611 |
一种天然植物染料腈纶纤维染色方法 | 2020-05-08 | 142 |
碳-碳环合酶及其编码基因与应用 | 2020-05-08 | 855 |
一种植物DNA的快速提取方法 | 2020-05-08 | 876 |
用于树脂提取的设备和方法 | 2020-05-08 | 525 |
一种保温防水绿化种植预制墙板屋顶面板及其制备方法 | 2020-05-08 | 30 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。