首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 国际申请 / 说明书 / 序列表 / 用于自动染色体分类的方法和系统

用于自动染色体分类的方法和系统

阅读:678发布:2023-02-07

专利汇可以提供用于自动染色体分类的方法和系统专利检索,专利查询,专利分析的服务。并且公开了用于自动 染色 体分类的方法和系统。该系统,可替代地称为残差卷积递归注意 力 神经网络(Res-CRANN),利用染色体带的带序列的特性进行染色体分类。Res-CRANN是端到端可训练系统,其中从由残差神经网络(ResNet)的卷积层产生的特征图中提取 特征向量 序列,其中特征向量对应于表示染色体图像中的染色体带的视觉特征。将序列特征向量馈送到利用注意力机制增强的 递归神经网络 (RNN)。RNN学习特征向量序列,并且注意力模 块 集中于特征向量序列的多个感兴趣区域(ROI),其中ROI特异于染色体的类别标签。与 现有技术 的染色体分类方法相比,Res-CRANN提供更高的分类准确度。,下面是用于自动染色体分类的方法和系统专利的具体信息内容。

1.一种用于染色体分类的处理器实现的方法,所述方法包括:
经由一个或多个硬件处理器接收包括具有多个染色体带的染色体的染色体图像(202);
经由一个或多个硬件处理器,通过生成具有维度GxHxK的多个特征图,来提取与所述染色体的所述染色体带相关联的视觉特征(204);
经由一个或多个硬件处理器,通过对所述多个特征图施加平切分,从所述多个特征图获得多个特征向量,其中每个特征向量Fg维度为H*K(206);
经由一个或多个硬件处理器,在所述多个染色体带中从顶部染色体带到底部染色体带依次序接所述多个特征向量以生成特征序列(Si=GxH*K)(208);以及
经由一个或多个硬件处理器,通过使用利用注意机制增强的递归神经网络(RNN)处理所述特征序列,将所述染色体分类为多个预确定的染色体类别标签中的类别标签,其中所述RNN学习所述特征序列并且所述注意力机制集中于所述特征序列的多个感兴趣区域(ROI),其中ROI特异于染色体的类别标签(210)。
2.根据权利要求1所述的方法,其中,将所述染色体分类还包括利用softmax层,所述softmax层向所述特征序列分配唯一的类别标签。
3.根据权利要求1所述的方法,其中,通过提取所述染色体的所述视觉特征生成所述多个特征图的步骤是使用残差神经网络(ResNet)-50来进行的,其中每个特征图是对应染色体的数学表示。
4.根据权利要求1所述的方法,其中,如同在文本序列中从左到右读取字符,从所述顶部染色体带到所述底部染色体带读取所述染色体图像的所述多个染色体带。
5.根据权利要求1所述的方法,其中,所述注意力机制是包括基于神经网络的学习机制的注意力模,其中所述基于神经网络的学习机制以高分辨率聚焦于所述染色体图像的所述ROI,同时以低分辨率感知所述染色体图像的邻近区域。
6.一种系统(100),包括:
一个或多个数据存储设备(104),可操作地耦合到一个或多个硬件处理器(102),并且被配置为存储指令,所述指令被配置为由所述一个或多个硬件处理器执行以:
接收包括具有多个染色体带的染色体的染色体图像;
通过生成具有维度GxHxK的多个特征图,来提取与所述染色体的所述染色体带相关联的视觉特征;
通过对所述多个特征图施加水平切分,从所述多个特征图获得多个特征向量,其中每个特征向量Fg维度为H*K;
在所述多个染色体带中从顶部染色体带到底部染色体带依次序接所述多个特征向量以生成特征序列(Si=GxH*K);并且
通过使用利用注意力机制增强的递归神经网络(RNN)处理所述特征序列,将所述染色体分类为多个预确定的染色体类别标签中的类别标签,其中RNN学习所述特征序列并且所述注意力机制集中于所述特征序列的多个感兴趣区域(ROI),其中ROI特异于染色体的类别标签。
7.根据权利要求6所述的系统(100),其中,所述系统(100)还被配置为:
利用softmax层分类所述染色体,所述softmax层向所述特征序列分配唯一的类别标签;以及
通过提取所述染色体的所述视觉特征生成所述多个特征图,是使用残差神经网络(ResNet)-50来进行的,其中每个特征图是对应染色体的数学表示。
8.根据权利要求6所述的系统(100),其中,所述系统(100)被配置为如同在文本序列中从左到右读取字符,从所述顶部染色体带到所述底部染色体带读取所述染色体图像的所述多个染色体带。
9.根据权利要求6所述的系统(100),其中,所述系统(100)的所述注意力机制是包括基于神经网络的学习机制的注意力模块,其中所述基于神经网络的学习机制以高分辨率聚焦于所述染色体图像的所述ROI,同时以低分辨率感知所述染色体图像的邻近区域。
10.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质存储指令,所述指令,当被硬件处理器执行时,使所述硬件处理器进行包括以下的动作:
接收包括具有多个染色体带的染色体的染色体图像;
通过生成具有维度GxHxK的多个特征图,来提取与所述染色体的所述染色体带相关联的视觉特征;
通过对所述多个特征图施加水平切分,从所述多个特征图获得多个特征向量,其中每个特征向量Fg维度为H*K;
在所述多个染色体带中从顶部染色体带到底部染色体带依次序接所述多个特征向量以生成特征序列(Si=GxH*K);以及
通过使用利用注意力机制增强的递归神经网络(RNN)处理所述特征序列,将所述染色体分类为多个预确定的染色体类别标签中的类别标签,其中RNN学习所述特征序列并且所述注意力机制集中于所述特征序列的多个感兴趣区域(ROI),其中ROI特异于染色体的类别标签。

说明书全文

用于自动染色体分类的方法和系统

[0001] 要求优先权
[0002] 该申请要求于2018年7月6日向印度提交的申请no.201821025353的优先权,其全部内容通过引用并入本文。

技术领域

[0003] 本文的公开内容总体涉及分类问题,并且更具体地,涉及用于自动染色体分类的系统和方法。

背景技术

[0004] 染色体核型分型/染色体核型分析(Chromosome Karyotyping)指的是分割和分类从在细胞分裂的中期阶段期间微拍摄的染色细胞图像获得的单个染色体图像的任务。核型分型的图像可用于诊断遗传性疾患,诸如唐氏综合症,特纳综合征和某些类型的癌症。通常,花费大量的人和时间来分割和分类单个染色体图像。自动染色体分类取得了相当大的发展。
[0005] 然而,现有的自动染色体分类方法利用长度、着丝粒和带谱作为染色体的特征来对染色体进行分类。最近,深度学习模型已被应用于自动执行此任务。在染色体分类中,准确度在尝试实现时间效率时至关重要。发明内容
[0006] 本公开的实施方式作为针对本发明人在传统系统中认识到的一个或多个上述技术问题的解决方案呈现了技术进步。
[0007] 在一方面,提供了一种用于自动染色体分类的处理器实现的方法。该方法包括接收包括具有多个染色体带的染色体的染色体图像;通过生成具有维度GxHxK的多个特征图来提取与染色体的染色体带相关联的视觉特征;通过对多个特征图施加平切分,从多个特征图获得多个特征向量,其中每个特征向量Fg维度为H*K;在多个染色体带中从顶部染色体带至底部染色体带序接多个特征向量以生成特征序列(Si=GxH*K);以及通过使用利用注意力机制增强的递归神经网络(RNN)处理特征序列,将染色体分类为多个预确定的染色体类别标签中的类别标签,其中RNN学习特征序列并且注意力机制集中在特征序列的多个感兴趣区域(ROI)上,其中ROI特异于染色体的类别标签。对染色体进行分类还包括利用softmax层,其为特征序列分配唯一的类别标签。
[0008] 在另一方面,提供了一种系统,包括:一个或多个数据存储设备,可操作地耦合到一个或多个处理器,并且被配置为存储指令,所述指令被配置为由所述一个或多个处理器执行以接收包括具有多个染色体带的染色体的染色体图像;通过生成具有维度GxHxK的多个特征图,提取与染色体的染色体带相关联的视觉特征;通过对多个特征图施加水平切分,从所述多个特征图获得多个特征向量,其中每个特征向量Fg的维度为H*K;在多个染色体带中从顶部染色体带至底部染色体带序接多个特征向量以生成特征序列(Si=GxH*K);以及通过使用利用注意力机制增强的递归神经网络(RNN)处理特征序列,将染色体分类为多个预确定的染色体类别标签中的类别标签,其中RNN学习特征序列并且注意力机制集中在特征序列的多个感兴趣区域(ROI)上,其中ROI特异于染色体的类别标签。此外,对染色体进行分类还包括利用softmax层,其为特征序列分配唯一的类别标签。
[0009] 在又一方面,提供了一种计算机程序产品,包括非暂时性计算机可读介质,其具有包含在其中的计算机可读程序,其中,当在计算设备上执行时,计算机可读程序使计算设备进行包括以下的动作:接收包括具有多个染色体带的染色体的染色体图像;通过生成具有维度GxHxK的多个特征图来提取与染色体的染色体带相关联的视觉特征;通过对多个特征图施加水平切分,从多个特征图获得多个特征向量,其中每个特征向量Fg的维度为H*K;在多个染色体带中从顶部染色体带至底部染色体带序接多个特征向量以生成特征序列(Si=GxH*K);以及通过使用利用注意力机制增强的递归神经网络(RNN)处理特征序列,将染色体分类为多个预确定的染色体类别标签中的类别标签,其中RNN学习特征序列并且注意力机制集中在特征序列的多个感兴趣区域(ROI)上,其中ROI特异于染色体的类别标签。对染色体进行分类还包括利用softmax层,其为特征序列分配唯一的类别标签。
[0010] 应当理解,前面的一般性描述和下面的详细描述都只是示例性和说明性的,并不是对所要求保护的本发明的限制。附图说明
[0011] 包含在本公开中并构成本公开的一部分的随附附图示出了示例性实施方式,并且与说明书一起用于解释所公开的原理。
[0012] 图1示出了根据本公开的实施方式的用于自动染色体分类的系统。
[0013] 图2示出了根据本公开的实施方式的自动染色体分类的计算机实现的方法的示例性流程图
[0014] 图3(a)和3(b)示出了根据本公开的实施方式的基于染色体特征的核型分型的染色体。
[0015] 图4示出了根据本公开的实施方式的使用各种途径进行染色体分类的比较分析。

具体实施方式

[0016] 参考随附附图描述示例性实施方式。在图中,附图标记的最左边的数字(一个或多个)标识首次出现该附图标记的图。方便起见,在整个附图中使用相同的附图标记来表示相同或相似的部分。虽然本文描述了所公开原理的示例和特征,但是可以进行修改、改编和其他实现,而不脱离所公开实施方式的精神和范围。旨在将以下详细描述视为仅是示例性的,其真实范围和精神由所附权利要求指示。
[0017] 本文的实施方式提供了用于自动染色体分类的方法和系统。该系统,可替代地称为残差卷积递归注意力神经网络(Res-CRANN),利用染色体图像的带序列的特性进行染色体分类。Res-CRANN是端到端可训练系统,其中从由残差神经网络(ResNet)的卷积层产生的特征图中提取特征向量序列,可替代地称为特征序列,其中特征向量对应于表示染色体图像中的染色体带的视觉特征。特征向量序列被馈送到利用注意力机制增强的递归神经网络(RNN)。RNN学习特征向量序列,并且注意力模集中于特征向量序列的多个感兴趣区域(ROI),其中ROI特异于染色体的类别标签。与现有技术的染色体分类方法相比,Res-CRANN提供更高的分类准确度。
[0018] 现在参考附图,更具体地说,参考图1至图4,其中,类似的附图标记在整个图中始终表示对应的特征,示出了优选实施方式,并且这些实施方式在以下示例性系统和/或方法的上下文中描述。
[0019] 图1示出了根据本公开的实施方式的用于自动染色体分类的系统。在实施方式中,系统100包括一个或多个处理器102,通信接口设备或输入/输出(I/O)接口(一个或多个)106,以及可操作地耦合到一个或多个处理器102的一个或多个数据存储设备或存储器104。
作为硬件处理器的一个或多个处理器102可以实现为一个或多个微处理器、微计算机、微控制器、数字信号处理器、中央处理单元、状态机、图形控制器、逻辑电路和/或基于操作指令操纵信号的任何设备。在其他能力方面,处理器(一个或多个)被配置为获取并执行存储在存储器中的计算机可读指令。在本公开的上下文中,表达“处理器”和“硬件处理器”可以互换使用。在实施方式中,系统100可以以各种计算系统实现,例如膝上型计算机、笔记本、手持设备、工作站、大型计算机、服务器、网络等。
[0020] I/O接口(一个或多个)106可以包括各种软件和硬件接口,例如,web接口、图形用户接口等,并且可以促进各种各样网络N/W和协议类型中的多种通信,包括有线网络,例如LAN、线缆等,以及无线网络,诸如WLAN、蜂窝或卫星。在实施方式中,I/O接口(一个或多个)可以包括一个或多个端口,用于将多个设备彼此连接或连接到另一个服务器。
[0021] 存储器104可以包括本领域中已知的任何计算机可读介质,包括例如易失性存储器,诸如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM),和/或非易失性存储器,诸如只读存储器(ROM)、可擦除可编程ROM、闪存、硬盘、光盘和磁带。在实施方式中,系统100的一个或多个模块(诸如染色体分类模块108)可以存储在存储器102中。
[0022] 图2示出了根据本公开的实施方式的自动染色体分类的计算机实现的方法的示例性流程图。在实施方式中,系统100包括可操作地耦合到一个或多个处理器102的一个或多个数据存储设备或存储器104,并且被配置为存储指令,该指令被配置为由一个或多个处理器104执行方法200的步骤。现在将参考图1的系统100的部件详细解释方法200的步骤。尽管可以按先后顺序描述处理步骤、方法步骤、技术等,但是这样的处理、方法和技术可以被配置为以交替顺序工作。换句话说,可以描述的步骤的任何序列或顺序不一定表示要求以该顺序进行该步骤。本文描述的过程的步骤可以以任何实际的顺序进行。此外,可以同时进行一些步骤。
[0023] 染色体具有有特点和唯一的亮色和暗色带的序列(带型),如图3(a)所示,其有助于在不同的染色体类别或类别标签之间做区分,诸如染色体1至22,x和y。核型分型的染色体类别标签描绘于图3(b)中。可互换地称为染色体带的带的位置和大小是高度染色体特异性的。带或带型或带序列提供了细分染色体的各个区域的有用方式,并且每个带被分配了特定数字,用户(诸如医生)利用该特定数字将标签分配给特定染色体。然而,传统的深度CNN(DCNN)不能利用这一特点,因为它们主要集中在学习图像特征上,并且因此不能直接应用于学习序列预测。方法200提供了一种架构,通过采用递归神经网络(RNN)明确地学习这些带的出现序列,RNN可以处理不同长度的序列数据,诸如文本或语音。所公开的系统(Res-CRANN)通过从顶部到底部(多个染色体带中从顶部染色体带到底部染色体带)水平地读取染色体图像,包含该带序列特性。而且,现有方法不能提供非常高的染色体分类准确度。分析医学图像时,分析在用于诊断时需要高度准确。正确的诊断对于治疗患者至关重要,特别是在诸如癌症或基因疾患等严重疾病中,染色体核型分型在其中起主要作用。因此,实现所提出的方法和系统100的更高准确度淘汰了自动染色体分类中的当前现有技术。此外,考虑到染色体图像的典型实例,其中捕获的染色体具有非常小的尺寸(几微米),从染色体图像中提取准确的视觉特征是一个挑战。所公开的方法能够提取染色体的视觉特征,以基于视觉特征准确地对染色体进行分类。
[0024] 在实施方式中,方法200利用长短期记忆网络(LSTM),其是特殊类型的RNN,用于使用机制对数据中的长期依赖性建模。方法200公开了DCNN和LSTM的组合,用于以与卷积递归神经网络(CRNN)已经应用于文本识别的类似方式识别染色体图像中的带序列。存在大量关于文本识别的文献,但是还没有探索过读取染色体的带序列用于分类目的,其涉及通过卷积操作以数学形式表示染色体图像,并且随后将该数学表示转换为要被馈送到LSTM中的特征向量序列。学习染色体中亮带和暗带序列的过程类似于在基于图像的文本序列识别任务中逐个读取字符。因此,方法200使得能够通过由ResNet的卷积层产生的特征图的水平或行方式序接来提取特征向量序列,并将该序列馈送到LSTM。此外,注意力机制增强了LSTM,其使得RNN能够关注输入染色体图像或序列的相关感兴趣区域(ROI)。在LSTM之后加入注意力机制,因为在染色体带序列中存在表示特定染色体类别的特定区域/子序列。因此,包括基于神经网络的注意力模块的注意力机制使得RNN网络能够学习关注该特定感兴趣区域(ROI),从而有效地提高分类准确度。
[0025] 系统100包括染色体分类模块108,其是基于深度注意力的CRNN模型,底部DCNN被50层ResNet模型取代,随后是LSTM,其输出序列通过注意力机制。该系统100网络架构被称为残差卷积递归注意力神经网络(Res-CRANN)。下面描述基于Res-CRANN架构及其功能的染色体分类模块108的每个部件或块。
[0026] 残差神经网络(ResNets):Res-Nets非常吸引人,并且证明在各种视觉和非视觉任务中都非常强大。Res-Nets利用深度残差学习框架,其使更深层神经网络的训练更容易。该残差框架通过快捷连接(shortcut connection)替换卷积层的块以形成快捷块,也称为残差块。残差块可以表示为下面的式1:
[0027] y=F(x,{Wi})+x  (1)
[0028] 其中,x和y是残差块输入和输出且函数F(x,{Wi})表示要学习的残差映射。残差块试图建模一个更接近身份映射而不是零映射的最优函数,并且应该更容易参考身份映射而不是零映射来找到扰动。这简化了ResNets的优化,几乎不需要任何成本。因此,ResNets中的后续残差块负责微调前一个块的输出,而不是从头开始生成所需的输出。这些残差连接的主要特性是它们既不引入额外的参数也不增加计算复杂性。残差块被堆叠并且残差映射有助于处理更深网络中的消失梯度问题,这使得优化变得容易并且因此导致训练效率的提高。ResNets具有多个版本的架构,表示为m层ResNet模型,其中m是对应架构中的层数,并且可以采用f50、101、152g中的值。
[0029] 卷积递归神经网络(CRNN):CRNN是深度卷积神经网络(DCNN)和递归神经网络(RNN)的组合,其架构主要设计于识别图像中的序列样对象,本文中是染色体中的带序列。CRNN的传统架构涉及从底部到顶部的卷积层、递归层和转录层(transcription layer)。然而,用系统100实现的方法200用softmax层替换转录层以用于分类任务。转录层为文本序列中的每个字符分配标签,而系统100利用softmax层将一个类别标签分配给整个带序列用于染色体分类。CRNN架构中基础DCNN的卷积层采用图像,可替代地称为染色体图像作为输入并产生对应的特征图。然后使用这些特征图来提取特征向量序列,其中通过从顶部到底部序接多行滤波图来生成每个特征向量。随后,该特征向量序列(特征序列)被馈送到递归神经网络,在实施方式中为长短期记忆网络(LSTM),其为特征序列的每个产生标签。顶部处的softmax层将LSTM的每帧预测转换为类别标签序列。包括染色体分类模块的整个系统100通过使用联合训练组成网络(即DCNN和LSTM)二者的单个损失函数进行端对端训练。
[0030] 基于注意力的序列学习:神经网络中的注意力机制基于人类中发现的视觉注意力机制。当人看到图像时,他的视觉注意力可归结为以高分辨率聚焦于图像中的特定感兴趣区域,同时以低分辨率感知该图像的周围区域,并且然后他随时间不断调整其焦点。这种注意力机制,通常在长序列的情况下,利用注意力使网络学习专注于这些序列的特定感兴趣区域(ROI)。神经网络中的注意力机制减少了训练网络所需的参数数目,并且还避免了过度拟合的可能性。
[0031] 在本公开的实施方式中,在步骤202,结合染色体分类模块108的一个或多个处理器102被配置为接收包括具有多个染色体带的染色体的染色体图像。染色体核型分型是一个两阶段过程:第一阶段是细胞分裂中期阶段期间细胞扩散图像的分割,并且第二阶段是单个染色体片段或单个染色体的分类。在本文中,假设系统100接收分割和拉直的单个染色体(归一化染色体),其必须被分类到用于核型分型的正确类别标签。归一化可以通过本领域已知的方法进行。
[0032] 完整的网络进行端到端训练,并且完全连接的softmax层在输出端处自动为被分析的染色体图像提供类别标签。在步骤204,结合染色体分类模块108的一个或多个处理器102被配置为通过生成用于染色体的多个特征图(GxHxK)来提取与染色体的染色体带相关联的视觉特征。在实施方式中,Res-CRANN的底部是50层ResNet模型,其产生特征图作为卷积层的结果。为了提取可视卷积特征图,可以使用任何深度卷积网络,如CNN、ResNet、inception、xception,包括ResNet的变体,诸如ResNet-50、ResNet-101和ResNet-152等。在步骤206,结合染色体分类模块108的一个或多个处理器102被配置为通过使用对多个特征图的水平和竖直切分之一从多个特征图中获得多个特征向量(H*K)。在步骤208,结合染色体分类模块108的一个或多个处理器102被配置为从顶部到底部序接多个特征向量,以生成特征序列(GxH*K)或特征向量序列。然后,通过序接每个特征图的水平向量,将这些特征图以与CRNN类似的方式转换为特征序列,其数学解释如下所述:
[0033]
[0034] 其中,Fg是从ResNet卷积特征图获得的维数H*K的特征向量,fgk是第k个滤波图的第g个水平向量,i表示第i个图像,而K是滤波图的总数。第i个图像的最终特征序列Si由下式给出:
[0035] Si=[Fi1,Fi2,.....,FiG]GxHxK  (3)
[0036] 其中,G和H是从ResNet-50模型的最顶部卷积层获得的特征图的高度和宽度。
[0037] 在步骤210,结合染色体分类模块108的一个或多个处理器102被配置为使用利用注意力机制增强的递归神经网络(RNN)来处理特征向量的特征序列,以将染色体分类为多个预确定的染色体类别标签中的类别标签,其中RNN学习特征序列,并且注意力机制集中于特征向量序列的多个感兴趣区域(ROI),其中ROI特异于染色体的类别标签。在实施方式中,特征序列Si然后通过LSTM(一种RNN),其学习预测带序列。随后,LSTM输出被馈送到注意力块,其学习序列中每个特征向量的注意力权重,如下所述:
[0038] 令M为由M=[m1,m2,…mN]给出的矩阵,其中mi表示LSTM产生的输出向量序列,并且N是序列的长度。注意力块的输出表示R是这些向量的加权和,其定义为:
[0039] L=tanh(M)  (4)
[0040] α=softmax(wTL)  (5)
[0041] R=MαT  (6)
[0042] 其中,w是注意力块要学习的权重。
[0043] 用于分类的最终表示r如下给出:
[0044] r=tanh(R)  (7)
[0045] 然后,从注意力机制产生的表示r通过具有softmax激活的完全连接层,其将图像分类为其对应的类别标签。
[0046] 实验评估
[0047] 用于实验评估的数据集:Res-CRANN的评估性能在Bioimage染色体分类数据集(Bioimage Chromosome Classification dataset)上进行,其可在线公开获得。该数据集由健康患者的总共5256个染色体图像组成,这些图像由专业的细胞遗传学家手动分割和分类,以便创建带标签的数据集。在这5256个图像中,我们使用4176个进行训练,使用360个进行验证,使用720个进行测试目的。为了进行实验,将染色体图像的分辨率设置为灰度级的224×224。另外,实施对数据集中的每个染色体图像进行长度归一化的预处理步骤。
[0048] 训练细节:用于比较所公开方法的性能的第一基线方法由传统的深度CNN组成(表1的第1行)。
[0049] 表I:比较分类结果
[0050]
[0051] 深度CNN模型使用Adam优化器训练,学习率为10-4,其余参数具有默认值。第二基线使用ResNet-50模型(表1的第2行)创建,其使用随机梯度下降训练,学习率为10-3,动量项为10-6,衰减参数设置为0:9,且nestrov设置为真。此外,使用Adam优化器训练表1的第3、4、5行中呈现的网络,学习率为10-4,epsilon设置为10-8,而其余参数设置为默认值。该CRNN模型(表1的第3行)包括ResNet-50和LSTM模型的序接,而基于注意力的序列模型(表1的第4行)由在ResNet-50模型上增加注意力块组成。训练深度CNN、ResNet-50、CRNN、基于注意力的模型和Res-CRANN的时期(epoch)数分别设定为150、30、100、80和80。在每个时期观察验证结果并跟踪对应于最低验证损失的模型参数,其随后用于测试。所有网络都使用Theano和Keras实现。表1示出了使用Res-CRANN架构和基线方法获得的经验结果。评估k设置为1、3和
5的top-k分类准确度百分比。传统的深度CNN模型的性能在表1的第1行中示出。它由6个卷积层组成,分别为16、16、32、64、128和256个滤波器,后面是2个完全连接的1024和512维的层。每个卷积层使用整流线性单位(ReLU),并且然后是大小为2x2的最大池层。在所有卷积层中使用的是3x3内核大小的滤波器。完全连接的层具有S形函数作为其激活函数。最后一层也是完全连接的softmax层,具有24个隐藏单元,用于24个染色体类别,具有softmax激活函数。如表1的第1行和第2行所示,与深度CNN相比,ResNet-50模型的性能得到改善,这促使我们在CRNN架构中使用ResNet-50。随后,表1的第3行表示CRNN模型的性能,该模型由如上所述的结合LSTM的ResNet-50模型组成。
[0052] 与ResNet-50和深度CNN模型相比,Res-CRANN在Top-1分类准确度方面分别绝对提高了2.63%和2.77%。这种改进表明单独使用卷积神经网络不能完全学习染色体带序列。因此,使用CRNN模型中的递归神经网络明确地包含序列信息,这提高了染色体分类的准确度。接下来,表1的第4行显示了基于注意力的序列模型的结果,其是注意力块对ResNet-50模型的增强,与CRNN模型的性能相当,同时优于两种基线方法。这种改进是学习注意力区域定位和分类之间关系的结果。在表1中,第5行显示了我们提出的方法的性能,即Res-CRANN模型,对于染色体分类,其实现了90.42%的Top-1分类准确度,优于先前现有技术的算法
此外,与其余模型相比,Res-CRANN模型的top-3和top-5分类准确度也最高。这表明所有三个主要层,即卷积层,递归层和注意力层有助于改善染色体分类的性能。
[0053] 此外,观察由不同网络架构,例如ResNet-50、CRNN、基于注意力的CRNN模型和Res-CRANN产生的一些染色体的显著图,如图4所示。使用用于生成显著图的keras-vis库。ResNet-50产生伴随染色体区域的不需要的噪声,并且因此影响该网络的分类准确度。然而,当我们用递归层和注意力机制(Res-CRANN)增强ResNet-50时,网络试图仅关注染色体图像区域,忽略背景。这通过图4中所示的精细显著图显而易见,其中仅突出显示感兴趣的区域,即染色体和带序列。这种可视化证明了Res-CRANN架构相对于其他网络对于染色体分类的改进性能。
[0054] 书面描述描述了本文的主题,以使本领域技术人员能够制造和使用实施方式。主题实施方式的范围由权利要求限定,并且可以包括本领域技术人员想到的其他修改。如果这些其他修改具有与权利要求的字面语言没有不同的相似元素,或者如果它们包括与权利要求的字面语言无实质差别的等效元素,则这些其他修改旨在落入权利要求的范围内。
[0055] 应当理解,保护范围除了其中具有消息的计算机可读装置之外还延伸至这样的程序;当该程序在服务器或移动设备或任何合适的可编程设备上运行时,这种计算机可读存储装置包含用于实现该方法的一个或多个步骤的程序代码装置。硬件设备可以是可以编程的任何类型的设备,包括例如任何类型的计算机,如服务器或个人计算机等,或其任何组合。该设备还可以包括可以是如下的装置:例如硬件装置(如专用集成电路(ASIC)、现场可编程门阵列(FPGA))或硬件和软件装置的组合(例如ASIC和FPGA),或至少一个微处理器和至少一个存储器,其中软件模块位于其内。因此,该装置可以包括硬件装置和软件装置二者。本文描述的方法实施方式可以在硬件和软件中实现。该设备还可以包括软件装置。替代地,实施方式可以在不同的硬件设备上实现,例如使用多个CPU。
[0056] 本文的实施方式可以包括硬件和软件元件。以软件实现的实施方式包括但不限于固件、驻留软件、微代码等。由本文描述的各种模块进行的功能可以在其他模块或其他模块的组合中实现。出于本说明书的目的,计算机可用或计算机可读介质可以是能够包括、存储、通信、传播或传输程序以供指令执行系统、器具或设备使用或与其结合使用的任何器具。
[0057] 所阐述的步骤被阐述以解释所示的示例性实施方式,并且应该预期正在进行的技术开发将改变执行特定功能的方式。本文存在的这些实例用于说明而非限制的目的。此外,为了便于描述,本文任意地限定了功能构建块的边界。可以限定替代边界,只要适当地执行指定的功能及其关系即可。基于本文包含的教导,相关领域(一个或多个)的技术人员将清楚替代方案(包括本文描述的那些的等同物、扩展、变化、偏差等)。这些替代方案落入所公开实施方式的范围和精神内。同样,词“包含”、“具有”、“含有”和“包括”以及其他类似形式旨在在意义上是等同的,并且是开放式的,因为这些词中的任何一个之后的一个或项目不是意味着是这样的一个或多个项目的详尽列表,或意味着仅限于所列一个项目或项目。还必须注意,如本文和所附权利要求中所使用的,单数形式“一(a)”,“一(an)”和“该(the)”包括复数指代,除非上下文另有明确说明。
[0058] 此外,一个或多个计算机可读存储介质可用于实现与本公开一致的实施方式。计算机可读存储介质指的是可以存储处理器可读的信息或数据的任何类型的物理存储器。因此,计算机可读存储介质可以存储用于由一个或多个处理器执行的指令,包括用于使处理器执行与本文描述的实施方式一致的步骤或阶段的指令。术语“计算机可读介质”应该被理解为包括有形项并且排除载波和瞬态信号,即,是非暂时的。实例包括随机存取存储器(RAM)、只读存储器(ROM)、易失性存储器、非易失性存储器、硬盘驱动器、CDROM、DVD、闪存驱动器、磁盘和任何其他已知的物理存储媒介。
[0059] 本公开和实例旨在被认为仅是示例性的,所公开的实施方式的真实范围和精神由所附权利要求指示。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈