首页 / 专利库 / 人工智能 / 机器学习 / 基于GAN的染色体结构异常检测方法、系统及存储介质

基于GAN的染色体结构异常检测方法、系统及存储介质

阅读:611发布:2020-05-08

专利汇可以提供基于GAN的染色体结构异常检测方法、系统及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了基于GAN的 染色 体结构 异常检测 方法、系统及存储介质,方法包括:对染色体数据集进行清洗过滤,得到待 训练数据 集;对待训练数据集进行数据增强处理,得到海量待训练数据;根据待训练数据构建基于GAN的异常检测模型;对异常检测模型进行优化;根据优化后的异常检测模型,预测染色体检测结果。本发明构建了基于GAN的异常检测模型,只需要训练正常染色体以及学习正常染色体的特征信息,充分利用正常染色体与异常染色体特征信息的差异性来进行染色体结构异常检测;另外,本发明既能进行染色体分类,又能对染色体进行异常检测,实用性高,可广泛应用于 机器学习 技术领域。,下面是基于GAN的染色体结构异常检测方法、系统及存储介质专利的具体信息内容。

1.基于GAN的染色体结构异常检测方法,其特征在于:包括以下步骤:
对染色体数据集进行清洗过滤,得到待训练数据集;
对待训练数据集进行数据增强处理,得到海量待训练数据;
根据待训练数据构建基于GAN的异常检测模型;
对异常检测模型进行优化;
根据优化后的异常检测模型,预测染色体检测结果。
2.根据权利要求1所述的基于GAN的染色体结构异常检测方法,其特征在于:所述对待训练数据集进行数据增强处理,得到海量待训练数据这一步骤,包括以下步骤:
对待训练数据集进行随机旋转处理;
和/或,
对待训练数据集进行亮度修改处理;
和/或,
对待训练数据集进行对比度修改处理;
和/或,
对待训练数据集进行饱和度修改处理;
和/或,
对待训练数据集进行伽变换处理。
3.根据权利要求1所述的基于GAN的染色体结构异常检测方法,其特征在于:所述根据待训练数据构建基于GAN的异常检测模型这一步骤,包括以下步骤:
通过Encoder编码器结构提取待训练数据的真实样本特征,并构造真实样本的特征向量
获取随机噪声;
根据随机噪声和真实样本特征,生成虚假样本信息;
通过反编码器对虚假样本信息再次进行编码以提取特征,得到虚假样本的特征向量;
根据真实样本的特征向量和虚假样本的特征向量训练异常检测模型。
4.根据权利要求1或3所述的基于GAN的染色体结构异常检测方法,其特征在于:
所述基于GAN的异常检测模型包括生成器和判别器;
所述生成器包括编码器-解码器和反编码器;所述编码器-解码器用于学习图像特征;
所述反编码器用于反编码学习到的特征;
所述判别器为多任务分类网络。
5.根据权利要求4所述的基于GAN的染色体结构异常检测方法,其特征在于:所述对异常检测模型进行优化这一步骤,包括以下步骤:
构造异常检测模型的损失函数,所述损失函数包括生成器的损失函数、判别器的损失函数和类别预测的损失函数;
根据构造得到的损失函数,对生成器和判别器进行交替优化。
6.根据权利要求5所述的基于GAN的染色体结构异常检测方法,其特征在于:所述根据优化后的异常检测模型,预测染色体检测结果这一步骤,包括以下步骤:
当异常检测模型的训练收敛后,计算所有正常样本的反译编码损失值;
选取所有损失值中的最大值作为阈值
计算任一染色体图片的损失值,若该损失值小于所述阈值,则判断该染色体图片为正常样本;反之,则判断该染色体图片为异常样本。
7.基于GAN的染色体结构异常检测系统,其特征在于:包括:
预处理模,用于对染色体数据集进行清洗过滤,得到待训练数据集;
数据增强模块,用于对待训练数据集进行数据增强处理,得到海量待训练数据;
模型构建模块,用于根据待训练数据构建基于GAN的异常检测模型;
优化模块,用于对异常检测模型进行优化;
推理模块,用于根据优化后的异常检测模型,预测染色体检测结果。
8.根据权利要求7所述的基于GAN的染色体结构异常检测系统,其特征在于:
所述基于GAN的异常检测模型包括生成器和判别器;
所述生成器包括编码器-解码器和反编码器;所述编码器-解码器用于学习图像特征;
所述反编码器用于反编码学习到的特征;
所述判别器为多任务分类网络。
9.基于GAN的染色体结构异常检测系统,其特征在于:包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-6中任一项所述的基于GAN的染色体结构异常检测方法。
10.一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-6中任一项所述的基于GAN的染色体结构异常检测方法。

说明书全文

基于GAN的染色体结构异常检测方法、系统及存储介质

技术领域

[0001] 本发明涉及机器学习技术领域,尤其是基于GAN的染色体结构异常检测方法、系统及存储介质。

背景技术

[0002] 术语解释:
[0003] 染色体:染色体是遗传物质,人类体细胞染色体数目为23对,包含22对常染色体和一对性染色体(XX或XY)。在本发明中,将染色体类别分为24个类别,分别对应22对常染色体、X性染色体、Y性染色体。
[0004] 染色体异常:染色体异常包括染色体数目异常和染色体结构异常,数目异常表现染色体数目上的缺失和增加,结构异常表现为染色体上出现部分缺失、易位、倒位、复制等特征。
[0005] 基因异常:基因异常是从基因序列的度去检测,可以明显定位到哪些基因位点的异常。
[0006] 图像分类:深度学习领域的图像分类是指通过深层网络的特征学习进行图像类别的识别,比如猫狗分类。
[0007] 异常检测:异常检测和普通的二分类问题并不相同,异常检测看似是二分类问题,实质是多分类问题,因为造成异常的原因各不相同。
[0008] 生成对抗神经网络(Generative Adversarial Networks,GAN):GAN由生成模型和判别模型两部分组成,其中生成模型用于生成噪声数据,从而学习样本的分布情况,而判别模型是一个分类器,用来判断输入的样本是真实数据还是噪声数据。该模型就是通过这种对抗与生成的博弈思想来学习数据特征,从而实现判别。
[0009] 特征选择:各个事物都具备不同的特征,区分事物的关键就是其所具备的独一无二的特征,因此,在机器学习中,通常利用某种算法对各个事物的特征进行选择,挑选出能够识别出该事物的特征。
[0010] 卷积神经网络(Convolutional Neural Networks,CNN):卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成。其中,卷积层用来提取特征;激活函数是用来加入非线性因素,构建稀疏矩阵;池化层则是用来进行特征压缩,提取主要特征。不同于传统全连接神经网络,卷积神经网络只提取局部有用特征,其次,通过卷积核的滑窗操作,实现了权值共享,也利用了图像特征的平移性特点,能够在一定程度上避免全连接网络的过拟合、参数过多等问题,因此卷积神经网络在计算机视觉领域广泛应用。
[0011] 在传统统计学方法中,为了解决染色体的接触、重叠和弯曲问题,相关研究人员在特征提取阶段利用染色体的几何特征和条带特征做出了许多研究。最常用的几何特征是染色体长度和着丝粒指数,其中,染色体长度由中轴线的像素决定,着丝粒指数由短臂长度与染色体总长度的比值有关。此外,基于概率统计的检测模型如基于均值移位和期望最大化等方法都需要得到先验分布知识,即需要知道一个良好的先验概率分布,才能使得这个数学模型对数据噪声比较敏感。因此,它们很难满足临床应用的要求,在系统设计中仅将这两种模型用于决策支持,且仍然需要医师手工审计。这些传统的检测方法灵敏度低,假阳性率高,特异性不确定,不能满足临床需要。
[0012] 近年来,相关学者研究了基于机器学习的染色体结构异常检测方法,主要应用于各种疾病的诊断与预防。如,利用支持向量机(SVM)作为分类器来检测臂级的基因拷贝数异常,从而检测结直肠癌的发生;利用三种传统的监督学习算法SVM、随机森林决策树来构建唐氏综合症预测/筛选模型。
[0013] 此外,基于深度学习的异常检测算法也越来越受欢迎,并被应用于各种任务上,且基于深度学习的异常检测方法性能远高于其他方法。从数据源角度,在深度异常检测领域,针对序列数据(如视频、语音、文本序列等),常用模型架构为CNN、RNN、LSTM;针对非序列数据(如图像等),常用模型架构为CNN、AE(auto-encoder)以及AE的各种变体。目前,基于GAN的异常检测研究较少,GAN主要应用在生成图片、图像超分、图像重建等方面,且在该领域中,关于染色体异常检测的研究暂时还没有。
[0014] 在医学检测过程中,结构异常检测准确率与阅片的质量以及医师本身的阅片能有关,当医师经验较为丰富时,准确率可能会较高。然而,传统的医学检查方法通常都需要依靠人力去识别异常并做出判断,这一判断过程中在染色体识别分类阶段和条带比对阶段耗时最多。
[0015] 现阶段,关于遗传学异常检测的研究,大都是基于基因的异常检测,包括基序列、基因位点等,很少有基于染色体图像进行相关检测;其次,关于染色体异常的研究,深度学习技术只是简单地辅助用于去噪或者降低异常位点的假阳性率等等的辅助检测。从研究方法上来看,在该研究领域,目前使用的深度学习模型大都是CNN、RNN这种简单基本模型进行特征提取,效果较为一般。

发明内容

[0016] 有鉴于此,本发明实施例提供一种能够同时进行染色体分类和异常检测的,基于GAN的染色体结构异常检测方法、系统及存储介质。
[0017] 第一方面,本发明实施例提供了一种基于GAN的染色体结构异常检测方法,包括以下步骤:
[0018] 对染色体数据集进行清洗过滤,得到待训练数据集;
[0019] 对待训练数据集进行数据增强处理,得到海量待训练数据;
[0020] 根据待训练数据构建基于GAN的异常检测模型;
[0021] 对异常检测模型进行优化;
[0022] 根据优化后的异常检测模型,预测染色体检测结果。
[0023] 进一步,所述对待训练数据集进行数据增强处理,得到海量待训练数据这一步骤,包括以下步骤:
[0024] 对待训练数据集进行随机旋转处理;
[0025] 和/或,
[0026] 对待训练数据集进行亮度修改处理;
[0027] 和/或,
[0028] 对待训练数据集进行对比度修改处理;
[0029] 和/或,
[0030] 对待训练数据集进行饱和度修改处理;
[0031] 和/或,
[0032] 对待训练数据集进行伽变换处理。
[0033] 进一步,所述根据待训练数据构建基于GAN的异常检测模型这一步骤,包括以下步骤:
[0034] 通过Encoder编码器结构提取待训练数据的真实样本特征,并构造真实样本的特征向量
[0035] 获取随机噪声;
[0036] 根据随机噪声和真实样本特征,生成虚假样本信息;
[0037] 通过反编码器对虚假样本信息再次进行编码以提取特征,得到虚假样本的特征向量;
[0038] 根据真实样本的特征向量和虚假样本的特征向量训练异常检测模型。
[0039] 进一步,所述基于GAN的异常检测模型包括生成器和判别器;
[0040] 所述生成器包括编码器-解码器和反编码器;所述编码器-解码器用于学习图像特征;所述反编码器用于反编码学习到的特征;
[0041] 所述判别器为多任务分类网络。
[0042] 进一步,所述对异常检测模型进行优化这一步骤,包括以下步骤:
[0043] 构造异常检测模型的损失函数,所述损失函数包括生成器的损失函数、判别器的损失函数和类别预测的损失函数;
[0044] 根据构造得到的损失函数,对生成器和判别器进行交替优化。
[0045] 进一步,所述根据优化后的异常检测模型,预测染色体检测结果这一步骤,包括以下步骤:
[0046] 当异常检测模型的训练收敛后,计算所有正常样本的反译编码损失值;
[0047] 选取所有损失值中的最大值作为阈值
[0048] 计算任一染色体图片的损失值,若该损失值小于所述阈值,则判断该染色体图片为正常样本;反之,则判断该染色体图片为异常样本。
[0049] 第二方面,本发明实施例还提供了一种基于GAN的染色体结构异常检测系统,包括:
[0050] 预处理模,用于对染色体数据集进行清洗过滤,得到待训练数据集;
[0051] 数据增强模块,用于对待训练数据集进行数据增强处理,得到海量待训练数据;
[0052] 模型构建模块,用于根据待训练数据构建基于GAN的异常检测模型;
[0053] 优化模块,用于对异常检测模型进行优化;
[0054] 推理模块,用于根据优化后的异常检测模型,预测染色体检测结果。
[0055] 进一步,所述基于GAN的异常检测模型包括生成器和判别器;
[0056] 所述生成器包括编码器-解码器和反编码器;所述编码器-解码器用于学习图像特征;所述反编码器用于反编码学习到的特征;
[0057] 所述判别器为多任务分类网络。
[0058] 第三方面,本发明实施例还提供了一种基于GAN的染色体结构异常检测系统,包括:
[0059] 至少一个处理器;
[0060] 至少一个存储器,用于存储至少一个程序;
[0061] 当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于GAN的染色体结构异常检测方法。
[0062] 第四方面,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的基于GAN的染色体结构异常检测方法。
[0063] 上述本发明实施例中的一个或多个技术方案具有如下优点:本发明构建了基于GAN的异常检测模型,只需要训练正常染色体以及学习正常染色体的特征信息,充分利用正常染色体与异常染色体特征信息的差异性来进行染色体结构异常检测,克服了现有技术中染色体异常数据集的缺乏的问题;另外,本发明通过基于GAN的异常检测模型,既能进行染色体分类,又能对染色体进行结构异常检测,实用性高。附图说明
[0064] 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0065] 图1为本发明实施例的整体步骤流程图
[0066] 图2为本发明实施例的基于GAN的染色体结构异常检测模型示意图;
[0067] 图3为本发明实施例的判别器的模型结构示意图。

具体实施方式

[0068] 下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0069] 本发明的目标是构建一个深度学习模型,通过建模正常染色体特征,来检测异常染色体,总流程如图1所示,染色体结构异常检测流程总体分为四个步骤:图像预处理、数据增强、模型训练与优化、模型推理。
[0070] 参照图1,本发明实施例提供了一种基于GAN的染色体结构异常检测方法,包括以下步骤:
[0071] 第一步,对染色体数据集进行清洗过滤,得到待训练数据集;
[0072] 具体的,该步骤主要是对染色体数据集进行相关清洗和过滤操作,使数据集更加符合任务导向。
[0073] 第二步,对待训练数据集进行数据增强处理,得到海量待训练数据;
[0074] 具体的,由于深度学习往往需要训练海量数据,但是医学图像中的数据量往往不够,为了尽可能达到更好的效果,可以使用深度学习中的相关数据增强方法,如旋转、亮度\对比度\饱和度修改、伽马变换等等。
[0075] 第三步,根据待训练数据构建基于GAN的异常检测模型;
[0076] 如图2所示,本发明提出的基于GAN的染色体异常检测模型如图2所示,该模型主要包括两部分:G为生成器(Generator)、D为判别器(Discriminator)。
[0077] 其中,生成器G内部为一个图像反译器,包含编码器-解码器(Encoder-Decoder)部分和反编码器(Anti-Encoder)两部分,前者主要用来学习图像特征,后者则是将学习到的特征反编码出来,目的是通过反编码加大正常染色体与异常染色体的差异性。模型中解码、编码结构部分都使用了卷积神经网络进行特征提取,主要利用了卷积神经网络对于图像特征的平移不变性,随着神经网络层数递增,能够学习到图像的特征。
[0078] 判别器D为一个分类网络,主要用来完成多任务分类:对染色体图像的类别预测;判断该图像是否真实图像。
[0079] 此外,本发明提出的基于GAN的染色体异常检测模型的优化是通过神经网络前向传递和反向传播机制来训练优化生成器G和判别器D。
[0080] 本实施例中,生成器的输入为噪声、类别标签和真实图像:其中,噪声(σ)服从高斯分布的随机噪声;类别标签Yr;真实样本图像Xr。
[0081] 生成器的输出为:虚假样本的特征编码信息。
[0082] 判别器的输入为:虚假样本的编码信息和真实样本的编码信息。
[0083] 判别器的输出为样本的真实性和样本的预测类别标签:其中,样本的真实性(I)包括“真\假”;样本的预测类别标签为Ypre,共24个类别,即值域为{1,2,3,…,22,23,24}。
[0084] 本实施例中定义训练集Zr,记为Zr={zr1,zr2,…,zri,…,zrn}={(xr1,yr1),(xr2,yr2),…,(xri,yri),…,(xrn,yrn)},其中zri为真实样本信息,zri=(xri,yri),xri表示第i张正常染色体图像,yri表示第i张正常染色体对应的类别标签,且i=1,2,…,n,n为正常图像的总数。
[0085] 本实施例中使用的染色体图像为24bitTIF图,具体步骤如下:
[0086] 步骤1:学习真实样本与类别的特征,构造特征向量。
[0087] 所述步骤1包括:
[0088] 步骤1.1:获取训练集Zr;
[0089] 步骤1.2:通过Encoder编码器结构提取真实样本特征,主要利用3*3卷积核进行卷积操作提取特征图,并构造特征向量Ezr,即
[0090] Ezr=Encoder(Zr)  (1)
[0091] 其中,输入变量为Zr,包含真实图像样本xri和类别标签yri,输出变量Ezr表示经过特征提取后得到的真实样本特征向量。
[0092] 步骤2:构造生成网络G,得到生成虚假图像集。
[0093] 步骤2.1:获取随机噪声σ,真实样本信息Zr,本实施例的σ和Zr同时控制着生成样本;
[0094] 步骤2.2:通过生成网络G中Encoder-Decoder结构得到生成样本信息Zf;
[0095] 本实施例的Encoder-Decoder结构采用类U-Net网络结构,主要利用其跳层连接(Skip Connection),即将第k层网络直接与m-k层相加,主要思想是让高层网络共享底层网络特征,保证模型学习能力更强。
[0096] 用GED(·)函数表示Encoder-Decoder结构,该过程即为:
[0097] Zf=GED(σ,Zr)  (2)
[0098] 其中,输出变量Zf表示经过编码器-解码器结构重新生成的虚假样本信息。
[0099] 步骤2.3:将上一步生成的虚假样本信息Zf经过Anti-Encoder反编码器重新编码提取特征,得到虚假样本的特征向量Ezf。
[0100] Anti-Encoder网络实现原理同公式(1),但模型训练时所用超参数不同,输入为Zf,输出为Ezf,用GE(·)函数表示该过程,即:
[0101] Ezf=GE(Zf)  (3)
[0102] 步骤3:构造判别网络D,用来对输入的样本信息进行样本的真实性判别(real/fake)以及样本类别的预测。用D(·)函数表示判别网络,则
[0103] ypre,I=D(Ez)  (4)
[0104] 其中,输入变量为Ez,即虚假样本特征编码Ezf和真实样本特征编码Ezr;输出变量包含两个部分:预测类别(ypre),样本虚假性判别(I)。
[0105] 本发明提出的判别器模型结构如图3所示,判别器D中间部分是基础特征学习模块,采用K个卷积-池化模块,由卷积层、激活函数(采用LeakyReLU激活函数)、池化层(采用最大池化)构成,用来提取有效的样本信息特征,最后采用双塔式结构完成多任务分类。MLP(多层感知机)层由批归一化(BatchNormalization)和ReLU激活函数组成,最后采用sigmoid函数作为神经网络的阈值函数,将变量映射到[0,1]之间,完成分类任务。
[0106] 第四步,对异常检测模型进行优化;
[0107] 具体的,本发明中的网络损失分为三部分:生成器损失、判别器损失、预测损失,最终构建的损失函数如公式(10)。
[0108] 此外,本发明中的损失函数构造与标准GAN网络损失的不同在于:1.在生成器损失部分,本发明定义了一个图像反译编码损失LG2,用于在像素级上减小真实图像与虚假图像的误差;2.判别器部分,定义了一个特征学习损失LD,用于在图像特征层面优化,更加准确地学习染色体特征;3.在类别预测部分,由于本发明中是一个多任务模型,因此需要单独对类别预测做出优化。上述所有损失函数的优化均在深度学习网络的前向传播、反向传播机制下进一步优化网络参数权重。该步骤具体包括以下步骤:
[0109] 步骤1.1:对于生成器G中的Encoder-Decoder结构部分,采用L1损失函数,如公式(5)。对于生成器G中Anti-Encoder结构部分,采用L2损失函数,如公式(6),主要用来计算编码网络的损失,需要比对的是原图与生成图在高层抽象空间的差异。
[0110] 用LG1表示生成器G中Encoder-Decoder结构的特征编码损失,LG2表示生成器G中Anti-Encoder结构的图像反译编码损失。
[0111] LG1=l1_loss(Zr,Zf)  (5)
[0112] LG2=l2_loss(Zf,Ezf)  (6)
[0113] 步骤1.2:对于判别器D,采用交叉熵损失函数(cross entropy loss),则真实性损失LD为:
[0114] LD=crossentropy_loss(input)  (7)
[0115] 步骤1.3:预测类别的损失函数,同样采用二分类的交叉熵损失函数,则标签预测损失Llabel为:
[0116] Llabel=crossentropy_loss(yr,yf)  (8)
[0117] 步骤2:模型训练与优化。
[0118] 本发明采用的训练策略与常规的GAN模型一样,交替训练优化生成器G和判别器D。
[0119] 步骤2.2:训练优化判别器D,即优化判别器损失函数LD,
[0120] LD=LDI+Llabel  (9)
[0121] 此时,LD中的input为
[0122] input=add(Ezr,Ezf)
[0123] 而生成器G的参数是固定的。
[0124] 步骤2.3:训练优化生成器G,主要需要优化LG1,而优化LD则为实现“对抗”思想,因此,总的损失函数L为
[0125] L=αLG1+βLG2+γLD  (10)
[0126] 此时,LDI中的input为
[0127] input=Ezf
[0128] 其中,α,β,γ为超参数,且满足α+β+γ=1。
[0129] 而判别器D的参数是固定的。
[0130] 第五步,根据优化后的异常检测模型,预测染色体检测结果;
[0131] 具体的,本发明提出的染色体异常检测推理方法基于半监督学习思想,具体推理过程为:当网络训练到收敛以后,计算所有正常样本的反译编码损失LG2值,选取其中最大值作为阈值φ,进行预测推理时,输入一张染色体图片,计算该样本的LG2值,如果小于阈值φ,则判断为正常样本,反之则判断为异常样本。
[0132] 与图1的方法相对应,本发明实施例还提供了一种基于GAN的染色体结构异常检测系统,包括:
[0133] 预处理模块,用于对染色体数据集进行清洗过滤,得到待训练数据集;
[0134] 数据增强模块,用于对待训练数据集进行数据增强处理,得到海量待训练数据;
[0135] 模型构建模块,用于根据待训练数据构建基于GAN的异常检测模型;
[0136] 优化模块,用于对异常检测模型进行优化;
[0137] 推理模块,用于根据优化后的异常检测模型,预测染色体检测结果。
[0138] 进一步作为优选的实施方式,所述基于GAN的异常检测模型包括生成器和判别器;
[0139] 所述生成器包括编码器-解码器和反编码器;所述编码器-解码器用于学习图像特征;所述反编码器用于反编码学习到的特征;
[0140] 所述判别器为多任务分类网络。
[0141] 与图1的方法相对应,本发明实施例还提供了一种基于GAN的染色体结构异常检测系统,包括:
[0142] 至少一个处理器;
[0143] 至少一个存储器,用于存储至少一个程序;
[0144] 当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于GAN的染色体结构异常检测方法。
[0145] 上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0146] 与图1的方法相对应,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的基于GAN的染色体结构异常检测方法。
[0147] 此外,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的数据处理方法。
[0148] 综上所述,相较于现有技术,本发明基于GAN的染色体结构异常检测方法、系统及存储介质具有以下优点:
[0149] 1.提出基于GAN的思想来做染色体结构异常检测,且加入了染色体类别识别,从而可以同时实现染色体分类与结构异常检测。
[0150] 2.提出了基于染色体图像进行染色体结构异常检测的思想,不同于现有遗传学异常检测是基于基因序列来做异常检测。
[0151] 3.提出了利用图像的反译差异性构造GAN模型的生成器,充分扩大了染色体结构异常中的小异常特征。
[0152] 4.本发明基于GAN的染色体结构异常检测网络模型的设计,以及染色体异常检测推理方法,在模型中损失函数的设计,定义了图像反译损失和类别预测损失,从两个方面提高模型鲁棒性。
[0153] 本发明从实际出发,考虑到医疗数据的缺乏,且染色体异常数据集的严重不足,通过只训练正常染色体,学习正常染色体的特征信息,充分利用正常染色体与异常染色体特征信息的差异性来进行染色体结构异常检测;其次,本发明使用了当前热研究领域GAN的思想进行模型创新,提出了一种可以同时进行染色体分类和异常检测的模型架构,在实现过程中,异常检测的主要思想是利用图像反译法中反译出来的图像特征与原图特征的明显差异性,从而实现异常检测。
[0154] 相比于现有的遗传学(染色体/基因)异常检测算法,现有相关异常检测方法大都是基于基因序列进行基因位点的异常检测,而关于染色体图像的研究目前主要集中在图像识别图像分割领域,所以本发明的研究点具有创新性。
[0155] 在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0156] 此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
[0157] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0158] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0159] 计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0160] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0161] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0162] 尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
[0163] 以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈