专利类型 | 发明授权 | 法律事件 | 公开; 实质审查; 授权; |
专利有效性 | 有效专利 | 当前状态 | 授权 |
申请号 | CN202510084740.6 | 申请日 | 2025-01-20 |
公开(公告)号 | CN119516023B | 公开(公告)日 | 2025-04-04 |
申请人 | 浙江大学; | 申请人类型 | 学校 |
发明人 | 朱新建; 成骏楠; 刘姗娜; 滕冲; 沈玉强; 李畅; | 第一发明人 | 朱新建 |
权利人 | 浙江大学 | 权利人类型 | 学校 |
当前权利人 | 浙江大学 | 当前权利人类型 | 学校 |
省份 | 当前专利权人所在省份:浙江省 | 城市 | 当前专利权人所在城市:浙江省杭州市 |
具体地址 | 当前专利权人所在详细地址:浙江省杭州市西湖区余杭塘路866号 | 邮编 | 当前专利权人邮编:310058 |
主IPC国际分类 | G06F17/00 | 所有IPC国际分类 | G06F17/00 |
专利引用数量 | 2 | 专利被引用数量 | 0 |
专利权利要求数量 | 4 | 专利文献类型 | B |
专利代理机构 | 重庆敏创专利代理事务所 | 专利代理人 | 陈千; |
摘要 | 本 发明 公开了基于 深度学习 的超声声速图像重建方法和系统,该方法包括:获取超声原始通道数据;将超声原始通道数据输入训练好的声速图像重建模型,生成声速图,该模型包含 编码器 和 解码器 ,编码器包括初步特征提取模 块 、GCSA模块和后续特征处理模块,初步特征提取模块用于提取原始特征图;GCSA模块融合了通道注意 力 、通道洗牌和空间注意力机制,GCSA模块将接收到的原始特征图进行处理,生成优化特征图;后续特征处理模块,用于对优化特征图进一步进行处理,生成编码器的输出特征图;解码器接收编码器的输出特征图,将编码器的输出特征图转化为声速矩阵,从而生成声速图。本发明的方法提高了特征的表达能力,使得生成的声速图 精度 更高。 | ||
权利要求 | 1.一种基于深度学习的超声声速图像重建方法,其特征在于,包括: |
||
说明书全文 | 基于深度学习的超声声速图像重建方法和系统技术领域[0001] 本发明属于图像重建领域,具体涉及一种基于深度学习的超声声速图像重建方法和系统。 背景技术[0002] 超声成像是医学诊断中的重要技术,广泛应用于各类疾病的检测与诊断。它通过发射高频声波并接收反射波来生成图像信息。在临床实践中,传统的超声图像(如B‑mode图像)仅能提供有限的组织结构信息,难以准确评估组织的弹性和声速分布,从而影响疾病的早期诊断和治疗。为克服这一局限,声速成像成为超声成像领域的重要研究方向。声速成像能够提供更多的组织特性信息,超声波传播有助于揭示组织的机械特性及病变区域。作为一种定量成像生物标志物,声速(Speed of Sound, SoS)对病理引起的结构变化非常敏感,因此具有重要的诊断价值,并承载了关于组织特性的重要信息。研究表明,纵波成像具有与横波成像相似的诊断能力,它可以为评估弹性和硬度提供重要信息。组织内的压缩波(纵波)速度通常通过测量已知相对位置之间的声波传输时间来确定。例如在肿瘤检测中,肿瘤组织通常较正常组织会表现得更加坚硬,纵波传播更快,使得纵波在肿瘤检测中更具潜力。因此,结合声速成像与纵波传播特性,不仅能更全面地评估组织的机械特性,还能为疾病的早期诊断和治疗提供更加精准的信息。 [0003] 组织的声学特性(包括声速信息)在原始超声射频(Radio Frequency, RF)数据中已有所体现,但从中准确提取这些信息的分析方法通常伴随较高的计算成本。此外,声速成像高度依赖于声波传播时间的精确测量,而微小结构的分辨率则受限于现有成像技术的物理边界。不同组织在声速成像中的表现亦存在显著差异,例如,对于软组织,由于声速差异较小,精准测量变得尤为具有挑战性。 [0004] 现阶段传统方法的超声声速分布图的重建技术通常基于声速反演模型,它通过从反射超声数据中提取声速信息,从而生成精确的声速分布图。1982年,DE Robinson等人提出了一种通过处理复合扫描获得的脉冲回波数据来确定超声在组织中的传播速度的方法。1998年,ME Anderson等人提出了一种直接估计介质中声速的方法,在该方法终,估计器通过分析单个换能器阵列在单次传输后接收到的脉冲回波数据,得出声速。2011年,Treeby等人研究了不同焦点函数后,提出了一种自动选择声速的聚焦方法。2020年,P Stähli等人提出了一种使用贝叶斯框架进行逆计算,这种方法下的SoS图像更加稳定且具有更好地抗相位噪声能力。 [0005] 近年来,深度学习在多个领域取得了显著进展,广泛应用于计算机视觉等传统领域,如利用深度学习进行MRI、CT和超声图像重建。例如在超声成像领域,深度学习已广泛应用于超声波束形成技术。随着深度学习技术的发展,基于神经网络的声速重建方法取得了显著的进展。这些方法不仅能够处理复杂的非线性关系,还能够自动学习从输入数据中提取的深层次特征,从而提高重建结果的准确性和细节表现。Micha等人提出了一种基于通道数据的单侧压力波声速测量替代方法,并采用全卷积深度神经网络实现单侧声速反演。Khun Jush F等人研究了基于DNN的声速重建方法,并应用于单个平面波采集的通道数据,用于自动乳腺超声。Shi M等人介绍了一种基于深度学习框架的双模态PA/US成像系统中的声速估计及像差校正方法,通过使用物理模型数据和从测量中获得的相关声速图进行迁移学习,进一步增强了该阶段的效果。 [0006] 然而,在现有的声速重建中,往往忽视了通道之间的关联信息,可能造成全局信息的丢失,进而影响模型对特征图中信息的有效利用。 发明内容[0007] 有鉴于此,本发明的目的是提供一种改进的模型,该模型中融合了通道注意力、通道洗牌和空间注意力机制,旨在通过捕捉特征图中的全局依赖关系,增强输入特征图的表达能力。 [0008] 本发明的目的是通过以下技术方案实现的: [0009] 一种基于深度学习的超声声速图像重建方法,包括: [0010] 获取超声原始通道数据; [0013] 初步特征提取模块用于提取原始特征图; [0014] GCSA模块融合了通道注意力、通道洗牌和空间注意力机制,GCSA模块将接收到的原始特征图进行处理,生成优化特征图; [0015] 后续特征处理模块,用于对优化特征图进一步进行处理,生成编码器的输出特征图; [0016] 解码器接收编码器的输出特征图,将编码器的输出特征图转化为声速矩阵,从而生成声速图。 [0017] 本发明还提供了一种基于深度学习的超声声速图像重建系统,包括: [0018] 数据获取引擎,用于获取超声原始通道数据; [0019] 模型构建与训练引擎,用于构建并训练声速图像重建模型进行训练; [0020] 图像重建引擎,用于根据超声原始通道数据和声速图像重建模型生成声速图,其中,声速图像重建模型包含编码器和解码器, [0021] 编码器按照信号流的方向依次包括初步特征提取模块、GCSA模块和后续特征处理模块, [0022] 初步特征提取模块用于提取原始特征图; [0023] GCSA模块融合了通道注意力、通道洗牌和空间注意力机制,GCSA模块将接收到的原始特征图进行处理,生成优化特征图; [0024] 后续特征处理模块,用于对优化特征图进一步进行处理,生成编码器的输出特征图; [0025] 解码器接收编码器的输出特征图,将编码器的输出特征图转化为声速矩阵,从而生成声速图。 [0026] 进一步地,初步特征提取模块按照信号流的方向依次包括第一编码单元、第二编码单元、第三编码单元和第四编码单元和第五编码单元, [0027] 其中, [0028] 第一编码单元按照信号流的方向依次包括卷积层和BN层; [0029] 第二编码单元、第三编码单元和第四编码单元与第一编码单元结构相同,第一编码单元至第四编码单元中的卷积层采用跨步卷积; [0030] 第五编码单元按照信号流的方向依次包括卷积层、最大池化层、Dropout层和BN层; [0031] 后续特征处理模块包括第六编码单元和第七编码单元,第六编码单元包括卷积层、最大池化层和BN层; [0032] 第七编码单元均包括卷积层、最大池化层、Dropout层和BN层。 [0033] 进一步地,解码器按照信号流的方向依次包括第一解码单元、第二解码单元、第三解码单元、第四解码单元、第五解码单元、第六解码单元和第七解码单元,其中,[0034] 第一解码单元按照信号流的方向依次包括卷积层、上采样层和BN层; [0035] 第二解码单元、第三解码单元和第四解码单元与第一解码单元的结构相同,[0036] 第四编码单元的卷积层的输出与第三解码单元中经过卷积层、上采样层和BN层处理之后的结果进行连接操作; [0037] 第五编码单元的最大池化层的输出与第二解码单元中经过卷积层、上采样层和BN层处理之后的结果进行连接操作; [0038] 第六编码单元的最大池化层的输出与第一解码单元中经过卷积层、上采样层和BN层处理之后的结果进行连接操作; [0039] 第五解码单元按照信号流的方向依次包括卷积层、重调尺寸层和BN层; [0040] 第六解码单元按照信号流的方向依次包括卷积层和BN层; [0041] 第七个解码单元包括卷积层。 [0042] 进一步地,GCSA模块包括通道注意力子模块和空间注意力子模块,[0043] 通道注意力子模块接收初步特征图生成通道注意力图;通道注意力子模块还将通道注意力图与初步特征进行相乘,得到增强后的特征图,并对增强后的特征图进行通道洗牌,生成混洗后的特征图; [0044] 空间注意力子模块接收混洗后的特征图,生成空间注意力图; [0045] GCSA模块还将混洗后的特征图与空间注意力图进行相乘,生成优化的特征图。 [0046] 进一步地,通道注意力子模块接收初步特征图生成通道注意力图,具体包括: [0047] S11:接收初步特征图; [0048] S12:对初步特征图进行维度置换,将通道维度移至最后一维; [0049] S13:对维度置换后的特征图输入多层感知机,多层感知机的第一层将通道数缩减为初始通道数的四分之一,然后通过ReLU激活函数进行非线性变换,多层感知机的第二层将通道数恢复至初始通道维度; [0050] S14:再次执行维度置换,将S13生成的特征图的形状恢复至与初步特征图的形状相同; [0051] S15:将S14的结果通过Sigmoid函数,生成通道注意力图。 [0052] 进一步地,空间注意力子模块接收混洗后的特征图,生成空间注意力图,具体包括: [0053] S21:接收混洗后的特征图; [0054] S22:将混洗后的特征图进行卷积操作,使得卷积后生成的特征图的通道数变为混洗后特征图的四分之一; [0055] S23:将S22生成的特征图经过批归一化与ReLU激活函数进行非线性转换; [0056] S24:将S23的结果再次进行卷积操作,使得卷积生成的特征图的通道数恢复至初始通道维度; [0057] S25:将S24的结果经过批归一化以及Sigmoid激活函数,生成空间注意力图。 [0058] 本发明的有益效果是: [0059] 本发明在模型中加入了GCSA模块,该模块融合了通道注意力、通道洗牌和空间注意力机制。通过引入通道注意力机制和通道洗牌操作,充分考虑了通道之间的依赖关系,使得特征图中的信息得到充分利用;之后又引入了空间注意力机制,充分捕捉图像中的局部和全局特征中的空间信息,即考虑特征图中更多的细节,提高了声速预估的准确性。 [0060] 本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。附图说明 [0061] 为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中: [0062] 图1是声速图像重建模型示意图; [0063] 图2是通道注意力子模块及执行通道洗牌操作示意图; [0064] 图3是空间注意力子模块示意图; [0065] 图4是不同模型在模拟数据集上的测试结果; [0066] 图5是在CIRS 040GSE仿体上的实验结果; [0067] 图6是在带有管状结构的离体猪组织的实验结果。 具体实施方式[0068] 以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。 [0069] 本发明提出了一种基于深度学习的声速图像重建方法,该方法用于超声射频(Radio Frequency,RF)数据的声速图像重建。该方法以大量模拟数据作为深度神经网络的训练输入,通过充分学习声速分布特征,生成高精度的声速分布图,从而通过训练得到声速图像重建模型。通过该模型,可以将接收到的超声通道射频数据转换为声速矩阵,生成声速分布图(即声速图)。 [0070] 具体地,一种基于深度学习的超声声速图像重建方法,可以包括: [0071] 获取超声原始通道数据; [0072] 将超声原始通道数据输入训练好的声速图像重建模型,生成声速图。声速图像重建模型是基于卷积神经网络进行构建的。图1是声速图像重建模型的示意图,如图1所示,声速图像重建模型包含编码器和解码器,进行特征提取和重构。即通过编码器和解码器,将超声通道的原始数据转换为声速值。该网络的输入是超声原始通道数据,输出为384 × 384 的声速矩阵。 [0073] 编码器按照信号流的方向依次包括初步特征提取模块、GCSA模块和后续特征处理模块, [0074] 初步特征提取模块用于提取原始特征图; [0075] GCSA模块融合了通道注意力、通道洗牌和空间注意力机制,GCSA模块将接收到的原始特征图进行处理,生成优化特征图; [0076] 后续特征处理模块,用于对优化特征图进一步进行处理,生成编码器的输出特征图; [0077] 解码器接收编码器的输出特征图,将编码器的输出特征图转化为声速矩阵,从而生成声速图。 [0078] 本发明还提供了一种基于深度学习的超声声速图像重建系统,包括: [0079] 数据获取引擎,用于获取超声原始通道数据; [0080] 模型构建与训练引擎,用于构建并训练声速图像重建模型进行训练; [0081] 图像重建引擎,用于根据超声原始通道数据和声速图像重建模型生成声速图,其中,声速图像重建模型包含编码器和解码器, [0082] 编码器按照信号流的方向依次包括初步特征提取模块、GCSA模块和后续特征处理模块, [0083] 初步特征提取模块用于提取原始特征图; [0084] GCSA模块,即全局通道‑空间注意力模块(Global Channel‑Spatial Attention Module,简称GCSA),其融合了通道注意力、通道洗牌和空间注意力机制,GCSA模块将接收到的原始特征图进行处理,生成优化特征图; [0085] 后续特征处理模块,用于对优化特征图进一步进行处理,生成编码器的输出特征图; [0086] 解码器接收编码器的输出特征图,将编码器的输出特征图转化为声速矩阵,从而生成声速图。 [0087] 如图1所示,初步特征提取模块按照信号流的方向依次包括第一编码单元、第二编码单元、第三编码单元和第四编码单元和第五编码单元, [0088] 其中, [0089] 第一编码单元按照信号流的方向依次包括卷积层和批量归一化(Batch Normalization, BN)层; [0090] 第二编码单元、第三编码单元和第四编码单元与第一编码单元结构相同;其中,第一编码单元至第四编码单元中的卷积层均采用了跨步卷积。具体地,跨步卷积的步幅可以为(1,2),其中,第一个维度中的步幅“1”表示卷积核在垂直方向的步幅为1;第二个维度中的步幅“2”表示卷积核在水平方向的步幅为2。在这四个编码单元的卷积层中,水平方向的步幅大于1,这意味着卷积核每次会跳过一个像素进行卷积。另外,这个四个编码单元中,数据的通道数均没有改变,维持在最初的值(例如,可以是32)。卷积核的大小从从第一编码单元至第四编码单元依次减小。 [0091] 第五编码单元按照信号流的方向依次包括卷积层、最大池化层、Dropout层(即随意丢弃层)和BN层(即批量归一化层); [0092] 后续特征处理模块位于GCSA模块之后,其按照信号流的方向依次包括第六编码单元和第七编码单元,第六编码单元包括卷积层、最大池化层和BN层;第七编码单元均包括卷积层、最大池化层、Dropout层和BN层。 [0093] 解码器按照信号流的方向依次包括第一解码单元、第二解码单元、第三解码单元、第四解码单元、第五解码单元、第六解码单元和第七解码单元,其中, [0094] 第一解码单元按照信号流的方向依次包括卷积层、上采样层和BN层; [0095] 第二解码单元、第三解码单元和第四解码单元与第一解码单元的结构相同。 [0096] 第五解码单元按照信号流的方向依次包括卷积层、重调尺寸层和BN层; [0097] 第六解码单元按照信号流的方向依次包括卷积层和BN层。 [0098] 第七个解码单元为1×1的卷积层。 [0099] 为了实现编码和解码两个路径的连接,这里加入了连接(即Concatenate)操作,具体的链接操作可以包括以下几种: [0100] 第四编码单元的卷积层的输出与第三解码单元中经过卷积层、上采样层和BN层处理之后的结果进行连接操作; [0101] 第五编码单元的最大池化层的输出与第二解码单元中经过卷积层、上采样层和BN层处理之后的结果进行连接操作; [0102] 第六编码单元的最大池化层的输出与第一解码单元中经过卷积层、上采样层和BN层处理之后的结果进行连接操作。 [0103] 通过以上连接操作,可以结合高层次和低层次的空间信息,减少信息的丢失,提高模型的训练效率。 [0104] 在图像重建过程中,若忽视通道之间的关联信息,可能会导致全局信息的丢失,进而影响模型对特征图中所有信息的有效利用,最终导致对全局特征的捕捉不足。为了解决这一问题,本发明设计了一种新的GCSA模块。该模块融合了通道注意力、通道洗牌和空间注意力机制,旨在通过捕捉特征图中的全局依赖关系,增强输入特征图的表达能力。GCSA模块包括通道注意力子模块和空间注意力子模块。 [0105] 通道注意力子模块可以接收初步特征图生成通道注意力图。 [0106] 图2是通道注意力子模块和通道洗牌操作示意图,如图2所示,通道注意力子模块接收初步特征图生成通道注意力图,具体包括: [0107] S11:接收初步特征图(即作为图2中的输入特征图); [0108] S12:对初步特征图进行维度置换,从原始的 变换为 ,将通道维度移至最后一维,其中,C表示输入特征图的原始通道数;H表示输入特征图的图像高度;W表示输入特征图的图像宽度; [0109] S13:对维度置换后的特征图输入多层感知机(MLP)来捕捉通道之间的关系,具体地,多层感知机的第一层将通道数缩减为初始通道数的四分之一(即将C变为C/4),然后通过ReLU激活函数进行非线性变换,多层感知机的第二层将通道数恢复至初始通道维度(即将C/4恢复为C),通过MLP,可以有效减少通道间的冗余信息,并突出重要特征,通过这种方式可以更好地捕捉通道之间的全局依赖关系; [0110] S14:再次执行维度置换(即逆置换,将 变为 ),将S13生成的特征图的形状恢复至与初步特征图的形状相同; [0111] S15:将S14的结果通过Sigmoid函数,生成通道注意力图。 [0112] 之后,将生成的通道注意力图与初始输入的特征图相乘,即可得到增强后的特征图。 [0113] 以上过程可以用公式(1)表示为:,(1) [0114] 其中, 为增强后的特征图, 为输入特征图, 代表维度置换操作, 为Sigmoid激活函数,MLP为多层感知机, 表示矩阵相乘。 [0115] 如果通道间的信息未得到充分混合,特征的表达能力可能会受到限制,进而无法充分发挥通道注意力的效果。为进一步混合和共享信息,本发明对增强后的特征图执行通道洗牌操作。具体而言,增强后的特征图会被分为四组,每组包含 个通道。然后,对分组后的特征图进行转置操作,从而打乱通道信息。最后,将打乱后的特征图恢复至原始形状。通过这种方式,可以更好地混合信息,从而增强特征表达能力。 [0116] 通道洗牌操作可以用公式(2)表示为: [0117] ,(2) [0118] 其 中, 为混 洗 后的特 征 图, 为 增强 后的 特征 图 ,代表通道洗牌操作。 [0119] 空间信息对于捕捉图像中的局部和全局特征同样至关重要。但仅通过通道注意力和通道洗牌操作,可能无法充分利用空间信息。为此,本发明还引入了一个空间注意力子模块,以充分考虑特征图中的细节,具体过程如图3展示。 [0120] 如图3所示,空间注意力子模块接收混洗后的特征图,生成空间注意力图,可以具体包括: [0121] S21:接收混洗后的特征图; [0122] S22:将混洗后的特征图进行卷积操作(例如,输入一个7×7的卷积层),使得卷积后生成的特征图的通道数变为混洗后特征图的四分之一; [0123] S23:将S22生成的特征图经过批归一化与ReLU激活函数进行非线性转换; [0124] S24:将S23的结果再次进行卷积操作(另一个7×7的卷积层),使得卷积生成的特征图的通道数恢复至初始通道维度C; [0125] S25:将S24的结果经过批归一化以及Sigmoid激活函数,生成空间注意力图。 [0126] 经过通道注意力子模块和通道洗牌处理后,本发明将得到的混洗特征图输入到一个7×7的卷积层,该卷积层将通道数缩减至原来的四分之一。接着,经过批归一化和ReLU激活函数进行非线性变换。随后,另一个7×7的卷积层将通道数恢复至初始维度 ,再经过一层批归一化,并通过Sigmoid激活函数生成空间注意力图。以上过程可以由公式(3)表示: [0127] ,(3) [0128] 其中, 为经过空间注意力后的图,即空间注意力图。 [0129] 最后,将混洗后的特征图和经过空间注意力子模块后的空间注意力图进行相乘,就得到了最终的输出特征图。以上过程可以由公式(4)表示: [0130] ,(4) [0131] 其中, 为最终编码器输出的特征图。 [0132] 本发明采用三种常见的评价指标对重建结果进行定量评估:均方根误差(Root Mean Square Error, RMSE)、峰值信噪比(Peak Signal‑to‑Noise Ratio, PSNR)和结构相似性指数(Structural Similarity Index, SSIM)。其中,RMSE作为主要评价指标,用于衡量重建结果与真实值之间的误差;PSNR和SSIM作为辅助指标,从信噪比和结构相似性两个维度进一步评估重建质量。 [0133] 本发明主要选择使用均方根误差(Root Mean Square Error, RMSE)作为评估深度学习中生成声速分布图准确性的主要指标。RMSE衡量的是预测值和真实值之间的偏差程度,通过计算预测值与真实值差值的平方和的平方根得出。其取值范围从0到正无穷大,RMSE越小,说明模型预测值与真实值的偏差越小,预测准确性越高。RMSE的定义可以由公式(5)表示: [0134] ,(5) [0135] 其中, 为实验样本数, 为真实值, 为预测值。 [0136] 峰值信噪比(Peak Signal‑to‑Noise Ratio, PSNR)是常用于图像质量评估的指标之一,用于衡量重建图像与原始图像之间的信噪比,反映图像质量的优劣。在本研究中,PSNR作为辅助评价指标,用于补充评估图像重建质量。PSNR的值越高,表示重建图像和真实图像的差异越小,即重建质量越好。PSNR的定义可以由公式(6)表示: [0137] ,(6) [0138] 其中, 为图像像素点的最大值, 为均方误差,即 的平方。 [0139] 结构相似性指数(Structural Similarity Index, SSIM)是第二种辅助评价指标,主要用于评价两幅图像结构相似性。与PSNR不同,SSIM综合考虑了图像的对比度、亮度和结构信息,强调对图像细节的保留程度,更能准确反映图像的相似性。SSIM的取值范围介于 之间,值越接近于1,表示两幅图像结构越相似。在超声声速分布图重建的过程中,SSIM能够更好地捕捉局部细节和结构信息,因此作为辅助指标,能够补充RMSE和SSIM未能反映的结构性信息。SSIM的定义可以由公式(7)表示: [0140] ,(7) [0141] 其中, 和 表示原始图像x和重建图像y的均值, 和 表示原始图像和重建图像的方差, 表示它们的协方差, 和 为常数,为了避免分母为0。 [0142] 本发明中的模型在5000个模拟样本中进行训练,训练/测试划分比为0.8,采用最小批量(batch size)为10的随机梯度下降优化器(Stochastic Gradient Descent, SGD),设置动量为0.9,学习率为0.00001,并使用均方误差(Mean Squared Error, MSE)最为损失函数。模型训练100个周期(epochs),训练集上的平均均方根误差(RMSE)最终收敛在20.7377 m/s,验证集上的RMSE最终收敛在25.5701 m/s。相比之下,未改进之前模型(即没有加入GCSA模块的模型,只有基线baseline)在相同的训练配置下,训练集上RMSE最终收敛至22.5991 m/s,在验证集上RMSE最终收敛在27.2553 m/s。 [0143] 本研究在三个不同的数据集上对训练得到的模型进行了测试,这些数据集包括模拟数据、仿体数据,以及由人类手腕2D成像切片组成的3D扫描序列。测试结果如表1所示。结果表明,改进后的模型在大多数测试任务中表现出更高的性能,进一步验证了其在不同数据分布下的泛化能力和鲁棒性。具体结果如表1所示。 [0144] 表 1 模型RMSE,PSNR,SSIM表现 [0145] [0146] 在模拟数据集上的实验结果如图4所示。 [0147] 如图4所示,采用十个(对应(a)‑(j)十个图像列)不同的随机生成异物的模拟数据,每个模拟数据都会有相对应的超声延迟求和(Delay And Sum,DAS)成像、真实的异物声速分布图、未改进前模型(即基线模型)生成的声速分布图以及改进后的模型(即基线模型+GCSA)的声速分布图。从图4中可以观察到,基础模型在某些情况下生成的声速分布图存在比较明显误差。以图4中的(b)列对应的图像和图4中的(d)列对应的图像为例,改进后的模型在区分不同的异物时表现得更为精准。在异物重叠的情况下,改进模型生成的声速分布图能够有效地区分各异物,而非将其模糊处理为一个整体。改进后的模型在去除伪影方面也得到了提升。例如,在图4中(j)列对应的图像中,基础模型生成了一个真实声速图中不存在的伪影,而在改进后的模型中并不会存在这个问题。相比之下,改进后的模型通过增强了通道之间的关系,能够更加准确地捕捉到图像重建过程中的细节。 [0148] 在本发明的实验中,真实数据的成像和数据采集采用了Vevo F2 LAZR‑X设备。Vevo F2成像系统是一种高分辨率、实时超声设备,主要用于小动物的诊断成像和流体流动分析,适用于实验室环境,由VisualSonics公司开发。该设备支持将实验数据导出为多种格式,便于后续分析。本实验中的仿体和离体猪组织实验数据均采用Vevo LAZR‑X设备的B‑Mode模式进行采集,获得了超声图像和超声通道射频数据。实验中使用的探头是UHF29x,工作频率范围为15.0 MHz至29.0 MHz,中心频率为17 MHz。为了评估声速分布的准确性,本实验通过比较B‑Mode图像与声速分布图的结构相似度,并观察声速分布图的数值变化来进行验证,分别开展了仿体实验和离体动物组织实验。 [0149] (1)仿体实验: 在本次实验中,选择了CIRS公司提供的多功能多组织超声波性能检测模体,型号为040GSE。该仿体是市场上唯一同时提供弹性目标和所有标准B型成像测试对象的质量控制体模。该仿体由CIRS专有的Zerdine®水凝胶聚合物制成,这种材料能够模仿人体软组织的声学特性,其尺寸为17.8cm×12.7cm×20.3cm(长×宽×高)。实验数据集来源于模体深度为1.5cm的区域,其中背景的声速值为1540 m/s。实验结果如图5所示,其中,图5中第一层的图像表示只有一个检测目标的情况;图5中第二层的图像表示有两个弹性目标的情况。图5中(a)列对应的图像显示了使用Vevo F2设备生成的B‑Mode图像,图5中(b)列对应的图像为未改进前神经网络生成的声速分布预测图,图5中(c)列对应的图像为改进后的模型生成的声速分布预测图。通过B‑Mode图像可见,在深度1.5 cm处检测到目标,模型能够准确检测并区分该目标与背景的整体形状。 [0150] 第二层的B‑Mode图像展示了深度在1.5cm处的弹性区域内的成像情况,包含两个不同弹性值的弹性目标,其弹性值分别为60kPa和100kPa。未改进的模型中并不能检测到弹性值60kPa的目标,在本实验中改进后的模型成功识别到两个目标与背景声速的差异。实验测得背景声速值为1530 m/s,与理论值接近;弹性值为60 kPa的目标声速为1405 m/s,弹性值为100 kPa的目标声速为1449 m/s。 [0151] (2)离体动物组织实验:本实验选择带有管状结构的离体猪组织,在实验中选择了一块厚度为2 cm的猪肉作为实验介质,并在其内部嵌入直径约为1 cm的管状结构作为模拟检测目标。如图6所示,图6中的(a)图为该结构的B‑Mode图像,图6中的(b)图为未改进模型生成的声速分布预测图,图6中的(c)图则为本发明提出的模型生成的声速分布预测图。从实验结果可以观察到,所提出的模型能够准确检测出目标管状结构的整体形状(如图6中的(c)图中的红框所示的区域),并有效区分管状结构与猪肉组织之间的差异。进一步分析表明,模型预测的猪肉声速范围为 1500 m/s 至 1580m/s,与理论值声速值1540m/s基本一致,验证了模型的可靠性。 [0152] 综上可知,本发明对训练使用的模拟数据集进行了调整,并在现有的神经网络的基础上设计新增了加强通道间信息关系的“全局通道‑空间注意力”模块,从而有效地挖掘更多特征图信息。该网络架构在模拟数据、仿体数据和离体猪组织数据上均表现出令人鼓舞的性能,展示了该网络在超声声速重建方面的巨大潜力。 |