探秘肝脏/肝脏肿瘤图像分割:医学影像技术的新突破
一、引言
肝脏/肝脏肿瘤图像分割在医学领域占据着愈发重要的地位,为肝脏疾病的精准诊断与有效治疗提供了关键技术支撑。随着医学成像技术的飞速进步,如磁共振成像(MRI)和计算机断层扫描(CT)等,医学图像已成为临床医疗诊治不可或缺的关键依据。肝癌作为一种致死率极高的恶性疾病,利用肝部 CT 图像和 MRI 图像进行精准的医疗诊治至关重要。
近年来,深度学习在图像分割领域取得了令人瞩目的成就。卷积神经网络(CNN)作为深度学习中常用的模型,能够通过学习海量图像数据,自动提取图像特征,从而实现高精度的图像分割。在肝脏和肿瘤的图像分割任务中,深度学习同样展现出巨大的应用潜力。例如,可利用 CNN 对肝脏和肿瘤图像进行训练与学习,构建一个能够自动提取肝脏和肿瘤区域的模型。这种方法通常能够实现更高的准确性和鲁棒性,是未来肝脏及肿瘤图像分割研究的重要发展方向。
目前,已有众多基于深度学习的肝脏/肝脏肿瘤图像分割方法被提出。例如,陆雪松和闫书豪提出了基于迭代卷积神经网络的肝脏 MRI 图像分割方法。该方法将前次分割输出的概率图引入网络浅层,与来自编码器的低水平特征图进行融合,有效弥补了下采样过程中丢失的细节信息。通过在 ISBI 2019 liver-chaos 挑战数据集上的验证实验,该方法的分割精度较传统 U-Net 有显著提高,能够更好地服务于临床工程。
腾讯优图实验室联合厦门大学组成的 TencentX 团队,在全球 LiTS(Liver Tumor Segmentation Challenge,肝脏肿瘤病灶区 CT 影像分割挑战)中荣获肝分割、肝肿瘤分割两项技术世界第一。该团队提出的自动分割算法在数据预处理、深度学习网络模型设计、损失函数选择以及最终结果后处理等各个环节都力求做到最优。通过良好的数据预处理降低不同数据间的图像差异,针对肝脏分割模块设计新颖的 2.5D 全卷积神经网络,在肝肿瘤分割模块设计新颖的辅助损失函数,使网络能够有效挖掘肿瘤的空间信息,最后通过模型融合等后处理调整,确保了算法的可靠性和精准性。
此外,还有许多研究者在肝脏/肝脏肿瘤图像分割方面开展了深入研究。例如,有研究者使用 U-Net 进行 MRI 的肝脏分割,通过提取肝脏二值化掩膜,将 dicom 文件转换为 png 格式,并进行数据增强,最终使用 Python3.7 + Pytorch 1.4.0 搭建 U-net 网络并进行训练。还有研究者对肝脏及肿瘤图像分割方法进行了全面综述,介绍了基于阈值、基于区域、基于边缘和深度学习等几种常见图像分割方法在肝脏及肿瘤图像分割中的应用,并指出深度学习在肝脏及肿瘤图像分割中展现出了强大的潜力。
总之,肝脏/肝脏肿瘤图像分割在医学领域意义重大,深度学习技术为该领域提供了新的方法和思路。随着深度学习技术的不断发展,相信未来会有更多研究致力于开发更加准确、鲁棒的肝脏及肿瘤图像分割方法。
二、肝脏图像分割的最新技术
(一)基于多维度特征提取网络的肝脏图像分割
网络结构
基于多维度特征提取网络(RDD-UNet)是一种基于残差 UNet 和混合损失函数的三维分割网络。该网络从原始 CT 数据的三个轴向提取信息,采用长短跳跃连接的组合形式融合多尺度语义特征,确保层内和层间信息得到充分利用。同时,网络中设计了不平衡深度可分离空洞卷积模块,在提升三维网络计算效率的同时,扩大了体素级别的特征感受范围。
关键技术
- 长短跳跃连接融合多尺度语义特征:通过长短跳跃连接的组合形式,将不同层次的特征进行融合,充分利用层内和层间信息,提高了网络对肝脏图像的分割精度。
- 不平衡深度可分离空洞卷积模块:该模块在提升三维网络计算效率的同时,扩大了体素级别的特征感受范围,使网络能够更好地捕捉肝脏图像的细节信息。
- 混合损失函数与深度监督结构:针对小尺寸分割目标数据不平衡问题提出混合损失函数,并与深度监督结构相结合,提升了边缘细节的分割效果。
分割效果
该网络在公共数据集 LiTS 2017 上的 Dice 分数达到 0.9652,与其他方法相比达到了较高的精度水平。
(二)使用 U-Net 进行 MRI 的肝脏分割
数据格式转换
将 dicom 文件转换为 png 格式,虽可进行数据增强,但可能导致数据精度丢失。具体实现过程中,可使用多种工具和方法将 dicom 文件转换为 png 格式。例如,使用 pydicom 库读取 dicom 文件,通过 img_as_float 函数将图像数据转换为浮点数格式,最后使用 matplotlib.pyplot 和 cv2 库将图像保存为 png 格式。
数据增强
使用 Augmentor 工具进行图像旋转、左右互换、放大缩小等操作,扩充数据样本数。具体操作包括设置不同的概率和参数,如旋转的最大左旋角度和右旋角度、左右互换的概率、放大缩小的概率和面积比例等。同时,对增强后的图像进行重新命名,便于管理和使用。
U-net 网络搭建
采用经典网络结构加 Dropout 层用于肝脏分割。U-net 网络由编码器和解码器组成,编码器由多个卷积块构成,用于提取语义特征并压缩特征映射;解码器由多个反卷积块构成,用于将特征映射恢复到原始图像大小。在网络中加入 Dropout 层可防止过拟合,提高网络的泛化能力。
三、挑战与解决方案
(一)挑战
- 标准方形卷积与不规则器官形状不匹配:标准方形卷积无法与不规则的肝脏形状相匹配,导致分割结果的轮廓误差较大。在对肝脏肿瘤进行图像分割时,肝脏作为不规则器官,其形状复杂多变,传统标准方形卷积难以准确捕捉器官边缘信息,从而使分割结果轮廓与实际肝脏肿瘤轮廓存在较大误差。
- 池化下采样操作导致细节信息丢失:池化下采样操作连续使用会导致不可逆的病变细节信息丢失,小目标分割精度低。在肝脏肿瘤图像分割中,池化下采样操作虽可降低图像分辨率、减少计算量,但连续使用会使一些病变细节信息丢失,特别是对于小的肝脏肿瘤目标,经过多次池化下采样后易被忽略,导致小目标分割精度降低。
(二)解决方案
- 可变形 U-Net(DefED-Net):在特征编码阶段采用残差连接的可变形卷积块替代常规卷积,获取更好的上下文信息和特征表达。设计特征融合模块 Ladder-ASPP,采用密集连接方式获取更好的多尺度特征表达。
- 在特征编码阶段,可变形 U-Net 采用残差连接的可变形卷积块替代常规卷积。可变形卷积能够通过学习卷积核特征采样位置的偏移来学习不规则器官的形状信息。例如,在肝脏自动分割中,标准卷积核提取特征的范围无法与不规则形状的肝脏匹配,而可变形卷积可通过学习空间偏移量确定在目标图像中的特征采样位置,从而较好地提取分割目标的特征。同时,用残差设计构造特征编码器能加速神经网络收敛。
- 设计的特征融合模块 Ladder-ASPP 主要分两路进行特征采样和融合。上一路采用全局平均池化和 1×1 卷积获取通道注意力权重,并对通道信息进行提取和加权;下一路采用密集连接的可变膨胀率的膨胀卷积在保证参数量不变的情况下获取多尺度的空间上下文信息。因此,该模块可从通道和空间两个部分进行多尺度的特征融合,保证信息的丰富和有效。
- 其他方法:深度学习在肝脏及肿瘤图像分割中有广泛应用。卷积神经网络(CNN)可自动提取特征实现准确分割。结合不同的深度学习模型和技术,如注意力机制、残差连接、生成对抗网络(GAN)等可提高分割性能。将多模态医学图像数据应用于深度学习模型,融合不同模态数据可提高分割准确性。
- 深度学习在肝脏及肿瘤图像分割中的应用广泛。卷积神经网络(CNN)作为深度学习中常用模型,可通过学习大量图像数据自动提取图像特征,实现准确的肝脏及肿瘤图像分割。例如,全卷积网络(FCN)通常采用 U-Net 结构,通过一系列卷积层、池化层和上采样层逐步提取图像特征,实现精细的像素分类。近年来,研究者们对 FCN 进行了各种改进,如使用注意力机制、残差连接等,以提高肝脏肿瘤分割的性能。
- 结合不同的深度学习模型和技术可提高分割性能。例如,将三维卷积神经网络(3D-CNN)与其他深度学习技术相结合,如残差网络(ResNet)、生成对抗网络(GAN)等,可进一步提高肝脏肿瘤分割的性能。3D-CNN 可直接对三维 CT 数据进行处理,从而更好地利用图像的空间信息。
- 将多模态医学图像数据应用于深度学习模型也能提高分割准确性。为了提高肝脏肿瘤分割的准确性,研究者们将多模态医学图像数据(如 MRI、超声等)应用于深度学习模型中。通过融合不同模态的数据,可获得更丰富的特征信息,从而提高肝脏肿瘤分割的性能。例如,有研究将 CT 和 MRI 图像数据相结合,利用循环神经网络(RNN)对多模态数据进行编码,再结合 CNN 进行肝脏肿瘤的分割。
四、肝脏及肿瘤图像的分割方法
(一)基于阈值的图像分割
原理
通过设置不同阈值,将像素值高于或低于阈值的像素分为不同类别。在肝脏和肿瘤分割中,由于肝脏和肿瘤的像素值通常具有明显差异,这种方法可有效将肝脏和肿瘤从背景中分割出来。例如,在一些肝脏 CT 图像中,可通过设置特定阈值将肝脏组织和肿瘤组织与周围的其他组织区分开来。
优缺点
在肝脏和肿瘤分割中有效,但对阈值选择敏感,不合适的阈值可能导致不准确结果。因为不同图像可能具有不同的像素值分布,所以选择合适的阈值非常困难。若阈值选择不当,可能会将一部分肝脏或肿瘤组织错误地分类为背景,或者将一部分背景组织错误地分类为肝脏或肿瘤。
(二)基于区域的图像分割
原理
根据像素颜色或灰度强度将图像分割成不同区域。在肝脏和肿瘤的图像分割中,可利用像素的颜色或灰度强度差异将肝脏和肿瘤区域提取出来。例如,在一些肝脏 MRI 图像中,肝脏组织和肿瘤组织的灰度强度可能与周围组织不同,可通过这种方法将它们分割出来。
优缺点
适用于背景和前景有明显颜色或灰度强度差异的图像,但在处理复杂医学图像时可能遇到困难。医学图像的背景和前景往往具有很高的相似性,这使得基于区域的分割方法在处理复杂医学图像时可能会出现错误。例如,在一些肝脏 CT 图像中,肝脏组织和周围组织可能具有相似的灰度强度,使得基于区域的分割方法难以准确分割出肝脏区域。
(三)基于边缘的图像分割
原理
通过检测图像中不同区域的边缘来分割图像。在肝脏和肿瘤的图像分割中,可利用边缘检测算法找出肝脏和肿瘤的边缘,从而实现准确的分割。例如,在一些肝脏超声图像中,可通过边缘检测算法检测出肝脏和肿瘤的边缘,然后将它们分割出来。
优缺点
在处理具有明显边缘的图像时效果较好,但边缘检测算法对噪声敏感。医学图像中往往存在噪声,这会影响边缘检测算法的准确性。例如,在一些肝脏 CT 图像中,噪声可能会导致边缘检测算法错误地检测出一些不存在的边缘,从而影响分割结果的准确性。
(四)深度学习方法
全卷积网络(FCN)
采用 U-Net 结构,通过一系列卷积层、池化层和上采样层逐步提取特征,实现精细像素分类。FCN 通常采用 U-Net 结构,通过一系列卷积层、池化层和上采样层逐步提取图像特征,实现精细的像素分类。在肝脏和肿瘤的图像分割中,可利用 FCN 对肝脏和肿瘤的图像进行像素级别的分类,从而实现准确的分割。例如,有研究将 FCN 应用于肝脏肿瘤 CT 图像分割,通过对大量标注的 CT 图像进行训练,FCN 能够自动学习到肝脏和肿瘤的特征,从而实现对肝脏肿瘤的精确分割。近年来,研究者们对 FCN 进行了各种改进,如使用注意力机制、残差连接等,以提高肝脏肿瘤分割的性能。例如,有研究在 FCN 中引入注意力机制,使网络更加关注肝脏和肿瘤区域的特征,从而提高分割的准确性。
三维卷积神经网络(3D-CNN)
直接处理三维 CT 数据,更好地利用空间信息,提高分割准确性。三维卷积神经网络是一种处理三维医学图像的有效方法。与 FCN 相比,3D-CNN 可直接对三维 CT 数据进行处理,从而更好地利用图像的空间信息。在肝脏和肿瘤的图像分割中,可利用 3D-CNN 对肝脏和肿瘤的三维 CT 图像进行分割,从而获得更准确的分割结果。例如,有研究将 3D-CNN 应用于肝脏肿瘤分割,通过对肝脏和肿瘤的三维 CT 图像进行训练,3D-CNN 能够自动学习到肝脏和肿瘤的空间特征,从而实现对肝脏肿瘤的准确分割。近年来,研究者们将 3D-CNN 与其他深度学习技术相结合,如残差网络(ResNet)、生成对抗网络(GAN)等,以进一步提高肝脏肿瘤分割的性能。例如,有研究将 3D-CNN 与 ResNet 相结合,通过在 3D-CNN 中引入残差连接,使网络更加容易训练,从而提高分割的准确性。
基于多模态数据
融合不同模态数据,获得更丰富特征信息,提高分割性能。为了提高肝脏肿瘤分割的准确性,研究者们将多模态医学图像数据(如 MRI、超声等)应用于深度学习模型中。通过融合不同模态的数据,可获得更丰富的特征信息,从而提高肝脏肿瘤分割的性能。例如,有研究将 CT 和 MRI 图像数据相结合,利用循环神经网络(RNN)对多模态数据进行编码,再结合 CNN 进行肝脏肿瘤的分割。又如,有研究将超声图像和 CT 图像相结合,通过融合两种模态的数据,获得更丰富的肝脏和肿瘤的特征信息,从而提高分割的准确性。
五、肝脏及其肿瘤图像的分割装置
肝脏及其肿瘤图像的分割装置主要由图像获取模块、肝脏图像分割模块和肝脏肿瘤图像分割模块组成。
图像获取模块
获取腹部磁共振影像。通过先进的医学成像设备采集高质量的腹部磁共振影像数据,为后续的图像分割提供原始素材。
肝脏图像分割模块
使用肝脏模型确定感兴趣区域,如 Dial3DResUNet,结合长短程跳跃连接结构和混合空洞卷积进行精准肝脏分割。
Dial3DResUNet 仅用三个降采样层,此时基础模型在编码器末端的感受野大小为 90×90×90。为了在模型编码器的深层部分提取到图像不同位置之间的长程依赖关系,加入混合空洞卷积。具体而言,将基础模型编码器部分的第二个降采样层后连续的三个卷积层的空洞率分别设置为 1、2、4,将第三个降采样层后连续的三个卷积层空洞率分别设置为 3、4、5。加入空洞卷积后的模型在编码器末端感受野提升至 266×266×266。
对于模型解码器部分,在每个 stage 末端引入辅助损失,形成深度监督机制。
肝脏肿瘤图像分割模块
使用肝脏肿瘤模型进行精细分割以减少假阳性,如 H3DNet,由 Hybrid-3D 卷积组成,有效提取肿瘤三维特征并减少模型参数量。
在训练样本采样规则上,根据肿瘤金标准,找到每一个肿瘤的三维包围盒,并在三个维度上均向外扩张一定的比例。在训练采样时,仅在这些膨胀过的三维立方体内随机采出固定大小的 block 进行训练。
从卷积模块上,提出 Hybrid-3D 卷积,其将一层 3D 卷积解耦为两层,分别为 intra-slice 卷积和 inter-slice 卷积。前者负责提取输入张量中 XY 方向上的特征,后者负责对 Z 轴方向上的特征进行融合。一个 3D 卷积层表示为 Conv (I,O,D,H,W),一个 Hybrid-3D 模块表示为 Conv (I,M,1,H,W)+Conv (M,O,D,1,1),其中 I 代表输入特征图通道数量,M 代表中间层特征图的通道数量,O 代表输出层特征图的通道数量,D、H、W 分别表征 Z、X、Y 三个正交维度上使用的卷积核大小。在 D、H、W 都设为 3 的情况下,3D 卷积总参数量为 27IO,Hybrid-3D 的总参数量为 9IM + 3MO。超参数 M 控制 Hybrid-3D 整体参数量,将其设定为与输入通道数相同,因此 Hybrid-3D 模块仅有 3D 卷积 44% 的参数量。保留基础模型中的第一个和最后一个 stage 以及其余每一个 stage 中的第一个卷积层不变,并将其余的 3D 卷积全部替换为 Hybrid-3D 卷积,称替换后的模型为 H3DNet。模型参数量替换前为 8.4M,替换后为 5.0M。
此外,在模型训练之后还可根据特定公式进行评价,进一步确保分割的准确性和可靠性。这种先进的肝脏及其肿瘤图像分割装置为医学诊断和治疗提供了有力的支持。
六、肝脏图像分割在医学中的应用
(一)基于深度学习的肝脏肿瘤分割实战
数据问题
肿瘤与肝脏灰度值重叠,通过划分数据等级、调整数据预处理方法解决。在进行肝脏肿瘤分割的实践中,遇到了肿瘤与肝脏灰度值几乎重叠的问题。为解决这一难题,首先从数据库的选择入手,从 3Dircadb 数据库换成数据量更大的 LiTS2017 数据库。然后,根据病人的肝脏与肿瘤直方图分布,手动将 130 位病人划分成了三个等级:level1 为肝脏与肿瘤对比度最大;level3 为肝脏与肿瘤的对比度几乎没有;训练数据只选择 level1 和 level2。同时,在数据预处理过程中,进行了如 ROI 操作等一系列处理。但在实验过程中,依然出现问题。后来发现,ROI 操作会将真实肝脏分割结果与原图做 “与” 操作,使非感兴趣的区域变黑,让网络集中注意力在肝脏内部的区域。然而,肝脏内部的肿瘤灰度值一般低于肝脏,也会在这个过程中变成黑色,这就产生了矛盾。于是,进行了大胆的实验,将肝脏变成灰色,肿瘤变成白色,肝脏外的区域为黑色,进行了颜色翻转。这一操作使得训练集上的 dice 系数达到 90% 左右,测试集上达到 70% 左右,虽然不够完美,但证明了方法的可行性,也再次强调了数据处理在肝脏肿瘤分割中的重要性。
实验结果
经过颜色翻转等操作,训练集和测试集的 dice 系数得到提高。通过上述一系列的数据处理和实验调整,最终在训练集和测试集上的 dice 系数都有了显著提高。训练集上 dice 系数从最初的问题状态提升到了 90% 左右,测试集上也达到了 70% 左右。这一结果表明,合理的数据处理和创新的实验方法对于提高肝脏肿瘤分割的准确性具有重要意义。
(二)自动上下文模型在三维 CT 肝脏图像分割中的应用
自动上下文模型介绍
自动上下文模型(ACM)由密集块和上下文模块组成,在不同层次上捕获并结合不同尺度下的物体上下文信息,提高图像分割准确性。上下文模块通过多次卷积操作和池化操作实现对不同尺度下的信息提取和融合。密集块由多个密集块单元(DenseBlockUnits,DBU)组成,每个 DBU 由多个卷积层和批量归一化层组成。ACM 的输出层是一个具有跳接连接的全卷积层,它使用了扩张卷积操作,进一步提高了分割准确性。
实验结果
在公开数据集 LiTS 上进行实验,与其他深度学习方法比较,准确性最高,Dice 系数为 0.925。为验证自动上下文模型在三维 CT 肝脏图像分割中的有效性,进行了一系列实验。使用公开数据集 LiTS(Liver Tumor Segmentation Challenge),该数据集包含 201 个三维 CT 肝脏图像。将数据集分为训练集和测试集,其中训练集包含 174 个样本,测试集包含 27 个样本。将 ACM 与其他深度学习方法进行了比较,包括 UNet、DenseUNet 和 MultiResUNet。实验结果表明,ACM 在三维 CT 肝脏图像分割中的准确性最高,Dice 系数为 0.925,较其他方法提高了约 2% 左右。这一结果充分证明了自动上下文模型在三维 CT 肝脏图像分割中的优势和潜力。
七、结论
肝脏/肝脏肿瘤图像分割技术在医学领域具有重要的应用价值。随着深度学习技术的不断发展,各种新的分割方法和模型不断涌现,为肝脏疾病的诊断和治疗提供了更准确、高效的手段。未来,我们可以期待更多创新的技术和方法,进一步提高肝脏图像分割的准确性和实用性。
目前,基于深度学习的肝脏/肝脏肿瘤图像分割技术已取得显著成果。例如,腾讯优图实验室联合厦门大学组成的 TencentX 团队在全球 LiTS 挑战中荣获肝分割、肝肿瘤分割两项技术世界第一。此外,还有许多研究者提出了各种新的分割方法和模型,如基于多维度特征提取网络的肝脏图像分割、可变形 U-Net 特征编码阶段采用残差连接的可变形卷积块替代常规卷积等方法,都在提高肝脏图像分割的准确性和实用性方面发挥了重要作用。
然而,肝脏/肝脏肿瘤图像分割技术仍面临一些挑战。例如,标准方形卷积无法与不规则的器官形状相匹配,导致分割结果的轮廓误差较大;池化下采样操作连续使用会导致不可逆的病变细节信息丢失,小目标分割精度低等问题。为解决这些问题,研究者们提出了各种解决方案,如采用可变形卷积、设计特征融合模块、结合不同的深度学习模型和技术、将多模态医学图像数据应用于深度学习模型等方法,都在一定程度上提高了肝脏图像分割的准确性和实用性。
未来,肝脏/肝脏肿瘤图像分割技术的发展方向可能包括以下几个方面:一是进一步提高分割的准确性和实用性,通过不断改进深度学习模型和算法,提高对肝脏/肝脏肿瘤图像的分割精度和鲁棒性;二是结合多模态医学图像数据,通过融合不同模态的数据,获得更丰富的特征信息,提高肝脏/肝脏肿瘤图像分割的准确性和实用性;三是实现自动化和智能化,通过引入自动化和智能化技术,实现肝脏/肝脏肿瘤图像分割的自动化和智能化,提高分割效率和准确性。
总之,肝脏/肝脏肿瘤图像分割技术在医学领域具有重要的应用价值,随着深度学习技术的不断发展,相信未来会有更多的研究致力于开发更加准确、鲁棒的肝脏及肿瘤图像分割方法。
八、肝脏相关数据集
肝脏相关数据集涵盖多种类型,为肝脏/肝脏肿瘤图像分割研究提供了丰富的数据支持。这些数据集包含不同医院、不同设备采集的肝脏和肝脏肿瘤图像,具有多样性和代表性。数据集地址可通过微信小程序猫脸码客获取,方便研究人员进行数据下载和使用,以推动肝脏/肝脏肿瘤图像分割技术的进一步发展。