Deep semi-supervised learning for medical image segmentation: A review

概述

在这里插入图片描述
在这里插入图片描述

  1. 医学图像分割的重要性:它是计算机辅助诊断(CAD)的关键部分,能帮助医生定位病变、评估治疗效果,减轻医生工作量。

  2. 深度学习技术的应用:U-Net等网络在医学图像分割中表现优异,近期大型视觉语言模型也展现出潜力。

  3. 数据稀缺的挑战:医学图像标注数据少(因疾病罕见、隐私问题、标注成本高),导致模型容易过拟合。

  4. 现有解决方案的局限性:降低模型复杂度、正则化、数据增强等方法效果有限。

  5. 半监督学习的潜力:通过利用少量标注数据和大量未标注数据,可能缓解数据稀缺问题,包括传统方法(多视图、图模型、生成模型)和深度半监督学习。

现在AI技术(尤其是深度学习)在医学影像分析中很厉害,比如用U-Net这种网络可以自动圈出CT或MRI图像里的肿瘤或器官,帮医生更快诊断。但问题是,训练这些AI需要大量带标注的医疗图片,而现实中这种数据很难搞到——要么因为罕见病例少,要么因为患者隐私保护,而且请专家标注图片又贵又费时间。

目前解决数据少的方法(比如简化AI模型、数据增强)效果一般,所以研究者开始尝试“半监督学习”:让AI既学少量标注数据,也利用大量未标注数据(比如医院里现成的未标记片子),这样可能更省钱又高效。

假设你要教小朋友认动物,但只有几张带标签的猫狗图片(有标注数据),和一堆无标签的动物照片(未标注数据)。传统方法是只反复用那几张带标签的图训练,而深度半监督学习会

  1. 先用带标签的图教基础规则(比如猫有尖耳朵)。

  2. 对无标签图片,让模型自己猜标签(伪标签)或发现规律(比如“这两张图耳朵形状一致,可能是同类”)。

  3. 通过设计更聪明的练习(损失函数)或学习工具(模型结构),让小朋友举一反三,最终认得更准

![[Pasted image 20250702095110.png]]

三个关键假设

平滑假设(保证局部一致性)

相似的输入,应该有相似的输出
如果两个样本(比如两张医学图像)在特征空间里距离很近(比如像素分布、纹理相似),那它们的标签(比如是否患病)也应该相似

聚类假设(保证全局一致性)

同一类别的数据会聚在一起
数据在特征空间中会形成聚类(Cluster),同一聚类内的样本属于同一类别
因此,决策边界(分类的分界线)应该避开高密度区域(即不要穿过聚类中心)

低密度分离假设

分类边界应该位于数据稀疏的地方
聚类假设的强化版,明确要求决策边界不能穿过数据密集区,而要在空白区域。

图像五大分割方法

伪标签法(Pseudo-Labeling)

先用标注数据训练初始模型,然后用该模型对未标注数据预测伪标签(Pseudo-Label),再将这些伪标签加入训练集重新训练模型。

典型方法

  • 自训练(Self-training):模型自己生成伪标签迭代优化。

  • 协同训练(Co-training):多个模型互相提供伪标签(如不同视角或模态的数据)。

改进方向

  • 筛选高置信度伪标签(避免错误标签累积)。

  • 动态阈值调整(不同类别采用不同置信度阈值)。

  • 不确定性估计(剔除不可靠预测)。

优点:简单易实现,计算成本低
缺点:错误伪标签会导致“累积偏差”(误差越来越大)
未来方向:结合不确定性建模、多模型协同优

一致性正则化(Consistency Regularization)

对同一输入施加不同扰动(如噪声、数据增强),要求模型输出保持一致(即预测结果不应因微小变化而剧烈波动)

![[Pasted image 20250702114946.png]]

(1)数据一致性(Data Consistency)
对未标注数据进行不同增强或扰动,强制模型对这些变体给出相同或相似的预测

(2) 模型一致性(Model Consistency)
模型本身施加约束(如参数扰动、多模型交互),确保不同模型变体的输出一致

(3)任务一致性(Task Consistency)
通过多任务学习辅助任务(如重建、分类)约束主任务(分割)的一致性。

典型方法

  • Π-Model:同一图像两次不同增强后预测应一致。

  • Mean Teacher:学生模型和教师模型(EMA平滑版)输出需一致。

  • FixMatch:强增强数据与弱增强数据的预测一致。

改进方向

  • 更强的数据增强策略(如MixUp、CutMix)。

  • 自适应一致性权重(不同样本赋予不同重要性)。

优点:避免依赖伪标签,适合噪声多的数据。
缺点:对扰动方式敏感,可能过拟合增强策略。
未来方向:自适应扰动策略、多模态一致性学习。

基于生成对抗网络(GAN)的方法

![[Pasted image 20250702112729.png]]

利用**生成器(Generator)合成逼真数据,判别器(Discriminator)区分真实标注数据和生成数据,通过对抗训练提升分割性能。

典型方法

  • SegAN:生成器生成分割图,判别器判断其真实性。

  • CycleGAN:跨模态数据转换(如MRI→CT)辅助分割。

改进方向

  • 更稳定的GAN训练(如Wasserstein GAN)。

  • 结合半监督损失(如一致性正则化+GAN)。

优点:能生成多样化数据,缓解标注不足问题。
缺点:训练不稳定,计算成本高。
未来方向:轻量化GAN、结合扩散模型(Diffusion Models)。

基于对比学习(Contrastive Learning)的方法

让相似样本(正样本)在特征空间靠近,不相似样本(负样本)远离,从而学习更好的特征表示(之前看过的facenet也是)

高级特征 vs. 低级特征

![[Pasted image 20250702113147.png]]

典型方法

  • SimCLR:同一图像的不同增强版本作为正样本。

  • MoCo:使用动态记忆库存储负样本。

改进方向

  • 医学图像特异性对比策略(如解剖结构相似性)。

  • 减少负样本偏差(医学数据类别不平衡)

优点:特征提取能力强,适合小样本场景。
缺点:需要大量负样本,计算开销大。
未来方向:无负样本对比学习(如BYOL)、跨模态对比

混合方法(Hybrid Methods)

结合上述多种方法(如伪标签+一致性正则化+对比学习),取长补短

典型方法

  • UPS(Uncertainty-aware Pseudo-labeling and Self-training):伪标签+不确定性估计。

  • CCT(Cross-Consistency Training):一致性+对比学习。

优点:性能通常优于单一方法。
缺点:设计复杂,调参难度大。
未来方向:自动化方法组合(如NAS搜索最优混合策略)。

方法核心思想优点缺点适用场景
伪标签法模型自生成标签迭代训练简单、计算高效错误标签累积风险标注数据较少但质量高
一致性正则化不同扰动下预测应一致避免伪标签偏差依赖数据增强策略数据增强有效的任务(如CT)
GAN方法生成对抗数据提升泛化能力数据多样性增强训练不稳定、计算成本高需要合成数据的复杂任务
对比学习特征空间正负样本分离特征提取能力强需大量负样本、计算量大小样本但需强特征表示的任务
混合方法结合多种策略性能通常最优设计复杂、调参难对精度要求极高的任务

评估指标

  1. Dice系数(Dice Score):

    • 衡量预测结果和医生标注的重叠程度(0~1,越接近1越好)。

    • 通俗理解:像“考试得分”,90分(Dice=0.9)比70分(Dice=0.7)好。

  2. Jaccard指数(IoU):

    • 类似Dice,但计算方式不同(通常比Dice略低)。
  3. 平均表面距离(ASD)

    • 预测边界和真实边界的平均误差(单位:毫米)。

    • 通俗理解:像“测量肿瘤边界的偏差”,误差越小越好。

  4. 95% Hausdorff距离(HD95)

    • 剔除5%异常值后的最大边界误差(对噪声更鲁棒)。

    • 通俗理解:像“去掉最离谱的错题后,看最差能错多远”。

类型代表方法性能表现原因分析
单模型自训练(Chen et al. 2022)较低易过拟合(标注数据少时,模型“死记硬背”)。
多模型Mean Teacher、UMCT更高、更稳定多模型互相纠错(如教师模型提供稳定伪标签,协同训练多视角学习)。
例外URPC(单模型+金字塔一致性)媲美多模型通过多尺度(多模态???)一致性约束(不同放大倍率的预测需一致),减少偏差。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/87148.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/87148.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[云上玩转Qwen3系列之四]PAI-LangStudio x AI搜索开放平台 x ElasticSearch: 构建AI Search RAG全栈应用

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于AI搜索开放平台 x ElasticSearch 的 AI Search RAG 智能检索应用。该应用通过使用 AI 搜索开放平台、ElasticSearch 全文检索向量检索引擎的混合检索技术配合阿里云最新发布的 Qwen3 推理模型编排在一个 Agentic Workf…

前端请求浏览器提示net::ERR_UNSAFE_PORT的解决方案

起因 项目中后端给到了6666端口的服务地址, 随即前端项目访问中浏览器报错如下: 不安全端口在主流浏览器(Chrome/Firefox/Edge/Safari)中会被拦截,触发浏览器Network的status列显示 net::ERR_UNSAFE_PORT 错误, 以下是常见的不安全端口一览…

【Bluedroid】蓝牙设备管理器初始化全流程深度解析(BTA_dm_on_hw_on)

本文全面剖析Android蓝牙设备管理器在硬件启动时的初始化流程,涵盖控制块创建、服务发现启动、设备类配置、安全密钥加载、超时参数设置等核心环节。通过分析从底层硬件交互到上层服务注册的全链路调用,揭示蓝牙系统从硬件就绪到功能可用的完整启动机制&…

大语言模型:是逐字生成还是一次多词?

大语言模型(LLM)既可以按顺序逐个生成单词(token),也能实现一次生成多个 token 核心差异源于解码策略与模型架构设计 一、常规“逐个生成”模式(基础逻辑) 多数入门级演示或简单文本生成中,LLM 会默认按 “生成一个 token → 拼接回输入 → 再生成下一个” 的流程,…

通俗易懂的LangGraph图定义解析

LangGraph 是一个基于状态的工作流框架,它通过 节点(Nodes) 和 边(Edges) 的组合,构建出复杂的工作流逻辑。这种设计特别适合处理需要动态决策、循环、多步骤交互的场景(比如对话系统、智能代理…

K8s Pod调度基础——2

目录 一、Deployment ‌一、Deployment 原理‌ ‌二、核心特性‌ ‌三、意义与场景‌ ‌四、示例与逐行解释‌ ‌五、总结‌ StatefulSet ‌一、StatefulSet 原理‌ ‌二、核心特性‌ ‌三、意义与场景‌ ‌四、示例与逐行解释‌ ‌五、总结‌ 彼此的区别 一、本质…

Java 大视界 -- Java 大数据在智能医疗健康管理中的慢性病风险预测与个性化干预(330)

Java 大视界 -- Java 大数据在智能医疗健康管理中的慢性病风险预测与个性化干预(330) 引言:正文:一、Java 构建的医疗数据融合平台(多源数据安全打通)1.1 分布式医疗数据集成系统(符合 HIPAA 与…

beego打包发布到Centos系统及国产麒麟系统完整教程

1、先清除go缓存,用下面命令 go clean -cache go clean -modcache 2、更新库文件 go mod tidy 3、安装beego go install github.com/beego/bee/v2latest 4、查看bee版本 5、进行打包然后传到Centos和麒麟服务器如下代码 bee pack -be GOOSlinux -be GOARCHa…

Instagram和facebook广告对比解析

一、平台用户画像对比 用户基础数据 (1)活跃用户规模 Instagram:20亿MAU,以年轻群体为主力 Facebook:29亿MAU,覆盖全年龄段用户 (2)核心用户特征 Instagram: • 25-3…

[MIA 2025]CLIP in medical imaging: A survey

论文网址:CLIP in medical imaging: A survey - ScienceDirect 项目页面:github.com 英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误,若有发现欢迎评论指正!文章偏…

Python通讯录系统实战教程

具体介绍见 通讯录管理系统设计与实现(C)-CSDN博客 class Person:def __init__(self, name"", sex0, age0, phone"", addr""):self.m_name name # 姓名self.m_Sex sex # 性别(1-男,2-女…

虾米壁纸分类页面代码

<template> <view class"wallpaper-category"> <custom-nav-bar title"分类列表"></custom-nav-bar> <!-- 分类展示 --> <scroll-view scroll-y class"category-scroll-view"> <view cl…

K8s-pod 调度基础

目录 Replication Controller&#xff08;RC&#xff09; 概念 关键字段 Replica Set&#xff08;RS&#xff09; 概念 关键字段 RC 与 RS 的区别 无状态应用管理Deployment 无状态应用&#xff08;Stateless Application&#xff09; 什么是无状态&#xff1f; 无状…

Vue + RuoYi 前后端分离入门手册

Vue RuoYi 前后端分离技术栈是一个非常流行且成熟的企业级后台管理系统开发方案&#xff0c;尤其在国内 Java 开发社区中广泛应用。它结合了现代化的前端框架 Vue.js 和基于 Spring Boot 的后端框架 RuoYi&#xff0c;提供了开箱即用的权限管理、代码生成、监控等功能&#xf…

JSON 安装使用教程

一、JSON 简介 JSON&#xff08;JavaScript Object Notation&#xff09;是一种轻量级的数据交换格式&#xff0c;易于人阅读和编写&#xff0c;同时也易于机器解析和生成。它广泛应用于前后端数据通信、配置文件、API 传输等场景。 二、JSON 是否需要安装&#xff1f; 不需要…

十大网络协议

十大网络协议 标题1. HTTP&#xff08;HyperText Transfer Protocol&#xff0c;超文本传输协议&#xff09;标题2. HTTPS&#xff08;Secure Hypertext Transfer Protocol&#xff0c;安全超文本传输协议&#xff09;标题3. HTTP/3标题4. TCP&#xff08;Transmission Control…

【语音告警】博灵智能语音报警灯Modbus TCP触发告警实例-语音报警灯|声光报警器|网络信号灯

功能说明 本文将以Python代码为例&#xff0c;讲解如何通过Python代码调用博灵语音通知终端A4实现声光语音告警。 本代码实现Python触发Modbus写多寄存器和写单寄存器实现调用通知终端模板播报功能&#xff08;通知终端内置TTS语音合成技术&#xff0c;本案例不讲解如何文本转…

摄像头 rtsp数据量 和正常数据流有什么区别

摄像头RTSP数据流和正常数据流&#xff08;如HTTP传输的普通文件或网页数据&#xff09;在多个方面存在显著差异&#xff0c;主要体现在协议特性、数据量、实时性、应用场景等方面。以下是具体对比&#xff1a; 1. 协议与传输方式 RTSP流&#xff1a; 实时流协议&#xff08;R…

深入理解装饰器模式:动态扩展对象功能的灵活设计模式

深入理解装饰器模式&#xff1a;动态扩展对象功能的灵活设计模式 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 总有一行代码&#xff0c;能点亮万千星辰。 &#x1f50d; 在技术的宇宙中&#xff0c;我愿做永不停歇的探索者。 ✨ 用代码丈量世界…

141.在 Vue 3 中使用 OpenLayers Link 交互:把地图中心点 / 缩放级别 / 旋转角度实时写进 URL,并同步解析显示

本文分享一个前端小技巧&#xff1a;借助 OpenLayers 的 Link 交互 在浏览器地址栏实时记录地图状态&#xff0c;同时把这些参数解析出来展示在页面上。 ✨ 双向同步&#xff1a;拖动、缩放、旋转地图时&#xff0c;URL 自动更新&#xff1b;手动修改 URL 或后退 / 前进&#x…