1. 弱监督与主动学习
- ASTE-AL框架(TPAMI 2024):提出对抗性时空集成主动学习方法,通过点标记数据集(每张图像仅需10个标注点)达到全监督模型98%-99%的性能。其核心模块包括:
- FPGD-PA对抗攻击:通过无额外计算成本的自由梯度下降攻击定位不确定像素。
- 时空集成策略:减少模型鲁棒性带来的计算开销。
- 关系感知多样性采样:避免过采样问题,提升模型泛化能力。
2. 多模态与Transformer
- 自适应卷积注意力与掩码结构(2025):结合CNN和Transformer,设计掩码感知解码模块和卷积注意力上下文增强模块,解决逐像素预测的语义不均问题,在多个数据集上实现显著性能提升。
- VST++(TPAMI 2024):在纯Transformer架构VST基础上优化,引入选择-集成注意力(SIA),将前景划分为细粒度片