数据是泰迪杯主办方提供的已经标记好的数据,4k画质的图片,总大小8个G
链接:https://pan.baidu.com/s/1fvmNHGrLvflEovjfCjDLOw?pwd=6666
提取码:6666
虫害包括:
八点灰灯蛾 | 褐飞虱属 | 白背飞虱 | 二化螟 | 蟋蟀 | 黄足猎蝽 | 黄毒蛾 | 粘虫 |
农田虫害识别优秀作品
https://www.tipdm.org/u/cms/www/202206/27143450a8sn.pdf
解决方案
在上述背景研究、问题分析和相关研究的基础之上,我们针对本次农作物害虫识 别任务,采用基于两阶段的目标检测算法 Casecade RCNN 和结合 Swin-Transformer 的 Mask RCNN 算法作为基本框架,进行模型融合,并使用离线数据增强和在线数据增强 组合,以及 SWA(随机权重平均)进一步进行性能的提升。
针对 1.2 提出的四个问题,相应采用以下解决方案:
1) 目前主流的目标检测算法都是基于两阶段的方法(Fast RCNN、Faster RCNN、Mask RCNN等)以及一阶段的方法(YOLO系列、SSD等),相比 于对识别速度的要求,农作物害虫检测更偏向于算法识别精确度的要求,故 选用主流的两阶段目标检测方法作为模型:Cascade Mask RCNN ,并使用目 前在目标检测领域效果最好的 Swin-Transformer 模型作为我们的特征提取层。
2) 针对某些类别目标太小以及个别类别样本数目,我们采用 copy and paste 方 法离线数据增强进行扩充数据集,并且采用随机反转、旋转、高斯噪声等在线数据增强进一步在训练之前处理数据集。以及对训练集和测试集数据使用 多尺度进行训练和预测,增加对小目标的识别效果。
3) 为了能更好的提升模型的识别效果,进一步使用每个模型不同的 epoch 的权 值进行 SWA,并把使用两个模型 SWA 后的网络权重的预测结果进行 NMS, 获取模型融合后的检测结果。
对于目标检测,基于深度学习的主流模型大致分为两类:
(1)两阶段目标检测算
法:Fast RCNN、Faster RCNN、Mask RCNN、Cascade Mask RCNN 等,这些方法首先
产生候选区域(region proposals),然后对候选区域进行分类;
(2)一阶段检测算法:
不需要 region proposals 阶段,直接产生目标的类别概率和位置坐标值,如 Yolo 系列和
SSD。
优缺点分析
优点:
⚫ 通过对农作物害虫图片的数据集处理和进行数据增强,能够有效的应对长尾 效应和多尺度目标问题;
⚫ 选择 Resnet50 Cascade Mask RCNN 和 Swin-S Cascade Mask RCNN 作为主要模 型,更能贴合农作物害虫识别的目标检测任务;
⚫ 采用 K-means 聚类完成锚框长宽比的确定,使用 Smooth L1 损失函数和 Soft NMS,更能符合害虫识别的应用场景;
⚫ 基于随机权重平均和多模型融合的方法,让网络识别效果更好,缓解误检和 漏检的可能性。
缺点:
⚫ 由于采用 Swin-S Cascade Mask RCNN 和 Resnet50 Cascade Mask RCNN 两个模 型进行训练,以及采用训练时和测试时的多尺度,导致模型的训练和检测, 需要耗费大量的显存资源以及时间成本;
⚫ 基于 copy and paste 的数据扩充方法,还是有一定程度存在与背景不符的可能 性,存在少数图片的重叠情况,应该进一步考虑。