【DL学习笔记】常用数据集总结

一、如何找数据集

  • paperswithcode,但好像没了

  • AutoDL
    在这里插入图片描述

  • Roboflow
    在这里插入图片描述

  • Kaggle
    在这里插入图片描述

  • Hungging Face
    在这里插入图片描述

  • 百度飞浆PP AIStudio
    在这里插入图片描述

二、目标检测数据集格式

常用数据集坐标格式

  • MSCOCO : 坐标格式(x,y,w,h),其中 x , y 是左上角的坐标
  • Pascal VOC :坐标格式(xmin,ymin,xmax,ymax),其中 (xmin, ymin) 是左上角的坐标,(ymin, ymax)是右下角的坐标
  • YOLO 要求坐标格式为(cx,cy,w,h), 其中 cx,cy 是 bbox 中心点的坐标

Pascal VOC

简介,官方

PASCAL 全称:Pattern Analysis, Statical Modeling and Computational Learning​

​PASCAL VOC(The PASCAL Visual Object Classes )是一个经典的计算机视觉数据集,由牛津大学、马里兰大学和微软剑桥研究院的研究人员创建的。 该数据集于2005年首次发布,从那时起就被用于训练和评估目标检测算法。​ ​

PASCAL VOC 从 2005年开始举办挑战赛,每年的内容都有所不同,主要包括:​

  • 图像分类(Classification )​
  • 目标检测(Detection)​
  • 目标分割(Segmentation)​
  • 人体布局(Human Layout)​
  • 动作识别(Action Classification)​ ​

我们知道在 ImageNet挑战赛上涌现了一大批优秀的分类模型,而PASCAL挑战赛上则是涌现了一大批优秀的目标检测和分割模型,这项挑战赛已于2012年停止举办了,但是研究者仍然可以在其服务器上提交预测结果以评估模型的性能。​ ​

虽然近期的目标检测或分割模型更倾向于使用MS COCO数据集,但是这丝毫不影响 PASCAL VOC数据集的重要性,毕竟PASCAL对于目标检测或分割类型来说属于先驱者的地位。对于现在的研究者来说比较重要的两个年份的数据集是 PASCAL VOC 2007 与 PASCAL VOC 2012,这两个数据集频频在现在的一些检测或分割类的论文当中出现。

官网地址:http://host.robots.ox.ac.uk/pascal/VOC/​
官方文档 : http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham10.pdf

MS COCO

简介、官网、论文

全称为Microsoft Common Objects in Context,是一个由微软公司创建的用于图像识别和物体检测的大型数据集。
官网地址:https://cocodataset.org/
在这里插入图片描述

点击Dataset下的Explore可以查相关类别的示例图。
在这里插入图片描述

论文地址:Microsoft COCO: Common Objects in Context,PDF下载

在这里插入图片描述

数据集特点

在这里插入图片描述stuff是指没有明确边界的物体,比如天空、街道、草地等等。

版本,下载

MS COCO数据集有两个版本:MS COCO 2014和MS COCO 2017。这里介绍2017版本,2017版数据集是对2014版数据集的扩展和更新,2017版较2014版的变化有:

  • 2017版和2014版使用完全相同的图像
  • 2017版训练集/验证集的划分是118K/5K,而2014版是83K/41K
  • 2017版中用于检测类任务 / 关键点检测的注释和2014版是一样的,但是增加了40K张训练图像(118K训练集中的子集)和所有验证集的stuff标注(后面有介绍stuff categories)
  • 2017年的测试集只有两个部分(开发集/挑战集),而2014版的测试集有四个部分(开发集/标准集/储备集/挑战集)。开发集用于比赛选手自己测试,挑战集用于竞赛。
  • 2017版发布12万张来自COCO的无标记的图像,这些图像遵循与标记图像相同的类分布,可用于半监督学习。

数据结构

.
├── annotations
│   ├── captions_train2017.json          图像描述的 训练集标注文件
│   ├── captions_val2017.json            图像描述的 验证集标注文件
│   ├── instances_train2017.json         对应目标检测、分割任务的 训练集标注文件
│   ├── instances_val2017.json           目标检测、分割任务的 验证集标注文件
│   ├── person_keypoints_train2017.json  人体关键点检测的 训练集标注文件
│   └── person_keypoints_val2017.json    人体关键点检测的 验证集标注文件
├── train2017
│   ├── 000000000009.jpg
│   ├── 000000000025.jpg
│   ├── 000000000030.jpg
│   ├── 000000000034.jpg
│   ├── 000000000036.jpg
│   └── ... (118287张图像)
└── val2017├── 000000000139.jpg├── 000000000285.jpg├── 000000000632.jpg├── 000000000724.jpg├── 000000000776.jpg└── ... (5000张图像)

ImageNet

CIFAR

Flowers

MNIST

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/93442.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/93442.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

19.3 Transformers量化模型极速加载指南:4倍推理加速+75%显存节省实战

Transformers量化模型极速加载指南:4倍推理加速+75%显存节省实战 实战项目:模型量化 Transformers 兼容性配置 量化模型加载核心配置逻辑 #mermaid-svg-rDjfMigtxckLYWp3 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#merm…

Android 终端接入 GB28181 国标视频平台的完整解决方案解析

1. 引言:让 Android 终端无缝融入国标视频网络在公安、交通、应急、工业、教育等领域,GB/T 28181 国标协议早已成为视频监控与指挥调度的事实标准。传统国标视频网络通常由固定部署的 IPC 摄像机、NVR、视频管理平台构成,设备形态单一。随着一…

Docker目录的迁移

# 迁移 docker 目录 (无论容器与镜像占用空间大小,哪怕只占用1G,也需用此方式,否则可能迁移不成功)service docker stopcd /var/lib/docker# 一个一个复制除 overlay2 外的其他所有文件夹cp -R builder /home/docker/l…

IOS APP 前端存储

UserDefaults优点简单易用提供简单的键值对存储接口无需复杂配置,开箱即用适合存储少量简单数据轻量级专门为存储小量数据设计内存占用小性能开销低自动持久化数据自动保存到磁盘应用重启后数据仍然可用通过synchronize()方法可以强制立即写入(iOS 12已自…

在前端js中使用jsPDF或react-to-pdf生成pdf文件时,不使用默认下载,而是存储到服务器

开源地址: https://github.com/ivmarcos/react-to-pdf 主要就是这个方法,有三种可选: 默认是save,也就是会自动触发下载的方法,open方法是默认会打开一个pdf预览的tab页面,build方法就是在调用的函数gener…

会议征稿!IOP出版|第二届人工智能、光电子学与光学技术国际研讨会(AIOT2025)

往届已EI检索,欢迎投稿! AIOT2024会后两个月实现见刊! AIOT2025已通过IOP-JPCS出版申请,独立JPCS出版 AIOT2025已上线西安文理学院官网: 征文通知|第二届人工智能、光电子学与光学技术国际…

CPP多线程2:多线程竞争与死锁问题

在多线程编程中,多个线程协同工作能显著提升程序效率,但当它们需要共享和操作同一资源时,潜在的问题也随之而来;线程间的执行顺序不确定性可能导致资源竞争,可能引发死锁,让程序陷入停滞。 多线程竞争问题示…

全国产飞腾d2000+复旦微690t信号处理模块

UD VPX-404是基于高速模拟/数字采集回放、FPGA信号实时处理、CPU主控、高速SSD实时存储架构开发的一款高度集成的信号处理组合模块,采用6U VPX架构,模块装上外壳即为独立整机,方便用户二次开发。 UD VPX-404模块的国产率可达到100%&#xff0…

物联网 (IoT) 的顶级硬件平台

物联网 (IoT) 的顶级硬件平台IoT(物联网)不再是一个流行词。随着每天出现几个鼓舞人心的用例,多家公司现在正在探索如何利用该技术实现业务增长。无论实施何种其他技术,基于物联网的新设备正迅速成为一项重…

TCP传输层协议(4)

TCP应用层协议(4) 流量控制 接收端处理数据的速度是有限的. 如果发送端发的太快, 导致接收端的缓冲区被打满, 这个时候如果发送端继续发送, 就会造成丢包, 继而引起丢包重传等等一系列连锁反应. 因此 TCP 支持根据接收端的处理能力, 来决定发送端的发送速…

双向SSL认证之Apache实战配置

防御未授权访问,为企业级应用构筑双重身份验证防线 本文是关于Apache配置双向SSL认证的深度技术指南,包含全流程操作、调试技巧及企业级解决方案,适用于运维工程师和安全管理员。 1.为什么需要双向认证 ? 核心价值 &#x1f51…

JavaScript 实用工具方法小全

1. 精确获取小数位数/*** 获取数字的小数位数(支持科学计数法)* param {number|string} num - 要检查的数字,可以是数字或字符串形式* returns {number} 返回小数部分的位数* * 实现原理:* 1. 处理科学计数法(如1.23e-…

【易错题】C语言

今日遇到的易错题 #include <stdio.h> int i;//全局变量默认初始化是0 int main() {i--;//-1if (i > sizeof(i)){printf(">\n");}else{printf("<\n");}return 0; }易错点&#xff1a;sizeof的返回值类型实际为无符号整形&#xff0c;因此编…

第七十五章:AI的“思维操控师”:Prompt变动对潜在空间(Latent Space)的影响可视化——看懂AI的“微言大义”!

Prompt变动对潜在空间影响前言&#xff1a;AI的“思维操控师”——Prompt变动对潜在空间的影响可视化&#xff01;第一章&#xff1a;痛点直击——Prompt“难伺候”&#xff1f;改一个字就“面目全非”&#xff01;第二章&#xff1a;AI的“思维圣地”&#xff1a;潜在空间&…

【计算机视觉与深度学习实战】03基于Canny、Sobel和Laplacian算子的边缘检测系统设计与实现

第一章 引言 边缘检测作为计算机视觉和图像处理领域的核心技术之一,在现代数字图像分析中占据着举足轻重的地位。边缘是图像中亮度变化剧烈的区域,通常对应着物体的轮廓、表面方向的不连续性、材质变化或照明条件的改变。准确而高效的边缘检测不仅是图像分割、特征提取、模式…

【大语言模型 02】多头注意力深度剖析:为什么需要多个头

多头注意力深度剖析&#xff1a;为什么需要多个头 - 解密Transformer的核心升级 关键词&#xff1a;多头注意力、Multi-Head Attention、注意力头、并行计算、特征学习、Transformer架构、深度学习 摘要&#xff1a;在掌握了Self-Attention基础后&#xff0c;本文深入探讨多头注…

Python Condition对象wait方法使用与修复

在 Python 中&#xff0c;Condition 对象用于线程同步&#xff0c;其 wait() 方法用于释放锁并阻塞线程&#xff0c;直到被其他线程唤醒。使用不当可能导致死锁、虚假唤醒或逻辑错误。以下是常见问题及修复方案&#xff1a;常见问题与修复方案1. 未检查条件&#xff08;虚假唤醒…

嵌入式硬件——ARM

一、ARM体系结构程序编译的过程&#xff1a;预处理&#xff08;.c-.i&#xff09;&#xff1a;宏替换&#xff0c;头文件展开&#xff0c;去掉注释&#xff0c;特殊符号的处理编译&#xff08;.i-.s&#xff09;&#xff1a;C语言转换成汇编语言汇编&#xff08;.s-.o&#xff…

Flutter 以模块化方案 适配 HarmonyOS 的实现方法

Flutter 以模块化方案 适配 HarmonyOS 的实现方法 Flutter的SDK&#xff1a; https://gitcode.com/openharmony-tpc/flutter_flutter 分支Tag&#xff1a;3.27.5-ohos-0.1.0-beta DevecoStudio&#xff1a;DevEco Studio 5.1.1 Release HarmonyOS版本&#xff1a;API18 本文使…

Redis入门与背景详解:构建高并发、高可用系统的关键基石

本文前言认识Redis单机架构浅谈分布式系统分布式是什么数据库分离和负载均衡引入缓存数据库分库分表引入微服务念补充小结Redis特性介绍持久化支持集群高可用快Redis的应用场景总结前言 在当今这个数据驱动的时代&#xff0c;应用的性能和可扩展性已成为衡量其成功的关键指标。…