KITTI数据集

KITTI数据集是由德国卡尔斯鲁厄理工学院 Karlsruhe Institute of Technology (KIT) 和美国芝加哥丰田技术研究院 Toyota Technological Institute at Chicago (TTI-C) 于2012年联合创办,是目前国际上最为常用的自动驾驶场景下的计算机视觉算法评测数据集之一。该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。KITTI数据集包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。 KITTI数据集针对3D目标检测任务提供了14999张图像以及对应的点云,其中7481组用于训练,7518组用于测试,针对场景中的汽车、行人、自行车三类物体进行标注,共计80256个标记对象。

一、核心任务 1:视觉 / 激光雷达里程计(Odometry)


里程计任务的核心是评估算法通过传感器数据(图像、LiDAR)估计车辆相对位姿(平移 + 旋转) 的精度,重点关注累计误差。KITTI 提供了 00-10 共 11 个序列的标注(包含真实轨迹的 6DoF 位姿),评价指标分为平移误差(Translational Error) 和旋转误差(Rotational Error) ,且按不同轨迹长度(段)统计,以反映误差随距离的累积特性。

1. 平移误差(关键指标)

衡量估计轨迹与真实轨迹在三维空间中的位置偏差,通常以 “每 100 米轨迹的平均平移误差” 为核心报告指标,具体计算方式如下:

  • 公式:对轨迹中连续的关键帧,计算估计位置 T^i​ 与真实位置 Ti​ 的欧氏距离,再按轨迹段长度(如 10m、20m、50m、100m、200m、500m)统计平均误差。
  • 报告形式
    • 表格中常以 t100m​(每 100 米平均平移误差,单位:m)作为核心指标,误差越小表示精度越高;
    • 同时提供不同段长(如 10m→500m)的误差曲线,反映误差累积速度(如 SLAM 算法的漂移程度)。
2. 旋转误差

衡量估计轨迹与真实轨迹在姿态(角度)上的偏差,同样按轨迹段长度统计:

  • 公式:计算估计旋转矩阵 R^i​ 与真实旋转矩阵 Ri​ 的夹角(通过矩阵迹运算:θ=arccos(2tr(R^iT​Ri​)−1​)),再转换为 “每 100 米轨迹的平均旋转误差”(单位:°/100m)。
  • 意义:旋转误差直接影响车辆航向估计的准确性,对路径规划和避障至关重要。
3. 轨迹可视化

除数值指标外,KITTI 要求将估计轨迹与真实轨迹在三维 / 二维平面(如 x-y 平面)叠加可视化,直观展示算法的漂移趋势(如是否随距离逐渐偏离真实轨迹)。

二、核心任务 2:3D 目标检测(3D Object Detection)

3D 目标检测的核心是评估算法从传感器数据中检测并定位三维目标(如汽车、行人、 cyclists) 的精度,需同时考虑 “检测是否准确” 和 “定位是否精准”,KITTI 采用平均精度(Average Precision, AP) 作为核心指标,并按目标类别和难度分级。

1. 目标类别与难度分级

KITTI 将目标分为 3 类,且每类按 “遮挡程度” 和 “截断程度” 分为 3 个难度等级(Easy/Moderate/Hard):

  • 类别:Car(汽车)、Pedestrian(行人)、Cyclist(骑行者);
  • 难度标准
    • Easy:遮挡率<10%,截断率<15%;
    • Moderate:遮挡率 10%-40%,截断率 15%-40%;
    • Hard:遮挡率 40%-60%,截断率 40%-50%(最接近真实复杂场景)。
2. 核心指标:3D AP 与 BEV AP

KITTI 不直接使用 2D 检测的 IoU(交并比),而是定义3D IoU 和 BEV IoU(鸟瞰图 IoU),并基于此计算 AP:

  • 3D IoU:计算预测的 3D bounding box 与真实 3D bounding box 的体积交并比(反映三维空间中的定位精度);
  • BEV IoU:将 3D bounding box 投影到地面平面(x-y 平面),计算投影后 2D 框的面积交并比(反映平面位置精度,对自动驾驶路径规划更关键);
  • AP 计算
    1. 对每个类别和难度,按 “预测置信度” 从高到低排序检测结果;
    2. 设定 IoU 阈值(KITTI 标准:Car→0.7,Pedestrian/Cyclist→0.5),统计 “真阳性(TP)” 和 “假阳性(FP)”;
    3. 绘制 “精确率 - 召回率(Precision-Recall, PR)曲线”,计算 PR 曲线下的面积(即 AP)。
  • 报告形式:需分别报告 3 类目标在 3 个难度等级下的 3D AP 和 BEV AP,AP 越高表示检测与定位精度越好(如 “Car Moderate 3D AP=85%” 表示汽车中等难度场景下的 3D 检测平均精度为 85%)。
3. 辅助指标:定位误差

除 AP 外,KITTI 还会统计3D bounding box 的定位误差,包括:

  • 平移误差(Δx, Δy, Δz):预测框中心与真实框中心在 x/y/z 轴上的偏差(单位:m);
  • 旋转误差(Δθ):预测框航向角与真实框航向角的偏差(单位:°);
  • 尺寸误差(Δl, Δw, Δh):预测框长 / 宽 / 高与真实框的偏差(单位:m)。

三、核心任务 3:立体匹配(Stereo Matching)

立体匹配的核心是评估算法从双目图像中计算视差图(Disparity Map) 的精度(视差用于推导深度),KITTI 提供了高分辨率双目图像的真实视差标注(通过 LiDAR 数据校准),评价指标聚焦 “视差估计误差”。

1. 核心指标:视差误差率(Disparity Error Rate)

统计 “估计视差与真实视差的偏差超过阈值” 的像素比例,按像素的 “有效性” 和 “视差范围” 分级:

  • 有效像素定义:排除遮挡区域、无纹理区域、边界区域等 “无效像素”,仅统计 “有效像素” 的误差;
  • 误差阈值
    • 相对误差:d∣d^−d∣​>0.05(d 为真实视差,d^为估计视差);
    • 绝对误差:∣d^−d∣>3(单位:像素);
    • 满足任一阈值即判定为 “误差像素”。
  • 报告形式:按视差范围(如 d<10、10≤d<20、d≥20)统计误差率,误差率越低表示视差估计越精准。
2. 辅助指标:平均绝对误差(MAE)

计算所有有效像素的 “估计视差 - 真实视差” 的绝对值的平均值,反映整体视差估计的偏差程度(单位:像素)。

四、其他任务的评价指标

KITTI 还支持光流估计、语义分割等任务,其指标与领域通用标准一致:

  • 光流估计:采用端点误差(Endpoint Error, EPE)—— 估计光流向量与真实光流向量的欧氏距离,统计平均 EPE 和 EPE>3 的像素比例;
  • 语义分割:采用交并比(mIoU,均值交并比)—— 计算每个类别的 IoU,再取所有类别的平均值,反映分割结果与真实标签的重合度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/923480.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/923480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

rk3568移植WebRTC AudioProcessing

前言: 大家好,我是飞一样的成长,今天这篇文章主要想分享音频3A的内容。在之前有网友找我怎么移植原生的webrtc到rk3568/rk3588上,当时我自己也没有移植过,后面折腾了一个礼拜才搞定,当时遇到的最大问题&…

介绍一下 RetNet

RetNet(Retention Network)是微软亚洲研究院于 2023 年提出的一种新型序列建模架构,旨在解决 Transformer 架构在长序列处理中存在的计算复杂度高、内存占用大、推理速度慢等核心问题。它通过创新的 “循环注意力机制”,实现了 “…

CANopen - PDO映射

CiA402为什么不放到一个PDO中。而是分成几个PDO? 简短答案:装不下 解耦时序。 PDO负载上限:经典CAN的每个PDO只有8字节。TargetPosition(607A:0032bit) ProfileVelocity(60FF:0032bit) ModesOfOperation(6060:008bit) 共9字节,单个PDO放不…

北理工提出仅依赖机载传感器针对IAP的控制与状态估计框架

近日,度量用户、北京理工大学俞玉树老师团队在IEEE RAL,IEEE TRO和IEEE TASE期刊上分别发表论文,研究着力于解决多飞行器集联平台(Integrated Aerial Platforms, IAPs)的相对位姿和全局定位问题,提出IAP的控…

13年测试老鸟,性能测试-618与双11大促销压测(二)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、准备工作 准备…

StreamCap(直播录制) v1.0.2 绿色版

StreamCap 是一个基于FFmpeg和StreamGet的多平台直播流录制客户端,覆盖 40 国内外主流直播平台,支持批量录制、循环监控、定时监控和自动转码等功能。软件特色 多端支持:支持Windows/MacOS/Web运行。循环监控:实时监控直播间状态&…

OpenCV:图像拼接(SIFT 特征匹配 + 透视变换)

目录 一、核心技术原理与对应 API 解析 1.1 SIFT 特征检测与描述(尺度不变特征提取) 1.1.1 灰度图转换:cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 1.1.2 SIFT 检测器初始化:cv2.SIFT_create() 1.1.3 特征点检测与描述符计算&…

日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(10):91-100语法+考え方13

日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(10):91-100语法1、前言(1)情况说明(2)工程师的信仰(3)高级语法N1语法和难点2、知识点-语法&…

继承与组合:C++面向对象的核心

C 继承:从基础到实战,彻底搞懂面向对象的 “代码复用术” 在面向对象编程(OOP)的世界里,“继承” 是实现代码复用的核心机制 —— 就像现实中孩子会继承父母的特征,C 的子类也能 “继承” 父类的成员&#…

Matplotlib定制:精解颜色、字体、线型与标记

Matplotlib定制:精解颜色、字体、线型与标记导语 Matplotlib 是 Python 数据可视化领域的基石。虽然它的默认样式足以满足快速分析的需求,但要创作出具有专业水准、信息清晰、视觉美观的图表,就必须掌握其强大的定制功能。本文将深入探讨 Mat…

Qt开发经验 --- Qt监听文件/文件夹改变(17)

文章目录[toc]1 概述2 演示效果3 简单使用示例4 带界面的使用示例5 源代码地址更多精彩内容👉内容导航 👈👉Qt开发经验 👈1 概述 QT实现实时监控文件的创建、修改、删除操作 跟踪文件夹内容的增删改变化 可用于文件发生变化时自…

数据分析:合并一

🔷 DA37:统计运动会项目报名人数(仅输出有人报名的项目)✅ 题目描述给定两个 CSV 文件:items.csv:包含项目信息(item_id, item_name, location)signup.csv:包含员工报名信…

WWW‘25一通读 |图Anomaly/OOD检测相关文章(1)

写在前面:进入新一轮学习阶段,从阅读开始。 本文分享的是WWW2025收录的与作者研究相近的graph-based xx相关paper的阅读笔记,含个人理解,仅供参考😄 0x01 HEI:利用不变性原理实现异配图结构分布偏移学习 J…

static_cast:C++类型系统的“正经翻译官”

1. 背景与核心概念 1.1 C的“类型安全”哲学 想象一下,你所在的世界突然失去了所有规则:文字可以随意变成数字,人可以瞬间变成椅子,汽车能飞上天变成飞机… 这听起来像是疯狂的梦境,但对于早期C语言来说,这…

【嵌入式原理系列-第八篇】USART从原理到配置全解析

目录 一.通信领域基础知识介绍 1.1 串行和并行通信 1.2 同步和异步传输 1.3 串口和COM口 1.4 通信协议标准以及物理层定义 1.5 物理层协议之TTL / RS-232 / RS-485 二.USART介绍 2.1 USART特点介绍 2.2 UART和TTL / RS-232 / RS-485 2.3 USART硬线流控介绍 2.4 USAR…

MariaDB介绍和MariaDB包安装

文章目录MariaDB介绍和安装1.MariaDB介绍1.1 起源与背景1.2 核心特性1.2.1 高度兼容 MySQL1.2.2 优化的存储引擎1.2.3 企业级功能增强1.2.4 性能优化1.2.5 安全增强1.3 社区与生态1.4 应用场景1.5 总结2.MariaDB安装2.1 主机初始化2.1.1 设置网卡名2.1.2 设置ip地址2.1.3 配置镜…

双指针与滑动窗口算法精讲:从原理到高频面试题实战

引言:算法选择的十字路口 在算法面试中,双指针和滑动窗口如同两把瑞士军刀,能高效解决80%以上的数组和字符串问题。本文将深入解析这两种技术的核心差异,结合力扣高频题目,提供可直接复用的代码。 一、算法核心思想解析…

苹果MAC、MacBook air和pro安装windows双系统与iOS分发

文章目录1. main1.1 准备工作1.2 启动转换助理1.3 Windows安装1.4 苹果电脑安装Windows双系统切换2. 苹果(iOS)分发/上架2.1 上架App Store2.2 上架TestFlight2.3 webClip免签上架2.4 超级签名2.5 企业证书2.6 app分发系统Reference1. main 苹果电脑安装windows双系统 https:…

ArcGIS定向影像(1)——非传统影像轻量级解决方案

常常听到这样的需求,ArcGIS能让用户自己低成本的做出谷歌街景吗?现在 _ArcGIS Pro 3.2 和 ArcGIS Enterprise 11.2 _能够让用户不使用任何插件和扩展的情况下完成街景数据集的构建,数据管理,发布服务和调用的完整解决方案。非常体…

uni-app 网络之封装实战HTTP请求框架

前言在uniapp开发中,网络请求是每个应用都必不可少的功能模块。一个优秀的网络请求封装不仅能提高开发效率,还能增强代码的可维护性和可扩展性。本文将基于实际项目经验,详细介绍如何封装一个高效、可维护的Uniapp网络请求框架,并…