说明:如需数据可以直接到文章最后关注获取。
1.数据背景
Automobile数据集源自于对汽车市场深入研究的需求,旨在为汽车行业提供一个全面且详细的资源,以便更好地理解影响汽车价格及性能的各种因素。该数据集最初由卡内基梅隆大学(Carnegie Mellon University)的研究人员收集并整理,并被广泛用于机器学习和统计分析的教学与实践中。其主要目的是通过包含多维度信息的数据集,支持从价格预测到车辆分类等多种任务的研究,帮助学术界和工业界的专家探索如何利用数据分析提升汽车设计、定价策略以及市场营销的效果。
此数据集包含了来自不同制造商的汽车详细属性,包括但不限于制造地、燃料类型、引擎规格、车身样式、驱动轮配置等。这些属性不仅涵盖了基本的物理尺寸如车长、车宽、车重等,还涉及了技术细节如发动机位置、马力输出等,以及经济指标如城市和高速公路燃油消耗量等。此外,数据集中还包括了一些描述性统计变量,例如每辆汽车的价格区间和维修记录等级,这使得它成为了一个理想的工具,可用于探索各种因素对汽车价值的影响,以及在不同市场条件下的表现。
Automobile数据集自发布以来,已被应用于多个领域的研究和实践中,包括但不限于经济学、工程学、计算机科学等。特别是在机器学习领域,该数据集常被用来进行回归分析以预测汽车价格,或作为分类算法的基础来评估车辆的燃油效率等级。随着汽车行业向智能化、电动化方向的发展,此类数据集的重要性日益凸显,不仅有助于改进现有的模型和技术,也为未来交通解决方案的设计提供了宝贵的参考。因此,持续更新和完善Automobile数据集,对于推动相关领域的进步具有重要意义。
2.数据介绍
数据格式为xlsx格式。
编号 | 变量名称 | 描述 |
1 | price | 汽车的价格(单位:美元) |
2 | highway-mpg | 高速公路工况下的燃油效率(单位:每加仑行驶的英里数,MPG) |
3 | city-mpg | 城市工况下的燃油效率(单位:每加仑行驶的英里数,MPG) |
4 | peak-rpm | 发动机达到最大功率时的转速(单位:每分钟转数,RPM) |
5 | horsepower | 发动机输出功率(单位:马力,hp) |
6 | compression-ratio | 发动机的压缩比,表示气缸内气体被压缩的程度 |
7 | stroke | 活塞行程(单位:英寸),即活塞从上止点到下止点的距离 |
8 | bore | 气缸直径(单位:英寸) |
9 | fuel-system | 燃油系统类型,例如单点喷射(mpfi)、多点喷射(spdi)等 |
10 | engine-size | 发动机排量(单位:立方厘米,cc) |
11 | num-of-cylinders | 气缸数量,例如 4 缸、6 缸、8 缸 |
12 | engine-type | 发动机类型,例如直列式(dohc)、V 型(ohcv)等 |
13 | curb-weight | 整车空载重量(单位:磅) |
14 | height | 车辆高度(单位:英寸) |
15 | width | 车辆宽度(单位:英寸) |
16 | length | 车辆长度(单位:英寸) |
17 | wheel-base | 轴距(前后轮中心的距离,单位:英寸) |
18 | engine-location | 发动机位置,例如前置(front)、中置(rear) |
19 | drive-wheels | 驱动轮配置,例如前驱(fwd)、后驱(rwd)、四驱(4wd) |
20 | body-style | 车身样式,例如轿车(sedan)、硬顶车(hardtop)、敞篷车(convertible)、SUV 等 |
21 | num-of-doors | 车门数量,例如 2 门、4 门 |
22 | aspiration | 进气方式,例如自然吸气(std)、涡轮增压(turbo) |
23 | fuel-type | 燃料类型,例如汽油(gas)、柴油(diesel) |
24 | make | 汽车制造商(品牌),例如 Toyota、Ford 等 |
25 | normalized-losses | 标准化损失值,用于衡量车辆在事故或其他情况下的平均损失成本 |
26 | y | 风险等级评分 |
数据详情如下(部分展示):
3.数据获取
关注下方名片 回复1036获取 或者 CSDN私信发消息获取。