文章目录
- 0. 学习目标
- 1. Pandas的数据结构分析
-
- 1.1 Series - 序列
-
- 1.1.1 Series概念
- 1.1.2 Series类的构造方法
- 1.1.3 创建Series对象
-
- 1.1.3.1 基于列表创建Series对象
- 1.1.3.2 基于字典创建Series对象
- 1.1.4 获取Series对象的数据
- 1.1.5 Series对象的运算
- 1.1.6 增删Series对象的行数据
-
- 1.1.6.1 增加行数据
- 1.1.6.2 删除行数据
- 1.2 DataFrame - 数据帧
-
- 1.2.1 DataFrame概念
- 1.2.2 DataFrame类的构造方法
- 1.2.3 创建DataFrame对象
- 1.2.4 获取DataFrame对象的列数据
-
- 1.2.4.1 通过索引方式
- 1.2.4.2 通过属性方式
- 1.2.4.3 获取列数据的推荐方式
- 1.2.5 增删DataFrame对象的列数据
-
- 1.2.5.1 增加列数据
- 1.2.5.2 删除列数据
- 1.2.6 DataFrame对象的运算
- 2. Pandas索引操作及高级索引
-
- 2.1 索引对象
-
- 2.1.1 索引对象概念
- 2.1.2 索引的子类
- 2.2 重置索引
-
- 2.2.1 如何重置索引
- 2.2.2 reindex()方法
-
- 2.2.2.1 语法格式
- 2.2.2.2 参数说明
- 2.2.2.3 案例演示
- 2.3 索引操作
-
- 2.3.1 通过索引位置或索引名称获取序列的数据
- 2.3.2 通过位置索引切片或索引名称切片获取序列的数据
- 2.3.3 通过不连续的索引获取序列的不连续数据
- 2.3.4 通过布尔索引获取序列的数据
- 2.3.5 数据帧的行索引和列索引
- 2.3.6 通过索引方式访问数据帧的数据
- 3 算术运算与数据对齐
-
- 3.1 采用NaN补齐缺失值
- 3.2 用户指定补齐值
- 4. 数据排序
-
- 4.1 按索引排序
-
- 4.1.1 对序列按索引排序
- 4.1.2 对数据帧按索引排序
- 4.2 按值排序
-
- 4.2.1 对序列按值排序
- 4.2.2 对数据帧按值排序
- 5. 统计计算与描述
-
- 5.1 统计函数
- 5.2 统计描述
- 6. 层次化索引
-
- 6.1 认识层次化索引
-
- 6.1.1 层次化索引概念
- 6.1.2 创建层次化索引
-
- 6.1.2.1 利用嵌套列表创建层次化索引
- 6.1.2.2 通过MultiIndex的方法构建层次化索引
-
- 6.1.2.2.1 将元组列转换成Mutilndex对象
- 6.1.2.2.2 将数组列表转换成MultiIndex对象
- 6.1.2.2.3 将多个集合的笛卡尔成绩转换成MutliIndex对象
- 6.1.3 基于层次化索引的序列案例演示
- 6.2 按照分层索引排序数据
- 7. 读写数据操作
-
- 7.1 读写文本文件
-
- 7.1.1 CSV文件
-
- 7.1.1.1 写CSV文件
- 7.1.1.2 读CSV文件
- 7.1.2 TXT文件
- 7.2 读写Excel文件
-
- 7.2.1 写Excel文件
- 7.2.2 读Excel文件
- 7.3 读取HTML表格数据
-
- 7.3.1 读取HTML函数
- 7.3.2 案例演示
- 7.3.4 读写数据库
-
- 7.3.4.1 读写数据库概述
- 7.3.4.2 读写数据库函数
- 7.3.4.3 读写数据库案例演示
-
- 7.3.4.3.1 读数据库
- 7.3.4.3.2 写数据库
- 8. 小结
0. 学习目标
- 掌握 数据结构分析,索引操作及高级索引
- 掌握 算术运算与数据对齐,数据排序
- 掌握 统计计算与描述 ,层次化索引
- 掌握 读写数据操作
1. Pandas的数据结构分析
- Pandas中有两个主要的数据结构:
Series
(一维的数据结构)和DataFrame
(二维的数据结构)
1.1 Series - 序列
1.1.1 Series概念
- Series是一个类似一维数组的对象,它能够保存任何类型的数据,主要由一组数据和与之相关的索引两部分构成。
- 注意:Series的索引位于左边,数据位于右边。
1.1.2 Series类的构造方法
Series(data