Python 数据分析与可视化 Day 5 - 数据可视化入门(Matplotlib Seaborn)

🎯 今日目标

  • 掌握 Matplotlib 的基本绘图方法(折线图、柱状图、饼图)
  • 掌握 Seaborn 的高级绘图方法(分类图、分布图、箱线图)
  • 熟悉图像美化(标题、标签、颜色、风格)
  • 完成一组学生成绩数据的可视化展示

🧱 一、Matplotlib 基础绘图

import matplotlib.pyplot as plt# 示例数据
names = ["张三", "李四", "王五", "赵六"]
scores = [88, 92, 75, 60]# 折线图
plt.plot(names, scores, marker="o")
plt.title("学生成绩折线图")
plt.xlabel("姓名")
plt.ylabel("成绩")
plt.grid(True)
plt.show()

✅ 常见图表类型

# 柱状图
plt.bar(names, scores)# 饼图
plt.pie(scores, labels=names, autopct="%.1f%%")# 保存图像
plt.savefig("charts/score_chart.png")

🌈 二、Seaborn 入门(更美观 + 高级)

import seaborn as sns
import pandas as pd# 示例 DataFrame
df = pd.DataFrame({"姓名": names,"成绩": scores,"性别": ["男", "女", "男", "女"]
})# 设置风格
sns.set_style("whitegrid")# 分类柱状图
sns.barplot(data=df, x="姓名", y="成绩", hue="性别")
plt.title("学生成绩(按性别)")
plt.show()

🎨 三、其他 Seaborn 图示示例

# 成绩分布直方图
sns.histplot(df["成绩"], bins=5)# 箱线图:成绩分布(可识别异常值)
sns.boxplot(data=df, x="性别", y="成绩")# 成绩与是否及格关系散点图(需添加字段)
sns.scatterplot(data=df, x="成绩", y="是否及格")

🧪 今日练习任务

使用 students_cleaned.csv (前两天清洗的表格数据)文件,完成以下图表:

  1. 所有学生成绩的折线图 & 柱状图

  2. 不同性别的平均成绩柱状图

  3. 所有学生成绩分布直方图

  4. 学生成绩箱线图(按性别分组)

  5. 将所有图像保存为 PNG 图片到 charts/ 文件夹

    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns
    import osrc = {'font.sans-serif': 'Arial Unicode MS','axes.unicode_minus': False}
    # 设置中文字体支持(如 matplotlib 出现乱码)
    plt.rcParams['font.family'] = 'Arial Unicode MS'  # Mac 用户可用
    # plt.rcParams['font.sans-serif'] = ['SimHei']   # Windows 用户用这行
    plt.rcParams['axes.unicode_minus'] = False# 路径设置
    input_path = "data/students_cleaned.csv"
    output_dir = "charts"
    os.makedirs(output_dir, exist_ok=True)# 加载数据
    df = pd.read_csv(input_path)
    print("✅ 已加载学生数据:")
    print(df.head())# -------- 图表 1:学生成绩折线图 --------
    plt.figure(figsize=(8, 5))
    plt.plot(df["姓名"], df["成绩"], marker='o')
    plt.title("学生成绩折线图")
    plt.xlabel("姓名")
    plt.ylabel("成绩")
    plt.grid(True)
    plt.tight_layout()
    plt.savefig(f"{output_dir}/成绩折线图.png")
    plt.close()# -------- 图表 2:学生成绩柱状图 --------
    plt.figure(figsize=(8, 5))
    plt.bar(df["姓名"], df["成绩"], color="skyblue")
    plt.title("学生成绩柱状图")
    plt.xlabel("姓名")
    plt.ylabel("成绩")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/成绩柱状图.png")
    plt.close()# -------- 图表 3:不同性别的平均成绩柱状图 --------
    plt.figure(figsize=(6, 4))
    sns.set(style="whitegrid", rc=rc)
    avg_by_gender = df.groupby("性别")["成绩"].mean().reset_index()
    sns.barplot(data=avg_by_gender, x="性别", y="成绩", hue='性别', palette="Set2", legend=False)
    plt.title("不同性别的平均成绩")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/性别平均成绩柱状图.png")
    plt.close()# -------- 图表 4:成绩分布直方图 --------
    plt.figure(figsize=(6, 4))
    sns.histplot(df["成绩"], bins=5, kde=True, color="orange")
    plt.title("成绩分布直方图")
    plt.xlabel("成绩")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/成绩分布直方图.png")
    plt.close()# -------- 图表 5:成绩箱线图(按性别) --------
    plt.figure(figsize=(6, 4))
    sns.boxplot(data=df, x="性别", y="成绩", hue="性别", palette="Pastel1", legend=False)
    plt.title("成绩箱线图(按性别)")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/成绩箱线图_按性别.png")
    plt.close()print(f"\n✅ 所有图表已生成并保存至:{output_dir}/")
    

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述


✍️ 今日总结

  • 掌握了 Matplotlib 基本图形绘制技巧
  • 掌握了 Seaborn 的分类、分布图制作方法
  • 能基于清洗后的数据完成完整的图形展示
  • 理解了图表选择和美化对表达分析结论的重要性

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86498.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86498.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CephFS “Client Failing to Respond to Cache Pressure“ 告警分析

告警含义 当出现 Client failing to respond to cache pressure 警告时,表明: 元数据服务器 (MDS) 要求客户端释放缓存的元数据(如 inode Capabilities)客户端未能及时响应 释放请求核心触发机制 MDS 通过以下周期性流程管理缓存 阶段操作触发条件Cache Trim 周期每隔 mds…

生成式人工智能实战 | 生成对抗网络(Generative Adversarial Network, GAN)

生成式人工智能实战 | 生成对抗网络 0. 前言1. 生成对抗网络2. 模型构建2.1 生成器2.2 判别器 3. 模型训练3.1 数据加载3.2 训练流程 0. 前言 生成对抗网络 (Generative Adversarial Networks, GAN) 是一种由两个相互竞争的神经网络组成的深度学习模型,它由一个生成…

缓存与加速技术实践-MongoDB数据库应用

一.什么是MongoDB MongoDB 是一个文档型数据库,数据以类似 JSON 的文档形式存储。 MongoDB 的设计理念是为了应对大数据量、高性能和灵活性需求。 MongoDB 使用集合(Collections)来组织文档(Documents)&#xff0…

声网对话式AI把“答疑机器人”变成“有思维的助教”

作为一家专注初高中学生的线上教育平台,我们精心打磨的系统化课程收获了不少认可,但课后无人答疑的难题却始终横亘在前。学生课后遇到疑惑,要么只能默默憋在心里,要么就得苦苦等待下一节课,家长们也频繁抱怨 “花了钱&…

常见的排序方法

目录 1. 插入排序 2. 希尔排序 3. 选择排序 4. 堆排序 5. 冒泡排序 6. 快速排序 1. 快速排序的实现 1. 思路(以从小到大排序为例) 2. 选取基准元素的方法(Hoare) 3. 选取基准元素的方法(挖坑法) …

【matlab定位例程】基于AOA和TDOA混合的定位方法,背景为三维空间,自适应锚点数量,附下载链接

文章目录 代码概述代码功能概述核心算法原理AOA定位模型TDOA定位迭代算法混合定位策略关键技术创新 运行结果4个锚点的情况40个锚点的情况 MATLAB源代码 代码概述 代码功能概述 本代码实现了一种三维空间中的混合定位算法,结合到达角( A O A AOA AOA&a…

专题:2025医疗AI应用研究报告|附200+份报告PDF汇总下载

原文链接:https://tecdat.cn/?p42748 本报告汇总解读聚焦医疗行业人工智能应用的前沿动态与市场机遇,以数据驱动视角剖析技术演进与商业落地的关键路径。从GenAI在医疗领域的爆发式增长,到细分场景的成熟度矩阵,再到运营成本压力…

推荐一个前端基于vue3.x,vite7.x,后端基于springboot3.4.x的完全开源的前后端分离的中后台管理系统基础项目(纯净版)

XHan Admin 简介 🎉🎉 XHan Admin 是一个开箱即用的开源中后台管理系统基础解决方案, 项目为前后端分离架构。采用最新的技术栈全新构建,纯净的项目代码,没有历史包袱。 前端使用最新发布的 vite7.0 版本构建&#xf…

MySQL误删数据急救指南:基于Binlog日志的实战恢复详解

背景 数据误删是一个比较严重的场景 1.典型误操作场景 场景1:DELETE FROM orders WHERE status0 → 漏写AND create_time>‘2025-06-20’ 场景2:DROP TABLE customer → 误执行于生产环境 认识 binlog 1.binlog 的核心作用 记录所有 DDL/DML 操…

高效数据采集方案:快速部署与应用 AnyCrawl 网页爬虫工具实操指南

以下是对 AnyCrawl 的简单介绍: AnyCrawl 提供高性能网页数据爬取,其功能专为 LLM 集成和数据处理而设计支持利用搜索引擎直接查询获取结果内容,类似 searxng提供开发者友好的API,支持动态内容抓取,并输出结构化数据&…

vue3可以分页、搜索的select

下载 npm i v-selectpage基本使用 import { SelectPageList } from v-selectpage;<SelectPageListlanguage"zh-chs"key-prop"id"label-prop"name"fetch-data"fetchData" />const fetchData (data,callback) > {const { sea…

C# 入门学习教程 (一)

文章目录 一、解决方案与项目1. Solution 与 project 二、类与名称空间1.类与名称空间2.类库的引用1. DLL引用&#xff08;黑盒引用&#xff0c;无源代码&#xff09;2. Nuget 引用3. 项目引用&#xff08;白盒引用&#xff0c;有源代码&#xff09; 3.依赖关系 三、类&#xf…

76、单元测试-参数化测试

76、单元测试-参数化测试 参数化测试是一种单元测试技术&#xff0c;通过将测试数据与测试逻辑分离&#xff0c;使用不同的输入参数多次运行相同的测试用例&#xff0c;从而提高测试效率和代码复用性。 #### 基本原理 - **数据驱动测试**&#xff1a;将测试数据参数化&#xf…

SQL学习笔记3

SQL常用函数 1、字符串函数 函数调用的语法&#xff1a;select 函数&#xff08;参数); 常用的字符串函数有&#xff1a; 拼接字符串&#xff0c;将几个字符串拼到一起&#xff1a;concat (s1,s2,……); select concat(你好,hello); update mytable set wherefo concat(中…

Golang 面向对象编程,如何实现 封装、继承、多态

Go语言虽然不是纯粹的面向对象语言&#xff0c;但它通过结构体(struct)、接口(interface)和方法(method)提供了面向对象编程的能力。下面我将通过具体示例展示Go中如何实现类、封装、继承、多态以及构造函数等概念。 1. 类与封装 在Go中&#xff0c;使用结构体(struct)来定义…

为什么android要使用Binder机制

1.linux中大多数标准 IPC 场景&#xff08;如管道、消息队列、ioctl 等&#xff09;的进程间通信机制 ------------------ ------------------ ------------------ | 用户进程 A | | 内核空间 | | 用户进程 B | | (User Spa…

OpenCV CUDA模块设备层-----双曲余弦函数cosh()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 该函数用于计算四维浮点向量&#xff08;float4类型&#xff09;的双曲余弦值&#xff0c;作用于CUDA设备端。双曲余弦函数定义为cosh(x) (eˣ …

48页PPT | 企业数字化转型关键方法论:实践路径、案例和落地评估框架

目录 一、什么是企业数据化转型&#xff1f; 二、为什么要进行数据化转型&#xff1f; 1. 市场复杂性与不确定性上升 2. 内部流程效率与协同难题突出 3. 数字资产沉淀不足&#xff0c;智能化基础薄弱 三、数据化流程管理&#xff1a;从“业务流程”到“数据流程”的对齐 …

VTK中的形态学处理

VTK图像处理代码解析:阈值化与形态学开闭运算 这段代码展示了使用VTK进行医学图像处理的两个关键步骤:阈值分割和形态学开闭运算。下面我将详细解析每个部分的功能和实现原理。 处理前 处理后 1. 阈值分割部分 (vtkImageThreshold) vtkSmartPointer<vtkImageThresho…

xlsx.utils.sheet_to_json() 方法详解

sheet_to_json() 是 SheetJS/xlsx 库中最常用的方法之一&#xff0c;用于将 Excel 工作表&#xff08;Worksheet&#xff09;转换为 JSON 格式数据。下面我将全面讲解它的用法、参数配置和实际应用场景。 基本语法 javascript 复制 下载 const jsonData XLSX.utils.sheet…