小杰python高级(six day)——pandas库

1.数据可视化

        用于绘制 DataFrame 数据图形,它允许用户直接从 DataFrame 创建各种类型的图表,而不需要使用其他绘图库(底层实际上使用了 Matplotlib)。

(1)plot

DataFrame.plot(*args, **kwargs)

功能:绘制各种线图

参数:kind: 图表类型,可以是以下之一:

                'line': 折线图(默认)

                'bar': 柱状图

                'barh': 水平柱状图

                'hist': 直方图

                'box': 箱线图

                'kde': 核密度估计图

                'area': 面积图

                'pie': 饼图

                'scatter': 散点图

                'hexbin': 六边形箱图

        x:指定X轴数据(列名或索引)

        y:指定y轴数据(列名或列名列表)

        ax: Matplotlib 子图对象

        subplots:是否绘制子图,True绘制子图

        figsize: 图表的尺寸,格式为 `(width, height)`,单位为英寸。

        use_index: 是否使用 pandas 的索引作为 x 轴标签。默认为 `True`。

        title: 图表的标题。

        grid: 是否显示网格线。默认为 `False`。

        legend: 是否显示图例。默认为 `True`。

        xticks: x 轴的刻度位置。

        yticks: y 轴的刻度位置。

        xlim: x 轴的范围,格式为 `(min, max)`。

        ylim: y 轴的范围,格式为 `(min, max)`。

        color: 绘制颜色,可以是单个颜色或颜色列表。

        label: 图例标签。

data = {'name':['zhangsan','lisi','wangwu', 'json'],'age':[12, 14, 20, 14],'height':[30, 14, 20, 14]}
df = pd.DataFrame(data)
print(df)# 绘制柱状图
# 将df的name作为x轴标签,只绘制age数据
df.plot(kind='bar', x='name', y='age')
plt.show()

2.文件的读写

pandas.read_csv(filepath, sep=',', header='infer', usecols=None,...)功能:读取csv类型的文件
参数:filepath:读取的文件名
      sep:字段分隔符,默认为逗号
      header:指定第一行作为列名,默认为0(第一行)
      usecols:返回一个数据子集,需要读取的列pandas.read_excel(filepath, sheet_name=0, header=0, usecols=None, ...)功能:读取execl类型文件
参数:sheet_name:工作表名称或索引,默认为0(第一个工作表)
      其他同上DataFrame.to_csv(path=None, sep=',', columns=None, index=True,  ...)功能:将DataFrame写入csv类型的文件
参数:columns:要写入的列名列表index:是否写行(索引)名称。默认为TrueDataFrame.to_excel(excel_writer, sheet_name='Sheet1',  ...)功能:将DataFrame写入excel类型的文件
参数:同上
# 读csv文件
# df = pd.read_csv('./learn_pandas.csv', usecols=['School','Height'])
# print(df)
# 读excel文件
df = pd.read_excel('./item.xlsx', usecols=['order-info','order-info 2'])
print(df)
# 写excel文件
df.to_excel('test.xlsx')

3.爬虫工具

1.简介

Instant Data Scraper插件是一款功能强大的数据抓取工具,主要用于从网页上自动提取数据。

Instant Data Scraper插件能够自动检测并提取网页上的数据,包括但不限于产品信息、评论、价格等,这些数据可以被导出为Excel或CSV文件,方便用户进行进一步的分析和处理。此外,该插件还支持动态数据检测,能够确保提取的数据是最新的。

2.使用步骤
        1.安装插件

               1. 使用谷歌浏览器安装插件

在线访问可能访问不了,使用本地插件进行加载。

2.打开右上角

​​​​​​​3.下载群里的,把插件的扩展名改为rar,把文件夹解压缩。

4.回到Chrome浏览器中,点击下图,在弹出的窗口中选择刚才解压后的文件夹。

5.找到这个图标,将精灵球固定在任务栏

​​​​​​​2.数据爬取

打开任意要爬取的网址

点击告诉爬虫程序翻页键在哪里,再次点击

点击开始爬取,点击下载爬取数据。

点击可以停止爬取。

4.三个库的总结

(1)numpy

  • 创建ndarray = array

emptyzerosonesfullfill

arangelinspacerandom(rand、random、randint、randn、normal、uniform、shuffle)

  • 访问下标切片
  • numpy数据类型:基本数据类型i4 S10结构化数据类型[(键名,类型),()]
  • 属性ndimshapesizedtype

修改属性astype类型reshape形状np.resize/arr.resizeflattenT

  • 运算

算术运算+ - * / **0.5 add\subtract/multiply/divide/powrer

广播机制

矩阵运算@ dot

逻辑运算& | ~

关系运算==

统计运算sum、meanmaxmin(argmax、argmin)、cumsumcumprodvarstd

数学函数sin/cos/tanexp/exp2log/log2

排序sort()[::-1]

  • 数组操作

添加删除append/insert/delete

修改数组维度expand_dims升维squeeze降维

数组连接concatenatestack

数组分割split

where函数根据条件筛选数据

(2)matplotlib

pyplot:绘图函数plotbar/barhscatterpiehistcontour

设置属性titlexlabelylabellegendsubplottight_layoutsubplots

操作函数savefigimreadimshowimsaveclosepause

Line2D对象set_data\get_label

Figure对象创建隐式显示(figure())

操作add_subplot\suptitle\add_axes\subplots_adjust\get_size_inches\clear

Axes对象获取对象plt.gca plt.gcf

操作set_xlim/set_ylimset_xlabel/set_ylabelset_titletext

GridSpec对象绘制子图网格 GridSpec

(3)pandas

  • 数据结构

Series创建访问(位置、标签、切片、函数get/head/tail/isin)、属性(value\index\dtype\shape\size\name\hasnans\is_unique\empty\axes)

DataFrame:创建访问([列]、loc、iloc)属性(index/columns/values/dtypes/ndim/T)

  • 数据操作

数据清洗dropna/fillna/isnull/drop_duplicates

数据转换replacetransform

数据排序sort_valuessort_index

数据筛选根据关系运算结果或布尔数组进行筛选

数据拼接concat

统计运算summeancountmaxminvarstdquantiledescribevalue_counts

分组聚合gropbyagg

数据可视化plot

文件读写read_csv/read_excel/to_csv/to_excel​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/93084.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/93084.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第十六届蓝桥杯青少组C++省赛[2025.8.9]第二部分编程题(1 、庆典队列)

参考程序&#xff1a;#include <iostream> using namespace std;int main() {int n, A;cin >> n >> A; // 输入&#xff1a;n 和 A&#xff0c;用空格隔开cout << n / A; // 整数相除&#xff0c;自动向下取整return 0; }

C++进阶:智能指针

目录1. RAII与智能指针2. C库中的智能指针2.1 智能指针auto_ptr2.2 智能指针unique_ptr2.3 智能指针shared_ptr3. shared_ptr的循环引用4. 智能指针的定值删除器1. RAII与智能指针 上一篇文章学习了异常相关的知识&#xff0c;其中遗留了一个异常安全相关的问题。那就是异常的抛…

Tkinter 实现按钮鼠标悬浮提示:两种方案(继承Frame与不继承)

在 Tkinter 桌面应用开发中&#xff0c;为按钮添加“鼠标悬浮提示”是提升用户体验的常用功能——无需点击&#xff0c;只需将鼠标挪到按钮上方&#xff0c;就能自动显示按钮功能说明。本文将详细介绍两种实现方案&#xff1a;不继承 Frame 类&#xff08;快速简洁版&#xff0…

20250814 最小生成树总结

引子 啊啊额&#xff0c;从一张图里抽出几条边&#xff0c;组成一棵树&#xff0c;无环n−1n-1n−1条边&#xff0c;就是生成树。那么边权和最小的生成树就叫最小生成树&#xff0c;最大生成树同理。 kruskal最小生成树 要求kruskal最小生成树&#xff0c;我们首先用结构体数组…

数据大集网:实体店获客引流的数字化引擎,解锁精准拓客新密码​

​在实体店面临流量焦虑、获客成本攀升的当下&#xff0c;实体店获客引流工具的重要性愈发凸显。如何在激烈的市场竞争中精准触达目标客户、构建可持续的客流增长模式&#xff1f;数据大集网凭借其创新的智能获客体系与全链路服务能力&#xff0c;正成为万千实体店突破增长瓶颈…

nginx --ssl证书生成mkcert

github https://github.com/FiloSottile/mkcert/releases网盘下载地址 https://pan.baidu.com/s/1XI0879pqu7HXZMnmQ9ztaw 提取码: 1111windows使用示例

守拙以致远:个人IP的长青之道|创客匠人

2025年被认为是AI应用全面爆发的一年。各种人工智能工具在写作、制图、剪辑等领域广泛使用&#xff0c;大大提升了个人和团队的工作效率。对于个人IP而言&#xff0c;这类工具的出现确实带来了新的机会&#xff0c;但也伴随着一种现象——一些人开始过度依赖甚至神化AI&#xf…

USB 3.0 LTSSM 状态机

USB2.0在电源供应后&#xff0c;通过Pull Up D-来决定枚举LS&#xff0c;Pull Up D有一个USB高速握手过程&#xff0c;来决定HS FS。USB3.0则会通过链路训练&#xff08;Link Training&#xff09;&#xff0c;来准备USB3.0通信。每当我们插上USB线的时候&#xff0c;对于3.0的…

MySQL窗口函数与PyMySQL以及SQL注入

MySQL窗口函数与PyMySQL实战指南&#xff1a;从基础到安全编程 引言 在数据处理和分析领域&#xff0c;MySQL作为最流行的关系型数据库之一&#xff0c;其窗口函数功能为数据分析提供了强大的支持。同时&#xff0c;Python作为数据分析的主要语言&#xff0c;通过PyMySQL库与My…

高级项目——基于FPGA的串行FIR滤波器

给大家安利一个 AI 学习神站&#xff01;在这个 AI 卷成红海的时代&#xff0c;甭管你是硬核开发者还是代码小白&#xff0c;啃透 AI 技能树都是刚需。这站牛逼之处在于&#xff1a;全程用 "变量名式" 幽默 生活化类比拆解 AI&#xff0c;从入门到入土&#xff08;啊…

JPrint免费的Web静默打印控件:PDF打印中文乱码异常解决方案

文章目录JPrint是什么&#xff1f;中文乱码&#xff08;Using fallback font xxx for xxxx&#xff09;1.字体嵌入2.客户机字体安装开源地址相关目录导航使用文档端口号修改代理使用场景打印服务切换中文乱码解决方案 JPrint是什么&#xff1f; JPrint是一个免费开源的可视化静…

MFT 在零售行业的实践案例与场景:加速文件集成与业务协作的高效方案

零售行业竞争激烈、数字化转型迭代迅速&#xff0c;业务对数据与档案的传输、处理和整合要求极高。无论是新品上市市场数据&#xff0c;还是供应链物流单据&#xff0c;集成方式不论是通过API或是档案传输, 对于传输的稳定性,安全性与性能, 都会直接影响决策效率与顾客体验。MF…

OSG+Qt —— 笔记1 - Qt窗口加载模型(附源码)

🔔 OSG/OsgEarth 相关技术、疑难杂症文章合集(掌握后可自封大侠 ⓿_⓿)(记得收藏,持续更新中…) OSG+Qt所用版本皆为: Vs2017+Qt5.12.4+Osg3.6.5+OsgQt(master) 效果 代码(需将cow.osg、reflect.rgb拷贝至工程目录下) OsgForQt.ui main.cpp

开源安全云盘存储:Hoodik 实现端到端数据加密,Docker快速搭建

以下是对 Hoodik 的简单介绍&#xff1a; Hoodik 是一个使用 Rust 和 Vue 开发的轻量级自托管安全云存储解决方案采用了非对称RSA密钥对和AES混合加密策略&#xff0c;从文件存储加密到数据链路加密&#xff0c;全程保证数据安全支持Docker一键私有部署&#xff0c;数据和服务…

[C++] Git 使用教程(从入门到常用操作)

1. Git 简介 Git 是一款分布式版本控制系统&#xff0c;用来跟踪文件变化、协作开发、管理项目版本。 它是开源的&#xff0c;由 Linus Torvalds 在 2005 年开发&#xff0c;广泛用于开源与企业项目中。 2. 安装 Git Windows 前往 Git 官网 下载并安装。 安装时建议勾选 Git…

实盘回测一体的期货策略开发:tqsdk获取历史数据并回测,附python代码

原创内容第969篇&#xff0c;专注AGI&#xff0c;AI量化投资、个人成长与财富自由。 星球好多同学希望说说实盘&#xff0c;我们就从实盘开始吧。 我们选择tqsdk给大家讲解&#xff0c;tqsdk支持免费注册&#xff0c;使用模拟账户&#xff0c;历史和实时数据&#xff0c;方便…

大模型推理框架vLLM 中的Prompt缓存实现原理

背景&#xff1a;为什么需要Prompt缓存模块&#xff1f;在大模型问答多轮对话应用场景中&#xff0c;不同请求的 Prompt 往往有相同的前缀&#xff0c;比如&#xff1a;第一次问答&#xff1a;你是一名专业的电子产品客服&#xff0c;负责回答客户关于手机产品的咨询。请根据以…

Python之Django使用技巧(附视频教程)

概述 Django 是一个高级的 Python Web 框架&#xff0c;遵循 “batteries-included”&#xff08;内置电池&#xff09;理念&#xff0c;提供了构建 Web 应用所需的大部分组件&#xff0c;让开发者可以专注于业务逻辑而不是底层细节。视频教程&#xff1a;https://pan.quark.cn…

sqli-labs通关笔记-第44关 POST字符型堆叠注入(单引号闭合 手工注入+脚本注入3种方法)

目录 一、堆叠注入 二、源码分析 1、代码审计 2、SQL注入安全性分析 三、堆叠手注法 1、进入靶场 2、正确用户名密码登录 3、堆叠注入 4、查看数据库 四、联合手注法 1、获取列数 2、确认回显位 3、获取数据库名 4、获取表名 5、获取列名 6、获取字段 7、总结…

从深度伪造到深度信任:AI安全的三场攻防战

前言当大模型开始“睁眼”看世界&#xff0c;伪造者也开始“闭眼”造世界。2025 WAIC释放出的信号很明确&#xff1a;没有AI安全底座&#xff0c;就没有产业智能化的高楼。WAIC 把“安全”摆在与“创新”同等重要的位置&#xff0c;形成了“1 份共识框架&#xff0b;2 份重磅报…