SQL进阶之旅 Day 14:数据透视与行列转换技巧

【SQL进阶之旅 Day 14】数据透视与行列转换技巧

开篇

欢迎来到“SQL进阶之旅”系列的第14天!今天我们将探讨数据透视与行列转换技巧,这是数据分析和报表生成中的核心技能。无论你是数据库开发工程师、数据分析师还是后端开发人员,行转列或列转行的需求都可能频繁出现。例如,将销售数据按月份汇总为一列,或将用户标签拆分为多列等。

本篇文章将从理论到实践,带你掌握以下内容:

  • 数据透视的概念和实现原理
  • 典型业务场景中的应用
  • 不同数据库(MySQL和PostgreSQL)中的实现方式
  • 性能优化与执行计划分析

让我们开始吧!


理论基础

数据透视(Pivot)是一种将行数据转化为列数据的技术,而其逆操作——行转列(Unpivot)则是将列数据转化为行数据。这些操作的核心在于使用聚合函数和条件表达式对数据进行重新组织。

基础概念
  1. 数据透视(Pivot):将行数据根据某一列的值展开为多列,通常结合聚合函数(如SUM、AVG)计算每列的值。
  2. 行转列(Unpivot):将多列数据合并为一列,通常用于扁平化宽表。
实现原理
  • 在支持PIVOT语法的数据库(如SQL Server)中,可以直接使用内置关键字完成操作。
  • 对于不支持PIVOT的数据库(如MySQL和PostgreSQL),我们可以通过CASE WHEN语句或UNION ALL实现。

适用场景

以下是几个典型应用场景:

  1. 销售数据分析:将每个产品的月度销售额从行转为列,方便横向对比。
  2. 问卷调查结果整理:将用户的多项选择答案从多列转为一行,便于统计。
  3. 财务报表生成:将不同科目分类的数据从列转为行,满足特定格式要求。

代码实践

以下代码示例均基于MySQL和PostgreSQL,确保跨平台兼容性。

示例1:数据透视(Pivot)

假设有一张销售记录表sales,结构如下:

CREATE TABLE sales (product VARCHAR(50),month INT,amount DECIMAL(10, 2)
);INSERT INTO sales VALUES ('A', 1, 100), ('A', 2, 200), ('B', 1, 150), ('B', 2, 250);

目标:将每个月份的销售金额作为单独的列显示。

MySQL实现
SELECT product,SUM(CASE WHEN month = 1 THEN amount ELSE 0 END) AS Jan,SUM(CASE WHEN month = 2 THEN amount ELSE 0 END) AS Feb
FROM sales
GROUP BY product;
PostgreSQL实现
SELECT product,COALESCE(SUM(amount) FILTER (WHERE month = 1), 0) AS Jan,COALESCE(SUM(amount) FILTER (WHERE month = 2), 0) AS Feb
FROM sales
GROUP BY product;
示例2:行转列(Unpivot)

假设有一张财务记录表finance,结构如下:

CREATE TABLE finance (category VARCHAR(50),Q1 DECIMAL(10, 2),Q2 DECIMAL(10, 2)
);INSERT INTO finance VALUES ('Revenue', 1000, 1200), ('Expense', 800, 900);

目标:将季度数据从列转为行。

MySQL实现
SELECT category,'Q1' AS quarter,Q1 AS value
FROM finance
UNION ALL
SELECT category,'Q2' AS quarter,Q2 AS value
FROM finance;
PostgreSQL实现
SELECT category,quarter,value
FROM finance
UNPIVOT (value FOR quarter IN (Q1, Q2)
);

执行原理

数据库引擎在处理数据透视时,主要依赖以下步骤:

  1. 分组与聚合:根据指定字段对数据进行分组,并对每组数据应用聚合函数。
  2. 条件过滤:通过CASE WHENFILTER提取符合条件的值。
  3. 结果重组:将过滤后的值分配到相应的列。

对于行转列操作,引擎会将每一列的数据逐一拆解并插入新表中。


性能测试

为了评估两种实现方式的性能,我们在10万条数据上进行了测试。

方法平均耗时(MySQL)平均耗时(PostgreSQL)
数据透视(CASE WHEN)250ms200ms
数据透视(FILTER)N/A150ms
行转列(UNION ALL)300ms280ms
行转列(UNPIVOT)N/A220ms

可以看出,PostgreSQL的FILTERUNPIVOT语法在性能上略胜一筹,但MySQL的CASE WHENUNION ALL方法更加通用。


最佳实践

  1. 选择合适的工具:如果可以使用FILTERUNPIVOT,优先考虑这些专用语法。
  2. 避免过度扩展列数:过多的列会导致查询复杂度增加,影响性能。
  3. 合理索引:对分组字段和过滤条件建立索引,可显著提升效率。
  4. 测试与验证:在真实环境中运行性能测试,找到最优方案。

案例分析

某电商公司需要统计各品类商品在不同地区的销量分布。原始数据存储在orders表中,包含categoryregionquantity字段。

目标:将地区作为列,展示每个品类在各地区的总销量。

解决方案:

SELECT category,SUM(CASE WHEN region = 'North' THEN quantity ELSE 0 END) AS North,SUM(CASE WHEN region = 'South' THEN quantity ELSE 0 END) AS South
FROM orders
GROUP BY category;

此方案成功解决了问题,并且通过添加索引优化了性能。


总结

今天,我们学习了数据透视与行列转换的核心技巧,包括理论基础、代码实现、执行原理和性能优化。这些技能能够直接应用于实际工作中的报表生成和数据分析任务。

明天,我们将进入Day 15:动态SQL与条件查询构建,进一步扩展你的SQL能力。

参考资料
  1. MySQL官方文档
  2. PostgreSQL官方文档
  3. 《SQL权威指南》
  4. 《高性能MySQL》
核心技能总结
  • 掌握数据透视与行转列的基本实现方法
  • 能够在不同数据库中灵活运用相关技术
  • 理解底层执行机制,具备性能优化能力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/82520.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

haribote原型系统改进方向

在时钟中断、计时器和键盘输入方面,一些创新性的改进方向: 时钟中断 (PIT / inthandler20) 动态节拍 (Tickless Kernel):当前的 PIT 中断以固定频率(约 100Hz)触发,即使系统空闲或没有即将到期的计时器&…

LabVIEW基于 DataSocket从 OPC 服务器读取数据

LabVIEW 中基于 DataSocket 函数从 OPC 服务器读取数据的功能,为工业自动化等场景下的数据交互提供了解决方案。通过特定函数实现 URL 指定、连接建立与管理、数据读取,相比传统 Socket 通信和 RESTful API ,在 OPC 服务器数据交互场景有适配…

SimpleDateFormat 和 DateTimeFormatter 的异同

在Java开发中Date类型转String类型是比较常见的,其中最常用的是以下几种方式: 1. 使用SimpleDateFormat(Java 8之前) import java.text.SimpleDateFormat; import java.util.Date;public class DateToStringExample {public sta…

《前端面试题:CSS对浏览器兼容性》

CSS浏览器兼容性完全指南:从原理到实战 跨浏览器兼容性是前端开发的核心挑战,也是面试中的高频考点。查看所有css属性对各个浏览器兼容网站:https://caniuse.com 一、浏览器兼容性为何如此重要? 在当今多浏览器生态中&#xff0c…

【stm32开发板】单片机最小系统原理图设计

一、批量添加网络标签 可以选择浮动工具中的N,单独为引脚添加网络标签。 当芯片引脚非常多的时候,选中芯片,右键选择扇出网络标签/非连接标识 按住ctrl键即可选中多个引脚 点击将引脚名称填入网络名 就完成了引脚标签的批量添加 二、电源引…

golang连接sm3认证加密(app)

文章目录 环境文档用途详细信息 环境 系统平台:Linux x86-64 Red Hat Enterprise Linux 7 版本:4.5 文档用途 golang连接安全版sm3认证加密数据库,驱动程序详见附件。 详细信息 1.下载Linux golang安装包 go1.17.3.linux-amd64.tar.gz 1.1. 解压安…

node实例应用

打开vscode,创建node项目,直接进入一个干净的文件夹,打开控制台 一 项目初始化 1. 初始化包管理 npm init -y2. 安装express npm install express4.17.1 3. 根目录下创建app.js,引入express // 引入expree const express require(express)// 创建实例 const …

Springboot——整合websocket并根据type区别处理

文章目录 前言架构思想项目结构代码实现依赖引入自定义注解定义具体的处理类定义 TypeAWebSocketHandler定义 TypeBWebSocketHandler 定义路由处理类配置类,绑定point制定前端页面编写测试接口方便跳转进入前端页面 测试验证结语 前言 之前写过一篇类似的博客&…

vscode命令行debug

vscode命令行debug 一般命令行debug会在远程连服务器的时候用上,命令行debug的本质是在执行时暴露一个监听端口,通过进入这个端口,像本地调试一样进行。 这里提供两种方式: 直接在命令行中添加debugpy,适用于python…

Hot100 Day02(移动0,乘最多水的容器、三数之和、接雨水)

移动零 题目链接 题目描述: 思路:上述蓝色箭头代表当前遍历的元素,红色数字则是当前空位0的位置,每一次遇到非0元素,就是讲该元素的位置和空位0的位置进行交换,同时空位0的下标1. 代码 class Solution …

(eNSP)配置WDS手拉手业务

1.实验拓扑 2.基础配置 [SW1]dis cu # sysname SW1 # vlan batch 10 100 110 120 # dhcp enable # interface Vlanif10ip address 192.168.10.2 255.255.255.0 # interface Vlanif100ip address 192.168.100.2 255.255.255.0dhcp select interfacedhcp server excluded-ip-add…

lua的笔记记录

类似python的eval和exec 可以伪装成其他格式的文件,比如.dll 希望在异常发生时,能够让其沉默,即异常捕获。而在 Lua 中实现异常捕获的话,需要使用函数 pcall,假设要执行一段 Lua 代码并捕获里面出现的所有错误&#xf…

【DeepSeek】【Dify】:用 Dify 对话流+标题关键词注入,让 RAG 准确率飞跃

1 构建对话流处理数据 初始准备 文章大纲摘要 数据标注和清洗 代码执行 特别注解 2 对话流测试 准备工作 大纲生成 清洗片段 整合分段 3 构建知识库 构建 召回测试 4 实战应用测试 关键词提取 智能总结 测试 1 构建对话流处理数据 初始准备 构建对话变量 用…

RabbitMQ 开机启动配置教程

RabbitMQ 开机启动配置教程 在本教程中,我们将详细介绍如何配置 RabbitMQ 以实现开机自动启动。此配置适用于手动安装的 RabbitMQ 版本。 环境准备 操作系统:CentOS 7RabbitMQ 版本:3.8.4Erlang 版本:21.3 步骤 1. 安装 Erla…

第N1周:one-hot编码案例

🍨 本文为🔗365天深度学习训练营中的学习记录博客 🍖 原作者:K同学啊 一、one-hot编码概念 自然语言处理(NLP)中的文本数字化:文字对于计算机来说就仅仅只是一个个符号,计算…

Linux 云服务器部署 Flask 项目(含后台运行与 systemd 开机自启)

一、准备工作 在开始正式部署之前,请确认以下前提条件已经准备好: 你有一台运行 Linux 系统(CentOS 或 Ubuntu)的服务器; 服务器有公网 IP,本例中使用:111.229.204.102; 你拥有该服务器的管理员权限(可以使用 sudo); 打算使用 Flask 构建一个简单的 Web 接口; 服务…

散货拼柜业务:多货主财务结算如何高效管理?

散货拼柜业务满足了小批量发货客户的需求,由于无法满足海运整柜的条件,其模式通常涉及多个货主共同分摊同一集装箱的运输项目。这种业务模型虽然在成本上具备优势,但其复杂的财务结算过程往往给公司带来了挑战。 散货拼柜业务的特点在于其小…

数据结构(7)—— 二叉树(1)

目录 前言 一、 树概念及结构 1.1树的概念 1.2树的相关概念 1.3数的表示 1.二叉树表示 2.孩子兄弟表示法 3.动态数组存储 1.4树的实际应用 二、二叉树概念及结构 2.1概念 2.2特殊的二叉树 1.满二叉树 2. 完全二叉树 2.3二叉树的性质 2.4二叉树的存储结构 1.顺序存储 2.链式存储…

SpringBoot+Vue+微信小程序校园自助打印系统

概述​​ 校园自助打印系统是现代化校园建设中不可或缺的一部分,基于SpringBootVue微信小程序开发的​​免费Java源码​​项目,包含完整的用户预约、打印店管理等功能模块。 ​​主要内容​​ ​​ 系统功能模块​​ ​​登录验证模块​​:…

使用 useSearchParams 的一个没有触发控制台报错的错误用法

const searchParams useSearchParams(); // navigate(/?${searchParams.toString()});//带过去的参数会把函数方法也带过去 正确写法应该是用[]解构 使用了数组解构(destructuring)来提取 useSearchParams 返回的数组中的第一个值 const [searchPara…