【mysql】mysql的高级函数、高级用法

mysql是最常用的数据库之一,常见的函数用法大家应该都很熟悉,本文主要例举一些相对出现频率比较少的高级用法
(注:需注意mysql版本,大部分高级特性都是mysql8才有的)

多值索引与虚拟列

主要是解决字符串索引问题,光说概念会比较抽象 我们举两个例子来阐述

mysql文档地址:

https://dev.mysql.com/doc/refman/8.4/en/create-index.html#create-index-multi-valued:~:text=%E7%9A%84%E8%AF%A6%E7%BB%86%E4%BF%A1%E6%81%AF%E3%80%82-,%E5%A4%9A%E5%80%BC%E7%B4%A2%E5%BC%95,-InnoDB%E6%94%AF%E6%8C%81%E5%A4%9A

场景一: 我们日常开发中 经常会使用,分隔 (例如userIds), 但是随着数据量和需求的增加,会造成效率问题;终极解决方案是拆表 建立一个新的关系表,但如果涉及改动大,拆表是个大工程;有一个技巧就是将数据升级成json格式,为json字段建立索引;如果代码规范的话 我们只需要修改entity到DTO层的转换,外部都是调用DTO,改动量小很多;
在这里插入图片描述
建立索引方式:
在这里插入图片描述
查询方式:

-- 索引方式 ref
SELECT * FROM customers   WHERE 94507 MEMBER OF(custinfo->'$.zipcode');
-- 或  (索引方式range)
SELECT * FROM customersWHERE JSON_CONTAINS(custinfo->'$.zipcode', CAST('[94507,94582]' AS JSON));

json数据插入格式:

{"zipcode": [94536, 123]}

场景二: json字符串为普通的k-v 格式,但是我们需要通过对某个字段 例如姓名建立索引
可以建立虚拟列 对虚拟列建立索引
这样可以简化查询代码 (注意 如果是场景一 数组格式的数组要走索引 则不合适)

CREATE TABLE `file_test_phone` (`id` bigint NOT NULL,`name` varchar(255) COLLATE utf8mb4_unicode_ci DEFAULT NULL,`real_phone` json DEFAULT NULL,`phone` varchar(255) COLLATE utf8mb4_unicode_ci GENERATED ALWAYS AS (json_unquote(json_extract(`real_phone`,_utf8mb4'$.phone'))) VIRTUAL,PRIMARY KEY (`id`),UNIQUE KEY `uk_phone` (`phone`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

json字段插入数据格式:

{"phone": "123"}

将字符串拼接数据拆分

还是上面场景,如果不打算用这种方式,想要用传统的拆表来实现,拆表很容易,但是会涉及到历史数据迁移问题。

我们假设旧表 user表 有id 和 role_id字段,其中role_id是逗号分隔,
在这里插入图片描述

现在希望将role_id拆分出去

我们可以先将逗号拼接的字符串先转成数组字符串:

update user set role_id  = concat ('[',role_id,']')

在这里插入图片描述
接着用以下语句数据迁移:


INSERT INTO user_role (id,user_id, role_id)
SELECT UUID_SHORT(),u.id AS user_id,CAST(JSON_UNQUOTE(js.value) AS UNSIGNED) AS role_id
FROM user u
JOIN JSON_TABLE(u.role_id,'$[*]' COLUMNS (value VARCHAR(255) PATH '$')) AS js  
WHERE u.role_id IS NOT NULL  AND JSON_VALID(u.role_id) AND JSON_LENGTH(u.role_id) > 0;

JSON_TABLE 是作用于行数据的,所以我们看不到显式的join关联条件,执行后user_role数据示例:

在这里插入图片描述

分区

(仅讨论分区语法 博主个人感觉分区有点鸡肋 mysql的这个设计对数据来说或许合理 但对用户使用来说 并不友好;
当然这也是见仁见智 感兴趣可以自行造亿级以上数据测试 这是只是提供一种思路)

常用分区策略:

range分区: 比如按照年份分区
list分区:按照枚举值分区 比如根据省份
hash分区:按哈希值分区,适用于数据比较均匀的场景
key分区:类似HASH分区,但使用MySQL的内部哈希函数

mysql5.1之后就可以分区了 语法为

-- 移除分区
-- ALTER TABLE test_part REMOVE PARTITIONING;
-- 修改表分区 (如果是创建 则在建表语句后面跟上PARTITION )
ALTER TABLE test_part
PARTITION BY RANGE (code) (PARTITION p1 VALUES LESS THAN (100000000),PARTITION p2 VALUES LESS THAN (200000000),PARTITION p3 VALUES LESS THAN (300000000),PARTITION p4 VALUES LESS THAN MAXVALUE
);

建表分区示例

-- 根据年份分区
CREATE TABLE orders (order_id INT NOT NULL,customer_id INT NOT NULL,order_date DATE NOT NULL,total DECIMAL(10, 2),PRIMARY KEY (order_id, order_date)
)
PARTITION BY RANGE (YEAR(order_date)) (PARTITION p2019 VALUES LESS THAN (2020),PARTITION p2020 VALUES LESS THAN (2021),PARTITION p2021 VALUES LESS THAN (2022),PARTITION pmax VALUES LESS THAN MAXVALUE
);

分区可以避免跨表分页的问题,虽然数据物理隔离了 但是终归是在同一张表;但是必须注意的一点:分区字段必须是主键字段之一;

因为一旦有主键,它就成为表的核心约束,MySQL 必须保证 主键在全表范围内唯一,但如果主键不包含分区字段,那主键值一样的数据有可能落入不同分区这样就出现了主键冲突,MySQL 没法检测这个冲突 —— 所以为了防止这种“隐形冲突”,它强制要求主键必须包含分区字段,否则干脆不让你建表。
这个设计不得不吐槽了,例如oracle就可以做到分区后也全局检测,所以不用限制主键分区

如下图 分区后反而降低了效率,主键本来就是聚促索引 弄成联合主键效率反而可能降低,在博主亲测的几千万级别数据 是完全没有必要分区(也没必要分表) , 不分区 建索引反而会快些
在这里插入图片描述

但是当表不存在主键的时候,最核心的性约束就不是主键了,而是唯一索引,这个时候 分区键是唯一索引字段就能分区成功了:

CREATE TABLE t1 (col1 INT NOT NULL,col2 DATE NOT NULL,col3 INT NOT NULL,col4 INT NOT NULL,UNIQUE KEY (col1, col2, col3)
)
PARTITION BY HASH(col3)
PARTITIONS 4;
-- 能执行成功
ALTER TABLE user_role_no_id PARTITION BY HASH(user_id) PARTITIONS 4;

那话又说回来,怎么会有大数据量的业务表不存在主键呢?
不存在主键的表(如配置表、字典表)又怎么会到分区的程度呢
这本身似乎是个悖论,所以我们平常见到的mysql分区应该也比较少;
[重申:本文仅介绍mysql有分区用法,实际使用可能需要斟酌再三]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/84199.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#日期和时间:DateTime转字符串全面指南

C#日期和时间:DateTime转字符串全面指南 在 C# 开发中,DateTime类型的时间格式化是高频操作场景。无论是日志记录、数据持久化,还是接口数据交互,合理的时间字符串格式都能显著提升系统的可读性和兼容性。本文将通过 20 实战示例…

Canvas设计图片编辑器全讲解(一)Canvas基础(万字图文讲解)

一、前序 近两年AI发展太过迅速,各类AI产品层出不穷,AI绘图/AI工作流/AI视频等平台的蓬勃发展,促使图片/视频等复杂内容的创作更加简单,让更多普通人有了图片和视频创作的机会。另一方面用户内容消费也逐渐向图片和视频倾斜。在“…

Javase易混点专项复习02_static关键字

1. static关键字1.1概述1.2修饰一个成员变量例:1.2.1静态属性与非静态属性示例及内存图对比 1.3修饰一个方法(静态方法)1.4.static修饰成员的访问特点总结1.5动态代码块和静态代码块1.5.1动态代码块1.5.2 静态代码块 1.6带有继承的对象创建过…

C++滑动门问题(附两种方法)

题目如下&#xff1a; 滑动窗口 - 题目 - Liusers OJ ——引用自OJ网站 方法如下&#xff1a; 1.常规思想 #include<bits/stdc.h> using namespace std; int main() {int n,k;int a[110];cin>>n>>k;for(int i0;i<n;i){cin>>a[i];}for(int i0;i…

mysql连接池druid监控配置

文章目录 前置依赖启用配置访问监控一些问题 前置 连接池有很多类型&#xff0c;比如 c3p0&#xff0c;比如 hikariCP&#xff0c;比如 druid。c3p0 一些历史项目可能用的比较多&#xff0c;hikariCP 需要高性能的项目比较多&#xff0c;druid 性能也很好&#xff0c;而且还提…

Jetson系统烧录与环境配置全流程详解(含驱动、GCC、.Net设置)

Jetson系统烧录与环境配置全流程详解&#xff08;含驱动、GCC、.Net设置&#xff09; 目录1. 准备工作与工具安装1.1 主机系统要求1.2 安装 SDK Manager 2. JetPack 系统烧录流程2.1 Jetson 进入恢复模式2.2 使用 SDK Manager 烧录 JetPack 3. Jetson 系统基础设置4. 配置 .Net…

分布式缓存:缓存的三种读写模式及分类

文章目录 缓存全景图Pre缓存读写模式概述1. Cache Aside&#xff08;旁路缓存&#xff09;工作流程优缺点 2. Read/Write Through&#xff08;读写穿透&#xff09;工作流程优缺点典型场景 3. Write Behind Caching&#xff08;异步写回&#xff09;工作流程优缺点典型场景 缓存…

Ntfs!FindFirstIndexEntry函数中ReadIndexBuffer函数的作用是新建一个Ntfs!_INDEX_LOOKUP_STACK结构

第一部分&#xff1a; 0: kd> kc # 00 Ntfs!FindFirstIndexEntry 01 Ntfs!NtfsRestartIndexEnumeration 02 Ntfs!NtfsQueryDirectory 03 Ntfs!NtfsCommonDirectoryControl 04 Ntfs!NtfsFsdDirectoryControl 05 nt!IofCallDriver 06 nt!IopSynchronousServiceTail 07 nt!Nt…

5.24 note

笛卡尔积(➕选择条件 select a.student_name as member_A, b.student_name as member_B, c.student_name as member_C from schoola as a join schoolb as b join schoolc as c where a.student_name ! b.student_name and a.student_name !…

为什么需要在循环里fetch?

假设有多个设备连接在后端,数量不定,需要按个读回状态,那么就要在循环里fetch了. 此函数非常好用,来自于国内一个作者,时间久了,忘记了来源,抱歉. export default async function fetchWithTimeout(resource, options {}) {const { timeout 1000 } options;const controll…

不同净化技术(静电 / UV / 湿式)的性能对比研究

在餐饮油烟和工业废气治理领域&#xff0c;油烟净化技术的选择至关重要。目前&#xff0c;静电、UV 光解、湿式洗涤是市场上应用较为广泛的三种净化技术。它们凭借不同的工作原理和技术特性&#xff0c;在净化效率、能耗、适用场景等方面展现出各自的优势与局限。本文将从多个维…

Ubuntu 22.04上升级npm版本

如果使用NVM安装Node.js npm会自动包含&#xff0c;但版本可能不是最新的。你可以选择升级&#xff1a; # 检查当前版本 npm --version# 升级到最新版本 npm install -g npmlatest# 或者升级到特定版本 npm install -g npm9.8.1如果使用其他方法安装Node.js 通常Node.js安装…

项目管理进阶:111页 详解华为业务变革框架及战略级项目管理【附全文阅读】

BTMS 是一套集成管理系统框架&#xff0c;涵盖变革规划、项目执行、实施及生命周期管理等多个关键环节。在规划阶段&#xff0c;通过全面收集需求、深入分析现状&#xff0c;制定出符合业务战略的年度规划&#xff0c;明确变革举措和项目清单。 解决方案开发的 PMOP 流程&#…

java基础知识回顾1(可用于Java基础速通)考前,面试前均可用!

目录 一、初识java 二、基础语法 1.字面量 2.变量 3.关键字 4.标识符 声明&#xff1a;本文章根据黑马程序员b站教学视频做的笔记&#xff0c;可对应课程听&#xff0c;课程链接如下: 02、Java入门&#xff1a;初识Java_哔哩哔哩_bilibili 一、初识java Java是美国 sun 公…

Linux下MySQL的安装与使用

1 安装前说明 1.1 Linux系统及工具的准备 安装并启动好两台虚拟机&#xff1a;CentOS 7 掌握克隆虚拟机的操作 mac地址主机名ip地址UUID 安装有 Xshell 和 Xftp 等访问 CentOS 系统的工具 CentOS6 和 CentOS7 在 MySQL 的使用中的区别 防火墙&#xff1a;6是iptables&am…

在react项目中使用andt日期组件,选择周和季度,直接获取所对应的日期区间

在react项目中使用andt日期组件&#xff0c;选择周和季度&#xff0c;直接获取所对应的日期区间 import { DatePicker, Space } from antd; import React from react; const onChange (date, dateString) > {console.log(date,dateString) }; const onChangeweek (date, …

数字信号处理大实验2 利用FFT估计信号的频率

目录 3.1 实验目的 3.2 实验内容与要求 3.3 实验原理 3.3.1 基于时域求导-频域乘法的n阶导数积分法 3.3.2 基于频域卷积的双/多谱线插值法 3.3.3 基于谱峰和滑动平均的多谱线综合插值方法 3.3.4 基于相邻显著谱线的滑动平均综合插值方法 3.3.5 基于&#xff08;2&#…

【Java】Java元注解

Target(ElementType.METHOD) Retention(value RetentionPolicy.RUNTIME) public interface OperatorLog {String source() default "WEB"; //日志操作来源 默认是web&#xff0c;还有socket的String model() default ""; //操作模块 }这个代码中的 Target…

阿里云百炼(1) : 阿里云百炼应用问答_回答图片问题_方案1_提问时上传图片文件

直接用于拍照答题不大理想, 可能适用其他用途, 更好的方案: 阿里云百炼(1) : 阿里云百炼应用问答_回答图片问题_方案2_提取题目再提问-CSDN博客 1.实现代码 package cn.nordrassil.ly.test.拍照答题;import com.alibaba.dashscope.app.Application; import com.alibaba.dashsc…

深入探索 CSS 中的伪类:从基础到实战​

在前端开发的世界里&#xff0c;CSS 作为网页样式的 “化妆师”&#xff0c;有着至关重要的作用。而 CSS 伪类则像是这位 “化妆师” 手中的神奇画笔&#xff0c;能够基于元素的状态或位置为其添加独特的样式&#xff0c;极大地丰富了网页的交互性和视觉效果。接下来&#xff0…