MySQL深度理解-MySQL索引优化

1.Order by与Group by优化

1.1Case1

        employees表中建立了name,position和age索引,并且使用了order by age进行排序操作:

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' and position = 'dev' order by age

        最终explain的结果发现使用了idx_name_age_position索引,并且Extra中显示Using index condition,并不是Using filesort,所以执行该语句时,使用到了索引进行优化,而不是使用外部排序。但是需要注意的是,ORDER BY走索引的时候,不会体现到key_len中,只要Extra中不是Using Filesort,是Using Index就代表ORDER BY使用了索引。

        分析:利用最左前缀法则,中间字段不能断,因为查询使用到了name索引,从key_len = 74也能看出,age索引列用在排序过程中,因为Extra字段里没有using filesort,展示的时Using index。

1.2Case2

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' ORDER BY position;

        这个SQL语句经过EXPLAIN进行分析,发现name确实是走索引了,但是Extra是Using Filesort,所以代表ORDER BY没有走索引。

        其主要原因是:Case1中,name确定时,由于age是有序的,所以是可以走索引的,Case2中,name确定时,position是没有顺序的,所以无法走索引,只能Using Filesort走外部排序。

1.3Case3

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' ORDER BY position,age

        这个SQL语句经过EXPLAIN进行分析,发现name确实走索引了,但是Extra是Using Filesort,所以代表ORDER BY没有走索引。

        究其原因是因为建立联合索引树时,position在age后面,但是使用ORDER BY进行排序时,两者颠倒了。

1.4Case4

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' AND age = 18 ORDER BY position,age;

        这个SQL语句经过EXPLAIN进行分析之后,name走了索引,Extra也是Using Index condition,所以代表ORDER BY也走索引了。

        主要原因是age当前是常量,ORDER BY后面的age其实形同虚设。

1.5Case5

EXPLAIN SELECT * FROM employees WHERE name = 'CC' ORDER BY age asc, position desc;

        这个SQL语句经过EXPLAIN进行分析之后,name走了索引,但是Extra是Using Filesort,所以就代表了ORDER BY没有使用索引进行排序。

        主要的原因是因为position在索引树中是按照升序排序进行构建的,但是这里使用ORDER BY进行排序时,采用的是降序排序,所以无法使用索引。

        注意点:该案例在MySQL5.6,5.7的版本中确实是成立的,但是在MySQL8的版本中,MySQL官方引入了降序索引进行优化,desc也可以使用索引了。

1.6Case6

EXPLAIN SELECT * FROM employees WHERE name in ('LiLei', 'CC') ORDER BY age,position;

        这个SQL语句经过EXPLAIN进行分析之后,name走了索引,但是Extra是Using Filesort,即ORDER BY排序没有走索引。

        主要的原因是name进行查询出的两部分数据组合起来时,按照age和position就不是有序的了,所以ORDER BY排序并不能走索引。

1.7Case7

EXPLAIN SELECT * FROM employees WHERE name > 'a' ORDER BY name;

        这个SQL语句经过EXPLAIN进行分析之后,name没有走索引,且Extra是Using Filesort,即ORDER BY排序没有走索引,并且查看type的时候,可以发现type中显示的是ALL,即该SQL语句进行了全表扫描。

        主要的原因在于,该数据表中name > 'a'的数据量太大,MySQL在底层进行计算时认为使用索引进行排序是比较麻烦的,所以决定使用全表扫描。

        可以使用覆盖索引进行优化:

EXPLAIN SELECT name,age,position FROM employees WHERE name > 'a' ORDER BY name;

1.8优化总结

1.MySQL支持两种方式的排序filesort和index,Using index是指MySQL扫描索引本身完成排序(因为索引构建的索引树本身就是有序的)。index效率很高,filesort效率低。

2.ORDER BY满足两种情况会使用Using index。

1)ORDER BY语句使用索引最左前列。

2)使用WHERE子句与ORDER BY子句条件列组合满足索引最左前缀法则。

3.尽量在索引列上完成排序,遵循索引建立(索引创建的顺序)时的最左前缀法则。

4.如果ORDER BY的条件不在索引列上,就会产生Using filesort。

5.能用覆盖索引尽量使用覆盖索引。

6.GROUP BY与ORDER BY很类似,其是指时先排序分组,遵照索引创建顺序的最左前缀法则。对于GROUP BY的优化如果不需要排序的可以加上ORDER BY NULL禁止排序。注意,WHERE优先于HAVING,能写在WHERE中的限定条件就不要去HAVING中进行限定了。

1.9Using filesort文件排序原理详解

        Using filesort是MySQL中重点的概念,主要在ORDER BY排序中进行体现。

1.9.1filesort文件排序方式

        单路排序:是一次性取出满足条件行的所有字段,然后再sort buffer中进行排序。使用trace工具(MySQL自带的性能分析工具)可以看到sort-mode信息里显示<sort_key, additional_fields>或者<sort_key, packed_additional_fields>,单路排序其实就是将聚簇索引根据条件查询出来的数据,放到sort buffer中进行排序(比较占用内存)

        双路排序(又被称之为回表排序模式):是首先根据相应的条件取出相应的排序字段可以直接定位行数据的行ID,然后在sort buffer中进行排序,排序完后需要再次取回其它需要的字段。使用trace工具可以看到sort_mode信息里显示<sort_key, rowid>,双路排序其实就是将二级索引根据条件查询出来数据,进行条件筛选后,再统一回表到聚簇索引中进行数据查询,将真正的数据进行返回。

1.9.2排序方式选择的依据

        MySQL通过比较系统变量max_length_for_sort_data(默认1024字节)的大小和需要查询的字节总大小来判断使用哪种排序模式。

        1.如果字段的总长度小于max_length_for_sort_data,使用单路排序模式。

        2.如果字段的总长度大于max_length_for_sort_data,使用双路排序模式,

        不建议自己去修改MySQL底层的参数。

1.9.3内存排序和磁盘排序

        MySQL在进行Using Filesort的时候,会根据数据量的规模来选择是否要调度磁盘进行排序。

        MySQL进行排序时,会先在内存中开辟一个名为sort_buffer的空间,将数据载入到sort_buffer空间中进行排序,但是如果MySQL发现数据量过大,就会在磁盘中开辟临时文件进行排序,MySQL会进行分析要在磁盘中开辟多少个临时文件用于排序。

        注意:如果全部使用sort_buffer内存排序一般情况下效率会高于磁盘文件排序,但不能因为这个就随便增大sort_buffer(默认1M),MySQL很多参数都是做过优化的,不要轻易调整。

2.索引设计原则

2.1代码先行,索引后上

        错误的打开方式:建完表之后马上建立索引。

        正确的打开方式:主体业务功能开发完毕后,将涉及到该表的相关SQL语句都需要拿出来分析之后再建立索引。

2.2尽量建立联合索引,少建立单值索引

        在实际的项目中,一般不会建立多个单值索引,会使用多个字段建立联合索引,一方面是索引是占用空间的,建立多个单值索引会导致占用大量的存储空间,而且项目中一般查询数据时都是使用多个字段一起进行搜索查询的。

        那么为什么要建立主键单值索引呢?

        因为需要建立一个主键单值索引,保证每条数据具备一个全局唯一性。

2.3联合索引尽量覆盖条件

        比如可以设计一个或者两三个联合索引,让每一个联合索引都尽量去包含SQL语句里的WHERE、ORDER BY、GROUP BY的字段,还要确保这些联合索引的字段顺序尽量满足SQL查询的最左前缀原则。

2.4不要在小基数上建立索引

        索引基数是指这个字段在表中总共有多少个不同的值,比如一张表总共100万行记录,其中有个性别字段,其值不是男就是女,那么改字段的基数就是2。

        如果对这种小基数字段建立索引的话,还不如全表扫描了,因为你的索引树里就包含男和女两种值,根本无法进行快速的二分查找,那用索引就没有太大意义了。

        一般建立索引,尽量使用那些基数比较大的字段,那么才能发挥出B+树快速二分查找的优势来。

2.5长字符串我们可以采用前缀索引

        尽量对字段类型较小的列设计索引,比如说扫描tinyint之类的,因为字段类型较小的话,占用磁盘空间也会比较小的,此时你在搜索的时候性能也会好一点。

        当然,这个所谓的字段类型小一点的列,也不是绝对的,很多时候你就是要针对varchar(255)这种字段建立索引,哪怕多占用一些磁盘空间也是有必要的。

        对于这种varchar(255)的大字段可能会比较占用磁盘空间,可以稍微优化下,比如针对这个字段的前20个字符建立索引,即是对这个字段按里的每个值的前20个字符放在索引树中,类似于KEY index(name(20), age, position)

        此时的WHERE条件里搜索的时候,如果是根据name字段来搜索,那么此时就会先到索引树里根据name字段的前20个字符去搜索,定位到之后前20个字符的前缀匹配的部分数据之后,再回到聚簇索引提取出来完整的name字段值进行对比。

        但是假如你要是order by name,那么此时你的name因为在索引树里仅仅包含了前20个字符,所以这个排序是没法用上索引的,group by也是同理。

3.实战场景优化

3.1整体场景

3.2范围查询数据索引建立在最后

        age这种数据是经常要进行范围查询的,所以这种数据一般是直接放在最后的,索引也会建立到最后,因为如果将age索引建立到=值前面,在age符合的范围中,后面的=值数据可能不是顺序性的,就无法完全利用建立的联合索引。

3.3in优化

        为什么在不筛选sex的时候,要使用sex in ('female', 'male')呢?对于in来说,在数据量大的时候,in是会走索引的,在数据量小的时候,是不会走索引的,但是在生产环境下,数据量一般都是比较大的,所以in一般都会走索引的,出于索引设计原因,当性别不进行筛选时,采用这种方案可以使得联合索引可以被完全利用。

3.4时间字段范围查询与age冲突的解决方案

        如果时间字段也需要进行范围查询的话,这样范围查询就与age发生了冲突,无法将联合索引所有的字段都利用上。我们可以将时间字段修改为一个标志,来满足我们的需求。

4.分页场景优化

4.1分页SQL问题分析

        很多时候我们业务系统实现分析功能可能会用如下SQL实现:

SELECT * FROM employees LIMIT 10000,10;

        表示从表employees中取出10001行开始的10行记录,看似只查询了10条记录,实际这条SQL是先读取10010条记录,然后抛弃前10000条记录,然后督导后面10条想要的数据。因此要查询一张大表比较靠后的数据,执行效率是非常低的。

4.2根据自增且连续的主键排序的分页查询

        如果数据的主键确实是连续的,可以使用WHERE条件查询ID实现:

SELECT * FROM employees WHERE id > 90000 LIMIT 5;

        但是主键如果是非连续自增,就无法使用这种方式,这也是其中的局限性。

        局限性:1.主键自增且连续。2.结果是按照主键排序的。

4.3根据非主键字段排序的分页查询

        再看一个根据非主键字段排序的分页查询,SQL如下:

SELECT * FROM employees ORDER BY name LIMIT 90000, 5;

        但是这个过程中查询的数据比较多,所以name字段可能放弃使用索引。原因是:扫描整个索引并查找到没索引的行(可能要遍历多个索引树)的成本比扫描全表的成本更高,所以优化器放弃使用索引。

        知道不走索引的原因,那么怎么优化呢?

        其实关键是让排序时返回的字段尽量可能少,让覆盖索引可以覆盖到,无需回表查询,所以可以让排序和分页操作先查出主键,然后根据主键查到对应的记录,SQL改写如下:

SELECT * FROM employees e INNER JOIN (SELECT id FROM employees ORDER BY name LIMIT 90000, 5) ed ON e.id = ed.id;

        这条语句的查询过程中,内连接里面的查询是会走索引的,因为排序查询时仅仅查询了id,此时整条语句会走覆盖索引的,所以整条索引的查询效率是比较高的。

5.Join关联查询优化

5.1MySQL的表关联常见的两种算法

        MySQL表进行关联查询的时候,主要是采用了以下两种算法:

        1.Nested-Loop Join 算法。

        2.Block Nested-Loop Join 算法。

5.2嵌套循环连接Nested-Loop Join(NLJ) 算法

        一次一行循环地从第一张表(称之为驱动表)中读取行,在这行数据中取到关联字段,根据关联字段另一张表(被驱动表)里取出满足条件的行,然后取出两张表的结果合集。

        触发点:这种情况一般是两个表进行连接时,使用索引连接时会使用NLJ这种算法。

        看下面这个SQL语句:

EXPLAIN SELECT * FROM t1 INNER JOIN t2 JOIN t2 ON t1.a = t2.a;

        从执行计划中可以看到这些信息:

        先执行了t2表的查询,type是ALL说明采取的方案是全表查询,后又查询的是t1表,走了索引(因为t1表的a字段建立了索引),这种情况一共会扫描200次(驱动表中的数据量100时),所以性能还是比较高的。

        1.驱动表是t2,被驱动表是t1,驱动表是连接符号后面的表。先执行的就是驱动表(执行计划结果的id如果一样则按从上到下顺序执行SQL),优化器一般会优先选择小表作为驱动表。所以使用inner join时,排在前面的表不易i的那个是驱动表。

        2.当使用left join时,左表是驱动表,右表是被驱动表,当受用right join时,右表是驱动表,左表是被驱动表,当使用join时,MySQL会选择数据量比较小的表作为驱动表,大表作为被驱动表。

        3.使用了NLJ算法。一般Join语句中,如果执行计划Extra中未出现Using join buffer则表示使用的join算法时NLJ。

        上面SQL的大致流程如下:

        1.从表t2中读取一行数据(如果t2表有查询过滤条件的,会从过滤结果里取出一行数据)

        2.从第1步的数据,取出关联字段a,到表t1中查找。

        3.取出表t1中满足条件的行,跟t2中获取到的结果合并,作为结果返回给客户端。

        4.重复上面3步。

        整个过程会读取t2表中的所有数据(扫描100行),然后遍历这每行数据中字段a的值,根据t2表中a的值索引扫描t1表中的对应的的行(扫描100次t1表的索引,1次扫描可以认为最终只扫描t1表一行完整的数据,也就是总共t1表也扫描了100行)。因此整个过程扫描了200行。

5.3基于块的连接循环连接Block Nested Loop Join(BNL)算法

        把驱动表的数据读入到join_buffer中,然后扫描被驱动表,把被驱动表每一行取出来跟join_buffer中的数据作对比。

        触发点:这种情况一般出现在两个表进行连接时,不使用索引连接时会使用BNL这种算法。

        看下面这个SQL语句:

EXPLAIN SELECT * FROM t1 INNER JOIN t2 ON t1.b = t2.b;

        触发这种情况时,Extra中会显示使用了BNL这种算法。

        上面SQL的大致流程如下:

        1.把t2(驱动表)的所有数据放入到join_buiffer中。

        2.把表t1中的每一行取出来,跟join_buffer中的数据做对比。

        3.返回满足join条件的数据。

        整个过程中对表t1和t2都做了一次全表扫描,因此扫描的总行数为10000(表t1的数据总量)+ 100(表t2的数据总量)= 10100。并且join_buffer里的数据是无序的,因此对表t1中的每一行,都要做100次判断,所以内存中的判断次数是100 * 10000 = 100万次。

        这个例子中的表t2才100行,如果表t2是一个大表,join_buffer放不下肿莫办呢?

        join_buffer的大小是由参数join_buffer_size设定的,默认值是256kb。如果放不下表t2的所有数据,策略很简单,就是分段放

        比如t2表中有1000行记录,join_buffer一次只能放800行数据,那么执行过程中就是先往join_buffer里放800行数据,然后从t1表中取出数据跟join_buffer中数据进行对比得到部分结果,然后清空join_buffer,再放入t2表剩余200行记录,再次从t1表中取出数据跟join_buffer中数据对比得到部分结果,然后清空join_buffer,再放入t2表剩余200行记录,再从t1表中取数据跟join_buffer中数据对比。所以就多扫了一次t1表。

5.4表连接时连接字段没有索引为什么采用BNL算法而不是NLJ算法

        如果表连接时连接字段没有索引,使用NLJ算法的话,磁盘扫描次数就会是100万次。

        很显然,使用BNL算法磁盘扫描的次数少很多,相比于磁盘扫描,BNL的内存计算会快得多。

        因此MySQL对于被驱动表的关联字段没索引的关联查询,一般都会使用BNL算法。如果有索引一般选择NLJ算法,有索引的情况下NLJ算法比BNL算法性能更高。

5.5对于关联SQL的优化

        1.关联字段加索引:让MySQL做join操作时尽量选择NLJ算法。

        2.小表驱动大表:写多表连接SQL时如果明确知道那张表是小表可以用straight_join写法固定连接驱动方式,省去MySQL优化器自己判断的时间。

        straight_join解释:straight_join功能同join类似,但能让坐标的表来驱动右边的表,能改优化器对于联表查询的执行顺序。

        比如下面这条SQL语句:

SELECT * FROM t2 straight_join t1 ON t2.a = t1.a

        这条SQL语句代表着指定MySQL选择t2表作为驱动表。

        1.straight_join只适用于inner join,并不适用于left join,right join(因为left join,right join已经代表指定了表的执行顺序)

        2.尽可能让优化器去判断,因为大部分情况下MySQL优化器是比人要聪明的。使用straight_join一定要慎重,因为部分情况下人为指定的执行顺序并不一定会比优化引擎要靠谱。

6.in和exists优化

        原则:小表驱动大表,即小的数据集驱动大的数据集。

6.1in优化

        in:当B表的数据集小于A表的数据集,in优于exists。

        看下面的SQL语句:

SELECT * FROM A WHERE id IN (SELECT id FROM b);

        这个SQL语句的执行流程:先执行IN后面的SQL语句,从b表中查询中一个id数据集,再根据查询出的id数据集去A中查询数据。

        等价于下面的代码:

for (SELECT id FROM B) {SELECT * FROM A WHERE A.id = B.id
}

        其实就是外循环B表,每次循环查询到的ID数据都需要A表去查询一次等价数据。

        此时如果B表是小表,数据量比较小,所以就会使得查询的数据比较少,优化整体性能。

6.2exists优化

        exists:当A表的数据集小于B表的数据集时,exists优于in。将主查询A的数据,放到子查询B中做条件验证,根据验证结果(true或者false)来决定主查询的数据是否保留。

        看下面这条SQL语句:

SELECT * FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id = A.id)

        这个SQL语句的执行流程:先执行前面的SQL语句,从表A中查询出所有的数据,然后执行EXISTS后面的查询语句,再进行筛选数据。

        等价于下面的代码:

for (SELECT * FROM A) {SELECT * FROM B WHERE B.id = A.id
}

        1.EXISTS(subquery)只返回TRUE或者FALSE,因此子查询中的SELECT * 也可以SELECT 1替换,官方说明是实际执行时会忽略SELECT清单,因此没有区别。

        2.EXISTS子查询的实际执行过程可能进行了优化,而不是我们理解上的逐条对比。

7.Count(*)优化

7.1执行原理

        Count关键字有下面四种用法:

EXPLAIN SELECT COUNT(1) FROM employees;
EXPLAIN SELECT COUNT(id) FROM employees;
EXPLAIN SELECT COUNT(NAME) FROM employees;
EXPLAIN SELECT COUNT(*) FROM employees;

        四个SQL最终的执行计计划如下:

        type为index,且Extra为Using index,代表均走了索引,key索引字段都走的是idx_name_age_position二级索引(非聚簇索引)

        四个SQL的执行计划一样,说明这四个SQL的执行效率都应该差不多。

        字段有索引时:count(*) ≈ count(1) > count(字段) > count(主键ID)

        分析:

        count的整体执行的流程是将对应的数据取出进行累加计算出一个值,计算出后返回。对于COUNT(1)和COUNT(字段)来说,两者的执行流程是类似的,不过COUNT(1)不需要取出字段统计,只需要统计常量1即可,COUNT(字段)还需要取出字段,理论上COUNT(1)比COUNT(字段)会快一些。

        COUNT(*)是例外,MySQL并不会将全部字段取出来,而是专门做了优化,不取值,按行累加,效率很高,所以不需要用COUNT(列名)或者COUNT(常量)来替代COUNT(*)。

        COUNT(id)之所以会在字段有索引时慢于COUNT(字段),因为字段建立的是二级非聚簇索引,id的叶节点是聚簇索引,聚簇索引的数据量相对于二级非聚簇索引是更大的,所以COUNT(id)的性能会较差一些。但是在MySQL5.7时针对这个进行了对应的优化,当表中建立了二级索引时,使用COUNT(id)时,就会走二级索引树,来优化提升性能。

        字段没有索引时:count(*) ≈ count(1) > count(主键ID) > count(字段)

        因为字段没有索引时,count(字段)是无法走索引的,只能ALL全表扫描,但是count(主键ID)仍然可以走索引,所以性能会更高一些。

7.2优化方案

7.2.1查询MySQL自己维护的总行数

        对于myisam存储引擎的表做不带WHERE条件的COUNT查询性能是很高的,因为myisam存储引擎的表的总行数会被mysql存储在磁盘上,查询不需要计算。

        看下面这个SQL查询语句:

EXPLAIN SELECT COUNT(*) FROM test_myisam;

        这个SQL语句的执行计划中Extra是Select table optimized away,type是null,即代表这条SQL语句的执行速度特别快,性能特别高。

        对于innodb存储引擎的表,MySQL不会存储表的总记录行数(因为有MVVC机制),查询count需要实时计算。

7.2.2 show table status

        如果只需要知道表总行数的估计值可以使用如下SQL查询,性能很高:

SHOW TABLE STATUS LIKE 'employees';

        MySQL会在表中维护一个STATUS作为总行数的估计值,虽然不是很准确但是在很多场景下也足够使用了。

7.2.3将总数维护到Redis中

        插入或者删除数据行的时候同时维护Redis中的表总行数key的计数值(用incr和decr命令),但是这种方式可能不准,很难保证表操作和Redis操作的事务一致性。

7.2.4增加数据库计数表

        插入或者删除数据行的时候同时维护计数表,让他们在同一个事务里操作,这种情况下不会出现数据不一致的情况。

8.MySQL数据类型选择

8.1数据类型

        在MySQL中选择正确的数据类型,对于性能至关重要,一般应该遵循下面两部:

        (1)确定合适的大类型:数字、字符串、时间、二进制。

        (2)确定具体的类型:有无符号、取值范围、变长定长登。

        MySQL数据类型设置方面,尽量用更小的数据类型,因为它们通常有更好的性能,花费更少的硬件资源。并且尽量把字段定义为NOT NULL,避免使用NULL。

        尽量参考对应的数据表。

        优化建议:

        1.如果整形数据没有负数,如ID号,建议指定为UNSIGNED无符号类型,容量可以扩大一倍。

        2.建议使用TINYINT代替ENUM、BITENUM、SET。

        3.避免使用整数的显示宽度,也就是说,不要使用INT(10)类似的方法指定自动福安显示宽度,直接用INT。

        4.DECIMAL最适合保存准确度要求高,而且用于计算的数据,比如价格。但是在使用DECIMAL类型的时候,注意长度设置。

        5.建议使用整形类型来运算和存储实数,方法是,实数乘以相应的倍数后再操作。

        6.整数通常是最佳的数据类型,因为它速度快,并且能使用AUTO_INCREMENT。

8.2日期和时间

类型

大小(字节)

范围

格式

用途

DATE

3

1000-01-01 到 9999-12-31

YYYY-MM-DD

日期值

TIME

3

'-838:59:59' 到 ‘838:59:59’

HH:MM:SS

时间值或持续时间

YEAR

1

1901 到 2155

YYYY

年份值

DATETIME

8

1000-01-01 00:00:00 到 9999-12-31

YYYY-MM-DD HH:MM:SS

混合时间和日期值

TIMESTAMP

4

1970-01-01 00:00:00 到 2038-01-19 03:14:07

YYYYMMDDhhmmss

混合日期和时间值,时间戳

        小公司建议使用TIMESTAMP,因为TIMESTAMP相对于DATETIME更加节省内存。

        大公司建议使用DATETIME,因为TIMESTAMP有2038危机。

        优化建议:

        1.MySQL呢个存储的最小时间粒度为秒。

        2.建议使用DATE数据类型来保存日期。MySQL中默认的日期格式是yyyy-mm-dd。

        3.用MySQL的内建类型DATE、TIME、DATETIME来存储时间,而不是使用字符串。

        4.当数据格式为TIMESTAMP和DATETIME时,可以使用CURRENT_TIMESTAMP作为默认值(MySQL5.6以后),MySQL会自动返回记录插入的确切时间。

        5.TIMESTAMP是UTC时间戳,与时区相关。

        6.DATETIME的存储格式时一个YYYYMMDD HH:MM:SS的整数,与时区无关,存储了什么,读出来就是什么。

        7.除非有特殊需求,一般的公司建议使用TIMESTAMP,相比与DATETIME更加节约空间,但是像阿里这种大公司一般会使用DATETIME,因为无需考虑TIMESTAMP的2038危机。

        8.有时人们把Unix的时间戳保存为整数值,但是这样通常没有任何好处,而且这种格式处理起来也不是很方便。

8.3字符串

        只需要简单了解以下存储字符的格式即可,其他无需了解了:

类型

大小

用途

CHAR

0-255字节

定长字符串,char(n)当插入的字符串实际长度不足n时,插入空格进行补充保存。在进行检索时,尾部的空格会被去掉。

VARCHAR

0-65535字节

变长字符串,varchar(n)中的n代表最大列长度,插入的字符串实际长度不组n时不会补充空格。

BLOB

0-65535字节

二进制形式的长文本数据。

TEXT

0-65535字节

长文本数据。

        优化建议:

        1.字符串的长度相差较大用VARCHAR;字符串短,且所有值都接近一个长度用CHAR。

        2.CHAR和VARCHAR适用于包括人名、邮政编码、电话号码和不超过255个字符长度的任意字母数字组合。那些要用来计算的数字不要用VARCHAR类型保存,因为可能会导致一些与计算相关的问题。换句话说,可能会影响到计算的准确性和完整性。

        3.尽量少用BLOB和TEXT,如果实在要用可以考虑将BLOB和TEXT单独存储到一张表中,用ID关联。主要是因为TEXT和BLOB字段中存储的数据是比较大的,并且TEXT和BLOB的数据可能是不经常需要去查询的,如果不需要去查询,还在表的聚簇索引中跟随扫表,就会出现性能下滑的现象,所以将其单独存到一张表中有利于提高性能。

        4.BLOB系列存储二进制字符串,与字符集无关。TEXT系列存储非二进制字符串,与字符集相关。

        5.BLOB和TEXT都不能有默认值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/915917.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/915917.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「Linux命令基础」用户和用户组实训

用户与用户组关系管理 在Linux系统中,用户和用户组的关系就像班级里的学生和小组。一个用户可以同时属于多个组,这种灵活的成员关系为权限管理提供了便利。创建用户时,系统会自动生成一个与用户同名的主组,这个组会成为用户创建文件时的默认属组。 理解用户和用户组的关系…

Https以及CA证书

目录 1. 什么是 HTTPS 通信机制流程 证书验证过程 CA证书 浏览器如何校验证书合法性呢&#xff1f; 1. 什么是 HTTPS HTTP 加上加密处理和认证以及完整性保护后即是 HTTPS。 它是为了解决 HTTP 存在的安全性问题&#xff0c;而衍生的协议&#xff0c;那使用 HTTP 的缺点有…

数字图像处理(四:图像如果当作矩阵,那加减乘除处理了矩阵,那图像咋变):从LED冬奥会、奥运会及春晚等等大屏,到手机小屏,快来挖一挖里面都有什么

数字图像处理&#xff08;四&#xff09;三、&#xff08;准备工作&#xff1a;玩具咋玩&#xff09;图像以矩阵形式存储&#xff0c;那矩阵一变、图像立刻跟着变&#xff1f;原图发挥了钞能力之后的图上述代码包含 10 个图像处理实验&#xff0c;每个实验会生成对应处理后的图…

SpringBoot航空订票系统的设计与实现

文章目录前言详细视频演示具体实现截图后端框架SpringBoot持久层框架Hibernate成功系统案例&#xff1a;代码参考数据库源码获取前言 博主介绍:CSDN特邀作者、985高校计算机专业毕业、现任某互联网大厂高级全栈开发工程师、Gitee/掘金/华为云/阿里云/GitHub等平台持续输出高质…

2025年PostgreSQL 详细安装教程(windows)

前言 PostgreSQL 是一个功能强大的开源关系型数据库管理系统(ORDBMS)&#xff0c;以下是对它的全面介绍&#xff1a; 基本概况 名称&#xff1a;通常简称为 "Postgres" 类型&#xff1a;对象-关系型数据库管理系统 许可&#xff1a;开源&#xff0c;采用类MIT许可…

Java日志按天切分方法

使用 Logrotate&#xff08;推荐&#xff09;Logrotate 是 Linux 系统自带的日志管理工具&#xff0c;支持自动切割、压缩和删除旧日志。步骤&#xff1a;创建 Logrotate 配置文件在 /etc/logrotate.d/ 下新建配置文件&#xff08;如 java-app&#xff09;&#xff1a;sudo nan…

进阶向:基于Python的本地文件内容搜索工具

概述 大家好&#xff01;今天我们将一起学习如何用Python创建一个简单但强大的本地文件内容搜索工具。这个工具特别适合处理大量文本文件时的快速检索需求。 为什么要学习这个工具 如果你刚接触编程&#xff0c;完全不用担心&#xff01;我会从零开始讲解&#xff0c;确保每…

多模态AI的可解释性

多模态AI的可解释性挑战 在深入探讨解决方案之前&#xff0c;首先需要精确地定义问题。多模态模型因其固有的复杂性&#xff0c;其内部决策过程对于人类观察者而言是不透明的。 模态融合机制 (Modal Fusion Mechanism)&#xff1a;模型必须将来自不同来源&#xff08;如图像和文…

MySQL深度理解-MySQL事务优化

1.什么是事务事务就是进行多个操作&#xff0c;要么同时执行成功&#xff0c;要么同时执行失败。2.事务的特性 - ACID特性2.1原子性Atomicity原子性&#xff08;Atomicity&#xff09;&#xff1a;当前事务的操作要么同时成功&#xff0c;要么同时失败。原子性由undo log日志来…

2025小学所有学习科目的全部版本电子教材

2025春小学最新课本-新版电子教材【文末自行获取全部资料~】 小学语文&#xff1a; 小学数学&#xff1a; 小学英语&#xff1a; 小学科学&#xff1a; 小学道德与法治&#xff1a; 小学劳动技术&#xff1a; 小学美术&#xff1a; 小学书法练习指导&#xff1a; 小学体育与健康…

华为视觉算法面试30问全景精解

华为视觉算法面试30问全景精解 ——技术引领 工程极致 智能未来:华为视觉算法面试核心考点全览 前言 华为作为全球领先的ICT(信息与通信技术)解决方案供应商,在智能终端、云计算、智慧城市、自动驾驶、工业互联网等领域持续推动视觉AI的创新与产业落地。华为视觉算法岗…

【Anaconda】Conda 虚拟环境打包迁移教程

Conda 虚拟环境打包迁移教程本文介绍如何使用 conda-pack 将 Conda 虚拟环境打包&#xff0c;并在另一台电脑上快速迁移、部署。0. 安装 conda-pack conda-pack 并非 Conda 默认自带工具&#xff0c;首次使用前必须手动安装。以下两种安装方式任选其一即可&#xff1a; ✅ 方法…

matrix-breakout-2-morpheus靶机通关教程

目录 一、信息搜集 二、尝试GetShell 三、反弹Shell 一、信息搜集 首先搜集信息&#xff0c;观察页面。 发现什么都没有&#xff0c;我们先来发现一下它的IP以及开放的端口。首先我们观察一下它的网络模式是怎么样的&#xff0c;来确定IP段。 可以发现他是NAT模式&#xff0…

深入思考【九九八十一难】的意义,试用歌曲能否解释

1. 《平凡之路》- 朴树契合点&#xff1a;前半生追求明白&#xff1a;“我曾经失落失望失掉所有方向&#xff0c;直到看见平凡才是唯一的答案”。后半生修行糊涂&#xff1a;“时间无言&#xff0c;如此这般&#xff0c;明天已在眼前”。对过去的释然与对未来的随缘&#xff0c…

SSM之表现层数据封装-统一响应格式全局异常处理

SSM之表现层数据封装-统一响应格式&全局异常处理一、为什么需要表现层数据封装&#xff1f;二、表现层数据封装的通用格式成功响应示例失败响应示例三、SSM中实现统一响应对象3.1 定义响应对象类&#xff08;Result.java&#xff09;四、全局异常处理4.1 实现全局异常处理器…

微软Fabric重塑数据管理:Forrester报告揭示高ROI

在数字化转型加速的今天&#xff0c;微软公司推出的Microsoft Fabric数据管理平台正以其卓越的经济效益和全面的技术能力引领行业变革。根据Forrester Consulting最新发布的总体经济影响(TEI)研究报告&#xff0c;该平台展现出令人瞩目的商业价值&#xff1a;实现379%的投资回报…

基于Qt和OpenCV的图片与视频编辑器

应用技术&#xff1a;Qt C、OpenCV、多线程、单例模式&#xff0c;qss样式表、OpenGL、ffmpeg。 本项目为Qt mingw6.5.3版本&#xff0c;QtCreator编写运行。 void XVideoWidget::do_setImage(cv::Mat mat) {QImage::Format fmt QImage::Format_RGB888;int pixSize 3;//处理…

NOTEPAD!NPCommand函数分析之comdlg32!GetSaveFileNameW--windows记事本源代码分析

第一部分&#xff1a;kd> kcUSER32!InternalCallWinProc USER32!UserCallDlgProcCheckWow USER32!DefDlgProcWorker USER32!SendMessageWorker USER32!InternalCreateDialog USER32!InternalDialogBox USER32!DialogBoxIndirectParamAorW USER32!DialogBoxIndirectParamW US…

【Qt开发】信号与槽(一)

目录 1 -> 信号和槽概述 1.1 -> 信号的本质 1.2 -> 槽的本质 2 -> 信号与槽的连接方式 2.1 -> 一对一 2.2 -> 一对多 2.3 -> 多对一 3 -> 小结 1 -> 信号和槽概述 在 Qt 中&#xff0c;用户和控件的每次交互过程称为一个事件。比如 “用户…

目标检测中的标签分配算法总结

目标检测中的标签分配算法是训练过程中的一个核心环节&#xff0c;它决定了如何将标注好的真实目标框分配给模型预测出来的候选框&#xff08;Anchor Boxes或Points&#xff09;&#xff0c;从而为这些候选框提供监督信号&#xff08;正样本、负样本、忽略样本&#xff09;。它…