深入理解数据结构之复杂度

文章目录

- 1.数据结构前言
- 1.1 数据结构
- 1.2 算法
2.算法效率
- 2.1 复杂度的概念
- 2.2 复杂度的重要性
- 3.1 大O的渐进表式法
- 3.2 时间复杂度计算示例
- - 3.2.1 示例1
  - 3.2.2 示例2
  - 3.2.3 示例3
  - 3.2.4 示例4
  - 3.2.5 示例5
  - 3.2.6 示例6
  - 3.2.7 示例7
4.空间复杂度
- 4.1 空间复杂度计算示例
- - 4.1.1 示例1
  - 4.1.2 示例2
5.常见复杂度对比
6.复杂度算法题
- 6.1思路2
- 6.2思路3：

1.数据结构前言

1.1 数据结构

数据结构(Data Structure)是计算机存储、组织数据的⽅式，指相互之间存在⼀种或多种特定关系的数据元素的集合。没有⼀种单⼀的数据结构对所有⽤途都有⽤，所以我们要学各式各样的数据结构，如：线性表、树、图、哈希等

1.2 算法

算法(Algorithm):就是定义良好的计算过程，他取⼀个或⼀组的值为输⼊，并产⽣出⼀个或⼀组值作为输出。简单来说算法就是⼀系列的计算步骤，⽤来将输⼊数据转化成输出结果。

2.算法效率

如何衡量⼀个算法的好坏呢？

案例：旋转数组https://leetcode.cn/problems/rotate-array/description/

思路：循环K次将数组所有元素向后移动⼀位

在这里插入图片描述

我们试着写一下这道算法题，

可以将这道题拆分成：先实现一次轮转，再循环K次，从而实现K次轮转

将数组中最后一个数据存放到numEND中，再将剩余的数组从后往前，依次向前移动一位，

最后将numEND放到nums[0]，这样就实现了一次轮转，再循环K次，就成功了

void rotate(int* nums, int numsSize, int k) {while(k--){int numEND = nums[numsSize-1];for(int i=numsSize-1;i>0;i--){nums[i]=nums[i-1];}nums[0]=numEND;}}

我们试着提交，发现这段代码并没有提交成功，并且显示超出时间限制

在这里插入图片描述

代码点击执行可以通过，然而点击提交却无法通过，那该如何衡量其好与坏呢？（这道算法的解法第6大点中给出）

2.1 复杂度的概念

算法在编写成可执⾏程序后，运⾏时需要耗费时间资源和空间(内存)资源。因此衡量⼀个算法的好坏，⼀般是从时间和空间两个维度来衡量的，即时间复杂度和空间复杂度。时间复杂度主要衡量⼀个算法的运行快慢，⽽空间复杂度主要衡量⼀个算法运⾏所需要的额外空间。在计算机发展的早期，计算机的存储容量很⼩。所以对空间复杂度很是在乎。但是经过计算机⾏业迅速发展，计算机的存储容量已经达到了很⾼的程度。所以我们如今已经不需要再特别关注⼀个算法的空间复杂度。

2.2 复杂度的重要性

复杂度在校招中的考察已经很常⻅，如下：
在这里插入图片描述

定义：在计算机科学中，算法的时间复杂度是⼀个函数式T(N)，它定量描述了该算法的运⾏时间。时间复杂度是衡量程序的时间效率，那么为什么不去计算程序的运⾏时间呢？

因为程序运行时间和编译环境和运行机器的配置都有关系，比如同⼀个算法程序，用⼀个老编译

器进行编译和新译器编译，在同样机器下运行时间不同。

同⼀个算法程序，用⼀个老低配置机器和新高配置机器，运行时间也不同。
并且时间只能程序写好后测试，不能写程序前通过理论思想计算评估。

那么算法的时间复杂度是⼀个函数式T(N)到底是什么呢？

这个T(N)函数式计算了程序的执行次数。

通过c语言编译链接章节学习，我们知道算法程序被编译后生成⼆进制指令，程序运行，就是cpu执行这些编译好的指令。那么我们通过程序代码或者理论思想计算出程序的执行次数的函数式T(N)，假设每句指令执行时间基本⼀样(实际中有差别，但是微乎其微)，那么执行次数和运行时间就是等比正相关，这样也脱离了具体的编译运行环境。执行次数就可以代表程序时间效率的优劣。比如解决⼀个问题的算法a程序T(N) = N，算法b程序T(N) = N^2，那么算法a的效率⼀定优于算法b。

案例：

// 请计算⼀下Func1中++count语句总共执⾏了多少
次？
void Func1(int N)
{int count = 0;for (int i = 0; i < N; ++i){for (int j = 0; j < N; ++j){++count;}}for (int k = 0; k < 2 * N; ++k){++count;}int M = 10;while (M--){++count;}
}

Func1 执⾏的基本操作次数：

T (N) = N2 + 2 ∗ N + 10
N = 10 T(N) = 130
N = 100 T(N) = 10210
N = 1000 T(N) = 1002010

通过对N取值分析，对结果影响最大的⼀项是 N^2

实际中我们计算时间复杂度时，计算的也不是程序的精确的执行次数，精确执行次数计算起来还是很

麻烦的(不同的⼀句程序代码，编译出的指令条数都是不⼀样的)，计算出精确的执行次数意义也不大，

因为我们计算时间复杂度只是想比较算法程序的增长量级，也就是当N不断变大时T(N)的差别，上面我

们已经看到了当N不断变大时常数和低阶项对结果的影响很小，所以我们只需要计算程序能代表增长量

级的大概执行次数，复杂度的表式通常使用大O的渐进表示法。

3.1 大O的渐进表式法

大O符号（Big O notation）：是用于描述函数渐进行为的数学符号

[!IMPORTANT]

1.时间复杂度函数式T(N)中，只保留最高阶项，去掉那些低阶项，因为当N不断变大时，低阶项对结果影响越来越小，当N无穷大时，就可以忽略不计了。

如果最高阶项存在且不是1，则去除这个项目的常数系数，因为当N不断变大，这个系数对结果影响越来越小，当N无穷大时，就可以忽略不计了。

T(N)中如果没有N相关的项目，只有常数项，用常数1取代所有加法常数。

通过以上方法，可以得到 Func1 的时间复杂度为： O(N2 )

3.2 时间复杂度计算示例

3.2.1 示例1

// 计算Func2的时间复杂度？
void Func2(int N)
{int count = 0;for (int k = 0; k < 2 * N; ++k){++count;}int M = 10;while (M--){++count;}printf("%d\n", count);
}

Func2执行的基本操作次数：

T (N) = 2N + 10

根据推导规则第3条得出 Func2的时间复杂度为： O(N)

3.2.2 示例2

// 计算Func3的时间复杂度？
void Func3(int N, int M)
{int count = 0;for (int k = 0; k < M; ++k){++count;}for (int k = 0; k < N; ++k){++count;}printf("%d\n", count);
}

Func3执行的基本操作次数：

T (N) = M + N

因此：Func2的时间复杂度为： O(N)

在这里插入图片描述

3.2.3 示例3

// 计算Func4的时间复杂度？
void Func4(int N)
{int count = 0;for (int k = 0; k < 100; ++k){++count;}printf("%d\n", count);
}

在这里插入图片描述

T (N) = 100

根据推导规则第1条得出

Func2的时间复杂度为： O(1)

3.2.4 示例4

// 计算strchr的时间复杂度？
const char* strchr(const char* str, int character)
{const char* p_begin = s;while (*p_begin != character){if (*p_begin == '\0')return NULL;p_begin++;}return p_begin;
}

strchr执行的基本操作次数：

1）若要查找的字符在字符串第⼀个位置，则：T (N) = 1

2）若要查找的字符在字符串最后的⼀个位置，则：T (N) = N

3）若要查找的字符在字符串中间位置，则：T (N) = N/2

因此：strchr的时间复杂度分为：

最好情况： O(1)

最坏情况： O(N)

平均情况： O(N)

通过上⾯我们会发现，有些算法的时间复杂度存在最好、平均和最坏情况。

最坏情况：任意输⼊规模的最⼤运⾏次数(上界)

平均情况：任意输⼊规模的期望运⾏次数

最好情况：任意输⼊规模的最⼩运⾏次数(下界)

⼤O的渐进表⽰法在实际中⼀般情况关注的是算法的上界，也就是最坏运行情况。

3.2.5 示例5

// 计算BubbleSort的时间复杂度？
void BubbleSort(int* a, int n)
{assert(a);for (size_t end = n; end > 0; --end){int exchange = 0;for (size_t i = 1; i < end; ++i){if (a[i - 1] > a[i]){Swap(&a[i - 1], &a[i]);exchange = 1;}}if (exchange == 0)break;}
}

这是冒泡排序的函数，这个函数主要是将数组中两个相邻的元素依次进行比较，将大的元素往后放（升序），从头到尾将每组相邻的元素比较完后，就能保证数组中最后那个元素是最大的（这是内层循环，当数组无限大时即循环n次），再来一趟就能把第二大的元素放到，倒数第二个位置，在进行下去循环数组长度n趟（最坏的情况），就得到了升序数组。

这样的函数的执行次数是多少呢？举个例子：
在这里插入图片描述

对于有n个元素的数组，最坏的情况代码要执行（n-1）+(n-2)+...+2+1次，通过我们小学所学的等差数列求和公式，这段代码一共执行了n*（n-1）/2次。我们的时间复杂度就是O( $n^2$ )当然这是最坏的情况，如果说数组完全有序，在比较完一趟数组之后没有发生元素交换即exchange == 0时，代码就只执行了（n-1）次，时间复杂度为O（n）,我们一般采取最坏的情况。

因此：BubbleSort的时间复杂度取最差情况为： O(* $N^2$ )

3.2.6 示例6

void func5(int n)
{int cnt = 1;while (cnt < n){cnt *= 2;}
}

有的时候代码的执行次数可能是对数，就像这个函数。

分析如下：

在这里插入图片描述

当n接近无穷大时，底数的大小对结果影响不大。因此，⼀般情况下不管底数是多少都可以省略不写，即可以表⽰为 log n

不同书籍的表示方式不同，以上写法差别不大，建议使用 log n

3.2.7 示例7

// 计算阶乘递归Fac的时间复杂度？
long long Fac(size_t N)
{if (0 == N)return 1;return Fac(N - 1) * N;
}

调用⼀次Fac函数的时间复杂度为 O(1)而在Fac函数中，存在n次递归调用Fac函数

因此：阶乘递归的时间复杂度为： O(n)

4.空间复杂度

空间复杂度也是⼀个数学表达式，是对⼀个算法在运行过程中因为算法的需要额外临时开辟的空间。空间复杂度不是程序占用了多少bytes的空间，因为常规情况每个对象大小差异不会很大，所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似，也使⽤大O渐进表示法。

注意：函数运行时所需要的栈空间(存储参数、局部变量、⼀些寄存器信息等)在编译期间已经确定好了，因此空间复杂度主要通过函数在运⾏时候显式申请的额外空间来确定。

4.1 空间复杂度计算示例

4.1.1 示例1

// 计算BubbleSort的时间复杂度？
void BubbleSort(int* a, int n)
{assert(a);for (size_t end = n; end > 0; --end){int exchange = 0;for (size_t i = 1; i < end; ++i){if (a[i - 1] > a[i]){Swap(&a[i - 1], &a[i]);exchange = 1;}}if (exchange == 0)break;}
}

这里我们额外创建的变量只有形参变量n和exchange

BubbleSort额外申请的空间有exchange等有限个局部变量，使用了常数个额外空间因此空间复杂度为 O(1)。

4.1.2 示例2

// 计算阶乘递归Fac的空间复杂度？
long long Fac(size_t N)
{if (N == 0)return 1;return Fac(N - 1) * N;
}

Fac递归调用了N次，额外开辟了N个函数栈帧，每个栈帧使用了常数个空间

因此空间复杂度为： O(N)

在这里插入图片描述

5.常见复杂度对比

在这里插入图片描述

6.复杂度算法题

在了解完复杂度的概念之后，我们终于理解了在第2大点当中那道轮转数组算法无法通过的原因，那我们如何优化我们的算法呢？

在上面的解法中，时间复杂度是O(N^2)，下面我们给出时间复杂度更低的两种解法：

6.1思路2

空间复杂度 O(n)

申请新数组空间，先将后k个数据放到新数组中，再将剩下的数据挪到新数组中

void rotate(int* nums, int numsSize, int k) {int newArr[numsSize];k=k%numsSize;for (int i = 0; i < k; i++){newArr[i] = nums[numsSize - k + i];}for (int j = k; j < numsSize; j++){newArr[j] = nums[j - k];}for(int x=0;x<numsSize;x++){nums[x]=newArr[x];}
}

这是这种解法的第一种方式，我们创建好新数组后，将原数组nums中倒数k个元素赋值到newArr的前k个，再将nums前numsSize-k个元素赋值到newArr后numsSize-k个，最后将新数组newArr拷贝给原数组nums其中最关键的是k的越界问题，因为k有可能是大于numsSize的，也就是数组轮转了超过numsSize个，甚至有可能包含了很多个numsSize，但是每循环numsSize次都是没有意义的，都会回到原点，所以我们要在前面加上
k=k%numsSize;，也就是把k限制在numsSize内

在这里插入图片描述

此解法还有另一种方式，更加简单直接

void rotate(int* nums, int numsSize, int k) {int newArr[numsSize];for(int i=0;i<numsSize;i++){newArr[(i+k)%numsSize]=nums[i];}for(int j=0;j<numsSize;j++){nums[j]=newArr[j];}
}

我们直接将原数组中nums[i]赋值给newArr[(i+k)]，我们不用分先后，直接轮转，但是很明显如果代码只有这样，可能会出现两种问题，一是循环到后面i+k会越界,这个时候它应该回到开头，二是i+k可能一开始就很大，超出numsSize好几轮我们还要newArr[(i+k)%numsSize],这样就确保(i+k)是在numsSize内的

这种解法只用了两个或者三个并列的循环时间复杂度是O(n)，而文章最开始使用的是嵌套循环时间复杂度是O( $n^2$ )，这种解法我们创建了新的数组，导致我们的空间复杂度变成了O(n)，本质上是用空间换时间的方式来提高性能。

6.2思路3：

空间复杂度 O(1)

前n-k个逆置： 4 3 2 1 5 6 7
后k个逆置：4 3 2 1 7 6 5
整体逆置： 5 6 7 1 2 3 4

void reserve(int* arr, int begin, int end)
{while (begin < end){int tmp = arr[begin];arr[begin] = arr[end];arr[end] = tmp;begin++;end--;}}void rotate(int* nums, int numsSize, int k) {k = k % numsSize;reserve(nums, 0, numsSize - k - 1);reserve(nums, numsSize - k, numsSize - 1);reserve(nums, 0, numsSize - 1);}