
学习数据结构,那必须得先介绍时间复杂度与空间复杂度,而且在很多时候出现在校招的笔试之中。 很多公司对代码能力的要求提高了,大厂笔试中几乎全是算法题而且难度大,中小厂笔试中也会有算法题。算法不仅笔试中考察,而面试中面试官基本都会让现场写代码。而算法能力短期内无法快速提高了,至少需要持续半年以上算法训练积累,否则真正校招时笔试会很艰难,因此算法要早早准备。
那如何学习好数据结构和算法呢? 注意画图和思考,当然代码也是很重要的
那先来介绍一下算法。
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
来举个例子:对于斐波纳契数列
long long Fib(int N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
**时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。**在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
来看个例子:请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N; ++i)
{
for (int j = 0; j < N; ++j)
{
++count;
}
}
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}我们来分析一下: 这里有三个循环,而这里代码
for (int i = 0; i < N; ++i)
{
for (int j = 0; j < N; ++j)
{
++count;
}
}嵌套了循环,而且都是N次,那这里总的就是平方阶N^2次。
继续看下面的循环:
for (int k = 0; k < 2 * N; ++k)
{
++count;
}这里循环了2*N次。
而后面又有一个while循环
int M = 10;
while (M--)
{
++count;
}虽然说也是循环,但前面已经给了M = 10,这里也就循环了10次。
所以Func1 执行的基本操作次数 :就是前面的和,也就是:F(N)=N^2+2*N+10。
但其实实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法: 1、用常数1取代运行时间中的所有加法常数。 2、在修改后的运行次数函数中,只保留最高阶项。 3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
在第一个代码中,使用大O的渐进表示法以后,Func1的时间复杂度为:O(N²)。
N = 10 F(N) = 100 N = 100 F(N) = 10000 N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。另外有些算法的时间复杂度存在最好、平均和最坏情况: 最坏情况:任意输入规模的最大运行次数(上界) 平均情况:任意输入规模的期望运行次数 最好情况:任意输入规模的最小运行次数(下界) 例如:在一个长度为N数组中搜索一个数据x 最好情况:1次找到 最坏情况:N次找到 平均情况:N/2次找到。
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)。
看这么多理论,不如来点示例看看。
计算Func2的时间复杂度
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}我们把代码分开来看看 第一部分:
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}这里循环了2*N次;
第二部分:
int M = 10;
while (M--)
{
++count;
}这里的whlie就循环了10次。 所以这里的F(N)=2*N+10。
计算Func3的时间复杂度
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++ k)
{
++count;
}
for (int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}这里我们看到同样有两个循环,那结果结束O(M+N)了吗? 其实并不是。 我们并不知道M和N的关系: 如果N远大于M,那就是O(N); 如果M远大于N,那就是O(M); 那它们差不多大的时候那就是O(N)或者O(M)都可以; 那在不能确定它们关系的时候,才是O(M+N)。
计算Func4的时间复杂度
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++ k)
{
++count;
}
printf("%d\n", count);
}那这里的又是多少呢? 可不能以为是O(N),那是在不确定N大小时,而在这个例子中,已经明确指出了k < 100,这里就是O(1)。 那就是有人问什么是O(1)? O(1)就表示这里是常数次,看例子中,100是不是一个常数,那当然是。
计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );这里我们就先来看看图:

我们要查找一个数,可能第一个就是,也有可能最后一个才找到,那我们用平均查找的时间来决定它的时间复杂度吗? 当然是不行的,我们不能取平均,而取的是最坏的情况。 也就是在实际中一般情况关注的是算法的最坏运行情况。
看看经典算法冒泡排序BubbleSort的时间复杂度
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}要注意的是时间复杂度是根据算法的思想来计算,并不是看代码。 我们都知道冒泡排序,第一趟要n-1次,第二趟n-2,第三趟n-3,以此类推最后一次。

最后我们来求一下和,那就是

最终结果就是O(N^2),我们不考虑常数项和系数的影响。
计算BinarySearch的时间复杂度
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n - 1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号 while (begin <= end)
{
int mid = begin + ((end - begin) >> 1);
if (a[mid] < x)
begin = mid + 1;
else if (a[mid] > x)
end = mid - 1;
else
return mid;
}
return -1;
}画图来看看:

每一次找就除2,最坏的情况就是到1。那就是N/2/2/…/2=1;

因为一般不好打下标2,所以简写为O(logN)。 有的书上或者文章上会写成O(lgN),但是不建议这样写,因为这样容易和数学上是的相冲突。
计算阶乘递归Fac的时间复杂度
long long Fac(size_t N)
{
if (0 == N)
return 1;
return Fac(N - 1) * N;
}显然这里是递归调用,那就是多次累加

也就是O(N)。
计算斐波那契递归Fib的时间复杂度
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
一直到

就像一个三角形

那这里就是

怎么才能好计算呢? 看看:

一下就出来了,这里的时间复杂度就是O(2^N).
时间复杂度例子就看到这里,我们来看看空间复杂度吧!
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度,也就是额外的。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。 注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
同样来计算一下冒泡BubbleSort的空间复杂度吧
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}在冒泡排序中我们并没有申请额外的空间来经行临时存储,这里就是常数阶O(1)。
计算一下Fibonacci的空间复杂度 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if (n == 0)
return NULL;
long long* fibArray = (long long*)malloc((n + 1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n; ++i)
{
fibArray[i] = fibArray[i - 1] + fibArray[i - 2];
}
return fibArray;
}这里
long long* fibArray = (long long*)malloc((n + 1) * sizeof(long long));开辟了n个新空间,所以这里的空间复杂度为O(N)。
计算阶乘递归Fac的空间复杂度
long long Fac(size_t N)
{
if (0 == N)
return 1;
return Fac(N - 1) * N;
}这里递归调用空间复杂度计算,也是空间的老家,但是与时间不同的是,空间是可以重复利用的。 这里递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)。
空间重复利用,来看一个例子:
void func1()
{
int a = 0;
printf("%p\n", &a);
}
void func2()
{
int b = 0;
printf("%p\n", &b);
}
int main()
{
func1();
func2();
return 0;
}这里就说明空间是可以重复利用的。

一般算法常见的复杂度如下:


有问题请指出,大家一起进步吧!