说明一下,我用的是gcc7.1.0编译器,标准库源代码也是这个版本的。
本篇文章讲解c++11中lambda表达式用法。
初次接触lambda这个关键字,记得还是在python里面,但其实,早在2011年c++11推出来的时候我们c++就有了这个关键字啦。lambda表达式是C++11中引入的一项新技术,利用lambda表达式可以编写内嵌的匿名函数,用以替换独立函数或者函数对象,并且使代码更可读。
所谓函数对象,其实就是对operator()进行重载进而产生的一种行为,比如,我们可以在类中,重载函数调用运算符(),此时类对象就可以直接类似函数一样,直接使用()来传递参数,这种行为就叫做函数对象,同样的,它也叫做仿函数。
如果从广义上说,lambda表达式产生的是也是一种函数对象,因为它也是直接使用()来传递参数进行调用的。
lambda表达式基本语法如下:
[ 捕获 ] ( 形参 ) -> ret { 函数体 };
lambda表达式一般都是以方括号[]开头,有参数就使用(),无参就直接省略()即可,最后结束于{},其中的ret表示返回类型。
我们先看一个简单的例子,定义一个可以输出字符串的lambda表达式,完整的代码如下:
#include <iostream>
int main()
{
auto atLambda = [] {std::cout << "hello world" << std::endl;};
atLambda();
return 0;
}
上面定义了一个最简单的lambda表达式,没有参数。如果需要参数,那么就要像函数那样,放在圆括号里面,如果有返回值,返回类型则要放在->后面,也就是尾随返回类型,当然你也可以忽略返回类型,lambda会帮你自动推导出返回类型,下面看一个较为复杂的例子:
#include <iostream>
int main()
{
auto print = [](int s) {std::cout << "value is " << s << std::endl;};
auto lambAdd = [](int a, int b) ->int { return a + b;};
int iSum = lambAdd(10, 11);
print(iSum);
return 0;
}
lambAdd有两个入参a和b,然后它的返回类型是int,我们可以试一下把->int
去掉,结果是一样的。
在第1节中,我们展示了lambda的语法形式,后面的形参和函数体之类都好理解,那么方括号里面捕获是啥意思呢?
其实这里涉及到lambda表达式一个重要的概念,就是闭包。
这里我们需要先对lambda表达式的实现原理做一下说明:当我们定义一个lambda表达式后,编译器会自动生成一个匿名类,这个类里面会默认实现一个public类型的operator()函数,我们称为闭包类型。那么在运行时,这个lambda表达式就会返回一个匿名的闭包实例,它是一个右值。
所以,我们上面的lambda表达式的结果就是一个一个的闭包。闭包的一个强大之处是可以通过传值或者引用的方式捕获其封装作用域内的变量,前面的方括号就是用来定义捕获模式以及变量,所以我们把方括号[]括起来的部分称为捕获块。
看这个例子:
#include <iostream>
int main()
{
int x = 10;
auto print = [](int s) {std::cout << "value is " << s << std::endl;};
auto lambAdd = [x](int a) { return a + x;};
auto lambAdd2 = [&x](int a, int b) { return a + b + x;};
auto iSum = lambAdd(10);
auto iSum2 = lambAdd2(10, 11);
print(iSum);
print(iSum2);
return 0;
}
当lambda块为空时,表示没有捕获任何变量,不为空时,比如上面的lambAdd是以复制的形式捕获变量x,而lambAdd2是以引用的方式捕获x。那么这个复制或者引用到底是怎么体现的呢,我们使用gdb看一下lambAdd和lambAdd2的具体类型,如下:
(gdb) ptype lambAdd
type = struct <lambda(int)> {
int __x;
}
(gdb) ptype lambAdd2
type = struct <lambda(int, int)> {
int &__x;
}
(gdb)
前面我们说过lambda实际上是一个类,这里得到了证明,在c++中struct和class除了有少许区别,其他都是一样的,所以我们可以看到复制形式捕获实际上是一个包含int类型成员变量的struct,引用形式捕获实际上是一个包含int&类型成员变量的struct,然后在运行的时候,会使用我们捕获的数据来初始化成员变量。
既然有初始化,那么必然有构造函数啊,然后捕获生成的成员变量,有operator()函数,暂时来讲,一个比较立体的闭包类型就存在于我们脑海中啦,对于lambda表达式类型具体组成,我们暂时放一放,接着说捕获。
捕获的方式可以是引用也可以是复制,但是到底有哪些类型的捕获呢?
捕获类型如下:
可以看到,lambda是可以有多个捕获的,每个捕获之间以逗号分隔,另外呢,不管多少种捕获类型,万变不离其宗,要么以复制方式捕获,要么以引用方式捕获。
那么复制捕获和引用捕获到底有什么区别呢?
标准c++规定,默认情况下,在lambda表达式中,对于operator()的重载是const属性的,也就意味着如果以复制形式捕获的变量,是不允许修改的,看这段代码:
#include <iostream>
int main()
{
int x = 10;
int y = 20;
auto print = [](int s) {std::cout << "value is " << s << std::endl;};
auto lambAdd = [x](int a) {
// x++; 此处x是只读,不允许自增,编译会报错
return a + x;
};
auto lambAdd2 = [&x](int a, int b) {
x = x+5;
return a + b + x;
};
auto iSum = lambAdd(10);
auto iSum2 = lambAdd2(10, 11);
print(iSum);
print(iSum2);
return 0;
}
从代码可以看出,复制捕获不允许修改变量值,而引用捕获则允许修改变量值,为什么呢,这里我理解,&x实际上是一个int*类型的指针,所以我们可以修改x的值,因为我们只是对这个指针所指向的内容进行修改,并没有对指针本身进行修改,且与我们常规声明的引用类型入参一样,修改的值在lambda表达式外也是有效的。
那么如果我想使用复制捕获,又想修改变量的值呢,这时我们就想起来有个关键字,叫做mutable,它允许在常成员函数中修改成员变量的值,所以我们可以给lambda表达式指定mutable关键字,如下:
#include <iostream>
int main()
{
int x = 10;
int y = 20;
auto print = [](int s) {std::cout << "value is " << s << std::endl;};
auto lambAdd = [x](int a) mutable {
x++;
return a + x;
};
auto iSum = lambAdd(10);
print(iSum);
print(x);
return 0;
}
执行结果如下:
value is 21
value is 10
所以加上mutable以后就可以对复制捕获进行修改,但有一点,它的修改出了lambda表达式以后就无效了。
仔细看2.2节中捕获类型,会发现有[x…]这样的类型,它实际上是以复制方式捕获了一个可变参数,在c++中其实涉及到了模板形参包,也就是变参模板,看下面例子:
#include <iostream>
void tprintf()
{
return;
}
template<typename U, typename ...Ts>
void tprintf(U u, Ts... ts)
{
auto t = [ts...]{
tprintf(ts...);
};
std::cout << "value is " << u << std::endl;
t();
return;
}
int main()
{
tprintf(1,'c',3, 8);
return 0;
}
它捕获了一组可变的参数,不过这里实际上是为了演示对可变参数的捕获,强行使用了lambda表达式,不使用的话,代码可能更加简洁,我们只需要通过这个演示知道怎么使用即可,另外对于变参模板的使用,这里就不展开来讲了。
我再看lambda的捕获的时候一直很奇怪,初看的话,这个捕获跟传参数有什么区别呢,都是把一个变量值传入lambda表达式体供使用,但仔细思考的话,它是有作用的,假设有这么一个案例,一个公司有999名员工,每个员工的工号是从1~999,我们现在想找出工号是8的整数倍的所有员工,一个可行的代码如下:
#include <iostream>
#include <array>
int main()
{
int x = 8;
auto t = [x](int i){
if ( i % x == 0 )
{
std::cout << "value is " << i << std::endl;
}
};
auto t2 = [](int i, int x){
if ( i % x == 0 )
{
std::cout << "value is " << i << std::endl;
}
};
for(int j = 1; j< 1000; j++)
{
t(j);
t2(j, x);
}
return 0;
}
表达式t使用了捕获,而表达式t2没有使用捕获,从代码作用和量来看,它们其实区别不大,但有一点,对于表达式t,x的值只复制了一次,而对于t2表达式,每次调用都要生成一个临时变量来存放x的值,这其实是多了时间和空间的开销,不过,对于这段代码而言,这点消耗可以忽略不计呢,但一旦数据上了规模,那就会有比较大的区别了。
对于捕获的作用,我暂时只想到了这一点,如果有大佬知道更多的作用,麻烦说一下呀。
对于捕获,还是尽量不要使用[=]或者[&]这样全捕获的形式,因为不可控,你不能确保哪些变量会被捕获,容易发生一些不测的行为。
lambda表达式一个更重要的应用是它可以作为函数的参数传入,通过这种方式可以实现回调函数。比如在STL算法中,经常要给一些模板类或者模板函数来指定某个模板参数为lambda表达式,就想上一节说的,我想统计999个员工中工号是8的整数倍的员工个数,一个可用的代码如下:
#include <iostream>
#include <array>
#include <algorithm>
int main()
{
int x = 8;
std::array<int, 999> arr;
for (int i =1; i< 1000; i++)
{
arr[i] = i;
}
int cnt = std::count_if(arr.begin(), arr.end(), [x](int a){ return a%x == 0;});
std::cout << "cnt=" << cnt << std::endl;
return 0;
}
这里很明显,我们指定了一个lambda表达式来作为一个条件,更多时候,是使用排序函数的时候,指定排序准则,也可以使用lambda表达式。
lambda表达式既然生成了一个类对象,那么它是否可以像普通类对象那样,进行赋值呢?
我们写一段代码试一下:
#include <iostream>
using namespace std;
int main()
{
auto a = [] { cout << "A" << endl; };
auto b = [] { cout << "B" << endl; };
//a = b; // 非法,lambda无法赋值
auto c(a); // 合法,生成一个副本
return 0;
}
很显然赋值不可以,而拷贝则可以,结合编译器自动生成构造函数规则,很明显,赋值函数被禁用了,而拷贝构造函数则没有被禁用,所以不能用一个lambda表达式给另外一个赋值,但可以进行初始化拷贝。
总而言之,根据lambda表达式的一个定义来看,它其实是用于替代一些功能比较简单,但又有大量使用的函数,lambda在stl中大量使用,对于大部分STL算法而言,可以非常灵活地搭配lambda表达式来实现想要的效果。
同时这里要说明一下,lambda其实是作为c++11新引入的一种语法规则,它与STL并没有什么直接关联,只是STL里面大量使用了lambda表达式而已,并不能直接就说把它当做是STL的一部分。