1、epoll诞生的原因
问大家一个问题,如果要设计一款有着千万级别并发的系统,你的客户端和服务端的网络通信底层该怎么设计?我在上一篇文章(socket网络编程(三)——select多路复用问题)中有说到用select可以实现IO多路复用,但是select的设计有瓶颈所在,超过十万的并发效率就非常慢。那么又该怎么办呢?
于是epoll就腾空出世了!
2、epoll是什么
什么是epoll呢?epoll和select一样,也是为IO多路复用而生的。而epoll最大的优点也是select的不足之处,我们知道,select的最大连接数被限制在了1024个,而且select是通过轮询所有的连接的方式寻找需要的那个连接,所以对select来说,连接数越多,耗费的资源就越大,这是一个无法调和的矛盾。
而epoll就是无需通过轮询就是可以找到那个发生IO事件的连接,它通过一个pollfd数组向内核传递需要关注的事件,故没有描述符个数的限制,epoll在内核初始化的时候向内核注册了一个文件系统,用于存储上述被监控的socket,所以无需轮询所有的socket连接,有点类似用空间换时间的意思。至于epoll底层的实现原理暂时不在本文的讨论范围,以后我会弄个章节出来特别讨论下。
3、具体实现
首先,还是先不扯其他的,我先扔出代码,然后结合代码讲解epoll,带着代码的疑问去思考,这样子感觉学起来更加的有效率。如果大家不习惯的话,可以先跳过以下的代码,先看代码下方的讲解部分。
3.1、服务端代码
3.2、客户端代码
4、epoll结构剖析
首先利用创建一个epoll句柄,参数size用来告诉内核监听的数目,size为epoll所支持的最大句柄数。它其实是在内核申请空间,用来存放你想监听的套接字描述符上是否有读、写或者异常的各类事件。不管是什么样的写法,只要是用到了epoll,就必须要有这个函数。
epoll的事件注册函数,它不同于select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。第一个参数是epoll_create()的返回值,第二个参数表示动作,用三个宏来表示:
EPOLL_CTL_ADD:注册新的fd到epfd中;
EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
EPOLL_CTL_DEL:从epfd中删除一个fd;
第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事件,struct epoll_event结构如下:
最后一个函数就像是阻塞函数,等待着客户端发来请求或者数据,只要有连接发来,这个函数就会响应。
epfd : epoll特有的文件描述符
events :从内核中的就绪队列中拷贝出就绪的文件描述符,不可以是空指针,内核只负责将数据拷贝到这里,不会为我们开辟空间。
maxevent : 高速内核events有多大,一般不能超过epoll_create传递的size,
timeout :函数超时时间,0表示非阻塞式等待,-1表示阻塞式等待,函数返回0表示已经超时。
说实话,epoll的代码写法上会比select容易理解得多,基本上就是围绕着那三个函数展开的,一个创建,一个注册,一个等待。至于底层的具体部分,都已经封装好了,属于操作系统层面。对于想自己搭建底层通信协议的童鞋来说懂得如何用epoll已经足够了,如果要深入了解epoll的话,需要更加阅读深入的教程,但已不属于本文所讨论的范围。后期如果有时间,我一定一点点和大家剖析底层的实现原理。
领取专属 10元无门槛券
私享最新 技术干货