select、poll、epoll

网络通信模型

阻塞式IO
非阻塞式IO
IO多路复用
信号驱动IO
异步IO

IO多路复用

I/O多路复用就通过一种机制，可以监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程序进行相应的读写操作。

select

函数

#include <sys/select.h>
#include <sys/time.h>

/**
 * 参数：
 * maxfdp: 待监听的最大fd数+1。
 * readSet：待监听的可读fd集合
 * writeSet：待监听的可写fd集合
 * exceptSet：待监听的异常fd集合
 * timeval：指定超时，NULL为一直等到，0为不等待
 *
 * 返回：
 * 就绪描述符的数目，超时返回0，出错返回-1，
 * 正常返回后，对应fd_set会设置相关满足条件的fd。
 */
int select(int maxfdp, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);

//fd_set相关操作
void FD_ZERO(fd_set *fdset); //清空集合
void FD_SET(int fd, fd_set *fdset);//将一个给定的文件描述符加入集合之中
void FD_CLR(int fd, fd_set *fdset);//将一个给定的文件描述符从集合中删除
int FD_ISSET(int fd, fd_set *fdset);//检查集合中指定的文件描述符是否可以读写

//相关结构
struct timeval {
    long tv_sec;//seconds
    long tv_usec;//microseconds
};

#define __NFDBITS (8 * sizeof(unsigned long)) //32位编译器，unsigned long为4个字节
#define __FD_SETSIZE 1024
#define __FDSET_LONGS (__FD_SETSIZE/__NFDBITS)

typedef struct {
    unsigned long fds_bits [__FDSET_LONGS];
} __kernel_fd_set;

缺点

单个进程监听的fd数量有限，最多为1024；（能改，但是改后影响效率）；
每次调用select，都需要遍历所有fd，才能发现哪些发生了事件，效率慢；
内存复制开销大，需要从用户空间、内核空间来回拷贝fd_set；

poll

poll的实现和select非常相似，只是描述fd集合的方式不同，poll使用pollfd结构而不是select的fd_set结构，其他的都差不多。

就少了select的fd数量限制，其他缺点仍存在。

函数

# include <poll.h>
int poll(struct pollfd * fds, unsigned int nfds, int timeout);

//结构
truct pollfd {
    int fd;//文件描述符
    short events;//等待的事件
    short revents;//实际发生了的事件
};

epoll

函数

//创建epoll句柄，返回值为句柄，即epfd
int epoll_create(int size)；

//注册要监听的事件类型
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)；

//等待事件的发生
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout)；

解决select、poll的缺点

epoll_create，提前准备好相关资源（开辟内核缓冲区，创建红黑树和就绪链表），注册事件只是往里面添加新的fd，所支持的fd上限是最大可以打开文件的数目；
epoll_ctl，注册事件时，就会把fd拷贝进内核，保证每个fd只拷贝一次；
epoll_ctl，注册事件时，为每个fd指定一个回调函数，当设备就绪，唤醒队列上的等待者时，就会调用回调函数，把就绪的fd加入一个就绪链表；
epoll_wait，等待事件的发生，只需要查看就绪链表中有没有就绪的fd，并且返回的fd是通过mmap让内核和用户空间共享同一块内存实现传递的，减少了不必要的拷贝；

工作模式

LT模式（level trigger，默认模式）：当epoll_wait检测到描述符事件发生并将此事件通知应用程序，应用程序可以不立即处理该事件。下次调用epoll_wait时，会再次响应应用程序并通知此事件；
ET模式（edge trigger）：当epoll_wait检测到描述符事件发生并将此事件通知应用程序，应用程序必须立即处理该事件。如果不处理，下次调用epoll_wait时，不会再次响应应用程序并通知此事件。

ET模式在很大程度上减少了epoll事件被重复触发的次数，因此效率要比LT模式高。epoll工作在ET模式的时候，必须使用非阻塞套接口，以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。

总结

epoll比select和poll高效的原因主要有：

减少了用户态和内核态之间的fd拷贝；
减少了对就绪fd的遍历；

select、poll、epoll

2018-03-30
服务器

select、poll、epoll

相关概念

一个IO操作流程

同步、异步

阻塞、非阻塞

用户态、内核态

文件描述符（file descriptor，简称fd）

回调函数（callback）

网络通信模型

IO多路复用

select

函数

缺点

poll

函数

epoll

函数

解决select、poll的缺点

工作模式

总结