大家好,我是极客范的本期栏目编辑小友,现在为大家讲解详细解读Linux内核的poll机制问题。
所有的系统调用,基于都可以在它的名字前加上"sys_"前缀,这就是它在内核中对应的函数。比如系统调用打开、读取、写入、轮询,与之对应的内核函数为:sys_open、sys_read、sys_write、sys_poll。
一、内核框架:
对于系统调用投票或选择,它们对应的内核函数都是sys_poll。分析sys_poll,即可理解投票机制。
1.sys_poll函数位于fs/select.c文件中,代码如下:
ASM链接长sys _ poll(结构轮询FD _ user * ufds,无符号int nfds,
长超时_毫秒)
{
s64超时_ jiffies
if(超时_毫秒ECS 0){ 0
#if HZ 1000
/*我们只能在1000 *时溢出/
if(超时_ ms ECS/1000(s64)0x 7 fffffffffffull/(s64)HZ)
time out _ jiffies=-1;
其他
#endif
time out _ jiffies=ms ECS _ to _ jiffies(超时_ ms ECS);
} else {
timeout _ jiffies=timeout _ msecs
}
返回do _ sys _ poll(ufd、nfd、time out _ jiffies);
}
它对超时参数稍作处理后,直接调用do_sys_poll。
2.do_sys_poll函数也位于位于fs/select.c文件中,我们忽略其他代码:
int do _ sys _ poll(struct poll FD _ _ user * ufds,无符号int nfds,s64 *超时)
{
……
poll_initwait(表);
……
fdcount=do_poll(nfds,head,table,time out);
……
}
poll_initwait函数非常简单,它初始化一个轮询_wqueues变量表格:
poll _ initwait init _ poll _ funcptr(pwq-pt,_ _ poll wait);pt-qproc=qproc;
即table-pt-qproc=__pollwait,__pollwait将在驱动的投票函数里用到。
3.do_sys_poll函数位于fs/select.c文件中,代码如下:
静态int do_poll(无符号int nfds,struct poll_list *list,
结构轮询_ wqueues *等待s64 *超时)
{
01 ……
02为(;) {
03 ……
04 if (do_pollfd(pfd,pt)){ 0
05计数;
06pt=空;
07}
08 ……
09if (count ||!*超时||信号_挂起(当前))
10休息;
11计数=等待-错误;
12if(计数)
13休息;
14
15if(*超时0){ 0
16
17 _ _超时=MAX _ SCHEDULE _ time out
18}否则如果(不太可能(*超时=(s64)MAX _ SCHEDULE _ time out-1)){ 0
19/*
20 *等待时间超过最大计划超时.在.做
21 *一个循环
22 */
23 _ _超时=MAX _ SCHEDULE _ time out-1;
24 *超时-=_ _超时;
25}其他{
26 _ _超时
= *timeout;27 *timeout = 0;28 }2930 __timeout = schedule_timeout(__timeout);31 if (*timeout >= 0)32 *timeout += __timeout;33 }34 __set_current_state(TASK_RUNNING);35 return count;36 }分析其中的代码,可以发现,它的作用如下:① 从02行可以知道,这是个循环,它退出的条件为:a. 09行的3个条件之一(count非0,超时、有信号等待处理)count顺0表示04行的do_pollfd至少有一个成功。b. 11、12行:发生错误② 重点在do_pollfd函数,后面再分析③ 第30行,让本进程休眠一段时间,注意:应用程序执行poll调用后,如果①②的条件不满足,进程就会进入休眠。那么,谁唤醒呢?除了休眠到指定时间被系统唤醒外,还可以被驱动程序唤醒──记住这点,这就是为什么驱动的poll里要调用poll_wait的原因,后面分析。
4. do_pollfd函数位于fs/select.c文件中,代码如下:static inline unsigned int do_pollfd(struct pollfd *pollfd, poll_table *pwait){…… if (file->f_op && file->f_op->poll) mask = file->f_op->poll(file, pwait);……}
可见,它就是调用我们的驱动程序里注册的poll函数。
二、驱动程序:
驱动程序里与poll相关的地方有两处:一是构造file_operation结构时,要定义自己的poll函数。二是通过poll_wait来调用上面说到的__pollwait函数,pollwait的代码如下:static inline void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p){ if (p && wait_address) p->qproc(filp, wait_address, p);}p->qproc就是__pollwait函数,从它的代码可知,它只是把当前进程挂入我们驱动程序里定义的一个队列里而已。它的代码如下:static void __pollwait(struct file *filp, wait_queue_head_t *wait_address, poll_table *p){ struct poll_table_entry *entry = poll_get_entry(p); if (!entry) return; get_file(filp); entry->filp = filp; entry->wait_address = wait_address; init_waitqueue_entry(&entry->wait, current); add_wait_queue(wait_address, &entry->wait);}
执行到驱动程序的poll_wait函数时,进程并没有休眠,我们的驱动程序里实现的poll函数是不会引起休眠的。让进程进入休眠,是前面分析的do_sys_poll函数的30行“__timeout = schedule_timeout(__timeout)”。poll_wait只是把本进程挂入某个队列,应用程序调用poll > sys_poll > do_sys_poll > poll_initwait,do_poll > do_pollfd >我们自己写的poll函数后,再调用schedule_timeout进入休眠。如果我们的驱动程序发现情况就绪,可以把这个队列上挂着的进程唤醒。可见,poll_wait的作用,只是为了让驱动程序能找到要唤醒的进程。即使不用poll_wait,我们的程序也有机会被唤醒:chedule_timeout(__timeout),只是休眠__time_out这段时间。
现在来总结一下poll机制:1. poll > sys_poll > do_sys_poll >poll_initwait,poll_initwait函数注册一下回调函数__pollwait,它就是我们的驱动程序执行poll_wait时,真正被调用的函数。
2. 接下来执行file->f_op->poll,即我们驱动程序里自己实现的poll函数 它会调用poll_wait把自己挂入某个队列,这个队列也是我们的驱动自己定义的; 它还判断一下设备是否就绪。
3. 如果设备未就绪,do_sys_poll里会让进程休眠一定时间
4. 进程被唤醒的条件有2:一是上面说的“一定时间”到了,二是被驱动程序唤醒。驱动程序发现条件就绪时,就把“某个队列”上挂着的进程唤醒,这个队列,就是前面通过poll_wait把本进程挂过去的队列。
5. 如果驱动程序没有去唤醒进程,那么chedule_timeout(__timeou)超时后,会重复2、3动作,直到应用程序的poll调用传入的时间到达。