`
xitong
  • 浏览: 6193917 次
文章分类
社区版块
存档分类
最新评论

linux中断的不确定性带来的问题

 
阅读更多

如果说一个函数不能在中断中调用,那么很多人都会想到那个函数可能会睡眠,而中断中不能睡眠。可是仅仅是因为不能睡眠吗?实际上因为中断是完全不确定的,所以它带来的限制不仅仅只是不能睡眠,往往确定的东西我们直接就可以管理,而不确定的东西就要靠限制来管理了。不能睡眠就是限制之一,当然还有别的,看一 下下面的代码:

int del_timer_sync(struct timer_list *timer) //2.6.9版本

{

tvec_base_t *base;

int i, ret = 0;

check_timer(timer);

del_again:

ret += del_timer(timer); //将此timer的base置为NULL,以防止它重新被add,此函数会争抢base的自旋锁

for_each_online_cpu(i) { //确保此timer在所有的cpu上都结束其生命

base = &per_cpu(tvec_bases, i);

if (base->running_timer == timer) {

while (base->running_timer == timer) {

cpu_relax();

preempt_check_resched();//如果在中断中,抢占计数不为0,抢占计数不为0的条件下,这个函数里面是不会调用schedule的。

}

break;

}

}

smp_rmb();

if (timer_pending(timer)) //必须再次确认此timer在所有的cpu上都结束其生命

goto del_again;

return ret;

}

linux 明确规定上述函数不能在中断上下文调用,再看看上述函数的实现发现怕的不是它会睡眠,而是怕它会死锁,看看那个无穷的goto del_again吧,只要有无穷的循环就有死锁的可能,因为跳出循环是需要条件的,如果那个条件死锁了,系统实际上就down掉不干活了。现在我们看看 它在中断上下文为何会死锁,我们希望如果在timer的function中调用上述函数来删除自身那么必然在base的spin_lock上死锁,因为我 们不喜欢任何理由的"自指行为",可是在执行timer的function之前base的自旋锁已经放开了,没有达到我们的希望的要求,这种情况不是我们 关注的。我们知道在中断处理执行的时候是抢占失效的,如果中断的cpu的running_timer就是这个要删除的timer的话,此timer的 base的自旋锁就已经被占有了(比如在__run_timers函数中,系统中断时正好在set_running_timer(base, timer)和spin_unlock_irq(&base->lock)之间),而在del_timer中会有获得自旋锁的操作,这样的 话就会死锁,注意这里的死锁不是无限循环造成的,而是自旋锁造成的,正是因为中断的不确定性才会导致你根本不发确定发生中断的时候是否那个timer正在 运行或者那个timer的base的自旋锁是否已经被拥有。同样还是这个函数,在后期的版本中造成死循环的原因就更加明显了

int del_timer_sync(struct timer_list *timer)

{

for (;;) { //事发地,恐怖的无限循环

int ret = try_to_del_timer_sync(timer);

if (ret >= 0) //退出条件

return ret;

cpu_relax();

}

}

int try_to_del_timer_sync(struct timer_list *timer)

{

struct tvec_base *base;

unsigned long flags;

int ret = -1;

base = lock_timer_base(timer, &flags); //这lock_timer_base实际上也会争抢base的自旋锁从而造成和2.6.9版本一样原因的死锁。

if (base->running_timer == timer) //如果中断的正是本timer的base的循环处理函数,那么直接返回-1,从而使得del_timer_sync中的循环退出条件不满足,进入无限死循环

goto out;

ret = 0;

if (timer_pending(timer)) {

detach_timer(timer, 1);

ret = 1;

}

out:

spin_unlock_irqrestore(&base->lock, flags);

return ret;

}

可 以看到,虽然死锁点在lock_timer_base,但是即使没有这个死锁点,该函数在中断上下文中调用还是可能死锁的,那个无穷的for循环就是另一 个死锁点,虽然内核可抢占而且中断可以嵌套重入,但是由于初始被中断的进程的抢占计数器不为0,进程还是无法切换,实际上就死锁在这里了。你是否会说,死 锁这么容易造成是不是锁的粒度太大了,一锁就锁一个base,只能说有这方面的原因,可是这个原因不是本质原因,本质原因就是中断的不确定性,还是那样, 你无法确定中断发生的时间以及中断发生时系统所处的状态。
同样的原因,do_exit的上下文不能是中断上下文,那样的话你可能释放任意进程。因此,基于中断的不确定性,内核规定了种种限制,而开发人员只有遵守这些限制规则才可以写出没有bug的程序,当然这和闯红灯一样,如果你硬闯红灯,得到的不仅仅是罚单,可能要付出生命的代价。linux中中断的不确定性 使得中断处理过程和别的过程相比多少有些另类,如果能把中断处理和其他的执行过程统一起来的话,内核看上去会更加和谐一些,可是也仅仅是看上去而已,详情请参考windows的irql,那个实现十分和谐,但是又带来了新的问题。最后我们得到一个总结:如果遇到不确定的另类因素,我们是保持它的另类呢还是为了美观强行将其与别的传统统一呢?linux的做法就是保持它的另类,而windows的做法恰恰相反,谁对谁错,无从考证,看你关注哪一方面了个人比较推崇linux的方式,事情已经不可收拾的情况下,维持原状可能仍然不可收拾,但是你的任何强加可能使事情更加不可收拾,因为它原本就是那样的,惰性往往是自我保护的一种很好的方式。

分享到:
评论

相关推荐

    Linux DeviceDrivers 3rd Edition

    其他有关移植性的问题 291 链表 294 快速参考 298 第十二章 PCI驱动程序 300 PCI接口 300 ISA回顾 317 PC/104和PC/104+ 319 其他的PC总线 319 SBus 320 NuBus 321 外部总线 321 快速参考 322 第十三章 ...

    LINUX设备驱动第三版_588及代码.rar

    其他有关移植性的问题 链表 快速参考 第十二章 PCI驱动程序 PCI接口 ISA回顾 PC/104和PC/104+ 其他的PC总线 SBus NuBus 外部总线 快速参考 第十三章 USB驱动程序 USB设备基础 USB和Sysfs USB urb ...

    Linux操作系统.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    操作系统与Linux.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    Linux系统故障诊断与排除--James Kirkland

    第10章至第15章介绍了Linux系统其他方面的故障诊断与排除技巧,包括打印问题、安全问题、网络问题、登录问题等。  本书适用于Linux系统管理员及高级用户,对Linux系统感兴趣的用户也可将此书作为参考书。 第1章 ...

    嵌入式系统/ARM技术中的实时 Linux 架构简介

    作者:李智敏,华清远见嵌入式学院上海...这是一个基本的问题:并不是 Linux 不够快或效率不够高,而是因为它不能提供确定性。  当中断到达时(event),CPU 发生中断并转入中断处理。执行一些工作以确定发生了什么事

    嵌入式Linux通信中构件技术应用研究 (1)

    特别是在运行内核线程时,Linux 关闭中断,而且分时调度虚拟文件系统的时间不确定性、缺乏高精度的计时器等问题都是需要解决的,所以在Linux 上进行实时改进,建立具有实时应用能力的操作系统是现代嵌入式操作系统的...

    LINUX 24学时教程

    本书详细讲解了用Linux的图形配置工具配置Caldera OpenLinux,通过一个ppp与网络连接、使用K桌面环境、用StarOffice提高在家办公的效率、网络浏览、发传真、接收email及使用GIMP等图形工具。 24学时每次1小时的课程...

    嵌入式Linux通信中构件技术应用研究

    关闭中断,而且分时调度虚拟文件系统的时间不确定性、缺乏高精度的计时器等问题都是需要解决的,所以在Linux 上进行实时改进,建立具有实时应用能力的操作系统是现代嵌入式操作系统的解决方案,也日益成为人们关注的...

    嵌入式系统/ARM技术中的嵌入式Linux通信中构件技术应用研究

    摘要:本文首先介绍了嵌入式Linux 网络实时通信的现状及构件技术的特点,...特别是在运行内核线程时,Linux 关闭中断,而且分时调度虚拟文件系统的时间不确定性、缺乏高精度的计时器等问题都是需要解决的,所以在Linu

    嵌入式Linux操作系统的实时化研究 (2003年)

    Linux应用于嵌人式实时环境时存在关闭中断、分时调度和虚拟文件系统的时间不确定性等问题使用虚拟机技术,增加一个仿真程序来替换Linux的底层中断程序用一个小的实时内核与Linux内核共享控制处理器和中断模拟等技术以...

    linux.chm文档

    cat /proc/interrupts 显示中断 cat /proc/meminfo 校验内存使用 cat /proc/swaps 显示哪些swap被使用 cat /proc/version 显示内核的版本 cat /proc/net/dev 显示网络适配器及统计 cat /proc/mounts 显示已加载...

    HNU操作系统.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    从0到1手把手教你用嵌入式操作系统 资料下载.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    HIT-CS 操作系统(2015秋)实验.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    CS2302-操作系统(D).zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    “操作系统”课程作业。.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

    操作系统作业.zip

    操作系统的定义:是一组控制和管理计算机软硬件资源,为用户提供便捷使用计算机的程序的集合。...程序的运行时间、运行顺序也具有不确定性;外部输入的请求、运行故障发生的时间难以预测。这些都是不确定性的表现。

Global site tag (gtag.js) - Google Analytics