Linux 软中断机制分析
軟中斷分析
? ? 最近工作繁忙,沒有時(shí)間總結(jié)內(nèi)核相關(guān)的一些東西。上次更新博客到了linux內(nèi)核中斷子系統(tǒng)。這次總結(jié)一下軟中斷,也就是softirq。之后還會(huì)總結(jié)一些tasklet、工作隊(duì)列機(jī)制。
1.?為什么要軟中斷
? ? 編寫驅(qū)動(dòng)的時(shí)候,一個(gè)中斷產(chǎn)生之后,內(nèi)核在中斷處理函數(shù)中可能需要完成很多工作。但是中斷處理函數(shù)的處理是關(guān)閉了中斷的。也就是說(shuō)在響應(yīng)中斷時(shí),系統(tǒng)不能再次響應(yīng)外部的其它中斷。這樣的后果會(huì)造成有可能丟失外部中斷。于是,linux內(nèi)核設(shè)計(jì)出了一種架構(gòu),中斷函數(shù)需要處理的任務(wù)分為兩部分,一部分在中斷處理函數(shù)中執(zhí)行,這時(shí)系統(tǒng)關(guān)閉中斷。另外一部分在軟件中斷中執(zhí)行,這個(gè)時(shí)候開啟中斷,系統(tǒng)可以響應(yīng)外部中斷。
? ? 關(guān)于軟件中斷的理論各種書籍都有介紹,不多敘述。而要真正體會(huì)軟件中斷的作用就必須從代碼的角度來(lái)分析。我們做工作時(shí)候講求的是professional,當(dāng)一個(gè)人在某個(gè)領(lǐng)域一無(wú)所知的時(shí)候,我們稱他為小白,偶,非蘋果電腦。小白的腦子里充滿了各種問(wèn)題。慢慢的當(dāng)這些疑惑解釋完之后,小白就脫白了。此時(shí),我們對(duì)這個(gè)領(lǐng)域的基本框架有了解,但這和professional還有一定的差距。再加以時(shí)日,逐漸融會(huì)貫通該領(lǐng)域才能達(dá)到專業(yè)的境界。
2.?什么時(shí)候觸發(fā)處理軟件中斷
? ? 說(shuō)了這么多廢話,趕快步入正題。初識(shí)軟中斷,腦子里肯定有不少的疑問(wèn),首先就是軟件中斷在什么地方被觸發(fā)處理?這個(gè)問(wèn)題的答案就是:一個(gè)硬件中斷處理完成之后。下面的函數(shù)在處理完硬件中斷之后推出中斷處理函數(shù),在irq_exit中會(huì)觸發(fā)軟件中斷的處理。
asmlinkage?void?__exception asm_do_IRQ(unsigned?int?irq,?structpt_regs *regs)? {?struct?pt_regs *old_regs = set_irq_regs(regs);?irq_enter();?/*?* Some hardware gives randomly wrong interrupts.? Rather?* than crashing, do something sensible.?*/??if?(irq >= NR_IRQS)?handle_bad_irq(irq, &bad_irq_desc);?else??generic_handle_irq(irq);?/* AT91 specific workaround */??irq_finish(irq);?irq_exit();?set_irq_regs(old_regs);? }? ??這里要注意,invoke_softirq必須滿足兩個(gè)條件才能被調(diào)用到,一個(gè)就是不是在硬件中斷處理過(guò)程中或者在軟件中斷處理中,第二個(gè)就是必須有軟件中斷處于pending狀態(tài)。第二個(gè)好理解,有軟件中斷產(chǎn)生才去處理,沒有就不處理。第一個(gè)就不好理解了。
/*? * Exit an interrupt context. Process softirqs if needed and possible: */?? void?irq_exit(void)? {?account_system_vtime(current);?trace_hardirq_exit();?sub_preempt_count(IRQ_EXIT_OFFSET);?if?(!in_interrupt() && local_softirq_pending())?invoke_softirq();?#ifdef?CONFIG_NO_HZ?/* Make sure that timer wheel updates are propagated */??rcu_irq_exit();?if?(idle_cpu(smp_processor_id()) && !in_interrupt() && !need_resched())?tick_nohz_stop_sched_tick(0);? #endif??preempt_enable_no_resched();? }在linux系統(tǒng)的進(jìn)程數(shù)據(jù)結(jié)構(gòu)里,有這么一個(gè)數(shù)據(jù)結(jié)構(gòu)
#define preempt_count()?(current_thread_info()->preempt_count),
利用preempt_count可以表示是否處于中斷處理或者軟件中斷處理過(guò)程中。
#define?PREEMPT_MASK??? (__IRQ_MASK(PREEMPT_BITS) << PREEMPT_SHIFT)? #define?SOFTIRQ_MASK??? (__IRQ_MASK(SOFTIRQ_BITS) << SOFTIRQ_SHIFT)? #define?HARDIRQ_MASK??? (__IRQ_MASK(HARDIRQ_BITS) << HARDIRQ_SHIFT)?#define?PREEMPT_OFFSET??? (1UL << PREEMPT_SHIFT)? #define?SOFTIRQ_OFFSET??? (1UL << SOFTIRQ_SHIFT)? #define?HARDIRQ_OFFSET??? (1UL << HARDIRQ_SHIFT)sub_preempt_count(IRQ_EXIT_OFFSET);
#define in_interrupt()?(irq_count())
#define irq_count()?(preempt_count() & (HARDIRQ_MASK | SOFTIRQ_MASK))
? ? ? ? ? ? ? ? ? ? ??
? ? preempt_count的8~23位記錄中斷處理和軟件中斷處理過(guò)程的計(jì)數(shù)。如果有計(jì)數(shù),表示系統(tǒng)在硬件中斷或者軟件中斷處理過(guò)程中。系統(tǒng)這么設(shè)計(jì)是為了避免軟件中斷在中斷嵌套中被調(diào)用,并且達(dá)到在單個(gè)CPU上軟件中斷不能被重入的目的。對(duì)于ARM架構(gòu)的CPU不存在中斷嵌套中調(diào)用軟件中斷的問(wèn)題,因?yàn)锳RM架構(gòu)的CPU在處理硬件中斷的過(guò)程中是關(guān)閉掉中斷的。只有在進(jìn)入了軟中斷處理過(guò)程中之后才會(huì)開啟硬件中斷,如果在軟件中斷處理過(guò)程中有硬件中斷嵌套,也不會(huì)再次調(diào)用軟中斷,because硬件中斷是軟件中斷處理過(guò)程中再次進(jìn)入的,此時(shí)preempt_count已經(jīng)記錄了軟件中斷!對(duì)于其它架構(gòu)的CPU,有可能在觸發(fā)調(diào)用軟件中斷前,也就是還在處理硬件中斷的時(shí)候,就已經(jīng)開啟了硬件中斷,可能會(huì)發(fā)生中斷嵌套,在中斷嵌套中是不允許調(diào)用軟件中斷處理的。Why?我的理解是,在發(fā)生中斷嵌套的時(shí)候,表明這個(gè)時(shí)候是系統(tǒng)突發(fā)繁忙的時(shí)候,內(nèi)核第一要?jiǎng)?wù)就是趕緊把中斷中的事情處理完成,退出中斷嵌套。避免多次嵌套,哪里有時(shí)間處理軟件中斷,所以把軟件中斷推遲到了所有中斷處理完成的時(shí)候才能觸發(fā)軟件中斷。
3.?軟件中斷的處理過(guò)程
? ? 之前我已經(jīng)說(shuō)到,軟中斷的一個(gè)很大的目的就是避免中斷處理中,處理的操作過(guò)多而丟失中斷。同時(shí)中斷還需要考慮到一件事情就是中斷處理過(guò)程過(guò)長(zhǎng)就會(huì)影響系統(tǒng)響應(yīng)時(shí)間。如果一個(gè)中斷處理一秒鐘,那你一定能感受到串口卡住的現(xiàn)象。從另外一方面說(shuō)呢,我們又必須考慮中斷處理的操作一定的優(yōu)先度,畢竟是硬件觸發(fā)的事務(wù),關(guān)系到網(wǎng)絡(luò)、塊設(shè)備的效率問(wèn)題。Linux內(nèi)核就中斷方面就必須考慮平衡這三個(gè)方面的問(wèn)題。而下面我要分析的__do_softirq函數(shù)就恰似在這三者之間打太極,游刃有余,面面俱到!
?/*? * We restart softirq processing MAX_SOFTIRQ_RESTART times,? * and we fall back to softirqd after that.? *? * This number has been established via experimentation.? * The two things to balance is latency against fairness -? * we want to handle softirqs as soon as possible, but they? * should not be able to lock up the box.? */?? #define?MAX_SOFTIRQ_RESTART?10??asmlinkage?void?__do_softirq(void)? {?struct?softirq_action *h;?__u32 pending;?int?max_restart = MAX_SOFTIRQ_RESTART;?int?cpu;?pending = local_softirq_pending();?account_system_vtime(current);?__local_bh_disable((unsigned?long)__builtin_return_address(0));?trace_softirq_enter();?cpu = smp_processor_id();? restart:?/* Reset the pending bitmask before enabling irqs */??set_softirq_pending(0);?local_irq_enable();?h = softirq_vec;?do??{?if?(pending &?1)?{?int?prev_count = preempt_count();?h->action(h);?if?(unlikely(prev_count != preempt_count()))?{?printk(KERN_ERR?"huh, entered softirq %td %p"??"with preempt_count %08x,"??" exited with %08x?\n", h - softirq_vec,?h->action, prev_count, preempt_count());?preempt_count() = prev_count;?}?rcu_bh_qsctr_inc(cpu);?}?h++;?pending >>=?1;?}?while?(pending);?local_irq_disable();?pending = local_softirq_pending();?if?(pending && --max_restart)?goto?restart;?if?(pending)?wakeup_softirqd();?trace_softirq_exit();?account_system_vtime(current);?_local_bh_enable();? }?__do_softirq函數(shù)處理軟件中斷過(guò)程如下圖流程分析
4.?首先調(diào)用local_softirq_pending函數(shù)取得目前有哪些位存在軟件中斷
5.?調(diào)用__local_bh_disable關(guān)閉軟中斷,其實(shí)就是設(shè)置正在處理軟件中斷標(biāo)記,在同一個(gè)CPU上使得不能重入__do_softirq函數(shù)
6.?重新設(shè)置軟中斷標(biāo)記為0,set_softirq_pending重新設(shè)置軟中斷標(biāo)記為0,這樣在之后重新開啟中斷之后硬件中斷中又可以設(shè)置軟件中斷位。
7.?開啟硬件中斷
8.?之后在一個(gè)循環(huán)中,遍歷pending標(biāo)志的每一位,如果這一位設(shè)置就會(huì)調(diào)用軟件中斷的處理函數(shù)。在這個(gè)過(guò)程中硬件中斷是開啟的,隨時(shí)可以打斷軟件中斷。這樣保證硬件中斷不會(huì)丟失。
9.?之后關(guān)閉硬件中斷,查看是否又有軟件中斷處于pending狀態(tài),如果是,并且在本次調(diào)用__do_softirq函數(shù)過(guò)程中沒有累計(jì)重復(fù)進(jìn)入軟件中斷處理的次數(shù)超過(guò)10次,就可以重新調(diào)用軟件中斷處理。如果超過(guò)了10次,就調(diào)用wakeup_softirqd();喚醒內(nèi)核的一個(gè)進(jìn)程來(lái)處理軟件中斷。設(shè)立10次的限制,也是為了避免影響系統(tǒng)響應(yīng)時(shí)間。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
4.?處理軟中斷內(nèi)核線程
? ? 之前我說(shuō)到不能讓CPU長(zhǎng)時(shí)間來(lái)處理中斷事務(wù),這樣會(huì)影響系統(tǒng)的響應(yīng)時(shí)間,嚴(yán)重影響用戶和系統(tǒng)之間的交互式體驗(yàn)。所以在之前的__do_softirq中最多將循環(huán)執(zhí)行10次,那么當(dāng)執(zhí)行了10次仍然有軟中斷在pending狀態(tài),這個(gè)時(shí)候應(yīng)該怎么處理呢?系統(tǒng)將喚醒一個(gè)軟件中斷處理的內(nèi)核進(jìn)程,在內(nèi)核進(jìn)程中處理pending中的軟件中斷。這里要注意,之前我們分析的觸發(fā)軟件中斷的位置其實(shí)是中斷上下文中,而在軟中斷的內(nèi)核線程中實(shí)際已經(jīng)是進(jìn)程的上下文。
這里說(shuō)的軟中斷上下文指的就是系統(tǒng)為每個(gè)CPU建立的ksoftirqd進(jìn)程。
?
? ? 看完這個(gè)函數(shù),我不得不佩服這個(gè)函數(shù)設(shè)計(jì)的精巧!而我更多的從中體會(huì)到其中蘊(yùn)藏的一種做人的道理。那就是做人要霸道一點(diǎn),太謙和太恭維不行,但是又不能橫行霸道,原則的問(wèn)題要公平講理,一定的時(shí)候顧及別人的利益,好處不能一個(gè)人獨(dú)吞。這就跟下面ksoftirqd處理過(guò)程一樣,該狠的時(shí)候禁止搶占,其它進(jìn)程別想調(diào)度到哦,但是自己占用CPU時(shí)間過(guò)長(zhǎng)的話,也自覺的問(wèn)一問(wèn)是不是該釋放CPU給其它進(jìn)程了。
? ? 下面我們就來(lái)分析一下這個(gè)處理過(guò)程怎么就體現(xiàn)了上面的這種說(shuō)法呢?軟中斷的內(nèi)核進(jìn)程中主要有兩個(gè)大循環(huán),外層的循環(huán)處理有軟件中斷就處理,沒有軟件中斷就休眠。內(nèi)層的循環(huán)處理軟件中斷,并每循環(huán)一次都試探一次是否過(guò)長(zhǎng)時(shí)間占據(jù)了CPU,需要調(diào)度釋放CPU給其它進(jìn)程。具體的操作在注釋中做了解釋。
static?int?ksoftirqd(void?*__bind_cpu)? {?set_current_state(TASK_INTERRUPTIBLE);?while?(!kthread_should_stop())?{?/*不管三七二十一首先禁止搶占,我掌握CPU,并全憑我自己掌握調(diào)度*/??preempt_disable();?if?(!local_softirq_pending())?{?preempt_enable_no_resched();?/*如果沒有軟中斷在pending,那就讓出CPU來(lái)吧*/??schedule();?/*我被喚醒了,首先掌握CPU,不讓自己被搶占,自己決定自己的是否要調(diào)度*/??preempt_disable();?}?__set_current_state(TASK_RUNNING);?while?(local_softirq_pending())?{?/* Preempt disable stops cpu going offline.?If already offline, we'll be on wrong CPU:?don't process */??if?(cpu_is_offline((long)__bind_cpu))?goto?wait_to_die;?/*處理軟中斷*/??do_softirq();?/*雖然我自己掌握是否要調(diào)度,雖然我可以一直不調(diào)度,但是我是?個(gè)正直的人,運(yùn)行一段時(shí)間后我會(huì)看看是否需要調(diào)度,還其它進(jìn)程運(yùn)行*/??preempt_enable_no_resched();?cond_resched();?preempt_disable();?rcu_qsctr_inc((long)__bind_cpu);?}?preempt_enable();?set_current_state(TASK_INTERRUPTIBLE);?}?__set_current_state(TASK_RUNNING);?return?0;?wait_to_die:?preempt_enable();?/* Wait for kthread_stop */??set_current_state(TASK_INTERRUPTIBLE);?while?(!kthread_should_stop())?{?schedule();?set_current_state(TASK_INTERRUPTIBLE);?}?__set_current_state(TASK_RUNNING);?return?0;? }??
文章內(nèi)容轉(zhuǎn)載自:http://blog.chinaunix.net/uid-28236237-id-3450751.html
?
?
總結(jié)
以上是生活随笔為你收集整理的Linux 软中断机制分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 4、简单的神经网络(MLP神经网络分类基
- 下一篇: Linux下文件压缩、打包,看这一篇就够