日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > linux >内容正文

linux

Linux内核线程kernel thread详解--Linux进程的管理与调度

發(fā)布時間:2023/11/30 linux 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Linux内核线程kernel thread详解--Linux进程的管理与调度 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

內核線程


為什么需要內核線程


Linux內核可以看作一個服務進程(管理軟硬件資源,響應用戶進程的種種合理以及不合理的請求)。

內核需要多個執(zhí)行流并行,為了防止可能的阻塞,支持多線程是必要的。

內核線程就是內核的分身,一個分身可以處理一件特定事情。內核線程的調度由內核負責,一個內核線程處于阻塞狀態(tài)時不影響其他的內核線程,因為其是調度的基本單位。

這與用戶線程是不一樣的。因為內核線程只運行在內核態(tài)

因此,它只能使用大于PAGE_OFFSET(傳統(tǒng)的x86_32上是3G)的地址空間。

內核線程概述


內核線程是直接由內核本身啟動的進程。內核線程實際上是將內核函數委托給獨立的進程,它與內核中的其他進程”并行”執(zhí)行。內核線程經常被稱之為內核守護進程

他們執(zhí)行下列任務

  • 周期性地將修改的內存頁與頁來源塊設備同步

  • 如果內存頁很少使用,則寫入交換區(qū)

  • 管理延時動作, 如2號進程接手內核進程的創(chuàng)建

  • 實現文件系統(tǒng)的事務日志

內核線程主要有兩種類型

  • 線程啟動后一直等待,直至內核請求線程執(zhí)行某一特定操作。

  • 線程啟動后按周期性間隔運行,檢測特定資源的使用,在用量超出或低于預置的限制時采取行動。

  • 內核線程由內核自身生成,其特點在于

  • 它們在CPU的管態(tài)執(zhí)行,而不是用戶態(tài)。

  • 它們只可以訪問虛擬地址空間的內核部分(高于TASK_SIZE的所有地址),但不能訪問用戶空間

  • 內核線程的進程描述符task_struct


    task_struct進程描述符中包含兩個跟進程地址空間相關的字段mm, active_mm,

    struct task_struct {// ...struct mm_struct *mm;struct mm_struct *avtive_mm;//... };
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    大多數計算機上系統(tǒng)的全部虛擬地址空間分為兩個部分: 供用戶態(tài)程序訪問的虛擬地址空間和供內核訪問的內核空間。每當內核執(zhí)行上下文切換時, 虛擬地址空間的用戶層部分都會切換, 以便當前運行的進程匹配, 而內核空間不會放生切換。

    對于普通用戶進程來說,mm指向虛擬地址空間的用戶空間部分,而對于內核線程,mm為NULL。

    這位優(yōu)化提供了一些余地, 可遵循所謂的惰性TLB處理(lazy TLB handing)。active_mm主要用于優(yōu)化,由于內核線程不與任何特定的用戶層進程相關,內核并不需要倒換虛擬地址空間的用戶層部分,保留舊設置即可。由于內核線程之前可能是任何用戶層進程在執(zhí)行,故用戶空間部分的內容本質上是隨機的,內核線程決不能修改其內容,故將mm設置為NULL,同時如果切換出去的是用戶進程,內核將原來進程的mm存放在新內核線程的active_mm中,因為某些時候內核必須知道用戶空間當前包含了什么。

    為什么沒有mm指針的進程稱為惰性TLB進程?

    假如內核線程之后運行的進程與之前是同一個, 在這種情況下, 內核并不需要修改用戶空間地址表。地址轉換后備緩沖器(即TLB)中的信息仍然有效。只有在內核線程之后, 執(zhí)行的進程是與此前不同的用戶層進程時, 才需要切換(并對應清除TLB數據)。

    內核線程和普通的進程間的區(qū)別在于內核線程沒有獨立的地址空間,mm指針被設置為NULL;它只在 內核空間運行,從來不切換到用戶空間去;并且和普通進程一樣,可以被調度,也可以被搶占。

    內核線程的創(chuàng)建


    創(chuàng)建內核線程接口的演變


    內核線程可以通過兩種方式實現:

    • 古老的接口 kernel_create和daemonize

      將一個函數傳遞給kernel_thread創(chuàng)建并初始化一個task,該函數接下來負責幫助內核調用daemonize已轉換為內核守護進程,daemonize隨后完成一些列操作, 如該函數釋放其父進程的所有資源,不然這些資源會一直鎖定直到線程結束。阻塞信號的接收, 將init用作守護進程的父進程

    • 更加現在的方法kthead_create和kthread_run

      創(chuàng)建內核更常用的方法是輔助函數kthread_create,該函數創(chuàng)建一個新的內核線程。最初線程是停止的,需要使用wake_up_process啟動它。

      使用kthread_run,與kthread_create不同的是,其創(chuàng)建新線程后立即喚醒它,其本質就是先用kthread_create創(chuàng)建一個內核線程,然后通過wake_up_process喚醒它

    2號進程kthreadd的誕生


    早期的kernel_create和daemonize接口

    在早期的內核中, 提供了kernel_create和daemonize接口, 但是這種機制操作復雜而且將所有的任務交給內核去完成。

    但是這種機制低效而且繁瑣, 將所有的操作塞給內核, 我們創(chuàng)建內核線程的初衷不本來就是為了內核分擔工作, 減少內核的開銷的么

    Workqueue機制

    因此在linux-2.6以后, 提供了更加方便的接口kthead_create和kthread_run, 同時將內核線程的創(chuàng)建操作延后, 交給一個工作隊列workqueue, 參見http://lxr.linux.no/linux+v2.6.13/kernel/kthread.c#L21,

    Linux中的workqueue機制就是為了簡化內核線程的創(chuàng)建。通過kthread_create并不真正創(chuàng)建內核線程, 而是將創(chuàng)建工作create work插入到工作隊列helper_wq中, 隨后調用workqueue的接口就能創(chuàng)建內核線程。并且可以根據當前系統(tǒng)CPU的個數創(chuàng)建線程的數量,使得線程處理的事務能夠并行化。workqueue是內核中實現簡單而有效的機制,他顯然簡化了內核daemon的創(chuàng)建,方便了用戶的編程.

    工作隊列(workqueue)是另外一種將工作推后執(zhí)行的形式.工作隊列可以把工作推后,交由一個內核線程去執(zhí)行,也就是說,這個下半部分可以在進程上下文中執(zhí)行。最重要的就是工作隊列允許被重新調度甚至是睡眠。

    具體的信息, 請參見

    Linux workqueue工作原理

    2號進程kthreadd

    但是這種方法依然看起來不夠優(yōu)美, 我們何不把這種創(chuàng)建內核線程的工作交給一個特殊的內核線程來做呢?

    于是linux-2.6.22引入了kthreadd進程, 并隨后演變?yōu)?號進程, 它在系統(tǒng)初始化時同1號進程一起被創(chuàng)建(當然肯定是通過kernel_thread),?參見rest_init函數, 并隨后演變?yōu)閯?chuàng)建內核線程的真正建造師,?參見kthreadd和kthreadd函數, 它會循環(huán)的是查詢工作鏈表static LIST_HEAD(kthread_create_list);中是否有需要被創(chuàng)建的內核線程, 而我們的通過kthread_create執(zhí)行的操作, 只是在內核線程任務隊列kthread_create_list中增加了一個create任務, 然后會喚醒kthreadd進程來執(zhí)行真正的創(chuàng)建操作?

    內核線程會出現在系統(tǒng)進程列表中, 但是在ps的輸出中進程名command由方括號包圍, 以便與普通進程區(qū)分。

    如下圖所示, 我們可以看到系統(tǒng)中, 所有內核線程都用[]標識, 而且這些進程父進程id均是2, 而2號進程kthreadd的父進程是0號進程

    使用ps -eo pid,ppid,command

    kernel_thread


    kernel_thread是最基礎的創(chuàng)建內核線程的接口, 它通過將一個函數直接傳遞給內核來創(chuàng)建一個進程, 創(chuàng)建的進程運行在內核空間, 并且與其他進程線程共享內核虛擬地址空間

    kernel_thread的實現經歷過很多變革?
    早期的kernel_thread執(zhí)行更底層的操作, 直接創(chuàng)建了task_struct并進行初始化,

    引入了kthread_create和kthreadd 2號進程后, kernel_thread的實現也由統(tǒng)一的_do_fork(或者早期的do_fork)托管實現

    早期實現

    早期的內核中, kernel_thread并不是使用統(tǒng)一的do_fork或者_do_fork這一封裝好的接口實現的, 而是使用更底層的細節(jié)

    參見

    http://lxr.free-electrons.com/source/kernel/fork.c?v=2.4.37#L613

    我們可以看到它內部調用了更加底層的arch_kernel_thread創(chuàng)建了一個線程

    arch_kernel_thread

    其具體實現請參見

    http://lxr.free-electrons.com/ident?v=2.4.37;i=arch_kernel_thread

    但是這種方式創(chuàng)建的線程并不適合運行,因此內核提供了daemonize函數, 其聲明在include/linux/sched.h中

    // http://lxr.free-electrons.com/source/include/linux/sched.h?v=2.4.37#L800 extern void daemonize(void);
    • 1
    • 2

    定義在kernel/sched.c

    http://lxr.free-electrons.com/source/kernel/sched.c?v=2.4.37#L1326

    主要執(zhí)行如下操作

  • 該函數釋放其父進程的所有資源,不然這些資源會一直鎖定直到線程結束。

  • 阻塞信號的接收

  • 將init用作守護進程的父進程

  • 我們可以看到早期內核的很多地方使用了這個接口, 比如

    可以參見

    http://lxr.free-electrons.com/ident?v=2.4.37;i=daemonize

    我們將了這么多kernel_thread, 但是我們并不提倡我們使用它, 因為這個是底層的創(chuàng)建內核線程的操作接口, 使用kernel_thread在內核中執(zhí)行大量的操作, 雖然創(chuàng)建的代價已經很小了, 但是對于追求性能的linux內核來說還不能忍受

    因此我們只能說kernel_thread是一個古老的接口, 內核中的有些地方仍然在使用該方法, 將一個函數直接傳遞給內核來創(chuàng)建內核線程

    新版本的實現

    于是linux-3.x下之后, 有了更好的實現, 那就是


    延后內核的創(chuàng)建工作, 將內核線程的創(chuàng)建工作交給一個內核線程來做, 即kthreadd 2號進程

    但是在kthreadd還沒創(chuàng)建之前, 我們只能通過kernel_thread這種方式去創(chuàng)建,?

    同時kernel_thread的實現也改為由_do_fork(早期內核中是do_fork)來實現, 參見kernel/fork.c

    pid_t kernel_thread(int (*fn)(void *), void *arg, unsigned long flags) {return _do_fork(flags|CLONE_VM|CLONE_UNTRACED, (unsigned long)fn,(unsigned long)arg, NULL, NULL, 0); }
    • 1
    • 2
    • 3
    • 4
    • 5

    kthread_create


    struct task_struct *kthread_create_on_node(int (*threadfn)(void *data),void *data,int node,const char namefmt[], ...);#define kthread_create(threadfn, data, namefmt, arg...) \kthread_create_on_node(threadfn, data, NUMA_NO_NODE, namefmt, ##arg)
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    創(chuàng)建內核更常用的方法是輔助函數kthread_create,該函數創(chuàng)建一個新的內核線程。最初線程是停止的,需要使用wake_up_process啟動它。

    kthread_run


    /*** kthread_run - create and wake a thread.* @threadfn: the function to run until signal_pending(current).* @data: data ptr for @threadfn.* @namefmt: printf-style name for the thread.** Description: Convenient wrapper for kthread_create() followed by* wake_up_process(). Returns the kthread or ERR_PTR(-ENOMEM).*/ #define kthread_run(threadfn, data, namefmt, ...) \ ({ \struct task_struct *__k \= kthread_create(threadfn, data, namefmt, ## __VA_ARGS__); \if (!IS_ERR(__k)) \wake_up_process(__k); \__k; \ })
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    使用kthread_run,與kthread_create不同的是,其創(chuàng)建新線程后立即喚醒它,其本質就是先用kthread_create創(chuàng)建一個內核線程,然后通過wake_up_process喚醒它

    內核線程的退出


    線程一旦啟動起來后,會一直運行,除非該線程主動調用do_exit函數,或者其他的進程調用kthread_stop函數,結束線程的運行。

    int kthread_stop(struct task_struct *thread);
    • 1

    kthread_stop() 通過發(fā)送信號給線程。

    如果線程函數正在處理一個非常重要的任務,它不會被中斷的。當然如果線程函數永遠不返回并且不檢查信號,它將永遠都不會停止。

    在執(zhí)行kthread_stop的時候,目標線程必須沒有退出,否則會Oops。原因很容易理解,當目標線程退出的時候,其對應的task結構也變得無效,kthread_stop引用該無效task結構就會出錯。

    為了避免這種情況,需要確保線程沒有退出,其方法如代碼中所示:

    thread_func() {// do your work here// wait to exitwhile(!thread_could_stop()){wait();} }exit_code() {kthread_stop(_task); //發(fā)信號給task,通知其可以退出了 }
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    這種退出機制很溫和,一切盡在thread_func()的掌控之中,線程在退出時可以從容地釋放資源,而不是莫名其妙地被人“暗殺”。

    總結

    以上是生活随笔為你收集整理的Linux内核线程kernel thread详解--Linux进程的管理与调度的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。