Linux下有3個特殊的進程,idle進程(
* idle進程由系統自動創建, 運行在內核態
idle進程其pid=0,其前身是系統創建的第一個進程,也是唯一一個沒有通過fork或者kernel_thread產生的進程。完成加載系統後,演變為進程調度、交換
* init進程由idle通過kernel_thread創建,在內核空間完成初始化後, 加載init程序, 並最終用戶空間
由0進程創建,完成系統的初始化. 是系統中所有其它用戶進程的祖先進程
Linux中的所有進程都是有init進程創建並運行的。首先Linux內核啟動,然後在用戶空間中啟動init進程,再啟動其他系統進程。在系統啟動完成完成後,init將變為守護進程監視系統其他進程。
* kthreadd進程由idle通過kernel_thread創建,並始終運行在內核空間, 負責所有內核線程的調度和管理
它的任務就是管理和調度其他內核線程kernel_thread, 會循環執行一個kthread的函數,該函數的作用就是運行kthread_create_list全局鏈表中維護的kthread, 當我們調用kernel_thread創建的內核線程會被加入到此鏈表中,因此所有的內核線程都是直接或者間接的以kthreadd為父進程
我們下面就詳解分析1號進程的前世(kernel_init)今生(init進程)
Linux系統中的init進程(pid=1)是除了idle進程(pid=0,也就是init_task)之外另一個比較特殊的進程,它是Linux內核開始建立起進程概念時第一個通過kernel_thread產生的進程,其開始在內核態執行,然後通過一個系統調用,開始執行用戶空間的/sbin/init程序,期間Linux內核也經歷了從內核態到用戶態的特權級轉變,/sbin/init極有可能產生出了shell,然後所有的用戶進程都有該進程派生出來
前面我們了解到了0號進程是系統所有進程的先祖, 它的進程描述符init_task是內核靜態創建的, 而它在進行初始化的時候, 通過kernel_thread的方式創建了兩個內核線程,分別是kernel_init和kthreadd,其中kernel_init進程號為1
start_kernel在其最後一個函數rest_init的調用中,會通過kernel_thread來生成一個內核進程,後者則會在新進程環境下調 用kernel_init函數,kernel_init一個讓人感興趣的地方在於它會調用run_init_process來執行根文件系統下的 /sbin/init等程序:
0號進程創建1號進程的方式如下
kernel_thread(kernel_init, NULL, CLONE_FS);
我們發現1號進程的執行函數就是kernel_init, 這個函數被定義init/main.c中,如下所示
kernel_init函數將完成設備驅動程序的初始化,並調用init_post函數啟動用戶空間的init進程。
由0號進程創建1號進程(內核態),1號內核線程負責執行內核的部分初始化工作及進行系統配置,並創建若干個用於高速緩存和虛擬主存管理的內核線程。
隨後,1號進程調用do_execve運行可執行程序init,並演變成用戶態1號進程,即init進程。
init進程是linux內核啟動的第一個用戶級進程。init有許多很重要的任務,比如像啟動getty(用於用戶登錄)、實現運行級別、以及處理孤立進程。
它按照配置文件/etc/initab的要求,完成系統啟動工作,創建編號為1號、2號…的若干終端注冊進程getty。
每個getty進程設置其進程組標識號,並監視配置到系統終端的接口線路。當檢測到來自終端的連接信號時,getty進程將通過函數do_execve()執行注冊程序login,此時用戶就可輸入注冊名和密碼進入登錄過程,如果成功,由login程序再通過函數execv()執行shell,該shell進程接收getty進程的pid,取代原來的getty進程。再由shell直接或間接地產生其他進程。
上述過程可描述為:0號進程->1號內核進程->1號用戶進程(init進程)->getty進程->shell進程
注意,上述過程描述中提到:1號內核進程調用執行init函數並演變成1號用戶態進程(init進程),這裡前者是init是函數,後者是進程。兩者容易混淆,區別如下:
kernel_init函數在內核態運行,是內核代碼
init進程是內核啟動並運行的第一個用戶進程,運行在用戶態下。
一號內核進程調用execve()從文件/etc/inittab中加載可執行程序init並執行,這個過程並沒有使用調用do_fork(),因此兩個進程都是1號進程。
當內核啟動了自己之後(已被裝入內存、已經開始運行、已經初始化了所有的設備驅動程序和數據結構等等),通過啟動用戶級程序init來完成引導進程的內核部分。因此,init總是第一個進程(它的進程號總是1)。
當init開始運行,它通過執行一些管理任務來結束引導進程,例如檢查文件系統、清理/tmp、啟動各種服務以及為每個終端和虛擬控制台啟動getty,在這些地方用戶將登錄系統。
在系統完全起來之後,init為每個用戶已退出的終端重啟getty(這樣下一個用戶就可以登錄)。init同樣也收集孤立的進程:當一個進程啟動了一個子進程並且在子進程之前終止了,這個子進程立刻成為init的子進程。對於各種技術方面的原因來說這是很重要的,知道這些也是有好處的,因為這便於理解進程列表和進程樹圖。init的變種很少。絕大多數Linux發行版本使用sysinit(由Miguel van Smoorenburg著),它是基於System V的init設計。UNIX的BSD版本有一個不同的init。最主要的不同在於運行級別:System V有而BSD沒有(至少是傳統上說)。這種區別並不是主要的。在此我們僅討論sysvinit。 配置init以啟動getty:/etc/inittab文件
1號進程通過execve執行init程序來進入用戶空間,成為init進程,那麼這個init在哪裡呢
內核在幾個位置上來查尋init,這幾個位置以前常用來放置init,但是init的最適當的位置(在Linux系統上)是/sbin/init。如果內核沒有找到init,它就會試著運行/bin/sh,如果還是失敗了,那麼系統的啟動就宣告失敗了。
因此init程序是一個可以又用戶編寫的進程。
Ubuntu等使用deb包的系統可以通過dpkg -S查看程序所在的包
CentOS等使用rpm包的系統可以通過rpm -qf查看系統程序所在的包
static noinline void __init kernel_init_freeable(void)
{
/*
* Wait until kthreadd is all set-up.
*/
wait_for_completion(&kthreadd_done);
/* Now the scheduler is fully set up and can do blocking allocations */
gfp_allowed_mask = __GFP_BITS_MASK;
/*
* init can allocate pages on any node
*/
set_mems_allowed(node_states[N_MEMORY]);
/*
* init can run on any cpu.
*/
set_cpus_allowed_ptr(current, cpu_all_mask);
cad_pid = task_pid(current);
smp_prepare_cpus(setup_max_cpus);
do_pre_smp_initcalls();
lockup_detector_init();
smp_init();
sched_init_smp();
page_alloc_init_late();
do_basic_setup();
/* Open the /dev/console on the rootfs, this should never fail */
if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0)
pr_err("Warning: unable to open an initial console.\n");
(void) sys_dup(0);
(void) sys_dup(0);
/*
* check if there is an early userspace init. If yes, let it do all
* the work
*/
if (!ramdisk_execute_command)
ramdisk_execute_command = "/init";
if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) {
ramdisk_execute_command = NULL;
prepare_namespace();
}
/*
* Ok, we have completed the initial bootup, and
* we're essentially up and running. Get rid of the
* initmem segments and start the user-mode stuff..
*
* rootfs is available now, try loading the public keys
* and default modules
*/
integrity_load_keys();
load_default_modules();
}
ctrl-alt-del
reboot signal的進程, 如果設置C_A_D=1就表示可以處理來自ctl-alt-del
的動作), 最後會調用 ctrl_alt_del(void)並確認C_A_D是否為1,確認完成後將執行cad_work=deferred_cad,執行kernel_restart
smp_prepare_cpus
體系結構相關的函數,實例在arch/arm/kernel/smp.c中,調用smp_prepare_cpus時,會以全局變量setup_max_cpus為函式參數max_cpus,以表示在編譯核心時,設定支援的最大CPU數量
do_pre_smp_initcalls
實例在init/main.c中, 會透過函式do_one_initcall,執行Symbol中 __initcall_start與__early_initcall_end之間的函數
smp_init
實例在kernel/smp.c中, 函數主要是由Bootstrap處理器,進行Active多核心架構下其它的處理器. 如果發生Online的處理器個數(from num_online_cpus)超過在核心編譯時,所設定的最大處理器個數 setup_max_cpus (from NR_CPUS),就會終止流程.如果該處理器目前屬於Present (也就是存在系統中),但尚未是Online的狀態,就會呼叫函式cpu_up(in kernel/cpu.c)來啟動該處理器.
sched_init_smp
實例在kernel/sched.c中, (1), 呼叫get_online_cpus,如果目前CPU Hotplug Active Write行程是自己,就直接返回.反之就把 cpu_hotplug.refcount加1 (表示多一個Reader)
static int __ref kernel_init(void *unused)
{
int ret;
kernel_init_freeable();
/* need to finish all async __init code before freeing the memory */
async_synchronize_full();
free_initmem();
mark_rodata_ro();
system_state = SYSTEM_RUNNING;
numa_default_policy();
flush_delayed_fput();
rcu_end_inkernel_boot();
if (ramdisk_execute_command) {
ret = run_init_process(ramdisk_execute_command);
if (!ret)
return 0;
pr_err("Failed to execute %s (error %d)\n",
ramdisk_execute_command, ret);
}
/*
* We try each of these until one succeeds.
*
* The Bourne shell can be used instead of init if we are
* trying to recover a really broken machine.
*/
if (execute_command) {
ret = run_init_process(execute_command);
if (!ret)
return 0;
panic("Requested init %s failed (error %d).",
execute_command, ret);
}
if (!try_to_run_init_process("/sbin/init") ||
!try_to_run_init_process("/etc/init") ||
!try_to_run_init_process("/bin/init") ||
!try_to_run_init_process("/bin/sh"))
return 0;
panic("No working init found. Try passing init= option to kernel. "
"See Linux Documentation/init.txt for guidance.");
}