歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux基礎 >> 關於Linux

Linux下1號進程的前世(kernel_init)今生(init進程)----Linux進程的管理與調度(六)

前言


Linux下有3個特殊的進程,idle進程(PID=0), init進程(PID=1)和kthreadd(PID=2)

* idle進程由系統自動創建, 運行在內核態

idle進程其pid=0,其前身是系統創建的第一個進程,也是唯一一個沒有通過fork或者kernel_thread產生的進程。完成加載系統後,演變為進程調度、交換


* init進程由idle通過kernel_thread創建,在內核空間完成初始化後, 加載init程序, 並最終用戶空間

由0進程創建,完成系統的初始化. 是系統中所有其它用戶進程的祖先進程
Linux中的所有進程都是有init進程創建並運行的。首先Linux內核啟動,然後在用戶空間中啟動init進程,再啟動其他系統進程。在系統啟動完成完成後,init將變為守護進程監視系統其他進程。


* kthreadd進程由idle通過kernel_thread創建,並始終運行在內核空間, 負責所有內核線程的調度和管理

它的任務就是管理和調度其他內核線程kernel_thread, 會循環執行一個kthread的函數,該函數的作用就是運行kthread_create_list全局鏈表中維護的kthread, 當我們調用kernel_thread創建的內核線程會被加入到此鏈表中,因此所有的內核線程都是直接或者間接的以kthreadd為父進程

我們下面就詳解分析1號進程的前世(kernel_init)今生(init進程)

Linux系統中的init進程(pid=1)是除了idle進程(pid=0,也就是init_task)之外另一個比較特殊的進程,它是Linux內核開始建立起進程概念時第一個通過kernel_thread產生的進程,其開始在內核態執行,然後通過一個系統調用,開始執行用戶空間的/sbin/init程序,期間Linux內核也經歷了從內核態到用戶態的特權級轉變,/sbin/init極有可能產生出了shell,然後所有的用戶進程都有該進程派生出來

1號進程


前面我們了解到了0號進程是系統所有進程的先祖, 它的進程描述符init_task是內核靜態創建的, 而它在進行初始化的時候, 通過kernel_thread的方式創建了兩個內核線程,分別是kernel_init和kthreadd,其中kernel_init進程號為1

start_kernel在其最後一個函數rest_init的調用中,會通過kernel_thread來生成一個內核進程,後者則會在新進程環境下調 用kernel_init函數,kernel_init一個讓人感興趣的地方在於它會調用run_init_process來執行根文件系統下的 /sbin/init等程序:

kernel_init


0號進程創建1號進程的方式如下

kernel_thread(kernel_init, NULL, CLONE_FS);

我們發現1號進程的執行函數就是kernel_init, 這個函數被定義init/main.c中,如下所示

kernel_init函數將完成設備驅動程序的初始化,並調用init_post函數啟動用戶空間的init進程。

由0號進程創建1號進程(內核態),1號內核線程負責執行內核的部分初始化工作及進行系統配置,並創建若干個用於高速緩存和虛擬主存管理的內核線程。

init進程


隨後,1號進程調用do_execve運行可執行程序init,並演變成用戶態1號進程,即init進程。

init進程是linux內核啟動的第一個用戶級進程。init有許多很重要的任務,比如像啟動getty(用於用戶登錄)、實現運行級別、以及處理孤立進程。

它按照配置文件/etc/initab的要求,完成系統啟動工作,創建編號為1號、2號…的若干終端注冊進程getty。

每個getty進程設置其進程組標識號,並監視配置到系統終端的接口線路。當檢測到來自終端的連接信號時,getty進程將通過函數do_execve()執行注冊程序login,此時用戶就可輸入注冊名和密碼進入登錄過程,如果成功,由login程序再通過函數execv()執行shell,該shell進程接收getty進程的pid,取代原來的getty進程。再由shell直接或間接地產生其他進程。

上述過程可描述為:0號進程->1號內核進程->1號用戶進程(init進程)->getty進程->shell進程

注意,上述過程描述中提到:1號內核進程調用執行init函數並演變成1號用戶態進程(init進程),這裡前者是init是函數,後者是進程。兩者容易混淆,區別如下:

kernel_init函數在內核態運行,是內核代碼

init進程是內核啟動並運行的第一個用戶進程,運行在用戶態下。

一號內核進程調用execve()從文件/etc/inittab中加載可執行程序init並執行,這個過程並沒有使用調用do_fork(),因此兩個進程都是1號進程。

當內核啟動了自己之後(已被裝入內存、已經開始運行、已經初始化了所有的設備驅動程序和數據結構等等),通過啟動用戶級程序init來完成引導進程的內核部分。因此,init總是第一個進程(它的進程號總是1)。

當init開始運行,它通過執行一些管理任務來結束引導進程,例如檢查文件系統、清理/tmp、啟動各種服務以及為每個終端和虛擬控制台啟動getty,在這些地方用戶將登錄系統。

在系統完全起來之後,init為每個用戶已退出的終端重啟getty(這樣下一個用戶就可以登錄)。init同樣也收集孤立的進程:當一個進程啟動了一個子進程並且在子進程之前終止了,這個子進程立刻成為init的子進程。對於各種技術方面的原因來說這是很重要的,知道這些也是有好處的,因為這便於理解進程列表和進程樹圖。init的變種很少。絕大多數Linux發行版本使用sysinit(由Miguel van Smoorenburg著),它是基於System V的init設計。UNIX的BSD版本有一個不同的init。最主要的不同在於運行級別:System V有而BSD沒有(至少是傳統上說)。這種區別並不是主要的。在此我們僅討論sysvinit。 配置init以啟動getty:/etc/inittab文件

關於init程序


1號進程通過execve執行init程序來進入用戶空間,成為init進程,那麼這個init在哪裡呢

內核在幾個位置上來查尋init,這幾個位置以前常用來放置init,但是init的最適當的位置(在Linux系統上)是/sbin/init。如果內核沒有找到init,它就會試著運行/bin/sh,如果還是失敗了,那麼系統的啟動就宣告失敗了。

因此init程序是一個可以又用戶編寫的進程。
Ubuntu等使用deb包的系統可以通過dpkg -S查看程序所在的包

這裡寫圖片描述

CentOS等使用rpm包的系統可以通過rpm -qf查看系統程序所在的包

舊版CentOS

新版CentOS

附錄


kernel_init_freeable流程分析


static noinline void __init kernel_init_freeable(void)
{
    /*
     * Wait until kthreadd is all set-up.
     */
    wait_for_completion(&kthreadd_done);

    /* Now the scheduler is fully set up and can do blocking allocations */
    gfp_allowed_mask = __GFP_BITS_MASK;

    /*
     * init can allocate pages on any node
     */
    set_mems_allowed(node_states[N_MEMORY]);
    /*
     * init can run on any cpu.
     */
    set_cpus_allowed_ptr(current, cpu_all_mask);

    cad_pid = task_pid(current);

    smp_prepare_cpus(setup_max_cpus);

    do_pre_smp_initcalls();
    lockup_detector_init();

    smp_init();
    sched_init_smp();

    page_alloc_init_late();

    do_basic_setup();

    /* Open the /dev/console on the rootfs, this should never fail */
    if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0)
            pr_err("Warning: unable to open an initial console.\n");

    (void) sys_dup(0);
    (void) sys_dup(0);
    /*
     * check if there is an early userspace init.  If yes, let it do all
     * the work
     */

    if (!ramdisk_execute_command)
            ramdisk_execute_command = "/init";

    if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) {
            ramdisk_execute_command = NULL;
            prepare_namespace();
    }

    /*
     * Ok, we have completed the initial bootup, and
     * we're essentially up and running. Get rid of the
     * initmem segments and start the user-mode stuff..
     *
     * rootfs is available now, try loading the public keys
     * and default modules
     */

    integrity_load_keys();
    load_default_modules();
 }
執行流程 說明 wait_for_completion 實例在kernel/sched/completion.c中, 等待Kernel Thread kthreadd (PID=2)創建完畢 gfp_allowed_mask __GFP_BITS_MASK;設置bitmask, 使得init進程可以使用PM並且允許I/O阻塞操作 set_mems_allowed(node_states[N_MEMORY]); init進程可以分配物理頁面 set_cpus_allowed_ptr 通過設置cpu_bit_mask, 可以限定task只能在特定的處理器上運行, 而initcurrent進程此時必然是init進程,設置其cpu_all_mask即使得init進程可以在任意的cpu上運行 task_pid 設置到目前運行進程init的pid號給cad_pid(cad_pid是用來接收ctrl-alt-del reboot signal的進程, 如果設置C_A_D=1就表示可以處理來自ctl-alt-del的動作), 最後會調用 ctrl_alt_del(void)並確認C_A_D是否為1,確認完成後將執行cad_work=deferred_cad,執行kernel_restart smp_prepare_cpus 體系結構相關的函數,實例在arch/arm/kernel/smp.c中,調用smp_prepare_cpus時,會以全局變量setup_max_cpus為函式參數max_cpus,以表示在編譯核心時,設定支援的最大CPU數量 do_pre_smp_initcalls 實例在init/main.c中, 會透過函式do_one_initcall,執行Symbol中 __initcall_start與__early_initcall_end之間的函數 smp_init 實例在kernel/smp.c中, 函數主要是由Bootstrap處理器,進行Active多核心架構下其它的處理器. 如果發生Online的處理器個數(from num_online_cpus)超過在核心編譯時,所設定的最大處理器個數 setup_max_cpus (from NR_CPUS),就會終止流程.如果該處理器目前屬於Present (也就是存在系統中),但尚未是Online的狀態,就會呼叫函式cpu_up(in kernel/cpu.c)來啟動該處理器. sched_init_smp 實例在kernel/sched.c中, (1), 呼叫get_online_cpus,如果目前CPU Hotplug Active Write行程是自己,就直接返回.反之就把 cpu_hotplug.refcount加1 (表示多一個Reader)
(2),取得Mutex Lock “sched_domains_mutex”
(3),呼叫arch_init_sched_domains,設定scheduler domains與groups,參考Linux Documentation/scheduler/sched-domains.txt文件,一個Scheduling Domain會包含一個或多個CPU Groups,排程的Load-Balance就會根據Domain中的Groups來做調整.
(4),釋放Mutex Lock “sched_domains_mutex”
(5),呼叫put_online_cpus,如果目前CPU Hotplug Active Writer行程是自己,就直接返回.反之就把 cpu_hotplug.refcount減1,如果 cpu_hotplug.refcount減到為0,表示沒有其他Reader,此時如果有CPU Hotplug Active Writer行程在等待,就會透過wake_up_process喚醒該行程,以便讓等待中的Writer可以被執行下去.(也可以參考_cpu_up中對於函式cpu_hotplug_begin的說明).
(6)注冊CPU Notifier cpuset_cpu_active/cpuset_cpu_inactive/update_runtime
(7),呼叫set_cpus_allowed_ptr,透過這函式可以設定CPU bitmask,限定Task只能在特定的處理器上運作.在這會用參數”non_isolated_cpus”,也就是會把init指定給non-isolated CPU. Linux Kernel可以在啟動時,透過Boot Parameters “isolcpus=“指定CPU編號或是范圍,讓這些處理器不被包含在Linux Kernel SMP balancing/scheduling算法內,可以在啟動後指派給特定的Task運作.而不在 “isolcpus=“ 指定范圍內的處理器就算是non-isolated CPU.
(8),呼叫sched_init_granularity,透過函式update_sysctl,讓sysctl_sched_min_granularity=normalized_sysctl_sched_min_granularity,sysctl_sched_latency=normalized_sysctl_sched_latency,sysctl_sched_wakeup_granularity=normalized_sysctl_sched_wakeup_granularit do_basic_setup 實例在init/main.c中,
1,diaousermodehelper_init (in kernel/kmod.c),產生khelper workqueue.
2,調用init_tmpfs (in mm/shmem.c),對VFS注冊Temp FileSystem.
3,呼叫driver_init (in drivers/base/init.c),初始化Linux Kernel Driver System Model.
4,呼叫init_irq_proc(in kernel/irq/proc.c),初始化 “/proc/irq”與其下的File Nodes.
5,呼叫do_ctors (in init/main.c),執行位於Symbol __ctors_start 到 __ctors_end間屬於Section “.ctors” 的Constructor函式.
6,透過函式do_initcalls,執行介於Symbol __early_initcall_end與__initcall_end之間的函式呼叫, sys_open 實例在fs/fcntl.c中,”SYSCALL_DEFINE1(dup, unsigned int, fildes)”,在這會連續執行兩次sys_dup,復制兩個sys_open開啟/dev/console所產生的檔案描述0 (也就是會多生出兩個1與2),只是都對應到”/dev/console”,我們在System V streams下的Standard Stream一般而言會有如下的對應
0:Standard input (stdin)
1:Standard output (stdout)
2:Standard error (stderr) ramdisk_execute_command與prepare_namespace 1,如果ramdisk_execute_command為0,就設定ramdisk_execute_command = “/init”
2,如果sys_access確認檔案ramdisk_execute_command 失敗,就把ramdisk_execute_command 設定為0,然後呼叫prepare_namespace去mount root FileSystem. integrity_load_keys 至此我們初始化工作完成, 文件系統也已經准備好了,那麼接下來加載 load integrity keys hook load_default_modules 加載基本的模塊

kernel_init分析


static int __ref kernel_init(void *unused)
{
    int ret;

    kernel_init_freeable();
    /* need to finish all async __init code before freeing the memory */
    async_synchronize_full();
    free_initmem();
    mark_rodata_ro();
    system_state = SYSTEM_RUNNING;
    numa_default_policy();

    flush_delayed_fput();

    rcu_end_inkernel_boot();

    if (ramdisk_execute_command) {
            ret = run_init_process(ramdisk_execute_command);
            if (!ret)
                    return 0;
            pr_err("Failed to execute %s (error %d)\n",
                   ramdisk_execute_command, ret);
    }

    /*
     * We try each of these until one succeeds.
     *
     * The Bourne shell can be used instead of init if we are
     * trying to recover a really broken machine.
     */
    if (execute_command) {
            ret = run_init_process(execute_command);
            if (!ret)
                    return 0;
            panic("Requested init %s failed (error %d).",
                  execute_command, ret);
    }
    if (!try_to_run_init_process("/sbin/init") ||
        !try_to_run_init_process("/etc/init") ||
        !try_to_run_init_process("/bin/init") ||
        !try_to_run_init_process("/bin/sh"))
            return 0;

    panic("No working init found.  Try passing init= option to kernel. "
          "See Linux Documentation/init.txt for guidance.");
}
執行流程 說明 kernel_init_freeable 調用kernel_init_freeable完成初始化工作,准備文件系統,准備模塊信息 async_synchronize_full 用以同步所有非同步函式呼叫的執行,在這函數中會等待List async_running與async_pending都清空後,才會返回. Asynchronously called functions主要設計用來加速Linux Kernel開機的效率,避免在開機流程中等待硬體反應延遲,影響到開機完成的時間 free_initmem free_initmem(in arch/arm/mm/init.c),釋放Linux Kernel介於__init_begin到 __init_end屬於init Section的函數的所有內存.並會把Page個數加到變量totalram_pages中,作為後續Linux Kernel在配置記憶體時可以使用的Pages. (在這也可把TCM范圍(__tcm_start到__tcm_end)釋放加入到總Page中,但TCM比外部記憶體有效率,適合多媒體,中斷,…etc等對效能要求高的執行需求,放到總Page中,成為可供一般目的配置的存儲范圍 system_state 設置運行狀態SYSTEM_RUNNING 加載init進程,進入用戶空間 a,如果ramdisk_execute_command不為0,就執行該命令成為init User Process.
b,如果execute_command不為0,就執行該命令成為init User Process.
c,如果上述都不成立,就依序執行如下指令
run_init_process(“/sbin/init”);
run_init_process(“/etc/init”);
run_init_process(“/bin/init”);
run_init_process(“/bin/sh”);
也就是說會按照順序從/sbin/init, /etc/init, /bin/init 與 /bin/sh依序執行第一個 init User Process.
如果都找不到可以執行的 init Process,就會進入Kernel Panic.如下所示panic(“No init found. Try passing init= option to kernel. ”“See Linux Documentation/init.txt for guidance.”);
Copyright © Linux教程網 All Rights Reserved