Linux进程的管理与调度（七）--- Linux下1号进程的前世（kernel_init）今生（init进程）-白红宇的个人博客

Linux进程的管理与调度（七）--- Linux下1号进程的前世（kernel_init）今生（init进程）

发布日期：2021-06-29 14:55:25 浏览次数：3 分类：技术文章

本文共 10915 字，大约阅读时间需要 36 分钟。

Linux进程的管理与调度（七）--- Linux下1号进程的前世（kernel_init）今生（init进程）

Linux 下有3 个特殊的进程，idle进程 $(P I D = 0)$ ，init进程 $(P I D = 1)$ 和 kthreadd进程 $(P I D = 2)$ 。

idle 进程由系统自动创建，运行在内核态
idle 进程其 pid = 0，其前身是系统创建的第一个进程，也是唯一一个没有通过fork 或者 kernel_thread产生的进程。
完成加载系统后，演变为进程调度，交换。

init 进程由idle 通过kernel_thread创建，在内核空间完成初始化后，加载init程序
由 0 号进程创建，完成系统的初始化，是系统中所有其他用户进程的祖先进程。
Linux 中的所有进程都是由init 进程创建并运行的。
首先Linux 内核启动，然后在用户空间中启动init 进程，再启动其他系统进程。
在系统进程启运完成后，init 将变为守护进程监视系统其他进程。

kthreadd 进程由idle 通过kernel_thread创建，并始终运行在内核空间，负表所有内核线程的调度和管理
它的任务就是管理和调度其他内核线程， kernel_thread会循环执行一个kthread的函数，该函数的作用就是运行kthread_create_list 全局链表中维护的kthread，当我们调用kernel_thread 创建的内核线程会被加入到此链表中，因此所有的内核线程都是直接或间接的以kthreadd为父进程。

Linux 系统中的init 进程（PID=1）是除了 idle 进程（PID=0，init_task）之外的另一个比较特殊的进程，它是Linux 内核开始建立起进程概念时第一个通过 kernel_thread产生的进程，其开是在内核态执行，然后通一个系统调用，开始执行用户空间的 /sbin/init 程序，期间Linux 内核也经历了从内核态到用户态的特权级转变，/sbin/init 极有可能产生出了shell，然后所有的用户进程都由该进程派生出来。

init 进程 - 1号进程

前面我们了解到了0号进程是系统所有进程的祖先，它的进程描述符 init_task是内核静态创建的，而它在进行初始化的时候，通过 kernel_thread 的方式创建了两个内核线程，分别是 kernel_init 和 kthreadd，其中 kernel_init 进程号为1。

start_kernel 在其最后一个函数 rest_init 的调用中，会通过 kernel_thread 来产生一个内核进程，
后者则会在新进程环境下调用kernel_init 函数，
kernel_init 一个让人感兴趣的地方在于它会调用 run_init_process 来执行根文件系统下的/sbin/init 等程序。

kernel_init

0 号进程创建 1 号进程的方式如下：

kernel_thread(kernel_init, NULL, CLONE_FS);

我们发现 1 号进程的执行函数就是kernel_init ，这个函数定义在 init/main.c 中，如下所示：

kernel_init 函数将完成设备驱动程序的初始化，并调用init_post 函数启用户空间的init 进程。

由0 号进程创建1号进程（内核态），1号内核态线程负责执行内核的部分初始化工作及进行系统配置，并创建若干高速缓存和虚拟主存管理的内核线程。

init 进程

随后，1号进程调用 do_execve运行可执行程序init，并演变成用户态1号进程，即init 进程。

init 进程是Linux 内核启动的第一个用户级进程。 init 有许多很重要的任务，比如像启动 getty（用于用户登陆），实现运行级别，以及处理孤立进程。

它按照配置文件 /etc/initab 的要求，完成系统启动工作，创建编号为1号、2号。。。的若干终端注册进程getty。

每个getty 进程设置其进程组标识号，并监视配置到系统终端的接口线路。

当检测到来自终端的连接信号时，getty进程将通过函数do_execve() 执行注册程序login，此时用户就可输入注册名和密码进入登录过程，如果成功，由login程序再通过函数execv() 执行shell，该shell进程接收getty进程的pid，取代原来的getty进程。再由shell直接或间接地产生其他进程。

上述过程可描述为：0号进程 -> 1号内核进程 -> 1号用户进程（init进程）-> getty进程 -> shell进程

注意，上述过程描述中提到：

1号内核进程调用执行init函数并演变成1号用户态进程（init进程），这里前者是init是函数，后者是进程。

两者容易混淆，区别如下：

kernel_init函数在内核态运行，是内核代码

init进程是内核启动并运行的第一个用户进程，运行在用户态下。

1号内核进程调用execve()从文件/etc/inittab中加载可执行程序init并执行，这个过程并没有使用调用do_fork()，因此两个进程都是1号进程。

当内核启动了自己之后（已被装入内存、已经开始运行、已经初始化了所有的设备驱动程序和数据结构等等），通过启动用户级程序init来完成引导进程的内核部分。因此，init总是第一个进程（它的进程号总是1）。

当init开始运行，它通过执行一些管理任务来结束引导进程，例如检查文件系统、清理/tmp、启动各种服务以及为每个终端和虚拟控制台启动getty，在这些地方用户将登录系统。

在系统完全起来之后，init为每个用户已退出的终端重启getty（这样下一个用户就可以登录）。

init同样也收集孤立的进程：当一个进程启动了一个子进程并且在子进程之前终止了，这个子进程立刻成为init的子进程。

对于各种技术方面的原因来说这是很重要的，知道这些也是有好处的，因为这便于理解进程列表和进程树图。

init的变种很少。绝大多数Linux发行版本使用sysinit（由Miguel van Smoorenburg著），它是基于System V的init设计。UNIX的BSD版本有一个不同的init。

最主要的不同在于运行级别：System V有而BSD没有（至少是传统上说）。这种区别并不是主要的。在此我们仅讨论sysvinit。配置init以启动getty：/etc/inittab文件

关于 init 程序

1号进程通过execve执行init程序来进入用户空间，成为init进程，那么这个init在哪里呢

内核在几个位置上来查寻init，这几个位置以前常用来放置init，但是init的最适当的位置（在Linux系统上）是/sbin/init。

如果内核没有找到init，它就会试着运行/bin/sh，如果还是失败了，那么系统的启动就宣告失败了。

因此init程序是一个可以由用户编写的进程, 如果希望看init程序源码的朋友，可以参见

init包	说明	学习链接
sysvinit	早期一些版本使用的初始化进程工具, 目前在逐渐淡出linux历史舞台, sysvinit 就是 system V 风格的 init 系统，顾名思义，它源于 System V 系列 UNIX。它提供了比 BSD 风格 init 系统更高的灵活性。是已经风行了几十年的 UNIX init 系统，一直被各类 Linux 发行版所采用。	《》
upstart	debian, Ubuntu等系统使用的initdaemon	《》
systemd	Systemd 是 Linux 系统中最新的初始化系统（init），它主要的设计目标是克服 sysvinit 固有的缺点，提高系统的启动速度	《》

Ubuntu等使用deb包的系统可以通过dpkg -S查看程序所在的包

CentOS等使用rpm包的系统可以通过rpm -qf查看系统程序所在的包

参见
《》

附录

kernel_init_freeable流程分析

static noinline void __init kernel_init_freeable(void){
       /*     * Wait until kthreadd is all set-up.     */    wait_for_completion(&kthreadd_done);    /* Now the scheduler is fully set up and can do blocking allocations */    gfp_allowed_mask = __GFP_BITS_MASK;    /*     * init can allocate pages on any node     */    set_mems_allowed(node_states[N_MEMORY]);    /*     * init can run on any cpu.     */    set_cpus_allowed_ptr(current, cpu_all_mask);    cad_pid = task_pid(current);    smp_prepare_cpus(setup_max_cpus);    do_pre_smp_initcalls();    lockup_detector_init();    smp_init();    sched_init_smp();    page_alloc_init_late();    do_basic_setup();    /* Open the /dev/console on the rootfs, this should never fail */    if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0)            pr_err("Warning: unable to open an initial console.\n");    (void) sys_dup(0);    (void) sys_dup(0);    /*     * check if there is an early userspace init.  If yes, let it do all     * the work     */    if (!ramdisk_execute_command)            ramdisk_execute_command = "/init";    if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) {
               ramdisk_execute_command = NULL;            prepare_namespace();    }    /*     * Ok, we have completed the initial bootup, and     * we're essentially up and running. Get rid of the     * initmem segments and start the user-mode stuff..     *     * rootfs is available now, try loading the public keys     * and default modules     */    integrity_load_keys();    load_default_modules(); }

执行流程	说明
wait_for_completion	实例在kernel/sched/completion.c中, 等待Kernel Thread kthreadd (PID=2)创建完毕
gfp_allowed_mask	__GFP_BITS_MASK;设置bitmask, 使得init进程可以使用PM并且允许I/O阻塞操作
set_mems_allowed(node_states[N_MEMORY])	init进程可以分配物理页面
set_cpus_allowed_ptr	通过设置cpu_bit_mask, 可以限定task只能在特定的处理器上运行, 而init current进程此时必然是init进程，设置其cpu_all_mask即使得init进程可以在任意的cpu上运行
task_pid	设置到目前运行进程init的pid号给cad_pid(cad_pid是用来接收ctrl-alt-del reboot signal的进程, 如果设置C_A_D=1就表示可以处理来自ctl-alt-del的动作)，最后会调用 ctrl_alt_del(void)并确认C_A_D是否为1，确认完成后将执行cad_work=deferred_cad，执行kernel_restart
smp_prepare_cpus	体系结构相关的函数，实例在arch/arm/kernel/smp.c中, 调用smp_prepare_cpus时,会以全局变量setup_max_cpus为函式参数max_cpus, 以表示在编译核心时,设定支援的最大CPU数量
do_pre_smp_initcalls	实例在init/main.c中, 会透过函式do_one_initcall, 执行Symbol中 __initcall_start与__early_initcall_end之间的函数
smp_init	实例在kernel/smp.c中, 函数主要是由Bootstrap处理器,进行Active多核心架构下其它的处理器. 如果发生Online的处理器个数(from num_online_cpus)超过在核心编译时, 所设定的最大处理器个数 setup_max_cpus (from NR_CPUS),就会终止流程. 如果该处理器目前属於Present （也就是存在系统中),但尚未是Online的状态, 就会呼叫函式cpu_up(in kernel/cpu.c)来启动该处理器.
sched_init_smp	实例在kernel/sched.c中, (1), 呼叫get_online_cpus,如果目前CPU Hotplug Active Write行程是自己, 就直接返回.反之就把 cpu_hotplug.refcount加1 (表示多一个Reader) (2),取得Mutex Lock “sched_domains_mutex” (3),呼叫arch_init_sched_domains,设定scheduler domains与groups, 参考Linux Documentation/scheduler/sched-domains.txt文件, 一个Scheduling Domain会包含一个或多个CPU Groups, 排程的Load-Balance就会根据Domain中的Groups来做调整. (4),释放Mutex Lock “sched_domains_mutex” (5),呼叫put_online_cpus,如果目前CPU Hotplug Active Writer行程是自己,就直接返回. 反之就把 cpu_hotplug.refcount减1, 如果 cpu_hotplug.refcount减到為0,表示没有其他Reader, 此时如果有CPU Hotplug Active Writer行程在等待,就会透过wake_up_process唤醒该行程, 以便让等待中的Writer可以被执行下去.(也可以参考_cpu_up中对於函式cpu_hotplug_begin的说明). (6)注册CPU Notifier cpuset_cpu_active/cpuset_cpu_inactive/update_runtime (7),呼叫set_cpus_allowed_ptr,透过这函式可以设定CPU bitmask, 限定Task只能在特定的处理器上运作.在这会用参数”non_isolated_cpus”, 也就是会把init指定给non-isolated CPU. Linux Kernel可以在啟动时, 透过Boot Parameters “isolcpus=“指定CPU编号或是范围, 让这些处理器不被包含在Linux Kernel SMP balancing/scheduling算法内, 可以在啟动后指派给特定的Task运作. 而不在 “isolcpus=“ 指定范围内的处理器就算是non-isolated CPU. (8),呼叫sched_init_granularity,透过函式update_sysctl, 让sysctl_sched_min_granularity=normalized_sysctl_sched_min_granularity, sysctl_sched_latency=normalized_sysctl_sched_latency, sysctl_sched_wakeup_granularity=normalized_sysctl_sched_wakeup_granularit
do_basic_setup	实例在init/main.c中, 1,diaousermodehelper_init (in kernel/kmod.c),产生khelper workqueue. 2,调用init_tmpfs (in mm/shmem.c),对VFS注册Temp FileSystem. 3,呼叫driver_init (in drivers/base/init.c),初始化Linux Kernel Driver System Model. 4,呼叫init_irq_proc(in kernel/irq/proc.c),初始化 “/proc/irq”与其下的File Nodes. 5,呼叫do_ctors (in init/main.c), 执行位於Symbol __ctors_start 到 __ctors_end间属於Section “.ctors” 的Constructor函式. 6,透过函式do_initcalls,执行介於Symbol __early_initcall_end与__initcall_end之间的函式呼叫,
sys_open	实例在fs/fcntl.c中,”SYSCALL_DEFINE1(dup, unsigned int, fildes)”, 在这会连续执行两次sys_dup, 复制两个sys_open开啟/dev/console所產生的档案描述0 (也就是会多生出两个1与2),只是都对应到”/dev/console”, 我们在System V streams下的Standard Stream一般而言会有如下的对应 0:Standard input (stdin) 1:Standard output (stdout) 2:Standard error (stderr) (為方便大家参考,附上Wiki URL )
ramdisk_execute_command 与 prepare_namespace	1. 如果ramdisk_execute_command為0,就设定ramdisk_execute_command = “/init” 2. 如果sys_access确认档案ramdisk_execute_command 失败, 就把ramdisk_execute_command 设定為0,然后呼叫prepare_namespace去mount root FileSystem.
integrity_load_keys	至此我们初始化工作完成, 文件系统也已经准备好了，那么接下来加载 load integrity keys hook
load_default_modules	加载基本的模块

kernel_init分析

static int __ref kernel_init(void *unused){
       int ret;    kernel_init_freeable();    /* need to finish all async __init code before freeing the memory */    async_synchronize_full();    free_initmem();    mark_rodata_ro();    system_state = SYSTEM_RUNNING;    numa_default_policy();    flush_delayed_fput();    rcu_end_inkernel_boot();    if (ramdisk_execute_command) {
               ret = run_init_process(ramdisk_execute_command);            if (!ret)                    return 0;            pr_err("Failed to execute %s (error %d)\n",                   ramdisk_execute_command, ret);    }    /*     * We try each of these until one succeeds.     *     * The Bourne shell can be used instead of init if we are     * trying to recover a really broken machine.     */    if (execute_command) {
               ret = run_init_process(execute_command);            if (!ret)                    return 0;            panic("Requested init %s failed (error %d).",                  execute_command, ret);    }    if (!try_to_run_init_process("/sbin/init") ||        !try_to_run_init_process("/etc/init") ||        !try_to_run_init_process("/bin/init") ||        !try_to_run_init_process("/bin/sh"))            return 0;    panic("No working init found.  Try passing init= option to kernel. "          "See Linux Documentation/init.txt for guidance.");}

执行流程	说明
kernel_init_freeable	调用`kernel_init_freeable`完成初始化工作，准备文件系统，准备模块信息
async_synchronize_full	用以同步所有非同步函式呼叫的执行, 在这函数中会等待List async_running与async_pending都清空后,才会返回. Asynchronously called functions主要设计用来加速Linux Kernel开机的效率, 避免在开机流程中等待硬体反应延迟,影响到开机完成的时间
free_initmem	free_initmem(in arch/arm/mm/init.c),释放Linux Kernel介於__init_begin到 __init_end属于init Section的函数的所有内存. 并会把Page个数加到变量totalram_pages中,作为后续Linux Kernel在配置记忆体时可以使用的Pages. (在这也可把TCM范围(__tcm_start到__tcm_end)释放加入到总Page中, 但TCM比外部记忆体有效率,适合多媒体, 中断,…etc等对效能要求高的执行需求,放到总Page中,成为可供一般目的配置的存储范围
system_state	设置运行状态SYSTEM_RUNNING
加载init进程，进入用户空间	a,如果ramdisk_execute_command不為0,就执行该命令成為init User Process. b,如果execute_command不為0,就执行该命令成為init User Process. c,如果上述都不成立,就依序執行如下指令 run_init_process(“/sbin/init”); run_init_process(“/etc/init”); run_init_process(“/bin/init”); run_init_process(“/bin/sh”); 也就是说会按照顺序从/sbin/init, /etc/init, /bin/init 与 /bin/sh依序执行第一个 init User Process. 如果都找不到可以执行的 init Process,就会进入Kernel Panic. 如下所示panic(“No init found. Try passing init= option to kernel. ” “See Linux Documentation/init.txt for guidance.”);

转载地址：https://ciellee.blog.csdn.net/article/details/110432359 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：【FFmpeg解码实战】（6）从零实现FFmpeg4.3 + SDL2视频播放器

下一篇：【倒车影像分流需求九】- 终 - 代码优化 - 异常情况处理

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！