您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> 關於Linux

Linux系統管理

進程管理

進程管理簡介

進程是正在執行的一個程序或命令，每一個進程都是一個運行的屍體，都有自己的地址空間，並占用一定的系統資源。

進程管理的作用

判斷服務器健康狀態查看系統中所有進程殺死進程

進程的查看

查看所有進程

ps命令

ps aux 查看系統中所有進程，使用BSD操作系統格式 ps -le 查看系統中所有進程，使用Linux標准命令格式
選項
-a 顯示一個終端的所有進程，除了會話
-u 顯示進程的歸屬用戶及內存的使用情況
-x 顯示沒有控制終端的進程
-l 長格式顯示。顯示更加詳細的信息
-e 顯示所有進程和-A作用一致

/*  USER 進程由哪個用戶生成
    PID 進程ID號
    %CPU 進程占用CPU資源的百分比，占用越高，進程越耗資源
    %MEM 進程占用物理內存的百分比，占用越高，進程越耗資源
    VSZ 進程占用虛擬內存的大小，單位KB
    RSS 進程占用實際物理內存的大小，單位KB

    TTY 進程是在哪個終端中運行。
        其中tty1-tty7代表本地控制台終端，tty1-tty6是本地字符界面終端，tty7是圖形終端，pts/0-255代表虛擬終端、遠程終端
        tty1-tty7可以通過CTL+ALT+F1~CTL+ALT+F7來切換。
        TTY顯示？說明進程是由內核啟動的不是由終端啟動。

    STAT 進程狀態。
        常見的狀態：
        R 運行、S 睡眠、T 停止狀態、s 包含子進程、+ 位於後台

    START 進程啟動時間
    TIME 進程占用CPU的運算時間，注意不是系統時間
    COMMAND 產生此進程的命令名
*/
$ ps aux
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.4 185316  4116 ?        Ss   6月24   0:23 /sbin/init spl
root         2  0.0  0.0      0     0 ?        S    6月24   0:00 [kthreadd]
root         3  0.0  0.0      0     0 ?        S    6月24   4:07 [ksoftirqd/0]
root         5  0.0  0.0      0     0 ?        S<   6月24   0:00 [kworker/0:0H]
root         7  0.1  0.0      0     0 ?        S    6月24  16:09 [rcu_sched]
...

`pstree命令`

pstree

選項

-p 顯示進程的PID

-u 顯示進程的所屬用戶

$ pstree
systemd─┬─ModemManager─┬─{gdbus}
        │              └─{gmain}
        ├─NetworkManager─┬─dhclient
        │                ├─dnsmasq
        │                ├─{gdbus}
        │                └─{gmain}
        ├─accounts-daemon─┬─{gdbus}
        │                 └─{gmain}
        ├─acpid
        ├─5*[agetty]
        ├─avahi-daemon───avahi-daemon
        ├─colord─┬─{gdbus}
...

`top命令`

查看系統健康狀態

top

選項

-d 秒數 指定投票命令每隔幾秒更新。默認3秒

-b 使用批處理模式輸出。一般和 -n 選項合用

-n 次數 指定top命令指定的次數。一般和-b選項合用 在top命令的交互模式當中可以執行的命令

？或h 顯示交互模式的幫助

P 以CPU使用率排序，默認就是此項

M 以內存的使用率排序

N 以PID排序

q 退出top

第一行信息為任務隊列信息

內容 說明 12:26:46 系統當前時間 up 1 day, 13:32 系統的運行時間，本機已經運行1天13小時32分鐘 2 users 當前登錄了兩個用戶 load average: 0.00, 0.00, 0.00

系統在之前1分鐘，5分鐘，15分鐘的平均負載。一般任務小於1時，負載較小。如果大於1，系統已經超出負載。

第二行為進程信息

內容 說明 Tasks： 95 tatal 系統中進程總數 1 running 正在運行的進程數 94 sleeping 睡眠的進程 0 stopped 正在停止的進程 0 zombie 僵屍進程。如果不是0，需要手工檢查僵屍進程

注：

孤兒進程：一個父進程退出，而它的一個或多個子進程還在運行，那麼那些子進程將成為孤兒進程。孤兒進程將被init進程(進程號為1)所收養，並由init進程對它們完成狀態收集工作。

僵屍進程：一個進程使用fork創建子進程，如果子進程退出，而父進程並沒有調用wait或waitpid獲取子進程的狀態信息，那麼子進程的進程描述符仍然保存在系統中。這種進程稱之為僵死進程。

第三行行為CPU信息

內容 說明 Cpu(s): 0.1%us 用戶模式占用的CPU百分比 0.1%sy 系統模式占用的CPU百分比 0.0%ni 改變過優先級的用戶進程占用的CPU百分比 99.7%id 空閒CPU的CPU百分比 0.1%wa 等待輸入/輸出的進程占用CPU百分比 0.0%hi 硬終端請求服務占用的CPU百分比 0.1%si 軟中斷請求服務占用的CPU百分比 0.0%st st(Steal time)虛擬時間百分比。就是當有虛擬機時，虛擬CPU等待實際CPU的時間百分比

第四行行為物理內存信息

內容 說明 Mem: 625344k total 物理內存的總量，單位KB 571504k used 已經使用的物理內存數量 53840 free 空閒的物理內存數量，我們使用虛擬機，總共只分配了628MB內存，所以只有53MB的空閒內存了 65800k buffers 作為緩沖的內存數量

注：

buffers：加速寫入；例如保存文件內容，真是情況是先寫入文件進程的緩沖區，然後在文件關閉和系統空閒時再寫入硬盤。

第五行為交換分區（swap）信息

內容 說明 Swap: 524280k total 交換分區（虛擬內存）的總大小 Ok used 已經使用的交互分區的大小 524280k free 空閒交換分區的大小 409289k cached 作為緩存的交換分區的大小

注：

cached：加速讀取；例如，讀取硬盤文件時可以把部分文件放在內存中緩存起來，不用每次訪問硬盤，加速讀取文件速度。

top內容主要查看 load average、cpu的空閒率、內存的空閒、Swap分區的空閒。

// 更改top刷新時間為1s，但不建議，top本身耗費資源
$ top -n 1

// 使用top只能在終端中看到很少一部分程序，因此使用-b來保存進程到文件中
$ top -b -n 1 >top.log
$ cat top.log

`進程的結束`

`kill命令`

kill -l

查看可用的進程信號

信號代號 信號名稱 說明 1 SIGHUB 該信號讓進程立即關閉，然後重新讀取配置文件之後重啟 2 SIGINT 程序終止信號，用於終止前台進程。相當於輸出ctl+c快捷鍵 8 SIGFPE

在發生致命的算術運算錯誤時發出。不僅包括浮點運算錯誤，還包括溢出及除數為0等其他所有的算術的錯誤

9 SIGKILL 用來立即結束程序的運行。本信號不能被阻塞、處理和忽略。一般用於強制終止進程。 14 SIGALRM 時鐘定時信號，計算的是實際的時間或時鐘時間。alarm函數使用該信號 15 SIGTERM

正常結束進程的信號，kill命令默認信號。有時如果進程已經發生問題，這個信號是無法正常終止進程的，我們才會嘗試SIGKILL信號，也就是信號9。

18 SIGCONT 該信號可以讓暫停的進程恢復執行，本信號不能被阻塞。 19 SIGSTOP 該信號可以暫停前台進程，相當於輸入ctl+z快捷鍵。本信號不能被阻斷。

SIGHUB信號若apache服務器重新設置配置文件，需要重啟apache服務，如果使用服務命令stop、start時關閉服務造成用戶體驗非常差。那麼可以使用Kill -HUB pid的命令使apache服務重新加載配置實現平滑重啟。但apache服務有多個服務進程，那麼可以使用killall 命令實現。平滑重啟不會使服務器登錄用戶掉線。

SIGKILL 強制終止進程，kill -9 2236

// 查看可用的進程信號
$ kill -l
// 強制終止進程,注kill後跟的是pid不能是進程名
$ kill -9 2237

`killall命令`

killall [選項][信號]進程名

選項

-i 交互式，詢問是否要殺死某個進程

-I 忽略進程名的大小寫

// 殺死所有apache服務
$ killall -9 httpd

`pkill命令`

pkill [選項][信號]進程號

選項

-t 終端號 按照終端號踢出用戶

注：pkill和killall命令基本相同。

// 查看當前登錄用戶
$ w
 19:53:45 up  3:02,  1 user,  load average: 0.00, 0.01, 0.05
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root   tty1     -               16:51    3:02m 23.87s  0.23s -bash
root   pts/0    192.168.44.1    04:47    0.00s 0.22s   0.00s w
root   pts/0    192.168.44.1    04:47    0.00s 0.22s   0.00s -bash

// 只有root用戶可以踢掉本地用戶
# pkill -9 -t tty1

`進程優先級的修改`

`進程優先級簡介`

Linux操作系統是一個多用戶、多任務的操作系統，Linux系統中通知運行著非常多的進程。但是CPU在統一時鐘周期內只能運算一個指令。進程優先級決定了每個進程處理的先後順序。

$ ps -le
F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
4 S     0     1     0  0  80   0 - 29895 -      ?        00:00:02 systemd
1 S     0     2     0  0  80   0 -     0 -      ?        00:00:00 kthreadd
1 S     0     3     2  0  80   0 -     0 -      ?        00:00:00 ksoftirqd/0
1 S     0     5     2  0  60 -20 -     0 -      ?        00:00:00 kworker/0:0H
1 S     0     7     2  0  80   0 -     0 -      ?        00:00:03 rcu_sched
1 S     0     8     2  0  80   0 -     0 -      ?        00:00:00 rcu_bh
1 S     0     9     2  0 -40   - -     0 -      ?        00:00:00 migration/0
5 S     0    10     2  0 -40   - -     0 -      ?        00:00:00 watchdog/0
5 S     0    11     2  0  80   0 -     0 -      ?        00:00:00 kdevtmpfs
1 S     0    12     2  0  60 -20 -     0 -      ?        00:00:00 netns

// PRI代表Priority，NI代表Nice。這兩個值都是優先級，數字越小代表該進程優先級越高。

`修改NI值時有幾個注意事項`

NI的值的范圍是-20到19 普通用戶調整NI值的范圍是0到19，而且只能調整自己的進程 普通用戶只能調高NI值，而不是降低，如原本NI值為0，則只能調整為大於0 root用戶才能設定進程NI值為負值，而且可以調整任何用戶的進程 PRI（最終值）=PRI（原始值）+NI 用戶只能修改NI的值，不能直接修改PRI

`nice命令`

nice [選項] 命令

nice命令可以給新執行的命令直接賦予NI值，但是不能修改已經存在進程的NI值

選項

-n NI值 給命令賦予NI值

// 進程啟動時才可以修改其NI值，進程運行時無法修改
# nice -n -5 service httpd start

`renice命令`

renice [優先級] PID

renice命令是修改已經存在進程的NI值命令

// 使用renice來修改已經存在進程的NI值
# renice -10 2125

`工作管理`

`工作管理簡介`

工作管理是指在單個登錄終端中（也就是登錄的shell界面中）同時管理多個工作的行為。

`注意事項`

當前的登錄終端，只能管理當前終端的工作，而不能管理其他登錄終端的工作

放入後台的命令必須可以持續運行一段時間，這樣我們才能捕捉和操作這個工作

放入後台執行的命令不能和前台有交互或需要前台輸入，否則放入後台只能暫停，而不能運行

`工作管理方法`

`進程放入後台`

使用 & 把命令放入後台使用 ctrl + z快捷鍵把命令放入後台

// 把命令放入後台，並在後台執行
$ tar -zcf etc.tar.gz /etc &

// 按下ctl + z 快捷鍵，放在後台暫停
$ top
ctl + z

`查看後台的工作`

jobs

選項

-l 顯示工作的PID

注：”+”號代表最近一個放入後台的工作，也是工作回復時，默認回復的工作。”-“號代表倒數第二個放入後台的工作

$ top&
$ top // ctrl+ z放入後台
// 查看後台進程，兩個top進程都是停止的，因為top給前台用戶查看的，和前台有交互，無法在後台執行
$ jobs
[1]-  Stopped                 top
[2]+  Stopped                 top

$ vi abc &
$ jobs
[1]   Stopped                 top
[2]-  Stopped                 top
[3]+  Stopped                 vi abc

`將後台暫停的工作恢復到前台執行`

fg %工作號

參數

%工作號 %號可以省略，但是注意工作和PID的區別

`將後台暫停的工作恢復到後台執行`

bg %工作號

參數

%工作號 %號可以省略，但是注意工作和PID的區別

注：後台恢復執行的命令，是不能和前台有交互的，否則不能恢復到後台執行

`後台命令脫離登錄終端執行`

`簡介`

把命令放入後台，只能在當前登錄終端執行。一旦退出或關閉終端，後台程序就會停止。

`後台命令脫離登錄終端執行的方法`

把需要後台執行的命令加入 /etc/rc.local文件 使用系統定時任務，讓系統在指定的時間執行某個後台命令 使用nohub命令，推薦使用 做成daemon守護進程 如mysqld服務

// 系統啟動時執行rc.local文件
$ cat /etc/rc.local
touch /var/lock/subsys/local // 注：這裡不是創建文件，改變文件的timestamp

// 在終端1中執行for.sh
# vi for.sh
#!/bin/bash
for ((i=0; i<=1000; i=i+1))
    do
        echo 11 >> /root/for.log
        sleep 10
    done

# nohup /root/for.sh &
// 關閉終端1
// 打開終端2，ps aux 可以看到for.sh仍在運行

`系統資源查看`

`vmstat命令監控系統資源`

vmstat [刷新延時刷新次數]

$ vmstat 1 3
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 0  0  70280 133280  13140 303244    0    4    60    16   53  121  1  1 98  0  0
 0  0  70280 133264  13140 303248    0    0     0     0   40  201  1  0 99  0  0
 0  0  70280 133264  13140 303248    0    0     0     0   43  183  1  0 99  0  0

process 進程信息字段

-r 等待運行的進程數，數量越大，系統越繁忙

-b 不可被喚醒的進程數量，數量越大，系統越繁忙 memory 內存信息字段

-swpd 虛擬內存的使用情況，單位KB

-free 空閒的內存容量，單位KB

-buff 緩沖的內存容量，單位KB

-cache 緩沖的內存容量，單位KB swap 交換分區的信息字段

-si 從磁盤中交換到內存中數據的數量，單位KB

-so 從內從中交換到磁盤中數據的數量，單位KB。此兩個數越大，證明數據需要經常在磁盤和內存之間交換，系統性能越差。 io 磁盤讀寫信息字段

-bi 從塊設備讀入數據的總量，單位是塊

-bo 寫到塊設備的數據的總量，單位是塊。次兩個數越大，代表系統的I/O越繁忙。 system 系統信息字段

-in 每秒被中斷的進程次數

-cs 每秒中進行的時間切換次數。此兩個數越大，代表系統與接口設備的通信非常繁忙。 CPU CPU信息字段

-us 非內核進程消耗CPU運算時間的百分比

-sy 內核進程消耗CPU運算時間的百分比

-id 空閒CPU的百分比

-wa 等待I/O所消耗的CPU百分比

-st 被虛擬機所盜用的CPU占比

`dmesg開機時內核檢測信息`

$ dmesg |grep CPU

`free命令查看內存使用狀態`

free [-b|-k|-m|-g]

選項

-b 以字節為單位顯示

-k 以KB為單位顯示，默認就是以KB為單位顯示

-m 以MB為單位顯示

-g 以GB為單位顯示

/*
    total 總內存數
    used 已經使用內存數
    free 空閒的內存數
    shared 多個進程共享的內存數
    buffers 緩沖內存數
    cached 緩存內存數
    默認單位是KB
*/
$ free -m
              total        used        free      shared  buff/cache   available
Mem:            983         545         124           6         313         273       
Swap:          1906          68        1838

`查看CPU信息`

$ cat /proc/cpuinfo

`uptime命令`

顯示系統的啟動時間和平均負載，也就是top命令的第一行。w命令也可以看到這個數據。

$ uptime
 10:10:47 up  6:11,  1 user,  load average: 0.18, 0.10, 0.09

$ w
 10:11:35 up  6:12,  1 user,  load average: 0.09, 0.09, 0.09
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root   tty7     :0               一16   17:20m 49.38s  0.28s /sbin/upstart --user

`查看系統與內核相關信息`

uname [選項]

選項

-a 查看系統所有相關信息

-r 查看內核版本

-s 查看內核名稱

`判斷當前系統的位數`

file /bin/ls

`查看當前Linux系統的發行版本`

lsb_release -a

`列出進程打開或使用的文件信息`

lsof [選項]

列出進程調用或打開文件的信息

選項

-c 字符串 只列出以字符串開頭的進程打開的文件

-u 用戶名 只列出某個用戶的進程打開的文件

-p pid 列出某個PID進程打開的文件

// 查詢系統中所有進程調用的文件
$ lsof |more
// 查詢某個文件被哪個進程調用
$ lsof /sbin/init
// 查看httpd進程調用了哪些文件
$ lsof -c httpd
// 按照用戶名，查詢某個用戶進程調用的文件
$ lsof -u root

緩存和緩沖的區別簡單來說緩存（cache）用來加速數據從硬盤中“讀取”的，而緩沖（buffer）用來加速數據“寫入”硬盤的。

`系統定時任務`

at一次性定時任務 crontab循環定時任務系統的crontab設置 anacron配置

`at命令`

`確定at安裝`

// at 服務是否安裝
# chkconfig --list |grep atd
# service atd status

`at的訪問控制`

如果系統中有/etc/at.allow文件，那麼只有寫入/etc/at.allow文件（白名單）中的用戶可以使用at命令（/etc/at.deny文件會被忽略）

如果系統中沒有/etc/at.allow文件，只有/etc/at.deny文件，那麼寫入/etc/at.deny文件（黑名單）中的用戶不能使用at命令。對root不起作用

如果系統中這兩個文件都不存在，那麼只有root用戶可以使用at命令

`at命令`

`例子`

$ at now +2 minutes
at> /root/hello.sh >> /root/hello.log
at> 

// 指定時間重啟
$ at 02:00 2013-07-26
at>/bin/sync
at>/sbin/shutdown -r now

`其他at管理命令`

atq

查詢當前服務器上的at工作

atrm [工作號]

刪除指定的at任務

`crontab`

`crond服務管理與訪問控制`

// 檢查crond服務是否安裝啟動
# service crond restart
# chkconfig crond on

`訪問控制`

當系統中有/etc/cron.allow文件時，只有寫入此文件的用戶可以使用crontab命令，沒有寫入的用戶不能使用crontab命令。同樣如果有此文件，/etc/cron.deny文件會被忽略，/etc/cron.allow文件的優先級更高

當系統中只有/etc/cron.deny文件時，則寫入此文件的用戶不能使用crontab命令，沒有寫入文件的用戶可以使用crontab命令

`用戶的crontab設置`

crontab [選項]

選項：

-e 編輯crontab定時任務

-l 查詢crontab任務

-r 刪除當前用戶所有的crontab任務

// 編輯crontab命令
$ crontab -e
***** command

項目 含義 范圍 第一個* 一小時當中的第幾分鐘 0-59 第二個* 一天當中的第幾小時 0-23 第三個* 一個月當中的第幾天 1-31 第四個* 一年當中的第幾個月 1-12 第五個* 一周當中的星期幾 0-7（0和7都代表星期日） 特殊符號 含義 * 代表任何時間。比如第一個“*”就代表一小時中的每分鐘都執行一次的意思 ,

代表不連續的時間。比如“0 8,12,16 * * * 命令”，就代表每天的8點0分，12點0分，16點0分都執行一次命令

- 代表連續的時間范圍，比如“0 5 * * 1-6 命令”，代表在周一到周六凌晨5點0分執行命令 */n 代表每隔多久執行一次。比如“ */10 * * * * 命令”，代表每隔10分鐘就執行一遍命令

// cron命令，每月1號和15號，每周1的0點0分都會執行
// 注意：星期幾和幾號最好不要同時出現，他們定義的都是天。非常迷惑。
0 0 1,15 * 1 命令

// 例子
// 每隔5分鐘在/root/test中寫入111
*/5 * * * * echo 111 >> /root/test

`crontab注意事項`

六個選項不能為空，必須填寫。如果不確定使用“*”代表任意時間。

crontab定時任務，最小有效時間是分鐘，最大時間范圍是月。想2018年某時執行，3點30分30秒這樣的時間都不能識別。

在定義時間時，日期和星期最好不要在一條定時任務中出現，因為他們都是以天作為單位，飛鏟更容易讓管理員混亂。

在定時任務中，不管是直接寫命令，還是在腳本中寫命令，最好都是用絕對路徑。

注：定時任務自帶的環境變量與$PATH中的保存的環境變量不一定相同，所以在crontab中使用絕對路徑。

`系統定的crontab設置`

“crontab -e”是每個用戶執行的命令，也就是說不同的用戶身份可以執行自己的定時任務。可是有些定時任務需要系統執行，這是我們就需要編輯/etc/crontab這個配置文件。

// 這裡crontab是普通用戶的定時任務
$ crontab -e 

// 系統定時任務
// CentOS 5 中的配置文件
$ vim /etc/crontab
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/

#run-parts
01 * * * * root run-parts /etc/cron.hourly
02 4 * * * root run-parts /etc/cron.daily
22 4 * * 0 root run-parts /etc/cron.weekly
42 4 1 * * root run-parts /etc/cron.monthly

// 查看/etc下crontab相關的目錄和文件
# ls /etc/cron
cron.d/       cron.hourly/  crontab       
cron.daily/   cron.monthly/ cron.weekly/

`執行系統的定時任務的方法`

手工執行定時任務

系統定時任務

第一種是把需要定時執行的腳本復制到/etc/cron.{daily, weekly, monthly}目錄中任意一個

第二種是修改/etc/crontab配置文件

`anacron配置`

anacron是用來保證在系統關機的時候錯過的定時任務，可以在系統開機之後再執行

`anacron檢測周期`

anacron會使用一天，七天，一個月作為檢測周期

在系統的/var/spool/anacron/目錄中存在cron.{daily, weekly, monthly}文件，用於記錄上次執行cron的時間

和當前時間作比較，如果兩個時間的差值超過了anacron的指定時間差值，證明有cron任務沒有被執行

`CentOS 6.x 的區別`

在老的CentOS版本中，/etc/cron.{daily, weekly, monthly}這些目錄即會被cron調用，也會被anacron調用，容易重復執行

在CentOS 6.x中則只會被anacron調用，避免了重復執行

在CentOS 6.x中，anacron不再是服務，而是系統命令

`anacron配置文件`

$ vi /etc/anacrontab

# /etc/anacrontab: configuration file for anacron

# See anacron(8) and anacrontab(5) for details.

SHELL=/bin/sh
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
HOME=/root
LOGNAME=root

RANDOM_DELAY=45

START_HOURS_RANGE=3-22

# These replace cron's entries
1       5       cron.daily      run-parts --report /etc/cron.daily
7       10      cron.weekly     run-parts --report /etc/cron.weekly
@monthly        15      cron.monthly    run-parts --report /etc/cron.monthly
#天數    強制延遲（分鐘）    工作名稱    實際執行的命令