shell是用戶和Linux操作系統之間的接口。Linux中有多種shell,其中缺省使用的是Bash。本章講述了shell的工作原理,shell的種類,shell的一般操作及Bash的特性。
什麼是shell
Linux系統的shell作為操作系統的外殼,為用戶提供使用操作系統的接口。它是命令語言、命令解釋程序及程序設計語言的統稱。
shell是用戶和Linux內核之間的接口程序,如果把Linux內核想象成一個球體的中心,shell就是圍繞內核的外層。當從shell或其他程序向Linux傳遞命令時,內核會做出相應的反應。
shell是一個命令語言解釋器,它擁有自己內建的shell命令集,shell也能被系統中其他應用程序所調用。用戶在提示符下輸入的命令都由shell先解釋然後傳給Linux核心。
有一些命令,比如改變工作目錄命令cd,是包含在shell內部的。還有一些命令,例如拷貝命令cp和移動命令rm,是存在於文件系統中某個目錄下的單獨的程序。對用戶而言,不必關心一個命令是建立在shell內部還是一個單獨的程序。
shell首先檢查命令是否是內部命令,若不是再檢查是否是一個應用程序(這裡的應用程序可以是Linux本身的實用程序,如ls和rm,也可以是購買的商業程序,如xv,或者是自由軟件,如emacs)。然後shell在搜索路徑裡尋找這些應用程序(搜索路徑就是一個能找到可執行程序的目錄列表)。如果鍵入的命令不是一個內部命令並且在路徑裡沒有找到這個可執行文件,將會顯示一條錯誤信息。如果能夠成功找到命令,該內部命令或應用程序將被分解為系統調用並傳給Linux內核。
shell的另一個重要特性是它自身就是一個解釋型的程序設計語言,shell程序設計語言支持絕大多數在高級語言中能見到的程序元素,如函數、變量、數組和程序控制結構。shell編程語言簡單易學,任何在提示符中能鍵入的命令都能放到一個可執行的shell程序中。
當普通用戶成功登錄,系統將執行一個稱為shell的程序。正是shell進程提供了命令行提示符。作為默認值(TurboLinux系統默認的shell是BASH),對普通用戶用“$”作提示符,對超級用戶(root)用“#”作提示符。
一旦出現了shell提示符,就可以鍵入命令名稱及命令所需要的參數。shell將執行這些命令。如果一條命令花費了很長的時間來運行,或者在屏幕上產生了大量的輸出,可以從鍵盤上按ctrl+c發出中斷信號來中斷它(在正常結束之前,中止它的執行)。
當用戶准備結束登錄對話進程時,可以鍵入logout命令、exit命令或文件結束符(EOF)(按ctrl+d實現),結束登錄。
我們來實習一下shell是如何工作的。
$ make work
make:***No rule to make target ‘work’. Stop.
$
注釋:make是系統中一個命令的名字,後面跟著命令參數。在接收到這個命令後,shell便執行它。本例中,由於輸入的命令參數不正確,系統返回信息後停止該命令的執行。
在例子中,shell會尋找名為make的程序,並以work為參數執行它。make是一個經常被用來編譯大程序的程序,它以參數作為目標來進行編譯。在 “make work”中,make編譯的目標是work。因為make找不到以work為名字的目標,它便給出錯誤信息表示運行失敗,用戶又回到系統提示符下。
另外,用戶鍵入有關命令行後,如果shell找不到以其中的命令名為名字的程序,就會給出錯誤信息。例如,如果用戶鍵入:
$ myprog
bash:myprog:command not found
$
可以看到,用戶得到了一個沒有找到該命令的錯誤信息。用戶敲錯命令後,系統一般會給出這樣的錯誤信息。
shell的種類
Linux中的shell有多種類型,其中最常用的幾種是Bourne shell(sh)、C shell(csh)和Korn shell(ksh)。三種shell各有優缺點。Bourne shell是UNIX最初使用的shell,並且在每種UNIX上都可以使用。Bourne shell在shell編程方面相當優秀,但在處理與用戶的交互方面做得不如其他幾種shell。Linux操作系統缺省的shell是Bourne Again shell,它是Bourne shell的擴展,簡稱Bash,與Bourne shell完全向後兼容,並且在Bourne shell的基礎上增加、增強了很多特性。Bash放在/bin/bash中,它有許多特色,可以提供如命令補全、命令編輯和命令歷史表等功能,它還包含了很多C shell和Korn shell中的優點,有靈活和強大的編程接口,同時又有很友好的用戶界面。
C shell是一種比Bourne shell更適於編程的shell,它的語法與C語言很相似。 Linux為喜歡使用C shell的人提供了Tcsh。Tcsh是C shell的一個擴展版本。Tcsh包括命令行編輯、可編程單詞補全、拼寫校正、歷史命令替換、作業控制和類似C語言的語法,它不僅和Bash shell是提示符兼容,而且還提供比Bash shell更多的提示符參數。
Korn shell集合了C shell和Bourne shell的優點並且和Bourne shell完全兼容。Linux系統提供了pdksh(ksh的擴展),它支持任務控制,可以在命令行上掛起、後台執行、喚醒或終止程序。
Linux並沒有冷落其他shell用戶,還包括了一些流行的shell如ash、zsh等。每個shell都有它的用途,有些shell是有專利的,有些能從Internet網上或其他來源獲得。要決定使用哪個shell,只需讀一下各種shell的聯機幫助,並試用一下。
用戶在登錄到Linux時由/etc/passwd文件來決定要使用哪個shell。例如:
# fgrep lisa /etc/passwd
lisa:x:500:500:TurboLinux User:/home/lisa:/bin/bash
shell被列每行的末尾(/bin/bash)。
由於Bash是Linux上缺省的shell,本章主要介紹Bash及其相關知識。
shell命令
命令行c
用戶登錄到Linux系統時,可以看到一個shell提示符,標識了命令行的開始。用戶可以在提示符後面輸入任何命令及參數。例如:
$ date
二 11 23 01:34:58 CST 1999
$
用戶登錄時,實際進入了shell,它遵循一定的語法將輸入的命令加以解釋並傳給系統。命令行中輸入的第一個字必須是一個命令的名字,第二個字是命令的選項或參數,命令行中的每個字必須由空格或TAB隔開,格式如下:
$ Command Option Arguments
1. 選項和參數
選項是包括一個或多個字母的代碼,它前面有一個減號(減號是必要的,Linux用它來區別選項和參數),選項可用於改變命令執行的動作的類型。例如:
$ ls
motd passwd
$
這是沒有選項的ls命令,可列出當前目錄中所有文件,只列出各個文件的名字,而不顯示其他更多的信息。
$ ls -l
total 2
-rw-r--r-- 2 wzh book 22 Apr 20 20:37 motd
-rw-r--r-- 2 wzh book 796 Apr 20 20:37 passwd
$
加入-l選項,將會為每個文件列出一行信息,諸如數據大小和數據最後被修改的時間。
大多數命令都被設計為可以接納參數。參數是在命令行中的選項之後鍵入的一個或多個單詞,例如:
$ ls -l text
-rw-r--r-- 2 wzh book 22 Apr 20 20:37 motd
-rw-r--r-- 2 wzh book 796 Apr 20 20:37 passwd
$
將顯示text目錄下的所有文件及其信息。
有些命令,如ls可以帶參數,而有一些命令可能需要一些最小數目的參數。例如,cp命令至少需要兩個參數,如果參數的數目與命令要求不符,shell將會給出出錯信息。例如:
$ cp -i mydata newdata
注意:命令行中選項先於參數輸入。
2. 命令行特征
命令行實際上是可以編輯的一個文本緩沖區,在按回車之前,可以對輸入的文本進行編輯。比如利用BACKSPACE鍵可以刪除剛鍵入的字符,可以進行整行刪除,還可以插入字符,使得用戶在輸入命令,尤其是復雜命令時,若出現鍵入錯誤,無須重新輸入整個命令,只要利用編輯操作,即可改正錯誤。
利用上箭頭可以重新顯示剛執行的命令,利用這一功能可以重復執行以前執行過的命令,而無須重新鍵入該命令。
bash保存著以前鍵入過的命令的列表,這一列表被稱為命令歷史表。按動上箭頭,便可以在命令行上逐次顯示各條命令。同樣,按動下箭頭可以在命令列表中向下移動,這樣可以將以前的各條命令顯示在命令行上,用戶可以修改並執行這些命令。這一特征將在10.4節中進行詳細的論述。
在一個命令行中還可以置入多個命令,用分號將各個命令隔開。例如:
$ ls -F;cp -i mydata newdata
也可以在幾個命令行中輸入一個命令,用反斜槓將一個命令行持續到下一行。
$ cp –i
mydata
newdata
上面的cp命令是在三行中輸入的,開始的兩行以反斜槓結束,把三行作為一個命令行。
shell中的特殊字符
shell中除使用普通字符外,還可以使用一些具有特殊含義和功能的特殊字符。在使用它們時應注意其特殊的含義和作用范圍。下面分別對這些特殊字符加以介紹。
1. 通配符
通配符用於模式匹配,如文件名匹配、路經名搜索、字符串查找等。常用的通配符有*、?和括在方括號[ ]中的字符序列。用戶可以在作為命令參數的文件名中包含這些通配符,構成一個所謂的“模式串”,在執行過程中進行模式匹配。
* 代表任何字符串(長度可以不等),例如:“f*”匹配以f打頭的任意字符串。但應注意,文件名前的圓點(.)和路經名中的斜線(/)必須顯式匹配。例如“*”不能匹配.file,而“.*”才可以匹配.file。
? 代表任何單個字符。
[] 代表指定的一個字符范圍,只要文件名中[]位置處的字符在[]中指定的范圍之內,那麼這個文件名就與這個模式串匹配。方括號中的字符范圍可以由直接給出的字符組成,也可以由表示限定范圍的起始字符、終止字符及中間的連字符(-)組成。例如,f [a- d] 與f [abcd]的作用相同。Shell將把與命令行中指定的模式串相匹配的所有文件名都作為命令的參數,形成最終的命令,然後再執行這個命令。
下面我們給出表10-1說明這些通配符的具體含義。
表10-1 通配符含義舉例
模式串
意 義
*
當前目錄下所有文件的名稱。
*Text*
當前目錄下所有文件名中包含有Text的文件的名稱。
[ab-dm]*
當前目錄下所有以a、b、c、d、m開頭的文件的名稱。
[ab-dm]?
當前目錄下所有以a、b、c、d、m開頭且後面只跟有一個字符的文件的名稱。
/usr/bin/??
目錄/usr/bin下所有名稱為兩個字符的文件的名稱。
特別需要注意的是,連字符“-”僅在方括號內有效,表示字符范圍,如在方括號外面就成為普通字符了。而*和?只在方括號外面是通配符,若出現在方括號之內,它們也失去通配符的能力,成為普通字符了。例如,模式“- a[*?]abc”中只有一對方括號是通配符,*和?均為普通字符,因此,它匹配的字符串只能是- a*abc和- a?abc。
最後說明一下使用通配符時需要注意的一些問題。由於*、?和[]對於shell來說具有比較特殊的意義,因此在正常的文件名中不應出現這些字符。特別是在目錄名中不要出現它們,否則Shell匹配起來可能會無窮的遞歸下去。另外要注意的一點是:如果目錄中沒有與指定的模式串相匹配的文件名,那麼Shell 將使用此模式串本身作為參數傳給有關命令。這可能就是命令中出現特殊字符的原因所在。
2. 引號
在shell中引號分為三種:單引號,雙引號和反引號。
* 單引號 ‘
由單引號括起來的字符都作為普通字符出現。特殊字符用單引號括起來以後,也會失去原有意義,而只作為普通字符解釋。例如:
$ string=’$PATH’
$ echo $string
$PATH
$
可見$保持了其本身的含義,作為普通字符出現。
* 雙引號 “
由雙引號括起來的字符,除$、、’、和”這幾個字符仍是特殊字符並保留其特殊功能外,其余字符仍作為普通字符對待。對於$來說,就是用其後指定的變量的值來代替這個變量和$;對於而言,是轉義字符,它告訴shell不要對其後面的那個字符進行特殊處理,只當作普通字符即可。可以想見,在雙引號中需要在前面加上的只有四個字符$,,’和”本身。而對”號,若其前面沒有加,則Shell會將它同前一個”號匹配。
例如,我們假定PATH的值為.:/usr/bin:/bin,輸入如下命令:
$ TestString=”$PATH”$PATH”
$ echo $TestString
.:/usr/bin:/ bin”$PATH
$
讀者可以自己試一下在第二個雙引號之前不加會產生什麼結果。
* 反引號 `
反引號(`)這個字符所對應的鍵一般位於鍵盤的左上角,不要將其同單引號(’)混淆。反引號括起來的字符串被shell解釋為命令行,在執行時,shell首先執行該命令行,並以它的標准輸出結果取代整個反引號(包括兩個反引號)部分。例如:
$ pwd
/home/xyz
$ string=”current Directory is `pwd`”
$ echo $string
current directour is /home/xyz
$
shell執行echo命令時,首先執行`pwd`中的命令pwd,並將輸出結果/home/xyz取代`pwd`這部分,最後輸出替換後的整個結果。
利用反引號的這種功能可以進行命令置換,即把反引號括起來的執行結果賦值給指定變量。例如:
$ today=`date`
$ echo Today is $today
Today is Mon Apr 15 16:20:13 CST 1999
$
反引號還可以嵌套使用。但需注意,嵌套使用時內層的反引號必須用反斜線()將其轉義。例如:
$ abc=`echo The number of users is `who wc-l``
$ echo $abc
The number of users is 5
$
在反引號之間的命令行中也可以使用shell的特殊字符。Shell為得到``中命令的結果,它實際上要去執行``中指定的命令。執行時,命令中的特殊字符,如$,”,?等又將具有特殊含義,並且``所包含的可以是任何一個合法的Shell命令,如:
$ ls
note readme.txt Notice Unix.dir
$ TestString=”`echo $HOME ` ` ls [nN]*`”
$ echo $TestString
/home/yxz note Notice
$
其他情況,讀者可自行試之。
1. 注釋符
在shell編程中經常要對某些正文行進行注釋,以增加程序的可讀性。在Shell中以字符“#”開頭的正文行表示注釋行。
此外還有一些特殊字符如:用於輸入/輸出重定向與管道的<、>、<<、> >和;執行後台命令的&;命令執行操作符&&和及表示命令組的{}將在下面各小節中加以介紹。
標准輸入/輸出和重定向
1. 標准輸入與輸出
我們知道,執行一個shell命令行時通常會自動打開三個標准文件,即標准輸入文件(stdin),通常對應終端的鍵盤;標准輸出文件(stdout)和標准錯誤輸出文件(stderr),這兩個文件都對應終端的屏幕。進程將從標准輸入文件中得到輸入數據,將正常輸出數據輸出到標准輸出文件,而將錯誤信息送到標准錯誤文件中。
我們以cat命令為例,cat命令的功能是從命令行給出的文件中讀取數據,並將這些數據直接送到標准輸出。若使用如下命令:
$ cat config
將會把文件config的內容依次顯示到屏幕上。但是,如果cat的命令行中沒有參數,它就會從標准輸入中讀取數據,並將其送到標准輸出。例如:
$ cat
Hello world
Hello world
Bye
Bye
<ctrl+d>
$
用戶輸入的每一行都立刻被cat命令輸出到屏幕上。
另一個例子,命令sort按行讀入文件正文(當命令行中沒有給出文件名時,表示從標准輸入讀入),將其排序,並將結果送到標准輸出。下面的例子是從標准輸入讀入一個采購單,並將其排序。
$ sort
bananas
carrots
apples
<ctrl+d>
apples
bananas
carrots
$
這時我們在屏幕上得到了已排序的采購單。
直接使用標准輸入/輸出文件存在以下問題:
輸入數據從終端輸入時,用戶費了半天勁輸入的數據只能用一次。下次再想用這些數據時就得重新輸入。而且在終端上輸入時,若輸入有誤修改起來不是很方便。
輸出到終端屏幕上的信息只能看不能動。我們無法對此輸出作更多處理,如將輸出作為另一命令的輸入進行進一步的處理等。
為了解決上述問題,Linux系統為輸入、輸出的傳送引入了另外兩種機制,即輸入/輸出重定向和管道。
2. 輸入重定向
輸入重定向是指把命令(或可執行程序)的標准輸入重定向到指定的文件中。也就是說,輸入可以不來自鍵盤,而來自一個指定的文件。所以說,輸入重定向主要用於改變一個命令的輸入源,特別是改變那些需要大量輸入的輸入源。
例如,命令wc統計指定文件包含的行數、單詞數和字符數。如果僅在命令行上鍵入:
$ wc
wc將等待用戶告訴它統計什麼,這時shell就好象死了一樣,從鍵盤鍵入的所有文本都出現在屏幕上,但並沒有什麼結果,直至按下<ctrl+d>,wc才將命令結果寫在屏幕上。
如果給出一個文件名作為wc命令的參數,如下例所示,wc將返回該文件所包含的行數、單詞數和字符數。
$ wc /etc/passwd
20 23 726 /etc/passwd
$
另一種把/etc/passwd文件內容傳給wc命令的方法是重定向wc的輸入。輸入重定向的一般形式為:命令<文件名。可以用下面的命令把wc命令的輸入重定向為/etc/passwd文件:
$ wc < /etc/passwd
20 23 726
$
另一種輸入重定向稱為here文檔,它告訴shell當前命令的標准輸入來自命令行。here文檔的重定向操作符使用<<。它將一對分隔符(本例中用delim表示)之間的正文重定向輸入給命令。下例將一對分隔符delim之間的正文作為wc命令的輸入,統計出正文的行數、單詞數和字符數。
$ wc<<delim
>this text forms the content
>of the here document,which
>continues until the end of
>text delimter
>delim
4 17 98
在<<操作符後面,任何字符都可以作為正文開始前的分隔符,本例中使用delim作為分隔符。here文檔的正文一直延續到遇見另一個分隔符為止。第二個分隔符應出現在新行的開頭。這時here文檔的正文(不包括開始和結束的分隔符)將重新定向送給命令wc作為它的標准輸入。
由於大多數命令都以參數的形式在命令行上指定輸入文件的文件名,所以輸入重定向並不經常使用。盡管如此,當要使用一個不接受文件名作為輸入參數的命令,而需要的輸入內容又存在一個文件裡時,就能用輸入重定向解決問題。
1. 輸出重定向
輸出重定向是指把命令(或可執行程序)的標准輸出或標准錯誤輸出重新定向到指定文件中。這樣,該命令的輸出就不顯示在屏幕上,而是寫入到指定文件中。
輸出重定向比輸入重定向更常用,很多情況下都可以使用這種功能。例如,如果某個命令的輸出很多,在屏幕上不能完全顯示,那麼將輸出重定向到一個文件中,然後再用文本編輯器打開這個文件,就可以查看輸出信息;如果想保存一個命令的輸出,也可以使用這種方法。還有,輸出重定向可以用於把一個命令的輸出當作另一個命令的輸入(還有一種更簡單的方法,就是使用管道,將在下面介紹)。
輸出重定向的一般形式為:命令>文件名。例如:
$ ls > directory.out
$ cat directory.out
ch1.doc ch2.doc ch3.doc chimp config mail/ test/
$
將ls命令的輸出保存為一個名為directory.out的文件。
注:如果>符號後邊的文件已存在,那麼這個文件將被重寫。
為避免輸出重定向中指定文件只能存放當前命令的輸出重定向的內容,shell提供了輸出重定向的一種追加手段。輸出追加重定向與輸出重定向的功能非常相似,區別僅在於輸出追加重定向的功能是把命令(或可執行程序)的輸出結果追加到指定文件的最後,而該文件原有內容不被破壞。
如果要將一條命令的輸出結果追加到指定文件的後面,可以使用追加重定向操作符>>。形式為:命令>>文件名。例如:
$ ls *.doc>>directory.out
$ cat directory.out
ch1.doc ch2.doc ch3.doc chimp config mail/ test/
ch1.doc ch2.doc ch3.doc
$
和程序的標准輸出重定向一樣,程序的錯誤輸出也可以重新定向。使用符號2>(或追加符號2>>)表示對錯誤輸出設備重定向。例如下面的命令:
$ ls /usr/tmp 2> err.file
可在屏幕上看到程序的正常輸出結果,但又將程序的任何錯誤信息送到文件err.file中,以備將來檢查用。
還可以使用另一個輸出重定向操作符(&>)將標准輸出和錯誤輸出同時送到同一文件中。例如:
$ ls /usr/tmp &> output.file
利用重定向將命令組合在一起,可實現系統單個命令不能提供的新功能。例如使用下面的命令序列:
$ ls /usr/bin > /tmp/dir
$ wc –w < /tmp/dir
459
統計了/usr/bin目錄下的文件個數。
管 道
將一個程序或命令的輸出作為另一個程序或命令的輸入,有兩種方法,一種是通過一個臨時文件將兩個命令或程序結合在一起,例如上個例子中的/tmp/dir文件將ls和wc命令聯在一起;另一種是Linux所提供的管道功能。這種方法比前一種方法更好。
管道可以把一系列命令連接起來,這意味著第一個命令的輸出會作為第二個命令的輸入通過管道傳給第二個命令,第二個命令的輸出又會作為第三個命令的輸入,以此類推。顯示在屏幕上的是管道行中最後一個命令的輸出(如果命令行中未使用輸出重定向)。
通過使用管道符“”來建立一個管道行。用管道重寫上面的例子:
$ ls /usr/binwc -w
1789
再如:
$ cat sample.txtgrep "High"wc -l
管道將cat命令(列出一個文件的內容)的輸出送給grep命令。grep命令在輸入裡查找單詞High,grep命令的輸出則是所有包含單詞High的行,這個輸出又被送給wc命令,wc命令統計出輸入中的行數。假設sample.txt文件的內容如下:
Things to do today:
Low:Go grocery shopping
High:Return movie
High:Clear level 3 in Alien vs. Predator
Medium:Pick up clothes from dry cleaner
那麼該管道行的結果是2。
命令替換
命令替換和重定向有些相似,但區別在於命令替換是將一個命令的輸出作為另外一個命令的參數。常用命令格式為:
command1 `command2`
其中,command2的輸出將作為command1的參數。需要注意的是這裡的`符號,被它括起來的內容將作為命令執行,執行後的結果作為command1的參數。例如:
$ cd `pwd`
該命令將pwd命令列出的目錄作為cd命令的參數,結果仍然是停留在當前目錄下