您现在的位置： Linux教程網 >> UnixLinux > >> Linux編程 >> PERL編程

Perl 作為命令行實用程序

　　那些將 Perl 用作編程語言的人經常忽視了：Perl 用作命令行操作的快速而又難看的腳本編制引擎時是很有用的。通過命令行，Perl 僅用一行就可以實現大多數其它語言需要數頁代碼才能完成的任務。跟著 Teodor，他會教給您一些有用的示例。　　為了完成這一篇 how-to 文章，您需要在系統上安裝 Perl 5.6.0。您的系統最好安裝比較新（2000 或更新）的 Linux 或 Unix，但是其它操作系統也能照樣工作。所有的示例都使用 tcsh shell（盡管 bash 及其它 shell 也能工作）。雖然這些示例也許可以和較早版本的 Perl、Linux 及其它操作系統一起工作，但是如果它們不能一起工作，那麼它們無法工作的原因可以作為練習，讓讀者去解決。　　我想說的第一點是：有經驗的程序員不應回避快速而又難看的解決方案。在其它專欄文章中，我已經強調了文檔編制和徹底性。本專欄文章將集中在編程的消極面，其中文檔編制是可選的，而咖啡因卻無從選擇。因為我們已經身陷其中。　　第二點和第一點一樣重要：快速而又難看的解決方案很難正確完成。如果您知道如何記錄、測試和調試完整的腳本，那麼您就非常有可能在一行程序中取得成功。如果您不知道怎樣做，那麼這就像是企圖用鲱魚來砍倒紅杉樹（而您的技能就是那條鲱魚）。　　第一步，您應該學習 shell 的特性：Unix 將命令行參數傳遞給 Perl 的方式及這些參數的 Perl 解釋方法。　　命令行的實質　　在 Unix 中您將看到可執行任務的概念，一個進程通常是裝入內存的程序。除了初始進程外，進程都可以由其它進程來啟動，初始進程通常是由內核（有時由內核進程）來啟動的。就用戶的觀點而言，啟動進程需要 shell 或啟動程序。因此，當用戶在 shell 命令行輸入"xeyes"或者從啟動程序菜單（類似於 GNOME 任務欄）選擇 X Eyes 應用程序時，shell 或啟動程序創建新的進程以運行該程序。　　進程獲得命令行參數。因此，例如，"perl"和"perl -w"是對同一個程序的兩種不同調用。在內部，Perl（類似於 C）將參數傳遞給它用 @ARGV 數組解釋的腳本。但是和 C 不同的是，Perl 偷偷地從腳本中"竊取"其中一些參數以用於自己的用途。例如，正在解釋的腳本看不到傳給 Perl 解釋器的"-w"參數，除非腳本看來需要它。shell 用空格字符隔開參數。　　傳給 Perl 的"-e"參數告訴 Perl 獲取命令行中"-e"後的任何內容並將它當作腳本來運行。"-M"參數表示獲取其後的任何內容並將該內容作為模塊導入，類似於正規腳本中的"use ModuleName"。請參閱 perldoc perlrun 頁面以獲取有關 Perl 必須從命令行提供的開關的更多信息。　　可能最好在這裡舉些示例。根據本專欄文章的精神，讓我們使用一行程序。腳本的 -MData:umper -e'print Dumper -@ARGV' 部分只是打印出了 @ARGV 數組的內容。　　清單 1. 命令行參數　　# at the command line, type each line after the '>'　　# and you'll get the output that 　　# follows it　　# print the @ARGV contents with no program arguments　　> perl -MData:umper -e'print Dumper \@ARGV'　　$VAR1 = [];　　# print the @ARGV contents with arguments "a" and "b"　　> perl -MData:umper -e'print Dumper \@ARGV' a b 　　$VAR1 = [　　'a',　　'b'　　];　　# print the @ARGV contents with warnings on, and arguments "a" and "b"　　> perl -w -MData:umper -e'print Dumper \@ARGV' a b 　　$VAR1 = [　　'a',　　'b'　　];　　# print the @ARGV contents with arguments "a", "b", and "-w"　　# note how the -w is not stolen by Perl if it follows arguments　　# that Perl knows it doesn't want　　> perl -MData:umper -e'print Dumper \@ARGV' a b -w　　$VAR1 = [　　'a',　　'b',　　'-w'　　];　　Here is the final line that includes some 　　除非您的 shell 限制了參數的數量或長度，不然您可以向 Perl 傳遞任意數量的參數。在 Perl 中打開神奇的文件句柄（filehandle），這會將傳送給 Perl 的每個參數作為文件名打開並逐行讀取每個文件的內容。缺省情況下，$_ 變量會保存每一行。　　Shell 使引號之間的所有內容都成為一個參數。這就是為什麼在清單 1 中我們可以寫成 -e'print Dumper \@ARGV' 並且 Perl 可以將其看成單個一行程序腳本的原因。單引號更好，因為使用單引號後您可以在一行程序內使用雙引號。Perl 中的雙引號用於解釋雙引號之間的任何內容。另一個示例或許會有助於進一步說明這一點：　　清單 2. 單引號 vs. 雙引號　　# print the Perl process ID, followed by a newline　　> perl -e'print "$$\n"'　　2063　　# error: the first two double quotes go together, the rest is passed　　# to the script directly　　> perl -e"print "$$\n""　　BareWord found where operator eXPected at -e line 1, near "1895n"　　(Missing operator before n?)　　syntax error at -e line 1, next token ???　　Execution of -e aborted due to compilation errors.　　用 bash 比用 tcsh 要好些，因為 bash 允許內部的雙引號用 \ 字符進行轉義。但是 shell 仍然在將雙引號內的 $$ 傳遞給 Perl 之前對其進行解釋。結論是：不要使用雙引號來指定以 -e 開始的一行程序腳本參數。請參閱 perldoc perlrun 以獲取更多的詳細信息，但是您主要應清楚什麼在系統上有效並堅持下去。　　到目前為止您已經了解了 -e 和 -M 開關所起的作用：導入模塊和運行語句。下面我列出了一些有用的其它開關；為了不把您搞糊塗，所以省略了那些更復雜的開關。請參閱 perldoc perlrun 以獲取完整的列表和一些使用想法。　　整潔性　　-w　　打開警告　　-Mstrict　　打開嚴格編譯指示（pragma）　　數據　　-0　　（這是個零）指定輸入記錄分隔符　　-a　　將數據分割成名為 @F 的數組　　-F 　　指定分割時 -a 使用的模式（請參閱 perldoc -f split）　　-i 　　在適當的位置編輯文件（請參閱 perldoc perlrun 以獲取大量詳細信息）　　-n 　　使用將所有 @ARGV 參數當作文件來逐個運行　　-p 　　和 -n 一樣，但是還會打印 $_ 的內容　　執行控制　　-e　　指定字符串以作為腳本（多個字符串迭加）執行　　-M　　導入模塊　　-I　　指定目錄以搜索標准位置前的模塊　　文件操作　　假定您在一個目錄中有一些文件需要用特定的方式重命名。例如，所有包含單詞"aaa"的文件應進行重命名，用單詞"bbb"進行代替。我們將不使用 Unix"mv"命令，因為用 Perl 的 rename() 函數來重命名文件已經相當不錯了（請參閱 perldoc -f rename 以獲取當使用 rename() 出問題時的詳細信息）。　　請參閱清單 3 以獲取將文件從 aaa 重命名為 bbb 的一行程序腳本。　　find . 命令打印出當前目錄下的所有文件和目錄列表。如果您只想要查看文件，那麼就給 find 添加"-type f"參數。獲取 find 的輸出（一個文件列表）並將其傳遞給一行程序。　　一行腳本使用 -ne 參數，該意味著它會被重寫成：　　清單 4. 將文件從 aaa 重命名為 bbb（已分解）　　while ( ) 　　{　　chomp; # trim the newline from the filename　　next unless -e; # the filename ($_) must exist　　$oldname = $_; # $oldname is now $_　　s/aaa/bbb/; # change all "aaa" to "bbb" in $_　　next if -e; # the new filename mustn't exist　　rename $oldname, $_; # rename the old to the new name　　}　　正如您所看到的那樣，這是個相當復雜的七行腳本。-n 開關簡化了很多東西。但是盡管如此，您還是必須知道 $_ 變量和 s/// 及 -e 運算符（請參閱 perldoc perlop 頁面以獲取詳細信息）。File::Find 標准 Perl 模塊本來可以代替 Unix find 命令用於進行文件查找，但是腳本也會隨之變得太大而不再是一行程序了。　　一行程序巧妙地平衡了有用性和復雜性，您必須准備好在需要時將它們重寫成實際腳本，而不應讓程序過於麻煩而無法控制。　　下面是文件處理的另一個示例：用已知的命名結構浏覽 mp3 文件的目錄並抽取專輯名。讓我們假設文件名是"Artist-Album-Track#-Song.mp3"。　　清單 5. 查找 Artist-Album-Track#-Song.mp3 的專輯名　　> find . -name "*.mp3" perl -pe 's/.\/\w+-(\w+)-.*/$1/' sort uniq　　這個腳本非常簡單。它依靠 find 的行為，總是在每個文件名前打印"./"。隨後它僅用專輯名代替 $_，並且 -p 開關自動打印專輯名。最後，按順序的 sort 和 uniq 確保了重復的專輯名只打印一次。所有的 find、sort 和 uniq 調用都可以用 Perl 完成，但是在操作系統已經為我們編寫了這一切時為何還煩惱呢？作為練習這會很有趣，但是實際上一行程序可能會變成 20-30 行不必要的代碼。　　讓我們分解 Perl 腳本（用一種簡化的方式－省略 -p 開關的一些復雜性）：　　清單 6. 查找 Artist-Album-Track#-Song.mp3 的專輯名（已分解）　　while ( ) 　　{　　s/.\/\w+-(\w+)-.*/$1/; # extract the album name into $_　　} continue　　{　　print; # print the album name　　}　　此外，請注意 Perl 是如何成為 find、sort 和 uniq 之間的中間工具的。不必嘗試用 Perl 編寫所有東西。您可以這麼做，有時也必須這麼做，但一行程序可以重用。還有，看看正則表達式是多麼的簡單。當然，如果 MP3 文件未正確命名，那麼我們可能會獲得一些異常的專輯名，但是這值得去盡力完善正則表

上一篇文章：通過 Perl 存取 mSQL 和 MySQL 的內容
下一篇文章：各種平台下Perl模塊的安裝方法完全版

PERL編程