歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux編程 >> PERL編程

Perl 作為命令行實用程序

  那些將 Perl 用作編程語言的人經常忽視了:Perl 用作命令行操作的快速而又難看的腳本編制引擎時是很有用的。通過命令行,Perl 僅用一行就可以實現大多數其它語言需要數頁代碼才能完成的任務。跟著 Teodor,他會教給您一些有用的示例。  為了完成這一篇 how-to 文章,您需要在系統上安裝 Perl 5.6.0。您的系統最好安裝比較新(2000 或更新)的 Linux 或 Unix,但是其它操作系統也能照樣工作。所有的示例都使用 tcsh shell(盡管 bash 及其它 shell 也能工作)。雖然這些示例也許可以和較早版本的 Perl、Linux 及其它操作系統一起工作,但是如果它們不能一起工作,那麼它們無法工作的原因可以作為練習,讓讀者去解決。  我想說的第一點是:有經驗的程序員不應回避快速而又難看的解決方案。在其它專欄文章中,我已經強調了文檔編制和徹底性。本專欄文章將集中在編程的消極面,其中文檔編制是可選的,而咖啡因卻無從選擇。因為我們已經身陷其中。  第二點和第一點一樣重要:快速而又難看的解決方案很難正確完成。如果您知道如何記錄、測試和調試完整的腳本,那麼您就非常有可能在一行程序中取得成功。如果您不知道怎樣做,那麼這就像是企圖用鲱魚來砍倒紅杉樹(而您的技能就是那條鲱魚)。  第一步,您應該學習 shell 的特性:Unix 將命令行參數傳遞給 Perl 的方式及這些參數的 Perl 解釋方法。  命令行的實質  在 Unix 中您將看到可執行任務的概念,一個進程通常是裝入內存的程序。除了初始進程外,進程都可以由其它進程來啟動,初始進程通常是由內核(有時由內核進程)來啟動的。就用戶的觀點而言,啟動進程需要 shell 或啟動程序。因此,當用戶在 shell 命令行輸入"xeyes"或者從啟動程序菜單(類似於 GNOME 任務欄)選擇 X Eyes 應用程序時,shell 或啟動程序創建新的進程以運行該程序。  進程獲得命令行參數。因此,例如,"perl"和"perl -w"是對同一個程序的兩種不同調用。在內部,Perl(類似於 C)將參數傳遞給它用 @ARGV 數組解釋的腳本。但是和 C 不同的是,Perl 偷偷地從腳本中"竊取"其中一些參數以用於自己的用途。例如,正在解釋的腳本看不到傳給 Perl 解釋器的"-w"參數,除非腳本看來需要它。shell 用空格字符隔開參數。  傳給 Perl 的"-e"參數告訴 Perl 獲取命令行中"-e"後的任何內容並將它當作腳本來運行。"-M"參數表示獲取其後的任何內容並將該內容作為模塊導入,類似於正規腳本中的"use ModuleName"。請參閱 perldoc perlrun 頁面以獲取有關 Perl 必須從命令行提供的開關的更多信息。  可能最好在這裡舉些示例。根據本專欄文章的精神,讓我們使用一行程序。腳本的 -MData:umper -e'print Dumper -@ARGV' 部分只是打印出了 @ARGV 數組的內容。  清單 1. 命令行參數  # at the command line, type each line after the '>'  # and you'll get the output that   # follows it  # print the @ARGV contents with no program arguments  > perl -MData:umper -e'print Dumper \@ARGV'  $VAR1 = [];  # print the @ARGV contents with arguments "a" and "b"  > perl -MData:umper -e'print Dumper \@ARGV' a b   $VAR1 = [  'a',  'b'  ];  # print the @ARGV contents with warnings on, and arguments "a" and "b"  > perl -w -MData:umper -e'print Dumper \@ARGV' a b   $VAR1 = [  'a',  'b'  ];  # print the @ARGV contents with arguments "a", "b", and "-w"  # note how the -w is not stolen by Perl if it follows arguments  # that Perl knows it doesn't want  > perl -MData:umper -e'print Dumper \@ARGV' a b -w  $VAR1 = [  'a',  'b',  '-w'  ];  Here is the final line that includes some   除非您的 shell 限制了參數的數量或長度,不然您可以向 Perl 傳遞任意數量的參數。在 Perl 中打開神奇的文件句柄(filehandle),這會將傳送給 Perl 的每個參數作為文件名打開並逐行讀取每個文件的內容。缺省情況下,$_ 變量會保存每一行。  Shell 使引號之間的所有內容都成為一個參數。這就是為什麼在清單 1 中我們可以寫成 -e'print Dumper \@ARGV' 並且 Perl 可以將其看成單個一行程序腳本的原因。單引號更好,因為使用單引號後您可以在一行程序內使用雙引號。Perl 中的雙引號用於解釋雙引號之間的任何內容。另一個示例或許會有助於進一步說明這一點:  清單 2. 單引號 vs. 雙引號  # print the Perl process ID, followed by a newline  > perl -e'print "$$\n"'  2063  # error: the first two double quotes go together, the rest is passed  # to the script directly  > perl -e"print "$$\n""  BareWord found where operator eXPected at -e line 1, near "1895n"  (Missing operator before n?)  syntax error at -e line 1, next token ???  Execution of -e aborted due to compilation errors.  用 bash 比用 tcsh 要好些,因為 bash 允許內部的雙引號用 \ 字符進行轉義。但是 shell 仍然在將雙引號內的 $$ 傳遞給 Perl 之前對其進行解釋。結論是:不要使用雙引號來指定以 -e 開始的一行程序腳本參數。請參閱 perldoc perlrun 以獲取更多的詳細信息,但是您主要應清楚什麼在系統上有效並堅持下去。  到目前為止您已經了解了 -e 和 -M 開關所起的作用:導入模塊和運行語句。下面我列出了一些有用的其它開關;為了不把您搞糊塗,所以省略了那些更復雜的開關。請參閱 perldoc perlrun 以獲取完整的列表和一些使用想法。  整潔性   -w  打開警告  -Mstrict  打開嚴格編譯指示(pragma)  數據   -0  (這是個零)指定輸入記錄分隔符  -a  將數據分割成名為 @F 的數組  -F   指定分割時 -a 使用的模式(請參閱 perldoc -f split)  -i   在適當的位置編輯文件(請參閱 perldoc perlrun 以獲取大量詳細信息)  -n   使用 將所有 @ARGV 參數當作文件來逐個運行  -p   和 -n 一樣,但是還會打印 $_ 的內容  執行控制   -e  指定字符串以作為腳本(多個字符串迭加)執行  -M  導入模塊  -I  指定目錄以搜索標准位置前的模塊  文件操作  假定您在一個目錄中有一些文件需要用特定的方式重命名。例如,所有包含單詞"aaa"的文件應進行重命名,用單詞"bbb"進行代替。我們將不使用 Unix"mv"命令,因為用 Perl 的 rename() 函數來重命名文件已經相當不錯了(請參閱 perldoc -f rename 以獲取當使用 rename() 出問題時的詳細信息)。  請參閱清單 3 以獲取將文件從 aaa 重命名為 bbb 的一行程序腳本。  find . 命令打印出當前目錄下的所有文件和目錄列表。如果您只想要查看文件,那麼就給 find 添加"-type f"參數。獲取 find 的輸出(一個文件列表)並將其傳遞給一行程序。  一行腳本使用 -ne 參數,該意味著它會被重寫成:  清單 4. 將文件從 aaa 重命名為 bbb(已分解)  while ( )   {  chomp; # trim the newline from the filename  next unless -e; # the filename ($_) must exist  $oldname = $_; # $oldname is now $_  s/aaa/bbb/; # change all "aaa" to "bbb" in $_  next if -e; # the new filename mustn't exist  rename $oldname, $_; # rename the old to the new name  }  正如您所看到的那樣,這是個相當復雜的七行腳本。-n 開關簡化了很多東西。但是盡管如此,您還是必須知道 $_ 變量和 s/// 及 -e 運算符(請參閱 perldoc perlop 頁面以獲取詳細信息)。File::Find 標准 Perl 模塊本來可以代替 Unix find 命令用於進行文件查找,但是腳本也會隨之變得太大而不再是一行程序了。  一行程序巧妙地平衡了有用性和復雜性,您必須准備好在需要時將它們重寫成實際腳本,而不應讓程序過於麻煩而無法控制。  下面是文件處理的另一個示例:用已知的命名結構浏覽 mp3 文件的目錄並抽取專輯名。讓我們假設文件名是"Artist-Album-Track#-Song.mp3"。  清單 5. 查找 Artist-Album-Track#-Song.mp3 的專輯名  > find . -name "*.mp3" perl -pe 's/.\/\w+-(\w+)-.*/$1/' sort uniq  這個腳本非常簡單。它依靠 find 的行為,總是在每個文件名前打印"./"。隨後它僅用專輯名代替 $_,並且 -p 開關自動打印專輯名。最後,按順序的 sort 和 uniq 確保了重復的專輯名只打印一次。所有的 find、sort 和 uniq 調用都可以用 Perl 完成,但是在操作系統已經為我們編寫了這一切時為何還煩惱呢?作為練習這會很有趣,但是實際上一行程序可能會變成 20-30 行不必要的代碼。  讓我們分解 Perl 腳本(用一種簡化的方式 - 省略 -p 開關的一些復雜性):  清單 6. 查找 Artist-Album-Track#-Song.mp3 的專輯名(已分解)  while ( )   {  s/.\/\w+-(\w+)-.*/$1/; # extract the album name into $_  } continue  {  print; # print the album name  }  此外,請注意 Perl 是如何成為 find、sort 和 uniq 之間的中間工具的。不必嘗試用 Perl 編寫所有東西。您可以這麼做,有時也必須這麼做,但一行程序可以重用。還有,看看正則表達式是多麼的簡單。當然,如果 MP3 文件未正確命名,那麼我們可能會獲得一些異常的專輯名,但是這值得去盡力完善正則表




Copyright © Linux教程網 All Rights Reserved