您现在的位置： Linux教程網 >> UnixLinux > >> Linux綜合 >> Linux資訊 >> 更多Linux

gcc 簡介

　手機參與本節學習GNU推出的Linux系統下C編譯器——gcc，主要介紹這種編譯器的基本原理和使用方法，以及編譯過程中所產生的錯誤的原因及對策。 gcc簡介 Linux系統下的gcc（GNU C Compiler）是GNU推出的功能強大、性能優越的多平台編譯器，是GNU的代表作品之一。gcc是可以在多種硬件平台上編譯出可執行程序的超級編譯器，其執行效率與一般的編譯器相比平均效率要高20%~30%。 gcc編譯器能將C、C++語言源程序、匯程序化序和目標程序編譯、連接成可執行文件，如果沒有給出可執行文件的名字，gcc將生成一個名為a.out的文件。在Linux系統中，可執行文件沒有統一的後綴，系統從文件的屬性來區分可執行文件和不可執行文件。而gcc則通過後綴來區別輸入文件的類別，下面我們來介紹gcc所遵循的部分約定規則。 .c為後綴的文件，C語言源代碼文件； .a為後綴的文件，是由目標文件構成的檔案庫文件； .C，.cc或.cxx 為後綴的文件，是C++源代碼文件； .h為後綴的文件，是程序所包含的頭文件； .i 為後綴的文件，是已經預處理過的C源代碼文件； .ii為後綴的文件，是已經預處理過的C++源代碼文件； .m為後綴的文件，是Objective-C源代碼文件； .o為後綴的文件，是編譯後的目標文件； .s為後綴的文件，是匯編語言源代碼文件； .S為後綴的文件，是經過預編譯的匯編語言源代碼文件。 gcc的執行過程雖然我們稱gcc是C語言的編譯器，但使用gcc由C語言源代碼文件生成可執行文件的過程不僅僅是編譯的過程，而是要經歷四個相互關聯的步驟：預處理(也稱預編譯，Preprocessing)、編譯(Compilation)、匯編(Assembly)和連接(Linking)。命令gcc首先調用cpp進行預處理，在預處理過程中，對源代碼文件中的文件包含(include)、預編譯語句(如宏定義define等)進行分析。接著調用cc1進行編譯，這個階段根據輸入文件生成以.o為後綴的目標文件。匯編過程是針對匯編語言的步驟，調用as進行工作，一般來講，.S為後綴的匯編語言源代碼文件和匯編、.s為後綴的匯編語言文件經過預編譯和匯編之後都生成以.o為後綴的目標文件。當所有的目標文件都生成之後，gcc就調用ld來完成最後的關鍵性工作，這個階段就是連接。在連接階段，所有的目標文件被安排在可執行程序中的恰當的位置，同時，該程序所調用到的庫函數也從各自所在的檔案庫中連到合適的地方。 gcc的基本用法和選項在使用gcc編譯器的時候，我們必須給出一系列必要的調用參數和文件名稱。gcc編譯器的調用參數大約有100多個，其中多數參數我們可能根本就用不到，這裡只介紹其中最基本、最常用的參數。 gcc最基本的用法是：gcc [options] [filenames] 其中options就是編譯器所需要的參數，filenames給出相關的文件名稱。 -c，只編譯，不連接成為可執行文件，編譯器只是由輸入的.c等源代碼文件生成.o為後綴的目標文件，通常用於編譯不包含主程序的子程序文件。 -o output_filename，確定輸出文件的名稱為output_filename，同時這個名稱不能和源文件同名。如果不給出這個選項，gcc就給出預設的可執行文件a.out。 -g，產生符號調試工具(GNU的gdb)所必要的符號信息，要想對源代碼進行調試，我們就必須加入這個選項。 -O，對程序進行優化編譯、連接，采用這個選項，整個源代碼會在編譯、連接過程中進行優化處理，這樣產生的可執行文件的執行效率可以提高，但是，編譯、連接的速度就相應地要慢一些。 -O2，比-O更好的優化編譯、連接，當然整個編譯、連接過程會更慢。 -Idirname，將dirname所指出的目錄加入到程序頭文件目錄列表中，是在預編譯過程中使用的參數。C程序中的頭文件包含兩種情況： A)#include B)#include “myinc.h” 其中，A類使用尖括號(< >)，B類使用雙引號(“ ”)。對於A類，預處理程序cpp在系統預設包含文件目錄(如/usr/include)中搜尋相應的文件，而對於B類，cpp在當前目錄中搜尋頭文件，這個選項的作用是告訴cpp，如果在當前目錄中沒有找到需要的文件，就到指定的dirname目錄中去尋找。在程序設計中，如果我們需要的這種包含文件分別分布在不同的目錄中，就需要逐個使用-I選項給出搜索路徑。 -Ldirname，將dirname所指出的目錄加入到程序函數檔案庫文件的目錄列表中，是在連接過程中使用的參數。在預設狀態下，連接程序ld在系統的預設路徑中(如/usr/lib)尋找所需要的檔案庫文件，這個選項告訴連接程序，首先到-L指定的目錄中去尋找，然後到系統預設路徑中尋找，如果函數庫存放在多個目錄下，就需要依次使用這個選項，給出相應的存放目錄。 -lname，在連接時，裝載名字為“libname.a”的函數庫，該函數庫位於系統預設的目錄或者由-L選項確定的目錄下。例如，-lm表示連接名為“libm.a”的數學函數庫。上面我們簡要介紹了gcc編譯器最常用的功能和主要參數選項，更為詳盡的資料可以參看Linux系統的聯機幫助。假定我們有一個程序名為test.c的C語言源代碼文件，要生成一個可執行文件，最簡單的辦法就是： gcc test.c 這時，預編譯、編譯連接一次完成，生成一個系統預設的名為a.out的可執行文件，對於稍為復雜的情況，比如有多個源代碼文件、需要連接檔案庫或者有其它比較特別的要求，就要給定適當的調用選項參數。再看一個簡單的例子。整個源代碼程序由兩個文件testmain.c 和testsub.c組成，程序中使用了系統提供的數學庫，同時希望給出的可執行文件為test，這時的編譯命令可以是： gcc testmain.c testsub.c –lm –o test 其中，-lm表示連接系統的數學庫libm.a，這個過程可以用圖12-1框圖描述。 gcc的錯誤類型及對策 gcc編譯器如果發現源程序中有錯誤，就無法繼續進行，也無法生成最終的可執行文件。為了便於修改，gcc給出錯誤信息，我們必須對這些錯誤信息逐個進行分析、處理，並修改相應的語言，才能保證源代碼的正確編譯連接。gcc給出的錯誤信息一般可以分為四大類，下面我們分別討論其產生的原因和對策。第一類：C語法錯誤錯誤信息：文件source.c中第n行有語法錯誤(syntex errror)。這種類型的錯誤，一般都是C語言的語法錯誤，應該仔細檢查源代碼文件中第n行及該行之前的程序，有時也需要對該文件所包含的頭文件進行檢查。有些情況下，一個很簡單的語法錯誤，gcc會給出一大堆錯誤，我們最主要的是要保持清醒的頭腦，不要被其嚇倒，必要的時候再參考一下C語言的基本教材。第二類：頭文件錯誤錯誤信息：找不到頭文件head.h(Can not find include file head.h)。這類錯誤是源代碼文件中的包含頭文件有問題，可能的原因有頭文件名錯誤、指定的頭文件所在目錄名錯誤等，也可能是錯誤地使用了雙引號和尖括號。第三類：檔案庫錯誤錯誤信息：連接程序找不到所需的函數庫，例如： ld: -lm: No sUCh file or Directory 這類錯誤是與目標文件相連接的函數庫有錯誤，可能的原因是函數庫名錯誤、指定的函數庫所在目錄名稱錯誤等，檢查的方法是使用find命令在可能的目錄中尋找相應的函數庫名，確定檔案庫及目錄的名稱並修改程序中及編譯選項中的名稱。第四類：未定義符號錯誤信息：有未定義的符號(Undefined symbol)。這類錯誤是在連接過程中出現的，可能有兩種原因：一是使用者自己定義的函數或者全局變量所在源代碼文件，沒有被編譯、連接，或者干脆還沒有定義，這需要使用者根據實際情況修改源程序，給出全局變量或者函數的定義體；二是未定義的符號是一個標准的庫函數，在源程序中使用了該庫函數，而連接過程中還沒有給定相應的函數庫的名稱，或者是該檔案庫的目錄名稱有問題，這時需要使用檔案庫維護命令ar檢查我們需要的庫函數到底位於哪一個函數庫中，確定之後，修改gcc連接選項中的-l和-L項。排除編譯、連接過程中的錯誤，應該說這只是程序設計中最簡單、最基本的一個步驟，可以說只是開了個頭。這個過程中的錯誤，只是我們在使用C語言描述一個算法中所產生的錯誤，是比較容易排除的。我們寫一個程序，到編譯、連接通過為止，應該說剛剛開始，程序在運行過程中所出現的問題，是算法設計有問題，說得更玄點是對問題的認識和理解不夠，還需要更加深入地測試、調試和修改。一個程序，稍為復雜的程序，往往要經過多次的編譯、連接和測試、修改。下面我們學習的程序維護、調試工具和版本維護就是在程序調試、測試過程中使用的，用來解決調測階段所出現的問題。

上一篇文章： Linux告別低價“國情”神話認清TCO真相
下一篇文章： mount使用指南