您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> Linux技術

gcc編譯程序的四個階段（預處理

相關博客/content/9388052.html
相關博客http://blog.sina.com.cn/s/blog_5ff8e88e01015tga.html
gcc的編譯流程分為四個步驟，分別為：
・預處理（Pre-Processing）
・編譯（Compiling）
・匯編（Assembling）
・鏈接（Linking）
下面就具體來查看一下gcc是如何完成四個步驟的。
hello.c源代碼
#include<stdio.h>
int main()
{
printf("Hello World!\n");
return 0;
}
（1）預處理階段
在該階段，編譯器將上述代碼中的stdio.h編譯進來，並且用戶可以使用gcc的選項”-E”進行查看，該選項的作用是讓gcc在預處理結束後停止編譯過程。
《深入理解計算機系統》中是這麼說的：
預處理器（cpp）根據以字符#開頭的命令（directives），修改原始的C程序。如hello.c中#include <stdio.h>指令告訴預處理器讀系統頭文件stdio.h的內容，並把它直接插入到程序文本中去。結果就得到另外一個C程序，通常是以.i作為文件擴展名的。
注意：
Gcc指令的一般格式為：Gcc [選項] 要編譯的文件 [選項] [目標文件]
其中，目標文件可缺省，Gcc默認生成可執行的文件名為：編譯文件.out
[gan@localhost gcc]# gcc –E hello.c –o hello.i
選項”-o”是指目標文件，”.i”文件為已經過預處理的C原始程序。以下列出了hello.i文件的部分內容：
typedef int (*__gconv_trans_fct) (struct __gconv_step *,
struct __gconv_step_data *, void *,
__const unsigned char *,
__const unsigned char **,
__const unsigned char *, unsigned char **,
size_t *);
…
# 2 "hello.c" 2
int main()
{
printf("Hello World!\n");
return 0;
}
由此可見，gcc確實進行了預處理，它把”stdio.h”的內容插入到hello.i文件中。
（2）編譯階段
接下來進行的是編譯階段，在這個階段中，Gcc首先要檢查代碼的規范性、是否有語法錯誤等，以確定代碼的實際要做的工作，在檢查無誤後，Gcc把代碼翻譯成匯編語言。用戶可以使用”-S”選項來進行查看，該選項只進行編譯而不進行匯編，生成匯編代碼。匯編語言是非常有用的，它為不同高級語言不同編譯器提供了通用的語言。如：C編譯器和Fortran編譯器產生的輸出文件用的都是一樣的匯編語言。
[gan@localhost gcc]# gcc –S hello.i –o hello.s
以下列出了hello.s的內容，可見Gcc已經將其轉化為匯編了，感興趣的讀者可以分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。
.file "hello.c"
.section .rodata
.align 4
.LC0:
.string "Hello World!"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax
addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0
call puts
addl $16, %esp
movl $0, %eax
leave
ret
.size main, .-main
.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
.section .note.GNU-stack,"",@progbits
（3）匯編階段
匯編階段是把編譯階段生成的”.s”文件轉成目標文件，讀者在此可使用選項”-c”就可看到匯編代碼已轉化為”.o”的二進制目標代碼了。如下所示：
[gan@localhost gcc]# gcc –c hello.s –o hello.o
（4）鏈接階段
在成功編譯之後，就進入了鏈接階段。在這裡涉及到一個重要的概念：函數庫。
讀者可以重新查看這個小程序，在這個程序中並沒有定義”printf”的函數實現，且在預編譯中包含進的”stdio.h”中也只有該函數的聲明，而沒有定義函數的實現，那麼，是在哪裡實現”printf”函數的呢？最後的答案是：系統把這些函數實現都被做到名為libc.so.6的庫文件中去了，在沒有特別指定時，gcc會到系統默認的搜索路徑”/usr/lib”下進行查找，也就是鏈接到libc.so.6庫函數中去，這樣就能實現函數”printf”了，而這也就是鏈接的作用。
函數庫一般分為靜態庫和動態庫兩種。靜態庫是指編譯鏈接時，把庫文件的代碼全部加入到可執行文件中，因此生成的文件比較大，但在運行時也就不再需要庫文件了。其後綴名一般為”.a”。動態庫與之相反，在編譯鏈接時並沒有把庫文件的代碼加入到可執行文件中，而是在程序執行時由運行時鏈接文件加載庫，這樣可以節省系統的開銷。動態庫一般後綴名為”.so”，如前面所述的libc.so.6就是動態庫。gcc在編譯時默認使用動態庫。
完成了鏈接之後，gcc就可以生成可執行文件，如下所示。
[gan@localhost gcc]# gcc hello.o –o hello
運行該可執行文件，出現正確的結果如下。
[root@localhost Gcc]# ./hello
Hello World!

上一篇文章：文件目錄類命令：Linux的五個查找命令
下一篇文章：初識gcc編譯過程

Linux技術

用GCC進行程序的編譯

Gcc編譯C程序常用選項

Linux下GCC編譯C源程序

GCC 編譯報錯：程序中有游離的 \357’ \273’ \277’

gcc 動態編譯

GCC編譯過程

GCC編譯器編譯鏈接，gcc編譯器編譯

用gcc進行程序的編譯，gcc進行程序編譯