基本概念
庫有動態與靜態兩種,動態通常用.so為後綴,靜態用.a為後綴。
例如:libhello.so libhello.a 為了在同一系統中使用不同版本的庫,可以在庫文件名後加上版本號為後綴,例如: libhello.so.1.0,由於程序連接默認以.so為文件後綴名。所以為了使用這些庫,通常使用建立符號連接的方式。 ln -s libhello.so.1.0 libhello.so.1 ln -s libhello.so.1 libhello.so
1、使用庫
當要使用靜態的程序庫時,連接器會找出程序所需的函數,然後將它們拷貝到執行文件,由於這種拷貝是完整的,所以一旦連接成功,靜態程序庫也就不再需要了。然 而,對動態庫而言,就不是這樣。動態庫會在執行程序內留下一個標記指明當程序執行時,首先必須載入這個庫。由於動態庫節省空間,linux下進行連接的缺省操作是首先連接動態庫,也就是說,如果同時存在靜態和動態庫,不特別指定的話,將與動態庫相連接。 現在假設有一個叫hello的程序開發包,它提供一個靜態庫libhello.a 一個動態庫libhello.so,一個頭文件hello.h,頭文件中提供sayhello()這個函數 /* hello.h */ void sayhello(); 另外還有一些說明文檔。
這一個典型的程序開發包結構 與動態庫連接 linux默認的就是與動態庫連接,下面這段程序testlib.c使用hello庫中的sayhello()函數
/*testlib.c*/
#include
#include
int main() { sayhello(); return 0; }
使用如下命令進行編譯 $gcc -c testlib.c -o testlib.o
用如下命令連接: $gcc testlib.o -lhello -o testlib
連接時要注意,假設libhello.o 和libhello.a都在缺省的庫搜索路徑下/usr/lib下,如果在其它位置要加上-L參數 與與靜態庫連接麻煩一些,主要是參數問題。還是上面的例子: $gcc testlib.o -o testlib -WI,-Bstatic -lhello 注:這個特別的"-WI,-Bstatic"參數,實際上是傳給了連接器ld. 指示它與靜態庫連接,如果系統中只有靜態庫當然就不需要這個參數了。 如果要和多個庫相連接,而每個庫的連接方式不一樣,比如上面的程序既要和libhello進行靜態連接,又要和libbye進行動態連接,其命令應為: $gcc testlib.o -o testlib -WI,-Bstatic -lhello -WI,-Bdynamic -lbye
2、動態庫的路徑問題 為了讓執行程序順利找到動態庫,有三種方法:
(1)把庫拷貝到/usr/lib和/lib目錄下。
(2)在LD_LIBRARY_PATH環境變量中加上庫所在路徑。例如動態庫libhello.so在/home/ting/lib目錄下,以bash為例,使用命令: $export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/ting/lib
(3) 修改/etc/ld.so.conf文件,把庫所在的路徑加到文件末尾,並執行ldconfig刷新。這樣,加入的目錄下的所有庫文件都可見。
3、查看庫中的符號
有時候可能需要查看一個庫中到底有哪些函數,nm命令可以打印出庫中的涉及到的所有符號。庫既可以是靜態的也可以是動態的。nm列出的符號有很多,常見的有 三種,一種是在庫中被調用,但並沒有在庫中定義(表明需要其他庫支持),用U表示;一種是庫中定義的函數,用T表示,這是最常見的;另外一種是所謂的“弱 態”符號,它們雖然在庫中被定義,但是可能被其他庫中的同名符號覆蓋,用W表示。例如,假設開發者希望知道上文提到的hello庫中是否定義了 printf():
$nm libhello.so |grep printf U
其中printf U表示符號printf被引用,但是並沒有在函數內定義,由此可以推斷,要正常使用hello庫,必須有其它庫支持,再使用ldd命令查看hello依賴於哪些庫:
$ldd hello libc.so.6=>/lib/libc.so.6(0x400la000) /lib/ld-linux.so.2=>/lib/ld-linux.so.2 (0x40000000) 從上面的結果可以繼續查看printf最終在哪裡被定義,有興趣可以go on
4、生成庫
第一步要把源代碼編繹成目標代碼。以下面的代碼為例,生成上面用到的hello庫: /* hello.c */ #include void sayhello() { printf("hello,world "); } 用gcc編繹該文件,在編繹時可以使用任何全法的編繹參數,例如-g加入調試代碼等: gcc -c hello.c -o hello.o 1.連接成靜態庫 連接成靜態庫使用ar命令,其實ar是archive的意思 $ar cqs libhello.a hello.o 2.連接成動態庫 生成動態庫用gcc來完成,由於可能存在多個版本,因此通常指定版本號: $gcc -shared -Wl,-soname,libhello.so.1 -o libhello.so.1.0 hello.o 另外再建立兩個符號連接: $ln -s libhello.so.1.0 libhello.so.1 $ln -s libhello.so.1 libhello.so 這樣一個libhello的動態連接庫就生成了。最重要的是傳gcc -shared 參數使其生成是動態庫而不是普通執行程序。 -Wl 表示後面的參數也就是-soname,libhello.so.1直接傳給連接器ld進行處理。實際上,每一個庫都有一個soname,當連接器發現它正 在查找的程序庫中有這樣一個名稱,連接器便會將soname嵌入連結中的二進制文件內,而不是它正在運行的實際文件名,在程序執行期間,程序會查找擁有 soname名字的文件,而不是庫的文件名,換句話說,soname是庫的區分標志。 這樣做的目的主要是允許系統中多個版本的庫文件共存,習慣上在命名庫文件的時候通常與soname相同 libxxxx.so.major.minor 其中,xxxx是庫的名字,major是主版本號,minor 是次版本號
總結
通過對LINUX庫工作的分析,我們已經可以理解程序運行時如何去別的地方尋找“庫”,在下一篇文章中我繼續研究可執行程序的執行過程,這兩天在寫一個服務器上的腳本,快成功了。花在Linux上的時間明顯少了點,等過兩天把這個小程序開發完畢以後馬上轉回正行