Python 是一種用於快速開發軟件的編程語言,它的語法比較簡單,易於掌握,但存在執行速度慢的問題,並且在處理某些問題時存在不足,如對計算機硬件系統的訪問,對媒體文件的訪問等。而作為軟件開發的傳統編程語言 C 語言,卻能在這些問題上很好地彌補 Python 語言的不足。因此,本文通過實例研究如何在 Python 程序中整合既有的 C 語言模塊,包括用 C 語言編寫的源程序和動態鏈接庫等,從而充分發揮 Python 語言和 C 語言各自的優勢。
Python 是一種用於快速開發軟件的編程語言,它的語法比較簡單,易於掌握,但存在執行速度慢的問題,並且在處理某些問題時存在不足,如對計算機硬件系統的訪問,對媒體文件的訪問等。而作為軟件開發的傳統編程語言—— C 語言,卻能在這些問題上很好地彌補 Python 語言的不足。因此,本文通過實例研究如何在 Python 程序中整合既有的 C 語言模塊,包括用 C 語言編寫的源程序和動態鏈接庫等,從而充分發揮 Python 語言和 C 語言各自的優勢。
Python 作為一門程序開發語言,被越來越多地運用到快速程序開發。Python 是一種解釋型的,互動的,面向對象的編程語言,它包含了模塊化的操作,異常處理,動態資料形態,以及類型的使用。它的語法表達優美易讀,具有很多優秀的腳本語言的特點:解釋的,面向對象的,內建的高級數據結構,支持模塊和包,支持多種平台,可擴展。而且它還支持交互式方式運行,圖形方式運行。它擁有眾多的編程界面支持各種操作系統平台以及眾多的各類函數庫,利用 C 和 C++ 可以對它進行擴充。
C 語言作為最受人們歡迎的語言之一,有廣泛的發展基礎。簡潔緊湊、靈活方便,功能強大是其特點。另外,C 語言是一門中級語言。它把高級語言的基本結構和語句與低級語言的實用性結合起來。由於可以直接訪問物理地址,可以方便的對硬件進行操作。因此,很多的系統軟件都是由 C 語言編寫。
為了節省軟件開發成本,軟件開發人員希望能夠縮短的軟件的開發時間,希望能夠在短時間內開發出穩定的產品。Python 功能強大,簡單易用,能夠快速開發應用軟件。但是由於 Python 自身執行速度的局限性,對性能要求比較高的模塊需要使用效率更高的程序語言進行開發,例如 C 語言,系統的其他模塊運用 Python 進行快速開發,最後將 C 語言開發的模塊與 Python 開發的模塊進行整合。在此背景下,基於 Python 語言與 C 語言的各自特點,用 C 語言來擴展現有的 Python 程序,顯得很有意義。本文首先介紹幾種常用的整合 Python 程序與 C 語言程序的方法,最後給出相應的實例。
ctypes 是 Python 的一個標准模塊,它包含在 Python2.3 及以上的版本裡。ctypes 是一個 Python 的高級外部函數接口,它使得 Python 程序可以調用 C 語言編譯的靜態鏈接庫和動態鏈接庫。運用 ctypes 模塊,能夠在 Python 源程序中創建,訪問和操作簡單的或復雜的 C 語言數據類型。最為重要的是 ctypes 模塊能夠在多個平台上工作,包括 Windows,Windows CE,Mac OS X,Linux,Solaris,FreeBSD,OpenBSD。
接下來通過幾個簡單的例子來看一下 ctypes 模塊如何整合 Python 程序和 C 程序。
利用 Python 本身提供的 ctypes 模塊可以使 Python 語言和 C 語言在源代碼層面上進行整合。本節介紹了如何通過使用 ctypes 庫,在 Python 程序中可以定義類似 C 語言的變量。
下表列出了 ctypes 變量類型,C 語言變量類型和 Python 語言變量類型之間的關系:
表 1 中的第一列是在 ctypes 庫中定義的變量類型,第二列是 C 語言定義的變量類型,第三列是 Python 語言在不使用 ctypes 時定義的變量類型。
舉例:
>>> from ctypes import * # 導入 ctypes 庫中所有模塊 >>> i = c_int(45) # 定義一個 int 型變量,值為 45 >>> i.value # 打印變量的值 45 >>> i.value = 56 # 改變該變量的值為 56 >>> i.value # 打印變量的新值 56
從下面的例子可以更明顯地看出 ctypes 裡的變量類型和 C 語言變量類型的相似性:
>>> p = create_string_buffer(10) # 定義一個可變字符串變量,長度為 10 >>> p.raw # 初始值是全 0,即 C 語言中的字符串結束符’ \0 ’ '\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00' >>> p.value = "Student" # 字符串賦值 >>> p.raw # 後三個字符仍是’ \0 ’ 'Student\x00\x00\x00' >>> p.value = "Big" # 再次賦值 >>> p.raw # 只有前三個字符被修改,第四個字符被修改為’ \0 ’ 'Big\x00ent\x00\x00\x00'
下面例子說明了指針操作:
>>> i = c_int(999) # 定義 int 類型變量 i,值為 999 >>> pi = pointer(i) # 定義指針,指向變量 i >>> pi.contents # 打印指針所指的內容 c_long(999) >>> pi.contents = c_long(1000) # 通過指針改變變量 i 的值 >>> pi.contents # 打印指針所指的內容 c_long(1000)
下面例子說明了結構和數組的操作:
>>> class POINT(Structure): # 定義一個結構,內含兩個成員變量 x,y,均為 int 型 ... _fields_ = [("x", c_int), ... ("y", c_int)] ... >>> point = POINT(2,5) # 定義一個 POINT 類型的變量,初始值為 x=2, y=5 >>> print point.x, point.y # 打印變量 2 5 >>> point = POINT(y=5) # 重新定義一個 POINT 類型變量,x 取默認值 >>> print point.x, point.y # 打印變量 0 5 >>> POINT_ARRAY = POINT * 3 # 定義 POINT_ARRAY 為 POINT 的數組類型 # 定義一個 POINT 數組,內含三個 POINT 變量 >>> pa = POINT_ARRAY(POINT(7, 7), POINT(8, 8), POINT(9, 9)) >>> for p in pa: print p.x, p.y # 打印 POINT 數組中每個成員的值 ... 7 7 8 8 9 9
通過 ctypes 模塊,Python 程序可以訪問 C 語言編譯的 dll,本節通過一個簡單的例子,Python 程序 helloworld.py 中調用 some.dll 中的 helloworld 函數,來介紹 Python 程序如何調用 windows 平台上的 dll。
from ctypes import windll # 首先導入 ctypes 模塊的 windll 子模塊 somelibc = windll.LoadLibrary(some.dll) # 使用 windll 模塊的 LoadLibrary 導入動態鏈接庫
somelibc. helloworld() # 這樣就可以得到 some.dll 的 helloworld 的返回值。
整個 helloworld.py 是這樣的:
from ctypes import windll def callc(): # load the some.dll somelibc = windll.LoadLibrary(some.dll) print somelibc. helloworld() if __name__== “__main__”: callc()
在命令行運行 helloworld.py,在 console 上可以看到 some.dll 中 helloworld 的輸出。
C:\>python C:\python\test\helloworld.py Hello World! Just a simple test.
通過 ctypes 模塊,Python 程序也可以訪問 C 語言編譯的 so 文件。與 Python 調用 C 的 dll 的方法基本相同,本節通過一個簡單的例子,Python 程序 helloworld.py 中調用 some.so 中的 helloworld 函數,來介紹 Python 程序如何調用 linux 平台上的 so。
from ctypes import cdll # 首先導入 ctypes 模塊的 cdll 子模塊,注意 linux 平台上使用 cdll 的,而不是 windll。 somelibc = cdll.LoadLibrary(“./some.so”) # 使用 cdll 模塊的 LoadLibrary 導入動態鏈接庫
somelibc. helloworld() # 使用方法與 windows 平台上是一樣的。
整個 helloworld.py 是這樣的:
from ctypes import cdll def callc(): # load the some.so somelibc = cdll.LoadLibrary(some.so) print somelibc. helloworld() if __name__== “__main__”: callc()
在命令行運行 helloworld.py,在 linux 標准輸出上可以看到 some.so 中 helloworld 的輸出。
[root@linux-790t] python ./helloworld.py Hello World! Just a simple test.
以下我們舉例用 Python 來實現一個小工具,用來實現 hash 算法,查看文件的校驗和(MD5,CRC,SHA1 等等)。通過查看文件的校驗和,可以知道文件在傳輸過程中是否被破壞或篡改。
Hash,一般翻譯做“散列”,也有直接音譯為"哈希"的,就是把任意長度的輸入(又叫做預映射,pre-image),通過散列算法,變換成固定長度的輸出,該輸出就是散列值。這種轉換是一種壓縮映射,也就是,散列值的空間通常遠小於輸入的空間,不同的輸入可能會散列成相同的輸出,而不可能從散列值來唯一的確定輸入值。簡單的說就是一種將任意長度的消息壓縮到某一固定長度的消息摘要的函數。
由於相對 C 語言來說,Python 的運行效率較低,因此我們的 Python 小工具利用一個已有的 C 語言的動態鏈接庫 (hashtcalc.dll) 來實現我們的程序。本例中,我們運用 wxPython 編寫簡單的 GUI 界面,通過 python 調用 hashtcalc.dll 的接口計算文件的校驗和,然後輸出在界面上。
函數名:calc_CRC32
函數:char* calc_CRC32(char *filename);
參數:文件名
返回值:字符串
說明:該函數對輸入的文件內容進行計算,並且返回它的 CRC32
函數名:calc_MD5
函數:char* calc_MD5(char *filename);
參數:文件名
返回值:字符串
說明:該函數對輸入的文件內容進行計算,並且返回它的 MD5
函數名:calc_SHA1
函數:char* calc_SHA1 (char *filename);
參數:文件名
返回值:字符串
說明:該函數對輸入的文件內容進行計算,並且返回它的 SHA1
HashcalcAdapter.py 實現了一個 python 的 class HashcalcAdapter,HashcalcAdapter 對 hashtcalc.dl 的 C 語言接口進行了封裝,使得其他 python 模塊可以直接通過 HashcalcAdapter 使用 hashtcalc.dll 中實現的 hash 算法。具體的代碼如下:
from ctypes import windll from ctypes import * class HashcalcAdapter(object): def __init__(self, dllpath): self._dllpath = dllpath self._libc = windll.LoadLibrary(self._dllpath) def calc_CRC32(self, filename): new_filename = c_char_p(filename) return self._libc.calc_CRC32(new_filename) def calc_MD5(self, filename): new_filename = c_char_p(filename) return self._libc.calc_MD5(new_filename) def calc_SHA1(self, filename): new_filename = c_char_p(filename) return self._libc.calc_SHA1(new_filename)
在軟件開發過程中同時運用 Python 語言和 C 語言,既能夠在加快開發速度的同時,也能夠保證軟件的運行性能。