一、 POSIX 中對可重入和線程安全這兩個概念的定義:
Reentrant Function:A function whose effect, when called by two or more threads,is guaranteed to be as if
the threads each executed the function one after another in an undefined order, even if the actual execution is interleaved.
Thread-Safe Function:A function that may be safely invoked concurrently by multiple threads.
Async-Signal-Safe Function: A function that may be invoked, without restriction from signal-catching functions. No function is async-signal -safe unless explicitly described as such.
以上三者的關系為:可重入函數 必然 是 線程安全函數 和 異步信號安全函數; 線程安全函數不一定是可重入函數。
可重入與線程安全的區別體現在能否在signal處理函數中被調用的問題上,可重入函數在signal處理函數中可以被安全調用,因此同時也是Async-Signal-Safe Function;而線程安全函數不保證可以在signal處理函數中被安全調用,如果通過設置信號阻塞集合等方法保證一個非可重入函數不被信號中斷,那麼它也是Async-Signal-Safe Function。
舉個例子,strtok是既不可重入的,也不是線程安全的;加鎖的strtok不是可重入的,但線程安全;而strtok_r既是可重入的,也是線程安全的。也就是說函數如果使用靜態變量,通過加鎖後可以轉成線程安全函數,但仍然有可能不是可重入的。我們所熟知的alloc也是線程安全但不是可重入的。
再舉個例子,假設函數func()在執行過程中需要訪問某個共享資源,因此為了實現線程安全,在使用該資源前加鎖,在不需要資源解鎖。 假設該函數在某次執行過程中,在已經獲得資源鎖之後,有異步信號發生,程序的執行流轉交給對應的信號處理函數;再假設在該信號處理函數中也需要調用函數 func(),那麼func()在這次執行中仍會在訪問共享資源前試圖獲得資源鎖,然而我們知道前一個func()實例已然獲得該鎖,因此信號處理函數阻塞;另一方面,信號處理函數結束前被信號中斷的線程是無法恢復執行的,當然也沒有釋放資源的機會,這樣就出現了線程和信號處理函數之間的死鎖局面。
因此,func()盡管通過加鎖的方式能保證線程安全,但是由於函數體對共享資源的訪問,因此是非可重入。
對於這種情況,采用的方法一般是在特定的區域屏蔽一定的信號。
二、可重入函數
我們知道,當捕捉到信號時,不論進程的主控制流程當前執行到哪兒,都會先跳到信號處理函數中執行,從信號處理函數返回後再繼續執行主控制流程。信號處理函數是一個單獨的控制流程,因為它和主控制流程是異步的,二者不存在調用和被調用的關系,並且使用不同的堆棧空間。引入了信號處理函數使得一個進程具有多個控制流程,如果這些控制流程訪問相同的全局資源(全局變量、硬件資源等),就有可能出現沖突,如下面的例子所示。
main函數調用insert函數向一個鏈表head中插入節點node1,插入操作分為兩步,剛做完第一步的時候,因為硬件中斷使進程切換到內核,再次回用戶態之前檢查到有信號待處理,於是切換到sighandler函數,sighandler也調用insert函數向同一個鏈表head中插入節點node2,插入操作的兩步都做完之後從sighandler返回內核態,再次回到用戶態就從main函數調用的insert函數中繼續往下執行,先前做第一步之後被打斷,現在繼續做完第二步。結果是,main函數和sighandler先後向鏈表中插入兩個節點,而最後只有一個節點真正插入鏈表中了。
像上例這樣,insert函數被不同的控制流程調用,有可能在第一次調用還沒返回時就再次進入該函數,這稱為重入,insert函數訪問一個全局鏈表,有可能因為重入而造成錯亂,像這樣的函數稱為不可重入函數,反之,如果一個函數只訪問自己的局部變量或參數,則稱為可重入(Reentrant)函數。
不可重入函數的原因在於:
1> 已知它們使用靜態數據結構
2> 它們調用malloc和free.
因為malloc通常會為所分配的存儲區維護一個鏈接表,而插入執行信號處理函數的時候,進程可能正在修改此鏈接表。
3> 它們是標准IO函數.
因為標准IO庫的很多實現都使用了全局數據結構
3、sig_atomic_t類型與volatile限定符
在上面的圖示例子中,main和sighandler都調用insert函數則有可能出現鏈表的錯亂,其根本原因在於,對全局鏈表的插入操作要分兩步完成,不是一個原子操作,假如這兩步操作必定會一起做完,中間不可能被打斷,就不會出現錯亂了。
關於原子操作最原始的說法是一條匯編指令能夠完成(對於多線程程序來說原子操作可以指加鎖後的幾個步驟集合),即使是一條C語句也不一定是一個原子操作,比如 a = 5; 如果a是32位的int變量,在32位機上賦值是原子操作,在16位機上就不是。如果在程序中需要使用一個變量,要保證對它的讀寫都是原子操作,應該采用什麼類型呢?
為了解決這些平台相關的問題,C標准定義了一個類型sig_atomic_t,在不同平台的C語言庫中取不同的類型,例如在32位機上定義sig_atomic_t為int類型。
在使用sig_atomic_t類型的變量時,還需要注意另一個問題。看如下的例子:
#include <signal.h>
sig_atomic_t a=0;
int main(void)
{
/* register a sighandler */
while(!a); /* wait until a changes in sighandler */
/* do something after signal arrives *
/ return 0;
}
為了簡潔,這裡只寫了一個代碼框架來說明問題。在main函數中首先要注冊某個信號的處理函數sighandler,然後在一個while死循環中等待信號發生,如果有信號遞達則執行sighandler,在sighandler中將a改為1,這樣再次回到main函數時就可以退出while循環,執行後續處理。如果在編譯時加了優化選項,則如果第一次比較a是否為0,如果相等則成了死循環,因為不會再次從內存讀取變量a的值。
是編譯器優化得有錯誤嗎?不是的。設想一下,如果程序只有單一的執行流程,只要當前執行流程沒有改變a的值,a的值就沒有理由會變,不需要反復從內存讀取,因此上面的兩條指令和while(!a);循環是等價的,並且優化之後省去了每次循環讀內存的操作,效率非常高。
所以不能說編譯器做錯了,只能說編譯器無法識別程序中存在多個執行流程。之所以程序中存在多個執行流程,是因為調用了特定平台上的特定庫函數,比如sigaction、pthread_create,這些不是C語言本身的規范,不歸編譯器管,程序員應該自己處理這些問題。
C語言提供了volatile限定符,如果將上述變量定義為volatile sig_atomic_t a=0;那麼即使指定了優化選項,編譯器也不會優化掉對變量a內存單元的讀寫。
對於程序中存在多個執行流程訪問同一全局變量的情況,volatile限定符是必要的,此外,雖然程序只有單一的執行流程,但是變量屬於以下情況之一的,也需要volatile限定:
變量的內存單元中的數據不需要寫操作就可以自己發生變化,每次讀上來的值都可能不一樣;
即使多次向變量的內存單元中寫數據,只寫不讀,也並不是在做無用功,而是有特殊意義的;
什麼樣的內存單元會具有這樣的特性呢?肯定不是普通的內存,而是映射到內存地址空間的硬件寄存器,例如串口的
接收寄存器屬於上述第一種情況,而發送寄存器屬於上述第二種情況。
sig_atomic_t類型的變量應該總是加上volatile限定符,因為要使用sig_atomic_t類型的理由也正是
要加volatile限定符的理由。
對於多線程的程序,訪問沖突的問題是很普遍的,解決的辦法是引入鎖,獲得鎖的線程可以完成“讀-修改-寫”的操作,然後釋放鎖給其它線程,沒有獲得鎖的線程只能等待而不能訪問共享數據,這樣“讀-修改-寫”三步操作組成一個原子操作,要麼都執行,要麼都不執行,不會執行到中間被打斷,也不會在其它處理器上並行做這個操作。