歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux基礎 >> 關於Linux

Linux操作系統內核編碼風格

這篇簡短的文章描述了Linux內核首選的編碼風格。編碼風格是很個人化的東西,我不會把自己的觀點強加給任何人。但是,Linux內核的代碼畢竟是我必須有能力維護的,因此我寧願它的編碼風格是我喜歡的。請至少考慮一下這一點。

首先,我建議打印一份《GNU編碼標准》,不要閱讀它。燒掉它,它不過是象征性的姿態。然後,請看:

第 1 章: 縮進

Tabs(制表符)是8個字符的大小,因此縮進也應該是8個字符的大小。有些叛逆主張試圖把縮進變成4個(甚至是2個!)字符的長度,這就好象試圖把PI (案,圓周率)定義成3是一樣的。

依據:縮進背後的思想是:清楚地定義一個控制塊從哪裡開始,到哪裡結束。尤其是在你連續不斷的盯了20個小時的屏幕後,如果你有大尺寸的縮進。你將更容易發現縮進的好處。

現在,有些人說8個字符大小的縮進導致代碼太偏右了,並且在一個80字符寬的終端屏幕上看著很不舒服。對這個問題的回答是:如果你有超過3個級別的縮進,你就有點犯糊塗了,應當修改你的程序。

簡而言之,8個字符的縮進使程序更易讀,而且當你把功能隱藏的太深時,多層次的縮進還會對此很直觀的給出警告。要留心這種警告信息。

第 2 章: 放置花括號

C程序中另一個要主意的就是花括號的放置。與縮進尺寸不同的是,關於如何放置花括號沒有技術上的理由。但是,首選的方法是象先知Brain Kernighan和Dennis Ritchie展現的那樣:把左括號放在行尾,右括號放在行首。也就是:

if (x is true) {
        we do y
    }
    
    然而,還有另外一種情況,就是函數:函數應當把左右括號都放在行首。也就是:
    
    int function(int x)
    {
        body of function
    }

叛逆的人們所在皆有。他們說,這樣會導致…嗯,不一致性(案,指函數的花括號使用與其他情況不統一)。但是所有正確思考的人都知道:(1) K&R是正確的;(2) K&R還是正確的。 而且,函數與別任何東西都不一樣(在C語言中你沒法隱藏它)。

注意,右括號所在的行不應當有其它東西,除非跟隨著一個條件判斷。也就是do-while語句中的“while”和if-else語句中的“else”。象這樣:

do {
        body of do-loop
    } while (condition);
    
和:
    
    if (x == y) {
        ..
    } else if (x >; y) {
        ...
    } else {
        ....
    }

依據: K&R。

而且,注意這種花括號的放置減少了空行的數目,並沒損害可讀性。因此,當屏幕上不可以有很多空行時(試想25行的終端屏幕),你就有更多的空行來安插注釋。

第 3 章: 命名

C是一門樸素的語言,你使用的命名也應該這樣。與Modula-2和Pascal程序員不同,C程序員不使用諸如 “ThisVariableIsATemporaryCounter”這樣“聰明”的名字。C程序員應該叫它“tmp”,這寫起來更簡單,也不會更難懂。

然而,當面對復雜情況時就有些棘手,給全局變量取一個描述性的名字是必要的。把一個全局函數叫做“foo”是一種目光短淺的行為。

全局變量(只當你確實需要時才用)應該有描述性的名字,全局函數也一樣。如果你有一個統計當前用戶個數的函數,應當把它命名為 “count_active_user()”或者簡單點些的類似名稱,不應該命名為“cntusr()”。

把函數類型寫進函數名(即所謂的“匈牙利命名法”)簡直就是大腦有問題──編譯器總是知道函數的類型並且能加以檢查,這種命名法只會弄糊塗程序員自己。怪不得微軟總是制造充滿bug的程序。

局部變量的名字應該盡量短,而且說到點子上。如果你有個普通的整型循環計數變量,應當命名為“i”。命名為“loop_counter”並不能帶來任何成效,如果它不被誤解的話(案,這裡的言外之意是說,如果被誤解就更慘了)。與此類似,“tmp”可以作為一個用來存儲任何類型臨時值的變量的名字。

如果你害怕弄混淆局部變量(s)的名字,你就面臨著另一個問題,也叫作“函數增長荷爾蒙失調綜合症”。請參考下一章。

第 4 章: 函數

函數應當短而精美,而且只做一件事。它們應當占滿1或2個屏幕(就象我們知道的那樣,ISO/ANSI的屏幕大小是80X24),只做一件事並且把它做好。

一個函數的最大長度與它的復雜度和縮進級別成反比。所以,如果如果你有一個概念上簡單(案,“簡單”是simple而不是easy)的函數,它恰恰包含著一個很長的case語句,這樣你不得不為不同的情況准備不懂的處理,那麼這樣的長函數是沒問題的。

然而,如果你有一個復雜的函數,你猜想一個並非天才的高一學生可能看不懂得這個函數,你就應當努力把它減縮得更接近前面提到的最大函數長度限制。可以使用一些輔助函數,給它們取描述性的名字(如果你認為這些輔助函數的調用是性能關鍵的,可以讓編譯器把它們內聯進來,這比在單個函數內完成所有的事情通常要好些)。

對函數還存在另一個測量標准:局部變量的數目。這不該超過5到10個,否則你可能會弄錯。應當重新考慮這個函數,把它分解成小片。人類的大腦一般能同時記住7個不同的東西,超過這個數目就會犯糊塗。或許你認為自己很聰明,那麼請你理解一下從現在開始的2周時間你都做什麼了。

第 5 章:注釋

注釋是有用的,但過量的注釋則是有害的。不要試圖在注釋中解釋你的代碼是如何工作的:把代碼是如何工作的視為一件顯然的事情會更好些,而且,給糟糕的代碼作注釋則是在浪費時間。

通常,你願意自己的注釋說出代碼是做什麼的,而不是如何做。還有,盡量避免在函數體內作注釋:如果函數很復雜,你很可能需要分開來注釋,回頭到第4章去看看吧。你可以給一段代碼──漂亮的或丑陋的──作注釋以引起注意或警告,但是不要過量。取而代之,應當把注釋放在函數首部,告訴人們該函數作什麼,而不是為什麼這樣做。

第 6 章:你把事情弄亂了

好吧,我們來看看。很可能有長期使用UNIX的人告訴過你,“GNU emacs”能自動為你格式化C程序源代碼,你注意到這是真的,它確實能做到,但是缺省情況下它的用處遠遠小於期望值──鍵入無數的monkeys到 GNU emacs中絕不可能造出好的程序。

因此,你可以或者刪除GNU emacs,或者對它進行理智的配置。對於後者,可以把下面的行粘貼到你的.emacs文件中:

(defun linux-c-mode ()

"C mode with adjusted defaults for use with the Linux kernel."

(interactive)

(c-mode)

(c-set-style "K&R")

(setq c-basic-offset 8))

這將會定義一個把C代碼弄成linux風格的命令。當hacking一個模塊時,如果你把“-*- linux-c -*-”放到了最初的兩行,這個模塊將被自動調用。而且,如果你打算每當在/usr/src/linux下編輯源文件時就自動調用它,也許你會把下面的命令:

(setq auto-mode-alist (cons '("/usr/src/linux.*/.*\\.[ch]$" . linux-c-mode)

auto-mode-alist))

添加進你的.emacs文件。

但是,即使你沒能讓emacs正確做到格式化,也並非將就此一無所有:還有“indent”程序呢。

嗯,再提醒一下,GNU indent跟GNU emacs有同樣的毛病,這就需要你給它一些命令行選項。然而,這不是很糟糕的事,因為即使是GNU indent也承認K&R的權威性(GNU的人不是魔鬼,他們只是在這裡太過嚴格了,以致於誤導人),所以你可以只需給indent這樣的選項: “-kr -i8”(表示“K&R風格,8個字符的縮進”)。

“indent”程序有很多選項,特別是當為重排過的程序作注釋的時候,你需要看一下它的手冊。記住:“indent”可不是修正糟糕程序的萬能鑰匙。

第 7 章: 配置文件(configuration-files)

對配置選項來說(arch/xxx/config.in和所有的Config.in文件),使用不同的縮進風格。

若代碼中的縮進級別為3,配置選項就應該為2,這樣可以暗示出依賴關系。後者只是用於bool/tristate(即二態/三態)的選項。對其它情況用常識就行了。舉例來說:

if [ "$CONFIG_EXPERIMENTAL" = "y" ]; then

tristate 'Apply nitroglycerine inside the keyboard (DANGEROUS)' CONFIG_BOOM

if [ "$CONFIG_BOOM" != "n" ]; then

bool ' Output nice messages when you explode' CONFIG_CHEER

fi

fi

通常CONFIG_EXPERIMENTAL應當在所有不穩定的選項的周圍出現。所有已知會破壞數據的選項(如文件系統的實驗性的寫支持功能)應當被標記為(DANGEROUS),其他實驗性的選項應當被標記為(EXPERIMENTAL)。

第 8 章: 數據結構

假如數據結構在其被創建/銷毀的線程環境(案:這裡說的線程是一個執行實體,可能是進程、內核線程或其它)之外還具有可見性,那麼他們都該有引用計數。在內核中沒有垃圾收集機制(而且內核之外的垃圾收集也是緩慢而低效的),這意味著你絕對應該為每一次使用進行引用計數。

引用計數意味著你可以避開鎖,還能允許多個線程並行訪問該數據結構──而且不用擔心僅僅因為訪問數據結構的線程睡眠了一會兒或者干別的去了,它們就會消失。

注意,鎖不是引用計數的替代品。鎖是用來保持數據結構的一致性的,而引用計數是一種內存管理技術。通常二者都需要,而且不會彼此混淆。

確實有許多數據結構可以有兩個級別的引用計數,當使用者具有不同的“等級”(classes)時就是這樣。子等級(subclass)記錄了處於該等級的使用者個數,而且當它減到零的時候就把總體計數(global count)減一。

這種“多級引用計數”(multi-reference-counting)的一個實例可以在內存管理子系統("struct mm_struct":mm_users和mm_count)中找到,也可以在文件系統的代碼中("struct super_block":s_count和s_active)找到。

記住:如果另一個線程能找到你的數據結構,而你有沒對它做引用計數,那幾乎可以肯定:這是一個bug。

Copyright © Linux教程網 All Rights Reserved