您现在的位置： Linux教程網 >> UnixLinux > >> Linux綜合 >> Linux資訊 >> 更多Linux

Linux中文化之LINUX終端國際化解決方案

　　一．Linux國際化現狀　　隨著INTERNET的普及，世界各國，特別是使用亞洲多字節語種的國家，開始意識到國際化的重要性。目前，　　各國有自己的編碼，例如，日本有JIS,韓國有KSC,中國有GBK和即將要實施的GB13080等等。如此多　　的編碼，使得系統兼容和國際交流成為很大的問題。　　值得令人高興的是，Linux國際標准化組織在近日發布了LI18NUX2000國際化規格草案。該草案的發布向實現Linux操作系統標准化更邁進了一步，這必將使全體開發人員和各機構從中受益。Linux的國際化是一項龐大的工程，它對於支持亞洲語言和其它多字節字符集是不可或缺的，將極大推動Linux在世界各地的普及。國際化組織制定UNICODE標准，在很大程度上解決了問題。目前是向UNICODE過渡的時期，所以，我們　　還必須支持各國的標准。　　目前LINUX國際化基本上還是在傳統的UNIX方式上。通常是以LOCALE為基礎國際化，由於內核不支持雙字節、XFree86不支持多字節語言，使得國際化工作就是一些Hacking的工作。人們采用各種方式，如修改內核（UNICON），編寫新的TTY, 修改運行庫，甚至修改X服務器。但一些方法已經固定下來，比如LOCALE等。更好的方法要等到國際化的新標准。　　二．什麼是Unicon？　　Unicon是在Linux內核基礎上，增加國際化支持的程序包。它包括內核補丁、鍵盤設備程序、輸入法服務器和Unicon客戶。應用程序可以在此基礎上處理各種語言。與其它終端中文系統相比，　　Unicon有以下優點：　　1. 最大限度支持國際化，目前本系統可以支持Big5, GB, GBK, JIS, KSC等. 　　2. 良好的兼容性　　Unicon以最小的內核改動換取最大的系統兼容。和其它終端軟件相比，它可以對鼠標，鍵盤，顯示有良好的支持。最使人欣慰的是，它可以支持滾屏。其它西文軟件，不需要經過修改，就可以輕松地處理　　各國語言。　　2. 每個TTY是獨立的機器，有自己獨立的狀態（字體和輸入法,Locale等）　　3. 良好的分層結構，使系統易於擴展本系統采用了類似於UNIX系統結構的方案。系統分三層：內核及驅動程序，輸入法服務器，輸入法。　　此結構容易擴展、移植。例如，當我們需要將系統移植到一個新的機器上時，主要的工作是在設備及驅動程序上，其余部分基本上不需要作很大修改。　　4. 提供API和通用輸入法接口　　為普通程序員提供接口程序。這裡包括兩個方面的含義，1. 輸入法模塊的接口，用戶只需按此接口就可以將自己的輸入法加到本系統上去；2. Client & Server 的接口，當系統改變時，只需修改這部分，而保持系統不變。　　5. 支持多種字體　　系統支持多字體內核，並在此基礎上，提供字體的動態切換。　　6. 支持動態切換語言及輸入法　　系統在字體管理程序和輸入法服務器的基礎上，提供動態切換。另外，對環境變量，如LOCALE, 同樣進行切換，極大方便了用戶。　　7. 為XFree86的Chinput提供輸入法由於XFree86的Chinput和Unicon使用同一輸入法服務器，所以，它們可以共享輸入法。　　三．Unicon總體設計和其它系統不同，在Unicon設計時，我們假定每個TTY是一個獨立的機器，有自己的狀態。由此，每個有自己獨立的輸入法和字體。在系統設計上，我們依照Unix操作系統的特點，將整個系統分為若干層，並盡可能將內核的修改減少到最小。將系統分為以下幾層：　　1. 內核補丁　　智能制表符識別　　提供制表符智能識別。以支持系統菜單等的正確顯示, 這部分代碼在　　drivers/char/console.c。　　字體顯示程序　　字體顯示部分是在FrameBuffer的總體控制程序上。這樣，我們只須修改高層模塊，而無需去管底層得各個驅動程序，使得我們得兼容性達到最佳。其次，UNIKEY可以方便地調用補丁程序，方便地控制顯示條。詳細可以參見drivers/video/fbcon.c 　　鍵盤過濾程序（UNIKEY) 我們在兩個地方對鍵盤進行過濾。一個是在鍵盤中斷，另外是在TTY鍵盤處理程序上。之所以這樣處理，是因為：1. 我們必須過濾鍵,尤其是一些功能鍵，組合鍵；2. 我們必須將翻譯後　　的結果發送回操作系統。而當我們將翻譯得結果發送回系統時，最快、最方便得方法是將他們寫回到TTY上去。這樣，UNIKEY可以很方便地對鍵進行過濾。　　詳細參見drivers/char/pc_keyb.c, include/linux/tty_flip.c 　　字體管理程序　　字體管理程序是為了支持TTY字體獨立。字體顯示程序必須通過調用字體管理器來確定當前TTY 的字體及編碼方式，以確保正確顯示。　　詳細參見drivers/video/fbcon.c等。　　2. 設備驅動程序UNIKEY 　　本模塊為高層模塊提供了鍵盤過濾、字體管理，輸入法顯示等等。另外，對系統熱鍵作了翻譯，以傳送到高層模塊。它包括以下幾個方面：　　輸入法顯示本模塊是對UNICON輸入法條顯示的支持。它是通過標准UNIX調用ioctl來實現的。　　鍵過濾程序　　本模塊對TTY1-―TTY6進行模擬，包括：1. 系統鍵過濾，包括對功能鍵，組合鍵得翻譯，以確保輸入法能正確，准確地接受系統的鍵盤信息；2. 輸入法程序向操作系統發送鍵的接口，通過這個接口，輸入法程序將翻譯得結果傳送到TTY，從而應用程序接受到翻譯得結果。　　字體管理器　　字體管理器動態管理字體。用戶可以根據自己得喜好，將不同的字體模塊放到系統中，從而達到用戶滿意得效果。　　3. 輸入法服務器　　本模塊是輸入法的管理程序。它為客戶端提供輸入法。服務器端維護每個連接，使每個客戶端有自己獨立的狀態。另外，通過共享詞庫，使系統的內存開銷降低到最低。　　4. 輸入法客戶　　本模塊為用戶看到的終端程序。首先，它通過輸入法服務器，打開一種輸入法，通過打開UNIKEY,過濾系統鍵盤，並將所得的鍵傳送到輸入法服務器，輸入法服務器翻譯這個鍵，客戶程序取回結果，並將服務器得結果顯示在屏幕上。另外，它還要處理語種切換，幫助，用戶造詞等等。　　四. Unicon 的工作原理。　　1. 顯示部分　　顯示中文（或其它文字），需要兩個條件，1. 在圖形方式下；2. 有編碼的字庫。　　假定我們在TTY2運行如下程序：　　main ( ) 　　{ 　　puts("hello, world.\n"); 　　} 　　系統將通過open("/dev/tty1"), 然後，通過系統調用write(2)調用系統內核console.c的do_con_write, 　　而do_con_write調用內核的FrameBuffer高層管理程序fbcon.c， fbcon.c 調用具體設備驅動程序。　　FrameBuffer將字符串顯示到屏幕上。系統用的是默認的內核字庫。　　Unicon實際上，就是修改是FrameBuffer高層控制程序fbcon.c，將默認的字庫指針指到我們的字庫，　　這樣，系統就可以顯示中文了。　　2. 設備驅動程序　　如上所述；我們的Unikey只是為應用程序（輸入法）和內核之間提供了一個通訊的接口。我們采用標准　　的Unix設備接口：strUCt file_operations, 將各自處理函數添入，這樣一個設備就形成了。　　當系統初始化設備驅動程序時，我們將內核有關Unicon支持的指針賦值，使內核能調用驅動程序的函數。　　3. 輸入法服務器　　輸入法服務器采用面向對象的設計技術。將系統分為接口類、輸入法控制模塊、輸入法模塊管理器、　　內碼轉換器、共享詞組模塊等等。　　當一個客戶連接到服務器時，服務器返回一個句柄。當客戶程序打開一個輸入法，服務器首先檢查該　　輸入法是否打開，如果沒有打開，就將其打開，然後初始化，返回輸入法句柄給客戶。服務器維護該　　輸入法的狀態。而客戶程序負責到服務器上來取信息。另外，服務器負責客戶狀態的維護（如全角等）。　　4. 輸入法客戶　　客戶程序負責和服務器連接，並通過服務器打開輸入法，並將鍵傳送到服務器。客戶程序從服務器　　取信息，並顯示。另外，客戶程序負責傳送當前的狀態（如全角等）。　　五．Unicon系統圖　　Unicon User/Kernel/Hardware Architecture 　　======================================== 　　+------------------+ 　　+-------------------+ libimm_server.so +--------------+ 　　 unicon +->