您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> Linux技術

在Linux系統中修改文本的字符編碼的方法

正如我們所知道的那樣，電腦只能夠處理低級的二進制值，並不能直接處理字符。當一個文本文件被存儲時，文件中的每一個字符都被映射成二進制值，實際存儲在硬盤中的正是這些“二進制值”。之後當程序打開文本文件時，所有二進制值都被讀入並映射回原始的可讀字符。只有當所有需要訪問這個文件的程序都能夠“理解”它的編碼，即二進制值到字符的映射時，這個“保存和打開”的過程才能很好地完成，這也確保了可理解數據的往返過程。

如果不同的程序使用不同的編碼來處理同一個文件，源文件中的特殊字符就無法正常顯示。這裡的特殊字符指的是非英文字母的字符，例如帶重音的字符（比如 ?，á，ü）。

然後問題就來了： 1）我們如何確定一個確定的文本文件使用的是什麼字符編碼？ 2）我們如何把文件轉換成已選擇的字符編碼？
步驟一

為了確定文件的字符編碼，我們使用一個名為 “file” 的命令行工具。因為 file 命令是一個標准的 UNIX 程序，所以我們可以在所有現代的 Linux 發行版中找到它。

運行下面的命令：

復制代碼代碼如下:$ file --mime-encoding filename
2015617180329059.jpg (378×122)