Linux和windows中的換行符差異問題
LINUX的換行符在Windows記事本打開不換行或出現黑點是由於Linux和windows中的換行符差異問題造成的。
首先來看回車符號和換行符號產生背景
關於“回車”(carriage return)和“換行”(line feed)這兩個概念的來歷和區別。
在計算機還沒有出現之前,有一種叫做電傳打字機(Teletype Model 33)的玩意,每秒鐘可以打10個字符。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒,正好可以打兩個字符。要是在
這0.2秒裡面,又有新的字符傳過來,那麼這個字符將丟失。
於是,研制人員想了個辦法解決這個問題,就是在每行後面加兩個表示結束的字符。一個叫做“回車”,告訴打字機把打印頭定位在左邊界;另一個叫做“換行”,告訴打字機把紙向下移一行。
這就是“換行”和“回車”的來歷,從它們的英語名字上也可以看出一二。
後來,計算機發明了,這兩個概念也就被般到了計算機上。那時,存儲器很貴,一些科學家認為在每行結尾加兩個字符太浪費了,加一個就可以。於是,就出現了分歧。
Unix系統裡,每行結尾只有“<換行>”,即“\n”;Windows系統裡面,每行結尾是“ <回車><換行>”,即“\r\n”;Mac系統裡,每行結尾是“<回車>”。一個直接後果是,Unix/Mac系統下的文件在
Windows裡打開的話,所有文字會變成一行;而Windows裡的文件在Unix/Mac下打開的話,在每行的結尾可能會多出一個^M符號
windows創建的文件是 \n\r結束的, 而linux,mac這種unix類系統是\n結束的。
所以unix的文本到windows會出現換行丟失(ultraedit這種軟件可以正確識別); 而反過來就會出現^M的符號;
Windows等操作系統用的文本換行符和UNIX/Linux操作系統用的不同,Windows系統下輸入的換行符在UNIX/Linux下不會顯示為“換行”,而是顯示為 ^M 這個符號(這是Linux等系統下規定的特殊標記,
占一個字符大小,不是^和M的組合,打印不出來的)。Linux下很多文本編輯器(命令行)會在顯示這個標記之後,補上一個自己的換行符,以避免內容混亂(只是用於顯示,補充的換行符不會寫入文件,有專門的命令將Windows換行符替換為Linux換行符)。 UNIX/Linux系統下的換行符在Windows系統的文本編輯器中會被忽略,整個文本會亂成一團。
windows換行是\r\n,十六進制數值是:0D0A。
LINUX換行是\n,十六進制數值是:0A
所以在linux保存的文件在windows上用記事本看的話會出現黑點,我們可以在LINUX下用命令把linux的文件格式轉換成win格式的。
unix2dos 是把linux文件格式轉換成windows文件格式
dos2unix 是把windows格式轉換成linux文件格式。
linux下刪除windows換行符^M
OJ判題時發現一個問題:用%c讀入的代碼都會報wa。後來發現跟scanf有關。在linux下使用%c會讀到\n和\r兩個字符。所以需要將^M(也就是\r)字符刪掉
刪除方法不少。找了一個比較簡單的。
要將a.txt裡的^M去掉並寫入b.txt,則使用如下指令cat a.txt | tr -d "^M" > b.txt
注意:語句中的^M是通過ctrl+V, ctrl+M輸入的。特指/r字符
unix 下換行符只有: \r
Dos 下換行符有:\r\n
具體的, \r的ascii 碼是:14
\n的ascii 碼是:10