歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux基礎 >> Linux技術

Linux下清除文件中的隱私數據以保護個人隱私

  我們平時創建的文件、圖片都包含著很多信息,很容易被人利用,所以要清除文件中的元數據,以保護個人隱私。下面小編就給大家介紹下如何清除文件中的隱私數據,一起來學習下吧。

  典型的數據文件通常關聯著“元數據”,其包含這個文件的描述信息,表現為一系列屬性-值的集合。元數據一般包括創建者名稱、生成文件的工具、文件創建/修改時期、創建位置和編輯歷史等等。幾種流行的元數據標准有 EXIF(圖片)、RDF(web資源)和DOI(數字文檔)等。

  雖然元數據在數據管理領域有它的優點,但事實上它會危害你的隱私。相機圖片中的EXIF格式數據會洩露出可識別的個人信息,比如相機型號、拍攝相關的GPS坐標和用戶偏愛的照片編輯軟件等。在文檔和電子表格中的元數據包含作者/所屬單位信息和相關的編輯歷史。不一定這麼絕對,但諸如metagoofil一類的元數據收集工具在信息收集的過程中常最作為入侵測試的一部分被利用。

   Linux下清除文件中的隱私數據的方法

  對那些想要從共享數據中擦除一切個人元數據的用戶來說,有一些方法從數據文件中移除元數據。你可以使用已有的文檔或圖片編輯軟件,通常有自帶的元數據編輯功能。在這個教程裡,我會介紹一種不錯的、單獨的元數據清理工具,其目標只有一個:匿名一切私有元數據。

  MAT(元數據匿名工具箱)是一款專業的元數據清理器,使用Python編寫。它屬於Tor旗下的項目,而且是Live 版的隱私增強操作系統 Trails 的標配應用。

  與諸如exiftool等只能對有限種類的文件類型進行寫入的工具相比,MAT支持從各種各樣的文件中消除元數據:圖片(png、jpg)、文檔(odt、docx、pptx、xlsx和pdf)、歸檔文件(tar、tar.bz2)和音頻(mp3、ogg、flac)等。

  在Linux上安裝MAT

  在基於Debian的系統(Ubuntu或Linux Mint)上,已經打包好MAT,所以安裝很直接:

  $ sudo apt-get install mat

  在Fedora上,並沒有預先生成的MAT軟件包,所以你需要從源碼生成。這是我在Fedora上生成MAT的步驟(不成功的話,請查看教程底部):

  $ sudo yum install python-devel intltool python-pdfrw perl-Image-ExifTool python-mutagen$ sudo pip install hachoir-core hachoir-parser$ wget https://mat.boum.org/files/mat-0.5.tar.xz$ tar xf mat-0.5.tar.xz$ cd mat-0.5$ python setup.py install

  使用MAT-GUI匿名元數據

  一旦安裝好,通過GUI和命令行都可以使用MAT。輸入這個命令啟動MAT的GUI:

  $ mat-gui

  嘗試清理一個包含如下內置元數據的實例文檔文件(如private.odt)。

  Linux下清除文件中的隱私數據的方法

  點擊“添加”按鈕來添加需要清理的文件到MAT中。一旦載入文件,點擊“確認”按鈕對所有隱藏的元數據信息進行掃描。

   Linux下清除文件中的隱私數據的方法 

  只要元數據被MAT檢測到,“State”狀態就會被標記成“Dirty”。雙擊文件可以查看檢測到的元數據。

   Linux下清除文件中的隱私數據的方法

  點擊“清理”按鈕來清除文件中的元數據。MAT會自動清空文件中的所有私有元數據字段。

   Linux下清除文件中的隱私數據的方法

  清除後的狀態中不包含任何私有可辨識的痕跡:

   Linux下清除文件中的隱私數據的方法

  從命令行匿名元數據

  $ mat -c 。

  正如前面提到的,另一種調用MAT的方式是從命令行,使用mat命令可達到。

  為了檢查任何敏感的元數據,先前往文件所在的目錄,然後運行:

  $ mat -c 。

  這樣會掃描當前目錄和其子目錄下的所有文件,並報告它們的狀態(已清理或未清理)。

   Linux下清除文件中的隱私數據的方法

  你可以使用“-d”選項來查看檢測到的真實元數據:

  $ mat -d 《input_file》

  Linux下清除文件中的隱私數據的方法

  如果不為mat命令提供任何選項,默認操作會移除文件的元數據。如果要在清理的過程中保留原始文件的備份,使用“-b”選項。下面命令會清除所有文件的元數據,並將原始文件存儲為“*.bak”文件。

  $ mat -b 。

   Linux下清除文件中的隱私數據的方法

  查看所支持的文件類型,請運行:

  $ mat -l

   Linux下清除文件中的隱私數據的方法

  故障排除

  當前我在Fedora上使用編譯版本的MAT遇到了下列問題。當我嘗試在Fedora清除歸檔/文檔文件的元數據時(如.gz、.odt、*.docx),MAT因為下列錯誤失敗。

  File “/usr/lib64/python2.7/zipfile.py”, line 305, in __init__ raise ValueError(‘ZIP does not support timestamps before 1980’)ValueError: ZIP does not support timestamps before 1980

  總結

  MAT是一款簡單但非常好用的工具,用來預防從元數據中無意洩露私人數據。請注意如果有必要,文件內容也需要保護。MAT能做的是消除與文件相關的元數據,但並不會對文件本身進行任何操作。簡而言之,MAT是一名救生員,因為它可以處理大多數常見的元數據移除,但不應該只指望它來保證你的隱私。

  上面就是清除文件中的隱私數據的介紹了,除了需要定期清除外,還要有良好的保護隱私的系統,只有養成保護隱私的習慣,才不會洩露私人數據。

Copyright © Linux教程網 All Rights Reserved