Dataguise日前公布了實施Hadoop的十大最佳做法。專業人員可以通過遵循管理隱私風險,數據和安全管理的程序,杜絕敏感數據外洩,降低風險狀況,從而更好地滿足合規性要求。
通過財富200強企業中的Hadoop安全部署經驗總結,Dataguise開發出以下十大建議,以確保大型和復雜多樣環境下的數據安全。
信息技術工具的日益更新和功能的不斷優化成熟,使得大數據的使用變得更具有可行性。然而,這一新技術領域的優勢往往還伴隨著數據隱私的問題。在這些龐大的信息庫中,個人身份信息(PII ),如姓名,地址和社會安全號碼都存在洩露的可能。
確保Hadoop數據安全的十大最佳方法
如何確保Hadoop數據安全
1、先下手為強!在規劃部署階段就確定數據的隱私保護策略,最好是在將數據放入到Hadoop之前就確定好保護策略。
2、確定哪些數據屬於企業的敏感數據。根據公司的隱私保護政策,以及相關的行業法規和政府規章來綜合確定。
3、及時發現敏感數據是否暴露在外,或者是否導入到Hadoop中。
4、搜集信息並決定是否暴露出安全風險。
5、確定商業分析是否需要訪問真實數據,或者確定是否可以使用這些敏感數據。然後,選擇合適的加密技術。如果有任何疑問,對其進行加密隱藏處理,同時提供最安全的加密技術和靈活的應對策略,以適應未來需求的發展。
6、確保數據保護方案同時采用了隱藏和加密技術,尤其是如果我們需要將敏感數據在Hadoop中保持獨立的話。
7、確保數據保護方案適用於所有的數據文件,以保存在數據匯總中實現數據分析的准確性。
8、確定是否需要為特定的數據集量身定制保護方案,並考慮將Hadoop的目錄分成較小的更為安全的組。
9、確保選擇的加密解決方案可與公司的訪問控制技術互操作,允許不同用戶可以有選擇性地訪問Hadoop集群中的數據。
10、確保需要加密的時候有合適的技術(比如Java、Pig等)可被部署並支持無縫解密和快速訪問數據。