Hadoop教程:Hadoop安全部署经验总结
通过Hadoop安全部署经验总结以下十大建议,以确保大型和复杂多样环境下的数据信息安全。
- 先下手为强!在规划部署阶段就确定数据的隐私保护策略,最好是在将数据放入到Hadoop之前就确定好保护策略。
- 确定哪些数据属于企业的敏感数据。根据公司的隐私保护政策,以及相关的行业法规和政府规章来综合确定。
- 及时发现敏感数据是否暴露在外,或者是否导入到Hadoop中。
- 搜集信息并决定是否暴露出安全风险。
- 确定商业分析是否需要访问真实数据,或者确定是否可以使用这些敏感数据。然后,选择合适的加密技术。如果有任何疑问,对其进行加密隐藏处理,同时提供最安全的加密技术和灵活的应对策略,以适应未来需求的发展。
- 确保数据保护方案同时采用了隐藏和加密技术,尤其是如果我们需要将敏感数据在Hadoop中保持独立的话。
- 确保数据保护方案适用于所有的数据文件,以保存在数据汇总中实现数据分析的准确性。
- 确定是否需要为特定的数据集量身定制保护方案,并考虑将Hadoop的目录分成较小的更为安全的组。
- 确保选择的加密解决方案可与公司的访问控制技术互操作,允许不同用户可以有选择性地访问Hadoop集群中的数据。
- 确保需要加密的时候有合适的技术(比如Java、Pig等)可被部署并支持无缝解密和快速访问数据。
来源:大数据研究