1 大数据平台安全方案
1.1 安全需求
九方认为大数据平台,通常包含以下4个方面的需求:
1. 边界安全(认证):对于Hadoop集群,会有各种不同类型的访问,包括对数据的访问,对组件服务的访问等等。对于这些访问,需要通过认证技术来验证哪些用户,或者进程能够被允许访问群。
2. 数据保护(数据加密): 大数据平台,存放着海量的数据。这些数据在存储,传输的过程中都应该是得到保护的,或者是加密的。
3. 访问控制(授权):为不同的用户,应用设定不同的权限,声明这些用户以及应用能够对集群的数据进行的操作。
4. 数据可视化:数据能够被监管,数据从哪里来,怎么被使用,最终去向哪里等等信息都需要被记录。
1.2 Hadoop集群安全之路
由于安全本身的复杂性,以及会涉及到的大量低对集群配置的改动。九方推荐安全的实施,应该是紧随着新集群搭建完成之后,集群刚刚完成搭建,相应的配置会比较简单,不会涉及到应用的适配。九方建议分阶段启用安全功能。
Phase 0:没有安全功能的集群。但是这个集群已经完成基本组件的安装,是一个能够工作的集群,高可用等基本功能已经具备。
Phase 1:具备基本安全功能的集群。集群启用了认证,授权以及审计的功能。启用认证,只有获得登陆信息的用户才能够访问集群。启用授权,给用户分配权限。启用审计,记录那些用户在集群里面做了怎样的操作。
Phase2:具备高级安全功能的集群。对于部分关键的数据进行加密。使用秘钥管理系统对加密秘钥进行管理。
Phase3:具备完整安全功能的集群。集群所有的数据都进行了加密,加密包括at-rest的加密以及传输过程中的加密。密钥管理系统支持高可用容错。审计功能接入工业级的审计集中平台。
2 安全实现架构
上图是推荐的安全架构。
安全参考架构集中于四个关键要素中:
· 边界安全:保护集群服务访问,且仅向外部企业用户、应用程序和网络公开特定接口(防火墙与认证);
· 访问控制:控制数据用户和应用程序可以访问以及其可以使用什么计算机资源(授权与多租户);
· 数据可视化:报告数据在何处及其如何使用(审计与血缘关系);
· 数据保护:保护敏感数据的可见性(加密)。