Hadoop虚拟化
编者注:更多内容可以参考Strata北京2017的相关议题。
Hadoop是一个流行的灵活的且费效比高的框架,可用来分析非结构化数据。2012年全球Hadoop市场的价值有15亿美元,估计到2020年会有500亿美元。企业现在可以选择部署Hadoop集群到物理的服务器环境、私有云环境或者是公有云环境。在这一增长期内,我们还看不出哪种模式会占据优势,不过私有云环境所具有的高安全性和细粒度的控制也许能让这一模式在大中型企业中成为主流。与其他模式相比, 私有云里的Hadoop集群有以下独特的好处:
• 几分钟内就可以搭建一个集群。
• 各种类型的硬件(DAS、SAN、NAS)可以灵活地使用。
• 费效比高,比物理机器部署的模式的投资要少,比公有云部署模式的运维成本低。
• 简化的管理工具可以降低初始配置和维护的复杂性。
• 高可靠性和容错性能可增加系统在线时间。
本报告检视了在私有云环境或汇聚模式(基于容器)下部署Hadoop的好处,并给出了最大化性能的最佳实践的概览。