大数据项目管理:从规划到实现
薛命灯 译
出版时间:2019年12月
页数:139
许多公司会在大数据项目的实施细节上下很多功夫,例如研究分布式处理引擎和数据分析算法。这并没有错,但不要因为一棵树而错过整片森林。本书将为你打开更广阔的视野,展示如何从大数据项目的规划阶段开始,一步步走向成功。无论是首席信息官、首席技术官、项目经理,还是架构师和开发人员,都能通过本书得到启迪。
● 开始规划:思考大数据项目的主要类型
● 评估和选择数据管理解决方案
● 降低与技术、团队、需求相关的风险
● 探索良好的接口设计模式
● 为项目选择合适的分布式存储系统
● 规划和实施元数据收集
● 使用数据管道确保数据完整性
● 根据并行处理引擎的特征评估处理框架
书名:大数据项目管理:从规划到实现
译者:薛命灯 译
国内出版社:人民邮电出版社
出版时间:2019年12月
页数:139
书号:978-7-115-45736-3
原版书书名:Foundations for Architecting Data Solutions
原版书出版商:O'Reilly Media
Ted Malaska
特德·马拉斯卡(Ted Malaska), Capital One的企业架构主管,曾在暴雪娱乐公司担任全球视野工程总监,负责为《魔兽世界》《守望先锋》《炉石传说》等游戏提供支持。他为众多开源项目贡献过代码,并与塞德曼等人合著有《Hadoop应用架构》。
Cloudera公司的解决方案架构师,致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局(FINRA,Financial Industry Regulatory Authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。
Jonathan Seidman
Cloudera公司的解决方案架构师,协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组(Chicago Hadoop User Group)及芝加哥大数据(Chicago Big Data)的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管,为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。