精通Azure数据分析
马睿 译
出版时间:2018年09月
页数:384
Microsoft Azure在存储、处理和分析不同摄取速度、形态和大小的数据方面提供了超过25种平台即服务(PaaS)功能,用以实现数据分析管道。对于你的公司业务来说,该如何选择恰当的功能呢?针对如何建立Azure大数据分析解决方案这一问题,本书提供了极具实践性的参考框架。
本书作者介绍了包括数据湖和Lambda架构在内的基本概念,同时结合示例代码详细解释了数据分析管道中的各个阶段。为了帮助你在数据分析的各个阶段中选择适当的Azure服务,本书还通过一个案例场景对全书内容进行了扩展,对书中所涉及的各项Azure服务,以示例代码的形式展示了它们在现实世界中的真实用例。
理解如何存储超大规模数据。
● 设计并实施可提供快速“热”查询和精确“冷”结果的解决方案。
● 以批量数据处理、实时微批量或一次处理一个元组的方式处理实时数据。
● 将机器学习与你的数据管道相集成。
● 数据资产的管理、治理和安全。
● 使用示例代码,这些代码由C#、Scala、Java,以及现代数据分析管道中各种服务所使用的原生语言编写。
- 序
- 前言
- 第1章 企业数据分析基础
- 数据分析管道
- 数据湖
- Lambda架构
- Kappa架构
- 在Lambda和Kappa间进行选择
- Azure分析管道
- 数据分析场景介绍
- 示例代码和示例数据集
- 小结
- 第2章 将数据导入Azure
- 摄取加载层
- 批量数据加载
- 硬盘传送
- 流数据加载
- 小结
- 第3章 在Azure中存储摄取的数据
- 文件存储
- 队列存储
- 小结
- 第4章 Azure中的实时数据处理
- 流处理
- 在Azure中每次处理一个元组
- 小结
- 第5章 Azure中的实时微批处理
- Azure中的微批处理
- 小结
- 第6章 Azure中的批处理
- HDInsight上的MapReduce批处理
- HDInsight上的Hive批处理
- HDInsight上的Pig批处理
- HDInsight上的Spark批处理
- 使用SQL数据仓库的批处理
- 使用数据湖分析的批处理
- Azure Batch批处理
- 小结
- 第7章 Azure中的交互式查询
- Azure SQL数据仓库的可交互式查询
- Hive和Tez交互式查询
- Spark SQL交互式查询
- USQL交互式查询
- 小结
- 第8章 Azure中的冷\热访问服务层
- Azure Redis缓存
- Document DB
- SQL 数据库
- SQL数据仓库
- HDInsight上的HBase
- Azure搜索
- 小结
- 第9章 智能和机器学习
- Azure机器学习
- HDInsight上的R服务
- SQL R服务
- Microsoft认知服务
- 小结
- 第10章 Azure中的元数据管理
- 使用Azure数据目录管理元数据
- 小结
- 第11章 保护在Azure中的数据
- 身份和访问管理
- 数据保护
- 审计
- 小结
- 第12章 执行数据分析
- 使用Power BI进行分析
- 在蓝色天际机场场景中使用Power BI批量分析报表
- 展望
书名:精通Azure数据分析
译者:马睿 译
国内出版社:中国电力出版社
出版时间:2018年09月
页数:384
书号:978-7-5198-2097-8
原版书书名:Mastering Azure Analytics
原版书出版商:O'Reilly Media
Zoiner Tejada
Zoiner Tejada,架构师,拥有超过18年软件行业咨询经验,在云计算、大数据、数据分析和机器学习方面拥有卓越见解。鉴于他在Azure和数据平台(Data Platform)两个方面的贡献,Microsoft在这两个领域都向他授予了MVP(Microsoft最有价值专家)称号。