Kudu:构建高性能实时数据分析存储系统
Jean-Marc Spaggiari, Mladen Kovacevic, Brock Noland, Ryan Bosshart
常冰琳 译
出版时间:2019年04月
页数:192
要在Hadoop生态系统中实现对数据的快速输入和分析,开发人员和架构师只有少数可用但是不够完美的解决方案可选择,要么以缓 慢的数据输入为代价实现快速分析,要么以缓慢的分析为代价实现快速的数据输入。这个问题现在有了解决办法。使用Kudu提供的基于列的数据存储,你可以很容易地对快速输入的数据进行快速的分析。这就是本书的内容。
Kudu始于Cloudera的一个内部项目,是一个与Hadoop生态系统中的 许多数据处理框架兼容的开源解决方案。在本书中,Cloudera的现任和前任解决方案专家提供了用例、示例、有用实践和代码,以帮助你快速熟悉Kudu。
● 探索Kudu的高级设计,包括如何把数据分散到多台服务器
● 全面管理一个Kudu集群,启用安全功能,添加或删除节点
● 了解Kudu的客户端API,包括如何集成Impala、Spark和其他框架 来处理数据
● 学习Kudu的模式设计,包括成功实施项目所必须了解的基本概念 和元素
● 探索使用Kudu进行实时物联网分析、预测建模以及与其他存储引 擎组合等应用场景
  1. 前言
  2. 第1章 为什么会有Kudu
  3. Kudu为什么重要
  4. 易用性驱动接纳度
  5. 新的应用场景
  6. 物联网
  7. 现有的实时分析方案
  8. 实时处理
  9. 硬件环境
  10. Kudu在大数据生态中的独特位置
  11. 与其他生态系统的组件对比
  12. 与大数据组件对比——HDFS、HBase和Cassandra
  13. 小结
  14. 第2章 Kudu简介
  15. Kudu的高层设计
  16. Kudu中的角色
  17. master服务器
  18. tablet服务器
  19. Kudu中的概念与机制
  20. 热点
  21. 分区
  22. 第3章 安装与运行
  23. 安装
  24. 使用Kudu Quickstart VM
  25. 使用Cloudera Manager
  26. 从源代码构建
  27. 软件包
  28. Cloudera Quickstart VM
  29. 快速安装:3分钟或者更短
  30. 小结
  31. 第4章 Kudu的管理
  32. 为Kudu做规划
  33. master服务器和tablet服务器
  34. 预写日志
  35. 数据服务器和存储
  36. 复制策略(replication strategy)
  37. 部署时的注意事项:是采用新集群还是现有集群
  38. 全新的仅有Kudu的集群
  39. 全新的包含Kudu的Hadoop集群
  40. 在现有的Hadoop集群中添加Kudu
  41. tablet服务器和master服务器的Web UI
  42. master服务器UI和tablet服务器UI
  43. master服务器UI
  44. tablet服务器UI
  45. Kudu命令行接口
  46. 集群
  47. 文件系统
  48. tablet副本
  49. 与Raft一致性相关的元数据
  50. 添加和删除tablet服务器
  51. 添加tablet服务器
  52. 删除tablet服务器
  53. 安全
  54. 一个简单的类比
  55. Kudu的安全功能
  56. 基本的性能调优
  57. Kudu的内存限制
  58. 维护管理器的线程
  59. 监控性能
  60. 未雨绸缪,远离麻烦
  61. 避免耗尽磁盘空间
  62. 容忍磁盘故障
  63. 备份
  64. 小结
  65. 第5章 Kudu常用的开发接口
  66. 客户端API
  67. Kudu Client(客户端)
  68. Kudu Table
  69. Kudu DDL
  70. Kudu扫描器(Scanner)读取模式
  71. C++ API
  72. Python API
  73. 准备Python开发环境
  74. 使用Python开发Kudu应用
  75. Java
  76. Java应用
  77. Spark
  78. 在Impala中使用Kudu
  79. 第6章 表和模式设计
  80. 模式设计基础
  81. 在线事务处理/在线分析处理混合的模式设计
  82. Lambda架构
  83. OLTP/OLAP拆分
  84. 主键和列的设计
  85. 列模式的其他注意事项
  86. 分区的基础知识
  87. 范围分区
  88. 哈希分区
  89. 模式的更改
  90. 最佳实践和提示
  91. 分区
  92. 大对象
  93. decimal(十进制数)
  94. 不重复的字符串
  95. 压缩
  96. 对象的命名
  97. 列的数量
  98. 二进制类型
  99. 网络包示例
  100. 小结
  101. 第7章 Kudu用例
  102. 实时物联网分析
  103. 预测建模
  104. 多平台混合方案
书名:Kudu:构建高性能实时数据分析存储系统
译者:常冰琳 译
国内出版社:电子工业出版社
出版时间:2019年04月
页数:192
书号:978-7-121-29541-6
原版书书名:Getting Started with Kudu
原版书出版商:O'Reilly Media
Jean-Marc Spaggiari
 
Jean-Marc Spaggiari是Cloudera的首 席解决方案架构师,为Hadoop、Kudu、HBase和其他工具提供技术支持服务。
 
 
Mladen Kovacevic
 
Mladen Kovacevic是一位软件开发者、讲师、作者和解决方案架构师,为客户实施大数据项目提供指导。
 
 
Brock Noland
 
Brock Noland是phData的总架构师,以及Apache软件基金会的成员。
 
 
Ryan Bosshart
 
Ryan Bosshart是phData的CEO,该公司提供“as a service(服务化)” 的Kudu和大数据平台,支持机器学习、数据分析和实时服务类应用。
 
 
购买选项
定价:59.00元
书号:978-7-121-29541-6
出版社:电子工业出版社