大数据湖最佳实践
Alex Gorelik
傅建庆, 崔齐挺, 郑伟杰, 许闹 译
出版时间:2020年07月
页数:240
“Alex是位富有远见的数据人。他把他的实践见解融入到本书,探讨了过渡到数据驱动型企业涉及的技术因素、对公司整体的影响以及由此产生的对业务的影响。”
——Keyur Desai
TD Ameritrade首席数据官
“本书很好地阐述了各类数据湖的架构,包括它们提供了什么价值,带来了哪些挑战,以及如何应对这些挑战。”
——Jari Koister
FICO产品和技术副总裁
加州大学伯克利分校的数据科学教授展开全部内容介绍
  1. 前言
  2. 第1章 数据湖概述
  3. 数据湖的成熟度
  4. 创建成功的数据湖
  5. 成功实施数据湖的路线图
  6. 构建数据湖
  7. 小结
  8. 第2章 历史背景
  9. 数据自助服务驱动——数据库的诞生
  10. 分析必要性驱动——数据仓库的诞生
  11. 数据仓库生态系统
  12. 小结
  13. 第3章 大数据和数据科学概述
  14. Hadoop引领大数据的历史性转变
  15. 数据科学
  16. 你的分析机构应该关注什么?
  17. 机器学习
  18. 小结
  19. 第4章 建立数据湖
  20. 为什么是Hadoop
  21. 防止数据水洼扩散
  22. 利用大数据的优势
  23. 小结
  24. 第5章 从数据池/大数据仓库到数据湖
  25. 数据仓库的基本功能
  26. 迁移至数据池
  27. 数据池演化为数据湖——加载数据仓库中未包含的数据
  28. 实时数据湖
  29. Lambda架构
  30. 数据转换
  31. 目标系统
  32. 小结
  33. 第6章 自助服务优化
  34. 自助服务起源
  35. 业务分析师
  36. 数据湖数据整理
  37. 分析和可视化
  38. 自助式商业智能的新世界
  39. 小结
  40. 第7章 数据湖架构
  41. 规划数据湖
  42. 多数据湖
  43. 云上数据湖
  44. 虚拟数据湖
  45. 小结
  46. 第8章 数据湖元数据
  47. 组织数据
  48. 打标
  49. 逻辑数据管理
  50. 连接分散的数据
  51. 建立血缘关系
  52. 数据预置
  53. 创建目录的工具
  54. 数据洋
  55. 小结
  56. 第9章 数据访问控制
  57. 授权与访问控制
  58. 基于标签的控制策略
  59. 数据脱敏
  60. 自助服务访问管理
  61. 小结
  62. 第10章 行业案例
  63. 金融服务大数据
  64. 数据湖为金融服务领域带来的价值
  65. 保险行业中的数据湖
  66. 智慧城市
  67. 医疗大数据
购买选项
定价:68.00元
书号:978-7-5198-4590-2
出版社:中国电力出版社