数据自助服务实践指南
Sandeep Uttamchandani
吴瑞诚, 熊畅, 王晓倩 译
出版时间:2022年05月
页数:228
数据驱动的洞察是当今所有行业的关键竞争优势。从原始数据中提取洞察往往需要几天或几周时间,大多数组织无法足够快地扩大数据科学团队以跟上需要转换的数据量的增长。那么如何解决这一问题呢?答案是实现数据自助服务。
通过本书,数据工程师、数据科学家和团队经理将学习如何构建自助数据平台,以帮助组织从数据中提取洞察。作者在书中提供了一个记分卡,用于跟踪并解决在数据发现、转换、处理和生产过程中增加洞察耗时的瓶颈问题。
本书弥合了数据科学家与数据工程师之间的鸿沟——数据科学家被工程现实所束缚,而数据工程师对自助服务的工作方式一无所知。
通过学习本书,你将能够:
● 构建自助服务门户以支持数据发现、数据质量、数据沿袭和数据治理。
● 使用开源技术为每个自助服务功能选择合适的方法。
● 为数据的发现、准备、构建、实施定制自助服务。
● 实现数据开放与洞察提效的功能。
● 扩展自助服务门户,从而为组织内的大量用户提供支持。
  1. 前言
  2. 第1章 数据介绍
  3. 1.1 从原始数据到洞察
  4. 1.2 定义洞察耗时记分卡
  5. 1.3 建立数据自助服务路线图
  6. 第一部分 数据发现自助服务
  7. 第2章 元数据目录服务
  8. 2.1 路线图
  9. 2.2 最小化解释耗时
  10. 2.3 定义需求
  11. 2.4 实现模式
  12. 2.5 总结
  13. 第3章 搜索服务
  14. 3.1 路线图
  15. 3.2 最小化搜索耗时
  16. 3.3 定义需求
  17. 3.4 实现模式
  18. 3.5 总结
  19. 第4章 特征存储服务
  20. 4.1 路线图
  21. 4.2 最小化特征处理耗时
  22. 4.3 定义需求
  23. 4.4 实现模式
  24. 4.5 总结
  25. 第5章 数据迁移服务
  26. 5.1 路线图
  27. 5.2 最小化数据可用性耗时
  28. 5.3 定义需求
  29. 5.4 实现模式
  30. 5.5 总结
  31. 第6章 点击流跟踪服务
  32. 6.1 路线图
  33. 6.2 最小化点击指标耗时
  34. 6.3 定义需求
  35. 6.4 实现模式
  36. 6.5 总结
  37. 第二部分 数据准备自助服务
  38. 第7章 数据湖管理服务
  39. 7.1 路线图
  40. 7.2 最小化数据湖管理耗时
  41. 7.3 实现模式
  42. 7.4 总结
  43. 第8章 数据整理服务
  44. 8.1 路线图
  45. 8.2 最小化数据整理耗时
  46. 8.3 定义需求
  47. 8.4 实现模式
  48. 8.5 总结
  49. 第9章 数据权限治理服务
  50. 9.1 路线图
  51. 9.2 最小化合规耗时
  52. 9.3 定义需求
  53. 9.4 实现模式
  54. 9.5 总结
  55. 第三部分 数据构建自助服务
  56. 第10章 数据虚拟化服务
  57. 10.1 路线图
  58. 10.2 最小化查询耗时
  59. 10.3 定义需求
  60. 10.4 实现模式
  61. 10.5 总结
  62. 第11章 数据转换服务
  63. 11.1 路线图
  64. 11.2 最小化转换耗时
  65. 11.3 定义需求
  66. 11.4 实现模式
  67. 11.5 总结
  68. 第12章 模型训练服务
  69. 12.1 路线图
  70. 12.2 最小化训练耗时
  71. 12.3 定义需求
  72. 12.4 实现模式
  73. 12.5 总结
  74. 第13章 持续集成服务
  75. 13.1 路线图
  76. 13.2 最小化集成耗时
  77. 13.3 定义需求
  78. 13.4 实现模式
  79. 13.5 总结
  80. 第14章 A/B测试服务
  81. 14.1 路线图
  82. 14.2 最小化A/B测试耗时
  83. 14.3 实现模式
  84. 14.4 总结
  85. 第四部分 实施自助服务
  86. 第15章 查询优化服务
  87. 15.1 路线图
  88. 15.2 最小化优化耗时
  89. 15.3 定义需求
  90. 15.4 实现模式
  91. 15.5 总结
  92. 第16章 管道编排服务
  93. 16.1 路线图
  94. 16.2 最小化编排耗时
  95. 16.3 定义需求
  96. 16.4 实现模式
  97. 16.5 总结
  98. 第17章 模型部署服务
  99. 17.1 路线图
  100. 17.2 最小化部署耗时
  101. 17.3 定义需求
  102. 17.4 实现模式
  103. 17.5 总结
  104. 第18章 质量可观测性服务
  105. 18.1 路线图
  106. 18.2 最小化洞察质量耗时
  107. 18.3 定义需求
  108. 18.4 实现模式
  109. 第19章 成本管理服务
  110. 19.1 路线图
  111. 19.2 最小化优化成本耗时
  112. 19.3 定义需求
  113. 19.4 实现模式
  114. 19.5 总结
书名:数据自助服务实践指南
译者:吴瑞诚, 熊畅, 王晓倩 译
国内出版社:机械工业出版社
出版时间:2022年05月
页数:228
书号:978-7-111-70385-3
原版书书名:The Self-Service Data Roadmap
原版书出版商:O'Reilly Media
Sandeep Uttamchandani
 
Sandeep Uttamchandani博士是Unravel Data Systems的首席数据官兼产品工程副总裁。他在构建企业数据产品和运行PB级数据平台(用于关键业务分析和机器学习应用程序)方面拥有近20年的经验。最近,他在Intuit管理数据平台团队,为Intuit的财务会计、工资单和支付产品提供分析和机器学习支持。Sandeep之前是一家使用机器学习管理开源产品安全漏洞的初创公司的联合创始人兼CEO。他在VMware和IBM担任工程领导职务超过15年。
Sandeep拥有40多项已授权的专利,在重要技术会议上发表了几十篇论文,并获得了多项产品创新和管理卓越奖。他是数据会议的常客,也是大学的客座讲师。他为初创企业提供咨询服务,并曾担任多个会议的项目/指导委员会成员,还担任Gartner’s SF CDO和Usenix Operational ML(OpML)会议的联合主席。Sandeep拥有伊利诺伊大学香槟分校的计算机科学博士和硕士学位。
 
 
本书封面上的动物是汤森大耳蝠(Corynorhinus townsendii)。这种飞行哺乳动物原产于北美洲西部,大量栖息于犹他州和科罗拉多州等落基山州的松林中,在墨西哥南部也可以看到。
在夏季,它们更喜欢待在温度低且稳定的开阔区域,比如洞穴、悬崖,甚至废弃的矿区。雄性通常独自栖息,雌性则会在12~200 只的母性群体中饲养幼崽。汤森大耳蝠的羽翼面积质量比较大,具备高机动性、低速飞行和飞行时悬停的能力。它们的直线飞行速度在6.4~12.3 英里/ 时(1 英里/ 时≈1.6 千米/ 时)之间。
汤森大耳蝠的大耳朵使它们能够准确地导航和捕猎。它们从喉部发出低频脉冲,仅持续几千分之一秒,然后从物体上反弹并回到耳朵。通过这些快速传播的信号,它们能确定主要猎物—飞蛾(飞蛾约占它们食物的80%)的形状、大小、距离,甚至质地。这种蝙蝠可以有效地防治害虫,有助于减少昆虫对环境和农业造成的损害。
O’Reilly 封面上的许多动物都濒临灭绝,它们对世界都很重要。
购买选项
定价:99.00元
书号:978-7-111-70385-3
出版社:机械工业出版社