Trino权威指南(原书第2版)
Matt Fuller, Manfred Moser, Martin Traverso
罗卓辉, 务志坤, 秦雁翔 王征 译
出版时间:2023年07月
页数:261
“Trino在Pinterest的数据分析中发挥了关键作用,你可以通过本书学习从Trino的使用场景到大规模运行Trino的重要知识。”
——Ashish Kumar Singh
Pinterest 大数据查询处理平台技术负责人
“对于那些希望构建现代化的分析技术栈的公司来说,本书是必读之作。”
——Jay Kreps
Apache Kafka 联合创作者,Confluent 联合创始人兼CEO

使用Trino高性能分布式SQL查询引擎可以对不同的数据源进行快速交互式分析。在本书中,你将学习如何在不迁移数据的情况下对数据进行分析。需要分析的数据,可以存在于使用Hive的传统数据湖中,也可以存在于使用Iceberg、Delta Lake等格式的湖仓一体系统中,或者存在于Cassandra、Kafka或SingleStore等异构系统中,还可以存在于PostgreSQL或Oracle等关系型数据库中。
数据分析师、软件工程师和产品工程师可以学习如何管理、使用Trino,甚至使用Trino进行开发,并使其成为自己的数据平台的关键部分。本书将向你展示如何使用一个Trino查询合并来自多个来源的数据,以便在整个组织中进行数据分析。
通过阅读本书,你将:
● 探索Trino的使用场景,了解与Trino相关的各类工具。
● 学习Trino的内部工作原理,包括如何连接和查询数据源,以及Trino支持的SQL语句、运算符、函数等。
● 了解Trino的安全机制、大规模部署能力、监控工作负载、调优查询,并连接更多应用程序。
● 了解其他组织如何成功应用Trino。
  1. 前言
  2. 第一部分 Trino入门
  3. 第1章 Trino介绍
  4. 1.1 大数据带来的问题
  5. 1.2 Trino来救场
  6. 1.3 Trino使用场景
  7. 1.4 Trino资源
  8. 1.5 Trino简史
  9. 1.6 小结
  10. 第2章 安装和配置Trino
  11. 2.1 使用Docker容器探索Trino
  12. 2.2 使用归档文件安装Trino
  13. 2.3 添加数据源
  14. 2.4 运行Trino
  15. 2.5 小结
  16. 第3章 使用Trino
  17. 3.1 Trino CLI
  18. 3.2 Trino JDBC驱动
  19. 3.3 Trino与ODBC
  20. 3.4 客户端库
  21. 3.5 Trino Web UI
  22. 3.6 使用Trino执行SQL
  23. 3.7 小结
  24. 第二部分 深入理解Trino
  25. 第4章 Trino架构
  26. 4.1 集群中的协调器和工作节点
  27. 4.2 基于连接器的架构
  28. 4.3 catalog、schema和表
  29. 4.4 查询执行模型
  30. 4.5 查询计划
  31. 4.6 优化规则
  32. 4.7 实现规则
  33. 4.8 基于代价的优化器
  34. 4.9 使用表统计信息
  35. 4.10 小结
  36. 第5章 生产环境部署
  37. 5.1 配置细节
  38. 5.2 服务端配置
  39. 5.3 日志
  40. 5.4 节点配置
  41. 5.5 JVM配置
  42. 5.6 启动器
  43. 5.7 集群安装
  44. 5.8 使用RPM安装
  45. 5.9 在云上安装
  46. 5.10 用Helm chart部署Kubernetes
  47. 5.11 考虑集群规模
  48. 5.12 小结
  49. 第6章 连接器
  50. 6.1 配置
  51. 6.2 RDBMS连接器示例:PostgreSQL
  52. 6.3 TPC-H连接器和TPC-DS连接器
  53. 6.4 用于分布式存储数据源的Hive连接器
  54. 6.5 现代分布式存储管理和分析
  55. 6.6 非关系型数据源
  56. 6.7 Trino JMX连接器
  57. 6.8 black hole连接器
  58. 6.9 内存连接器
  59. 6.10 其他连接器
  60. 6.11 小结
  61. 第7章 高级连接器示例
  62. 7.1 用Phoenix连接HBase
  63. 7.2 键值存储连接器示例:Accumulo
  64. 7.3 Apache Cassandra连接器
  65. 7.4 流系统连接器示例:Kafka
  66. 7.5 文档存储连接器示例:Elasticsearch
  67. 7.6 Trino中的联邦查询
  68. 7.7 ETL和联邦查询
  69. 7.8 小结
  70. 第8章 在Trino中使用SQL
  71. 8.1 Trino语句
  72. 8.2 Trino系统表
  73. 8.3 catalog
  74. 8.4 schema
  75. 8.5 information schema
  76. 8.6 表
  77. 8.7 视图
  78. 8.8 会话信息和配置
  79. 8.9 数据类型
  80. 8.10 SELECT语句基础
  81. 8.11 WHERE子句
  82. 8.12 GROUP BY和HAVING子句
  83. 8.13 ORDER BY子句和LIMIT子句
  84. 8.14 JOIN语句
  85. 8.15 UNION、INTERSECT和EXCEPT子句
  86. 8.16 分组操作
  87. 8.17 WITH子句
  88. 8.18 子查询
  89. 8.19 从表中删除数据
  90. 8.20 小结
  91. 第9章 高级SQL特性
  92. 9.1 函数和运算符介绍
  93. 9.2 标量函数和运算符
  94. 9.3 布尔运算符
  95. 9.4 逻辑运算符
  96. 9.5 用BETWEEN语句选择范围
  97. 9.6 用IS (NOT) NULL检测值的存在
  98. 9.7 数学函数和运算符
  99. 9.8 三角函数
  100. 9.9 常数和随机函数
  101. 9.10 字符串函数和运算符
  102. 9.11 字符串和映射
  103. 9.12 Unicode
  104. 9.13 正则表达式
  105. 9.14 解嵌套复杂数据类型
  106. 9.15 JSON函数
  107. 9.16 日期和时间函数及运算符
  108. 9.17 直方图
  109. 9.18 聚合函数
  110. 9.19 窗函数
  111. 9.20 lambda表达式
  112. 9.21 地理空间函数
  113. 9.22 预处理语句
  114. 9.23 小结
  115. 第三部分 Trino的实际应用
  116. 第10章 安全
  117. 10.1 认证
  118. 10.2 授权
  119. 10.3 加密
  120. 10.4 CA与自签名证书
  121. 10.5 证书认证
  122. 10.6 Kerberos
  123. 10.7 数据源访问和安全配置
  124. 10.8 使用Hive连接器进行Kerberos认证
  125. 10.9 集群分离
  126. 10.10 小结
  127. 第11章 将Trino与其他工具集成
  128. 11.1 使用Apache Superset进行查询、可视化和更多操作
  129. 11.2 使用RubiX提高性能
  130. 11.3 使用Apache Airflow的工作流
  131. 11.4 嵌入式Trino示例:Amazon Athena
  132. 11.5 企业版:Starburst Enterprise和Starburst Galaxy
  133. 11.6 其他集成示例
  134. 11.7 自定义集成
  135. 11.8 小结
  136. 第12章 生产环境中的Trino
  137. 12.1 使用Trino Web UI进行监控
  138. 12.2 Trino SQL查询调优
  139. 12.3 内存管理
  140. 12.4 任务并发性
  141. 12.5 工作节点调度
  142. 12.6 网络数据交换
  143. 12.7 JVM调优
  144. 12.8 资源组
  145. 12.9 小结
  146. 第13章 真实世界案例
  147. 13.1 部署和运行时平台
  148. 13.2 集群规模
  149. 13.3 Hadoop/Hive迁移的使用场景
  150. 13.4 其他数据源
  151. 13.5 用户和流量
  152. 13.6 小结
  153. 总结
书名:Trino权威指南(原书第2版)
译者:罗卓辉, 务志坤, 秦雁翔 王征 译
国内出版社:机械工业出版社
出版时间:2023年07月
页数:261
书号:978-7-111-73160-3
原版书书名:Trino: The Definitive Guide, 2nd Edition
原版书出版商:O'Reilly Media
Matt Fuller
 
马特·富勒(Matt Fuller),Starburst公司联合创始人。
 
 
Manfred Moser
 
曼弗雷德·莫泽(Manfred Moser),开源社区拥护者、技术作家、培训师,Starburst公司软件工程师。
 
 
Martin Traverso
 
马丁·特拉韦尔索(Martin Traverso),Presto项目创始成员,Presto软件基金会联合创始人,Starburst公司首席技术官。
 
 
购买选项
定价:109.00元
书号:978-7-111-73160-3
出版社:机械工业出版社