Google BigQuery权威指南
傅建庆, 姜海龙, 罗一鸣, 潘飞 译
出版时间:2021年08月
页数:514
你是否需要从PB级数据中获取洞察,你是否希望构建协作、敏捷的工作空间?本书是Google BigQuery的规范参考书,它的存储系 统可以帮助你整合企业的全部数据,其查询引擎可以支持对大型 数据集的交互式分析和机器学习。BigQuery帮助企业在一个便捷 的框架中有效地存储、查询、导入数据,并从中学习。
本书作者提供了在基于serverless、自动扩缩容的公共云上建立现代数据仓库的最佳实践。无论你是想更全面地了解BigQuery,还 是想专注于特定的任务,这份详尽的指南都必不可少。
● 深入探讨BigQuery的内部工作方式,包括其整体架构。
● 学习BigQuery支持的数据类型、函数和运算符。
● 优化查询语句和schema,从而提高性能或降低成本。
● 使用标准SQL中高级功能,如GIS、历史快照、DDL/DML、用户定义函数和脚本。
● 使用BigQuery ML解决各类机器学习问题。
● 学习如何保护数据、监控作业,以及授权用户。
- 前言
- 第1章 Google BigQuery是什么
- 数据处理架构
- 使用BigQuery
- BigQuery起源
- 是什么使BigQuery成为可能?
- 小结
- 第2章 基础查询语法
- 简单查询
- 使用WHERE进行过滤
- SELECT *、EXCEPT和REPLACE
- 聚合
- 数组与结构体简介
- Join表
- 保存和分享
- 小结
- 第3章 数据类型、函数和运算符
- 数值类型和函数
- 数学函数
- 使用BOOL
- 使用TIMESTAMP
- Date、Time和DateTime
- 使用GIS函数
- 小结
- 第4章 将数据加载到BigQuery
- 基础知识
- 联邦查询和外部数据源
- 传输和导出
- 迁移自有数据
- 小结
- 第5章 使用BigQuery进行开发
- 以编程的方式进行开发
- 通过数据科学工具访问BigQuery
- 通过Bash脚本使用BigQuery
- 小结
- 第6章 BigQuery架构
- 高层架构
- 查询引擎 Dremel
- 存储
- 小结
- 第7章 性能与成本优化
- 需要遵循的原则
- 度量和故障排除
- 优化数据的存储和访问方式
- 时间不敏感的用户场景
- 小结
- 第8章 高级查询
- 可复用查询
- 高级SQL
- 扩展SQL
- 高级函数
- 小结
- 第9章 BigQuery中的机器学习
- 什么是机器学习
- 构建回归模型
- 构建分类模型
- 自定义BigQuery ML
- k-Means聚类
- 推荐系统
- 在GCP上自定义机器学习模型
- 小结
- 第10章 BigQuery安全管理
- 安全基础设施
- IAM
- 管理BigQuery
- 可用性、故障恢复和加密
- 监管与合规
- 小结
书名:Google BigQuery权威指南
译者:傅建庆, 姜海龙, 罗一鸣, 潘飞 译
国内出版社:中国电力出版社
出版时间:2021年08月
页数:514
书号:978-7-5198-5677-9
原版书书名:Google BigQuery: The Definitive Guide
原版书出版商:O'Reilly Media
Valliappa Lakshmanan
Valliappa (Lak) Lakshmanan是Google Cloud的数据分析和AI解决方案负责人。他的团队借助BigQuery和Google Cloud上的其他数据分析、机器学习产品,构建软件解决方案来解决业务问题。
Valliappa Lakshmanan目前是Google云计算平台数据和机器学习专业服务的技术主管。他希望将机器学习普及化,让任何人、在任何地方,无需深入了解统计学、编程知识,也无需购买大量硬件,也可使用Google云平台提供的卓越架构。在加入Google前,Valliappa曾供职于气象局,领导着一个数据科学团队,并且是NOAA国家重大风暴实验室的研究科学家,他曾致力于使用机器学习进行恶劣天气的识别和预测。
Jordan Tigani
Jordan Tigani是BigQuery的产品管理总监。作为BigQuery的创始工程师之一,他帮助数据仓库发展成为Google Cloud中最成功的产品之一。 他拥有20年的软件开发经验。