精通Apache Pulsar:可伸缩云原生事件流实践
蔡正昕, 王殿进, 徐文涛 译
出版时间:2023年12月
页数:224
“用户要有丰富的经验才能知道何时及如何使用Pulsar。Jowanza Joseph正是这样一位有着丰富经验的开发者。阅读本书有助于缩短构建和部署Pulsar应用程序的时间。”
——Johnny Nelson, generativist的高级机器学习工程师
所有企业级应用程序都会产生日志消息、指标、用户活动记录和输出消息等数据。了解如何传输这些数据与了解数据本身同样重要。如果你是对Apache Pulsar还不太熟悉的应用程序架构师、开发者或者产品工程师,那这本实践指南会引导你借助这一开源事件流平台来处理实时数据流。
在本书中,就职于Finicity的主管工程师Jowanza Joseph解释了如何部署生产级别的Pulsar集群,如何编写可靠的事件流应用程序,以及如何基于Pulsar构建可扩展的实时数据处理管道。读者可以通过详尽的示例来学习Pulsar的设计理念、可靠性保证、核心的API,以及包括复制协议、负载均衡管理和存储层在内的架构细节。
本书将帮助读者:
● 理解事件流在大数据生态系统中的作用。
● 使用Pulsar生产者、消费者和读者来写入和读取事件。
● 通过将Pulsar接入外部系统来构建可扩展的数据处理管道。
● 利用Pulsar Functions简化事件流应用程序的构建流程。
● 管理Pulsar集群,包括监控、调优及维护等任务。
● 根据Pulsar提供的运维指标来维护生产级别的集群。
● 利用Flink处理事件流,以及利用Presto查询事件流。
- 前言
- 第1章 实时消息的价值
- 流动的数据
- 资源效率
- 使用场景
- 小结
- 第2章 事件流和事件代理
- 发布/订阅
- 队列
- 故障类型
- 推送与轮询
- 为什么需要Pulsar
- 小结
- 第3章 认识Pulsar
- Pulsar的起源
- Pulsar的设计理念
- Pulsar生态
- Pulsar成功案例
- 小结
- 第4章 Pulsar内部组件
- Broker
- Apache BookKeeper
- Apache ZooKeeper
- Pulsar Proxy
- Java 虚拟机(JVM)
- 小结
- 第5章 消费者
- 成为消费者意味着什么
- 订阅
- 确认
- Schema
- 消费模式
- 高级配置
- 配置消费者
- 小结
- 第6 章 生产者
- 同步生产者
- 异步生产者
- 生产者路由
- 生产者配置
- Schema on Write
- 非持久化主题
- 事务
- 小结
- 第7章 Pulsar IO
- Pulsar IO架构
- 使用场景
- 考量
- 示例
- 创建自己的连接器
- 小结
- 第8章 Pulsar Functions
- 流处理
- Pulsar Functions架构
- 在Kubernetes上部署Pulsar Functions的隔离性
- 使用场景
- 小结
- 第9章 分层存储
- 在云端存储数据
- 使用场景
- 卸载数据
- 检索已卸载的数据
- 小结
- 第10章 Pulsar SQL
- 流即表
- SQL-on-Anything引擎
- Pulsar SQL的工作原理
- 配置Pulsar SQL
- 性能考量
- 小结
- 第11章 部署Pulsar
- Docker
- 裸金属
- 公有云厂商
- Kubernetes
- 小结
- 第12章 运维Pulsar
- Apache BookKeeper指标
- Apache ZooKeeper指标
- 主题指标
- 消费者指标
- Pulsar事务指标
- Pulsar Functions指标
- 高级运维技巧
- 指标转发
- 小结
- 第13章 未来
- 编程语言支持
- 小结
- 附录A Pulsar Admin API
- 附录B Pulsar Admin CLI
- 附录C 跨地域复制
- 附录D Pulsar中的安全、认证和鉴权
书名:精通Apache Pulsar:可伸缩云原生事件流实践
译者:蔡正昕, 王殿进, 徐文涛 译
国内出版社:电子工业出版社
出版时间:2023年12月
页数:224
书号:978-7-121-46717-2
原版书书名:Mastering Apache Pulsar
原版书出版商:O'Reilly Media
Jowanza Joseph
Jowanza Joseph是一位就职于Finicity的软件工程师,他负责领导Finicity开放银行平台的网格开发。Jowanza曾在多个项目中使用Apache Pulsar,并利用基于Pulsar构建的全托管消息和流处理平台实现了日均处理十亿量级的消息。近十年中,Jowanza在Pluralsight等公司的工作中都使用过Apache Kafka、Akka、Kubernetes及其他流技术与消息技术。他还曾在Strange Loop、Abstractions、开源峰会及O’Reilly的Strata Data & AI大会上做过技术分享。