目录

Ch1 实时流计算

  1. 大数据时代的新挑战:实时流计算
  2. 实时流计算使用场景
  3. 实时流数据的特点

Ch2 数据采集

  1. 设计数据采集的接口
  2. 使用 Spring Boot 实现数据采集服务器
  3. BIO 与 NIO
  4. NIO 和异步
  5. 使用 Netty 实现数据采集服务器

Ch3 实现单节点流计算应用

  1. 自己动手写实时流计算框架
  2. CompletableFuture 方法与原理
  3. 采用 CompletableFuture 实现单节点流处理
  4. 流计算应用的性能调优

Ch4 数据处理

  1. 流计算到底在计算什么
  2. 流数据操作
  3. 时间维度聚合特征计算
  4. 关联图谱特征计算
  5. 事件序列分析
  6. 模型学习和预测

Ch5 实时流计算的状态管理

  1. 流的状态
  2. 采用 Redis 实现流信息状态管理
  3. 采用 Apache Ignite 实现流信息状态管理
  4. 扩展为集群

Ch6 开源流计算框架

  1. Apache Storm
  2. Spark Streaming
  3. Apache Samza
  4. Apache Flink

Ch7 当做不到实时

  1. 做不到实时的原因
  2. Lambda 架构
  3. Kappa 架构与架构实例

Ch8 数据传输

  1. 消息中间件
  2. Apache Kafka
  3. RabbitMQ
  4. Apache Camel

Ch9 数据存储

  1. 存储的设计原则
  2. 点查询
  3. Ad-Hoc 查询
  4. 离线分析
  5. 关系型数据库查询

Ch10 服务治理和配置管理

  1. 服务治理
  2. 面向配置编程
  3. 动态配置
  4. 将前端配置与后端服务配置隔离开

Ch11 实时流计算应用案例

  1. 实时流数据特征提取引擎
  2. 使用 Flink 实现风控引擎