跳至内容
Wiki@桩白墨
用户工具
登录
站点工具
搜索
工具
显示页面
修订记录
反向链接
最近更改
媒体管理器
网站地图
登录
>
最近更改
媒体管理器
网站地图
您的足迹:
book:实时流计算系统架构
本页面只读。您可以查看源文件,但不能更改它。如果您觉得这是系统错误,请联系管理员。
====== 实时流计算系统架构 ====== 5个部分:数据采集、数据传输、数据处理、数据存储和数据展示。 ===== 1 数据采集 ===== 通常而言,数据组织的结构越简单越好,平坦的数据结构比嵌套式数据结构更好,嵌套浅的数据结构比嵌套深的数据结构更好。 ===== 2 数据传输 ===== 选择消息中间件时,考虑以下因素: - 吞吐量 - 延迟 - 高可用 - 持久化 - 水平扩展 ===== 3 数据处理 ===== 通常使用 DAG 来描述流计算过程。 ===== 4 数据存储 ===== 存储方案选择: ^ 目的 ^ 选型 ^ 原因 ^ | 实时查询 | NoSQL数据库 | 更适合大数据量下的实时查询,能获得更高的吞吐能力 | | 数据备份、离线分析 | 分布式文件系统:HDFS 或 S3 | 。| | UI 呈现 | 搜索引擎类:ES | 更好应对未来UI需求变化、各种查询条件调整 | 很多时候必须将相同内容的数据根据不同的需求,同时存入多种不同功能的存储方案中。 ===== 5 数据展示 ===== 形式: * REST API * Web UI 数据可视化是数据展示的核心所在。
book/实时流计算系统架构.txt
· 最后更改: 2020/09/02 16:58 由
plough
页面工具
显示页面
修订记录
反向链接
回到顶部