支持百亿请求的微博广告运维技术实践
▲ 图2-12 业务查询 三、海量指标监控平台Oops实践 最后我们看下我们如何应对微博广告海量指标数据下多维的监控需求。前文也说了,监控报警就像我们的眼睛,能够让我们实时的看到我们系统内部的运行情况,因此,每一个服务都应该有一些关键指标通过我们的监控报警系统展示出来,实时反馈系统的健康状态。 如图3-1所示,做一个监控平台很容易,我们将指标、日志等数据进行ETL清洗后写入一个时序数据库中,再通过可视化工具展示出来,对于有问题的指标通过邮件或者微信的方式报警出来。但是在这个过程中,随着我们数据量的增长、我们指标的增长以及查询复杂度的增加,我们可能会遇到监控指标延迟、数据偏差以及系统不稳定等问题。 ▲ 图3-1 监控平台的挑战 因此,在设计我们的监控系统时,就不能仅仅基于实现考虑,还需要考虑它的稳定性、实施性、准确性,同时还应尽量把系统做的简单易用。 ▲ 图3-2 监控平台的目标 而我们目前的监控平台Oops,也是基于上述原则,经历了多年的迭代和考验。图3-3是我们Oops监控平台当前的整体架构。 ▲ 图3-3 Oops监控平台架构 ① 数据采集 整个平台分为四个层次,首先是我们的数据采集。我们当前主要通过Filebeat这样一款优秀的开源采集客户端来采集我们的日志。对我们使用而言,Filebeat足够的高效、轻量,使用起来也很灵活易用。 ▲ 图3-4 Filebeat架构图 ② 指标清洗 数据采集到Kafka后,我们再根据具体的业务需求将指标提取出来。如图3-5所示,当前我们主要通过Flink来解析日志,并写入ClickHouse中。 (编辑:泰州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- 升级到Windows 10操作系统后怎么清理C盘中的垃圾?
- Chrome非触控模式曝光 谷歌欲杀入功能机市场?
- 操作系统常用调度算法 你知道几个?
- 华为宣布方舟编译器将于8月31日开源
- Win10卸载应用商店后怎么恢复 Win10卸载应用商店后恢复方法
- windows-7 – 在Windows 7中将程序作为域管理员帐户运行并以
- 万维网之父推开源项目Solid:将Web去中心化/让用户掌控数据
- Windows不安装虚拟机怎样使用Linux系统作为开发工具?
- Exchange – Office 365的所有外部邮件都失败了SPF,在混合部
- 我应该安装Windows Management Framework 3.0吗?