糖尿病康复,内容丰富有趣,生活中的好帮手!
糖尿病康复 > 运维 放过监控-也放过自己吧

运维 放过监控-也放过自己吧

时间:2018-11-03 16:43:49

相关推荐

运维 放过监控-也放过自己吧

根据多年和运维打交道的经历,我发现,运维常常让监控变得无效。。。

1.我的监控故事

我做过两年多的运维工作,后面就转做运维平台开发了,也一步步看着监控系统越来越没用。

1.1 有用的监控

当我做运维要负责oncall时,我一直认为监控系统做的还可以,并不是因为做了太多事情,而是因为运维的业务还是单体应用,也没有太多的监控需要加。

记得那会公司还是用Nagios(估计新人已经没多少人知道了),不过监控的维护工作着实费劲。后面我就开始研究zabbix,最大的好处就是它可以discovery&自动添加监控。后面我又搭了一套ELK,把业务日志都收集到一起,监控就齐活了。由于没有添加太多告警,那会的每个告警基本都得处理,最常见的问题就是百度来爬数据,我有一套屡试不爽的处理流程:1.看指标:如果是xx业务的负载高, 有90%的概率是爬虫导致的2.看日志:在kibana上看访问记录,找出topx的IP段3.封访问:用iptables封掉

这就是我唯一一段的运维监控经历。由于业务简单、监控原始反而让我感觉告警是有用的。

1.2 无用的仪表盘

1.2.1 疯狂自动化

当我转运维开发后,我发现运维对监控的需求也变了。因为自动化能力的提升,各种开源的监控系统逐步完善,运维就开始在平台里面拼命的加各种自动化的需求,对于监控系统就是自动的给业务绑定各种监控模板、告警模板、grafana仪表盘

如果觉得《运维 放过监控-也放过自己吧》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。