设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 手机 数据
当前位置: 首页 > 运营中心 > 建站资源 > 策划 > 正文

一篇文章带你了解当下主流的监控工具

发布时间:2019-05-22 06:51 所属栏目:20 来源:老王谈运维
导读:监控做为自动化运维的重要组成部分,承担着反馈的作用。 以往,在缺少告警机制的情况下,企业无法第一时间洞悉到系统发生故障,只能通过用户的反馈来获取,系统运维人员往往也只是充当了一个救火 队员,大面积的系统瘫痪往往也会给企业和用户带来极大的损

监控做为自动化运维的重要组成部分,承担着反馈的作用。

以往,在缺少告警机制的情况下,企业无法第一时间洞悉到系统发生故障,只能通过用户的反馈来获取,系统运维人员往往也只是充当了一个“救火” 队员,大面积的系统瘫痪往往也会给企业和用户带来极大的损失

当下,通过监控,企业可以在系统受损的第一时间得到反馈,及时处理问题,大大减小了系统故障对企业和用户造成的影响,更有可以做到无感知的修复。

一篇文章带你了解当下主流的监控工具

选择监控工具的原则是根据公司业务场景选择,而不要盲目的追求新工具(如果公司内部有一定的研发能力,且对监控工具的需求比较大,那尝试新工具也未尝不可)。

但是大多数企业对于监控都是新模块,面对琳琅满目的监控工具,不知所措。是选择便宜的商业软件,还是选择开源工具自主开发,还是选择第三方公司外包。今天就跟大家分享目前市场上最热的十个监控工具详解,希望能够帮助您更好的选择到合适的监控工具。

Prometheus

官方网站:https://prometheus.io/docs/introduction/overview/

Prometheus是一套开源的监控系统,它将所有信息都存储为时间序列数据;因此实现一种Profiling监控方式,实时分析系统运行的状态、执行时间、调用次数等,以找到系统的热点,为性能优化提供依据。

一篇文章带你了解当下主流的监控工具

本身的功能在于数据的提取,不具备监控功能,但是依靠它周边组件从而实现了强大的监控功能。

优点:

  • 易管理性,核心部分只有一个单独的二进制文件,可直接在本地工作,不依赖于分布式存储。
  • 业务数据相关性,监控服务的运行状态,从而让用户可以获取服务和应用内部真正的运行状态。
  • 高效,单一Prometheus可以处理数以百万的监控指标;每秒处理数十万的数据点。
  • 易于伸缩,通过使用功能分区(sharing)+联邦集群(federation)可以对Prometheus进行扩展,形成一个逻辑集群;Prometheus提供多种语言的客户端SDK。
  • 良好的可视化,自带有Prometheus UI,还提供了一个独立的基于Ruby On Rails的Dashboard解决方案Promdash。

缺点:

  • 对于Prometheus的使用者来说,所有的公制端点都必须是可达的,这意味着一个更加复杂的安全网络配置。
  • 在大型部署中,扩展成为一个问题,Prometheus建议采用一种基于推特的方法来收集短期的工作指标。
  • Prometheus的主要设计目标之一是操作简单性。这样,Prometheus就限制了监控系统的可能失效模式数量,遵循着一原则,Prometheus目前只局限于单个点,因为集群带来了额外的操作复杂性,使用单个节点不那么复杂,但是对可以由Prometheus监控的度量指标适量有着严格的限制。

Zabbix

官方网站:https://www.zabbix.com/

Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案,在企业中有非常全面的应用,也是目前国内互联网用户中使用最广的监控软件。

一篇文章带你了解当下主流的监控工具

入门容易、上手简单、功能强大并且开源免费是对Zabbix的最直观评价。Zabbix易于管理和配置,能生成比较漂亮的数据图,其自动发现功能大大减轻日常管理的工作量,丰富的数据采集方式和API接口可以让用户灵活进行数据采集,而分布式系统架构可以支持监控更多的设备。理论上,通过Zabbix提供的插件式架构,可以满足企业的任何需求。

优点:

  • 支持多平台的企业级分布式开源监控软件
  • 安装部署简单,多种数据采集插件灵活集成
  • 功能强大,可实现复杂多条件告警,
  • 自带画图功能,得到的数据可以绘成图形
  • 提供多种API接口,支持调用脚本
  • 出现问题时可自动远程执行命令(需对agent设置执行权限)

缺点:

  • 项目批量修改不方便;
  • 中文资料较少,服务支持有限:
  • 入门容易,但是深层次需求需要非常熟悉 Zabbix 并进行大量的二:次定制开发,难度较大;
  • 系统级别报警、报警邮件、自定义项目报警需要自己设置,过程繁琐;
  • 缺少数据汇总功能,数据报表也需进行二次开发。

Nagios

官方网站:https://www.nagios.org/

Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知运维人员,在状态恢复后发出正常的邮件或短信通知。

一篇文章带你了解当下主流的监控工具

Nagios提供一个基于浏览器的web界面,方便管理人员查看系统的运行状态,网络状态、服务状态、日志信息,以及其他异常现象。

优点:

  • 出错的服务器、应用和设备会自动重启,自动日志滚动
  • 配置灵活,可以自定义shell脚本,通过分布式监控模式
  • 支持以冗余方式进行主机监控,报警设置多样
  • 命令重新加载配置文件无需打扰Nagios的运行

缺点:

  • 事件控制台功能弱,插件易用性差
  • 对性能、流量等指标的处
  • 无历史数据,难追查故障
  • 配置复杂,初学者费时长

Open-falcon

官方网址:http://open-falcon.org/

小米的监控系统:OpenFalcon是一款企业级、高可用、可扩展的开源监控解决方案。

一篇文章带你了解当下主流的监控工具

可以从运营级别(基本配置即可),以及应用级别(二次开发,通过端口进行日志上报),对服务器、操作系统、中间件、应用进行全面的监控,及报警。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读