监控以及zabbix监控基础一
一:监控组成部分。
成都创新互联公司自2013年创立以来,是专业互联网技术服务公司,拥有项目成都做网站、成都网站建设、成都外贸网站建设网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元遵义做网站,已为上家服务,为遵义各地企业和个人服务,联系电话:13518219792
传感器:收集数据检测数据。
数据采集:CPU利用率 磁盘空间,内存 带宽 用户上线率==。
数据存储(时间序列数据) 数据展示(图形) 报警
(采集到的数据超出阈值)
IT系统监控机制:我们利用一个平台(网络监控系统NMS)来定期向对被监控机发出数据要求,由被监控机进行数据采集然后反馈给监控机(周期性)。采集过来之后实现存储,然后来进行数据分析。
SNMP协议:简单网络管理协议 Simple Network Management Protocol(由监控端和被监控端组成)
SNMP协议版本:v1,(没有认证功能)v2(NMS--》agent共享秘钥明文验证),v3实现了认证加密和解密功能
SNMP工作模式:
一:监控端(NMS)主动发起请求到被监控端采集数据。
二:被监控端(Agent)主动发起向监控端汇报数据。
三:一旦监控端发现被监控端出现异常状态,管理端向被监控端发起修改数据。
SNMP的组件:
MIB:management information base(管理信息库)所有的任何一个被监控的资源都可以描述未监控对象的集合。浮点型,×××等等。NMS跟Agent之间的接口。通过他来发送请求,实现数据交互(瘦管道所以端口强大。协议太简单,所以先规定好文件。)
MIB视图:定义执行节点,绘制MIB树状结构较大(譬如通过Agent对C的某一项指标执行对B和其他执行忽略)
从跟向下,每一个可被监控的对象都有自己的OID。(不仅仅包含MIB系统也有其他的监控对象)
SMI:关于MIB的表示符号
SNMP协议基于TCP/TP协议实现网络管理本身。
NMS可发起的操作
Get,获取数据,GetNext.获取多个参数,Set修改配置,Trap捕获每一个被监控端发来的主动报告数据。
Agent:Response,返回一个或多个操作值。
UDP(基于端口) 、
NMS:161
agent:162
linux使用snmp:net-snmp程序包
必须能够实现:注意到一个被监控的对象万一发生状态转换时,第一次的软状态进行多次采样之后变成硬状态才能报警。
Nagios:灵活调用各种各样的端口进行强大的报警机制。从软件发生硬状态的时候,立即报警。(邮件和短信)定制报警频率。在指定时间段内完成报警,报警进行升级依次给高级别。定义在维护时间内无需报警(在一个窗口内,发生数据变换不会执行报警操作)。定义被监控节点的依赖关系、避免受到由某一节点断影响其他获得大量报警。不太适用于大规模使用众多指标的环境中。不能很好的实现分布式监控系统。不收集具体的数据,只关心是否异常状态转变,并完成数据报警。
Zabbix:结合cacti和Nagios的俩者优点。一旦监控到某一个指标发生异常时,会远程调用脚本来进行解决,然才向上实现报警。完成数据采集,存储采集,展示并且才报警得一体化功能。
著名的开源监控工具:zabbix,zennos,opennms,cacti,nagios(icinga),ganglia.
zabbix监控功能的实现:通过专门的zabbix进程来获取被监控机的超级管理权限,来进行数据采集。(完成本地命令或本地脚本执行,来进行操作重启或其他配置。再次监听发现还未起来,则才报警)
模式支持:专用agent,ssh,SNMP,IPMI
IPMI:智慧平台管理接口。控制监控服务器的启动,关闭等等。
zabbix:拥有自己专用的agent的监控工具。
监控主机:
linux/windows/freeBSD
网络设备:
SNMP,SSH(并非所有)
可监控对象:
设备/软件
设备:服务器、路由器、交换机、IO系统
软件:OS、网络、应用程序
偶发性小故障:
服务器宕机、服务不可用、主机不可达
严重故障:磁盘满啦,内存啦。cpu啦等等
主机性能指标
趋势:时间序列数据(一定时间段内的某一项指标)
数据存储:
cacti:rrd(round robin datebase环状数据库不被持久保存所有数据会覆盖)
zabbix:MySQL.pgsql。(调用mysql的API接口来保存绘图数据来进行操作)
1998开始,2001正式启动。2009 1.8版本就越发成熟。2.4的版本最新。
zabbix企业级监控,可监控多达10万台设备。
真正开源,各种用户多达4W多个。支持的监控系统包含,mac,windows hp,unix aix reeBSD openBSD linux SOLARIS
zabbix工作流程:周期不断采集存储数据,定义一个触发器或多个对每一个监控器阈值指标来产生异常事件,触发action,执行程序、发送报警。绘图接口将数据取出来绘制走势图来进行展示,实现数据的可视化。交予流量较大,磁盘IO、网络IO等等,所以进行分布式监控。
分布式监控:形成代理,从代理来进行监控取值,来减少中心控制的压力。实现不同地域的监控。
自动化监控系统
文章名称:监控以及zabbix监控基础一
分享路径:http://scyanting.com/article/igohij.html