20.23/20.24/20.25 告警系统邮件引擎 20.26 运行告警系统
发布日期:2021-08-20 07:55:04 浏览次数:2 分类:技术文章

本文共 1294 字,大约阅读时间需要 4 分钟。

hot3.png

20.23/20.24/20.25 告警系统邮件引擎

因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。

但是告警邮件引擎核心,conf主配置文件调用到的都是"mail.sh" ,所以这里需要定义调用"mail.py"的sh脚本

mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦

收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复

• mail.sh内容 //其中"mail.py"内容到这里下载

#!/bin/bahslog=$1   t_s=`date +%s`t_s2=`date -d "2 hours ago" +%s`  //定义2个小时的时间戳#日志不存在就创建日志if [ ! -f /tmp/$log ]then    echo $t_s2 > /tmp/$logfi#下面这段,等同于一个计时器t_s2=`tail -1 /tmp/$log|awk '{print $1}'`echo $t_s>>/tmp/$logv=$[$t_s-$t_s2]   //时间戳对比echo $v#当故障存在3600秒,就会进行告警if [ $v -gt 3600 ]then    ./mail.py  $1  $2  $3    echo "0" > /tmp/$log.txt  //等同于计数器else    if [ ! -f /tmp/$log.txt ]    then        echo "0" > /tmp/$log.txt    fi    nu=`cat /tmp/$log.txt`    nu2=$[$nu+1]    echo $nu2>/tmp/$log.txt    if [ $nu2 -gt 10 ]    then         ./mail.py  $1 "trouble continue 10 min $2" "$3"         echo "0" > /tmp/$log.txt   //邮件告警结束以后,重新开始计数    fifi

该脚本运用于,间隔3600 故障;10分钟内故障;间歇性故障;

核心判断:计时、计数

20.26 运行告警系统

要执行告警系统,肯定要是每分钟,执行一次

crontab -e* * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh

监控发送邮件的部分,尽量少用空格,因为mail.py发送邮件是以 空格来定义三个参数的

开始测试

定义好计划以后,重启计划

手动模拟生产一个错误的情况,测试监控是否生效,是否能正常发送邮件

改动 load的检测值为 -lt 10

最后发现,根本不会发送邮件。/tmp/目录下也不会产生所谓的计时和计数文件

转载于:https://my.oschina.net/nova12315/blog/1786003

转载地址:https://blog.csdn.net/weixin_33672109/article/details/92065016 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:2.0 内建函数(1) 2.1 内建函数(2) 2.2 内建函数(3) 2.3 内建函数(4) 2.4 内建函数(5...
下一篇:Excel读取插件对比(POI & JXL)

发表评论

最新留言

初次前来,多多关照!
[***.217.46.12]2024年04月18日 06时23分46秒