1.如何设置grafana警报和通知(alert and notification)
步骤1: 编辑grafana配置文件(/etc/grafana/grafana.ini
)
sudo vim /etc/grafana/grafana.ini
步骤2: 修改以下选项:(注意:每一行前面的;表示注释,需去掉)
[smtp]
enabled = true
#host表示smtp邮件服务邮箱(前提是你申请了smtp账号,默认是smtp开头)
host = smtp.126.com:25 #需提供端口号,默认是25
;user = #账户和密码可以不提供
;password =
;cert_file =
;key_file =
skip_verify = true #无特殊需求改为true即可
;from_address = admin@grafana.localhost #默认不改即可
[alerting]
alert = true #将这里的alert改为true
execute_alerts = true
步骤3: 重启grafana服务
sudo service grafana-server restart
步骤4: 设置notification channel和alert
send test测试,查看是否收到邮件
右上角发送成功提示,不成功请检查配置或网络
步骤5: 到gragh面板上对监控组件设置alert (注意!目前只有gragh panel支持alert规则)
若出现问题:“Template variables are not supported in alert queries”
解决办法:单独配置个告警的视图,用正则匹配出所有的主机 或者 每台主机单独一个查询语句
完成状态
参考:https://blog.csdn.net/weixin_40367126
2.配置变量variale
在dashboard的设置中定义的变量,可以作为该dashboard的全局变量使用,如下图所示
变量的表示符号。如:IDC表示IDC这个变量,使用的时候,直接使用$IDC就可以获取IDC变量的值。
新建变量->点击new按钮,填写如下信息,
Query或“SHOW TAG VALUES from “exec_tbm1”,“cpu”,“mem” WITH KEY=“testbed_name””
Type为变量的类型,总共有六种类型:Interval(时间间隔类),Query(查询类),Datasource(数据源类型),Custom(自定义类),Constant(常量类),Ad hoc filters(我也不知道啥玩意,未知类)
SELECT DISTINCT cluster FROM jdos_node_base WHERE idc = '$IDC'
注:IDC为已经设置的变量,直接使用取值即可。
Refresh变量刷新方式
Refresh是指变量的刷新方式,总共三种: Never,On Dashboard Load,On Time Range Change.
Never : 从来不刷新
On Dashboard Load:面板加载的时候,刷新一次
On Time Range Change:跟随面板刷新时间刷新该变量,面板的刷新设置在面板的右上角,如下
变量设置完成之后,下方会出现变量的值。
点击Add按钮,设置完成。
返回面板,是这样的,
部分参考:https://www.jianshu.com/p/fe8bab704716