监控系统使用及配置说明

监控系统由以下几个组件组成:

  • telegraf: agent,运行在每个被监控的机器上
  • influxdb: 数据库,运行在 influxdb.ustclug.org (docker2.s.ustclug.org)
  • ganglia: 可视化工具,监控报警,地址:monitor.ustclug.org (docker2.s.ustclug.org)

Configure InfluxDB

特别注意 :InfluxDB 默认没有开启认证。

首次运行时,创建好管理账号(admin),只读账号(grafana)和写入账号(telegraf)。

然后修改位于 /srv/docker/influxdb/conf/influxdb.conf 的配置,修改以启用认证:

[http]
# ...
# Determines whether HTTP authentication is enabled.
auth-enabled = true

Install telegraf

安装方法见:

https://docs.influxdata.com/telegraf/v1.6/introduction/installation

一个典型的安装命令是:

wget https://dl.influxdata.com/telegraf/releases/telegraf_1.6.1-1_amd64.deb
sudo dpkg -i telegraf_1.6.1-1_amd64.deb

Configure telegraf

配置文件在 /etc/telegraf/ 目录下,用 root 权限修改:

/etc/telegraf/telegraf.d/ 下增加 net.conf 用来开启网络监控,内容如下:

# /etc/telegraf/telegraf.d/net.conf
[[inputs.net]]

/etc/telegraf/telegraf.conf 中的[[outputs.influxdb]]增加 influxdb 的地址:

[[outputs.influxdb]]
  urls = ["http://influxdb.ustclug.org:8086"]
  username = "${INFLUX_USERNAME}"
  password = "${INFLUXDB_PASSWORD}"

其中 INFLUX_USERNAMEINFLUXDB_PASSWORD 应使用对 telegraf 数据库写权限的账号,否则无法写入数据。

配置完成之后,重启 telegraf 服务,并确保服务运行正常。

sudo systemctl restart telegraf
sudo systemctl status telegraf

Web

Web 端监控位于: https://monitor.ustclug.org ,登陆账号同 ldap,可以在这里设置预警提示等。

注意: 配置 InfluxDB 数据源时,只能使用只读账号,否则会带来严重的安全问题。