运维监控-prometheus常用监控示例

常用监控指标示例

linux系统监控模板
https://grafana.com/grafana/dashboards/8919

内存使用率

使⽤率 = 1 - (实际可⽤内存 / 总内存)* 100
总内存: node_memory_MemTotal_bytes
Cached内存: node_memory_Cached_bytes
Buffers内存: node_memory_Buffers_bytes
可用内存: node_memory_MemAvailable_bytes

内存使用率:
公式:(1 - (node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes ))* 100
可用内存(单位:M)

  公式:node_memory_MemAvailable_bytes / 1024 / 1024

硬盘io使用情况

((rate(node_disk_read_bytes_total[1m] )+ rate(node_disk_written_bytes_total[1m])) / 1024 /1024) > 0

硬盘使⽤率 是 read + written 读和写 都会占⽤IO /1024 两次后 就由 bytes => Mbs

硬盘使用情况

磁盘总大小: node_filesystem_size_bytes
磁盘剩余空间: node_filesystem_avail_bytes

磁盘总大小(单位: G)

  公式:node_filesystem_size_bytes {fstype=~”ext4|xfs”} / 1024 / 1024 / 1024

磁盘剩余大小(单位: G)

  公式:node_filesystem_avail_bytes {fstype=~”ext4|xfs”} / 1024 / 1024 / 1024

磁盘使用率
  公式:(1-(node_filesystem_free_bytes{fstype=“ext4|xfs”} / node_filesystem_size_bytes{fstype=“ext4|xfs”})) * 100

网卡流量

网卡入网流量 (指定某一个网卡,比如ens32)

  公式:irate(node_network_receive_bytes_total{device=’ens32’}[5m])

网卡出网流量(指定某一个网卡,比如ens32)

  公式:irate(node_network_transmit_bytes_total{device=’ens32’}[5m])

cpu使用情况

CPU使用率

  公式:100 - (avg by (instance) (irate(node_cpu_seconds_total{mode=”idle”}[5m])) * 100)

CPU负载

  公式:

    node_load1 ## 1分钟负载

    node_load5 ##5分钟负载

    node_load15 ##15分钟负载

docker容器监控

tcp连接数监控