运维监控-prometheus常用监控示例
常用监控指标示例
linux系统监控模板
https://grafana.com/grafana/dashboards/8919
内存使用率
使⽤率 = 1 - (实际可⽤内存 / 总内存)* 100
总内存: node_memory_MemTotal_bytes
Cached内存: node_memory_Cached_bytes
Buffers内存: node_memory_Buffers_bytes
可用内存: node_memory_MemAvailable_bytes
内存使用率:
公式:(1 - (node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes ))* 100
可用内存(单位:M)
公式:node_memory_MemAvailable_bytes / 1024 / 1024
硬盘io使用情况
((rate(node_disk_read_bytes_total[1m] )+ rate(node_disk_written_bytes_total[1m])) / 1024 /1024) > 0
硬盘使⽤率 是 read + written 读和写 都会占⽤IO /1024 两次后 就由 bytes => Mbs
硬盘使用情况
磁盘总大小: node_filesystem_size_bytes
磁盘剩余空间: node_filesystem_avail_bytes
磁盘总大小(单位: G)
公式:node_filesystem_size_bytes {fstype=~”ext4|xfs”} / 1024 / 1024 / 1024
磁盘剩余大小(单位: G)
公式:node_filesystem_avail_bytes {fstype=~”ext4|xfs”} / 1024 / 1024 / 1024
磁盘使用率
公式:(1-(node_filesystem_free_bytes{fstype=“ext4|xfs”} / node_filesystem_size_bytes{fstype=“ext4|xfs”})) * 100
网卡流量
网卡入网流量 (指定某一个网卡,比如ens32)
公式:irate(node_network_receive_bytes_total{device=’ens32’}[5m])
网卡出网流量(指定某一个网卡,比如ens32)
公式:irate(node_network_transmit_bytes_total{device=’ens32’}[5m])
cpu使用情况
CPU使用率
公式:100 - (avg by (instance) (irate(node_cpu_seconds_total{mode=”idle”}[5m])) * 100)
CPU负载
公式:
node_load1 ## 1分钟负载
node_load5 ##5分钟负载
node_load15 ##15分钟负载