group_left的时候，一边有多个重复的metric. 例如利用cephfs的时候，就有这种情况，此时就会出错，用avg/min/max可以dedupicate。

{beta_kubernetes_io_arch="amd64", beta_kubernetes_io_os="linux", instance="k8s-master-2.pxx.com", job="kubernetes-nodes", kubernetes_io_arch="amd64", kubernetes_io_hostname="k8s-master-2.pxx.com", kubernetes_io_os="linux", namespace="default", persistentvolumeclaim="nextcloud-data"}
...
{beta_kubernetes_io_arch="amd64", beta_kubernetes_io_os="linux", instance="k8s-master-4.pxx.com", job="kubernetes-nodes", kubernetes_io_arch="amd64", kubernetes_io_hostname="k8s-master-4.pxx.com", kubernetes_io_os="linux", namespace="default", persistentvolumeclaim="nextcloud-data"}

此时需要去掉一个，否则无法使用group_left(需要1：N来匹配）

    - name: pod_disk_usage
      rules:

      - alert: pod disk is full.
        # max/avg/min to deduplicate.
        expr: (0 * kube_pod_spec_volumes_persistentvolumeclaims_info) + on(persistentvolumeclaim) group_left 100* ( max(kubelet_volume_stats_used_bytes / kubelet_volume_stats_capacity_bytes) by (persistentvolumeclaim)) > 85
        for: 3m
        labels:
          severity: critical
        annotations:
          summary: pod disk is full
          description: "Pod disk is full\nValue = {{ $value }}\nLabels = {{ $labels.env }}"

某些metric只有特定条件下才有值，例如ceph OSD，只有down的时候，才会有值，那应该怎么处理呢？vector(x) 可以返回x

count(ceph_osd_up{app="$cluster"} ==0) OR vector(0)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

prometheus-tricks.md

prometheus-tricks.md

Files

prometheus-tricks.md

Latest commit

History

prometheus-tricks.md

File metadata and controls