Осуществляем мониторинг состояние Ceph кластера с помощью плагина Icinga2
Возможности данного плагина:
Статус Ceph кластера (HEALTH_OK, HEALTH_WARN)
Контроль состояния OSD (можно установить значения warning и critical на количество неактивных OSD)
Статус Placement Group (нет значения warning и critical, но есть возможность отследить, если состояние PG не active+clean)
Дисковое пространство (контроль свободного пространства на пуле, основано на поле Max Available, которое отображается при выводе ceph df. Это не общее значение свободного места, а свободное место с учетом репликации пула)
Показатель эффективности (предназначено для сбора информации для метрики, iops, количество прочитанной/записанной информации в bytes/sec)
Для работы плагина необходим клиент Ceph на сервере с Icinga2.
Runs health checks against a ceph cluster. This is designed to run on the monitoring server using the ceph client software. Supply a ceph.conf, keyring, and user to access the cluster.
optional arguments: -h, --help show this help message and exit -C CONF, --conf CONF ceph.conf file, defaults to /etc/ceph/ceph.conf. -id ID, --id ID Ceph authx user -k KEYRING, --keyring KEYRING Path to ceph keyring if not in /etc/ceph/client.\$id.keyring --health Get general health status. ex. HEALTH_OK, HEALTH_WARN -o, --osd OSD status. Thresholds are in number of OSDs missing -m MON, --mon MON MON status. Thesholds are in number of mons missing -p, --pg PG status. No thresholds due to the large number of pg states. --perf collects additional ceph performance statistics --df Disk/cluster usage. Reports global and all pools unless --pool is used. Warning and critical are number of -b free to the pools. This is not Raw Free, but Max Avail to the pools based on rep or k,m settings. If you do not define a pool the threshold is run agains all the pools in the cluster. -b BYTE, --byte BYTE Format to use for displaying DF data. G=Gigabyte, T=Terabyte. Use with the --df option. Defults to TB --pool POOL Pool. Use with df --objects OBJECTS Object counts based on pool -w WARNING, --warning WARNING Warning threshold. See specific checks for value types -c CRITICAL, --critical CRITICAL Critical threshold. See specific checks for value types