На платформе предусмотрена возможность мониторинга производительности системы с использованием инструмента Grafana, встроенного в систему. Это позволяет отслеживать различные показатели, как на уровне хоста, так и для каждого отдельного контейнера. Мониторинг этих показателей помогает выявлять необходимость балансировки нагрузки, чтобы предотвратить сбои в работе системы. Полученные метрики предоставляет детальную информацию о текущем состоянии платформы, уровне нагрузки и использовании ресурсов. Эти данные могут быть использованы для принятия обоснованных решений по улучшению работы всей платформы.
В системе есть два преднастроенных дашборда:
Container metrics – отображает ключевые метрики, связанные с производительностью и использованием ресурсов по каждому контейнеру.
Host metrics – отображает метрики, связанные с использованием ресурсов и производительностью хоста.
Ниже представлена таблица с перечнем метрик каждого дашборда:
Дашборд
Метрики
Container metrics
CPU Usage per Container;
Memory Usage per Container;
Incoming Network Trafic per Container;
Outgoing Network Trafic per Container;
Disk I/O;
Container info;
Name;
CPU
RAM
OOM Killed
Host metrics
System Load
CPU Basic
Disc spaced used basic
Disc IOps Completed
Memory Basic
Network Trafic Basic
Disc R/W Data
Time Spent Doing I/Os
Disc R/W Time
Network Sockstat
Open File Descriptor/Context Switches
Просмотр дашбордов с метриками
Для получения доступа к метрикам платформы, необходимо иметь роль globaladmin.
Для просмотра дашбордов с метриками систему, необходимо выполнить следующие шаги:
В веб-браузере перейдите по адресу http://<platform-address>/v3/grafana, где <platform-address> – IP-адрес или доменное имя сервера.
В открывшемся окне нажмите кнопку Toggle menu и выберите Dashboards:
На странице Dashboards вы увидите два преднастроенных дашборда:
Container metrics;
Host metrics
При выборе Container metrics открывается дашборд с метриками по каждому контейнеру:
При выборе Host metrics открываются метрики хоста:
Имея доступ к метрикам системы вы сможете:
Контролировать использование ресурсов: зная, как используются ресурсы на сервере и в контейнерах, можно оптимизировать их использование и предотвратить перегрузку.
Осуществлять мониторинг производительности: вы сможет отслеживать производительность системы в реальном времени и быстро реагировать на возникающие проблемы.
Прогнозировать проблемы: анализ метрик может помочь предсказать возможные проблемы до того, как они возникнут.
Проводить аналитику: на основе полученных данных вы сможете создавать отчеты и анализировать данные, что может быть полезно для принятия решений об улучшении системы.
Вы можете выбрать определённую ноду для отслеживания её метрик, если ClickHouse развёрнут на нескольких серверах. Для этого в верхней части экрана разверните меню Host и выберите требуемую ноду:
Информацию о доступных нодах можно получить, выполнив на сервере следующую команду:
docker inspect -f "{{.ID}} {{.Status.Addr}} {{.Spec.Labels}}" $(docker node ls -q)
В ответ вы получите список адресов и идентификаторов нод: