Прометей - легко войти, трудно уйти
27 января 2023 г.Prometheus стал стандарт де-факто для показателей временных рядов как для Cloud Native, так и для устаревших сред. Многие технологии в ландшафте CNCF уже включают конечную точку метрик Prometheus, и существуют метрические экспортеры для многих других технологий. Запуск Prometheus в Kubernetes простой благодаря диаграммам Helm для Оператор или сообщество Стек Kube. Что касается «голого железа», то большинство дистрибутивов Linux включают Prometheus в свои программные репозитории. Наконец, Prometheus как сервис доступен на AWS, Azure, GCP и других платформах, таких как Grafana, Victoria Metrics, Logz и OpsVerse.
С минимальными усилиями в течение дня сервер Prometheus может быть запущен, запущен и собирает данные. Однако, как вскоре узнают многие, это лишь первый шаг в очень долгом и бесконечном путешествии.
Выгода
Отлично, вы выполнили первый шаг, у вас есть экземпляр Prometheus, полный данных, и вы очень довольны собой. Теперь вам просто нужно получить некоторую полезную информацию, Grafana — это инструмент информационной панели. для сопряжения с Prometheus. Создание полезного набора информационных панелей — нетривиальная и трудоемкая задача. Прежде всего, вам нужно изучить PromQL, язык запросов Prometheus, а также узнать, какие показатели являются важными для каждой из технологий, за которыми вы наблюдаете.
После немалых усилий у вас теперь есть рудиментарный набор информационных панелей, охватывающих самое необходимое. Вскоре становится утомительно постоянно следить за приборными панелями, было бы намного лучше получать оповещение, если что-то выходит за пределы допустимого. Теперь вам необходимо научиться тонкому искусству балансировки порогов. Установка слишком низкого значения приведет к множеству ложных срабатываний, слишком высокое значение не сработает, пока не станет слишком поздно. Даже если вам удастся правильно сбалансировать, вы все равно получите серию дискретных предупреждений без какого-либо контекста или корреляции. Это делает невозможным определение того, какие из них важны, а какие являются первичной причиной, а какие являются вторичными симптомами. Эта непрекращающаяся болтовня вскоре приводит к утомлению.
Вот почему большинство реализаций Prometheus останавливаются после первоначального развертывания. Неспособность извлечь реальную пользу из всех собранных данных ослабляет энтузиазм по поводу дальнейшего сбора данных.
Если бы только существовал простой способ извлечь выгоду из всех данных Prometheus.
Второй шаг к ценности
Asserts интеллектуально использует существующие данные Prometheus, чтобы устранить усталость от предупреждений. Вместо потока несвязанных предупреждений Asserts предоставляет контекстные уведомления с прямой ссылкой на рабочую среду анализа первопричин, которая автоматически группирует связанные сигналы в одном месте, вся необходимая информация находится на расстоянии одного клика.
Asserts постоянно анализирует метки метрик в ваших данных Prometheus, чтобы с течением времени строить отношения отслеживания Entity Graph. Это позволяет Asserts разумно группировать оповещения, предоставляя всю информацию, необходимую для анализа первопричины, одним щелчком мыши.
Asserts включает тщательно отобранные библиотеки для правил генерации оповещений и информационных панелей Grafana, освобождая вас от необходимости создавать и поддерживать эти ресурсы; не говоря уже об изучении PromQL. Если у вас уже есть любимые информационные панели, вы можете импортировать их в Asserts и продолжать их использовать. Библиотеку правил генерации оповещений также можно легко отредактировать, чтобы точно настроить в соответствии с вашими требованиями.
Asserts интегрируется с вашими существующими инструментами сбора и отслеживания журналов, обеспечивая прямую связь с контекстом. Перейдите прямо из Asserts к журналу или трассировке аналитики с предварительно заполненным запросом и временным диапазоном. Вся необходимая информация находится на расстоянии одного клика.
Путь к SRE Nirvana
Благодаря дополнительному уровню автоматизации и интеллектуальных функций, которые Asserts предоставляет в дополнение к вашим существующим данным Prometheus, вы скоро сможете извлечь реальную пользу из того, что у вас уже есть. Однако это только начало реализации ценности. Теперь, когда вы можете легко управлять всеми своими данными Prometheus и избавиться от усталости от оповещений, нет причин не добавлять дополнительные данные метрик. Многие технологии предоставляют конечную точку метрик Prometheus, или существует множество доступных экспортеров. Их можно просто добавить без каких-либо изменений в коде, что значительно увеличивает охват ваших приложений наблюдаемостью.
Для достижения SRE Nirvana с полной видимостью ваших приложений и максимальной отдачей от ваших инвестиций в Prometheus в код приложения добавляется агент Prometheus. Это обеспечит подробные метрики для среды выполнения службы (Java, Go, Python, NodeJS, …) вместе с метриками RED (скорость, ошибки, продолжительность) для каждой конечной точки. Благодаря полному охвату метрик средами приложений можно управлять, устанавливая Цели уровня обслуживания. (SLO) против функциональности приложения. Теперь у вас будет самодовольное чувство удовлетворения от того, что вы достигли Нирваны и у вас есть эталонная реализация SRE Handbook а>.
Получите максимальную отдачу от своей среды Prometheus, воспользовавшись бесплатной пробной версией Asserts.
:::информация Также опубликовано здесь.
:::
Оригинал