Understanding Prometheus Metrics
Если задались вопросом «а какие типы метрик есть в Prometheus», в этой статье есть ответ. Читать дальше.
Если задались вопросом «а какие типы метрик есть в Prometheus», в этой статье есть ответ. Читать дальше.
How To Monitor a Spring Boot App With Prometheus and Grafana
Пошаговый гайд по настройке мониторинга Spring Boot App при помощи Prometheus и Grafana. Читать дальше.
Пошаговый гайд по настройке мониторинга Spring Boot App при помощи Prometheus и Grafana. Читать дальше.
Distributed Logging and Tracing with Spring Boot 3 and Kafka
В этой статье рассказано о о распределенной трассировке в микросервисах Kafka. В статье приводится подробный пример подключения Micrometer и Brave в приложениях Spring Boot 3 Kafka для обеспечения распределенной трассировки и корреляции с логами. Читать дальше.
Brave и Micrometer — решения с открытым исходным кодом.
Репыч Brave на Гитхабе
Репыч Micrometer на Гитхабе
В этой статье рассказано о о распределенной трассировке в микросервисах Kafka. В статье приводится подробный пример подключения Micrometer и Brave в приложениях Spring Boot 3 Kafka для обеспечения распределенной трассировки и корреляции с логами. Читать дальше.
Brave и Micrometer — решения с открытым исходным кодом.
Репыч Brave на Гитхабе
Репыч Micrometer на Гитхабе
Create alerts for OpenShift user workload
Начиная с OpenShift 4.6, мониторинг нагрузки на кластер официально поддерживается путем добавления второго экземпляра Prometheus в новом пространстве имен openshift-user-workload-monitoring. В этой статье описано, как можно отслеживать нагрузку и создавать оповещения. Читать дальше.
Начиная с OpenShift 4.6, мониторинг нагрузки на кластер официально поддерживается путем добавления второго экземпляра Prometheus в новом пространстве имен openshift-user-workload-monitoring. В этой статье описано, как можно отслеживать нагрузку и создавать оповещения. Читать дальше.
Reduce compliance TCO by using Grafana Loki for non-SIEM logs
В этой статье обсуждаются решения, используемые компаниями для решения проблемы соответствия нормативным требованиям, а также то, в чем эти инструменты не подходят компаниям, которые хотят эффективнее работать с логами. Далее вы узнаете почему Grafana Loki можно сделать ключевым элементом стратегии соответствия нормативным требованиям. Читать дальше.
В этой статье обсуждаются решения, используемые компаниями для решения проблемы соответствия нормативным требованиям, а также то, в чем эти инструменты не подходят компаниям, которые хотят эффективнее работать с логами. Далее вы узнаете почему Grafana Loki можно сделать ключевым элементом стратегии соответствия нормативным требованиям. Читать дальше.
OpenTelemetry Up and Running
Как устроено решение OpenTelemetry и как при помощи него настроить трейсинг вызовов — обзорная статья. Читать дальше.
Как устроено решение OpenTelemetry и как при помощи него настроить трейсинг вызовов — обзорная статья. Читать дальше.
Log Management and Distributed Tracing using Grafana Loki and Tempo
Воркшоп по разворачиванию всего перечисленного в кластере Kubernetes. Читать дальше.
Воркшоп по разворачиванию всего перечисленного в кластере Kubernetes. Читать дальше.
A Step-by-Step Guide to Calculating SLAs, SLIs, and SLOs for Your IT Services
Соглашения об уровне обслуживания (SLA), показатели уровня обслуживания (SLI) и цели уровня обслуживания (SLO) — это критически важные метрики для измерения производительности и надежности ИТ-услуг. Эти показатели дают ценную информацию о качестве обслуживания клиентов и помогают командам определить области для улучшения. В этой статье представлено пошаговое руководство по расчету SLA, SLI и SLO для ИТ-услуг на примере приложения электронной коммерции на базе микросервисов. Читать дальше.
Соглашения об уровне обслуживания (SLA), показатели уровня обслуживания (SLI) и цели уровня обслуживания (SLO) — это критически важные метрики для измерения производительности и надежности ИТ-услуг. Эти показатели дают ценную информацию о качестве обслуживания клиентов и помогают командам определить области для улучшения. В этой статье представлено пошаговое руководство по расчету SLA, SLI и SLO для ИТ-услуг на примере приложения электронной коммерции на базе микросервисов. Читать дальше.
👍2
ИТ-мониторинг ДОМ.РФ: от идеи к рабочему инструменту
История допиливания плагина Status Panel для Grafana до соответствия требованиям. Читать на Хабре.
История допиливания плагина Status Panel для Grafana до соответствия требованиям. Читать на Хабре.
Подключаем VictoriaMetrics в Deckhouse и настраиваем уведомления в Telegram
В статье рассмотрено, как в Kubernetes-кластере под управлением Deckhouse удобно и быстро настраивать мониторинг с уведомлениями в Telegram. VictoriaMetrics в этом случае используется для хранения метрик, Grafana для отображения и алертинга. Читать дальше.
В статье рассмотрено, как в Kubernetes-кластере под управлением Deckhouse удобно и быстро настраивать мониторинг с уведомлениями в Telegram. VictoriaMetrics в этом случае используется для хранения метрик, Grafana для отображения и алертинга. Читать дальше.
How to find unused Prometheus metrics using mimirtool
Недавно перед автором этой статьи встала задача стабилизировать, отследить проблемы и значительно снизить потребление ресурсов системой Prometheus. В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать дальше.
Недавно перед автором этой статьи встала задача стабилизировать, отследить проблемы и значительно снизить потребление ресурсов системой Prometheus. В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать дальше.
Grafana Dashboard for Pgbouncer And Monitor With Percona PMM
Pgbouncer — приложение-пулер соединений, которое используется в среде PostgreSQL. Он легкий, при этом обрабатывает множество соединений. Pgbouncer имеет несколько встроенных таблиц (или представлений) для просмотра текущего состояния и исторических данных. Не совсем удобно выполнять запросы к этим данным через командную строку. Многие слышали об инструменте мониторинга Percona PMM. Это инструмент мониторинга с открытым исходным кодом для MySQL, PostgreSQL и MongoDB. У PMM, к сожалению, нет собственного агента для pgbouncer. В этой статье разобрано создание двух экспортеров Prometheus для pgbouncer. Читать дальше.
Расскажите какую систему мониторинга для PostgreSQL вы используете в вашем окружении. Можно тапнуть на кнопку или рассказать подробно в комментариях.
Pgbouncer — приложение-пулер соединений, которое используется в среде PostgreSQL. Он легкий, при этом обрабатывает множество соединений. Pgbouncer имеет несколько встроенных таблиц (или представлений) для просмотра текущего состояния и исторических данных. Не совсем удобно выполнять запросы к этим данным через командную строку. Многие слышали об инструменте мониторинга Percona PMM. Это инструмент мониторинга с открытым исходным кодом для MySQL, PostgreSQL и MongoDB. У PMM, к сожалению, нет собственного агента для pgbouncer. В этой статье разобрано создание двух экспортеров Prometheus для pgbouncer. Читать дальше.
Расскажите какую систему мониторинга для PostgreSQL вы используете в вашем окружении. Можно тапнуть на кнопку или рассказать подробно в комментариях.
2624 упражнений и вопросов по DevOps
Этот репозиторий содержит вопросы и упражнения на различные технические темы, связанные с DevOps и SRE. Вы можете их использовать для подготовки к интервью. Репыч на Гитхабе.
Этот репозиторий содержит вопросы и упражнения на различные технические темы, связанные с DevOps и SRE. Вы можете их использовать для подготовки к интервью. Репыч на Гитхабе.
Learn From Scratch Prometheus and Grafana for The Ultimate Monitoring and Visualization Experience
Эта статья даст базовые понятия о том, что из себя представляет Prometheus в связке с Grafana. Пойдёт, если вы только начинаете изучать эти два решения. Примерно половину статьи занимает воркшоп по настройке. Читать дальше.
Используете Prometheus в своём стеке мониторинга?
Эта статья даст базовые понятия о том, что из себя представляет Prometheus в связке с Grafana. Пойдёт, если вы только начинаете изучать эти два решения. Примерно половину статьи занимает воркшоп по настройке. Читать дальше.
Используете Prometheus в своём стеке мониторинга?
Loguru — это библиотека для логирования в Python
Можно рассмотреть в качестве замены print(). Расскажите в комментариях как решаете задачу логирования вашего кода.
Репыч на Гитхабе
Можно рассмотреть в качестве замены print(). Расскажите в комментариях как решаете задачу логирования вашего кода.
Репыч на Гитхабе
Bad Observability
Антипаттерны построения системы Observability с забавными картинками и толковым описанием. Читать дальше.
Антипаттерны построения системы Observability с забавными картинками и толковым описанием. Читать дальше.
Grafana agent operator
Grafana Agent Operator — это оператор Kubernetes, который упрощает развертывание Grafana Agent и сбор телеметрических данных с подов.
Grafana Agent Operator работает, отслеживая ресурсы Kubernetes, которые определяют, как собирать телеметрические данные с кластера Kubernetes и куда их отправлять. Agent Operator управляет соответствующими Grafana Agent в кластере, отслеживая изменения в ресурсах. Читать дальше.
Grafana Agent Operator — это оператор Kubernetes, который упрощает развертывание Grafana Agent и сбор телеметрических данных с подов.
Grafana Agent Operator работает, отслеживая ресурсы Kubernetes, которые определяют, как собирать телеметрические данные с кластера Kubernetes и куда их отправлять. Agent Operator управляет соответствующими Grafana Agent в кластере, отслеживая изменения в ресурсах. Читать дальше.