Prometheus 3.0 и OpenTelemetry: практическое руководство по хранению и запросу данных OTel
Статья в блоге Grafana
Статья в блоге Grafana
v1.0.0-victorialogs
12 ноября объявили о релизе первой версии и теперь Victoria Logs в GA.
Концепция решения
Репыч на Гитхаб
Кто-то уже тестировал? Расскажите в комментариях о своём опыте.
12 ноября объявили о релизе первой версии и теперь Victoria Logs в GA.
Концепция решения
Репыч на Гитхаб
Кто-то уже тестировал? Расскажите в комментариях о своём опыте.
Современный on-call менеджмент: 5 основных шагов от мониторинга до постмортема
Статья от Monq (вендор одноименной системы мониторинга), где рассказывают про важность системного подхода к организации дежурств и оповещений. Про новый продукт Monq OnCall тоже рассказывают.
Поделитесь в комментах каким решением для OnCall пользуетесь и почему выбрали именно его. На сегодняшний день самым известным, наверное, является Grafana OnCall.
Статья от Monq (вендор одноименной системы мониторинга), где рассказывают про важность системного подхода к организации дежурств и оповещений. Про новый продукт Monq OnCall тоже рассказывают.
Поделитесь в комментах каким решением для OnCall пользуетесь и почему выбрали именно его. На сегодняшний день самым известным, наверное, является Grafana OnCall.
How do open source solutions for logs work: Elasticsearch, Loki and VictoriaLogs
Если вы используете Elasticsearch, OpenSearch, Loki или VictoriaLogs и вам интересно, почему ОС требует много оперативной памяти или выполняет полнотекстовые поисковые запросы с очень низкой скоростью, то эта статья может быть вам интересна.
❗️Статья на medium.com
Если вы используете Elasticsearch, OpenSearch, Loki или VictoriaLogs и вам интересно, почему ОС требует много оперативной памяти или выполняет полнотекстовые поисковые запросы с очень низкой скоростью, то эта статья может быть вам интересна.
❗️Статья на medium.com
Tracer спустя год: новые фичи и возможности инструмента для аналитики ошибок в мобильных приложениях
Tracer — модульный инструмент для аналитики ошибок в мобильных приложениях от OK.Tech, который был представлен год назад. За это время в Tracer зарегистрировалось более 1500 организаций и 5000 пользователей. Сейчас решение обрабатывает более 1 млрд событий в день и обслуживает приложения, которые имеют суммарный DAU в 20 млн пользователей. Читать на Хабре.
Tracer — модульный инструмент для аналитики ошибок в мобильных приложениях от OK.Tech, который был представлен год назад. За это время в Tracer зарегистрировалось более 1500 организаций и 5000 пользователей. Сейчас решение обрабатывает более 1 млрд событий в день и обслуживает приложения, которые имеют суммарный DAU в 20 млн пользователей. Читать на Хабре.
Мониторинг ipsec strongSwan
IPsec-туннели в основном используются для связи между облаками, так как инфраструктура разнесена — например, dev и prod живут у разных облачных провайдеров. Также есть интеграции со сторонними организациями, кластеры Kubernetes в AWS, GCP и т.д. Основная цель — получать алерты о падении туннеля раньше, чем сработают алерты о недоступности сервисов. Это особенно важно, поскольку Prometheus один, он живёт в одном из облаков, а prometheus-stack в Kubernetes-кластерах работают в режиме агентов. Читать дальше.
IPsec-туннели в основном используются для связи между облаками, так как инфраструктура разнесена — например, dev и prod живут у разных облачных провайдеров. Также есть интеграции со сторонними организациями, кластеры Kubernetes в AWS, GCP и т.д. Основная цель — получать алерты о падении туннеля раньше, чем сработают алерты о недоступности сервисов. Это особенно важно, поскольку Prometheus один, он живёт в одном из облаков, а prometheus-stack в Kubernetes-кластерах работают в режиме агентов. Читать дальше.
keep
Это агрегатор событий от различных систем мониторинга с открытым исходным кодом. Есть готовые интеграции с Zabbix, Kibana, Elastic, Grafana и множеством других. Еще пока не тестировал, но выглядит интересно.
Репыч на Гитхабе
Это агрегатор событий от различных систем мониторинга с открытым исходным кодом. Есть готовые интеграции с Zabbix, Kibana, Elastic, Grafana и множеством других. Еще пока не тестировал, но выглядит интересно.
Репыч на Гитхабе
CMDB в ИТ-мониторинге или как устранять инциденты в 3 раза быстрей
Полностью поддерживаю тезис, что CMDB позволяет работать с системой мониторинга более эффективно. В статье рассказывают про российскую систему мониторинга Monq, в которую уже встроена CMDB. Но никто не мешает добавить ту же бесплатную CMDB iTop к вашей существующей системе мониторинга, тому же Zabbix.
Читать на Хабре.
Полностью поддерживаю тезис, что CMDB позволяет работать с системой мониторинга более эффективно. В статье рассказывают про российскую систему мониторинга Monq, в которую уже встроена CMDB. Но никто не мешает добавить ту же бесплатную CMDB iTop к вашей существующей системе мониторинга, тому же Zabbix.
Читать на Хабре.
Как оценить качество проекта? Внедряем DORA-метрики
В этой статье рассказано что такое DORA-метрики и как они могут помочь оценить качество проекта. Читать на Хабре.
В этой статье рассказано что такое DORA-метрики и как они могут помочь оценить качество проекта. Читать на Хабре.
Jaeger v2 released
Новая версия использует фреймворк OpenTelemetry Collector в качестве основы и расширяет его возможности для реализации функций Jaeger. В статье подробности.
❗️Статья на medium.com
Новая версия использует фреймворк OpenTelemetry Collector в качестве основы и расширяет его возможности для реализации функций Jaeger. В статье подробности.
❗️Статья на medium.com
Mastering Process and System Monitoring in Linux: Essential Tools and Techniques
В этой статье популярные утилиты для получения данных о производительности сервера Linux и примеры использования. Читать дальше.
❗️Статья на medium.com
В этой статье популярные утилиты для получения данных о производительности сервера Linux и примеры использования. Читать дальше.
❗️Статья на medium.com
Edit your Git-based Grafana dashboards locally
Grizzly — утилита командной строки для Grafana, которую можно использовать для проверки или редактирования дашбордов Grafana. Статья в блоге Grafana.
Grizzly — утилита командной строки для Grafana, которую можно использовать для проверки или редактирования дашбордов Grafana. Статья в блоге Grafana.
How vmagent Collects and Ships Metrics Fast with Aggregation, Deduplication, and More
Агент VictoriaMetrics или vmagent, — это инструмент, предназначенный для сбора показателей из различных источников.
Vmagent может отправлять обработанные метрики в систему хранения, например, VictoriaMetrics или куда угодно, где поддерживается протокол записи в формате Prometheus. Он также поддерживает собственный протокол удаленной записи VictoriaMetrics, что является более эффективным способом обработки большого объема данных. Читать в блоге VM.
Агент VictoriaMetrics или vmagent, — это инструмент, предназначенный для сбора показателей из различных источников.
Vmagent может отправлять обработанные метрики в систему хранения, например, VictoriaMetrics или куда угодно, где поддерживается протокол записи в формате Prometheus. Он также поддерживает собственный протокол удаленной записи VictoriaMetrics, что является более эффективным способом обработки большого объема данных. Читать в блоге VM.
Monitoring logs with Prometheus, Grafana and Fluentd
Статья-воркшоп по настройке мониторинга.
❗️Статья на medium.com
Статья-воркшоп по настройке мониторинга.
❗️Статья на medium.com
11 скриптов автоматизации для автоматизации конфигурации Prometheus
В этой статье 11 скриптов для автоматизации работы с Prometheus. Не спорю, что есть и Ansible и много чего ещё, но иногда бывает достаточно таких вот скриптов. Смотреть на Хабре.
В этой статье 11 скриптов для автоматизации работы с Prometheus. Не спорю, что есть и Ansible и много чего ещё, но иногда бывает достаточно таких вот скриптов. Смотреть на Хабре.
Monitoring, troubleshooting, and query analytics for PostgreSQL on Kubernetes
Сказ про Percona Monitoring and Management (PMM) и установку этого инструмента в кластере Kubernetes. Читать статью.
Сказ про Percona Monitoring and Management (PMM) и установку этого инструмента в кластере Kubernetes. Читать статью.
12-15 ноября в Солт-Лейк Сити прошел ежегодный Kubecon. Несколько недель назад они выложили записи с мероприятия. Я выбрал несколько интересных выступлений с точи зрения мониторинга и ниже привожу на них ссылки.
Prometheus: Celebrating Prometheus 3.0: All You Need To Know!
Inspektor Gadget: eBPF for Observability, Made Easy and Approachable
OpenTelemetry: The Future of Network Monitoring eBPF for Low-Level Insights
OpenTelemetry: OpenTelemetry in Five Minutes
Jaeger: Distributed Tracing with Jaeger and OpenTelemetry
Shopify’s Open Source Approach to Network Monitoring with eBPF, Vector and ClickHouse
Tutorial: Simplify and Optimize Your YAML with YAMLScript
OpenTelemetry Hands-on - Automatic and Manual Instrumentation for Java and Python Apps
Cortex Intro: Multi-Tenant Scalable Prometheus
Fluent Bit: Better Pipelines for Observability
Cognitive and Self-Adaptive System for Effective Distributed-Tracing in Applications
Tame MTTR with Real-Time Anomaly Detection
Low-Overhead, Zero-Instrumentation, Continuous Profiling for OpenTelemetry
Mastering OpenTelemetry Collector Configuration
Prometheus: Celebrating Prometheus 3.0: All You Need To Know!
Inspektor Gadget: eBPF for Observability, Made Easy and Approachable
OpenTelemetry: The Future of Network Monitoring eBPF for Low-Level Insights
OpenTelemetry: OpenTelemetry in Five Minutes
Jaeger: Distributed Tracing with Jaeger and OpenTelemetry
Shopify’s Open Source Approach to Network Monitoring with eBPF, Vector and ClickHouse
Tutorial: Simplify and Optimize Your YAML with YAMLScript
OpenTelemetry Hands-on - Automatic and Manual Instrumentation for Java and Python Apps
Cortex Intro: Multi-Tenant Scalable Prometheus
Fluent Bit: Better Pipelines for Observability
Cognitive and Self-Adaptive System for Effective Distributed-Tracing in Applications
Tame MTTR with Real-Time Anomaly Detection
Low-Overhead, Zero-Instrumentation, Continuous Profiling for OpenTelemetry
Mastering OpenTelemetry Collector Configuration
Как внедрить наблюдаемость в микросервисное приложение с помощью OpenTelemetry, Jaeger и Prometheus
Базовая статьи о концепции наблюдаемости. Читать на Хабре
Базовая статьи о концепции наблюдаемости. Читать на Хабре