IMPulse
OnCall-утилита для управления событиями из Prometheus (Alertmanager)
Репыч на Гитхабе
Статья на Хабре с описанием
OnCall-утилита для управления событиями из Prometheus (Alertmanager)
Репыч на Гитхабе
Статья на Хабре с описанием
Understanding OpenTelemetry with demo example
Обзорная статья о том, как устроен Opentelemetry, для чего используется и пример его работы. Читать в статье.
❗️Статья на medium.com
Обзорная статья о том, как устроен Opentelemetry, для чего используется и пример его работы. Читать в статье.
❗️Статья на medium.com
How vmstorage Turns Raw Metrics into Organized History
vmstorage — это компонент VictoriaMetrics, который управляет долгосрочным хранением данных мониторинга. Он получает данные из vminsert, организует данные в эффективные структуры хранения и управляет сроком хранения данных.
Еще до того, как vminsert увидит данные, их уже собирают агенты. Эти агенты собирают метрики из разных источников, хранят данные в течение некоторого времени, а затем отправляют их в vminsert партиями.
Когда vminsert получает данные, он сжимает их в пакеты для повышения эффективности передачи.
После сжатия vminsert отправляет эти пакеты в vmstorage. vmstorage хранит данные на диске организованным и оптимизированным образом. Такая структура позволяет очень быстро извлекать и запрашивать данные в дальнейшем.
Читать статью в блоге VM
vmstorage — это компонент VictoriaMetrics, который управляет долгосрочным хранением данных мониторинга. Он получает данные из vminsert, организует данные в эффективные структуры хранения и управляет сроком хранения данных.
Еще до того, как vminsert увидит данные, их уже собирают агенты. Эти агенты собирают метрики из разных источников, хранят данные в течение некоторого времени, а затем отправляют их в vminsert партиями.
Когда vminsert получает данные, он сжимает их в пакеты для повышения эффективности передачи.
После сжатия vminsert отправляет эти пакеты в vmstorage. vmstorage хранит данные на диске организованным и оптимизированным образом. Такая структура позволяет очень быстро извлекать и запрашивать данные в дальнейшем.
Читать статью в блоге VM
Настраиваем алерты из заббикса в телеграм
В zabbix версии 7.0 есть встроенный механизм по отправке сообщений в телеграм, но он не доработан — там нету опции отправки графиков. В этой статье как раз разобран такой сценарий.
В zabbix версии 7.0 есть встроенный механизм по отправке сообщений в телеграм, но он не доработан — там нету опции отправки графиков. В этой статье как раз разобран такой сценарий.
Мониторинг бизнес-процессов с помощью OpenTelemetry
В этой статье рассказано, как объединить несколько разных команд разработки общим Observability и с помощью исключительно технических метрик отслеживаем здоровье бизнес-процессов. Как всё это помогает мгновенно находить первопричину сбоя. Как устроен OpenTelemetry и как с его помощью рассчитать доступность приложения в девятках, а также MTTR (Mean Time to Recovery). Читать на Хабре.
В этой статье рассказано, как объединить несколько разных команд разработки общим Observability и с помощью исключительно технических метрик отслеживаем здоровье бизнес-процессов. Как всё это помогает мгновенно находить первопричину сбоя. Как устроен OpenTelemetry и как с его помощью рассчитать доступность приложения в девятках, а также MTTR (Mean Time to Recovery). Читать на Хабре.
File Integrity Monitoring with Zabbix
Интересная статья из блога Zabbix относительно мониторинга файлов, директорий и прочего с этим связанного.
🚀 vfs.dir.count[/etc/mysql] — количество файлов/директорий
🚀 vfs.dir.size[/etc/mysql] — размер файлов/директорий
🚀 vfs.file.exists[/etc/mysql/mariadb.conf.d/50-server.cnf] — проверка существования файла
🚀 vfs.file.cksum[/etc/mysql/mariadb.conf.d/50-server.cnf,sha256] — проверка чексуммы файла на случай, если кто-то его изменил
🚀 vfs.file.regmatch[/etc/mysql/mariadb.conf.d/50-server.cnf,^max_connections\s+=\s+(\d+)] — проверка содержимого файла на совпадение по регулярному выражению
🚀 vfs.file.regexp[/etc/mysql/mariadb.conf.d/50-server.cnf,^max_connections\s+=\s+(\d+),,,,\1] — извлечение содержимого файла по регулярному выражению
❗️Еще больше полезного о Zabbix в канале @zabbix_ru
Интересная статья из блога Zabbix относительно мониторинга файлов, директорий и прочего с этим связанного.
🚀 vfs.dir.count[/etc/mysql] — количество файлов/директорий
🚀 vfs.dir.size[/etc/mysql] — размер файлов/директорий
🚀 vfs.file.exists[/etc/mysql/mariadb.conf.d/50-server.cnf] — проверка существования файла
🚀 vfs.file.cksum[/etc/mysql/mariadb.conf.d/50-server.cnf,sha256] — проверка чексуммы файла на случай, если кто-то его изменил
🚀 vfs.file.regmatch[/etc/mysql/mariadb.conf.d/50-server.cnf,^max_connections\s+=\s+(\d+)] — проверка содержимого файла на совпадение по регулярному выражению
🚀 vfs.file.regexp[/etc/mysql/mariadb.conf.d/50-server.cnf,^max_connections\s+=\s+(\d+),,,,\1] — извлечение содержимого файла по регулярному выражению
❗️Еще больше полезного о Zabbix в канале @zabbix_ru
10 лучших приёмов логирования для разработчиков
Качественное логирование играет принципиальную роль для высокой производительности и целостности системы в современных сложных ИТ-средах. Эффективное логирование оптимизирует устранение сбоев, так как из лога можно получить однозначную информацию об ошибках и поведении системы. Кроме того, оно улучшает мониторинг производительности, показывая узкие места и отклонения. Надёжное логирование важно и для безопасности: оно помогает выявлять и расследовать потенциальные угрозы или случаи несанкционированного доступа.
В этой статье собраны передовые приёмы логирования, которые превращают запись логов в эффективный, действенный и масштабируемый процесс.
Качественное логирование играет принципиальную роль для высокой производительности и целостности системы в современных сложных ИТ-средах. Эффективное логирование оптимизирует устранение сбоев, так как из лога можно получить однозначную информацию об ошибках и поведении системы. Кроме того, оно улучшает мониторинг производительности, показывая узкие места и отклонения. Надёжное логирование важно и для безопасности: оно помогает выявлять и расследовать потенциальные угрозы или случаи несанкционированного доступа.
В этой статье собраны передовые приёмы логирования, которые превращают запись логов в эффективный, действенный и масштабируемый процесс.
Grafana Loki 3.3 release: faster query results via Blooms for structured metadata
Вышла версия Grafana Loki 3.3. Loki теперь использует фильтры Блума — переход от свободного текстового поиска к использованию мощи структурированных метаданных. Это упрощает поиск иголки в стоге логов, а также улучшает опыт выполнения поисковых запросов для сообщества OpenTelemetry. Читать в блоге Grafana.
Вышла версия Grafana Loki 3.3. Loki теперь использует фильтры Блума — переход от свободного текстового поиска к использованию мощи структурированных метаданных. Это упрощает поиск иголки в стоге логов, а также улучшает опыт выполнения поисковых запросов для сообщества OpenTelemetry. Читать в блоге Grafana.
Monitoring Kafka Clusters: Setup Guide for JMX Exporter, Prometheus, and Grafana
Статья-воркшоп по настройке мониторинга Kafka. Читать.
❗️Статья на medium.com
Статья-воркшоп по настройке мониторинга Kafka. Читать.
❗️Статья на medium.com
Самописный скрипт для мониторинга системных логов
Зачем нужны все эти Loki, Elasticsearch и прочие тяжеловесные инструменты, когда есть старый добрый баш-скрипт?
Зачем нужны все эти Loki, Elasticsearch и прочие тяжеловесные инструменты, когда есть старый добрый баш-скрипт?
Teletype
Самописный скрипт для мониторинга системных логов
Специально для телеграм-канала Мониторим ИТ
OpenTelemetry and Grafana Labs: what’s new and what’s next in 2025
В этой статье обзор возможностей OpenTelemetry + прогноз развития продукта на 2025 год. Читать в блоге Grafana.
В этой статье обзор возможностей OpenTelemetry + прогноз развития продукта на 2025 год. Читать в блоге Grafana.
When Metrics Meet vminsert: A Data-Delivery Story
Статья в блоге VictoriaMetrics о том как загружаются данные в vmstorage.
Статья в блоге VictoriaMetrics о том как загружаются данные в vmstorage.
A Guide to Deploying Jaeger on Kubernetes in Production
В этой статье рассказано, что требуется для развертывания и управления бэкендом Jaeger в продовых средах.
❗️Статья на medium.com
В этой статье рассказано, что требуется для развертывания и управления бэкендом Jaeger в продовых средах.
❗️Статья на medium.com
lazyjournal
Графический интерфейс в терминале для вывода journalctl, а также контейнеров Docker и Podman для просмотра и фильтрации с нечетким поиском, поддержкой регулярных выражений (например, fzf и grep) и раскрашиванием вывода. Написан на Go с использованием библиотеки awesome-gocui.
Репыч на Гитхабе
Графический интерфейс в терминале для вывода journalctl, а также контейнеров Docker и Podman для просмотра и фильтрации с нечетким поиском, поддержкой регулярных выражений (например, fzf и grep) и раскрашиванием вывода. Написан на Go с использованием библиотеки awesome-gocui.
Репыч на Гитхабе
This media is not supported in your browser
VIEW IN TELEGRAM
Grafana community dashboards: Memorable use cases of 2024
В этой статье в блоге Grafana собраны интересные пользовательские дашборды пользователей, которые они создавали как в профессиональных, так и в личных целях. Возможно, увидите интересные для себя референсы.
В этой статье в блоге Grafana собраны интересные пользовательские дашборды пользователей, которые они создавали как в профессиональных, так и в личных целях. Возможно, увидите интересные для себя референсы.
Grafana Alerting: Save time and effort with Grafana-managed recording rules
Правила алертинга Grafana полезный инструмент для оптимизации выполнения одних и тех же запросов к источникам данных. При помощи правила вы можете заранее выполнять запросы к источникам данных и сохранять результат в БД с временными рядами (это может быть Prometheus, Mimir и т.д.). Подробности в этой статье в блоге Grafana.
Правила алертинга Grafana полезный инструмент для оптимизации выполнения одних и тех же запросов к источникам данных. При помощи правила вы можете заранее выполнять запросы к источникам данных и сохранять результат в БД с временными рядами (это может быть Prometheus, Mimir и т.д.). Подробности в этой статье в блоге Grafana.
OpenTelemetry Go 2025 Goals
В этой статье в блоге OpenTelemetry собраны планы по развитию продукта на 2025 год.
В этой статье в блоге OpenTelemetry собраны планы по развитию продукта на 2025 год.
Databases and SLOs: How to apply service level objectives to your databases with synthetic monitoring
В этой статье из блога Grafana рассказывается какие SLO можно прикрутить к БД и как это все реализовать при помощи экспортера Prometheus. Спойлер:
🚀sql_exporter_query_failures_total : общее количество запросов, отправленных экспортером, которые не были выполнены
🚀sql_exporter_queries_total : общее количество запросов, отправленных экспортером
🚀sql_exporter_query_duration_seconds_bucket : время, потраченное на запрос к базе данных по сегментам
🚀sql_exporter_query_duration_seconds_count : количество наблюдений в виде гистограммы
В этой статье из блога Grafana рассказывается какие SLO можно прикрутить к БД и как это все реализовать при помощи экспортера Prometheus. Спойлер:
🚀sql_exporter_query_failures_total : общее количество запросов, отправленных экспортером, которые не были выполнены
🚀sql_exporter_queries_total : общее количество запросов, отправленных экспортером
🚀sql_exporter_query_duration_seconds_bucket : время, потраченное на запрос к базе данных по сегментам
🚀sql_exporter_query_duration_seconds_count : количество наблюдений в виде гистограммы
pyrra
Утилита с открытым исходным кодом для визуализации SLO, бюджета ошибок и т.п. на основе данных из Prometheus.
Репыч на Гитхабе
Утилита с открытым исходным кодом для визуализации SLO, бюджета ошибок и т.п. на основе данных из Prometheus.
Репыч на Гитхабе
Prometheus SQL Exporter
Репозиторий содержит экспортер, который запускает пользовательские SQL-запросы с настраиваемыми интервалами и экспортирует полученные метрики через HTTP для использования в Prometheus.
Репыч на Гитхабе
Репозиторий содержит экспортер, который запускает пользовательские SQL-запросы с настраиваемыми интервалами и экспортирует полученные метрики через HTTP для использования в Prometheus.
Репыч на Гитхабе