Telegram Web Link
sniffnet

Легковесная утилитка для мониторинга (прослушивания трафика).

Репыч на Гитхабе
Grafana Tempo 2.6 release: performance improvements and new TraceQL features

В этой статье в блоге Grafana разобраны обновления в новой версии Grafana Tempo.
Scaling Prometheus with Cortex

В этой статье рассказывают, что такое Cortex, раскрывают его архитектуру и функциональные возможности. Затем рассказывают о настройке Cortex с Prometheus, а также о мониторинге в формате высокой доступности. Читать статью.
Как следить за состоянием мобильного приложения?

«Знакома ли вам ситуация, когда вы спокойно работаете, а клиентская служба передаёт вам странный репорт: несколько пользователей жалуются, что в приложении не грузятся картинки, но у вас всё работает. Или пользователь пишет в Google Play, что приложение занимает несколько гигабайт, и вы не понимаете, сколько таких пользователей и что с этим делать. Нужно ли срочно бросаться чинить, или это может подождать следующего планового релиза?»

Согласитесь, было бы здорово узнавать о проблемах раньше, чем пользователи начнут жаловаться в поддержку. В этой статье автор расскажет, как они в Циан создавали Техническую Мобильную Аналитику (ТьМА) и получили возможность в любой момент времени ответить на вопрос: «Всё ли в порядке с приложением?» Читать на Хабре.
Трассировка OpenTelemetry в 200 строк кода

Разработчики часто воспринимают трассировку как нечто загадочное, и OpenTelemetry — не исключение. Она может казаться еще более сложной из‑за множества новых концепций, с которыми сталкиваешься в базовых примерах.

Ситуация усугубляется тем, что по мере создания стабильной и надежной библиотеки для трассировки сам код усложняется, чтобы учитывать редкие случаи, поддерживать работу в разных окружениях и оптимизировать производительность, минимизируя влияние на приложения. Это особенно заметно при использовании автоматической инструментации, которая может «волшебным образом» оборачивать или изменять код, который изначально для этого не предназначен.

Неудивительно, что многие разработчики воспринимают библиотеки трассировки как «черные ящики». Мы добавляем их в приложения, надеемся на лучшее и полагаемся на них в критические моменты, например, во время инцидентов ночью.

На самом деле, трассировка гораздо проще, чем кажется. Если разобрать её на части, можно представить её как комбинацию «необычного логирования» и «распространения контекста». Читать дальше на Хабре.
Одна платформа, чтобы мониторить всех: как мы осуществляем трассировку, работаем с логами и метриками во всей экосистеме

В этой статье рассказывают, как мы с помощью платформы мониторинга осуществляется распределенная трассировка, сбор и хранение метрик и централизованное логирование. Читать на Хабре.
OpenTelemetry с нуля до 100: пример внедрения Норвежским управлением труда и соцобеспечения

Это история о том, как внедряли OpenTelemetry в Норвежском управлении труда и социального обеспечения (NAV). Рассмотрен путь от первых коммитов до реального применения в production. А ещё рассказано о некоторых трудностях, с которыми столкнулись, и о том, как их преодолели.

В NAV используется микросервисная архитектура с тысячами сервисов, работающих в кластерах Kubernetes. С самого начала они убеждали команды перейти на Prometheus и Grafana. Увы, но они до сих пор в значительной степени полагаются на логи приложений, изучая их в Kibana.

Без надлежащего трейсинга трудно понять, как запросы проходят через систему. Это затрудняет устранение ошибок в длинных и зачастую сложных цепочках обработки данных или оптимизацию медленных запросов. Для команд, которые внедрили event-driven архитектуру на базе Kafka, этот вызов стал особо острым. Это всё равно что пытаться ориентироваться в городе без карты. Читать дальше на Хабре.
Как мы доработали postgres_exporter для мониторинга событий в БД

В Сбере решили мониторить базы данных связкой Grafana, Prometheus и postgres_exporter. Но, во‑первых, столкнулись, с тем, что не хватает гибкости в использовании queries.yaml в postgres exporter. А, во‑вторых, так они не могли регистрировать события с таймаутом меньше 15 секунд. Поэтому они сделали свой инструмент для мониторинга — pangolin_exporter. Эта статья будет полезна тем, кто мониторит инфраструктуру с помощью postgres_exporter и хочет кастомизировать всё под свои нужды. Читать дальше на Хабре.
perses

Дашборд для визуализации данных наблюдаемости из Prometheus/Thanos/Jaeger.

Репыч на Гитхабе.
How We Migrated from StatsD to Prometheus in One Month

Недавно мы перенесли все наши метрики инфраструктуры из StatsD в Prometheus и очень довольны результатами. Миграция потребовала много работы, и мы многому научились в процессе. Цель этого поста — пролить свет на то, почему мы перешли на Prometheus, а также описать некоторые технические проблемы, с которыми мы столкнулись в ходе процесса. Читать статью.

❗️Статья в блоге на Medium
How to reduce expenses on monitoring: be smarter about data

Мониторинг может стать дорогостоящим из-за огромного количества данных, которые необходимо обработать. В этой статье вы узнаете о лучших способах хранения и обработки показателей мониторинга для сокращения расходов, а также о том, как VictoriaMetrics может в этом помочь. Читать статью.
Customizing ICMP Payload in Ping Command

Ping — полезный протокол, который очень распространен при мониторинге доступности удаленных систем. В этой статье разобран механизм работы этого протокола и принципы работы таких утилит как ping, fping, hping. Статья длинная и полезная. Читать.

❗️Статья на medium.com
beszel

Легковесная утилита для мониторинга ресурсов сервера с историческими данными, статистикой и алертами.

Репыч на Гитхабе
Как снизить расходы на мониторинг: более разумный подход к данным

В этой статье вы узнаете о лучших способах хранения и обработки метрик мониторинга для снижения расходов на хранение и о том, как VictoriaMetrics может в этом помочь. Читать перевод на Хабре.
Key Prometheus concepts every Grafana user should know

В этой статье автор поделится некоторыми из своих ключевых выводов из книги «Prometheus Up & Running», которые особенно актуальны для инженеров, работающих с Grafana. Читать в блоге Grafana.
Inside PromQL: A closer look at the mechanics of a Prometheus query

В этой автор предлагает заглянуть под капот Prometheus и лучше понять, как данные передаются от источника к конечному пункту назначения в API. Автор также прикладывает ссылку на свое выступление и слайды с PromCon 2024. Читать статью.
Как снизить расходы на мониторинг: замена Prometheus на VictoriaMetrics

Мониторинг может оказаться дорогим делом из-за огромных объемов данных, которые необходимо обрабатывать. В этой статье вы узнаете о лучших способах хранения и обработки метрик мониторинга для снижения расходов и о том, как VictoriaMetrics может в этом помочь. Читать на Хабре.
Monitoring Microsoft SQL Server with Grafana: A Comprehensive Guide

В этой статье автор делится комплексной панелью Grafana, которую он создал для мониторинга Microsoft SQL Server. Дашборд построен с использованием собственных функций MS SQL, без необходимости использования дополнительных инструментов, таких как Prometheus. Читать статью.

Статья на medium.com
Monitoring Failed Jobs in NetBackup with Zabbix

Мониторинг решений резервного копирования может быть трудной задачей – особенно потому, что многие инструменты резервного копирования не предоставляют API и с ними просто нелегко работать. Одно из таких решений – NetBackup. К счастью, Zabbix с его функциями низкоуровневого обнаружения (LLD) и возможностью использовать пользовательские параметры для расширения агента Zabbix поможет решить задачу мониторинга NetBackup. Подробнее в блоге Zabbix.
promscale — всё?

Случайно зашел в репозиторий Promscale и увидел, что он в архиве со 2 апреля 2024 года. Интересное было решение. Кто-то его использовал в работе? Может на какой-то аналог перешли?
2025/07/05 06:06:16
Back to Top
HTML Embed Code: