Telegram Web Link
Unlocking Kubernetes Observability with the OpenTelemetry Operator

В статье рассматривается, как OpenTelemetry Operator упрощает сбор телеметрии, обеспечивая бесперебойный мониторинг как самого Kubernetes, так и приложений, работающих на нем. Читать дальше в блоге Dash0.
Редтимим мониторинг: рекон Grafana

Статья о том, что можно достать из Grafana, которая одной ногой торчит в интернете. Проверьте, хорошо ли она у вас защищена.
Эй, где моя ошибка? Как OpenTelemetry фиксирует ошибки

В зависимости от языка программирования, на котором вы привыкли работать, у вас могут быть определённые представления о том, что такое ошибка, что такое исключение и как его следует обрабатывать. Например, в Go нет исключений — отчасти для того, чтобы отбить у программистов желание причислять слишком много обычных ошибок к «исключительным». С другой стороны, в Java, Python и т. п. поддержка для работы с исключениями встроена.

Когда разные языки расходятся во мнении, что такое ошибки или исключения и как их обрабатывать, возникает вопрос: что использовать, если нужны стандартизированная телеметрия и отчёты об ошибках для микросервисов, написанных на этих языках? OpenTelemetry отвечает на него. Читать дальше на Хабре.
AngularJS support will be removed in Grafana 12: what you need to know

А все уже знают, что Grafana пересаживается с Angular на React? В рамках этого перехода поддержка AngularJS была отключена по умолчанию в Grafana 11, но пользователи могли снова включить ее с помощью angular_support_enabled=true. Статья - напоминание.

Что нужно знать и что поменяется в процессе перехода (спойлер: перестанут работать панели на Angular)
Мониторинг с Grafana. Best practices

Не очень свежая статья, но тем не менее актуальности не потеряла. Есть базовые рекомендации, о которых, быть может, вы не знали.
Настроил легковесный мониторинг для домашнего сервера с интеграцией Telegram для алертов: опыт использования Beszel

Слово автору:

Имея в домашнем парке сервер на базе Proxmox, на котором работает несколько виртуальных машин, а также отдельный мини-ПК под файловое хранилище и пару VDS для личных нужд, давно стал задумываться о необходимости мониторинга состояния устройств, включая сеть, диск, CPU и температуру.

Мне хотелось найти инструмент с базовым мониторингом без сложной настройки и необходимости разбираться в том, какие метрики собирать или как рисовать дашборды. Мне важно было получить готовое решение «из коробки», которое быстро развёртывается и отвечает моим требованиям. А ещё я хотел получать уведомления о возникающих проблемах, чтобы оперативно их решать. Читать дальше на Хабре.
How to use Prometheus to efficiently detect anomalies at scale

Допустим, вы работаете в дежурной смене и вам посреди ночи приходит уведомление. Вы его открываете, там ссылка на дашборд мониторинга, где вы задержку выполнения транзакций. Но является ли этот всплеск нормальным для этого времени суток? Является ли он вообще актуальным? Следующее, что вы делаете — вы расширяете временное окно и проверяете другие связанные показатели, пытаясь выяснить, что происходит.

Такая вот обычная ситуация. В этой статье в блоге Grafana разбираются какие математические выражения помогут наиболее эффективно и быстро обнаружить аномалии на различных графиках производительности.
Покоряем сетевой стек Linux: декапсулируем пакеты с помощью eBPF на скорости 6Mpps+

В этой статье автор рассказывает о том, как они использовали eBPF для перехвата и декапсуляции VXLAN-пакетов прямо в ядре, обеспечив корректный сбор статистики без значительных изменений в архитектуре системы. Разберает, какие требования привели их к этому решению, как его внедряли и каких результатов удалось достичь. Также расскажет, что такое eBPF, как работает технология, как начать с ней работать и на каких этапах сетевого стека Linux можно перехватывать пакеты с ее помощью. Читать дальше.
💻 На случай, если вы строите микросервисы, у нас есть для вас кое-что интересное…

Когда архитектура становится сложнее, стандартной Kafka может быть недостаточно для надёжной работы. Яндекс создал YDB Topics — брокер сообщений, который сочетает Kafka-совместимость с встроенными транзакциями и высоким уровнем доступности.

Приходите 23 апреля на вебинар, где объяснят, как YDB Topics масштабируется без ручных действий, обеспечивая бесперебойную работу даже при отказах ресурсов и пооговорят о борьбе с дублями через exactly once-семантику и о том, как отказаться от outbox-паттерна благодаря ACID-транзакциям.

Вдобавок будет обсуждение встроенных возможностей для корпоративной интеграции: управление ролями, аудитных логов, квот и поддержки LDAP.

Ждем вас!
Как сделать централизованное логирование и крепко спать по ночам

Действительно, как? В этой статье коллеги из МТС рассказывают как они работают с сервисом логирования на базе кластеров Open Search с более 400 терабайтами логов клиентов. Читать на Хабре.
Forwarded from Zabbix Recipes
Пришло время пригласить вас на вебинар, за который все так дружно проголосовали.

29 апреля в 11 часов утра по московскому времени мы расскажем о нашем подходе к использованию Zabbix, Grafana и ещё немного iTop в качестве инструментов для мониторинга работы ИТ-сервисов и создания древовидной структуры зависимостей компонентов друг от друга. Также на вебинаре накидаем несколько дашбордов в реалтайме.

Приходите — будет интересно!


Регистрация
Внедряем метрики OpenTelemetry в PHP проект на Yii2

В этой статье о том, как внедрить метрики в формате OpenTelemetry в PHP монолит, построенный на фреймворке Yii2. Читать дальше.
Bash + Telegram: мониторинг сервера и мгновенные уведомления

В этой статье рассказано о том, как написать bash-скрипт для отправки мгновенных уведомлений об активности на сервере в Telegram. Читать на Хабре.
От хаоса к порядку: автоматизация мониторинга СУБД в гибридных средах

Если вы DBA, то вы наверняка сталкивались с задачей мониторинга десятков инстансов баз данных — PostgreSQL, MSSQL, MariaDB, Oracle или что-то из NoSQL — на разных ОС, от bare metal до PaaS. Настройка мониторинга в таких условиях может занять недели, а ошибки в алертинге приводят к простоям. В статье рассказывают как настроить Victoria Metrics для сбора статистики с разнокалиберных баз данных. Читать дальше.
Forwarded from Zabbix Recipes
Давайте уже после майских проведем следующий вебинар.

Приходите 13 мая в 11 часов по московскому времени на следующий вебинар, где мы детально обсудим содержимое базы данных Zabbix, что там хранится и как с этим работать. Приглашайте коллег!

Регистрация

@zabbix_ru
Data sources, visualizations, and apps: A guide to extending and customizing Grafana

Эта статья из блока Grafana полезна тем, что в ней описана текущая структура плагинов. Сейчас их три:

1. Data sources — коммуникация с внешними источниками.
2. Panels (visualizations) — различные типы визуализаций.
3. Apps — бандл из первых двух типов.

Также вы узнаете о 5 различных вариантах подписи этих плагинов и их предназначениях:

1. Grafana
2. Enterprise
3. Community
4. Commercial
5. Private

Читать в блоге Grafana
How to Extend Percona Monitoring and Management (PMM) to Add Logging Functionality

PMM — это решение для мониторинга баз данных с открытым исходным кодом для MySQL, PostgreSQL, MongoDB. В статье разбирается расширение функционала мониторинга PMM при помощи VictoriaLogs.
Как не потерять миллионы на SLA: архитектурный подход к управлению ожиданиями

Создание SLA, которые действительно работают, а не просто выглядят красиво на бумаге, требует глубокого понимания архитектуры систем и грамотного управления ожиданиями клиентов. На этом видео независимый эксперт Игорь Цупко рассказывает о том, как этого достичь.
Гайд по бизнес-метрикам в Grafana для аналитиков: бороться и искать, найти и не сдаваться

Эта статья - пошаговая инструкция для тех аналитиков, кто без скиллов в BI пытается к утру сделать бизнес-метрики в Grafana, имея только доступ к ней. Надеюсь, что гайд поможет быстро настроить дашборд по бизнес-метрикам и найти варианты устранения ошибок, которые возникает в работе начинающего аналитика в данной сфере.
Как правильно использовать rate() в Grafana: от мониторинга до расчёта SLO

Функция rate() в PromQL необходима для вычисления средней скорости изменения метрики в секунду за определённый период времени. В статье рассказано подробно об этой функции и кейсах ее применения.
2025/07/01 03:35:18
Back to Top
HTML Embed Code: