Telegram Web Link
How to monitor Containerd

В статье рассказывается о подходах к мониторингу containerd. Узнаете про плагины containerd и методах сбора метрик, логов, трейсов и профилировании. Читать статью.
🎓 Тренинг Zabbix Сертифицированный Специалист 7.0 26-30 августа — ответ на вопрос «как быстро получить самые полные знания по Zabbix 7.0».

❗️Приглашаем на дополнительный тренинг

В этом посте расскажем как проходит тренинг Zabbix Сертифицированный специалист.

📖 Тренинг состоит из практической и теоретической части, которые чередуются в течении дня. Т.е. сначала вы разбираете теорию, а затем выполняете практику. Для тренинга выделяется виртуальная машина с предустановленным Zabbix-сервером, где вы выполняете лабораторные задания. Все задания максимально приближены к реальным. Например, в ходе лабы вы настраиваете аутентификацию через LDAP, включая ролевую модель в Zabbix. Из LDAP прилетает пользователь вместе с дополнительными полями, например email для оповещений. Также есть задания с отправкой PDF-отчетов, созданием Действий, формированиям сценария проверки через Selenium и т.д.

🚀 Весь курс выглядит как тестовый полигон, на котором вы сможете восполнить пробелы, которые у вас могли возникнуть в ходе эксплуатации Zabbix.

👨‍💻К нам на обучение приходят руководители, которые хотят разобраться с этой системой мониторинга, чтобы лучше понимать как им выстроить процесс мониторинга и что там можно улучшить. Приходите и вы.

📎 В приложении первые слайды из презентаций по каждому, чтобы вы могли увидеть перечень охватываемых тем за все 5 дней.

P.S. Zabbix сертифицированный профессионал 7.0 (ZCP 7.0) будет сразу следом — 9-11 сентября. Можно сказать, уникальный шанс прокачаться за короткое время.

Запрос дополнительной информации можно отправить @galssoftware или на [email protected], а также через форму обратной связи на gals.software. Там же можно узнать о датах следующих тренингах, включая тренинги в 2025 году (если закладываете бюджет).
Tracing Kubernetes Services

В этой статье пойдет речь про iptables — пользовательское окружение, которое непосредственно работает с netfilter. Последний может, среди прочего, перенаправлять трафик в другие места назначения. Читать статью.

❗️Статья на medium.com
deepflow

DeepFlow — проект с открытым исходным кодом, который предназначен для обеспечения наблюдаемости сложных облачных и ИИ-приложений. DeepFlow реализует сбор данных при помощи eBPF-метрик, распределенной трассировки, логов запросов и профилирования функций.

Репыч на Гитхабе
What to Use When: OpenTelemetry vs. eBPF

OpenTelemetry и eBPF имеют различные функции, они охватывают разные области мониторинга системы. Понимание их сильных сторон и того, когда их использовать, может значительно улучшить подход к наблюдаемости. В статье разобраны их отличия и кейсы использования.

❗️Статья на medium.com
Mastering Latency Metrics: P90, P95, P99

Наблюдая за задержками P90, P95 и P99, можно выявить потенциальные узкие места для оптимизации пользовательского опыта. В статье разобран подход к мониторингу с точки зрения персентилей и их измерений.
Proactive PostgreSQL Database Performance Scanner

Эта статья посвящена мониторингу баз данных PostgreSQL. Здесь описывается подход, который позволяет легко идентифицировать запросы, которые неэффективно используют систему, помогает найти причину проблем с производительностью и помогает понять типичные шаблоны нагрузки и узкие места производительности.

Proactive PostgreSQL Database(s) Performance Scanner — это скрипт, который подключается к базе данных и запускает набор проверок, которые можно расширить при желании. Все проверки — это запросы к базе данных, объединенные по структуре. Посмотреть что за скрипт и как его использовать.

❗️Статья на medium.com
Detecting Specific Incidents Within Your Kubernetes Cluster Using eBPF

eBPF — это технология, которая позволяет запускать пользовательский низкоуровневый код в ядре Linux без необходимости изменять само ядро. Она обеспечивает возможность отслеживания и фильтрации событий в различных точках ядра, что делает ее ценным инструментом для мониторинга и защиты инфраструктуры Kubernetes. В этой статье рассмотрено, как использовать eBPF для обнаружения определенных инцидентов в кластере Kubernetes.

❗️Статья на medium.com
Simplify Kubernetes Monitoring: Kube-prometheus-stack Made Easy with Glasskube

Kube-Prometheus-Stack имеет на борту набор манифестов Kubernetes, дашбордов Grafana и правил Prometheus, предоставляя простое в эксплуатации решение для мониторинга кластера Kubernetes с Prometheus. Звучит как хорошая новость, и это так, но стек упакован в Helm-чарт и только values.yaml содержит более 4000 строк. Настройка и поддержка такого Helm-чарта такое себе занятие.

Glasskube — инструмент для упрощения работы и настроек в Kube-Prometheus-Stack. Да, он теперь поддерживает Kube-Prometheus-Stack. В этой статье рассмотрены шаги по настройке и установке Kube-Prometheus-Stack совместно с Glasskube.

Репыч Glasskube на Github

❗️Статья на medium.com
ChatOps на практике: создание бота для мониторинга логов

«Недавно на работе меня попросили придумать рабочую задачку для студентов. Поскольку я работаю в инфраструктурной команде, мои повседневные задачи вряд ли подходят для их домашек или курсовых работ. Чтобы найти подходящую идею, я начал перебирать инструменты, которыми мы с командой часто пользуемся. Большинство из них интегрированы с чатами и ботами, и один из ключевых инструментов — это Алерт Бот. Он отслеживает логи и отправляет оповещения, если происходит что-то необычное. Это позволяет нам быстрее обнаруживать и устранять инциденты.

Когда я придумал эту задачу для студентов, мне пришло в голову, что подобный функционал может быть полезен многим. Возможно, кто-то сможет адаптировать это решение под свои нужды и облегчить себе жизнь, автоматизируя процесс мониторинга и реагирования на инциденты. Собственно этим я бы и хотел поделиться в своей статье.»

Читать на Хабре
Профилирование Java-приложений: от HeapDump до Grafana

В этой статье разобраны HeapDump, ThreadDump, VisualVM, Grafana, HikariPool, Prometheus и Garbage Collector. Описаны потенциальные проблемные сценарии (use-case’ы) и шаги, которые необходимо предпринять для локализации и решения проблемы. Читать на Хабре.
Logger C++

Этот проект представляет собой простую и гибкую библиотеку для логирования на C++. Библиотека поддерживает разные уровни логирования, форматирование сообщений и возможность записи логов в разные потоки. Статья на Хабре.

Репыч на Гитхабе
The Kafka Metric You’re Not Using: Stop Counting Messages, Start Measuring Time

Один из способов мониторинга групп консьюмеров — оповещение о разнице между максимальным смещением раздела топика (т. е. смещением последнего созданного сообщения) и максимальным смещением, закоммиченным группой консьюмеров для того же раздела топика. В этой статье разбирается мониторинг Kafka с точки зрения измерения временного лага. Читать статью.

❗️Статья на medium.com
k8spacket - a fully based on eBPF right now

Репыч на Гитхабе

Что такое k8spacket? Это инструмент для сбора информации о трафике TCP и метаданных TLS-подключений в кластере Kubernetes с использованием eBPF и визуализации в Grafana. Подробнее в статье.

❗️ Статья на medium.com
Writing an Excellent Postmortem

Чтобы побудить инженеров делиться результатами постмортемов, должна быть культура безупречности . То есть, относиться к инциденту как к артефакту, а не как к отражению способностей инженера. Чтобы способствовать развитию этой культуры, компании должны включать управление инцидентами (включая постмортемы) в качестве части критериев оценки производительности. Самопроизвольные инциденты должны быть изучены и устранены; другие должны быть сокращены, а их усилия соответственно вознаграждены. В статье подробно разбираются подходы к идеальным постмортемам.

❗️ Статья на medium.com
25 сентября в Москве пройдёт одно из самых крупных мероприятий по облачным технологиям – Yandex Scale

На конференции выступят эксперты Yandex Cloud, а также приглашённые специалисты из Mindbox, Lamoda, Райффайзен банка и других компаний — всего более 50 спикеров.

Генеративные нейросети, речевые технологии, новинки сервисов инфраструктуры, решения по работе с данными и безопасности, AI‑инструменты и serverless‑подход — в каждом треке ожидаются технологические анонсы и разбор кейсов.

Мероприятие будет интересно как руководителям и менеджерам, так и разработчикам, тестировщикам, архитекторам, инженерам SIEM и другим ИТ-специалистам. Присоединиться можно офлайн и онлайн, очных участников ждёт afterparty.

Участие бесплатное,
регистрация открыта.
2025/07/06 22:44:11
Back to Top
HTML Embed Code: