How to monitor Containerd
В статье рассказывается о подходах к мониторингу containerd. Узнаете про плагины containerd и методах сбора метрик, логов, трейсов и профилировании. Читать статью.
В статье рассказывается о подходах к мониторингу containerd. Узнаете про плагины containerd и методах сбора метрик, логов, трейсов и профилировании. Читать статью.
🎓 Тренинг Zabbix Сертифицированный Специалист 7.0 26-30 августа — ответ на вопрос «как быстро получить самые полные знания по Zabbix 7.0».
❗️Приглашаем на дополнительный тренинг
В этом посте расскажем как проходит тренинг Zabbix Сертифицированный специалист.
📖 Тренинг состоит из практической и теоретической части, которые чередуются в течении дня. Т.е. сначала вы разбираете теорию, а затем выполняете практику. Для тренинга выделяется виртуальная машина с предустановленным Zabbix-сервером, где вы выполняете лабораторные задания. Все задания максимально приближены к реальным. Например, в ходе лабы вы настраиваете аутентификацию через LDAP, включая ролевую модель в Zabbix. Из LDAP прилетает пользователь вместе с дополнительными полями, например email для оповещений. Также есть задания с отправкой PDF-отчетов, созданием Действий, формированиям сценария проверки через Selenium и т.д.
🚀 Весь курс выглядит как тестовый полигон, на котором вы сможете восполнить пробелы, которые у вас могли возникнуть в ходе эксплуатации Zabbix.
👨💻К нам на обучение приходят руководители, которые хотят разобраться с этой системой мониторинга, чтобы лучше понимать как им выстроить процесс мониторинга и что там можно улучшить. Приходите и вы.
📎 В приложении первые слайды из презентаций по каждому, чтобы вы могли увидеть перечень охватываемых тем за все 5 дней.
P.S. Zabbix сертифицированный профессионал 7.0 (ZCP 7.0) будет сразу следом — 9-11 сентября. Можно сказать, уникальный шанс прокачаться за короткое время.
Запрос дополнительной информации можно отправить @galssoftware или на [email protected], а также через форму обратной связи на gals.software. Там же можно узнать о датах следующих тренингах, включая тренинги в 2025 году (если закладываете бюджет).
❗️Приглашаем на дополнительный тренинг
В этом посте расскажем как проходит тренинг Zabbix Сертифицированный специалист.
📖 Тренинг состоит из практической и теоретической части, которые чередуются в течении дня. Т.е. сначала вы разбираете теорию, а затем выполняете практику. Для тренинга выделяется виртуальная машина с предустановленным Zabbix-сервером, где вы выполняете лабораторные задания. Все задания максимально приближены к реальным. Например, в ходе лабы вы настраиваете аутентификацию через LDAP, включая ролевую модель в Zabbix. Из LDAP прилетает пользователь вместе с дополнительными полями, например email для оповещений. Также есть задания с отправкой PDF-отчетов, созданием Действий, формированиям сценария проверки через Selenium и т.д.
🚀 Весь курс выглядит как тестовый полигон, на котором вы сможете восполнить пробелы, которые у вас могли возникнуть в ходе эксплуатации Zabbix.
👨💻К нам на обучение приходят руководители, которые хотят разобраться с этой системой мониторинга, чтобы лучше понимать как им выстроить процесс мониторинга и что там можно улучшить. Приходите и вы.
📎 В приложении первые слайды из презентаций по каждому, чтобы вы могли увидеть перечень охватываемых тем за все 5 дней.
P.S. Zabbix сертифицированный профессионал 7.0 (ZCP 7.0) будет сразу следом — 9-11 сентября. Можно сказать, уникальный шанс прокачаться за короткое время.
Запрос дополнительной информации можно отправить @galssoftware или на [email protected], а также через форму обратной связи на gals.software. Там же можно узнать о датах следующих тренингах, включая тренинги в 2025 году (если закладываете бюджет).
Tracing Kubernetes Services
В этой статье пойдет речь про iptables — пользовательское окружение, которое непосредственно работает с netfilter. Последний может, среди прочего, перенаправлять трафик в другие места назначения. Читать статью.
❗️Статья на medium.com
В этой статье пойдет речь про iptables — пользовательское окружение, которое непосредственно работает с netfilter. Последний может, среди прочего, перенаправлять трафик в другие места назначения. Читать статью.
❗️Статья на medium.com
deepflow
DeepFlow — проект с открытым исходным кодом, который предназначен для обеспечения наблюдаемости сложных облачных и ИИ-приложений. DeepFlow реализует сбор данных при помощи eBPF-метрик, распределенной трассировки, логов запросов и профилирования функций.
Репыч на Гитхабе
DeepFlow — проект с открытым исходным кодом, который предназначен для обеспечения наблюдаемости сложных облачных и ИИ-приложений. DeepFlow реализует сбор данных при помощи eBPF-метрик, распределенной трассировки, логов запросов и профилирования функций.
Репыч на Гитхабе
What to Use When: OpenTelemetry vs. eBPF
OpenTelemetry и eBPF имеют различные функции, они охватывают разные области мониторинга системы. Понимание их сильных сторон и того, когда их использовать, может значительно улучшить подход к наблюдаемости. В статье разобраны их отличия и кейсы использования.
❗️Статья на medium.com
OpenTelemetry и eBPF имеют различные функции, они охватывают разные области мониторинга системы. Понимание их сильных сторон и того, когда их использовать, может значительно улучшить подход к наблюдаемости. В статье разобраны их отличия и кейсы использования.
❗️Статья на medium.com
Proactive PostgreSQL Database Performance Scanner
Эта статья посвящена мониторингу баз данных PostgreSQL. Здесь описывается подход, который позволяет легко идентифицировать запросы, которые неэффективно используют систему, помогает найти причину проблем с производительностью и помогает понять типичные шаблоны нагрузки и узкие места производительности.
Proactive PostgreSQL Database(s) Performance Scanner — это скрипт, который подключается к базе данных и запускает набор проверок, которые можно расширить при желании. Все проверки — это запросы к базе данных, объединенные по структуре. Посмотреть что за скрипт и как его использовать.
❗️Статья на medium.com
Эта статья посвящена мониторингу баз данных PostgreSQL. Здесь описывается подход, который позволяет легко идентифицировать запросы, которые неэффективно используют систему, помогает найти причину проблем с производительностью и помогает понять типичные шаблоны нагрузки и узкие места производительности.
Proactive PostgreSQL Database(s) Performance Scanner — это скрипт, который подключается к базе данных и запускает набор проверок, которые можно расширить при желании. Все проверки — это запросы к базе данных, объединенные по структуре. Посмотреть что за скрипт и как его использовать.
❗️Статья на medium.com
Detecting Specific Incidents Within Your Kubernetes Cluster Using eBPF
eBPF — это технология, которая позволяет запускать пользовательский низкоуровневый код в ядре Linux без необходимости изменять само ядро. Она обеспечивает возможность отслеживания и фильтрации событий в различных точках ядра, что делает ее ценным инструментом для мониторинга и защиты инфраструктуры Kubernetes. В этой статье рассмотрено, как использовать eBPF для обнаружения определенных инцидентов в кластере Kubernetes.
❗️Статья на medium.com
eBPF — это технология, которая позволяет запускать пользовательский низкоуровневый код в ядре Linux без необходимости изменять само ядро. Она обеспечивает возможность отслеживания и фильтрации событий в различных точках ядра, что делает ее ценным инструментом для мониторинга и защиты инфраструктуры Kubernetes. В этой статье рассмотрено, как использовать eBPF для обнаружения определенных инцидентов в кластере Kubernetes.
❗️Статья на medium.com
Simplify Kubernetes Monitoring: Kube-prometheus-stack Made Easy with Glasskube
Kube-Prometheus-Stack имеет на борту набор манифестов Kubernetes, дашбордов Grafana и правил Prometheus, предоставляя простое в эксплуатации решение для мониторинга кластера Kubernetes с Prometheus. Звучит как хорошая новость, и это так, но стек упакован в Helm-чарт и только values.yaml содержит более 4000 строк. Настройка и поддержка такого Helm-чарта такое себе занятие.
Glasskube — инструмент для упрощения работы и настроек в Kube-Prometheus-Stack. Да, он теперь поддерживает Kube-Prometheus-Stack. В этой статье рассмотрены шаги по настройке и установке Kube-Prometheus-Stack совместно с Glasskube.
Репыч Glasskube на Github
❗️Статья на medium.com
Kube-Prometheus-Stack имеет на борту набор манифестов Kubernetes, дашбордов Grafana и правил Prometheus, предоставляя простое в эксплуатации решение для мониторинга кластера Kubernetes с Prometheus. Звучит как хорошая новость, и это так, но стек упакован в Helm-чарт и только values.yaml содержит более 4000 строк. Настройка и поддержка такого Helm-чарта такое себе занятие.
Glasskube — инструмент для упрощения работы и настроек в Kube-Prometheus-Stack. Да, он теперь поддерживает Kube-Prometheus-Stack. В этой статье рассмотрены шаги по настройке и установке Kube-Prometheus-Stack совместно с Glasskube.
Репыч Glasskube на Github
❗️Статья на medium.com
ChatOps на практике: создание бота для мониторинга логов
«Недавно на работе меня попросили придумать рабочую задачку для студентов. Поскольку я работаю в инфраструктурной команде, мои повседневные задачи вряд ли подходят для их домашек или курсовых работ. Чтобы найти подходящую идею, я начал перебирать инструменты, которыми мы с командой часто пользуемся. Большинство из них интегрированы с чатами и ботами, и один из ключевых инструментов — это Алерт Бот. Он отслеживает логи и отправляет оповещения, если происходит что-то необычное. Это позволяет нам быстрее обнаруживать и устранять инциденты.
Когда я придумал эту задачу для студентов, мне пришло в голову, что подобный функционал может быть полезен многим. Возможно, кто-то сможет адаптировать это решение под свои нужды и облегчить себе жизнь, автоматизируя процесс мониторинга и реагирования на инциденты. Собственно этим я бы и хотел поделиться в своей статье.»
Читать на Хабре
«Недавно на работе меня попросили придумать рабочую задачку для студентов. Поскольку я работаю в инфраструктурной команде, мои повседневные задачи вряд ли подходят для их домашек или курсовых работ. Чтобы найти подходящую идею, я начал перебирать инструменты, которыми мы с командой часто пользуемся. Большинство из них интегрированы с чатами и ботами, и один из ключевых инструментов — это Алерт Бот. Он отслеживает логи и отправляет оповещения, если происходит что-то необычное. Это позволяет нам быстрее обнаруживать и устранять инциденты.
Когда я придумал эту задачу для студентов, мне пришло в голову, что подобный функционал может быть полезен многим. Возможно, кто-то сможет адаптировать это решение под свои нужды и облегчить себе жизнь, автоматизируя процесс мониторинга и реагирования на инциденты. Собственно этим я бы и хотел поделиться в своей статье.»
Читать на Хабре
Профилирование Java-приложений: от HeapDump до Grafana
В этой статье разобраны HeapDump, ThreadDump, VisualVM, Grafana, HikariPool, Prometheus и Garbage Collector. Описаны потенциальные проблемные сценарии (use-case’ы) и шаги, которые необходимо предпринять для локализации и решения проблемы. Читать на Хабре.
В этой статье разобраны HeapDump, ThreadDump, VisualVM, Grafana, HikariPool, Prometheus и Garbage Collector. Описаны потенциальные проблемные сценарии (use-case’ы) и шаги, которые необходимо предпринять для локализации и решения проблемы. Читать на Хабре.
Logger C++
Этот проект представляет собой простую и гибкую библиотеку для логирования на C++. Библиотека поддерживает разные уровни логирования, форматирование сообщений и возможность записи логов в разные потоки. Статья на Хабре.
Репыч на Гитхабе
Этот проект представляет собой простую и гибкую библиотеку для логирования на C++. Библиотека поддерживает разные уровни логирования, форматирование сообщений и возможность записи логов в разные потоки. Статья на Хабре.
Репыч на Гитхабе
The Kafka Metric You’re Not Using: Stop Counting Messages, Start Measuring Time
Один из способов мониторинга групп консьюмеров — оповещение о разнице между максимальным смещением раздела топика (т. е. смещением последнего созданного сообщения) и максимальным смещением, закоммиченным группой консьюмеров для того же раздела топика. В этой статье разбирается мониторинг Kafka с точки зрения измерения временного лага. Читать статью.
❗️Статья на medium.com
Один из способов мониторинга групп консьюмеров — оповещение о разнице между максимальным смещением раздела топика (т. е. смещением последнего созданного сообщения) и максимальным смещением, закоммиченным группой консьюмеров для того же раздела топика. В этой статье разбирается мониторинг Kafka с точки зрения измерения временного лага. Читать статью.
❗️Статья на medium.com
k8spacket - a fully based on eBPF right now
Репыч на Гитхабе
Что такое k8spacket? Это инструмент для сбора информации о трафике TCP и метаданных TLS-подключений в кластере Kubernetes с использованием eBPF и визуализации в Grafana. Подробнее в статье.
❗️ Статья на medium.com
Репыч на Гитхабе
Что такое k8spacket? Это инструмент для сбора информации о трафике TCP и метаданных TLS-подключений в кластере Kubernetes с использованием eBPF и визуализации в Grafana. Подробнее в статье.
❗️ Статья на medium.com
Writing an Excellent Postmortem
Чтобы побудить инженеров делиться результатами постмортемов, должна быть культура безупречности . То есть, относиться к инциденту как к артефакту, а не как к отражению способностей инженера. Чтобы способствовать развитию этой культуры, компании должны включать управление инцидентами (включая постмортемы) в качестве части критериев оценки производительности. Самопроизвольные инциденты должны быть изучены и устранены; другие должны быть сокращены, а их усилия соответственно вознаграждены. В статье подробно разбираются подходы к идеальным постмортемам.
❗️ Статья на medium.com
Чтобы побудить инженеров делиться результатами постмортемов, должна быть культура безупречности . То есть, относиться к инциденту как к артефакту, а не как к отражению способностей инженера. Чтобы способствовать развитию этой культуры, компании должны включать управление инцидентами (включая постмортемы) в качестве части критериев оценки производительности. Самопроизвольные инциденты должны быть изучены и устранены; другие должны быть сокращены, а их усилия соответственно вознаграждены. В статье подробно разбираются подходы к идеальным постмортемам.
❗️ Статья на medium.com
25 сентября в Москве пройдёт одно из самых крупных мероприятий по облачным технологиям – Yandex Scale
На конференции выступят эксперты Yandex Cloud, а также приглашённые специалисты из Mindbox, Lamoda, Райффайзен банка и других компаний — всего более 50 спикеров.
Генеративные нейросети, речевые технологии, новинки сервисов инфраструктуры, решения по работе с данными и безопасности, AI‑инструменты и serverless‑подход — в каждом треке ожидаются технологические анонсы и разбор кейсов.
Мероприятие будет интересно как руководителям и менеджерам, так и разработчикам, тестировщикам, архитекторам, инженерам SIEM и другим ИТ-специалистам. Присоединиться можно офлайн и онлайн, очных участников ждёт afterparty.
Участие бесплатное, регистрация открыта.
На конференции выступят эксперты Yandex Cloud, а также приглашённые специалисты из Mindbox, Lamoda, Райффайзен банка и других компаний — всего более 50 спикеров.
Генеративные нейросети, речевые технологии, новинки сервисов инфраструктуры, решения по работе с данными и безопасности, AI‑инструменты и serverless‑подход — в каждом треке ожидаются технологические анонсы и разбор кейсов.
Мероприятие будет интересно как руководителям и менеджерам, так и разработчикам, тестировщикам, архитекторам, инженерам SIEM и другим ИТ-специалистам. Присоединиться можно офлайн и онлайн, очных участников ждёт afterparty.
Участие бесплатное, регистрация открыта.