Proactive PostgreSQL Database Performance Scanner
Эта статья посвящена мониторингу баз данных PostgreSQL. Здесь описывается подход, который позволяет легко идентифицировать запросы, которые неэффективно используют систему, помогает найти причину проблем с производительностью и помогает понять типичные шаблоны нагрузки и узкие места производительности.
Proactive PostgreSQL Database(s) Performance Scanner — это скрипт, который подключается к базе данных и запускает набор проверок, которые можно расширить при желании. Все проверки — это запросы к базе данных, объединенные по структуре. Посмотреть что за скрипт и как его использовать.
❗️Статья на medium.com
Эта статья посвящена мониторингу баз данных PostgreSQL. Здесь описывается подход, который позволяет легко идентифицировать запросы, которые неэффективно используют систему, помогает найти причину проблем с производительностью и помогает понять типичные шаблоны нагрузки и узкие места производительности.
Proactive PostgreSQL Database(s) Performance Scanner — это скрипт, который подключается к базе данных и запускает набор проверок, которые можно расширить при желании. Все проверки — это запросы к базе данных, объединенные по структуре. Посмотреть что за скрипт и как его использовать.
❗️Статья на medium.com
Detecting Specific Incidents Within Your Kubernetes Cluster Using eBPF
eBPF — это технология, которая позволяет запускать пользовательский низкоуровневый код в ядре Linux без необходимости изменять само ядро. Она обеспечивает возможность отслеживания и фильтрации событий в различных точках ядра, что делает ее ценным инструментом для мониторинга и защиты инфраструктуры Kubernetes. В этой статье рассмотрено, как использовать eBPF для обнаружения определенных инцидентов в кластере Kubernetes.
❗️Статья на medium.com
eBPF — это технология, которая позволяет запускать пользовательский низкоуровневый код в ядре Linux без необходимости изменять само ядро. Она обеспечивает возможность отслеживания и фильтрации событий в различных точках ядра, что делает ее ценным инструментом для мониторинга и защиты инфраструктуры Kubernetes. В этой статье рассмотрено, как использовать eBPF для обнаружения определенных инцидентов в кластере Kubernetes.
❗️Статья на medium.com
Simplify Kubernetes Monitoring: Kube-prometheus-stack Made Easy with Glasskube
Kube-Prometheus-Stack имеет на борту набор манифестов Kubernetes, дашбордов Grafana и правил Prometheus, предоставляя простое в эксплуатации решение для мониторинга кластера Kubernetes с Prometheus. Звучит как хорошая новость, и это так, но стек упакован в Helm-чарт и только values.yaml содержит более 4000 строк. Настройка и поддержка такого Helm-чарта такое себе занятие.
Glasskube — инструмент для упрощения работы и настроек в Kube-Prometheus-Stack. Да, он теперь поддерживает Kube-Prometheus-Stack. В этой статье рассмотрены шаги по настройке и установке Kube-Prometheus-Stack совместно с Glasskube.
Репыч Glasskube на Github
❗️Статья на medium.com
Kube-Prometheus-Stack имеет на борту набор манифестов Kubernetes, дашбордов Grafana и правил Prometheus, предоставляя простое в эксплуатации решение для мониторинга кластера Kubernetes с Prometheus. Звучит как хорошая новость, и это так, но стек упакован в Helm-чарт и только values.yaml содержит более 4000 строк. Настройка и поддержка такого Helm-чарта такое себе занятие.
Glasskube — инструмент для упрощения работы и настроек в Kube-Prometheus-Stack. Да, он теперь поддерживает Kube-Prometheus-Stack. В этой статье рассмотрены шаги по настройке и установке Kube-Prometheus-Stack совместно с Glasskube.
Репыч Glasskube на Github
❗️Статья на medium.com
ChatOps на практике: создание бота для мониторинга логов
«Недавно на работе меня попросили придумать рабочую задачку для студентов. Поскольку я работаю в инфраструктурной команде, мои повседневные задачи вряд ли подходят для их домашек или курсовых работ. Чтобы найти подходящую идею, я начал перебирать инструменты, которыми мы с командой часто пользуемся. Большинство из них интегрированы с чатами и ботами, и один из ключевых инструментов — это Алерт Бот. Он отслеживает логи и отправляет оповещения, если происходит что-то необычное. Это позволяет нам быстрее обнаруживать и устранять инциденты.
Когда я придумал эту задачу для студентов, мне пришло в голову, что подобный функционал может быть полезен многим. Возможно, кто-то сможет адаптировать это решение под свои нужды и облегчить себе жизнь, автоматизируя процесс мониторинга и реагирования на инциденты. Собственно этим я бы и хотел поделиться в своей статье.»
Читать на Хабре
«Недавно на работе меня попросили придумать рабочую задачку для студентов. Поскольку я работаю в инфраструктурной команде, мои повседневные задачи вряд ли подходят для их домашек или курсовых работ. Чтобы найти подходящую идею, я начал перебирать инструменты, которыми мы с командой часто пользуемся. Большинство из них интегрированы с чатами и ботами, и один из ключевых инструментов — это Алерт Бот. Он отслеживает логи и отправляет оповещения, если происходит что-то необычное. Это позволяет нам быстрее обнаруживать и устранять инциденты.
Когда я придумал эту задачу для студентов, мне пришло в голову, что подобный функционал может быть полезен многим. Возможно, кто-то сможет адаптировать это решение под свои нужды и облегчить себе жизнь, автоматизируя процесс мониторинга и реагирования на инциденты. Собственно этим я бы и хотел поделиться в своей статье.»
Читать на Хабре
Профилирование Java-приложений: от HeapDump до Grafana
В этой статье разобраны HeapDump, ThreadDump, VisualVM, Grafana, HikariPool, Prometheus и Garbage Collector. Описаны потенциальные проблемные сценарии (use-case’ы) и шаги, которые необходимо предпринять для локализации и решения проблемы. Читать на Хабре.
В этой статье разобраны HeapDump, ThreadDump, VisualVM, Grafana, HikariPool, Prometheus и Garbage Collector. Описаны потенциальные проблемные сценарии (use-case’ы) и шаги, которые необходимо предпринять для локализации и решения проблемы. Читать на Хабре.
Logger C++
Этот проект представляет собой простую и гибкую библиотеку для логирования на C++. Библиотека поддерживает разные уровни логирования, форматирование сообщений и возможность записи логов в разные потоки. Статья на Хабре.
Репыч на Гитхабе
Этот проект представляет собой простую и гибкую библиотеку для логирования на C++. Библиотека поддерживает разные уровни логирования, форматирование сообщений и возможность записи логов в разные потоки. Статья на Хабре.
Репыч на Гитхабе
The Kafka Metric You’re Not Using: Stop Counting Messages, Start Measuring Time
Один из способов мониторинга групп консьюмеров — оповещение о разнице между максимальным смещением раздела топика (т. е. смещением последнего созданного сообщения) и максимальным смещением, закоммиченным группой консьюмеров для того же раздела топика. В этой статье разбирается мониторинг Kafka с точки зрения измерения временного лага. Читать статью.
❗️Статья на medium.com
Один из способов мониторинга групп консьюмеров — оповещение о разнице между максимальным смещением раздела топика (т. е. смещением последнего созданного сообщения) и максимальным смещением, закоммиченным группой консьюмеров для того же раздела топика. В этой статье разбирается мониторинг Kafka с точки зрения измерения временного лага. Читать статью.
❗️Статья на medium.com
k8spacket - a fully based on eBPF right now
Репыч на Гитхабе
Что такое k8spacket? Это инструмент для сбора информации о трафике TCP и метаданных TLS-подключений в кластере Kubernetes с использованием eBPF и визуализации в Grafana. Подробнее в статье.
❗️ Статья на medium.com
Репыч на Гитхабе
Что такое k8spacket? Это инструмент для сбора информации о трафике TCP и метаданных TLS-подключений в кластере Kubernetes с использованием eBPF и визуализации в Grafana. Подробнее в статье.
❗️ Статья на medium.com
Writing an Excellent Postmortem
Чтобы побудить инженеров делиться результатами постмортемов, должна быть культура безупречности . То есть, относиться к инциденту как к артефакту, а не как к отражению способностей инженера. Чтобы способствовать развитию этой культуры, компании должны включать управление инцидентами (включая постмортемы) в качестве части критериев оценки производительности. Самопроизвольные инциденты должны быть изучены и устранены; другие должны быть сокращены, а их усилия соответственно вознаграждены. В статье подробно разбираются подходы к идеальным постмортемам.
❗️ Статья на medium.com
Чтобы побудить инженеров делиться результатами постмортемов, должна быть культура безупречности . То есть, относиться к инциденту как к артефакту, а не как к отражению способностей инженера. Чтобы способствовать развитию этой культуры, компании должны включать управление инцидентами (включая постмортемы) в качестве части критериев оценки производительности. Самопроизвольные инциденты должны быть изучены и устранены; другие должны быть сокращены, а их усилия соответственно вознаграждены. В статье подробно разбираются подходы к идеальным постмортемам.
❗️ Статья на medium.com
25 сентября в Москве пройдёт одно из самых крупных мероприятий по облачным технологиям – Yandex Scale
На конференции выступят эксперты Yandex Cloud, а также приглашённые специалисты из Mindbox, Lamoda, Райффайзен банка и других компаний — всего более 50 спикеров.
Генеративные нейросети, речевые технологии, новинки сервисов инфраструктуры, решения по работе с данными и безопасности, AI‑инструменты и serverless‑подход — в каждом треке ожидаются технологические анонсы и разбор кейсов.
Мероприятие будет интересно как руководителям и менеджерам, так и разработчикам, тестировщикам, архитекторам, инженерам SIEM и другим ИТ-специалистам. Присоединиться можно офлайн и онлайн, очных участников ждёт afterparty.
Участие бесплатное, регистрация открыта.
На конференции выступят эксперты Yandex Cloud, а также приглашённые специалисты из Mindbox, Lamoda, Райффайзен банка и других компаний — всего более 50 спикеров.
Генеративные нейросети, речевые технологии, новинки сервисов инфраструктуры, решения по работе с данными и безопасности, AI‑инструменты и serverless‑подход — в каждом треке ожидаются технологические анонсы и разбор кейсов.
Мероприятие будет интересно как руководителям и менеджерам, так и разработчикам, тестировщикам, архитекторам, инженерам SIEM и другим ИТ-специалистам. Присоединиться можно офлайн и онлайн, очных участников ждёт afterparty.
Участие бесплатное, регистрация открыта.
How to set up Grafana Mimir using Ansible
В этой статье показано, как использовать роль mimir с коллекцией Grafana Ansible для развертывания и управления Mimir на нескольких хостах Linux и как исследовать данные в Grafana. Читать в блоге Grafana.
В этой статье показано, как использовать роль mimir с коллекцией Grafana Ansible для развертывания и управления Mimir на нескольких хостах Linux и как исследовать данные в Grafana. Читать в блоге Grafana.
Grafana 11.2 release: new updates for data sources, visualizations, transformations, and more
Обо всем множестве обновлений в блоге Grafana
Обо всем множестве обновлений в блоге Grafana
Мониторинг простыми словами, или как я объяснил маме работу SRE
Как ответить на вопрос правильно и не скатиться к простому «я ремонтирую компьютеры». Читать на Хабре.
Как ответить на вопрос правильно и не скатиться к простому «я ремонтирую компьютеры». Читать на Хабре.
Monitoring PostgreSQL using PostgreSQL Exporter on Kubernetes
Эта статья поможет настроить мониторинг PostgreSQL с помощью PostgreSQL Exporter в кластере Kubernetes. Читать статью.
❗️Статья на medium.com
Эта статья поможет настроить мониторинг PostgreSQL с помощью PostgreSQL Exporter в кластере Kubernetes. Читать статью.
❗️Статья на medium.com
Simplifying Log Shipping in Kubernetes with Promtail, Loki, and Grafana
Для оптимизации процесса управления и анализа логов кластера Kubernetes сочетание Promtail, Loki и Grafana является мощным решением для отправки, хранения и визуализации. Читать статью.
❗️Статья на medium.com
Для оптимизации процесса управления и анализа логов кластера Kubernetes сочетание Promtail, Loki и Grafana является мощным решением для отправки, хранения и визуализации. Читать статью.
❗️Статья на medium.com
Django App Monitoring with Prometheus and Grafana
В этой статье рассмотрено, как настроить мониторинг Django с помощью Prometheus и Grafana, двух мощных инструментов, которые обеспечивают глубокое понимание поведения приложения. Читать статью.
❗️Статья на medium.com
В этой статье рассмотрено, как настроить мониторинг Django с помощью Prometheus и Grafana, двух мощных инструментов, которые обеспечивают глубокое понимание поведения приложения. Читать статью.
❗️Статья на medium.com
Grafana Loki: performance optimization with Recording Rules, caching, and parallel queries
В целом, когда все работает, и все вроде бы хорошо, но иногда при получении данных за неделю или месяц в Grafana очень часто вылезают ошибки 502/504 или «too many outstanding requests».
В этой статье рассмотрено, как можно оптимизировать Loki для повышения производительности. Читать статью.
В целом, когда все работает, и все вроде бы хорошо, но иногда при получении данных за неделю или месяц в Grafana очень часто вылезают ошибки 502/504 или «too many outstanding requests».
В этой статье рассмотрено, как можно оптимизировать Loki для повышения производительности. Читать статью.
Better root cause analysis: Mastering alert insights with the new central history timeline
Чтобы обеспечить стабильность системы и предотвратить сбои, в Grafana 11.2 появился новый интерфейс для просмотра истории состояний всех оповещений в системе. Страница «История» показывает все переходы состояний для каждого правила оповещения, управляемого в Grafana. Читать в блоге Grafana.
Чтобы обеспечить стабильность системы и предотвратить сбои, в Grafana 11.2 появился новый интерфейс для просмотра истории состояний всех оповещений в системе. Страница «История» показывает все переходы состояний для каждого правила оповещения, управляемого в Grafana. Читать в блоге Grafana.
VictoriaLogs: an overview, run in Kubernetes, LogsQL, and Grafana
Слово автору статьи:
«VictoriaLogs — относительно новая система сбора и анализа журналов, похожая на Grafana Loki, но — как и VictoriaMetrics по сравнению с ванильным Prometheus — менее требовательная к ресурсам ЦП/памяти.
Лично я использую Grafana Loki около 5 лет, но иногда у меня возникают опасения по поводу нее — как в плане документации, так и общей сложности системы, поскольку в ней много компонентов. Также есть вопросы по поводу производительности, поскольку как бы я ее ни настраивал (см. Grafana Loki: оптимизация производительности с помощью правил записи, кэширования и параллельных запросов ), но все равно иногда на относительно небольших запросах Grafana возвращает ошибки 504 от Loki Gateway, и я, честно говоря, устал с этим бороться.»
Все подробности в статье
❗️Статья на medium.com
Слово автору статьи:
«VictoriaLogs — относительно новая система сбора и анализа журналов, похожая на Grafana Loki, но — как и VictoriaMetrics по сравнению с ванильным Prometheus — менее требовательная к ресурсам ЦП/памяти.
Лично я использую Grafana Loki около 5 лет, но иногда у меня возникают опасения по поводу нее — как в плане документации, так и общей сложности системы, поскольку в ней много компонентов. Также есть вопросы по поводу производительности, поскольку как бы я ее ни настраивал (см. Grafana Loki: оптимизация производительности с помощью правил записи, кэширования и параллельных запросов ), но все равно иногда на относительно небольших запросах Grafana возвращает ошибки 504 от Loki Gateway, и я, честно говоря, устал с этим бороться.»
Все подробности в статье
❗️Статья на medium.com
System Monitoring and Performance Tuning in Linux -DevOps Prerequisite 5
Мониторинг системы и настройка производительности являются важными задачами для обеспечения эффективной и производительной работы Linux. В этой статье рассмотрен ряд инструментов и методов для мониторинга производительности системы и настройки различных аспектов системы Linux. Читать статью.
❗️Статья на medium.com
Мониторинг системы и настройка производительности являются важными задачами для обеспечения эффективной и производительной работы Linux. В этой статье рассмотрен ряд инструментов и методов для мониторинга производительности системы и настройки различных аспектов системы Linux. Читать статью.
❗️Статья на medium.com