Telegram Web Link
Proactive PostgreSQL Database Performance Scanner

Эта статья посвящена мониторингу баз данных PostgreSQL. Здесь описывается подход, который позволяет легко идентифицировать запросы, которые неэффективно используют систему, помогает найти причину проблем с производительностью и помогает понять типичные шаблоны нагрузки и узкие места производительности.

Proactive PostgreSQL Database(s) Performance Scanner — это скрипт, который подключается к базе данных и запускает набор проверок, которые можно расширить при желании. Все проверки — это запросы к базе данных, объединенные по структуре. Посмотреть что за скрипт и как его использовать.

❗️Статья на medium.com
Detecting Specific Incidents Within Your Kubernetes Cluster Using eBPF

eBPF — это технология, которая позволяет запускать пользовательский низкоуровневый код в ядре Linux без необходимости изменять само ядро. Она обеспечивает возможность отслеживания и фильтрации событий в различных точках ядра, что делает ее ценным инструментом для мониторинга и защиты инфраструктуры Kubernetes. В этой статье рассмотрено, как использовать eBPF для обнаружения определенных инцидентов в кластере Kubernetes.

❗️Статья на medium.com
Simplify Kubernetes Monitoring: Kube-prometheus-stack Made Easy with Glasskube

Kube-Prometheus-Stack имеет на борту набор манифестов Kubernetes, дашбордов Grafana и правил Prometheus, предоставляя простое в эксплуатации решение для мониторинга кластера Kubernetes с Prometheus. Звучит как хорошая новость, и это так, но стек упакован в Helm-чарт и только values.yaml содержит более 4000 строк. Настройка и поддержка такого Helm-чарта такое себе занятие.

Glasskube — инструмент для упрощения работы и настроек в Kube-Prometheus-Stack. Да, он теперь поддерживает Kube-Prometheus-Stack. В этой статье рассмотрены шаги по настройке и установке Kube-Prometheus-Stack совместно с Glasskube.

Репыч Glasskube на Github

❗️Статья на medium.com
ChatOps на практике: создание бота для мониторинга логов

«Недавно на работе меня попросили придумать рабочую задачку для студентов. Поскольку я работаю в инфраструктурной команде, мои повседневные задачи вряд ли подходят для их домашек или курсовых работ. Чтобы найти подходящую идею, я начал перебирать инструменты, которыми мы с командой часто пользуемся. Большинство из них интегрированы с чатами и ботами, и один из ключевых инструментов — это Алерт Бот. Он отслеживает логи и отправляет оповещения, если происходит что-то необычное. Это позволяет нам быстрее обнаруживать и устранять инциденты.

Когда я придумал эту задачу для студентов, мне пришло в голову, что подобный функционал может быть полезен многим. Возможно, кто-то сможет адаптировать это решение под свои нужды и облегчить себе жизнь, автоматизируя процесс мониторинга и реагирования на инциденты. Собственно этим я бы и хотел поделиться в своей статье.»

Читать на Хабре
Профилирование Java-приложений: от HeapDump до Grafana

В этой статье разобраны HeapDump, ThreadDump, VisualVM, Grafana, HikariPool, Prometheus и Garbage Collector. Описаны потенциальные проблемные сценарии (use-case’ы) и шаги, которые необходимо предпринять для локализации и решения проблемы. Читать на Хабре.
Logger C++

Этот проект представляет собой простую и гибкую библиотеку для логирования на C++. Библиотека поддерживает разные уровни логирования, форматирование сообщений и возможность записи логов в разные потоки. Статья на Хабре.

Репыч на Гитхабе
The Kafka Metric You’re Not Using: Stop Counting Messages, Start Measuring Time

Один из способов мониторинга групп консьюмеров — оповещение о разнице между максимальным смещением раздела топика (т. е. смещением последнего созданного сообщения) и максимальным смещением, закоммиченным группой консьюмеров для того же раздела топика. В этой статье разбирается мониторинг Kafka с точки зрения измерения временного лага. Читать статью.

❗️Статья на medium.com
k8spacket - a fully based on eBPF right now

Репыч на Гитхабе

Что такое k8spacket? Это инструмент для сбора информации о трафике TCP и метаданных TLS-подключений в кластере Kubernetes с использованием eBPF и визуализации в Grafana. Подробнее в статье.

❗️ Статья на medium.com
Writing an Excellent Postmortem

Чтобы побудить инженеров делиться результатами постмортемов, должна быть культура безупречности . То есть, относиться к инциденту как к артефакту, а не как к отражению способностей инженера. Чтобы способствовать развитию этой культуры, компании должны включать управление инцидентами (включая постмортемы) в качестве части критериев оценки производительности. Самопроизвольные инциденты должны быть изучены и устранены; другие должны быть сокращены, а их усилия соответственно вознаграждены. В статье подробно разбираются подходы к идеальным постмортемам.

❗️ Статья на medium.com
25 сентября в Москве пройдёт одно из самых крупных мероприятий по облачным технологиям – Yandex Scale

На конференции выступят эксперты Yandex Cloud, а также приглашённые специалисты из Mindbox, Lamoda, Райффайзен банка и других компаний — всего более 50 спикеров.

Генеративные нейросети, речевые технологии, новинки сервисов инфраструктуры, решения по работе с данными и безопасности, AI‑инструменты и serverless‑подход — в каждом треке ожидаются технологические анонсы и разбор кейсов.

Мероприятие будет интересно как руководителям и менеджерам, так и разработчикам, тестировщикам, архитекторам, инженерам SIEM и другим ИТ-специалистам. Присоединиться можно офлайн и онлайн, очных участников ждёт afterparty.

Участие бесплатное,
регистрация открыта.
How to set up Grafana Mimir using Ansible

В этой статье показано, как использовать роль mimir с коллекцией Grafana Ansible для развертывания и управления Mimir на нескольких хостах Linux и как исследовать данные в Grafana. Читать в блоге Grafana.
Grafana 11.2 release: new updates for data sources, visualizations, transformations, and more

Обо всем множестве обновлений в блоге Grafana
Мониторинг простыми словами, или как я объяснил маме работу SRE

Как ответить на вопрос правильно и не скатиться к простому «я ремонтирую компьютеры». Читать на Хабре.
Monitoring PostgreSQL using PostgreSQL Exporter on Kubernetes

Эта статья поможет настроить мониторинг PostgreSQL с помощью PostgreSQL Exporter в кластере Kubernetes. Читать статью.

❗️Статья на medium.com
Simplifying Log Shipping in Kubernetes with Promtail, Loki, and Grafana

Для оптимизации процесса управления и анализа логов кластера Kubernetes сочетание Promtail, Loki и Grafana является мощным решением для отправки, хранения и визуализации. Читать статью.

❗️Статья на medium.com
Django App Monitoring with Prometheus and Grafana

В этой статье рассмотрено, как настроить мониторинг Django с помощью Prometheus и Grafana, двух мощных инструментов, которые обеспечивают глубокое понимание поведения приложения. Читать статью.

❗️Статья на medium.com
Grafana Loki: performance optimization with Recording Rules, caching, and parallel queries

В целом, когда все работает, и все вроде бы хорошо, но иногда при получении данных за неделю или месяц в Grafana очень часто вылезают ошибки 502/504 или «too many outstanding requests».

В этой статье рассмотрено, как можно оптимизировать Loki для повышения производительности. Читать статью.
Better root cause analysis: Mastering alert insights with the new central history timeline

Чтобы обеспечить стабильность системы и предотвратить сбои, в Grafana 11.2 появился новый интерфейс для просмотра истории состояний всех оповещений в системе. Страница «История» показывает все переходы состояний для каждого правила оповещения, управляемого в Grafana. Читать в блоге Grafana.
VictoriaLogs: an overview, run in Kubernetes, LogsQL, and Grafana

Слово автору статьи:

«VictoriaLogs — относительно новая система сбора и анализа журналов, похожая на Grafana Loki, но — как и VictoriaMetrics по сравнению с ванильным Prometheus — менее требовательная к ресурсам ЦП/памяти.

Лично я использую Grafana Loki около 5 лет, но иногда у меня возникают опасения по поводу нее — как в плане документации, так и общей сложности системы, поскольку в ней много компонентов. Также есть вопросы по поводу производительности, поскольку как бы я ее ни настраивал (см. Grafana Loki: оптимизация производительности с помощью правил записи, кэширования и параллельных запросов ), но все равно иногда на относительно небольших запросах Grafana возвращает ошибки 504 от Loki Gateway, и я, честно говоря, устал с этим бороться.»

Все подробности в статье

❗️Статья на medium.com
System Monitoring and Performance Tuning in Linux -DevOps Prerequisite 5

Мониторинг системы и настройка производительности являются важными задачами для обеспечения эффективной и производительной работы Linux. В этой статье рассмотрен ряд инструментов и методов для мониторинга производительности системы и настройки различных аспектов системы Linux. Читать статью.

❗️Статья на medium.com
2025/07/05 10:20:24
Back to Top
HTML Embed Code: