Telegram Web Link
Visualizing Kubernetes Audit Logs with Grafana: A Comprehensive Security Guide

В статье разобрано, как включить журналы аудита в кластере Kubernetes и настроить мониторинг с помощью Grafana, Loki и Promtail. Читать статью.

❗️Статья на Медиум. Возможно, нужен VPN.
Fosdem 2024

3 и 4 февраля 2024 года в Брюсселе прошла конференция Fosdem. Посмотрите выступления в секции Monitoring & Observability, возможно, найдете интересные.

Мне зашла презентация открытой системы мониторинга netdata. Выглядит интересно. Можно посмотреть репыч на Гитхабе.
OpenTelemetry best practices: A user's guide to getting started with OpenTelemetry

В этой статье представлена подборка лучших практик OpenTelemetry, основанная на часто задаваемых вопросах, частых темах обсуждений и опыте Grafana. Читать статью в блоге Grafana.
Prometheus Vs Victoria Metrics Load Testing

В статье разобраны следующие сценарии:

Baseline load test
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 5000

Current production scale load test
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 5000

Future projection load test
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 5000

❗️Статья на Медиум. Возможно, нужен VPN.
Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for Scalability and Speed

В этой короткой статье рассказывается о преимуществах перехода с Prometheus на VictoriaMetrics. Наверное, вы и так знаете, но не лишним будет взглянуть, так сказать, с helicopter view.

Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for optimised CPU and Memory usage

А это вторая часть — преимущества VictoriaMetrics перед Prometheus с точки зрения потребления CPU и памяти. С графиками и сравнениями.

Prometheus Vs Victoria Metrics Load Testing

Это третья часть. Ссылка на нее парой постов выше.
How to build a centralized logging solution with Grafana Loki

В этом посте разобрана архитектура централизованной системы логирования и показано, как настроить сервер логирования (Grafana Loki), а также как настроить приложения для отправки логов в него. Читать статью.

❗️Статья на Медиум. Возможно, нужен VPN.
Один из методов мониторинга и анализа ошибок СУБД

Очень неприятная ситуация для DBA: «что-то происходит с СУБД, но что именно — нет информации». Первый и иногда достаточный способ избежать неопределенности — всегда иметь полную информацию о нештатных ситуациях в работе СУБД на текущий период и в истории. Для решения этой в общем то стандартной задачи и нужно мониторить и анализировать лог СУБД. PostgreSQL в данном случае не исключение.

К рассмотрению предлагается один из способов мониторинга ошибок СУБД PostgreSQL и получением итоговой информации, используя Zabbix. Данная статья не tutorial и не roadmap, скорее как эскиз для обмена мнениями с коллегами. Читать статью.
Best practices to prevent alert fatigue

В этом посте обсуждается методология непрерывного улучшения и реализация процесса, который поможет анализировать оповещения.

Описаны следующие шаги:
⚡️Выявление шумовых оповещений, которые вызывают утомление;
⚡️Превентивные меры, чтобы свести к минимуму возможность утомления в будущем.
⚡️Уменьшение усталости от оповещений с помощью Datadog (неудивительно, ведь статья вышла в блоге Datadog)
How to reduce expenses on monitoring: Swapping in VictoriaMetrics for Prometheus

Из этой статьи вы узнаете, как эффективно хранить и обрабатывать метрики мониторинга для сокращения накладных расходов, а также о том, как VictoriaMetrics может в этом помочь. Читать статью.
Запуск официальных тренингов по Zabbix на русском языке от Галс Софтвэр

Мы запустили официальные тренинги Zabbix с возможностью получения сертификатов вендора. Все тренинги и сертификации будут проводиться на русском языке. Анонсы ближайших тренингов и полезную информацию по Zabbix также публикуем в нашем канале @zabbix_ru, посвященный Zabbix и ничему кроме Zabbix.

Предлагаем ознакомиться с расписанием ближайших публичных тренингов:

Zabbix Certified Specialist (ZCS) 11-15 марта 2024 года (оффлайн + онлайн)

Zabbix Certified Professional (ZCP) 8-10 апреля 2024 года (оффлайн + онлайн)

Также возможно проведение закрытых тренингов по запросу.

Задать вопросы и получить дополнительную информацию вы можете у @galssoftware, по запросу на [email protected] или на сайте galssoftware.com.
Мониторинг температуры Windows. Создание метрик, настройка InfluxDB и Grafana

В этой статье автор показывает полный путь от получения таких метрик до конечной визуализации на примере сбора информации датчиков температуры Windows в минимально возможной конфигурации. Читать статью.

У автора есть репозиторий на GitHub с различными PowerShell-командами.
SRE Interview Prep Plan

В этом цикле статей 6-недельный план, который составлен, чтобы пройти через весь процесс подготовки к собеседованию на позицию SRE. На каждой неделе уделено внимание развитию знаний в ключевых областях, которые должны знать SRE, таких как автоматизация, мониторинг, реагирование на инциденты и т. д.

В статьях собраны ссылки на материалы для подготовки. Полезный свод знаний для подготовки к интервью. В одном из прошлых постов ссылка на статьи по первым 4 неделям, а в этом вы найдете ссылку на статью по 5 неделе.

Неделя 5
Day 1: Introduction to Scalability
Day 2: Performance Metrics and Tools
Day 3: Architectural Patterns for Scalability
Day 4: Optimizing Application Performance
Day 5: Infrastructure Optimization
Days 6-7: System Design
За свои собственные деньги я вписался в курс Observability от Отуса. Решил расширить свои знания в области мониторинга на чуть менее известные для меня TICK Stack, Grafana Loki, Tempo, Jaeger, Prometheus, Thanos и другие модные словечки.

Если вы проходили этот курс, напишите, что о нем думаете в комментах. Я планирую периодически писать посты в канале о своих ощущениях от курса, о преподавателях и, самое главное, о пользе. Вообще, мне интересно узнать как устроены процессы мониторинга в других компаниях, узнать подходы, которые они там используют.

Ссылки не публикую, поиском легко найти этот курс.
How to Create and Work with Variables | Grafana

Из этого видео с ютуб-канала Grafana вы узнаете:
⚡️Что такое переменные дашбордов
⚡️ Какие типы переменных существуют
⚡️ Как создавать переменные
⚡️ Пример создания переменной
Key metrics for monitoring etcd

Статья из блога Datadog и посвящена мониторингу etcd в Kubernetes. В ней показаны ключевые показатели, которые следует отслеживать, чтобы убедиться, что etcd обеспечивает работоспособность и производительность кластера Kubernetes. Читать статью.
Ещё одно интересное выступление с Fosdem 2024 — Linux load average and other silly metrics. Здесь запускают нагрузку на сервере и интересно интерпретируют показатели утилиты top. Смотреть видео.
The engineering on-call experience: misconceptions, lessons learned, and how to prepare

В этой статье старшие инженеры-программисты Grafana делятся своими самыми большими заблуждениями о дежурстве, некоторыми советами и приемами, которые они узнали на этом пути, а также тем, почему этот опыт может быть полезным и веселым. Читать статью.
How to Display Grafana Alerts to Your Dashboards | Grafana

В этом видео рассказывывают о подходах к визуализации алертов на дашбордах в Grafana.
Настраиваем логирование с помощью Loki и Grafana

При построении микросервисной архитектуры часто возникает потребность анализировать логи из нескольких источников (баз, сервисов и т. д.). В этой статье автор делится решением к которому в итоге пришел. Читать статью.
Google Maps Integration With Zabbix Geomap Widget

На этом видео Дмитрий Ламберт, руководитель команды техподдержки Zabbix рассказывает об интеграции Google Maps с геовиджетом в Zabbix. Смотреть.
2025/07/07 09:16:30
Back to Top
HTML Embed Code: