Visualizing Kubernetes Audit Logs with Grafana: A Comprehensive Security Guide
В статье разобрано, как включить журналы аудита в кластере Kubernetes и настроить мониторинг с помощью Grafana, Loki и Promtail. Читать статью.
❗️Статья на Медиум. Возможно, нужен VPN.
В статье разобрано, как включить журналы аудита в кластере Kubernetes и настроить мониторинг с помощью Grafana, Loki и Promtail. Читать статью.
❗️Статья на Медиум. Возможно, нужен VPN.
Fosdem 2024
3 и 4 февраля 2024 года в Брюсселе прошла конференция Fosdem. Посмотрите выступления в секции Monitoring & Observability, возможно, найдете интересные.
Мне зашла презентация открытой системы мониторинга netdata. Выглядит интересно. Можно посмотреть репыч на Гитхабе.
3 и 4 февраля 2024 года в Брюсселе прошла конференция Fosdem. Посмотрите выступления в секции Monitoring & Observability, возможно, найдете интересные.
Мне зашла презентация открытой системы мониторинга netdata. Выглядит интересно. Можно посмотреть репыч на Гитхабе.
OpenTelemetry best practices: A user's guide to getting started with OpenTelemetry
В этой статье представлена подборка лучших практик OpenTelemetry, основанная на часто задаваемых вопросах, частых темах обсуждений и опыте Grafana. Читать статью в блоге Grafana.
В этой статье представлена подборка лучших практик OpenTelemetry, основанная на часто задаваемых вопросах, частых темах обсуждений и опыте Grafana. Читать статью в блоге Grafana.
Prometheus Vs Victoria Metrics Load Testing
В статье разобраны следующие сценарии:
Baseline load test
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 5000
Current production scale load test
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 5000
Future projection load test
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 5000
❗️Статья на Медиум. Возможно, нужен VPN.
В статье разобраны следующие сценарии:
Baseline load test
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 5000
Current production scale load test
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 5000
Future projection load test
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 5000
❗️Статья на Медиум. Возможно, нужен VPN.
Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for Scalability and Speed
В этой короткой статье рассказывается о преимуществах перехода с Prometheus на VictoriaMetrics. Наверное, вы и так знаете, но не лишним будет взглянуть, так сказать, с helicopter view.
Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for optimised CPU and Memory usage
А это вторая часть — преимущества VictoriaMetrics перед Prometheus с точки зрения потребления CPU и памяти. С графиками и сравнениями.
Prometheus Vs Victoria Metrics Load Testing
Это третья часть. Ссылка на нее парой постов выше.
В этой короткой статье рассказывается о преимуществах перехода с Prometheus на VictoriaMetrics. Наверное, вы и так знаете, но не лишним будет взглянуть, так сказать, с helicopter view.
Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for optimised CPU and Memory usage
А это вторая часть — преимущества VictoriaMetrics перед Prometheus с точки зрения потребления CPU и памяти. С графиками и сравнениями.
Prometheus Vs Victoria Metrics Load Testing
Это третья часть. Ссылка на нее парой постов выше.
How to build a centralized logging solution with Grafana Loki
В этом посте разобрана архитектура централизованной системы логирования и показано, как настроить сервер логирования (Grafana Loki), а также как настроить приложения для отправки логов в него. Читать статью.
❗️Статья на Медиум. Возможно, нужен VPN.
В этом посте разобрана архитектура централизованной системы логирования и показано, как настроить сервер логирования (Grafana Loki), а также как настроить приложения для отправки логов в него. Читать статью.
❗️Статья на Медиум. Возможно, нужен VPN.
Один из методов мониторинга и анализа ошибок СУБД
Очень неприятная ситуация для DBA: «что-то происходит с СУБД, но что именно — нет информации». Первый и иногда достаточный способ избежать неопределенности — всегда иметь полную информацию о нештатных ситуациях в работе СУБД на текущий период и в истории. Для решения этой в общем то стандартной задачи и нужно мониторить и анализировать лог СУБД. PostgreSQL в данном случае не исключение.
К рассмотрению предлагается один из способов мониторинга ошибок СУБД PostgreSQL и получением итоговой информации, используя Zabbix. Данная статья не tutorial и не roadmap, скорее как эскиз для обмена мнениями с коллегами. Читать статью.
Очень неприятная ситуация для DBA: «что-то происходит с СУБД, но что именно — нет информации». Первый и иногда достаточный способ избежать неопределенности — всегда иметь полную информацию о нештатных ситуациях в работе СУБД на текущий период и в истории. Для решения этой в общем то стандартной задачи и нужно мониторить и анализировать лог СУБД. PostgreSQL в данном случае не исключение.
К рассмотрению предлагается один из способов мониторинга ошибок СУБД PostgreSQL и получением итоговой информации, используя Zabbix. Данная статья не tutorial и не roadmap, скорее как эскиз для обмена мнениями с коллегами. Читать статью.
Best practices to prevent alert fatigue
В этом посте обсуждается методология непрерывного улучшения и реализация процесса, который поможет анализировать оповещения.
Описаны следующие шаги:
⚡️Выявление шумовых оповещений, которые вызывают утомление;
⚡️Превентивные меры, чтобы свести к минимуму возможность утомления в будущем.
⚡️Уменьшение усталости от оповещений с помощью Datadog (неудивительно, ведь статья вышла в блоге Datadog)
В этом посте обсуждается методология непрерывного улучшения и реализация процесса, который поможет анализировать оповещения.
Описаны следующие шаги:
⚡️Выявление шумовых оповещений, которые вызывают утомление;
⚡️Превентивные меры, чтобы свести к минимуму возможность утомления в будущем.
⚡️Уменьшение усталости от оповещений с помощью Datadog (неудивительно, ведь статья вышла в блоге Datadog)
How to reduce expenses on monitoring: Swapping in VictoriaMetrics for Prometheus
Из этой статьи вы узнаете, как эффективно хранить и обрабатывать метрики мониторинга для сокращения накладных расходов, а также о том, как VictoriaMetrics может в этом помочь. Читать статью.
Из этой статьи вы узнаете, как эффективно хранить и обрабатывать метрики мониторинга для сокращения накладных расходов, а также о том, как VictoriaMetrics может в этом помочь. Читать статью.
Запуск официальных тренингов по Zabbix на русском языке от Галс Софтвэр
Мы запустили официальные тренинги Zabbix с возможностью получения сертификатов вендора. Все тренинги и сертификации будут проводиться на русском языке. Анонсы ближайших тренингов и полезную информацию по Zabbix также публикуем в нашем канале @zabbix_ru, посвященный Zabbix и ничему кроме Zabbix.
Предлагаем ознакомиться с расписанием ближайших публичных тренингов:
Zabbix Certified Specialist (ZCS) 11-15 марта 2024 года (оффлайн + онлайн)
Zabbix Certified Professional (ZCP) 8-10 апреля 2024 года (оффлайн + онлайн)
Также возможно проведение закрытых тренингов по запросу.
Задать вопросы и получить дополнительную информацию вы можете у @galssoftware, по запросу на [email protected] или на сайте galssoftware.com.
Мы запустили официальные тренинги Zabbix с возможностью получения сертификатов вендора. Все тренинги и сертификации будут проводиться на русском языке. Анонсы ближайших тренингов и полезную информацию по Zabbix также публикуем в нашем канале @zabbix_ru, посвященный Zabbix и ничему кроме Zabbix.
Предлагаем ознакомиться с расписанием ближайших публичных тренингов:
Zabbix Certified Specialist (ZCS) 11-15 марта 2024 года (оффлайн + онлайн)
Zabbix Certified Professional (ZCP) 8-10 апреля 2024 года (оффлайн + онлайн)
Также возможно проведение закрытых тренингов по запросу.
Задать вопросы и получить дополнительную информацию вы можете у @galssoftware, по запросу на [email protected] или на сайте galssoftware.com.
Мониторинг температуры Windows. Создание метрик, настройка InfluxDB и Grafana
В этой статье автор показывает полный путь от получения таких метрик до конечной визуализации на примере сбора информации датчиков температуры Windows в минимально возможной конфигурации. Читать статью.
У автора есть репозиторий на GitHub с различными PowerShell-командами.
В этой статье автор показывает полный путь от получения таких метрик до конечной визуализации на примере сбора информации датчиков температуры Windows в минимально возможной конфигурации. Читать статью.
У автора есть репозиторий на GitHub с различными PowerShell-командами.
SRE Interview Prep Plan
В этом цикле статей 6-недельный план, который составлен, чтобы пройти через весь процесс подготовки к собеседованию на позицию SRE. На каждой неделе уделено внимание развитию знаний в ключевых областях, которые должны знать SRE, таких как автоматизация, мониторинг, реагирование на инциденты и т. д.
В статьях собраны ссылки на материалы для подготовки. Полезный свод знаний для подготовки к интервью. В одном из прошлых постов ссылка на статьи по первым 4 неделям, а в этом вы найдете ссылку на статью по 5 неделе.
Неделя 5
Day 1: Introduction to Scalability
Day 2: Performance Metrics and Tools
Day 3: Architectural Patterns for Scalability
Day 4: Optimizing Application Performance
Day 5: Infrastructure Optimization
Days 6-7: System Design
В этом цикле статей 6-недельный план, который составлен, чтобы пройти через весь процесс подготовки к собеседованию на позицию SRE. На каждой неделе уделено внимание развитию знаний в ключевых областях, которые должны знать SRE, таких как автоматизация, мониторинг, реагирование на инциденты и т. д.
В статьях собраны ссылки на материалы для подготовки. Полезный свод знаний для подготовки к интервью. В одном из прошлых постов ссылка на статьи по первым 4 неделям, а в этом вы найдете ссылку на статью по 5 неделе.
Неделя 5
Day 1: Introduction to Scalability
Day 2: Performance Metrics and Tools
Day 3: Architectural Patterns for Scalability
Day 4: Optimizing Application Performance
Day 5: Infrastructure Optimization
Days 6-7: System Design
За свои собственные деньги я вписался в курс Observability от Отуса. Решил расширить свои знания в области мониторинга на чуть менее известные для меня TICK Stack, Grafana Loki, Tempo, Jaeger, Prometheus, Thanos и другие модные словечки.
Если вы проходили этот курс, напишите, что о нем думаете в комментах. Я планирую периодически писать посты в канале о своих ощущениях от курса, о преподавателях и, самое главное, о пользе. Вообще, мне интересно узнать как устроены процессы мониторинга в других компаниях, узнать подходы, которые они там используют.
Ссылки не публикую, поиском легко найти этот курс.
Если вы проходили этот курс, напишите, что о нем думаете в комментах. Я планирую периодически писать посты в канале о своих ощущениях от курса, о преподавателях и, самое главное, о пользе. Вообще, мне интересно узнать как устроены процессы мониторинга в других компаниях, узнать подходы, которые они там используют.
Ссылки не публикую, поиском легко найти этот курс.
How to Create and Work with Variables | Grafana
Из этого видео с ютуб-канала Grafana вы узнаете:
⚡️Что такое переменные дашбордов
⚡️ Какие типы переменных существуют
⚡️ Как создавать переменные
⚡️ Пример создания переменной
Из этого видео с ютуб-канала Grafana вы узнаете:
⚡️Что такое переменные дашбордов
⚡️ Какие типы переменных существуют
⚡️ Как создавать переменные
⚡️ Пример создания переменной
YouTube
How to Create and Work with Variables | Grafana
Links:
Variables
https://grafana.com/docs/grafana/latest/dashboards/variables/
List of Global Variables
https://grafana.com/docs/grafana/latest/dashboards/variables/add-template-variables/#global-variables
Sign up for Grafana cloud for free: https://graf…
Variables
https://grafana.com/docs/grafana/latest/dashboards/variables/
List of Global Variables
https://grafana.com/docs/grafana/latest/dashboards/variables/add-template-variables/#global-variables
Sign up for Grafana cloud for free: https://graf…
Key metrics for monitoring etcd
Статья из блога Datadog и посвящена мониторингу etcd в Kubernetes. В ней показаны ключевые показатели, которые следует отслеживать, чтобы убедиться, что etcd обеспечивает работоспособность и производительность кластера Kubernetes. Читать статью.
Статья из блога Datadog и посвящена мониторингу etcd в Kubernetes. В ней показаны ключевые показатели, которые следует отслеживать, чтобы убедиться, что etcd обеспечивает работоспособность и производительность кластера Kubernetes. Читать статью.
Ещё одно интересное выступление с Fosdem 2024 — Linux load average and other silly metrics. Здесь запускают нагрузку на сервере и интересно интерпретируют показатели утилиты top. Смотреть видео.
The engineering on-call experience: misconceptions, lessons learned, and how to prepare
В этой статье старшие инженеры-программисты Grafana делятся своими самыми большими заблуждениями о дежурстве, некоторыми советами и приемами, которые они узнали на этом пути, а также тем, почему этот опыт может быть полезным и веселым. Читать статью.
В этой статье старшие инженеры-программисты Grafana делятся своими самыми большими заблуждениями о дежурстве, некоторыми советами и приемами, которые они узнали на этом пути, а также тем, почему этот опыт может быть полезным и веселым. Читать статью.
How to Display Grafana Alerts to Your Dashboards | Grafana
В этом видео рассказывывают о подходах к визуализации алертов на дашбордах в Grafana.
В этом видео рассказывывают о подходах к визуализации алертов на дашбордах в Grafana.
Настраиваем логирование с помощью Loki и Grafana
При построении микросервисной архитектуры часто возникает потребность анализировать логи из нескольких источников (баз, сервисов и т. д.). В этой статье автор делится решением к которому в итоге пришел. Читать статью.
При построении микросервисной архитектуры часто возникает потребность анализировать логи из нескольких источников (баз, сервисов и т. д.). В этой статье автор делится решением к которому в итоге пришел. Читать статью.