Мониторим ИТ 1488

Мониторим ИТ

Visualizing Kubernetes Audit Logs with Grafana: A Comprehensive Security Guide

В статье разобрано, как включить журналы аудита в кластере Kubernetes и настроить мониторинг с помощью Grafana, Loki и Promtail. Читать статью.

❗️Статья на Медиум. Возможно, нужен VPN.

3.6K views10:26

Мониторим ИТ

Fosdem 2024

3 и 4 февраля 2024 года в Брюсселе прошла конференция Fosdem. Посмотрите выступления в секции Monitoring & Observability, возможно, найдете интересные.

Мне зашла презентация открытой системы мониторинга netdata. Выглядит интересно. Можно посмотреть репыч на Гитхабе.

3.5K views14:59

Мониторим ИТ

OpenTelemetry best practices: A user's guide to getting started with OpenTelemetry

В этой статье представлена подборка лучших практик OpenTelemetry, основанная на часто задаваемых вопросах, частых темах обсуждений и опыте Grafana. Читать статью в блоге Grafana.

3.7K views13:00

Мониторим ИТ

Prometheus Vs Victoria Metrics Load Testing

В статье разобраны следующие сценарии:

Baseline load test
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 5 Million, Ingestion Rate: 180k, Target: 5000

Current production scale load test
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 10 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 10 Million, Ingestion Rate: 250k, Target: 5000

Future projection load test
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 1000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 2000
Active Time Series : 15 Million, Ingestion Rate: 180k, Target: 5000
Active Time Series : 15 Million, Ingestion Rate: 250k, Target: 5000

❗️Статья на Медиум. Возможно, нужен VPN.

3.5K views08:00

Мониторим ИТ

Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for Scalability and Speed

В этой короткой статье рассказывается о преимуществах перехода с Prometheus на VictoriaMetrics. Наверное, вы и так знаете, но не лишним будет взглянуть, так сказать, с helicopter view.

Supercharge your Monitoring: Migrate from Prometheus to VictoriaMetrics for optimised CPU and Memory usage

А это вторая часть — преимущества VictoriaMetrics перед Prometheus с точки зрения потребления CPU и памяти. С графиками и сравнениями.

Prometheus Vs Victoria Metrics Load Testing

Это третья часть. Ссылка на нее парой постов выше.

4.0K views14:00

Мониторим ИТ

How to build a centralized logging solution with Grafana Loki

В этом посте разобрана архитектура централизованной системы логирования и показано, как настроить сервер логирования (Grafana Loki), а также как настроить приложения для отправки логов в него. Читать статью.

❗️Статья на Медиум. Возможно, нужен VPN.

3.7K viewsedited 13:00

Мониторим ИТ

Один из методов мониторинга и анализа ошибок СУБД

Очень неприятная ситуация для DBA: «что-то происходит с СУБД, но что именно — нет информации». Первый и иногда достаточный способ избежать неопределенности — всегда иметь полную информацию о нештатных ситуациях в работе СУБД на текущий период и в истории. Для решения этой в общем то стандартной задачи и нужно мониторить и анализировать лог СУБД. PostgreSQL в данном случае не исключение.

К рассмотрению предлагается один из способов мониторинга ошибок СУБД PostgreSQL и получением итоговой информации, используя Zabbix. Данная статья не tutorial и не roadmap, скорее как эскиз для обмена мнениями с коллегами. Читать статью.

3.9K views06:30

Мониторим ИТ

Best practices to prevent alert fatigue

В этом посте обсуждается методология непрерывного улучшения и реализация процесса, который поможет анализировать оповещения.

Описаны следующие шаги:
⚡️Выявление шумовых оповещений, которые вызывают утомление;
⚡️Превентивные меры, чтобы свести к минимуму возможность утомления в будущем.
⚡️Уменьшение усталости от оповещений с помощью Datadog (неудивительно, ведь статья вышла в блоге Datadog)

5.3K views13:00

Мониторим ИТ

How to reduce expenses on monitoring: Swapping in VictoriaMetrics for Prometheus

Из этой статьи вы узнаете, как эффективно хранить и обрабатывать метрики мониторинга для сокращения накладных расходов, а также о том, как VictoriaMetrics может в этом помочь. Читать статью.

5.2K views08:58

Мониторим ИТ

Запуск официальных тренингов по Zabbix на русском языке от Галс Софтвэр

Мы запустили официальные тренинги Zabbix с возможностью получения сертификатов вендора. Все тренинги и сертификации будут проводиться на русском языке. Анонсы ближайших тренингов и полезную информацию по Zabbix также публикуем в нашем канале @zabbix_ru, посвященный Zabbix и ничему кроме Zabbix.

Предлагаем ознакомиться с расписанием ближайших публичных тренингов:

Zabbix Certified Specialist (ZCS) 11-15 марта 2024 года (оффлайн + онлайн)

Zabbix Certified Professional (ZCP) 8-10 апреля 2024 года (оффлайн + онлайн)

Также возможно проведение закрытых тренингов по запросу.

Задать вопросы и получить дополнительную информацию вы можете у @galssoftware, по запросу на [email protected] или на сайте galssoftware.com.

4.2K views10:05

Канал Zabbix Recipes

Мониторим ИТ

Мониторинг температуры Windows. Создание метрик, настройка InfluxDB и Grafana

В этой статье автор показывает полный путь от получения таких метрик до конечной визуализации на примере сбора информации датчиков температуры Windows в минимально возможной конфигурации. Читать статью.

У автора есть репозиторий на GitHub с различными PowerShell-командами.

4.3K views06:30

Мониторим ИТ

SRE Interview Prep Plan

В этом цикле статей 6-недельный план, который составлен, чтобы пройти через весь процесс подготовки к собеседованию на позицию SRE. На каждой неделе уделено внимание развитию знаний в ключевых областях, которые должны знать SRE, таких как автоматизация, мониторинг, реагирование на инциденты и т. д.

В статьях собраны ссылки на материалы для подготовки. Полезный свод знаний для подготовки к интервью. В одном из прошлых постов ссылка на статьи по первым 4 неделям, а в этом вы найдете ссылку на статью по 5 неделе.

Неделя 5
Day 1: Introduction to Scalability
Day 2: Performance Metrics and Tools
Day 3: Architectural Patterns for Scalability
Day 4: Optimizing Application Performance
Day 5: Infrastructure Optimization
Days 6-7: System Design

8.0K views10:00

Мониторим ИТ

За свои собственные деньги я вписался в курс Observability от Отуса. Решил расширить свои знания в области мониторинга на чуть менее известные для меня TICK Stack, Grafana Loki, Tempo, Jaeger, Prometheus, Thanos и другие модные словечки.

Если вы проходили этот курс, напишите, что о нем думаете в комментах. Я планирую периодически писать посты в канале о своих ощущениях от курса, о преподавателях и, самое главное, о пользе. Вообще, мне интересно узнать как устроены процессы мониторинга в других компаниях, узнать подходы, которые они там используют.

Ссылки не публикую, поиском легко найти этот курс.

5.3K views08:00

Мониторим ИТ

How to Create and Work with Variables | Grafana

Из этого видео с ютуб-канала Grafana вы узнаете:
⚡️Что такое переменные дашбордов
⚡️ Какие типы переменных существуют
⚡️ Как создавать переменные
⚡️ Пример создания переменной

YouTube

How to Create and Work with Variables | Grafana

Links:
Variables
https://grafana.com/docs/grafana/latest/dashboards/variables/
List of Global Variables
https://grafana.com/docs/grafana/latest/dashboards/variables/add-template-variables/#global-variables
Sign up for Grafana cloud for free: https://graf…

7.3K views06:30

Мониторим ИТ

Key metrics for monitoring etcd

Статья из блога Datadog и посвящена мониторингу etcd в Kubernetes. В ней показаны ключевые показатели, которые следует отслеживать, чтобы убедиться, что etcd обеспечивает работоспособность и производительность кластера Kubernetes. Читать статью.

5.4K views06:30

Мониторим ИТ

Ещё одно интересное выступление с Fosdem 2024 — Linux load average and other silly metrics. Здесь запускают нагрузку на сервере и интересно интерпретируют показатели утилиты top. Смотреть видео.

7.3K views11:00

Мониторим ИТ

The engineering on-call experience: misconceptions, lessons learned, and how to prepare

В этой статье старшие инженеры-программисты Grafana делятся своими самыми большими заблуждениями о дежурстве, некоторыми советами и приемами, которые они узнали на этом пути, а также тем, почему этот опыт может быть полезным и веселым. Читать статью.

6.2K views09:34

Мониторим ИТ

How to Display Grafana Alerts to Your Dashboards | Grafana

В этом видео рассказывывают о подходах к визуализации алертов на дашбордах в Grafana.

3.9K views15:30

Мониторим ИТ

Настраиваем логирование с помощью Loki и Grafana

При построении микросервисной архитектуры часто возникает потребность анализировать логи из нескольких источников (баз, сервисов и т. д.). В этой статье автор делится решением к которому в итоге пришел. Читать статью.

4.3K views06:00

Мониторим ИТ

Google Maps Integration With Zabbix Geomap Widget

На этом видео Дмитрий Ламберт, руководитель команды техподдержки Zabbix рассказывает об интеграции Google Maps с геовиджетом в Zabbix. Смотреть.

4.7K views13:00

2025/07/07 09:16:30
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>