Telegram Web Link
Improving SNMP monitoring performance with bulk SNMP data collection

Всё течет и меняется. Zabbix — не исключение. В этой статье из блога Zabbix разобрано нововведение в версии 6.4 — новый тип элемента данных в рамках SNMP-агента — walk, который эффективен при необходимости сбора большого количества метрик с одного устройства. Под капотом работает как GetBulk. Настройка выглядит следующим образом:

1. Создаём главный элемент walk[], содержащий необходимые OID.
2. Создаём LLD-правило для элемента типа dependent item, который будет зависеть от основного элемента walk[].
3. Определяем LLD-макросы, используя шаг препроцессинга SNMP walk to JSON.
4. Создаём прототипы элементов типа dependent item, которые зависят от главного элемента walk[], и используем шаг препроцессинга SNMP walk value, чтобы указать, какой OID следует использовать для сбора значений.

Ключевое отличие от существующего метода дискаверинга SNMP-устройства (discovery) — формат вывода. Расскажите в комментариях, использует ли уже кто-то этот новый метод сбора SNMP-метрик.
Вышла Grafana 10.3

Что нового:

⚡️обновились всплывающие подсказки (появились цветовые индикаторы и появилась поддержка более длинных записей)
⚡️на панели типа Canvas появился зум (увеличение)
⚡️появилась возможность отображать изменения в процентах
⚡️появился аудит анонимных подключений и возможность их количественно ограничить
⚡️экспорт табличных представлений в PDF-файлы

и другие новые возможности. Подробнее можно узнать в блоге Grafana.
🔥Новый канал по Zabbix

Галс Софтвэр объявляет о запуске нового канала @zabbix_ru, посвященный понятно какой системе. Будут публиковать полезные материалы, записи вебинаров, конференций, митапов, а также делиться собственным опытом. Пост там пока только один, но скоро будет много.

Есть и второй канал, посвященный OpenSearch/ElasticSearch @elasticstack_ru.

Каналы сами на себя не подпишутся — вперёд!🚀
Что такое и зачем нужна CMDB

В этой статье автор весьма доходчиво объясняет о плюсах внедрения CMDB . Действительно, в крупных организациях процесс управления активами решен, а вот в некоторых средних и малых далеко не всегда. В конце статьи приведены ссылки на бесплатную и открытую ITSM-систему — iTop. В ней можно автоматизировать большинство ITSM-процессов, не заплатив при этом за лицензии. Я с этой системой уже работал и могу подтвердить, что её использование снимает много головняков в организации. Особенно в связке с Zabbix. Читать статью на Хабре.
SRE Interview Prep Plan

В этом цикле статей 6-недельный план, который составлен, чтобы пройти через весь процесс подготовки к собеседованию на позицию SRE. На каждой неделе уделено внимание развитию знаний в ключевых областях, которые должны знать SRE, таких как автоматизация, мониторинг, реагирование на инциденты и т. д.

В статьях собраны ссылки на материалы для подготовки. Полезный свод знаний для подготовки к интервью.

Неделя 1 (Days 1-2: Introduction to SRE, Days 3-4: Linux/Unix Systems, Days 5-7: Networking Fundamentals)

Неделя 2 (Days 1-3: Introduction to Automation, Scripting, Days 4-5: Infrastructure as Code, Days 6-7: Practice scripting and automation tasks)

Неделя 3 (Days 1-3: Monitoring, Logging, and Alerting, Days 4-5: Exploring Observability Stacks, Days 6-7: Setting up O11Y for a mock infrastructure)

Неделя 4 (Days 1-3: Incident Management Lifecycle, Days 4-5: Troubleshooting Techniques, Days 6-7: Mock Incident Management and Postmortem Analysis)

Продолжение следует.
tailspin

Открытая и бесплатная утилита для выделения текста в логах.

Репыч на Гитхабе
A guide to post-mortem meetings and how we run them at incident.io

Есть несколько моментов, о которых нужно помнить до, во время и после совещания по ликвидации последствий инцидента, чтобы извлечь из него максимальную пользу. В этой статье разобраны такие моменты. Читать статью.
How to be on-call

Большую часть своей карьеры автор этой статьи работал в командах дежурных и руководил такими командами и имеет большой опыт негативного влияния дежурств на личную жизнь. Он пропустил рождественский ужин, работал по выходным и ночам, пропустил множество детских мероприятий, а однажды одновременно справлялся с беспокойным ребенком и вызовом в офис. В этой статье разобрано как сделать процесс дежурств более разумным, сбалансировав потребности бизнеса с личной жизнью сотрудников. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
Troubleshooting Missing Kubernetes Logs in Elasticsearch

В этой статье разобран процесс логирования Kubernetes и траблшутинга отсутствия логов в Elasticsearch. Читать статью.
Prometheus metrics at 37signals

В этой статье рассказано как команда 37signals работает с Prometheus. Читать статью.
qryn

Интеграционный инструмент для работы с логами, трейсами и метриками в одном интерфейсе. В качестве хранилища использует Clickhouse.

Репыч на Гитхабе.
Scaling SRE Teams: The Challenges and How To Build a Successful Scaling Framework

В этой статье разобраны принципы масштабирования команд SRE и связанные с этим подводные и надводные камни. Читать статью.
Service Level Indicators

SLI: что это такое, как считать и использовать в работе — все в этой статье. Читать.
With OpenTelemetry, ComplyAdvantage overhauled its observability (twice)

Компания ComplyAdvantage, предоставляющая инструменты для соответствия требованиям и управления рисками, дважды за два года обновляла свою Observability-платформу: сначала они перешли с локальной Grafana OSS на Datadog, а затем с Datadog на Grafana Cloud. Н этой записи с ObservabilityCON SRE-директор ComplyAdvantage Адам Уилсон рассказывает как развивался подход его команды к наблюдаемости и как возросшее использование OTel позволило дважды мигрировать — и получить максимальную отдачу от Grafana Cloud для метрик, логов, трассировок, мониторинга Kubernetes и многого другого. Смотреть запись.
Accelerate TraceQL queries at scale with dedicated attribute columns in Grafana Tempo

В Grafana Tempo 2.3 был анонсирован новый формат хранения (vParquet3), который позволил реализовать новую функцию — выделенные столбцы с атрибутами. В этой статье рассказано о преимуществах и технических деталях этой функции, а также рассмотрен пример, в котором этот функционал может применяться. Читать статью.
grafana-dashboards-kubernetes

Репозиторий дашбордов для Kubernetes в Grafana. Описание их использования можно посмотреть в статье на Медиум (возможно, нужен VPN).

Репыч на Гитхабе.
Как создать панель управления веб-сайтом Analytics в Grafana

Из этого видео вы узнаете как создать в Grafana дашборд с метриками, относительно веб-сайта. А еще есть статья с описанием.
How to troubleshoot memory leaks in Go with Grafana Pyroscope

В этой статье рассмотрены наиболее распространенные причины утечек памяти в Go и продемонстрировано, как использовать Grafana Pyrscope — решение для непрерывного профилирования с открытым исходным кодом, для поиска и устранения этих утечек. Читать статью.
PostgreSQL Performance: Monitoring and Enhancement

В статье рассмотрены подходы к мониторингу СУБД PostgreSQL и оптимизации производительности. Читать статью.

❗️Статья на Медиум. Возможно, нужен VPN.
Infinity plugin for Grafana: Grafana Labs will now maintain the versatile data source plugin

Плагин Infinity представляет собой решение, которое позволяет запрашивать и визуализировать данные из JSON, CSV, XML и GraphQL. А Grafana Labs теперь официально стала владельцем этого популярного и универсального плагина.

У посла медальон, у Шпака магнитофон.. А теперь вот еще один плагин. На самом деле, позитивная новость. Теперь разработка будет вестись не силами энтузиастов, а разработчиками на зарплате со своими KPI и прочими штуками. Напомню, ранее в блоге Grafana сообщалось о принятии на сопровождении плагина для Zabbix.

Репыч на Гитхабе

Документация на плагин
2025/07/07 18:08:27
Back to Top
HTML Embed Code: