Telegram Web Link
OpenTelemetry Collector persistence and retry mechanisms under the hood

В этой статье подробно рассмотрена одна из важнейших функций в OpenTelemetry Collector: механизмы постоянного хранения и повторов. Читать статью.
Kubernetes — Grafana — Overview dashboard: common issues and efficiency

В этой статье рассматривается создание облегченного дашборда для Kubernetes в Grafana, который дает глобальный обзор нагрузки на кластера Kubernetes, помогает обнаруживать распространенные проблемы и нештатное поведение. В конце статьи сам дашборд в формате JSON. Читать на Medium.

❗️ Статья на medium.com
Ограничение доступа к метрикам Node Exporter по IP-адресам

Для повышения безопасности можно реализовать возможность ограничения доступа к метрикам только для определённых IP-адресов, что позволит контролировать, какие клиенты могут запрашивать метрики. В этой статье рассмотрено, как внести соответствующие изменения в код Node Exporter, а также процесс сборки обновленного пакета. Читать на Хабре.
MySQLTuner-perl

MySQLTuner — это скрипт, написанный на Perl, который позволяет быстро просматривать настройки инсталляции MySQL и вносить в них изменения для повышения производительности и стабильности. Текущие переменные конфигурации и данные о состоянии извлекаются и представляются в кратком формате вместе с некоторыми базовыми рекомендациями по производительности.

Репыч на Гитхабе
Почему observability — это не только Grafana и Prometheus

Вы видите красивые графики в Grafana, алерты настроены, метрики собираются — значит, все под контролем? На самом деле, нет. Когда в продакшене что-то пойдет не так, Prometheus покажет скачок latency, но не объяснит, почему это произошло. Логи могут не содержать нужных данных. Трейсов нет. Итог — часы расследования, хаотичные гипотезы, поиски иголки в стоге сена.

Observability — одно из тех модных слов, которые часто понимают неправильно. Для многих оно сводится к связке Grafana + Prometheus, не более. Однако в реальных системах наблюдаемость (observaбыстроbility) — это больше, чем просто красивые дашборды с метриками. В этой статье разбираются, почему классический стек не покрывает все задачи, какие альтернативы есть на рынке и как построить современный observability-стек.
Data sources, visualizations, and apps: A guide to extending and customizing Grafana

В этой статье из блога Grafana расказывают как можно расширить ее функционал с помощью плагинов. Представлен обзор трех основных типов плагинов и рассказано как найти то, что нужно в каталоге плагинов.
В GMonit появились динамические бейзлайны 🔥

Теперь в observability платформе доступна система динамических пороговых значений для ключевых метрик. Dynamic baselines автоматически:
⚡️ учитывают сезонные колебания;
⚡️ анализируют исторические данные;
⚡️ определяют нормальные пределы метрик в разное время суток, дни недели или сезонные периоды.

Благодаря обновлению пользователи могут выявлять аномалии с учетом реального поведения ПО, а не на основе статических порогов. Это сокращает количество ложных срабатываний и ускоряет обнаружение реальных проблем – команды получают более точные алерты, быстрее реагируют на ошибки и повышают стабильность продукта.

🔔 Подробнее об observability платформе читайте на сайте
Когда устанавливаешь Zabbix, перед тобой открывается новый дивный мир. В этой статье на Хабре автор рассказывает какие открытия он для себя сделал, установив эту систему мониторинга. Прочитайте, если имеете лишь отдаленной представление о Zabbix.

P.S. Жду в комментариях человека с гифкой про Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix.

P.P.S Андрей, спасибо, не подвел🙃
VictoriaMetrics: нюансы внедрения в облачную платформу

Опыт внедрения VM в проде. Читать статью.
Как я создавал Observability для своих pet-проектов. Часть 1

На примере своего стека (ниже) автор разбирает подход к созданию системы наблюдаемости с использованием VictoriaMetrics для метрик, Jaeger и Tempo для трейсинга, Grafana для визуализации, Loki для логов, Vector — универсальный агент для сбора всего, cAdvisor для сбора метрик с самой машины.

👉 VPS, на котором размещены мои проекты. Стандартная конфигурация: 4 ядра, 4 ГБ ОЗУ — и вперёд.

👉 Nginx proxy, который принимает все запросы из интернета. У меня используется сборка с jwilder/nginx-proxy и nginxproxy/acme-companion, которую я выложил в свой GitHub. Благодаря этому я могу добавлять новые проекты на VPS, и они сразу доступны из интернета с SSL-сертификатом от Let’s Encrypt. Ссылка на репозиторий.

👉 Ghost для блогов. Это как WordPress на заре его появления, только круче. Написан на Node.js.

👉 Laravel — там, где нужна админка или фронт.

👉 Golang для проектов, где требуется чистый бэкенд.

Читать статью.
Top 16 DevOps Tools for 2025: (Excellent for SREs, Too!)

В этой статье 16 инструментов, среди них:

🚀 Harness — платформа доставки программного обеспечения на основе искусственного интеллекта, разработанная для модернизации процессов DevOps.

🚀 Tekton — фреймворк с открытым исходным кодом для создания систем CI/CD, предлагающий гибкость и мощность для работы с различными средами развертывания и поставщиками облачных услуг, а также локально.

🚀 Argo CD — декларативный инструмент непрерывной доставки GitOps, разработанный для Kubernetes.

🚀 Dash0 — observability-платформа на базе OpenTelemetry, которая обеспечивает комплексное понимание приложений и инфраструктуры.

🚀 HyperDX — observability-платформа с открытым исходным кодом.

🚀 Crossplane — облачный фреймворк управления, который позволяет создавать собственные алгоритмы оркестрации без написания кода.

🚀 NGINX Unit — легкая и универсальная среда выполнения приложений с открытым исходным кодом, которая объединяет основные компоненты веб-приложений в один сервер.

🚀 Piku — платформа с открытым исходным кодом, которая позволяет пользователям развертывать приложения на своих серверах с помощью простых команд 'git push'.

🚀 SSOReady — сервис с открытым исходным кодом, которая упрощает реализацию единого входа (SSO) SAML для разработчиков.

..и другие.

❗️ Статья на medium.com
OpenTelemetry, Prometheus, and More: Which Is Better for Metrics Collection and Propagation?

В статье разбирают бенчмаркинг трех коллекторов: Prometheus (в режиме агента), OpenTelemetry Collector и vmagent (легкий агент от VictoriaMetrics) для сбора данных с 1200 экспортеров узлов, разбросанных по 3 регионам. Узнать кто победил.

❗️Статья на Medium.
Grafana Drilldown apps: the improved queryless experience formerly known as the Explore apps

Речь про бывший Explore. В блоге Grafana рассказывают о новых возможностях этого интерефейса и упрощении работы с ним. Читать дальше.
VictoriaLogs Source Reading

В этой статье рассматривается архитектура VictoriaLogs, основные компоненты и функции, включая механизмы хранения, индексирование, запросы и визуализацию данных, а также сравнивается с другими решениями по управлению логами. Читать статью.
Мониторинг контейнеров с помощью cAdvisor

В этой статье рассмотрено, как с помощью cAdvisor можно отслеживать использование ресурсов контейнеров и их производительность.
Observability Checklist. От железа до приложений, или как не остаться слепым в продакшене

Статья о том, какие метрики должны входить в контур мониторинга, чтобы чувствовать себя уверенно и ничего не пропустить.
Как мы автоматизировали сбор данных по проблемам производительности 1С для проведения диагностики в одном окне

В этой статье рассказывают как покрывать мониторингом 1С. Из знакомых интерфейсов увидел Kibana и Grafana. А что там работает под капотом осталось, к сожалению, за рамками статьи.
Основы SNMP

SNMP — основной протокол мониторинга для сетевых устройств и другого физического оборудования. В этой статье разобраны принципы работы этого протокола и приведены примеры диагностики через утилиты командной строки.
Как я создавал Observability для своих pet-проектов. Часть 2

Часть 1 по ссылке.

В этой части разбирается настройка Observability на примере простого Golang-приложения, настройка в нём структурированных логов, распределённый трейсинг и метрики, а также интегрирация со стеком мониторинга.
Set up Monitoring and Logging in a Docker Swarm Cluster

В этой статье рассмотрен процесс настройки системы мониторинга и логирования в кластере Docker Swarm. Настройка обеспечит кластеру наблюдаемость, а логи и показатели производительности будут визуализироваться в режиме реального времени. Инструменты, которые описаны в статье, включают: Docker Swarm, Traefik, Grafana, Prometheus, cAdvisor, Node Exporter, Loki, Promtail.

❗️Статья на medium.com
2025/07/05 06:10:13
Back to Top
HTML Embed Code: