Kubernetes — Grafana — Overview dashboard: common issues and efficiency
В этой статье рассматривается создание облегченного дашборда для Kubernetes в Grafana, который дает глобальный обзор нагрузки на кластера Kubernetes, помогает обнаруживать распространенные проблемы и нештатное поведение. В конце статьи сам дашборд в формате JSON. Читать на Medium.
❗️ Статья на medium.com
В этой статье рассматривается создание облегченного дашборда для Kubernetes в Grafana, который дает глобальный обзор нагрузки на кластера Kubernetes, помогает обнаруживать распространенные проблемы и нештатное поведение. В конце статьи сам дашборд в формате JSON. Читать на Medium.
❗️ Статья на medium.com
🔥6👍5
Ограничение доступа к метрикам Node Exporter по IP-адресам
Для повышения безопасности можно реализовать возможность ограничения доступа к метрикам только для определённых IP-адресов, что позволит контролировать, какие клиенты могут запрашивать метрики. В этой статье рассмотрено, как внести соответствующие изменения в код Node Exporter, а также процесс сборки обновленного пакета. Читать на Хабре.
Для повышения безопасности можно реализовать возможность ограничения доступа к метрикам только для определённых IP-адресов, что позволит контролировать, какие клиенты могут запрашивать метрики. В этой статье рассмотрено, как внести соответствующие изменения в код Node Exporter, а также процесс сборки обновленного пакета. Читать на Хабре.
👎11🤔2
MySQLTuner-perl
MySQLTuner — это скрипт, написанный на Perl, который позволяет быстро просматривать настройки инсталляции MySQL и вносить в них изменения для повышения производительности и стабильности. Текущие переменные конфигурации и данные о состоянии извлекаются и представляются в кратком формате вместе с некоторыми базовыми рекомендациями по производительности.
Репыч на Гитхабе
MySQLTuner — это скрипт, написанный на Perl, который позволяет быстро просматривать настройки инсталляции MySQL и вносить в них изменения для повышения производительности и стабильности. Текущие переменные конфигурации и данные о состоянии извлекаются и представляются в кратком формате вместе с некоторыми базовыми рекомендациями по производительности.
Репыч на Гитхабе
👍12🔥3
Почему observability — это не только Grafana и Prometheus
Вы видите красивые графики в Grafana, алерты настроены, метрики собираются — значит, все под контролем? На самом деле, нет. Когда в продакшене что-то пойдет не так, Prometheus покажет скачок latency, но не объяснит, почему это произошло. Логи могут не содержать нужных данных. Трейсов нет. Итог — часы расследования, хаотичные гипотезы, поиски иголки в стоге сена.
Observability — одно из тех модных слов, которые часто понимают неправильно. Для многих оно сводится к связке Grafana + Prometheus, не более. Однако в реальных системах наблюдаемость (observaбыстроbility) — это больше, чем просто красивые дашборды с метриками. В этой статье разбираются, почему классический стек не покрывает все задачи, какие альтернативы есть на рынке и как построить современный observability-стек.
Вы видите красивые графики в Grafana, алерты настроены, метрики собираются — значит, все под контролем? На самом деле, нет. Когда в продакшене что-то пойдет не так, Prometheus покажет скачок latency, но не объяснит, почему это произошло. Логи могут не содержать нужных данных. Трейсов нет. Итог — часы расследования, хаотичные гипотезы, поиски иголки в стоге сена.
Observability — одно из тех модных слов, которые часто понимают неправильно. Для многих оно сводится к связке Grafana + Prometheus, не более. Однако в реальных системах наблюдаемость (observaбыстроbility) — это больше, чем просто красивые дашборды с метриками. В этой статье разбираются, почему классический стек не покрывает все задачи, какие альтернативы есть на рынке и как построить современный observability-стек.
👍12❤1
Data sources, visualizations, and apps: A guide to extending and customizing Grafana
В этой статье из блога Grafana расказывают как можно расширить ее функционал с помощью плагинов. Представлен обзор трех основных типов плагинов и рассказано как найти то, что нужно в каталоге плагинов.
В этой статье из блога Grafana расказывают как можно расширить ее функционал с помощью плагинов. Представлен обзор трех основных типов плагинов и рассказано как найти то, что нужно в каталоге плагинов.
👍8🔥2
В GMonit появились динамические бейзлайны 🔥
Теперь в observability платформе доступна система динамических пороговых значений для ключевых метрик. Dynamic baselines автоматически:
⚡️ учитывают сезонные колебания;
⚡️ анализируют исторические данные;
⚡️ определяют нормальные пределы метрик в разное время суток, дни недели или сезонные периоды.
Благодаря обновлению пользователи могут выявлять аномалии с учетом реального поведения ПО, а не на основе статических порогов. Это сокращает количество ложных срабатываний и ускоряет обнаружение реальных проблем – команды получают более точные алерты, быстрее реагируют на ошибки и повышают стабильность продукта.
🔔 Подробнее об observability платформе читайте на сайте
Теперь в observability платформе доступна система динамических пороговых значений для ключевых метрик. Dynamic baselines автоматически:
⚡️ учитывают сезонные колебания;
⚡️ анализируют исторические данные;
⚡️ определяют нормальные пределы метрик в разное время суток, дни недели или сезонные периоды.
Благодаря обновлению пользователи могут выявлять аномалии с учетом реального поведения ПО, а не на основе статических порогов. Это сокращает количество ложных срабатываний и ускоряет обнаружение реальных проблем – команды получают более точные алерты, быстрее реагируют на ошибки и повышают стабильность продукта.
🔔 Подробнее об observability платформе читайте на сайте
gmonit.ru
Observability платформа для командной работы. Российское решение, основанное на лучших мировых практиках
👍67❤27🔥20👎5🤔2
Когда устанавливаешь Zabbix, перед тобой открывается новый дивный мир. В этой статье на Хабре автор рассказывает какие открытия он для себя сделал, установив эту систему мониторинга. Прочитайте, если имеете лишь отдаленной представление о Zabbix.
P.S. Жду в комментариях человека с гифкой про Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix.
P.P.S Андрей, спасибо, не подвел🙃
P.S. Жду в комментариях человека с гифкой про Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix Zabbix.
P.P.S Андрей, спасибо, не подвел🙃
👍14❤3🤔3👎1🔥1
Как я создавал Observability для своих pet-проектов. Часть 1
На примере своего стека (ниже) автор разбирает подход к созданию системы наблюдаемости с использованием VictoriaMetrics для метрик, Jaeger и Tempo для трейсинга, Grafana для визуализации, Loki для логов, Vector — универсальный агент для сбора всего, cAdvisor для сбора метрик с самой машины.
👉 VPS, на котором размещены мои проекты. Стандартная конфигурация: 4 ядра, 4 ГБ ОЗУ — и вперёд.
👉 Nginx proxy, который принимает все запросы из интернета. У меня используется сборка с jwilder/nginx-proxy и nginxproxy/acme-companion, которую я выложил в свой GitHub. Благодаря этому я могу добавлять новые проекты на VPS, и они сразу доступны из интернета с SSL-сертификатом от Let’s Encrypt. Ссылка на репозиторий.
👉 Ghost для блогов. Это как WordPress на заре его появления, только круче. Написан на Node.js.
👉 Laravel — там, где нужна админка или фронт.
👉 Golang для проектов, где требуется чистый бэкенд.
Читать статью.
На примере своего стека (ниже) автор разбирает подход к созданию системы наблюдаемости с использованием VictoriaMetrics для метрик, Jaeger и Tempo для трейсинга, Grafana для визуализации, Loki для логов, Vector — универсальный агент для сбора всего, cAdvisor для сбора метрик с самой машины.
👉 VPS, на котором размещены мои проекты. Стандартная конфигурация: 4 ядра, 4 ГБ ОЗУ — и вперёд.
👉 Nginx proxy, который принимает все запросы из интернета. У меня используется сборка с jwilder/nginx-proxy и nginxproxy/acme-companion, которую я выложил в свой GitHub. Благодаря этому я могу добавлять новые проекты на VPS, и они сразу доступны из интернета с SSL-сертификатом от Let’s Encrypt. Ссылка на репозиторий.
👉 Ghost для блогов. Это как WordPress на заре его появления, только круче. Написан на Node.js.
👉 Laravel — там, где нужна админка или фронт.
👉 Golang для проектов, где требуется чистый бэкенд.
Читать статью.
🔥8
Top 16 DevOps Tools for 2025: (Excellent for SREs, Too!)
В этой статье 16 инструментов, среди них:
🚀 Harness — платформа доставки программного обеспечения на основе искусственного интеллекта, разработанная для модернизации процессов DevOps.
🚀 Tekton — фреймворк с открытым исходным кодом для создания систем CI/CD, предлагающий гибкость и мощность для работы с различными средами развертывания и поставщиками облачных услуг, а также локально.
🚀 Argo CD — декларативный инструмент непрерывной доставки GitOps, разработанный для Kubernetes.
🚀 Dash0 — observability-платформа на базе OpenTelemetry, которая обеспечивает комплексное понимание приложений и инфраструктуры.
🚀 HyperDX — observability-платформа с открытым исходным кодом.
🚀 Crossplane — облачный фреймворк управления, который позволяет создавать собственные алгоритмы оркестрации без написания кода.
🚀 NGINX Unit — легкая и универсальная среда выполнения приложений с открытым исходным кодом, которая объединяет основные компоненты веб-приложений в один сервер.
🚀 Piku — платформа с открытым исходным кодом, которая позволяет пользователям развертывать приложения на своих серверах с помощью простых команд 'git push'.
🚀 SSOReady — сервис с открытым исходным кодом, которая упрощает реализацию единого входа (SSO) SAML для разработчиков.
..и другие.
❗️ Статья на medium.com
В этой статье 16 инструментов, среди них:
🚀 Harness — платформа доставки программного обеспечения на основе искусственного интеллекта, разработанная для модернизации процессов DevOps.
🚀 Tekton — фреймворк с открытым исходным кодом для создания систем CI/CD, предлагающий гибкость и мощность для работы с различными средами развертывания и поставщиками облачных услуг, а также локально.
🚀 Argo CD — декларативный инструмент непрерывной доставки GitOps, разработанный для Kubernetes.
🚀 Dash0 — observability-платформа на базе OpenTelemetry, которая обеспечивает комплексное понимание приложений и инфраструктуры.
🚀 HyperDX — observability-платформа с открытым исходным кодом.
🚀 Crossplane — облачный фреймворк управления, который позволяет создавать собственные алгоритмы оркестрации без написания кода.
🚀 NGINX Unit — легкая и универсальная среда выполнения приложений с открытым исходным кодом, которая объединяет основные компоненты веб-приложений в один сервер.
🚀 Piku — платформа с открытым исходным кодом, которая позволяет пользователям развертывать приложения на своих серверах с помощью простых команд 'git push'.
🚀 SSOReady — сервис с открытым исходным кодом, которая упрощает реализацию единого входа (SSO) SAML для разработчиков.
..и другие.
❗️ Статья на medium.com
🔥9👍4❤1
OpenTelemetry, Prometheus, and More: Which Is Better for Metrics Collection and Propagation?
В статье разбирают бенчмаркинг трех коллекторов: Prometheus (в режиме агента), OpenTelemetry Collector и vmagent (легкий агент от VictoriaMetrics) для сбора данных с 1200 экспортеров узлов, разбросанных по 3 регионам. Узнать кто победил.
❗️Статья на Medium.
В статье разбирают бенчмаркинг трех коллекторов: Prometheus (в режиме агента), OpenTelemetry Collector и vmagent (легкий агент от VictoriaMetrics) для сбора данных с 1200 экспортеров узлов, разбросанных по 3 регионам. Узнать кто победил.
❗️Статья на Medium.
👍7
Grafana Drilldown apps: the improved queryless experience formerly known as the Explore apps
Речь про бывший Explore. В блоге Grafana рассказывают о новых возможностях этого интерефейса и упрощении работы с ним. Читать дальше.
Речь про бывший Explore. В блоге Grafana рассказывают о новых возможностях этого интерефейса и упрощении работы с ним. Читать дальше.
👍6🔥1
VictoriaLogs Source Reading
В этой статье рассматривается архитектура VictoriaLogs, основные компоненты и функции, включая механизмы хранения, индексирование, запросы и визуализацию данных, а также сравнивается с другими решениями по управлению логами. Читать статью.
В этой статье рассматривается архитектура VictoriaLogs, основные компоненты и функции, включая механизмы хранения, индексирование, запросы и визуализацию данных, а также сравнивается с другими решениями по управлению логами. Читать статью.
👍6🔥3
Мониторинг контейнеров с помощью cAdvisor
В этой статье рассмотрено, как с помощью cAdvisor можно отслеживать использование ресурсов контейнеров и их производительность.
В этой статье рассмотрено, как с помощью cAdvisor можно отслеживать использование ресурсов контейнеров и их производительность.
🔥7👍3
Observability Checklist. От железа до приложений, или как не остаться слепым в продакшене
Статья о том, какие метрики должны входить в контур мониторинга, чтобы чувствовать себя уверенно и ничего не пропустить.
Статья о том, какие метрики должны входить в контур мониторинга, чтобы чувствовать себя уверенно и ничего не пропустить.
👍6🔥3
Как мы автоматизировали сбор данных по проблемам производительности 1С для проведения диагностики в одном окне
В этой статье рассказывают как покрывать мониторингом 1С. Из знакомых интерфейсов увидел Kibana и Grafana. А что там работает под капотом осталось, к сожалению, за рамками статьи.
В этой статье рассказывают как покрывать мониторингом 1С. Из знакомых интерфейсов увидел Kibana и Grafana. А что там работает под капотом осталось, к сожалению, за рамками статьи.
👍3❤1🔥1
Основы SNMP
SNMP — основной протокол мониторинга для сетевых устройств и другого физического оборудования. В этой статье разобраны принципы работы этого протокола и приведены примеры диагностики через утилиты командной строки.
SNMP — основной протокол мониторинга для сетевых устройств и другого физического оборудования. В этой статье разобраны принципы работы этого протокола и приведены примеры диагностики через утилиты командной строки.
👍6
Как я создавал Observability для своих pet-проектов. Часть 2
Часть 1 по ссылке.
В этой части разбирается настройка Observability на примере простого Golang-приложения, настройка в нём структурированных логов, распределённый трейсинг и метрики, а также интегрирация со стеком мониторинга.
Часть 1 по ссылке.
В этой части разбирается настройка Observability на примере простого Golang-приложения, настройка в нём структурированных логов, распределённый трейсинг и метрики, а также интегрирация со стеком мониторинга.
👍3
Set up Monitoring and Logging in a Docker Swarm Cluster
В этой статье рассмотрен процесс настройки системы мониторинга и логирования в кластере Docker Swarm. Настройка обеспечит кластеру наблюдаемость, а логи и показатели производительности будут визуализироваться в режиме реального времени. Инструменты, которые описаны в статье, включают: Docker Swarm, Traefik, Grafana, Prometheus, cAdvisor, Node Exporter, Loki, Promtail.
❗️Статья на medium.com
В этой статье рассмотрен процесс настройки системы мониторинга и логирования в кластере Docker Swarm. Настройка обеспечит кластеру наблюдаемость, а логи и показатели производительности будут визуализироваться в режиме реального времени. Инструменты, которые описаны в статье, включают: Docker Swarm, Traefik, Grafana, Prometheus, cAdvisor, Node Exporter, Loki, Promtail.
❗️Статья на medium.com
Grafana OnCall (OSS) — всё?
В своем блоге Grafana объявила о завершении поддержки этого продукта и перевод его в архив примерно через год. Что ж продукт был неоднозначным, непростым в развертывании и настройке. Сейчас весь функционал OnCall будет развиваться в рамках Grafana Cloud IRM (в облаке и за деньги). Они пишут, что поддержат решение сообщество, если кто-то захочет контрибьютить и поддерживать этот продукт.
Этим постом я хотел напомнить, что есть и другие интересные продукты для решения задач OnCall, например Keep.
Пользователи Grafana OnCall, расскажите в комментариях куда планируете переходит или вы уже находитесь в процессе перехода. Что вообще думаете про сложившуюся ситуацию?
В своем блоге Grafana объявила о завершении поддержки этого продукта и перевод его в архив примерно через год. Что ж продукт был неоднозначным, непростым в развертывании и настройке. Сейчас весь функционал OnCall будет развиваться в рамках Grafana Cloud IRM (в облаке и за деньги). Они пишут, что поддержат решение сообщество, если кто-то захочет контрибьютить и поддерживать этот продукт.
Этим постом я хотел напомнить, что есть и другие интересные продукты для решения задач OnCall, например Keep.
Пользователи Grafana OnCall, расскажите в комментариях куда планируете переходит или вы уже находитесь в процессе перехода. Что вообще думаете про сложившуюся ситуацию?
🤔13👍4👎1