Telegram Web Link
How we improved Grafana's alert state history to provide better insights into your alerting data

В этой статье в блоге Grafana рассказано о глубокой переработке системы истории состояний оповещений в Grafana Alerting. Теперь можно использовать возможности запросов в Grafana Loki в сочетании с обновленным и улучшенным пользовательским интерфейсом для анализа, отслеживания и создания дашбордов по оповещениям. Читать дальше.
👍4
#бесплатно

👥 Митап Yandex Infrastructure в Новосибирске

У Яндекса огромная инфраструктура хранения и обработки данных, многие ее составляющие — собственные разработки компании. За все эти технологии, процессы и продукты отвечает команда инфраструктуры.

Приглашаю на митап, где расскажут о:

• YDB:
О том, как упрощается разработка клиентского приложения, когда на уровне платформы для работы с данными гарантирована атомарность вычитания данных из потока событий в топики и запись в таблицы.

• Arc — собственная система контроля версий для монорепозитория:
Расскажут, зачем нужен монорепозиторий, как устроена внутренняя система контроля версий в Яндексе и виртуализация файловой системы.

• Система сборки Ya make:
Иногда разработка в монорепозитории большой компании предъявляет к системе сборки неожиданные требования — расскажут, как мы с этим справляемся и с какими компромиссами нам приходится жить.

📍 27 июля, 18:00
📍 Новосибирск, Лофт Парк «Подземка», Красный проспект, 161
📍 Регистрация — по ссылке.
👎4👍21
Мониторинг пользователей OpenVPN с помощью Zabbix и визуализации в Grafana

В этой статье рассказано о шаблоне для Zabbix и дашборде в Grafana для визуализации активности пользователей OpenVPN. Читать дальше.
👍9
Как из метрик Prometheus построить график Latency

В этой статье рассказано как визуализировать Latency с помощью Histogram метрики. Будет полезно тем, кто еще не строил метрики из Prometheus, а так же тем, кто хочет понять как их интерпретировать. Читать статью.
👍1
Centralized Resource Display for Multiple Kubernetes Clusters

Несколько бесплатных инструментов для централизованного просмотра показателей производительности кластеров K8S. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
Новый выпуск о событиях в облачной индустрии — Monthly Cloud News June

Developer Advocate Yandex Cloud Антон Черноусов вместе с архитектором Yandex Cloud Павлом Селивановым и Александром Титовым из «Экспресс 42» обсудят:

• Kuberconf'23;
• исследование состояния DevOps 2023;
• тренды в развитии Kubernetes®;
• Argo CD;
• общие тренды внедрения практик DevOps.

Смотрите выпуск на YouTube-канале Yandex Cloud.
👍4
Metrics: From Prometheus to OpenTelemetry with no Telemetry Data Loss

В этой статье автор делится своим опытом миграции метрик с Prometheus на OpenTelemetry без потери данных. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍2
Конвейер CI/CD для Java-приложения в Kubernetes + Jenkins

Теория — это хорошо, но подсмотреть чужой опыт на практике — бесценно. Специально для этой цели делимся с вами видео (https://youtu.be/adG0vq5boL8), где инженер за 3 часа строит пайплайн для Java-приложения в Kubernetes с помощью Jenkins. Каждое свое действие он объясняет, так что вопросов быть не должно.

По традиции предлагаем использовать Яндекс Браузер со встроенным синхронным переводчиком, если видео на английском пока даются тяжело 😉

Пользуйтесь и делитесь с коллегами 🤝

#kubernetes #devops #jenkins #nexus #docker #cicd #java

@DevOpsKaz
👍8👎1
Две статьи из блога Zabbix об анализе и трансформации данных внутри Zabbix

Zabbix in: Exploratory Data Analysis Rehearsal – Part 1. В этой статье рассказывают на примере мониторинга Nginx о создании новых метрик, которые помогут быстрее проводить диагностику нештатной работы сервиса.

Zabbix in: Exploratory Data Analysis Rehearsal – Part 2. Здесь разобран более продвинутый анализ метрик: стандартная девиация, персентиль, вариативность и другие.
👍51
Как использовать JMeter для нагрузочного тестирования и тестирования производительности

Apache JMeter — это инструмент для проведения нагрузочного тестирования, представляющий собой десктопное приложение с открытым исходным кодом на базе Java. JMeter позволяет определить, может ли тестируемое веб-приложение удовлетворять требованиям высокой нагрузки или нет. Он также помогает проанализировать работу всего сервера под высокой нагрузкой. Читать статью.
Как и зачем мы сделали свой мониторинг гипервизоров для виртуальных машин

В этой статье рассказано кастомном мониторинге гипервизоров: как его сделали, как он работает и какую пользу приносит. Решение выполнено для Openstack на базе Prometheus/Alertmanager/Grafana. Читать статью.
👍4
Alerting: The Do’s and Don’ts for Effective Observability

Статья об эффективном подходе к алертингу. Читать статью.
1👍1
SRE Evangelist

Несколько советов о том, как быть хорошим SRE. Читать дальше.
👍4
Prometheus Now Supports OpenTelemetry Metrics

Prometheus уже долгое время является основным средством мониторинга Kubernetes и облачных систем. Prometheus предоставляет полный стек, включая сбор метрик, а также бэкенд, включающий базу данных с временными рядами для хранения метрик, пользовательский интерфейс, AlertManager и многое другое.

Затем появился OpenTelemetry, который предлагает унифицированный способ сбора телеметрии наблюдаемости, включая трассировки, журналы и метрики. OpenTelemetry — самый активный проект в CNCF после Kubernetes, и он быстро становится стандартом сбора данных о наблюдаемости.

Но как сочетаются эти два чрезвычайно популярных проекта?
Если люди начинают собирать метрики с помощью OpenTelemetry, смогут ли они продолжать использовать Prometheus в качестве бэкенда для сбора метрик? Ответ на вопрос в статье.

❗️Статья на Медиум, возможно, нужен VPN.
👍4
Preparing your logging stack for a 10x scale using ELK & Kafka on Kubernetes

Urban Company рассказывает о собственном опыте скалирования инфраструктуры логирования. Читать статью.
👍31
Deploying Prometheus and Grafana monitoring stack to Kubernetes the GitOps way using ArgoCD

Деплой мониторинга K8S при помощи ArgoCD. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍2
Zabbix + OpenStack

Zabbix представил шаблон для мониторинга OpenStack для версии 6.4. Посмотреть шаблон.
👍6👎1🤔1
What is My SLO and How do I Test It?

В этой статье рассказано как при помощи K6 определить SLO для ряда эндпоинтов демонстрационного сервиса K6 и как написать повторяющиеся тесты производительности этих SLO, чтобы следить за работой сервиса. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
How to Calculate Reliability and High Availability in SRE!

В этой статье раскрываются технические детали реализации понятий SLO, SLI, SLA и показано, как создавать собственные дашборды, отвечающие специфическим потребностям. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍2
Python Profiling — Why and Where Your Code is Slow

Сказ о профайлерах, которые помогут выявить недостатки кода на Python. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍21
2025/07/10 13:02:25
Back to Top
HTML Embed Code: