Telegram Web Link
Deploying Grafana, Prometheus, and Alertmanager on Kubernetes: A Quick and Easy Guide

Эта статья — краткое руководство по настройке grafana, prometheus и alertmanger с помощью kube-prometheus-stack helm chart. Читать.
👍1
В этом посте собраны три ссылки на репозитории Github, которые потенциально могут помочь при подготовке к собеседованию на позицию SRE. Приятного чтения!

Site Reliability Engineer (SRE) Interview Preparation Guide

SRE-Interviews

SRE Interviewing Questions
👍1👏1
В сервисе Yandex Data Proc стало доступно создание управляемых кластеров Hive Metastore (Public Preview)

Hive Metastore связывает разнородные ETL-системы и инструменты для работы с общими данными и упрощает их развёртывание. Кластеры Metastore управляют табличными метаданными объектов, которые находятся в бакетах Object Storage.

Теперь решать задачи подготовки и очистки данных, создания хранилищ и предметно-ориентированных витрин данных стало проще.

➡️ Подробнее о новинке и о том, как первым получить доступ по ссылке
👍1🔥1👏1
Autometrics - это микрофреймворк наблюдаемости, созданный для разработчиков

Он позволяет инструментировать любую функцию с помощью наиболее полезных метрик: частоты запросов, ошибок и задержек. Autometrics использует имена инструментированных функций для генерации запросов Prometheus, поэтому не нужно вручную писать сложные PromQL.

Репыч на Гитхабе.
👍1🔥1
OpenTelemetry Tracing: Everything you need to know

Из этой статьи вы узнаете о возможностях и архитектуре OpenTelemetry. Читать дальше.
👍51🔥1
5 tips for improving Grafana Loki query performance

Запись вебинара с советами по оптимизации производительности Grafana Loki. Смотреть.
👍4❤‍🔥1
On-call management on the go: Introducing the Grafana OnCall mobile app

Описание работы мобильного приложения для Grafana OnCall OSS или Grafana OnCall в Grafana Cloud. Читать статью в блоге Grafana.
👍4🔥21
Managing Grafana Dashboards With Terraform

Статья про использование Terraform для управления дашбордами в Grafana. Читать дальше.
👍5👎4❤‍🔥1🔥1🤔1
Monitoring CPU/RAM/disk metrics with OpenTelemetry and Uptrace

В этой статье раасказано как при помощи мотка изоленты и интегральной микросхемы OpenTelemetry, hostmetricsreceiver и Uptrace собрать данные сервера по производительности. Читать статью.
👍61
🔥 Главная в России конференция про Kubernetes®

22 июня 2023 года состоится Kuber Conf — конференция для всех, кто работает с Kubernetes®. Вас ждёт 9 докладов, 12 спикеров, 180 минут техноконтента:

➡️ технические доклады, продуктовые обзоры, лучшие практики от разработчиков и экспертов по контейнерным технологиям;
➡️ создание сервисов и решение бизнес-задач с помощью Kubernetes в финтехе, e-commerce, HoReCa и не только;
➡️ неформальное общение с профессиональным сообществом, встреча старых друзей и новые знакомства.

Регистрируйтесь по ссылке, чтобы получить доступ к онлайн-трансляции Kuber Conf’2
🔥5👎21👍1
Say Hello to Grafana OnCall

Практический гайд по использованию Grafana OnCall. Сохраните, чтобы не потерять. Читать статью.

Используете у себя этот полезный инструмент для управления алертами?
👍101🔥1
Relabeler

Песочница для проверки правил релейбелинга в Prometheus. Ссылка.
🔥10👍41🤔1
caretta

Утилита для визуализации топологии K8S в Grafana. Carreta использует eBPF для отображения всех сетевых взаимодействий служб в кластере K8s и Grafana для визуализации собранных данных.

Репозиторий на Github

Расскажите в комментариях каким инструментом визуализируете топологию K8S. Возможно, есть еще что-то более интересное с точки зрения функций и юзабилити.
👍13🔥41
Grafana Mimir and VictoriaMetrics: performance tests

В этой статье автор сравнивает производительность и использование ресурсов кластеров VictoriaMetrics и Grafana Mimir, работающих при умеренной нагрузке на одном и том же оборудовании. Читать дальше.

Какую TSDB используете в своем окружении?
👍4
Single Prometheus job for dozens of Blackbox exporters

Представьте, что у вас есть 20+ экспортеров Blackbox в разных точках мира, которые не принадлежат к какому-либо кластеру или окружению, а работают как отдельные части мониторинга конечных точек из разных мест. Например, нужно отслеживать 100+ URL из различных локаций для обеспечения доступности сайта, задержек и т.д. Читать дальше.

❗️Статья на Медиум, возможно, будет нужен VPN.
👍6
Sample vs Metrics vs Cardinality

В статье объясняются три эти понятия относительно работы с TSDB. Читать дальше.
👍2
Alerts, what are they good for?

Статья о работе с алертами: что такое алертинг, каким должен быть правильный алерт и т.д. Читать дальше.

А вы как-то управляете алертами в своей среде? Например, выполняете аудит или проверяете реагирует ли вообще кто-то на них.
👍2
pint

Линтер для Prometheus.

Репыч на Гитхабе
👍7
Understanding OpenTelemetry Collectors

Статья о том, как устроены коллекторы OpenTelemetry. Читать статью.

❗️Статья на Медиум, возможно, будет нужен VPN.
👍1
sampler

Утилита для визуализации метрик производительности и алертинга.

Репыч на Гитхабе.
👍6
2025/07/11 23:23:36
Back to Top
HTML Embed Code: