Telegram Web Link
Best Practices for Monitoring and Improving Kafka Performance

Несколько советов по улучшению производительности и мониторингу Kafka. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
🔥2
How to find unused Prometheus metrics using mimirtool

В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать статью.

Prometheus performance and cardinality in practice

В этой статье рассказано об оптимизации производительности Prometheus. Читать статью.
👍5
teletrace

Teletrace — это распределенная система трассировки с открытым исходным кодом, которая помогает разработчикам контролировать и устранять неполадки в сложных распределенных системах, обеспечивая сквозной мониторинг и трассировку транзакций в различных микросервисах. Teletrace опирается OpenTelemetry.

Репыч на Гитхабе.
🔥5
Приемы логирования в Kubernetes

В этой статье на Хабре описаны приемы логирования Kubernetes и практики работы с логами. Читать статью.
👍6
Grafana Tempo 2.2 release: TraceQL structural operators are here!

Главной фишкой нового релиза, безусловно, являются структурные операторы. Структурные операторы позволяют пользователю очень четко и лаконично искать сложные структурные условия в трассировках вызовов. Подробности в статье в блоге Grafana.
👍6
Сага в двух частях:

Наблюдаемость сетевой инфраструктуры Kubernetes. Часть первая

В этой статье рассмотрены инструменты наблюдения за сетевой инфраструктурой Kubernetes и основные составляющие Observability/Наблюдаемости – мониторинг, журналы событий, метрики, распределенная трассировка и оповещения.

Наблюдаемость сетевой инфраструктуры Kubernetes. Часть вторая

В этой статье разобраны инструменты, базирующиеся на ранее озвученных подходах (Service Mesh, eBPF monitoring и Distributed Tracing). Для сравнения решений будет выбран единый сценарий, при развёртывании которого собираются метрики приложения и кластера k8s.
👍3🔥2
What's new in distributed trace visualization in Grafana

В этой рассказано о нескольких усовершенствованиях, которые были недавно внесены в Grafana и которые направлены на облегчение поиска нужной информации и отсеивание ненужной. Читать статью.
Мониторинг Postgres по USE и RED

Есть две методологии перформанс мониторинга: USE (Utilization, Saturation, Errors) Брендана Грегга и RED (Requests, Errors, Durations) от Тома Уилки. В этой статье (она же расшифровка доклада Павла Труханова из Okmeter с PGConf.Russia) рассказано о том, как ориентироваться на эти методологии при реализации мониторинга Postgres. Читать статью.
👍9
openobserve

OpenObserve — это платформа наблюдаемости, созданная специально для работы с логами, метриками, трассировками и аналитикой в петабайтных масштабах.

Она очень проста и удобна в эксплуатации, в отличие от Elasticsearch. Использование OpenObserve позволяет сократить расходы на хранение логов в ~140 раз по сравнению с Elasticsearch.

Репыч на Гитхабе.
👎2
How to collect and query Kubernetes logs with Grafana Loki, Grafana, and Grafana Agent

В этой статье в блоге Grafana рассказано как можно централизовать сбор и анализ логов K8S при помощи Grafana Loki. Читать статью.
👍8
Основы парсинга на Python: от Requests до Selenium

В этой статье рассказано, как парсить данные веб-сайтов с помощью Python. Полезный инструментарий для мониторинга веб-ресурсов. Читать статью.
👍6🔥1
Building a Successful SRE Team

В этой статье описаны четыре урока, которые извлек автор, построивший успешную команду SRE:

⚡️Focus on Developer Training
⚡️Focus on the Right Abstractions
⚡️Focus on Self Service
⚡️Automate Yourself out of a job

Читать статью.
👍2
VictoriaMetrics: deploying a Kubernetes monitoring stack

В этой статье описаны интересные моменты развертывания полноценного мониторинга с помощью VictoriaMetrics Kubernetes Monitoring Stack. Читать статью.
👍3
Grafana Loki: performance optimization with Recording Rules, caching, and parallel queries

Статья о том, как оптимизировать производительность Loki. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍6
Статья компании Флант на Хабре с полезными ссылками на статьи по SRE, Kubernetes, базам данных и другим инструментам. Читать обзор.
👍6🔥3
Grafana: values ​​from records in Loki logs, and dual-Y-axes panels in Grafana

Статья с деталями по настройке дашбордов в Grafana на основе данных из Loki. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍4
Distributed Tracing Best Practices for 2023

В этой статье вы узнаете про лучшие практики распределенной трассировки запросов: что это и для чего нужно, компоненты и инструменты. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍31
Grafana 10.1 release: Enhanced flame graphs, new geomap network layer, and more

Вышла Grafana 10.1. В этой статье из блога Grafana вы узнаете о нововведениях. Каждый пункт сопровожден демонстрационным видео, чтобы быстро понять что же там обновилось. Читать статью.
👍4
Zabbix Roadmap и другие новости

Есть один способ заглянуть в будущее — посмотреть Zabbix Roadmap. Система активно развивается, появляются новые полезные фичи.

А ещё, в дополнение к 2 статьям по анализу данных вышла 3 часть — Zabbix in: exploratory data analysis rehearsal – Part 3. Вы узнаете про анализ асимметрии распределения на графиках — что говорит асимметрия о производительности приложения.

skewness(//net.tcp.service.perf[http,”{HOST.CONN}”,”{$NGINX.STUB_STATUS.PORT}”],1h:now/h)
6
Evaluating monitoring solutions; Prometheus, Thanos, Mimir, Victoria Metrics

В этой статье сравниваются Prometheus, Thanos, Mimir, Victoria Metrics по различным критериям. Полезно, если вы находитесь на этапе выбора. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍4👎1
2025/07/09 19:13:55
Back to Top
HTML Embed Code: