Best Practices for Monitoring and Improving Kafka Performance
Несколько советов по улучшению производительности и мониторингу Kafka. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
Несколько советов по улучшению производительности и мониторингу Kafka. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
🔥2
How to find unused Prometheus metrics using mimirtool
В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать статью.
Prometheus performance and cardinality in practice
В этой статье рассказано об оптимизации производительности Prometheus. Читать статью.
В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать статью.
Prometheus performance and cardinality in practice
В этой статье рассказано об оптимизации производительности Prometheus. Читать статью.
👍5
teletrace
Teletrace — это распределенная система трассировки с открытым исходным кодом, которая помогает разработчикам контролировать и устранять неполадки в сложных распределенных системах, обеспечивая сквозной мониторинг и трассировку транзакций в различных микросервисах. Teletrace опирается OpenTelemetry.
Репыч на Гитхабе.
Teletrace — это распределенная система трассировки с открытым исходным кодом, которая помогает разработчикам контролировать и устранять неполадки в сложных распределенных системах, обеспечивая сквозной мониторинг и трассировку транзакций в различных микросервисах. Teletrace опирается OpenTelemetry.
Репыч на Гитхабе.
🔥5
Приемы логирования в Kubernetes
В этой статье на Хабре описаны приемы логирования Kubernetes и практики работы с логами. Читать статью.
В этой статье на Хабре описаны приемы логирования Kubernetes и практики работы с логами. Читать статью.
👍6
Grafana Tempo 2.2 release: TraceQL structural operators are here!
Главной фишкой нового релиза, безусловно, являются структурные операторы. Структурные операторы позволяют пользователю очень четко и лаконично искать сложные структурные условия в трассировках вызовов. Подробности в статье в блоге Grafana.
Главной фишкой нового релиза, безусловно, являются структурные операторы. Структурные операторы позволяют пользователю очень четко и лаконично искать сложные структурные условия в трассировках вызовов. Подробности в статье в блоге Grafana.
👍6
Сага в двух частях:
Наблюдаемость сетевой инфраструктуры Kubernetes. Часть первая
В этой статье рассмотрены инструменты наблюдения за сетевой инфраструктурой Kubernetes и основные составляющие Observability/Наблюдаемости – мониторинг, журналы событий, метрики, распределенная трассировка и оповещения.
Наблюдаемость сетевой инфраструктуры Kubernetes. Часть вторая
В этой статье разобраны инструменты, базирующиеся на ранее озвученных подходах (Service Mesh, eBPF monitoring и Distributed Tracing). Для сравнения решений будет выбран единый сценарий, при развёртывании которого собираются метрики приложения и кластера k8s.
Наблюдаемость сетевой инфраструктуры Kubernetes. Часть первая
В этой статье рассмотрены инструменты наблюдения за сетевой инфраструктурой Kubernetes и основные составляющие Observability/Наблюдаемости – мониторинг, журналы событий, метрики, распределенная трассировка и оповещения.
Наблюдаемость сетевой инфраструктуры Kubernetes. Часть вторая
В этой статье разобраны инструменты, базирующиеся на ранее озвученных подходах (Service Mesh, eBPF monitoring и Distributed Tracing). Для сравнения решений будет выбран единый сценарий, при развёртывании которого собираются метрики приложения и кластера k8s.
👍3🔥2
What's new in distributed trace visualization in Grafana
В этой рассказано о нескольких усовершенствованиях, которые были недавно внесены в Grafana и которые направлены на облегчение поиска нужной информации и отсеивание ненужной. Читать статью.
В этой рассказано о нескольких усовершенствованиях, которые были недавно внесены в Grafana и которые направлены на облегчение поиска нужной информации и отсеивание ненужной. Читать статью.
Мониторинг Postgres по USE и RED
Есть две методологии перформанс мониторинга: USE (Utilization, Saturation, Errors) Брендана Грегга и RED (Requests, Errors, Durations) от Тома Уилки. В этой статье (она же расшифровка доклада Павла Труханова из Okmeter с PGConf.Russia) рассказано о том, как ориентироваться на эти методологии при реализации мониторинга Postgres. Читать статью.
Есть две методологии перформанс мониторинга: USE (Utilization, Saturation, Errors) Брендана Грегга и RED (Requests, Errors, Durations) от Тома Уилки. В этой статье (она же расшифровка доклада Павла Труханова из Okmeter с PGConf.Russia) рассказано о том, как ориентироваться на эти методологии при реализации мониторинга Postgres. Читать статью.
👍9
openobserve
OpenObserve — это платформа наблюдаемости, созданная специально для работы с логами, метриками, трассировками и аналитикой в петабайтных масштабах.
Она очень проста и удобна в эксплуатации, в отличие от Elasticsearch. Использование OpenObserve позволяет сократить расходы на хранение логов в ~140 раз по сравнению с Elasticsearch.
Репыч на Гитхабе.
OpenObserve — это платформа наблюдаемости, созданная специально для работы с логами, метриками, трассировками и аналитикой в петабайтных масштабах.
Она очень проста и удобна в эксплуатации, в отличие от Elasticsearch. Использование OpenObserve позволяет сократить расходы на хранение логов в ~140 раз по сравнению с Elasticsearch.
Репыч на Гитхабе.
👎2
How to collect and query Kubernetes logs with Grafana Loki, Grafana, and Grafana Agent
В этой статье в блоге Grafana рассказано как можно централизовать сбор и анализ логов K8S при помощи Grafana Loki. Читать статью.
В этой статье в блоге Grafana рассказано как можно централизовать сбор и анализ логов K8S при помощи Grafana Loki. Читать статью.
👍8
Основы парсинга на Python: от Requests до Selenium
В этой статье рассказано, как парсить данные веб-сайтов с помощью Python. Полезный инструментарий для мониторинга веб-ресурсов. Читать статью.
В этой статье рассказано, как парсить данные веб-сайтов с помощью Python. Полезный инструментарий для мониторинга веб-ресурсов. Читать статью.
👍6🔥1
Building a Successful SRE Team
В этой статье описаны четыре урока, которые извлек автор, построивший успешную команду SRE:
⚡️Focus on Developer Training
⚡️Focus on the Right Abstractions
⚡️Focus on Self Service
⚡️Automate Yourself out of a job
Читать статью.
В этой статье описаны четыре урока, которые извлек автор, построивший успешную команду SRE:
⚡️Focus on Developer Training
⚡️Focus on the Right Abstractions
⚡️Focus on Self Service
⚡️Automate Yourself out of a job
Читать статью.
👍2
VictoriaMetrics: deploying a Kubernetes monitoring stack
В этой статье описаны интересные моменты развертывания полноценного мониторинга с помощью VictoriaMetrics Kubernetes Monitoring Stack. Читать статью.
В этой статье описаны интересные моменты развертывания полноценного мониторинга с помощью VictoriaMetrics Kubernetes Monitoring Stack. Читать статью.
👍3
Grafana Loki: performance optimization with Recording Rules, caching, and parallel queries
Статья о том, как оптимизировать производительность Loki. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
Статья о том, как оптимизировать производительность Loki. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
👍6
Статья компании Флант на Хабре с полезными ссылками на статьи по SRE, Kubernetes, базам данных и другим инструментам. Читать обзор.
👍6🔥3
Grafana: values from records in Loki logs, and dual-Y-axes panels in Grafana
Статья с деталями по настройке дашбордов в Grafana на основе данных из Loki. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
Статья с деталями по настройке дашбордов в Grafana на основе данных из Loki. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
👍4
Distributed Tracing Best Practices for 2023
В этой статье вы узнаете про лучшие практики распределенной трассировки запросов: что это и для чего нужно, компоненты и инструменты. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
В этой статье вы узнаете про лучшие практики распределенной трассировки запросов: что это и для чего нужно, компоненты и инструменты. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
👍3❤1
Grafana 10.1 release: Enhanced flame graphs, new geomap network layer, and more
Вышла Grafana 10.1. В этой статье из блога Grafana вы узнаете о нововведениях. Каждый пункт сопровожден демонстрационным видео, чтобы быстро понять что же там обновилось. Читать статью.
Вышла Grafana 10.1. В этой статье из блога Grafana вы узнаете о нововведениях. Каждый пункт сопровожден демонстрационным видео, чтобы быстро понять что же там обновилось. Читать статью.
👍4
Zabbix Roadmap и другие новости
Есть один способ заглянуть в будущее — посмотреть Zabbix Roadmap. Система активно развивается, появляются новые полезные фичи.
А ещё, в дополнение к 2 статьям по анализу данных вышла 3 часть — Zabbix in: exploratory data analysis rehearsal – Part 3. Вы узнаете про анализ асимметрии распределения на графиках — что говорит асимметрия о производительности приложения.
Есть один способ заглянуть в будущее — посмотреть Zabbix Roadmap. Система активно развивается, появляются новые полезные фичи.
А ещё, в дополнение к 2 статьям по анализу данных вышла 3 часть — Zabbix in: exploratory data analysis rehearsal – Part 3. Вы узнаете про анализ асимметрии распределения на графиках — что говорит асимметрия о производительности приложения.
skewness(//net.tcp.service.perf[http,”{HOST.CONN}”,”{$NGINX.STUB_STATUS.PORT}”],1h:now/h)
Zabbix
Zabbix roadmap
Explore pending Zabbix features and get a view of what's to come.
❤6
Evaluating monitoring solutions; Prometheus, Thanos, Mimir, Victoria Metrics
В этой статье сравниваются Prometheus, Thanos, Mimir, Victoria Metrics по различным критериям. Полезно, если вы находитесь на этапе выбора. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
В этой статье сравниваются Prometheus, Thanos, Mimir, Victoria Metrics по различным критериям. Полезно, если вы находитесь на этапе выбора. Читать статью.
❗️Статья на Медиум, возможно, нужен VPN.
👍4👎1