Incident management at major sporting goods e-commerce
В этой статье техническая команда Декатлона рассказывает как у них устроена работа с инцидентами.
«Одним из главных препятствий, с которыми мы столкнулись, было отсутствие классификации инцидентов. Без четкого метода категоризации и квалификации инцидентов было сложно эффективно вовлекать соответствующие команды с правильным приоритетом, когда они не знали уровень серьезности. Каждая проблема казалась уникальной, что усложняло координацию и разрешение.»
Читать статью
❗️Статья в блоге на Medium
В этой статье техническая команда Декатлона рассказывает как у них устроена работа с инцидентами.
«Одним из главных препятствий, с которыми мы столкнулись, было отсутствие классификации инцидентов. Без четкого метода категоризации и квалификации инцидентов было сложно эффективно вовлекать соответствующие команды с правильным приоритетом, когда они не знали уровень серьезности. Каждая проблема казалась уникальной, что усложняло координацию и разрешение.»
Читать статью
❗️Статья в блоге на Medium
Building an Observability Solution with ClickHouse
В этой серии статей рассказывают как при помощи OpenTelemetry, Clickhouse, Vector/FluentBit и Grafana создать систему наблюдаемости.
Part 1 - Logs
Part 2 - Traces
В этой серии статей рассказывают как при помощи OpenTelemetry, Clickhouse, Vector/FluentBit и Grafana создать систему наблюдаемости.
Part 1 - Logs
Part 2 - Traces
Grafana Loki query acceleration: How we sped up queries without adding resources
В этой статье техническая команда Grafana рассказывает как им удалось ускорить работу Loki и подсвечивает им в этом помогли n-граммы и фильтры Блума. Читать статью в блоге Grafana.
В этой статье техническая команда Grafana рассказывает как им удалось ускорить работу Loki и подсвечивает им в этом помогли n-граммы и фильтры Блума. Читать статью в блоге Grafana.
BPFAgent: eBPF for Monitoring at DoorDash
Мониторинг с помощью eBPF позволяет разработчикам писать программы, внедряемые непосредственно в ядро, и отслеживать операции ядра. Эти программы, разработанные для предоставления легкого доступа к большинству компонентов ядра, помещаются в песочницу и проверяются на безопасность ядром перед выполнением. DoorDash был заинтересован в отслеживании сетевого трафика с помощью хуков, называемых kprobes (динамическая трассировка ядра) и tracepoints. С помощью этих хуков можно перехватывать соединения TCP и UDP в кластерах Kubernetes. В статье разобран подход использования eBPF для мониторинга.
Мониторинг с помощью eBPF позволяет разработчикам писать программы, внедряемые непосредственно в ядро, и отслеживать операции ядра. Эти программы, разработанные для предоставления легкого доступа к большинству компонентов ядра, помещаются в песочницу и проверяются на безопасность ядром перед выполнением. DoorDash был заинтересован в отслеживании сетевого трафика с помощью хуков, называемых kprobes (динамическая трассировка ядра) и tracepoints. С помощью этих хуков можно перехватывать соединения TCP и UDP в кластерах Kubernetes. В статье разобран подход использования eBPF для мониторинга.
SLA vs SLO vs SLI: What’s the Difference?
Когда мы говорим о поддержании бесперебойной работы сервисов, мы часто слышим о SLA, SLO и SLI. Но что означают эти термины и чем они отличаются? SLA, или соглашения об уровне обслуживания, подобны обещаниям между поставщиком услуг и клиентом. Они описывают, чего клиент может ожидать с точки зрения качества обслуживания. В статье понятным образом разобраны отличия. Читать.
Когда мы говорим о поддержании бесперебойной работы сервисов, мы часто слышим о SLA, SLO и SLI. Но что означают эти термины и чем они отличаются? SLA, или соглашения об уровне обслуживания, подобны обещаниям между поставщиком услуг и клиентом. Они описывают, чего клиент может ожидать с точки зрения качества обслуживания. В статье понятным образом разобраны отличия. Читать.
Logdy - terminal logs in web browser
Смотрелка для логов в веб-интерфейсе. Удобно подсвечивает и фильтрует.
Репыч на Гитхабе
Смотрелка для логов в веб-интерфейсе. Удобно подсвечивает и фильтрует.
Репыч на Гитхабе
Anomaly Alerting in Prometheus
В этой статье я рассмотрено как использовать Prometheus с Istio для обнаружения аномалий во времени отклика служб. Читать статью.
В этой статье я рассмотрено как использовать Prometheus с Istio для обнаружения аномалий во времени отклика служб. Читать статью.
Organizing your Grafana k6 performance testing suite: Best practices to get started
В этой статье команда Grafana предлагает рекомендации по началу работы с Grafana k6 и делится списком лучших практик для организации тестирования производительности. Читать пост в блоге Grafana.
В этой статье команда Grafana предлагает рекомендации по началу работы с Grafana k6 и делится списком лучших практик для организации тестирования производительности. Читать пост в блоге Grafana.
Persistent Data Structures in VictoriaMetrics
Цель этой серии статей — дать представление о том, как VictoriaMetrics организует и оперирует данными на диске.
Постоянные структуры данных в VictoriaMetrics (часть 1): vmagent
Постоянные структуры данных в VictoriaMetrics (часть 2): vmselect
❗️Статьи в блоге на Medium
Цель этой серии статей — дать представление о том, как VictoriaMetrics организует и оперирует данными на диске.
Постоянные структуры данных в VictoriaMetrics (часть 1): vmagent
Постоянные структуры данных в VictoriaMetrics (часть 2): vmselect
❗️Статьи в блоге на Medium
Как мы Zabbix с MaxPatrol подружили
В этой статье рассказывают о решении, которое позволяет быстро уведомлять о найденных уязвимостях, формировать список этих уязвимостей и предоставлять дополнительную информацию о них. Читать на Хабре.
В этой статье рассказывают о решении, которое позволяет быстро уведомлять о найденных уязвимостях, формировать список этих уязвимостей и предоставлять дополнительную информацию о них. Читать на Хабре.
Observability using OpenSearch + Grafana
В статье рассказывается о настройке отображения данных OpenSearch в Grafana и настройке оповещений по этим данным напрямую из Grafana. Читать статью.
❗️Статья на Medium.com
В статье рассказывается о настройке отображения данных OpenSearch в Grafana и настройке оповещений по этим данным напрямую из Grafana. Читать статью.
❗️Статья на Medium.com
Дашборды в СКУД: визуализация данных для удобной аналитики на примере Grafana
В этой статье автор рассказывает, как с помощью Grafana визуализировать данные из СКУД и в целом, – об их ценности для бизнеса. В качестве базиса для статьи будет использован опыт работы автора с этим инструментом для аналитики работы демонстрационных зон продуктов компании на выставке Securika Moscow 2024. Читать на Хабре.
В этой статье автор рассказывает, как с помощью Grafana визуализировать данные из СКУД и в целом, – об их ценности для бизнеса. В качестве базиса для статьи будет использован опыт работы автора с этим инструментом для аналитики работы демонстрационных зон продуктов компании на выставке Securika Moscow 2024. Читать на Хабре.
Самый простой способ проверить работу веб-приложения под нагрузкой на примере JMeter и Grafana
В этой статье автор рассказывает о своём эксперименте с нагрузочным тестированием с помощью JMeter, Grafana и Prometheus, а также показывает, как тестировал три сценария: с двумя, 10 и 100 запросами в секунду. Читать на Хабре.
В этой статье автор рассказывает о своём эксперименте с нагрузочным тестированием с помощью JMeter, Grafana и Prometheus, а также показывает, как тестировал три сценария: с двумя, 10 и 100 запросами в секунду. Читать на Хабре.
Сколько денег вы теряете на инцидентах
Давайте разберёмся, зачем и как считать потери на инцидентах, можно ли делать это автоматически и как продать ценность расчётов бизнесу. Читать в статье на Хабр.
Давайте разберёмся, зачем и как считать потери на инцидентах, можно ли делать это автоматически и как продать ценность расчётов бизнесу. Читать в статье на Хабр.
Anomaly Alerting in Prometheus
В этой статье рассмотрено, как использовать Prometheus с Istio для обнаружения аномалий во времени отклика служб. Реализация будет достаточно общей, чтобы вы могли применить ее глобально ко всем службам, работающим в вашей сети. Вы сможете применить тот же шаблон практически к любой метрике скорости, которая вас интересует. Читать статью.
В этой статье рассмотрено, как использовать Prometheus с Istio для обнаружения аномалий во времени отклика служб. Реализация будет достаточно общей, чтобы вы могли применить ее глобально ко всем службам, работающим в вашей сети. Вы сможете применить тот же шаблон практически к любой метрике скорости, которая вас интересует. Читать статью.
Как подружить Zabbix с eXpress
Похоже, не такая уж это и тривиальная задача подружить Zabbix с импортозамещенным мессенджером eXpress, раз уж этому посвящена целая статья на Хабре.
Похоже, не такая уж это и тривиальная задача подружить Zabbix с импортозамещенным мессенджером eXpress, раз уж этому посвящена целая статья на Хабре.
Visualizing Nginx Access Logs using Timeplus and Grafana
Timeplus Proton расширяет функции обработки логов ClickHouse и возможности обработки исторических данных с помощью потоковых данных. Timeplus Proton имеет удобную функцию RANDOM STREAM, которую можно использовать для генерации всех данных логов доступа, необходимых для экспериментов в этой статье. Читать в статье.
❗️Статья на medum.com
Proton — это потоковый SQL-движок, быстрая и легкая альтернатива ksqlDB или Apache Flink, 🚀 работающая на ClickHouse. Подробнее о нем писал в канале @usr_bin_linux.
Репыч Proton на Гитхаб
Timeplus Proton расширяет функции обработки логов ClickHouse и возможности обработки исторических данных с помощью потоковых данных. Timeplus Proton имеет удобную функцию RANDOM STREAM, которую можно использовать для генерации всех данных логов доступа, необходимых для экспериментов в этой статье. Читать в статье.
❗️Статья на medum.com
Proton — это потоковый SQL-движок, быстрая и легкая альтернатива ksqlDB или Apache Flink, 🚀 работающая на ClickHouse. Подробнее о нем писал в канале @usr_bin_linux.
Репыч Proton на Гитхаб
The State of SQL-based Observability
В этой статье из блога Clickhouse ответ на вопрос «применима ли SQL-based Observability к вашему окружению».
В этой статье из блога Clickhouse ответ на вопрос «применима ли SQL-based Observability к вашему окружению».
Python Logging: From Basics to Advanced Practices
Логирование в Python — это важный навык для разработчиков всех уровней и надежный и универсальный способ отслеживания событий, отладки проблем и понимания поведения приложения. Это не просто полезно, но и необходимо для разработки надежного и поддерживаемого программного обеспечения. В этой статье разобраны подходы к журналированию на базе модулей logging, structlog и loguru. Читать статью.
❗️Статья на medium.com
Логирование в Python — это важный навык для разработчиков всех уровней и надежный и универсальный способ отслеживания событий, отладки проблем и понимания поведения приложения. Это не просто полезно, но и необходимо для разработки надежного и поддерживаемого программного обеспечения. В этой статье разобраны подходы к журналированию на базе модулей logging, structlog и loguru. Читать статью.
❗️Статья на medium.com
Towards Jaeger v2 💥💥💥 Moar OpenTelemetry!
Jaeger, популярная система распределенной трассировки, получила значительные обновления в предстоящем релизе Jaeger v2. В этой статье рассматриваются детали Jaeger v2, изучается его дизайн, функции и преимущества. Также обсуждается дорожная карта разработки и то, чего пользователи могут ожидать от нового релиза. Читать статью.
❗️Статья на medium.com
Jaeger, популярная система распределенной трассировки, получила значительные обновления в предстоящем релизе Jaeger v2. В этой статье рассматриваются детали Jaeger v2, изучается его дизайн, функции и преимущества. Также обсуждается дорожная карта разработки и то, чего пользователи могут ожидать от нового релиза. Читать статью.
❗️Статья на medium.com