Мониторим ИТ 1633

Мониторим ИТ

Incident management at major sporting goods e-commerce

В этой статье техническая команда Декатлона рассказывает как у них устроена работа с инцидентами.

«Одним из главных препятствий, с которыми мы столкнулись, было отсутствие классификации инцидентов. Без четкого метода категоризации и квалификации инцидентов было сложно эффективно вовлекать соответствующие команды с правильным приоритетом, когда они не знали уровень серьезности. Каждая проблема казалась уникальной, что усложняло координацию и разрешение.»

Читать статью

❗️Статья в блоге на Medium

3.6K views06:23

Мониторим ИТ

Building an Observability Solution with ClickHouse

В этой серии статей рассказывают как при помощи OpenTelemetry, Clickhouse, Vector/FluentBit и Grafana создать систему наблюдаемости.

Part 1 - Logs

Part 2 - Traces

5.5K views12:00

Мониторим ИТ

Grafana Loki query acceleration: How we sped up queries without adding resources

В этой статье техническая команда Grafana рассказывает как им удалось ускорить работу Loki и подсвечивает им в этом помогли n-граммы и фильтры Блума. Читать статью в блоге Grafana.

3.6K views16:00

Мониторим ИТ

BPFAgent: eBPF for Monitoring at DoorDash

Мониторинг с помощью eBPF позволяет разработчикам писать программы, внедряемые непосредственно в ядро, и отслеживать операции ядра. Эти программы, разработанные для предоставления легкого доступа к большинству компонентов ядра, помещаются в песочницу и проверяются на безопасность ядром перед выполнением. DoorDash был заинтересован в отслеживании сетевого трафика с помощью хуков, называемых kprobes (динамическая трассировка ядра) и tracepoints. С помощью этих хуков можно перехватывать соединения TCP и UDP в кластерах Kubernetes. В статье разобран подход использования eBPF для мониторинга.

3.7K views07:00

Мониторим ИТ

SLA vs SLO vs SLI: What’s the Difference?

Когда мы говорим о поддержании бесперебойной работы сервисов, мы часто слышим о SLA, SLO и SLI. Но что означают эти термины и чем они отличаются? SLA, или соглашения об уровне обслуживания, подобны обещаниям между поставщиком услуг и клиентом. Они описывают, чего клиент может ожидать с точки зрения качества обслуживания. В статье понятным образом разобраны отличия. Читать.

3.6K views12:00

Мониторим ИТ

Logdy - terminal logs in web browser

Смотрелка для логов в веб-интерфейсе. Удобно подсвечивает и фильтрует.

Репыч на Гитхабе

3.6K views07:00

Мониторим ИТ

Anomaly Alerting in Prometheus

В этой статье я рассмотрено как использовать Prometheus с Istio для обнаружения аномалий во времени отклика служб. Читать статью.

3.8K views12:00

Мониторим ИТ

Organizing your Grafana k6 performance testing suite: Best practices to get started

В этой статье команда Grafana предлагает рекомендации по началу работы с Grafana k6 и делится списком лучших практик для организации тестирования производительности. Читать пост в блоге Grafana.

4.3K views07:00

Мониторим ИТ

Persistent Data Structures in VictoriaMetrics

Цель этой серии статей — дать представление о том, как VictoriaMetrics организует и оперирует данными на диске.

Постоянные структуры данных в VictoriaMetrics (часть 1): vmagent

Постоянные структуры данных в VictoriaMetrics (часть 2): vmselect

❗️Статьи в блоге на Medium

6.8K views12:00

Мониторим ИТ

Как мы Zabbix с MaxPatrol подружили

В этой статье рассказывают о решении, которое позволяет быстро уведомлять о найденных уязвимостях, формировать список этих уязвимостей и предоставлять дополнительную информацию о них. Читать на Хабре.

4.3K views07:00

Мониторим ИТ

Observability using OpenSearch + Grafana

В статье рассказывается о настройке отображения данных OpenSearch в Grafana и настройке оповещений по этим данным напрямую из Grafana. Читать статью.

❗️Статья на Medium.com

4.5K views17:06

Мониторим ИТ

Дашборды в СКУД: визуализация данных для удобной аналитики на примере Grafana

В этой статье автор рассказывает, как с помощью Grafana визуализировать данные из СКУД и в целом, – об их ценности для бизнеса. В качестве базиса для статьи будет использован опыт работы автора с этим инструментом для аналитики работы демонстрационных зон продуктов компании на выставке Securika Moscow 2024. Читать на Хабре.

4.2K views06:30

Мониторим ИТ

Самый простой способ проверить работу веб-приложения под нагрузкой на примере JMeter и Grafana

В этой статье автор рассказывает о своём эксперименте с нагрузочным тестированием с помощью JMeter, Grafana и Prometheus, а также показывает, как тестировал три сценария: с двумя, 10 и 100 запросами в секунду. Читать на Хабре.

4.4K views12:11

Мониторим ИТ

Сколько денег вы теряете на инцидентах

Давайте разберёмся, зачем и как считать потери на инцидентах, можно ли делать это автоматически и как продать ценность расчётов бизнесу. Читать в статье на Хабр.

3.2K views16:01

Мониторим ИТ

Anomaly Alerting in Prometheus

В этой статье рассмотрено, как использовать Prometheus с Istio для обнаружения аномалий во времени отклика служб. Реализация будет достаточно общей, чтобы вы могли применить ее глобально ко всем службам, работающим в вашей сети. Вы сможете применить тот же шаблон практически к любой метрике скорости, которая вас интересует. Читать статью.

3.4K views07:00

Мониторим ИТ

Как подружить Zabbix с eXpress

Похоже, не такая уж это и тривиальная задача подружить Zabbix с импортозамещенным мессенджером eXpress, раз уж этому посвящена целая статья на Хабре.

3.2K views15:07

Мониторим ИТ

Visualizing Nginx Access Logs using Timeplus and Grafana

Timeplus Proton расширяет функции обработки логов ClickHouse и возможности обработки исторических данных с помощью потоковых данных. Timeplus Proton имеет удобную функцию RANDOM STREAM, которую можно использовать для генерации всех данных логов доступа, необходимых для экспериментов в этой статье. Читать в статье.

❗️Статья на medum.com

Proton — это потоковый SQL-движок, быстрая и легкая альтернатива ksqlDB или Apache Flink, 🚀 работающая на ClickHouse. Подробнее о нем писал в канале @usr_bin_linux.

Репыч Proton на Гитхаб

3.4K views07:00

Мониторим ИТ

The State of SQL-based Observability

В этой статье из блога Clickhouse ответ на вопрос «применима ли SQL-based Observability к вашему окружению».

3.3K views12:00

Мониторим ИТ

Python Logging: From Basics to Advanced Practices

Логирование в Python — это важный навык для разработчиков всех уровней и надежный и универсальный способ отслеживания событий, отладки проблем и понимания поведения приложения. Это не просто полезно, но и необходимо для разработки надежного и поддерживаемого программного обеспечения. В этой статье разобраны подходы к журналированию на базе модулей logging, structlog и loguru. Читать статью.

❗️Статья на medium.com

5.2K views07:00

Мониторим ИТ

Towards Jaeger v2 💥💥💥 Moar OpenTelemetry!

Jaeger, популярная система распределенной трассировки, получила значительные обновления в предстоящем релизе Jaeger v2. В этой статье рассматриваются детали Jaeger v2, изучается его дизайн, функции и преимущества. Также обсуждается дорожная карта разработки и то, чего пользователи могут ожидать от нового релиза. Читать статью.

❗️Статья на medium.com

3.1K views12:00

2025/07/07 09:32:41
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>