Telegram Web Link
Как я по вечерам разрабатывал Statuser — платформу для мониторинга доступности приложений

statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.
Adaptive alerting: faster, better insights with the new metrics forecasting UI in Grafana Cloud

В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
Высшее на новом уровне: онлайн-магистратура от Яндекса и ИТМО. Здесь фундаментальные знания и практика для карьерного роста, а ещё — учёба, которую можно совмещать с работой и жизнью.

IT‑специальность с экспертизой Яндекса + диплом магистра гособразца = новая ступень в карьере. Приёмная кампания уже идёт!


Все подробности — на дне открытых дверей:
— Разбор совместной программы с ИТМО.
— Всё о формате прикладной онлайн-магистратуры: что взяли от классического высшего, а что добавили из опыта специалистов Яндекса.
— Общение с экспертами из вуза и ответы на вопросы.
— Всё про поступление: сроки, экзамены, документы, оплата и образовательный кредит.

▷ Ждём вас 26 июня в 19:00 мск.

→ Зарегистрироваться на встречу
VictoriaLogs Unleashed: Cluster Version Now Available for Exceptional, Linear Scaling

VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
Собираем трейс в Laravel и отправляем в Zipkin

В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
🚨 Предотвращение угрозы всегда дешевле, чем расследование инцидента и устранение его последствий 💥 Но сказать проще, чем сделать.

Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».

Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️  Что общего и разного у AppArmor, SeLinux, seccomp
▶️  Как NetworkPolicy относится к теме предотвращения
▶️  Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️  Как Luntry помогает предотвращать Runtime угрозы

Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC

Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться. 

РЕГИСТРАЦИЯ:
🤖 ТГ-Бот  |  🌐 Сайт + почта

#реклама
О рекламодателе
Сложности перехода к SRE

Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.
kl

Интерактивный просмотрщик журналов Kubernetes для терминала.

Репыч на Гитхабе
Please open Telegram to view this post
VIEW IN TELEGRAM
Готовы помочь начинающим специалистам?
Создайте курс для Яндекс Практикума!

Яндекс Практикум — сервис онлайн-образования, где получают навыки для старта и роста в IT. А наши эксперты — практикующие специалисты из разных сфер и компаний.

Сейчас мы в поиске автора курса «SRE инженер». Создание курса спокойно можно совмещать с основной работой благодаря удалёнке и нагрузке от 10 часов в неделю.
Авторы Яндекс Практикума напрямую влияют на развитие индустрии через написание обучающих и практических материалов для студентов.

Если вы хорошо понимаете подход SRE и имеете практический опыт внедрения SRE-практик, оставляйте отклик по ссылке
arkime

Arkime — это масштабируемая система анализа сети и захвата пакетов с открытым исходным кодом.

Репыч на Гитхабе
ElastAlert 2 на практике: как создать универсальное правило для мониторинга событий

Одной из ключевых задач при работе с Elastic Stack является настройка эффективной системы уведомлений. Это позволяет оперативно реагировать на происходящие события и минимизировать последствия сбоев или атак. В таком контексте фреймворк ElastAlert 2 представляет собой мощный инструмент, который значительно расширяет возможности встроенных уведомлений Elastic Stack, обеспечивая гибкость и детализацию алертов.

В этой статье автор рассказывает о том, какое одно универсальное правило для мониторинга событий в ElastAlert 2 охватывает все основные варианты условий срабатывания. Рассмотрено, как можно использовать ElastAlert 2 для расширения функциональности алертинга в Kibana и как интегрировать оба инструмента для более эффективного мониторинга событий. Читать дальше.
Жирные и тощие клиенты, многоразовый код, высокая математика… Все это — побочные эффекты плохого перевода ИТ-книг. Мы их лечим.

Мы — клуб книжных дебагеров КРОК, комьюнити рецензентов и переводчиков ИТ-литературы. За три года проверили больше 50 книг для издательств «Питер», «БХВ» и «Бомбора».

В клубе:
— рецензируем книги до релиза
— улучшаем переводы для крупнейших издательств России
— делимся болью, радостью и мемами по теме

Присоединяйся к @readitclub и участвуй в розыгрыше пака книжного дебагера 🎁
Please open Telegram to view this post
VIEW IN TELEGRAM
AlertCLI: Когда Alertmanager слишком серьёзен

AlertCLI — утилита для работы с Alertmanager, которая превращает страдания от мониторинга в менее мучительные страдания. Потому что давайте признаем: когда в 3 часа ночи звонит PagerDuty, хочется не решать проблемы, а решить того, кто их создал.

Описание на Хабре

Репыч на Гитхабе
Jaeger v2

Цель статьи показать на практике, как внедрить Jaeger в продукт на микросервисах. Ссылку на код всего, о чем пойдет речь дальше, можно найти в конце статьи.
Как настроить сложные маршруты сообщений за 10 минут?

Научитесь управлять потоком данных так, чтобы даже самые запутанные сценарии работали как часы!

Приглашаем на открытый урок «RabbitMQ. Как заставить сообщения летать по сложным маршрутам» посвященный курсу «RabbitMQ для разработчиков и администраторов»

Практика: Участники научатся настраивать сложные маршруты сообщений за 10 минут, избегать типичных ловушек и получат готовые шаблоны для своих проектов

👉 Регистрация на урок
https://tglink.io/286e9c8c68c7?erid=2W5zFJ7Utxg

#реклама
О рекламодателе
What is Observability 3.0?

То, что начиналось как разрозненные журналы, метрики и трассировки, превратилось в Observability 2.0 — унифицированный подход, который использует контекстно-обогащенные данные и стандартизированную телеметрию на базе OpenTelemetry. Читать дальше.

❗️Статья на medium.com
💬 Мы ничего не меняли, но всё сломалось

👆 Крупные компании больше не верят таким объяснениям. Они ищут инженеров, которые умеют не только чинить, но и предотвращать сбои — и готовы платить им на 35% больше. Потому что час простоя сервиса может стоить сотни тысяч, а специалист, который нашёл проблему до её появления — бесценен.

Учебный центр Слёрм запускает обучение, которое поможет вам стать таким специалистом. На курсе «Chaos Engineering» вы поймёте, как:

🔻 Находить слабые места системы до того, как они станут проблемой
🔻 Работать с инструментами для экспериментов (да, будем ломать — но осознанно)
🔻 Готовить план улучшений на основе тестов — чтобы система не падала на ровном месте.

Всё через практику, без воды, с опытными спикерами.

❗️Сейчас по промокоду LETO2025 на курс действует скидка 50%
*промокод вводится при оформлении оплаты

Успейте забрать обучение с выгодой и повысьте свою конкурентоспособность уже этим летом! Стартуем 14 июля.

➡️ Смотреть программу и занять место со скидкой
Faster incident response through distributed tracing: Inside Glovo's use of Traces Drilldown

Статья посвящена опыту использования в Glovo инструмента от Grafana — Traces Drilldown.
2025/07/04 00:45:07
Back to Top
HTML Embed Code: