Telegram Web Link
📊 Grafana: продвинутый уровень визуализации и алертинга

🔥 19 июня в 20:00 мск приглашаем на бесплатный вебинар «Grafana — продвинутое использование» с Анатолием Бенем.Это больше, чем графики — это визуальный интеллект вашей системы.

Что вас ждёт:

– переменные, шаблоны и динамические панели для гибкой визуализации,
– создание информативных дашбордов с PromQL и данными из Prometheus, Loki, Elasticsearch и других источников,
– настройка умных алертов и управление инцидентами,
– подключение плагинов, настройка авторизации, best practices для команд.

Узнайте, как превратить Grafana в мощный центр наблюдаемости, настроенный под вашу инфраструктуру.

👉 Регистрируйтесь по ссылке: https://otus.pw/p7Uw/?erid=2W5zFGAck7r

Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Митап для всех, кто хоть раз ронял прод

📍 19 июня | 17:30

Поговорим про опыт работы с Rust, разберемся, что делать с инфраструктурным зоопарком.

Будут живые дискуссии, дебаты и мерч за лучшую историю про инженерный провал :)

Регистрация по ссылке, оффлайн или онлайн: https://slc.tl/ggsx6

Чтобы не пропустить митап и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxQ3on6
How to import Prometheus-style alerts and recording rules to Grafana-managed alerts and recording rules

Статья в блоге Grafana посвящена новой функциональности в Grafana 12, которая позволяет массово импортировать существующие файлы правил Prometheus, Grafana Loki или Grafana Mimir в оповещения и правила записи, управляемые Grafana, непосредственно через пользовательский интерфейс.
Mastering the OpenTelemetry Transformation Language (OTTL)

Экосистема OpenTelemetry продолжает развиваться одновременно с другими мощными инструментами, которые улучшают стратегию наблюдения. Среди них — выделяется язык преобразования OpenTelemetry (OTTL), который обладает возможностями манипулирования и преобразования телеметрических данных.

В этой статье рассматривается, что такое OTTL, как он работает и как его можно использовать для максимального увеличения ценности данных о наблюдаемости с минимальными усилиями.
«Изучаем OpenTelemetry: современный мониторинг систем»

OpenTelemetry сегодня – это отраслевой стандарт сбора и передачи данных телеметрии, а также набор инструментов, позволяющий интерпретировать подаваемые системой сигналы о своем состоянии. Основатели проекта Тед Янг и Остин Паркер создали руководство изучению OpenTelemetry для всех, кто хочет глубоко разобраться в наблюдаемости.

🔍 Что внутри?
– Настройка и диагностика OpenTelemetry.
– Лучшие практики наблюдаемости для Kubernetes, AWS Lambda и других облачных сервисов.
– Как инструментировать свои сервисы и библиотеки с
помощью OpenTelemetry.

📌 Для кого?
DevOps, SRE, бэкенд-разработчики и все, кто хочет вывести мониторинг на новый уровень.

Выведите мониторинг на новый уровень!
Ознакомиться с книгой на сайте издательства 📖

Реклама: ООО” МЕЙЛ ПЛЮС” ИНН 7802524386 ERID: 2VtzqumhF2W
Сказ Платформы про ученья: дата-центра отключение.

Жили-были в королевстве Ozon Tech мудрые и дальновидные инженеры Платформы. И решили они научиться так отключать один из ДЦ, чтобы ни трафинка не пригнулась, ни листик не шелохнулся, ни latency не подпрыгнуло.

20 июня этот сказочный митап можно увидеть своими глазами в Москве или онлайн. Главное — успеть зарегистрироваться.
Обнаружение аномалий в данных временных рядов с помощью статистического анализа

Настройка оповещений для различных метрик не всегда представляет из себя тривиальную задачу. В некоторых случаях может быть вполне достаточно простого порогового значения, например, для отслеживания свободного места на диске устройства. Вы можете просто установить оповещение о том, что осталось 10% свободного места, и все готово. То же самое касается и мониторинга доступной памяти на сервере. Далее в переводе статьи на Хабре.
На что способен GPU-сервер YADRO G4208P G3 c H100 NVL и RTX 4090 на борту

Какую платформу выбрать для решения конкретной ИИ-задачи? Нужны ли именно вам топовые H100 NVL или можно обойтись RTX 4090, которые в заводских условиях адаптированы для работы в GPU-сервере? Что такое NVLink и когда он нужен?

Инженеры из YADRO отвечают на эти и многие другие вопросы по итогам масштабного тестирования собственного GPU-сервера G4208P G3. Тесты проводились на десятке ИИ-моделей и бенчмарков, включая GPT-2 Андрея Карпаты на 1,6 млрд параметров и промышленный MLCommons.

Статья на Хабре →
Configure and customize Kubernetes Monitoring easier with Alloy Operator

В helm chart Kubernetes Monitoring появилась возможность динамической настройки сбора данных телеметрии с помощью Alloy Operator. В этой стать в блоге Grafana рассказано об этом подробнее.
Обновления К2 Облака – из первых рук

К2 Облако – облачная платформа собственной разработки, и с начала года команда K2 Cloud выпустила много новых сервисов.

24 июня подключайтесь к вебинару и узнайте от разработчиков, какие задачи решают обновления, как они работают и будут развиваться.

В программе

🔹Новый регион К2 Облака ru-spb: полноценная катастрофоустойчивость

🔹Сети: новый сервис Direct Connect, ALB

🔹Хранение данных: Elastic File System, сетевые нереплицируемые NVMe-диски

🔹Обновления PaaS: гибкое управление параметрами дисков, запуск сервисов по потребности, Kafka, ALB для Kubernetes

Спикеры

Владислав Одинцов
Техлид, Product Owner сетевых сервисов K2 Cloud

Олег Сидоренко
Разработчик команды сервисов хранения данных K2 Cloud

Александр Чернев
Старший инженер команды платформенной разработки K2 Cloud

📅 24 июня, 11:00

Подробности и регистрация >>
Migrating to ClickStack from Elastic

В этом руководстве описан подход к миграции с Elastic Stack на ClickStack. Фокус сделан на стратегии параллельной работы, которая минимизирует риск, используя сильные стороны ClickHouse в рабочих нагрузках наблюдаемости. Документация ClickHouse.
Как я по вечерам разрабатывал Statuser — платформу для мониторинга доступности приложений

statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.
📊 Хотите стать экспертом в Observability? Начните с теста!

Курс OTUS «Observability: мониторинг, логирование, трейсинг» — это практическое обучение работе с Prometheus, Grafana, ELK, Loki, Jaeger и другими инструментами. Вы научитесь строить отказоустойчивые системы мониторинга и логирования, настраивать алерты и визуализировать данные.

🔍 Пройдите вступительное тестирование, чтобы:

- Оценить свой текущий уровень знаний.
- Узнать, насколько вы готовы к курсу.

📅 Тест занимает около 30 минут. Результаты будут отправлены на вашу электронную почту. Повторное прохождение теста доступно через 3 дня.

👉 Пройти тестирование 
https://otus.pw/xTP5/?erid=2W5zFJT1quz

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Adaptive alerting: faster, better insights with the new metrics forecasting UI in Grafana Cloud

В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
Высшее на новом уровне: онлайн-магистратура от Яндекса и ИТМО. Здесь фундаментальные знания и практика для карьерного роста, а ещё — учёба, которую можно совмещать с работой и жизнью.

IT‑специальность с экспертизой Яндекса + диплом магистра гособразца = новая ступень в карьере. Приёмная кампания уже идёт!


Все подробности — на дне открытых дверей:
— Разбор совместной программы с ИТМО.
— Всё о формате прикладной онлайн-магистратуры: что взяли от классического высшего, а что добавили из опыта специалистов Яндекса.
— Общение с экспертами из вуза и ответы на вопросы.
— Всё про поступление: сроки, экзамены, документы, оплата и образовательный кредит.

▷ Ждём вас 26 июня в 19:00 мск.

→ Зарегистрироваться на встречу
VictoriaLogs Unleashed: Cluster Version Now Available for Exceptional, Linear Scaling

VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
Три специальных технологических доклада на VK Cloud Conf 2025

26 июня пройдет ежегодная конференция VK Cloud Conf 2025, посвященная облачным технологиям.

В 17:30 начнется особенная часть конференции — технологический трек, на котором приглашенные эксперты расскажут:
🔹 как организовать доставку и обработку 1,5 млн событий в секунду,
🔹 перейти от арендованных ЦОДов к собственной инфраструктуре,
🔹 построить CDN VK под нагрузками в миллион запросов в секунду.

Темы докладов

🔹 Highload-логистика: как управлять потоком из 1,5 млн событий в секунду


Доклад про организацию доставки и обработки событий, возникающие проблемы и используемые инструменты.

Спикеры: Дмитрий Куколев, руководитель направления безопасности Runtime; Кирилл Назаров, руководитель группы DevOps, направление безопасности Runtime, блок «Информационная безопасность», VK.

🔹 Без единой точки отказа: путь к облаку на трех AZ и tier-4 ЦОДах

Опыт перехода к первым в России ЦОДам Tier-4.

Спикер: Николай Бутенко, директор по надежности сервисов VK Cloud, лучший спикер Highload++ 2024.

🔹 Много храним и быстро раздаем: как мы построили CDN VK под нагрузками в миллион запросов в секунду

Узнайте, как обслуживать миллионы запросов и раздавать десятки терабит в секунду.

Спикер: Дмитрий Радчук, руководитель группы граничных сервисов, департамент инфраструктурных сервисов VK.

Регистрируйтесь
Собираем трейс в Laravel и отправляем в Zipkin

В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
🚨 Предотвращение угрозы всегда дешевле, чем расследование инцидента и устранение его последствий 💥 Но сказать проще, чем сделать.

Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».

Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️  Что общего и разного у AppArmor, SeLinux, seccomp
▶️  Как NetworkPolicy относится к теме предотвращения
▶️  Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️  Как Luntry помогает предотвращать Runtime угрозы

Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC

Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться. 

РЕГИСТРАЦИЯ:
🤖 ТГ-Бот  |  🌐 Сайт + почта

#реклама
О рекламодателе
Сложности перехода к SRE

Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.
2025/06/29 06:47:08
Back to Top
HTML Embed Code: