📊 Grafana: продвинутый уровень визуализации и алертинга
🔥 19 июня в 20:00 мск приглашаем на бесплатный вебинар «Grafana — продвинутое использование» с Анатолием Бенем.Это больше, чем графики — это визуальный интеллект вашей системы.
Что вас ждёт:
– переменные, шаблоны и динамические панели для гибкой визуализации,
– создание информативных дашбордов с PromQL и данными из Prometheus, Loki, Elasticsearch и других источников,
– настройка умных алертов и управление инцидентами,
– подключение плагинов, настройка авторизации, best practices для команд.
Узнайте, как превратить Grafana в мощный центр наблюдаемости, настроенный под вашу инфраструктуру.
👉 Регистрируйтесь по ссылке: https://otus.pw/p7Uw/?erid=2W5zFGAck7r
Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🔥 19 июня в 20:00 мск приглашаем на бесплатный вебинар «Grafana — продвинутое использование» с Анатолием Бенем.Это больше, чем графики — это визуальный интеллект вашей системы.
Что вас ждёт:
– переменные, шаблоны и динамические панели для гибкой визуализации,
– создание информативных дашбордов с PromQL и данными из Prometheus, Loki, Elasticsearch и других источников,
– настройка умных алертов и управление инцидентами,
– подключение плагинов, настройка авторизации, best practices для команд.
Узнайте, как превратить Grafana в мощный центр наблюдаемости, настроенный под вашу инфраструктуру.
👉 Регистрируйтесь по ссылке: https://otus.pw/p7Uw/?erid=2W5zFGAck7r
Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Митап для всех, кто хоть раз ронял прод
📍 19 июня | 17:30
Поговорим про опыт работы с Rust, разберемся, что делать с инфраструктурным зоопарком.
Будут живые дискуссии, дебаты и мерч за лучшую историю про инженерный провал :)
Регистрация по ссылке, оффлайн или онлайн: https://slc.tl/ggsx6
Чтобы не пропустить митап и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxQ3on6
📍 19 июня | 17:30
Поговорим про опыт работы с Rust, разберемся, что делать с инфраструктурным зоопарком.
Будут живые дискуссии, дебаты и мерч за лучшую историю про инженерный провал :)
Регистрация по ссылке, оффлайн или онлайн: https://slc.tl/ggsx6
Чтобы не пропустить митап и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxQ3on6
How to import Prometheus-style alerts and recording rules to Grafana-managed alerts and recording rules
Статья в блоге Grafana посвящена новой функциональности в Grafana 12, которая позволяет массово импортировать существующие файлы правил Prometheus, Grafana Loki или Grafana Mimir в оповещения и правила записи, управляемые Grafana, непосредственно через пользовательский интерфейс.
Статья в блоге Grafana посвящена новой функциональности в Grafana 12, которая позволяет массово импортировать существующие файлы правил Prometheus, Grafana Loki или Grafana Mimir в оповещения и правила записи, управляемые Grafana, непосредственно через пользовательский интерфейс.
Mastering the OpenTelemetry Transformation Language (OTTL)
Экосистема OpenTelemetry продолжает развиваться одновременно с другими мощными инструментами, которые улучшают стратегию наблюдения. Среди них — выделяется язык преобразования OpenTelemetry (OTTL), который обладает возможностями манипулирования и преобразования телеметрических данных.
В этой статье рассматривается, что такое OTTL, как он работает и как его можно использовать для максимального увеличения ценности данных о наблюдаемости с минимальными усилиями.
Экосистема OpenTelemetry продолжает развиваться одновременно с другими мощными инструментами, которые улучшают стратегию наблюдения. Среди них — выделяется язык преобразования OpenTelemetry (OTTL), который обладает возможностями манипулирования и преобразования телеметрических данных.
В этой статье рассматривается, что такое OTTL, как он работает и как его можно использовать для максимального увеличения ценности данных о наблюдаемости с минимальными усилиями.
«Изучаем OpenTelemetry: современный мониторинг систем»
OpenTelemetry сегодня – это отраслевой стандарт сбора и передачи данных телеметрии, а также набор инструментов, позволяющий интерпретировать подаваемые системой сигналы о своем состоянии. Основатели проекта Тед Янг и Остин Паркер создали руководство изучению OpenTelemetry для всех, кто хочет глубоко разобраться в наблюдаемости.
🔍 Что внутри?
– Настройка и диагностика OpenTelemetry.
– Лучшие практики наблюдаемости для Kubernetes, AWS Lambda и других облачных сервисов.
– Как инструментировать свои сервисы и библиотеки с
помощью OpenTelemetry.
📌 Для кого?
DevOps, SRE, бэкенд-разработчики и все, кто хочет вывести мониторинг на новый уровень.
Выведите мониторинг на новый уровень!
Ознакомиться с книгой на сайте издательства 📖
Реклама: ООО” МЕЙЛ ПЛЮС” ИНН 7802524386 ERID: 2VtzqumhF2W
OpenTelemetry сегодня – это отраслевой стандарт сбора и передачи данных телеметрии, а также набор инструментов, позволяющий интерпретировать подаваемые системой сигналы о своем состоянии. Основатели проекта Тед Янг и Остин Паркер создали руководство изучению OpenTelemetry для всех, кто хочет глубоко разобраться в наблюдаемости.
🔍 Что внутри?
– Настройка и диагностика OpenTelemetry.
– Лучшие практики наблюдаемости для Kubernetes, AWS Lambda и других облачных сервисов.
– Как инструментировать свои сервисы и библиотеки с
помощью OpenTelemetry.
📌 Для кого?
DevOps, SRE, бэкенд-разработчики и все, кто хочет вывести мониторинг на новый уровень.
Выведите мониторинг на новый уровень!
Ознакомиться с книгой на сайте издательства 📖
Реклама: ООО” МЕЙЛ ПЛЮС” ИНН 7802524386 ERID: 2VtzqumhF2W
Сказ Платформы про ученья: дата-центра отключение.
Жили-были в королевстве Ozon Tech мудрые и дальновидные инженеры Платформы. И решили они научиться так отключать один из ДЦ, чтобы ни трафинка не пригнулась, ни листик не шелохнулся, ни latency не подпрыгнуло.
20 июня этот сказочный митап можно увидеть своими глазами в Москве или онлайн. Главное — успеть зарегистрироваться.
Жили-были в королевстве Ozon Tech мудрые и дальновидные инженеры Платформы. И решили они научиться так отключать один из ДЦ, чтобы ни трафинка не пригнулась, ни листик не шелохнулся, ни latency не подпрыгнуло.
20 июня этот сказочный митап можно увидеть своими глазами в Москве или онлайн. Главное — успеть зарегистрироваться.
Обнаружение аномалий в данных временных рядов с помощью статистического анализа
Настройка оповещений для различных метрик не всегда представляет из себя тривиальную задачу. В некоторых случаях может быть вполне достаточно простого порогового значения, например, для отслеживания свободного места на диске устройства. Вы можете просто установить оповещение о том, что осталось 10% свободного места, и все готово. То же самое касается и мониторинга доступной памяти на сервере. Далее в переводе статьи на Хабре.
Настройка оповещений для различных метрик не всегда представляет из себя тривиальную задачу. В некоторых случаях может быть вполне достаточно простого порогового значения, например, для отслеживания свободного места на диске устройства. Вы можете просто установить оповещение о том, что осталось 10% свободного места, и все готово. То же самое касается и мониторинга доступной памяти на сервере. Далее в переводе статьи на Хабре.
На что способен GPU-сервер YADRO G4208P G3 c H100 NVL и RTX 4090 на борту
Какую платформу выбрать для решения конкретной ИИ-задачи? Нужны ли именно вам топовые H100 NVL или можно обойтись RTX 4090, которые в заводских условиях адаптированы для работы в GPU-сервере? Что такое NVLink и когда он нужен?
Инженеры из YADRO отвечают на эти и многие другие вопросы по итогам масштабного тестирования собственного GPU-сервера G4208P G3. Тесты проводились на десятке ИИ-моделей и бенчмарков, включая GPT-2 Андрея Карпаты на 1,6 млрд параметров и промышленный MLCommons.
Статья на Хабре →
Какую платформу выбрать для решения конкретной ИИ-задачи? Нужны ли именно вам топовые H100 NVL или можно обойтись RTX 4090, которые в заводских условиях адаптированы для работы в GPU-сервере? Что такое NVLink и когда он нужен?
Инженеры из YADRO отвечают на эти и многие другие вопросы по итогам масштабного тестирования собственного GPU-сервера G4208P G3. Тесты проводились на десятке ИИ-моделей и бенчмарков, включая GPT-2 Андрея Карпаты на 1,6 млрд параметров и промышленный MLCommons.
Статья на Хабре →
Configure and customize Kubernetes Monitoring easier with Alloy Operator
В helm chart Kubernetes Monitoring появилась возможность динамической настройки сбора данных телеметрии с помощью Alloy Operator. В этой стать в блоге Grafana рассказано об этом подробнее.
В helm chart Kubernetes Monitoring появилась возможность динамической настройки сбора данных телеметрии с помощью Alloy Operator. В этой стать в блоге Grafana рассказано об этом подробнее.
Migrating to ClickStack from Elastic
В этом руководстве описан подход к миграции с Elastic Stack на ClickStack. Фокус сделан на стратегии параллельной работы, которая минимизирует риск, используя сильные стороны ClickHouse в рабочих нагрузках наблюдаемости. Документация ClickHouse.
В этом руководстве описан подход к миграции с Elastic Stack на ClickStack. Фокус сделан на стратегии параллельной работы, которая минимизирует риск, используя сильные стороны ClickHouse в рабочих нагрузках наблюдаемости. Документация ClickHouse.
Как я по вечерам разрабатывал Statuser — платформу для мониторинга доступности приложений
statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.
statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.
Adaptive alerting: faster, better insights with the new metrics forecasting UI in Grafana Cloud
В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
Высшее на новом уровне: онлайн-магистратура от Яндекса и ИТМО. Здесь фундаментальные знания и практика для карьерного роста, а ещё — учёба, которую можно совмещать с работой и жизнью.
IT‑специальность с экспертизой Яндекса + диплом магистра гособразца = новая ступень в карьере. Приёмная кампания уже идёт!
Все подробности — на дне открытых дверей:
— Разбор совместной программы с ИТМО.
— Всё о формате прикладной онлайн-магистратуры: что взяли от классического высшего, а что добавили из опыта специалистов Яндекса.
— Общение с экспертами из вуза и ответы на вопросы.
— Всё про поступление: сроки, экзамены, документы, оплата и образовательный кредит.
▷ Ждём вас 26 июня в 19:00 мск.
→ Зарегистрироваться на встречу
IT‑специальность с экспертизой Яндекса + диплом магистра гособразца = новая ступень в карьере. Приёмная кампания уже идёт!
Все подробности — на дне открытых дверей:
— Разбор совместной программы с ИТМО.
— Всё о формате прикладной онлайн-магистратуры: что взяли от классического высшего, а что добавили из опыта специалистов Яндекса.
— Общение с экспертами из вуза и ответы на вопросы.
— Всё про поступление: сроки, экзамены, документы, оплата и образовательный кредит.
▷ Ждём вас 26 июня в 19:00 мск.
→ Зарегистрироваться на встречу
VictoriaLogs Unleashed: Cluster Version Now Available for Exceptional, Linear Scaling
VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
Три специальных технологических доклада на VK Cloud Conf 2025
26 июня пройдет ежегодная конференция VK Cloud Conf 2025, посвященная облачным технологиям.
В 17:30 начнется особенная часть конференции — технологический трек, на котором приглашенные эксперты расскажут:
🔹 как организовать доставку и обработку 1,5 млн событий в секунду,
🔹 перейти от арендованных ЦОДов к собственной инфраструктуре,
🔹 построить CDN VK под нагрузками в миллион запросов в секунду.
Темы докладов
🔹 Highload-логистика: как управлять потоком из 1,5 млн событий в секунду
Доклад про организацию доставки и обработки событий, возникающие проблемы и используемые инструменты.
Спикеры: Дмитрий Куколев, руководитель направления безопасности Runtime; Кирилл Назаров, руководитель группы DevOps, направление безопасности Runtime, блок «Информационная безопасность», VK.
🔹 Без единой точки отказа: путь к облаку на трех AZ и tier-4 ЦОДах
Опыт перехода к первым в России ЦОДам Tier-4.
Спикер: Николай Бутенко, директор по надежности сервисов VK Cloud, лучший спикер Highload++ 2024.
🔹 Много храним и быстро раздаем: как мы построили CDN VK под нагрузками в миллион запросов в секунду
Узнайте, как обслуживать миллионы запросов и раздавать десятки терабит в секунду.
Спикер: Дмитрий Радчук, руководитель группы граничных сервисов, департамент инфраструктурных сервисов VK.
Регистрируйтесь
26 июня пройдет ежегодная конференция VK Cloud Conf 2025, посвященная облачным технологиям.
В 17:30 начнется особенная часть конференции — технологический трек, на котором приглашенные эксперты расскажут:
🔹 как организовать доставку и обработку 1,5 млн событий в секунду,
🔹 перейти от арендованных ЦОДов к собственной инфраструктуре,
🔹 построить CDN VK под нагрузками в миллион запросов в секунду.
Темы докладов
🔹 Highload-логистика: как управлять потоком из 1,5 млн событий в секунду
Доклад про организацию доставки и обработки событий, возникающие проблемы и используемые инструменты.
Спикеры: Дмитрий Куколев, руководитель направления безопасности Runtime; Кирилл Назаров, руководитель группы DevOps, направление безопасности Runtime, блок «Информационная безопасность», VK.
🔹 Без единой точки отказа: путь к облаку на трех AZ и tier-4 ЦОДах
Опыт перехода к первым в России ЦОДам Tier-4.
Спикер: Николай Бутенко, директор по надежности сервисов VK Cloud, лучший спикер Highload++ 2024.
🔹 Много храним и быстро раздаем: как мы построили CDN VK под нагрузками в миллион запросов в секунду
Узнайте, как обслуживать миллионы запросов и раздавать десятки терабит в секунду.
Спикер: Дмитрий Радчук, руководитель группы граничных сервисов, департамент инфраструктурных сервисов VK.
Регистрируйтесь
Собираем трейс в Laravel и отправляем в Zipkin
В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
🚨 Предотвращение угрозы всегда дешевле, чем расследование инцидента и устранение его последствий 💥 Но сказать проще, чем сделать.
Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».
Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️ Что общего и разного у AppArmor, SeLinux, seccomp
▶️ Как NetworkPolicy относится к теме предотвращения
▶️ Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️ Как Luntry помогает предотвращать Runtime угрозы
Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC
Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться.
РЕГИСТРАЦИЯ:
🤖 ТГ-Бот | 🌐 Сайт + почта
#реклама
О рекламодателе
Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».
Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️ Что общего и разного у AppArmor, SeLinux, seccomp
▶️ Как NetworkPolicy относится к теме предотвращения
▶️ Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️ Как Luntry помогает предотвращать Runtime угрозы
Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC
Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться.
РЕГИСТРАЦИЯ:
🤖 ТГ-Бот | 🌐 Сайт + почта
#реклама
О рекламодателе
Сложности перехода к SRE
Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.
Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.