Top 16 DevOps Tools for 2025: (Excellent for SREs, Too!)
В этой статье 16 инструментов, среди них:
🚀 Harness — платформа доставки программного обеспечения на основе искусственного интеллекта, разработанная для модернизации процессов DevOps.
🚀 Tekton — фреймворк с открытым исходным кодом для создания систем CI/CD, предлагающий гибкость и мощность для работы с различными средами развертывания и поставщиками облачных услуг, а также локально.
🚀 Argo CD — декларативный инструмент непрерывной доставки GitOps, разработанный для Kubernetes.
🚀 Dash0 — observability-платформа на базе OpenTelemetry, которая обеспечивает комплексное понимание приложений и инфраструктуры.
🚀 HyperDX — observability-платформа с открытым исходным кодом.
🚀 Crossplane — облачный фреймворк управления, который позволяет создавать собственные алгоритмы оркестрации без написания кода.
🚀 NGINX Unit — легкая и универсальная среда выполнения приложений с открытым исходным кодом, которая объединяет основные компоненты веб-приложений в один сервер.
🚀 Piku — платформа с открытым исходным кодом, которая позволяет пользователям развертывать приложения на своих серверах с помощью простых команд 'git push'.
🚀 SSOReady — сервис с открытым исходным кодом, которая упрощает реализацию единого входа (SSO) SAML для разработчиков.
..и другие.
❗️ Статья на medium.com
В этой статье 16 инструментов, среди них:
🚀 Harness — платформа доставки программного обеспечения на основе искусственного интеллекта, разработанная для модернизации процессов DevOps.
🚀 Tekton — фреймворк с открытым исходным кодом для создания систем CI/CD, предлагающий гибкость и мощность для работы с различными средами развертывания и поставщиками облачных услуг, а также локально.
🚀 Argo CD — декларативный инструмент непрерывной доставки GitOps, разработанный для Kubernetes.
🚀 Dash0 — observability-платформа на базе OpenTelemetry, которая обеспечивает комплексное понимание приложений и инфраструктуры.
🚀 HyperDX — observability-платформа с открытым исходным кодом.
🚀 Crossplane — облачный фреймворк управления, который позволяет создавать собственные алгоритмы оркестрации без написания кода.
🚀 NGINX Unit — легкая и универсальная среда выполнения приложений с открытым исходным кодом, которая объединяет основные компоненты веб-приложений в один сервер.
🚀 Piku — платформа с открытым исходным кодом, которая позволяет пользователям развертывать приложения на своих серверах с помощью простых команд 'git push'.
🚀 SSOReady — сервис с открытым исходным кодом, которая упрощает реализацию единого входа (SSO) SAML для разработчиков.
..и другие.
❗️ Статья на medium.com
OpenTelemetry, Prometheus, and More: Which Is Better for Metrics Collection and Propagation?
В статье разбирают бенчмаркинг трех коллекторов: Prometheus (в режиме агента), OpenTelemetry Collector и vmagent (легкий агент от VictoriaMetrics) для сбора данных с 1200 экспортеров узлов, разбросанных по 3 регионам. Узнать кто победил.
❗️Статья на Medium.
В статье разбирают бенчмаркинг трех коллекторов: Prometheus (в режиме агента), OpenTelemetry Collector и vmagent (легкий агент от VictoriaMetrics) для сбора данных с 1200 экспортеров узлов, разбросанных по 3 регионам. Узнать кто победил.
❗️Статья на Medium.
Grafana Drilldown apps: the improved queryless experience formerly known as the Explore apps
Речь про бывший Explore. В блоге Grafana рассказывают о новых возможностях этого интерефейса и упрощении работы с ним. Читать дальше.
Речь про бывший Explore. В блоге Grafana рассказывают о новых возможностях этого интерефейса и упрощении работы с ним. Читать дальше.
VictoriaLogs Source Reading
В этой статье рассматривается архитектура VictoriaLogs, основные компоненты и функции, включая механизмы хранения, индексирование, запросы и визуализацию данных, а также сравнивается с другими решениями по управлению логами. Читать статью.
В этой статье рассматривается архитектура VictoriaLogs, основные компоненты и функции, включая механизмы хранения, индексирование, запросы и визуализацию данных, а также сравнивается с другими решениями по управлению логами. Читать статью.
Мониторинг контейнеров с помощью cAdvisor
В этой статье рассмотрено, как с помощью cAdvisor можно отслеживать использование ресурсов контейнеров и их производительность.
В этой статье рассмотрено, как с помощью cAdvisor можно отслеживать использование ресурсов контейнеров и их производительность.
Observability Checklist. От железа до приложений, или как не остаться слепым в продакшене
Статья о том, какие метрики должны входить в контур мониторинга, чтобы чувствовать себя уверенно и ничего не пропустить.
Статья о том, какие метрики должны входить в контур мониторинга, чтобы чувствовать себя уверенно и ничего не пропустить.
Как мы автоматизировали сбор данных по проблемам производительности 1С для проведения диагностики в одном окне
В этой статье рассказывают как покрывать мониторингом 1С. Из знакомых интерфейсов увидел Kibana и Grafana. А что там работает под капотом осталось, к сожалению, за рамками статьи.
В этой статье рассказывают как покрывать мониторингом 1С. Из знакомых интерфейсов увидел Kibana и Grafana. А что там работает под капотом осталось, к сожалению, за рамками статьи.
Основы SNMP
SNMP — основной протокол мониторинга для сетевых устройств и другого физического оборудования. В этой статье разобраны принципы работы этого протокола и приведены примеры диагностики через утилиты командной строки.
SNMP — основной протокол мониторинга для сетевых устройств и другого физического оборудования. В этой статье разобраны принципы работы этого протокола и приведены примеры диагностики через утилиты командной строки.
Как я создавал Observability для своих pet-проектов. Часть 2
Часть 1 по ссылке.
В этой части разбирается настройка Observability на примере простого Golang-приложения, настройка в нём структурированных логов, распределённый трейсинг и метрики, а также интегрирация со стеком мониторинга.
Часть 1 по ссылке.
В этой части разбирается настройка Observability на примере простого Golang-приложения, настройка в нём структурированных логов, распределённый трейсинг и метрики, а также интегрирация со стеком мониторинга.
Set up Monitoring and Logging in a Docker Swarm Cluster
В этой статье рассмотрен процесс настройки системы мониторинга и логирования в кластере Docker Swarm. Настройка обеспечит кластеру наблюдаемость, а логи и показатели производительности будут визуализироваться в режиме реального времени. Инструменты, которые описаны в статье, включают: Docker Swarm, Traefik, Grafana, Prometheus, cAdvisor, Node Exporter, Loki, Promtail.
❗️Статья на medium.com
В этой статье рассмотрен процесс настройки системы мониторинга и логирования в кластере Docker Swarm. Настройка обеспечит кластеру наблюдаемость, а логи и показатели производительности будут визуализироваться в режиме реального времени. Инструменты, которые описаны в статье, включают: Docker Swarm, Traefik, Grafana, Prometheus, cAdvisor, Node Exporter, Loki, Promtail.
❗️Статья на medium.com
Grafana OnCall (OSS) — всё?
В своем блоге Grafana объявила о завершении поддержки этого продукта и перевод его в архив примерно через год. Что ж продукт был неоднозначным, непростым в развертывании и настройке. Сейчас весь функционал OnCall будет развиваться в рамках Grafana Cloud IRM (в облаке и за деньги). Они пишут, что поддержат решение сообщество, если кто-то захочет контрибьютить и поддерживать этот продукт.
Этим постом я хотел напомнить, что есть и другие интересные продукты для решения задач OnCall, например Keep.
Пользователи Grafana OnCall, расскажите в комментариях куда планируете переходит или вы уже находитесь в процессе перехода. Что вообще думаете про сложившуюся ситуацию?
В своем блоге Grafana объявила о завершении поддержки этого продукта и перевод его в архив примерно через год. Что ж продукт был неоднозначным, непростым в развертывании и настройке. Сейчас весь функционал OnCall будет развиваться в рамках Grafana Cloud IRM (в облаке и за деньги). Они пишут, что поддержат решение сообщество, если кто-то захочет контрибьютить и поддерживать этот продукт.
Этим постом я хотел напомнить, что есть и другие интересные продукты для решения задач OnCall, например Keep.
Пользователи Grafana OnCall, расскажите в комментариях куда планируете переходит или вы уже находитесь в процессе перехода. Что вообще думаете про сложившуюся ситуацию?
tailpipe
Утилита для селекта из логов. Есть готовые пресеты для обнаружения результатов, соответствующих MITRE ATT&CK. Работает локально, использует аналитику в памяти DuckDB и оптимизированное хранилище Parquet.
Репыч на Гитхабе
Утилита для селекта из логов. Есть готовые пресеты для обнаружения результатов, соответствующих MITRE ATT&CK. Работает локально, использует аналитику в памяти DuckDB и оптимизированное хранилище Parquet.
Репыч на Гитхабе
Nping
Поддерживает одновременный пинг для нескольких адресов, визуальное отображение задержки, отображает в реальном времени максимальную, минимальную, среднюю задержку, скорость потери пакетов и других показателей.
Репыч на Гитхабе
Поддерживает одновременный пинг для нескольких адресов, визуальное отображение задержки, отображает в реальном времени максимальную, минимальную, среднюю задержку, скорость потери пакетов и других показателей.
Репыч на Гитхабе
pgwatch
Утилита для мониторинга PostgreSQL с открытым исходным кодом. Работает в комплекте с Grafana.
Репыч на Гитхаб
Утилита для мониторинга PostgreSQL с открытым исходным кодом. Работает в комплекте с Grafana.
Репыч на Гитхаб
Why VictoriaLogs is a better alternative to Grafana Loki?
А вы как думаете почему? Не потому ли, что статью написал разработчик Victoria Logs? 🙃
В статье сравнивают Loki с ElasticSearch, а потом Loki с VictoriaLogs. И пока все выглядит так, что VL выигрывает по всем параметрам. Да, все доводы имеют под собой аргументы, но лучше всего проверить на +/- боевом потоке данных.
❗️статья на medium.com
А вы как думаете почему? Не потому ли, что статью написал разработчик Victoria Logs? 🙃
В статье сравнивают Loki с ElasticSearch, а потом Loki с VictoriaLogs. И пока все выглядит так, что VL выигрывает по всем параметрам. Да, все доводы имеют под собой аргументы, но лучше всего проверить на +/- боевом потоке данных.
❗️статья на medium.com
Open-source инструменты для визуализации данных
В статье рассмотрены D3.js, Apache Superset, Metabase, Grafana (куда ж без нее), Redash и RAWGraphs.
В статье рассмотрены D3.js, Apache Superset, Metabase, Grafana (куда ж без нее), Redash и RAWGraphs.
Prometheus Alerting 101: Rules, Recording Rules, and Alertmanager
В статье обсуждаются особенности работы Alertmanager относительно его компонентов.
Другие статьи цикла:
Counters, Gauges, Histograms & Summaries
Instant Queries and Range Queries Explained
В статье обсуждаются особенности работы Alertmanager относительно его компонентов.
Другие статьи цикла:
Counters, Gauges, Histograms & Summaries
Instant Queries and Range Queries Explained
💪 Качаем скиллы PostgreSQL!
10 апреля 2025 года пройдет бесплатное комьюнити-мероприятие из серии PG BootCamp Russia — конференция, направленная на приобретение практических навыков при работе с СУБД PostgreSQL.
🔵Программа рассчитана как на начинающих специалистов, так и на более опытных разработчиков, желающих углубить знания в части ядра и экосистемы продукта
🔵 Ведущие эксперты в области СУБД проведут мастер-классы и лекции по наиболее востребованным и интересным темам
🔵Для тех, кто не сможет присутствовать очно, предусмотрена онлайн-трансляция
🧑🎓 Все участники получат электронные сертификаты, подтверждающие приобретение новых знаний и навыков.
📌 Дата и время: 10 апреля, в 10:00 (по ЕКБ)
Формат: офлайн/онлайн
Место проведения: конгресс-отель «Екатеринбург»
✅ Зарегистрируйтесь сейчас и приготовьтесь к захватывающему путешествию в мир СУБД!
Реклама. ООО «ТАНТОР ЛАБС», ИНН 9701183207, erid 2VtzqwZcsef
10 апреля 2025 года пройдет бесплатное комьюнити-мероприятие из серии PG BootCamp Russia — конференция, направленная на приобретение практических навыков при работе с СУБД PostgreSQL.
🔵Программа рассчитана как на начинающих специалистов, так и на более опытных разработчиков, желающих углубить знания в части ядра и экосистемы продукта
🔵 Ведущие эксперты в области СУБД проведут мастер-классы и лекции по наиболее востребованным и интересным темам
🔵Для тех, кто не сможет присутствовать очно, предусмотрена онлайн-трансляция
🧑🎓 Все участники получат электронные сертификаты, подтверждающие приобретение новых знаний и навыков.
📌 Дата и время: 10 апреля, в 10:00 (по ЕКБ)
Формат: офлайн/онлайн
Место проведения: конгресс-отель «Екатеринбург»
✅ Зарегистрируйтесь сейчас и приготовьтесь к захватывающему путешествию в мир СУБД!
Реклама. ООО «ТАНТОР ЛАБС», ИНН 9701183207, erid 2VtzqwZcsef
eBPF вместо всего: почему это новая эра сетей, мониторинга и безопасности?
Раньше модификация Linux требовала пересборки ядра или использования дополнительных модулей. Но теперь есть eBPF — технология, которая позволяет программировать ядро на лету, не жертвуя стабильностью. Читать дальше.
Раньше модификация Linux требовала пересборки ядра или использования дополнительных модулей. Но теперь есть eBPF — технология, которая позволяет программировать ядро на лету, не жертвуя стабильностью. Читать дальше.
Deckhouse Prom++: добавили плюсы к Prometheus и сократили потребление памяти в 7,8 раза
Prometheus для хранения 1 миллиона метрик, собираемых раз в 30 секунд на протяжении 2 часов, требуются 500 МБ на диске и 5 ГБ памяти. Нам показалось, что это слишком много. Вместо этого хотелось получить «бесплатный» мониторинг, который не будет требовать значительных затрат на инфраструктуру.
Больше двух лет Флант работал над этой задачей. Её результатом стал Deckhouse Prom++. Это Open Source-система мониторинга, которой в среднем требуется в 7,8 раза меньше памяти и в 2,2 раза меньше ресурсов CPU, чем Prometheus v2.53. И здесь ещё есть пространство для оптимизации.
В статье они рассказали, как появилась идея Deckhouse Prom++, что уже получилось оптимизировать, какие результаты показывает решение по сравнению с Prometheus и VictoriaMetrics, а также о ближайших планах.
Репыч на Гитхабе
Prometheus для хранения 1 миллиона метрик, собираемых раз в 30 секунд на протяжении 2 часов, требуются 500 МБ на диске и 5 ГБ памяти. Нам показалось, что это слишком много. Вместо этого хотелось получить «бесплатный» мониторинг, который не будет требовать значительных затрат на инфраструктуру.
Больше двух лет Флант работал над этой задачей. Её результатом стал Deckhouse Prom++. Это Open Source-система мониторинга, которой в среднем требуется в 7,8 раза меньше памяти и в 2,2 раза меньше ресурсов CPU, чем Prometheus v2.53. И здесь ещё есть пространство для оптимизации.
В статье они рассказали, как появилась идея Deckhouse Prom++, что уже получилось оптимизировать, какие результаты показывает решение по сравнению с Prometheus и VictoriaMetrics, а также о ближайших планах.
Репыч на Гитхабе