Как работает самая популярная у дата саентистов модель машинного обучения
В этом материале автор расскажет про самую популярную у дата саентистов модель машинного обучения - градиентный бустинг.
Секреты аналитики
В этом материале автор расскажет про самую популярную у дата саентистов модель машинного обучения - градиентный бустинг.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Топ 5 мифов про Data Аналитику и в чем ее отличие от Data Science?
В этом ролике автор разоблачит 5 мифов о Data Аналитике и Data Science, а также разберется чем они отличаются друг от друга.
Смотреть это видео на youtube: youtu.be/Dcl_XCrNSu0
Секреты аналитики
В этом ролике автор разоблачит 5 мифов о Data Аналитике и Data Science, а также разберется чем они отличаются друг от друга.
Смотреть это видео на youtube: youtu.be/Dcl_XCrNSu0
Секреты аналитики
Data Science: лучшие учебные курсы и программы сертификации
Можно получить два-три десятка Data Science-сертификатов, но по-настоящему стоящих программ сертификации из сферы науки о данных не так уж и много. В этом материале автор рассказывает о нескольких таких программах, поддерживаемых авторитетными организациями.
Секреты аналитики
Можно получить два-три десятка Data Science-сертификатов, но по-настоящему стоящих программ сертификации из сферы науки о данных не так уж и много. В этом материале автор рассказывает о нескольких таких программах, поддерживаемых авторитетными организациями.
Секреты аналитики
PySpark для аналитика. Как правильно просить ресурсы и как понять, сколько нужно брать
Эта статья будет полезна аналитикам, дата-инженерам и специалистам по обработке больших данных, а также тимлидам команд, которые работают с Apache Spark для решения задач аналитики и машинного обучения. Вы узнаете, как правильно задавать параметры Spark-сессии, чтобы получить ресурсы.
Секреты аналитики
Эта статья будет полезна аналитикам, дата-инженерам и специалистам по обработке больших данных, а также тимлидам команд, которые работают с Apache Spark для решения задач аналитики и машинного обучения. Вы узнаете, как правильно задавать параметры Spark-сессии, чтобы получить ресурсы.
Секреты аналитики
Неструктурированные данные: что это, в чем их опасность и как защититься?
Неструктурированные данные могут представлять собой текст, изображения, аудио- и видеозаписи, электронные письма и множество других форм. Это огромный массив ценной информации, но управление, анализ и обеспечение его безопасности вызывают сложности.
В этой статье автор рассмотрит значимость неструктурированных данных и опасности, которые они могут нести для компании, а также расскажет о том, что нужно делать, чтобы обеспечить их безопасность.
Секреты аналитики
Неструктурированные данные могут представлять собой текст, изображения, аудио- и видеозаписи, электронные письма и множество других форм. Это огромный массив ценной информации, но управление, анализ и обеспечение его безопасности вызывают сложности.
В этой статье автор рассмотрит значимость неструктурированных данных и опасности, которые они могут нести для компании, а также расскажет о том, что нужно делать, чтобы обеспечить их безопасность.
Секреты аналитики
Что в глубинах Data Lake?
На Хабр вышел отличный текст от технического руководителя Core Data Lake центра Big Data МТС о том, какие слои находятся внутри Data Lake, как построить архитектуру базы данных и чем распределенный Data Mesh-подход отличается от монолитного хранения данных.
В статье автор рассказал о задачах, архитектуре и проблемах развития Data lake, а также представил способы решения возникающих проблем, специфику процессов и перспективы развития.
Секреты аналитики
На Хабр вышел отличный текст от технического руководителя Core Data Lake центра Big Data МТС о том, какие слои находятся внутри Data Lake, как построить архитектуру базы данных и чем распределенный Data Mesh-подход отличается от монолитного хранения данных.
В статье автор рассказал о задачах, архитектуре и проблемах развития Data lake, а также представил способы решения возникающих проблем, специфику процессов и перспективы развития.
Секреты аналитики
Хранилища данных. Обзор технологий и подходов к проектированию
В этой статье автор рассмотрит основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюцию архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.
Секреты аналитики
В этой статье автор рассмотрит основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюцию архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.
Секреты аналитики
Как использовать аналитические инструменты для повышения конверсии на веб-сайте
Когда на ваш сайт ежедневно заходят тысячи пользователей, но до целевого действия доходит лишь малая часть - довольно грустно, особенно если показатели отказов далеки от средних показателей по рынку. Но почему так происходит? 95% ответа на подобный вопрос можно найти в данных: аналитические инструменты помогают увидеть поведение посетителей под микроскопом, найти проблемные места и принять решения для роста конверсии.
Секреты аналитики
Когда на ваш сайт ежедневно заходят тысячи пользователей, но до целевого действия доходит лишь малая часть - довольно грустно, особенно если показатели отказов далеки от средних показателей по рынку. Но почему так происходит? 95% ответа на подобный вопрос можно найти в данных: аналитические инструменты помогают увидеть поведение посетителей под микроскопом, найти проблемные места и принять решения для роста конверсии.
Секреты аналитики
От таблицы в Excel до собственного инструмента: как мы строили в VK Cloud решение для работы с внешними партнерами
Обмен данными между компаниями-партнерами при реализации совместных проектов — стандартная практика. Но часто есть сценарии, которые требуют особого подхода — например, из-за необходимости подстраивать формат отображения данных под специфику работы с информацией на стороне партнера.
Секреты аналитики
Обмен данными между компаниями-партнерами при реализации совместных проектов — стандартная практика. Но часто есть сценарии, которые требуют особого подхода — например, из-за необходимости подстраивать формат отображения данных под специфику работы с информацией на стороне партнера.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Что такое визуализация данных?
00:00 Введение
00:44 Что такое визуализация данных
02:44 Примеры
05:08 Правила
07:02 Где учиться визуализации
09:48 Инструменты
10:55 Где следить за новостями
11:28 С чего начать
Смотреть это видео на youtube: youtu.be/Pjp1oKBqwxM
Секреты аналитики
00:00 Введение
00:44 Что такое визуализация данных
02:44 Примеры
05:08 Правила
07:02 Где учиться визуализации
09:48 Инструменты
10:55 Где следить за новостями
11:28 С чего начать
Смотреть это видео на youtube: youtu.be/Pjp1oKBqwxM
Секреты аналитики
PandasAI — кратно ускоряем работу аналитика данных в одну строчку
По сути PandasAI это LLM агент, который имеет доступ к Pandas. Агенту необходимо передать вопрос или указание на естественном языке, а он на основе данных найдет, построит диаграмму или преобразует данные.
Секреты аналитики
По сути PandasAI это LLM агент, который имеет доступ к Pandas. Агенту необходимо передать вопрос или указание на естественном языке, а он на основе данных найдет, построит диаграмму или преобразует данные.
Секреты аналитики
Основы теории вероятностей для будущих программистов и дата-аналитиков
Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Секреты аналитики
Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Секреты аналитики
Разработка фреймворка для автоматизации загрузок данных из источников
Аналитика данных и витрины аналитики — источники аналитической отчетности, на основе которой принимаются стратегические управленческие решения. Однако на рынке нет готовых фреймворков, которые полностью удовлетворяют потребности в извлечении данных.
Секреты аналитики
Аналитика данных и витрины аналитики — источники аналитической отчетности, на основе которой принимаются стратегические управленческие решения. Однако на рынке нет готовых фреймворков, которые полностью удовлетворяют потребности в извлечении данных.
Секреты аналитики
Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице
M42 — сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы. M42 — это часть единого аналитического продукта Trisigma, вторая его половина — платформа для A/B‑тестирования. Trisigma считает и визуализирует метрики в конкретных A/B‑экспериментах, а M42 помогает принимать решения глобально по продукту.
Секреты аналитики
M42 — сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы. M42 — это часть единого аналитического продукта Trisigma, вторая его половина — платформа для A/B‑тестирования. Trisigma считает и визуализирует метрики в конкретных A/B‑экспериментах, а M42 помогает принимать решения глобально по продукту.
Секреты аналитики
Перспективы профессии Data Science: ликбез для джунов
В этой статье автор расскажет, какие возможности для развития в дата-сайенс есть сейчас и какие появятся в ближайшем будущем, а ещё подсветит неочевидные для новичков особенности работы дата-сайентиста.
Секреты аналитики
В этой статье автор расскажет, какие возможности для развития в дата-сайенс есть сейчас и какие появятся в ближайшем будущем, а ещё подсветит неочевидные для новичков особенности работы дата-сайентиста.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
С чего стоит начать обучение Data Science?
В этом видео автор подробно разбирает с чего стоит начинать изучение Data Science и в какой именно последовательности. Вы узнаете основные темы, которые являются базисными, а также полезные ресурсы, где можно найти материал.
00:00 С чего начать обучение Data Science?
00:33 Python - основные темы и полезные ресурсы
01:27 Матанализ и Линейная алгебра
01:55 Методы оптимизации
02:03 Теория вероятности и Статистика
02:32 Методы машинного обучения
03:48 Чужой код на Github
04:15 Практика на Kaggle / Pet-project
05:25 Сколько в день нужно учиться?
05:49 Полная программа обучения
Смотреть это видео на youtube: youtu.be/hZQgOcyQNow
Секреты аналитики
В этом видео автор подробно разбирает с чего стоит начинать изучение Data Science и в какой именно последовательности. Вы узнаете основные темы, которые являются базисными, а также полезные ресурсы, где можно найти материал.
00:00 С чего начать обучение Data Science?
00:33 Python - основные темы и полезные ресурсы
01:27 Матанализ и Линейная алгебра
01:55 Методы оптимизации
02:03 Теория вероятности и Статистика
02:32 Методы машинного обучения
03:48 Чужой код на Github
04:15 Практика на Kaggle / Pet-project
05:25 Сколько в день нужно учиться?
05:49 Полная программа обучения
Смотреть это видео на youtube: youtu.be/hZQgOcyQNow
Секреты аналитики
Играем в GOLF: как обучить нейросети точно предсказывать геометрию молекул, используя малое число данных
Автор этой статьи учится предсказывать свойства молекул, привлекая для этого нейросети — так выходит сильно быстрее, чем с помощью традиционных квантовохимических пакетов. Но есть и обратная сторона медали: чтобы нейросеть точно предсказывала энергии молекул, ей нужно очень много данных. В данном материале автор расскажет, как можно ослабить это ограничение.
Секреты аналитики
Автор этой статьи учится предсказывать свойства молекул, привлекая для этого нейросети — так выходит сильно быстрее, чем с помощью традиционных квантовохимических пакетов. Но есть и обратная сторона медали: чтобы нейросеть точно предсказывала энергии молекул, ей нужно очень много данных. В данном материале автор расскажет, как можно ослабить это ограничение.
Секреты аналитики
Анализ тенденций в области антифрода: как технологии проверки личности меняются и совершенствуются
В современном мире антифрод — это скрытый, но ключевой элемент защиты как для крупных бизнесов, так и для небольших компаний. Некоторые платформы активно внедряют системы антифрода для обеспечения безопасности и доверия своим пользователям.
Секреты аналитики
В современном мире антифрод — это скрытый, но ключевой элемент защиты как для крупных бизнесов, так и для небольших компаний. Некоторые платформы активно внедряют системы антифрода для обеспечения безопасности и доверия своим пользователям.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
SQL для Data-аналитика с нуля
Это отличное пошаговое руководство для новичков, которые хотят начать работу с SQL, ведь он востребован по всему миру уже более 50 лет. Вы не только освоите навык, но и узнаете о полезных сертификациях от Microsoft и разных способах монетизировать свои навыки анализа данных.
Смотреть это видео на youtube: youtu.be/-dLcaAlfCls
Секреты аналитики
Это отличное пошаговое руководство для новичков, которые хотят начать работу с SQL, ведь он востребован по всему миру уже более 50 лет. Вы не только освоите навык, но и узнаете о полезных сертификациях от Microsoft и разных способах монетизировать свои навыки анализа данных.
Смотреть это видео на youtube: youtu.be/-dLcaAlfCls
Секреты аналитики
Инфраструктура для data engineer S3
В этой статье автор расскажет о технологии S3 со стороны дата-инженерии. Вы рассмотрите как развернуть сервис, как им пользоваться и зачем он нужен в дата-инженерии.
Секреты аналитики
В этой статье автор расскажет о технологии S3 со стороны дата-инженерии. Вы рассмотрите как развернуть сервис, как им пользоваться и зачем он нужен в дата-инженерии.
Секреты аналитики