Telegram Web Link
Как работает самая популярная у дата саентистов модель машинного обучения

В этом материале автор расскажет про самую популярную у дата саентистов модель машинного обучения - градиентный бустинг.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Топ 5 мифов про Data Аналитику и в чем ее отличие от Data Science?

В этом ролике автор разоблачит 5 мифов о Data Аналитике и Data Science, а также разберется чем они отличаются друг от друга.

Смотреть это видео на youtube: youtu.be/Dcl_XCrNSu0

Секреты аналитики
Data Science: лучшие учебные курсы и программы сертификации

Можно получить два-три десятка Data Science-сертификатов, но по-настоящему стоящих программ сертификации из сферы науки о данных не так уж и много. В этом материале автор рассказывает о нескольких таких программах, поддерживаемых авторитетными организациями.

Секреты аналитики
PySpark для аналитика. Как правильно просить ресурсы и как понять, сколько нужно брать

Эта статья будет полезна аналитикам, дата-инженерам и специалистам по обработке больших данных, а также тимлидам команд, которые работают с Apache Spark для решения задач аналитики и машинного обучения. Вы узнаете, как правильно задавать параметры Spark-сессии, чтобы получить ресурсы.

Секреты аналитики
Неструктурированные данные: что это, в чем их опасность и как защититься?

Неструктурированные данные могут представлять собой текст, изображения, аудио- и видеозаписи, электронные письма и множество других форм. Это огромный массив ценной информации, но управление, анализ и обеспечение его безопасности вызывают сложности.

В этой статье автор рассмотрит значимость неструктурированных данных и опасности, которые они могут нести для компании, а также расскажет о том, что нужно делать, чтобы обеспечить их безопасность.

Секреты аналитики
Что в глубинах Data Lake?

На Хабр вышел отличный текст от технического руководителя Core Data Lake центра Big Data МТС о том, какие слои находятся внутри Data Lake, как построить архитектуру базы данных и чем распределенный Data Mesh-подход отличается от монолитного хранения данных.

В статье автор рассказал о задачах, архитектуре и проблемах развития Data lake, а также представил способы решения возникающих проблем, специфику процессов и перспективы развития.

Секреты аналитики
Хранилища данных. Обзор технологий и подходов к проектированию

В этой статье автор рассмотрит основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюцию архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.

Секреты аналитики
Как использовать аналитические инструменты для повышения конверсии на веб-сайте

Когда на ваш сайт ежедневно заходят тысячи пользователей, но до целевого действия доходит лишь малая часть - довольно грустно, особенно если показатели отказов далеки от средних показателей по рынку. Но почему так происходит? 95% ответа на подобный вопрос можно найти в данных: аналитические инструменты помогают увидеть поведение посетителей под микроскопом, найти проблемные места и принять решения для роста конверсии.

Секреты аналитики
От таблицы в Excel до собственного инструмента: как мы строили в VK Cloud решение для работы с внешними партнерами

Обмен данными между компаниями-партнерами при реализации совместных проектов — стандартная практика. Но часто есть сценарии, которые требуют особого подхода — например, из-за необходимости подстраивать формат отображения данных под специфику работы с информацией на стороне партнера.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Что такое визуализация данных?

00:00 Введение
00:44 Что такое визуализация данных
02:44 Примеры
05:08 Правила
07:02 Где учиться визуализации
09:48 Инструменты
10:55 Где следить за новостями
11:28 С чего начать

Смотреть это видео на youtube: youtu.be/Pjp1oKBqwxM

Секреты аналитики
PandasAI — кратно ускоряем работу аналитика данных в одну строчку

По сути PandasAI это LLM агент, который имеет доступ к Pandas. Агенту необходимо передать вопрос или указание на естественном языке, а он на основе данных найдет, построит диаграмму или преобразует данные.

Секреты аналитики
Основы теории вероятностей для будущих программистов и дата-аналитиков

Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.

Секреты аналитики
Разработка фреймворка для автоматизации загрузок данных из источников

Аналитика данных и витрины аналитики — источники аналитической отчетности, на основе которой принимаются стратегические управленческие решения. Однако на рынке нет готовых фреймворков, которые полностью удовлетворяют потребности в извлечении данных.

Секреты аналитики
Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

M42 — сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы. M42 — это часть единого аналитического продукта Trisigma, вторая его половина — платформа для A/B‑тестирования. Trisigma считает и визуализирует метрики в конкретных A/B‑экспериментах, а M42 помогает принимать решения глобально по продукту.

Секреты аналитики
Перспективы профессии Data Science: ликбез для джунов

В этой статье автор расскажет, какие возможности для развития в дата-сайенс есть сейчас и какие появятся в ближайшем будущем, а ещё подсветит неочевидные для новичков особенности работы дата-сайентиста.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
С чего стоит начать обучение Data Science?

В этом видео автор подробно разбирает с чего стоит начинать изучение Data Science и в какой именно последовательности. Вы узнаете основные темы, которые являются базисными, а также полезные ресурсы, где можно найти материал.

00:00 С чего начать обучение Data Science?
00:33 Python - основные темы и полезные ресурсы
01:27 Матанализ и Линейная алгебра
01:55 Методы оптимизации
02:03 Теория вероятности и Статистика
02:32 Методы машинного обучения
03:48 Чужой код на Github
04:15 Практика на Kaggle / Pet-project
05:25 Сколько в день нужно учиться?
05:49 Полная программа обучения

Смотреть это видео на youtube: youtu.be/hZQgOcyQNow

Секреты аналитики
Играем в GOLF: как обучить нейросети точно предсказывать геометрию молекул, используя малое число данных

Автор этой статьи учится предсказывать свойства молекул, привлекая для этого нейросети — так выходит сильно быстрее, чем с помощью традиционных квантовохимических пакетов. Но есть и обратная сторона медали: чтобы нейросеть точно предсказывала энергии молекул, ей нужно очень много данных. В данном материале автор расскажет, как можно ослабить это ограничение.

Секреты аналитики
Анализ тенденций в области антифрода: как технологии проверки личности меняются и совершенствуются

В современном мире антифрод — это скрытый, но ключевой элемент защиты как для крупных бизнесов, так и для небольших компаний. Некоторые платформы активно внедряют системы антифрода для обеспечения безопасности и доверия своим пользователям.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
SQL для Data-аналитика с нуля

Это отличное пошаговое руководство для новичков, которые хотят начать работу с SQL, ведь он востребован по всему миру уже более 50 лет. Вы не только освоите навык, но и узнаете о полезных сертификациях от Microsoft и разных способах монетизировать свои навыки анализа данных.

Смотреть это видео на youtube: youtu.be/-dLcaAlfCls

Секреты аналитики
Инфраструктура для data engineer S3

В этой статье автор расскажет о технологии S3 со стороны дата-инженерии. Вы рассмотрите как развернуть сервис, как им пользоваться и зачем он нужен в дата-инженерии.

Секреты аналитики
2025/06/28 19:14:08
Back to Top
HTML Embed Code: