Telegram Web Link
🤯 Грустный факт: 90% дата-сайентистов тратят больше времени на очистку данных, чем на сам анализ.

А знаете, что еще хуже? Даже после всей этой работы модель может не показать хороших метрик.

Когда последний раз вы:

— Объясняли, почему результаты модели зависят от качества данных, а не только от самой модели?
— Оптимизировали код, но модель всё равно не показывала нужных метрик и работала медленно?
— Тратили время на изучение нового инструмента, а он уже успел устареть?

Чтобы стать востребованным специалистом и быстро решать реальные проблемы DS, подписывайтесь на Библиотеку Data Science.

Там публикуют только годный контент:
→ Шпаргалки по работе с популярными библиотеками
→ Лайфхаки для оптимизации кода и моделей
→ Мемы, которые поймут только настоящие дата-сайентисты

➡️ Подписывайтесь, чтобы прокачать скиллы: @dsproglib

P.S. В закрепе канала — шпаргалка по структурированию проектов Data Science, которая сэкономит вам часы работы.

Реклама. ИП Дрёмов Артём Сергеевич. ИНН 771391651571. erid: 2VtzqvETn33
Please open Telegram to view this post
VIEW IN TELEGRAM
Введение в архитектурный фреймворк для анализа данных Lena

В этом материале автор расскажет об архитектурном фреймворке Lena, который сам разрабатывает. Архитектура определяет наиболее общее устройство программы и взаимодействие её компонентов. Lena как фреймворк реализует конкретную архитектуру для анализа данных и предоставляет пользователю классы и функции, которые могут быть при этом полезны.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Обзор интерфейса Power BI Desktop

В этом видеоуроке автор подробно рассматривает основные принципы интерфейса Power BI Desktop, а также разбирает подключение к источнику данных и загрузку в модель.

Смотреть это видео на youtube: youtu.be/hpNGX-wIQ9k

Секреты аналитики
Внедрение подхода «Self-Service» для самостоятельного анализа данных

Инструменты Business Intelligence (BI) за последние несколько лет проникли почти во все виды бизнеса, а изучению данных уделяется все больше внимания и выделяется больше ресурсов.

Секреты аналитики
Ускорение разведочного анализа данных с использованием библиотеки pandas-profiling

Первым делом, приступая к работе с новым набором данных, нужно понять его. Для того чтобы это сделать, нужно, например, выяснить диапазоны значений, принимаемых переменными, их типы, а также узнать о количестве пропущенных значений. Библиотека pandas предоставляет нам множество полезных инструментов для выполнения разведочного анализа данных (Exploratory Data Analysis).

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Python для начинающих аналитиков: Jupyter Notebook, методы, функции, аргументы

Это первый урок видеокурса, на котором вы с нуля узнаете как применять популярный язык программирования Python в работе с данными.

02:08 Зачем аналитику Python
03:10 Python — самый популярный язык программирования
09:48 Jupyter Notebook
13:46 Переменные, базовые концепции программирования
20:14 Типы данных
27:27 Операторы
40:47 Методы, функции, аргументы
58:04 Анализируем текст “Войны и мира”

Смотреть это видео на youtube: youtu.be/GQGaqrkV1s4

Секреты аналитики
ETL в анализе данных

Наблюдаемая все чаще и чаще картина в задаче анализа данных вызывает удручающее впечатление. Intel, AMD и другие производители непрерывно наращивают вычислительную мощность. Гениальные математики-программисты пишут суперэффективные библиотеки и алгоритмы. И вся эта мощь гасится и распыляется рядовыми аналитиками и разработчиками.

Секреты аналитики
Фича стор, CLTV и как построить много моделей в короткий срок

В этой статье автор расскажет, что такое CLTV, как от бизнес-постановки задачи перейти к задаче машинного обучения, какие при этом могут возникнуть проблемы и как их решать. А главное — что такое Feature Store и как этот инструмент помогает решить задачи СLTV.

Секреты аналитики
Отказоустойчивая распределённая архитектура для UX-аналитики

UX-аналитика – это сбор и анализ данных о взаимодействии пользователей с интерфейсом (клики, скроллы, навигация и прочие события). Такие события генерируются в огромных количествах, особенно при большой аудитории приложения. Чтобы эффективно обрабатывать эту информацию, необходима распределённая архитектура, способная масштабироваться под высокий поток событий и обеспечивать отказоустойчивость – т.е. работать надёжно даже при сбоях отдельных компонентов.

Секреты аналитики
Инди-геймдев и A/B тесты: совместить несовместимое

В текущих реалиях инди-геймдева каждый человек на вес золота и выделять для аналитики отдельного человека - расточительство. Вместе с тем, сфера аналитики как дремучей лес: мало информации, множество непонятных терминов и сложных вычислений. Однако это совершенно не мешает, чтобы грубо, как обезьяна, потыкать палкой в эту странную сферу и получить дополнительный вектор для развития проекта.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Обзор дашборда в Yandex DataLens

В этом видео автор подробно разбирает дашборд, созданный в Yandex DataLens на основе датасета Superstore.

00:18 Что такое Yandex DataLens?
00:29 Как начать работу в сервисе
06:44 Подготовка и настройка данных
08:57 Настройка отчетов и визуализации
14:12 Верстка дашборда
14:30 Добавление чартов
15:21 Добавление фильтра
17:38 Добавление страниц
17:46 Публикация и онлайн-доступ
18:23 Выводы и соответствие поставленной задаче

Смотреть это видео на youtube: youtu.be/wKz6rE9n0wY

Секреты аналитики
Изучаем Анализ данных с помощью библиотеки Bokeh в Python

Подходящая визуализация способна превратить сложные структуры данных в наглядные образы, позволяя нам видеть и понимать информацию на более глубоком уровне. В этом контексте библиотека Bokeh для Python выделяется как одно из наиболее мощных и гибких средств для визуализации данных.

Bokeh обеспечивает интерактивные и красочные графики, которые можно легко встраивать в веб-приложения и даже динамически изменять в режиме реального времени.

Секреты аналитики
Welch's test: он вам не замена Т-test'a

В этой статье автор расскажет про один из классических тестов в статистике – тест Уэлча (Welch’s Test). Он постарается максимально раскрыть, когда и где стоит применять данный тест и является ли он на самом деле тестом по умолчанию вместо t-test’a.

Секреты аналитики
Многоразовый шаблон логирования на Python для всех ваших приложений в Data Science

Идеальный способ отлаживать и отслеживать приложения — хорошо определённые, информативные и удобно структурированные логи. Они являются необходимым компонентом любого — малого, среднего или крупного — проекта на любом языке программирования, не только на Python.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Используем нейронные сети для предсказания цены акций

В этом ролике автор разбирает, как можно предсказать цену на акции компании Apple используя нейронные сети, а именно RNN (LSTM блок).

00:00 Введение
01:00 Обзор датасета с Kaggle
02:09 Анализ данных с использованием Pandas
08:16 Создание датасета для временного ряда
14:33 Обучение RNN модели с помощью Tensorflow

Смотреть это видео на youtube: youtu.be/LI94ZkjE_w4

Секреты аналитики
Математика для Data Scientist: необходимые разделы

Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по-настоящему глубоко анализировать и систематизировать огромные массивы данных.

Секреты аналитики
14 практических советов по использованию Tableau

Эта статья будет особенно полезна тем командам, которые только настраивают Tableau — некоторые из приёмов нужно сделать один раз и это сильно упростит жизнь.

Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Знакомство с Power Query

В этом видеоуроке автор познакомит вас с Power Query и разберет следующие вопросы:
— зачем нужен Power Query
— как его установить
— как его настроить
— как изменить запрос

Смотреть это видео на youtube: youtu.be/uLeO7nZ0axM

Секреты аналитики
Технические отличия BI систем (Power BI, Qlik Sense, Tableau)

Целью данной статьи является сравнение трёх ведущих BI платформ, которые находятся в лидерах квадранта Gartner:
— Power BI (Microsoft)
— Tableau
— Qlik

Секреты аналитики
Оценка эффективности бизнес-моделей через анализ данных: от ROI до стоимости привлечения клиентов

Бизнес стал невероятно динамичным и конкурентным. Компании постоянно сталкиваются с вызовами и возможностями, их бизнес-модели постоянно эволюционируют. Однако, чтобы преуспеть, предпринимателям и руководителям необходимо оценивать эффективность своих бизнес-моделей.

Секреты аналитики
2025/07/10 15:26:35
Back to Top
HTML Embed Code: