📚Winning with Data Science — руководство для бизнес-лидеров цифровой эпохи

Авторы: Howard Steven Friedman и Akshay Swaminathan

🔍 О чём книга?

Книга Winning with Data Science — это не о том, как писать код на Python или строить нейросети. Это о том, как бизнесу получать реальную ценность от data science-проектов, даже если вы не технарь.
Авторы объясняют, как быть грамотным «заказчиком» аналитических решений: задавать правильные вопросы, понимать этапы data science-проекта, участвовать в формировании требований и оценке результатов.

💡 Ключевые идеи книги:

Data Science ≠ магия. Это инструмент для решения конкретных задач бизнеса, а не повод гнаться за хайпом.
Роль бизнеса — ключевая. Бизнес-заказчик должен чётко понимать проблему, ограничения и желаемый результат.
Важно задавать правильные вопросы. Не «какой алгоритм лучше?», а «поможет ли это достичь цели в срок и в бюджет?».
Технические навыки — не обязательны. Но базовые знания о данных, типах моделей, хранении, качествах и возможностях — желательны.
Этика — не в последнюю очередь. Модели не должны закреплять предвзятости или дискриминировать.

🧠 Кому будет полезна:

Руководителям, внедряющим аналитику
Продакт-менеджерам и основателям стартапов
Маркетологам и финансовым директорам
Всем, кто хочет эффективно взаимодействовать с data science-командами

🤔Обобщенный вывод:
Эта книга — мост между бизнесом и аналитиками. Без перегруза терминами, но с глубоким пониманием процессов.
🎓 Как студенты используют ИИ в университете — реальное исследование от Anthropic на 1 000 000 сессий

ИИ всё больше проникает в образование, но большинство обсуждений до сих пор строились на опросах и лабораторных экспериментах. В новом отчёте команда Anthropic провела одно из крупнейших исследований реального использования ИИ студентами, проанализировав более 1 миллиона анонимизированных диалогов с Claude.ai.

🤔 Кто использует ИИ чаще всего?

Студенты компьютерных наук — вне конкуренции: они составляют 36,8% всех разговоров с Claude, хотя по факту это только 5,4% выпускников США.
STEM-дисциплины в целом доминируют — студенты естественных наук, математики и инженерии используют ИИ гораздо активнее, чем студенты бизнеса, медицины или гуманитарных наук.
Бизнес составляет почти 19% всех дипломов, но лишь 8,9% всех ИИ-сессий. Аналогичная картина в здравоохранении и гуманитарной сфере.

🤔 Зачем студенты обращаются к ИИ: самые популярные запросы

Создание и редактирование учебных материалов — 39,3%
Решение заданий, кодинг, объяснение теории — 33,5%
Анализ и визуализация данных — 11%
Помощь в исследованиях и разработке инструментов — 6,5%
Переводы, корректура, создание диаграмм — оставшиеся проценты.

🤔Как именно студенты взаимодействуют с ИИ?

Прямое решение задач
Прямое создание контента
Совместное решение задач
Совместное создание контента

💡Интересно, что все 4 типа встречаются примерно одинаково часто (по 23–29%).

⚠️ Вопрос академической честности и мышления

Исследование показало, что Claude в разговорах со студентами чаще всего выполняет высокоуровневые когнитивные функции по таксономии Блума:

Создание — 39,8%
Анализ — 30,2%
Применение, понимание и запоминание — намного реже

⚡️ Все это переворачивает привычную "пирамиду Блума" с ног на голову — и вызывает беспокойство: не начинают ли студенты слишком рано "делегировать" ИИ важнейшие мыслительные операции?

💡Данное исследование — только начало большого пути, но уже даёт массу материала для размышлений преподавателям, студентам и администраторам вузов.

💻Полный текст статьи здесь
🌍 Geospatial Reasoning от Google: ИИ, который понимает геоданные — и решает реальные проблемы

Что если бы ИИ не просто "видел" спутниковые снимки, но и понимал, что на них происходит? Google запустил новый масштабный проект Geospatial Reasoning, объединяющий мощные foundation-модели и генеративный ИИ для ускоренного анализа геопространственных данных. Речь идёт не о теории — а о реальных сценариях: от оценки ущерба после урагана до улучшения городского планирования и климатической адаптации.

🔎 Что под капотом Geospatial Reasoning?

Population Dynamics Foundation Model (PDFM) — модель, которая моделирует поведение населения и взаимодействие с окружающей средой;
Модель мобильности по траекториям — для отслеживания и анализа перемещений;
Новые foundation-модели для удалённого зондирования — обученные на огромном массиве спутниковых и аэрофотоснимков с аннотациями.

🧠 Как это работает?

Проект Geospatial Reasoning позволяет объединять возможности моделей Google с вашими собственными данными и создавать агентные рабочие процессы. Пример: после урагана система может:
Сравнить снимки «до» и «после»,
Определить, какие здания повреждены,
Рассчитать предполагаемый экономический ущерб,
Оценить социальную уязвимость пострадавших районов,
Сформировать приоритеты для оказания помощи

🚀 Кто уже подключился?

Airbus — планирует использовать модели для быстрого анализа триллионов пикселей спутниковых данных;
Maxar — интегрирует foundation-модели в свою "живую карту Земли";
Planet Labs — ускоряет извлечение геоинсайтов для бизнеса и госструктур;
WPP (Choreograph) — использует PDFM для усиления медиа-аналитики на основе поведенческих паттернов

📌 Почему это важно?

Геоданные — это один из самых сложных и потенциально полезных классов информации. Их много, они разнородные и часто требуют высокой экспертизы для анализа.

💻Подробнее в этой статье
😎Топ поисковиков датасетов и хранилищ данных

Google Dataset Search - открывает доступ к бесплатным публичным наборам данных. Вы можете выбрать данные по различным темам и в различных форматах, включая .pdf, .csv, .jpg, .txt и другие. Использовать его так же просто, как обычный поиск в Google: просто введите название или тему, которая вас интересует, в строку поиска. По мере ввода система будет предлагать наборы данных с нужными ключевыми словами — вы можете случайно наткнуться на что-то новое и интересное.

World Bank Open Data - открытые данные Всемирного банка считаются одними из самых обширных и разнообразных источников статистической информации и публичных наборов данных. Вы можете искать данные по различным категориям. Особенность сайта Всемирного банка — бесплатные ресурсы и инструменты для общественного пользования, например Data Bank — удобный инструмент для анализа и визуализации больших наборов данных

Data.world - на этой платформе можно получить доступ к бесплатным наборам данных, а также работать с ними прямо на сайте. Всё, что нужно — создать бесплатный аккаунт, после чего вам станут доступны 3 бесплатных проекта. При необходимости можно перейти на платные тарифы с большим объёмом хранилища. С помощью строки поиска вы можете находить ключевые слова, ресурсы, организации или пользователей. А для более точного поиска можно воспользоваться кнопкой «Create advanced filter» (создать расширенный фильтр), чтобы найти именно то, что нужно.

DataHub — это платформа для публикации данных (SaaS), разработанная компанией Datopian, где вы можете просматривать одну из самых разнообразных коллекций публичных наборов данных, организованных по темам. На платформе также есть блог с материалами на темы, связанные с Big Data Science.

Humanitarian Data Exchange - платформа для поиска датасетов. Здесь вы можете искать бесплатные наборы данных и фильтровать результаты по таким критериям, как местоположение, формат, организация и лицензия. Платформа также позволяет делиться данными по различным категориям.

UCI Machine Learning Repository - наименее обширный из всех упомянутых ресурсов, он остаётся полезным для тех, кто хочет построить модель машинного обучения. Несмотря на ограниченное количество наборов данных, здесь также можно искать данные по типу задачи, типу атрибутов, формату данных и области применения.

Academic Torrents - если вы занимаетесь научной работой, пишете статью или магистерскую диссертацию, то Academic Torrents станет отличным помощником. Платформа предлагает разнообразные крупные наборы данных из научных публикаций — некоторые из них достигают объёма 2 терабайта. Пользоваться Academic Torrents очень просто: вы можете искать датасеты, статьи, курсы и коллекции, а также загружать свои собственные данные, чтобы другие могли с ними работать. Наборы данных предоставляются бесплатно, но для их загрузки вам понадобится торрент-клиент, установленный на вашем устройстве.
👍2
Media is too big
VIEW IN TELEGRAM
😱Китай задаёт темп в медицинских технологиях

🤖 Роботы в белых халатах

В крупнейших клиниках Китая трудятся десятки медицинских роботов. Они не только дезинфицируют и доставляют лекарства, но и выполняют сложные процедуры:
📌 В больнице Zhongshan при Фуданьском университете робот-флеботомист берёт кровь точнее человека

🧠 ИИ — не ассистент, а полноценный врач

Китай открыл первую в мире AI-больницу, где пациентов консультируют «виртуальные доктора»
⚙️ Система ведёт приём 24/7, анализирует симптомы, ставит предварительные диагнозы и даже назначает лечение.
🔬 Сотни тысяч консультаций в месяц — без усталости и человеческого фактора

🌏 Медтех на экспорт

Китайские роботы и AI-системы уже работают в клиниках Азии, Африки и Латинской Америки.
Ведутся переговоры с Евросоюзом и Ближним Востоком.

🔮 Что это значит?

Китай превращает медицину из перегруженной системы в высокотехнологичный, человекоцентричный сервис. Будущее медицины уже наступило. И оно — made in China😁
👍2🔥2🤯1
💡X-AnyLabeling — профессиональный ИИ-инструмент для автоматической разметки данных

X-AnyLabeling — это расширенная и улучшенная версия популярного open-source проекта AnyLabeling, созданная для индустриального применения. Благодаря поддержке ИИ и десятков моделей CV, инструмент делает разметку в разы быстрее и точнее, чем вручную.

💡 Что умеет X-AnyLabeling:
🔹 Автоматическая и полуавтоматическая аннотация изображений и видео
🔹 Поддержка 20+ моделей компьютерного зрения: YOLO, SAM, DETR и др.
🔹 Работа с видео в реальном времени — включая трекинг объектов на потоках
🔹 Интуитивно понятный интерфейс + режим коллаборации
🔹 Экспорт/импорт в все ключевые форматы аннотаций: COCO, VOC, YOLO, LabelMe и другие

🔧 Для кого:
ML-инженеры и команды CV-проектов
Аналитики данных
Исследователи, работающие с медицинскими изображениями, беспилотниками, безопасностью и др.
Компании, создающие коммерческие датасеты
👍6
🌎ТОП майских ивентов в Data Science

14 мая - Linkmeetup. Митап от IT для IT – Москва, Россия - https://linkmeetup.ru/
14 мая - AI да Governance by RPPA.pro – Москва, Россия - https://rppa-pro.timepad.ru/event/3320126/
16 мая - Ural BIM Community 2025 – Екатеринбург, Россия - https://www.ubc-conf.ru/
16-17 мая - IML 2025 - Санкт-Петербург, Россия - https://imlconf.com/
24 мая – 1 июня - Data Fest 2025 – Онлайн - https://ods.ai/events/datafest2025
26-27 мая - TECH WEEK 2025 – Москва, Россия - https://techweek.moscow/
28 мая - Data&ML2Business – Москва, Россия - https://yandex.cloud/ru/events/dataml2b/
28 мая - Data & BI Bridge - Санкт-Петербург, Россия - https://bi.conteq.ru/data-bi-bridge-2025
👍4
🔍 5 полезных сервисов для аналитиков данных, которые стоит использовать:

Каждому профессионалу в области Data Science важно использовать передовые инструменты, чтобы оставаться на гребне волны. В этом посте — 5 сервисов, которые могут существенно повысить эффективность работы.

1️⃣ DataRobot — Платформа, которая помогает автоматизировать процессы создания и оптимизации моделей машинного обучения, позволяя даже новичкам быстро внедрять решения для анализа данных.

2️⃣ Hugging Face — Репозиторий и инструменты для работы с моделями NLP и трансформерами. Незаменим для обработки текстовых данных.

3️⃣ RapidMiner — Инструмент для автоматизации процессов анализа данных с минимальными затратами времени. Он включает в себя мощные функции для моделирования и визуализации.

4️⃣ Kaggle Kernels — Платформа для обучения и соревнований, которая предоставляет доступ к большому количеству данных и возможности для работы в облаке.

5️⃣ Neptune.ai — Платформа для отслеживания и визуализации экспериментов с моделями машинного обучения. Идеально подходит для команд, работающих над сложными проектами.

💡 Почему это важно?
Эти инструменты помогают аналитикам и исследователям сэкономить время на рутинных задачах и быстрее достигать нужных результатов. Инвестирование в современные сервисы становится важным фактором для повышения продуктивности в Data Science.
👍1
🔹Qwen 3: Китайский ИИ нового поколения

🧠 Гибридное мышление и масштабируемость
Qwen 3 — это третье поколение больших языковых моделей от Alibaba, разработанное с акцентом на гибридное мышление. Модель сочетает в себе способности к логическим рассуждениям и генерации контента, что делает её универсальным инструментом для различных задач. Qwen 3 доступна в различных конфигурациях, включая как плотные модели (от 0.6B до 32B параметров), так и разреженные модели (до 235B параметров), что обеспечивает гибкость в зависимости от потребностей пользователей.

🌍 Многоязычная поддержка и широкое применение
Модель обучена на 36 триллионах токенов и поддерживает 119 языков и диалектов, включая китайский, английский, русский, французский и испанский. Это делает Qwen 3 особенно привлекательной для глобальных предприятий, стремящихся к многоязычной поддержке и локализации своих продуктов. Модель уже применяется в различных сферах, включая разработку программного обеспечения, анализ данных, образование и маркетинг.

📈 Конкуренция на рынке ИИ
С выпуском Qwen 3 Alibaba усиливает конкуренцию на рынке ИИ, особенно в Китае, где стремится обогнать таких соперников, как DeepSeek и Baidu. Компания утверждает, что Qwen 3 превосходит модели конкурентов по ряду показателей, включая способность к логическим рассуждениям и эффективность в выполнении задач.

🧩 Открытый исходный код и доступность
Qwen 3 выпущена под лицензией Apache 2.0, что делает её доступной для широкой аудитории разработчиков и исследователей. Модель можно использовать через платформы chat.qwen.ai, Hugging Face и ModelScope, что упрощает её интеграцию в различные приложения и сервисы.

🔮 Перспективы и влияние
Выпуск Qwen 3 подчеркивает стремление Китая занять лидирующие позиции в области искусственного интеллекта. С расширением функциональности и доступности модели, Alibaba демонстрирует готовность конкурировать с западными технологическими гигантами, предлагая мощные и универсальные решения в сфере ИИ.
👍41
🗣 Apple перезапускает Siri — теперь с ИИ.
Apple полностью перерабатывает голосового ассистента, встроив в него большую языковую модель. Новый Siri будет понимать сложные команды, поддерживать диалог и искать информацию в интернете. Архитектура создана с нуля: старый код уходит в архив, команда в Цюрихе пишет «мозг» нового поколения. Особенность — обучение и обработка данных прямо на устройстве, без отправки в облако.

🔒 Apple делает ставку на приватный ИИ:
Все вычисления происходят локально, с дифференциальной приватностью.
Персональные данные не покидают iPhone, даже при генерации сложных ответов.
Siri сможет использовать информацию из фото, заметок и приложений — но только внутри устройства.

🌐 Ассистент нового поколения:
Siri 2.0 станет не просто помощником, а полноценным интерфейсом общения с ИИ на iOS и macOS.
Apple тестирует возможность, чтобы Siri «понимала» экран, предлагала действия и контекстные советы.
Презентация новой версии ожидается на WWDC в июне 2025 года.

🔻Битва между Apple, Google и OpenAI за «домашний ИИ» выходит на новый уровень — и выигрывать её будут те, кто умеет защищать данные.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
📈 Genspark AI: автономный супер-агент для бизнеса и аналитики

⚙️ Мульти-агентная архитектура и глубокая автоматизация
Genspark AI использует «mixture-of-agents» из 9 специализированных LLM-моделей и более 80 инструментов. Платформа сама разбивает запрос на этапы, назначает отдельного «мини-агента» каждому шагу и координирует их работу, покрывая всю цепочку — от сбора данных и аналитики до написания отчёта и публикации Sparkpage. Такой гибрид повышает скорость выполнения до 8 раз и снижает расходы приблизительно на 60 % по сравнению с однопоточным решением.

🌍 Универсальность применения и интеграций
Сервис уже внедрён в финтехе, консалтинге и e-commerce для автоматизации ресёрча, построения дашбордов и подготовки маркетинговых материалов. Поддерживаются коннекторы к BigQuery, Snowflake, Tableau, а также плагины для Notion, Slack и Jira. Созданные Sparkpages снабжены встроенным AI-копилотом, который отвечает на вопросы читателей прямо на странице.

🔮 Перспективы и влияние
Команда Genspark планирует поддержку мультимодальных моделей (видео-аналитика, 3D-CAD), маркетплейс готовых агентов и приватные Spark-кластеры для крупного бизнеса. Если эти планы реализуются, сервис сможет занять нишу между классическими BI-системами и LLM-ассистентами, предлагая end-to-end-решения без необходимости собирать разрозненный стек инструментов.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Ошибки в Data Science: как избежать провала на каждом этапе проекта

Коллеги из Embedika разобрали главные ошибки при работе с данными в бизнесе — от постановки задачи до внедрения модели. Если вы устали от бесконечных экспериментов с нулевым результатом — сохраняйте пост в закладки

Embedika — эксперт в разработке и внедрении комплексных ИТ-проектов по анализу текстов с применением технологий ИИ. Создают сервисы и продукты, которые знают, что вы ищете.

👉 Подписывайтесь на @embedika — здесь делятся экспертными материалами по ИИ, корпоративному поиску и работе с ECM-системами, рассказывают о практических кейсах и бизнес-эффектах от внедрения технологий.
👍4🔥2
🔹Кампус AI: универсальная платформа для обучения и анализа данных 🎓📊

Кампус AI — это инновационный сервис, объединяющий возможности искусственного интеллекта и современных технологий для эффективного обучения и анализа больших данных. Платформа подходит как для студентов, так и для профессионалов, желающих повысить квалификацию или освоить новые навыки с помощью ИИ.

🧠 Интеллектуальные функции
Кампус AI предлагает инструменты для обучения и развития навыков в эпоху ИИ, включая персонализированные образовательные пути и систему AI Gym, которая помогает оценить соответствие текущих компетенций будущим профессиям (например, AI Programmer, AI Tester, AI Project Manager). Сервис также предоставляет AI Makerspace для создания собственных проектов с использованием передовых инструментов.

🌍 Персонализация и автоматизация
Кампус AI использует адаптивные алгоритмы для создания индивидуальных программ обучения, позволяющих пользователям прогрессировать в своем темпе. Автоматизация включает генерацию профессионального контента (текст, изображения, видео, музыка, 3D-объекты) через Co-Crafting School, а также доступ к практическим инструментам и шаблонам для повышения эффективности работы.
2
Media is too big
VIEW IN TELEGRAM
📌 Rumi Labs превращает видео в интерактивный диалог с ИИ
Американский стартап Rumi Labs разработал платформу, позволяющую зрителю общаться с героями видео в реальном времени — будь то актёры сериала, ведущие шоу или даже спортсмены во время матча.

🧠 ИИ анализирует:
- видеопоток и диалоги в реальном времени,
- контекст сцены и поведение героев,
- голосовые или текстовые запросы зрителя.

После этого он синтезирует ответ от лица персонажа или участника, максимально приближенный к его характеру и текущему состоянию (эмоции, мотивации, усталость и т. д.).

💬 Примеры взаимодействия:
– «Почему герой убежал из комнаты?»
– «Он сейчас зол?»
– «Сколько километров пробежал этот игрок за матч?»
– «Что он чувствует в этот момент?»

📈 Почему это важно?
Проект уже получил $4,7 млн инвестиций от венчурных фондов Andreessen Horowitz (a16z) и EV3, что подчёркивает интерес к слиянию ИИ и массового потребительского контента.

Это может изменить:
потоковые платформы (Netflix, Hulu, YouTube),
спорттрансляции и телешоу,
образовательный и корпоративный видеоконтент.

🔮 Что это значит?
Rumi Labs стирает грань между пассивным зрителем и активным участником, создавая совершенно новый формат потребления видео, в котором: зритель не просто наблюдает, а взаимодействует, задаёт вопросы, исследует сюжет.
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/07/09 20:37:37
Back to Top
HTML Embed Code: