Telegram Web Link
Поиск глобального максимума общей полезности как задача для Искусственного интеллекта и bigdata
Похоже, что Искусственный Интеллект уже достаточно освоился в нашем мире и пришла пора поручить ему реальные глобальные задачи человечества.
https://habr.com/ru/articles/729698/
Кто я - аналитик данных или датасаентист?
По данным аналитической компании IDC, в 2020 году в мире было произведено более 64 зеттабайт данных (для справки: 1 зеттабайт равен 10²¹ байтов). По прогнозам, к 2025 году объем всех данных в мире составит 175 зеттабайт. Важно подчеркнуть, что эта тенденция растет, и правильное использование данных может сыграть решающую роль в развитии многих отраслей.
https://habr.com/ru/articles/729520/
Как устроиться на работу специалистом по данным в эпоху GPT-4
Сосредоточимся на статистике, основных концепциях науки о данных, НЛП, оперативном проектировании, портфолио науки о данных, подготовке к интервью и AIOps.
https://www.kdnuggets.com/2023/04/get-hired-data-scientist-gpt4-era.html
Легко изучайте LLM на своем ноутбуке с openplayground

Используйте простой пользовательский интерфейс, чтобы экспериментировать с различными широко известными языковыми моделями.
https://www.kdnuggets.com/2023/04/explor
10 веб-сайтов для получения потрясающих данных для проектов по науке о данных
В этой статье речь пойдет о 10 удивительных веб-сайтах, где вы можете получить действительно потрясающие данные для проектов по науке о данных. Цель будет заключаться в том, чтобы продемонстрировать различные данные, которые могут вам понравиться.
https://www.kdnuggets.com/2023/04/10-web
Планирование и запуск ETL с помощью Jupysql и GitHub Actions
В этом блоге вы найдете исчерпывающий обзор ETL и JupySQL, включая краткое введение в ETL и JupySQL. Мы также продемонстрировали, как запланировать пример блокнота ETL с помощью действий GitHub, что позволяет автоматизировать процесс выполнения ETL и JupySQL из Jupyter.
https://www.kdnuggets.com/2023/05/schedu
Универсальная модель в онлайн-обслуживании клиентов
Построение моделей машинного обучения может быть трудоемким процессом, который часто занимает несколько месяцев в типичных бизнес-сценариях. Чтобы обеспечить стабильную производительность модели и учитывать изменения в распределении данных, необходимо регулярное переобучение.
https://www.amazon.science/publications/
Обучение псевдометкам и инерция модели в нейронном машинном переводе
Как и многие другие приложения машинного обучения, нейронный машинный перевод (NMT) выигрывает от чрезмерно параметризованных глубоких нейронных моделей. Однако было замечено, что эти модели ненадежны: прогнозы модели NMT чувствительны к небольшим изменениям входных данных
https://www.amazon.science/publications/
Автоматизируйте свою кодовую базу с помощью Promptr и GPT
Вы хотите упростить операции с кодом с помощью GPT, но устали от процесса копирования и вставки? Ну вот и решение в виде подсказки. Инструмент с открытым исходным кодом для автоматизации вашей кодовой базы.
https://www.kdnuggets.com/2023/04/automa
Анализ заработной платы специалиста по данным
Специалисты по данным востребованы во многих отраслях и секторах. Но сколько они зарабатывают и где работают?
https://www.kdnuggets.com/2023/04/data-s
Регрессионный анализ в DataScience. Часть 2. Преобразование Бокса-Кокса. Проверка тренда и случайности
В данном обзоре рассмотрим более сложную задачу:
- исходные данные не подчиняются нормальному закону;
- исходные данные представляют собой временные ряды показателей, т.е. возможно возникновение автокорреляции и ложной корреляции.
https://habr.com/ru/articles/695556/
Создание и обучение вашей первой нейронной сети с помощью TensorFlow и Keras
Узнайте, как создать и обучить свою первую модель классификации изображений с помощью Keras и TensorFlow с использованием сверточной нейронной сети.
https://www.kdnuggets.com/2023/05/building-training-first-neural-network-tensorflow-keras.html
Понимание центральной тенденции
Центральная тенденция — это свойство данных распределяться относительно характеристического значения. В науке о данных и статистике двумя наиболее важными показателями центральной тенденции являются среднее значение и медиана.
https://www.kdnuggets.com/2023/05/understanding-central-tendency.html
Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства
С каждым годом растет сложность моделей, решающих вопросы семантически‑ и контекстно‑ориентированной обработки естественного языка (NLP). Также нельзя забывать и про проблемы мультиязычности моделей.
https://habr.com/ru/articles/727318/
Ты мог бы стать спортсменом, если бы родился в другой день. Что такое Relative Age Effect?
Что делает перспективного ребенка из местной спортивной секции чемпионом мира по футболу, олимпийским призером или обладателем Кубка Стэнли?
Одни ответят талант. Без таланта далеко не уедешь. Что, если он не так мелодичен, не так романтичен и уж совсем не вписывается в наше представление об истинном успехе?
https://habr.com/ru/articles/718764/
Создавайте эффективные и надежные системы машинного обучения!
Проектирование системы машинного обучения: комплексные примеры — это практическое руководство по планированию и разработке успешных приложений машинного обучения. Он излагает четкую, воспроизводимую основу для создания, обслуживания и улучшения систем любого масштаба. https://www.kdnuggets.com/2023/05/manning-design-effective-reliable-machine-learning-systems.html
Концепция Data Mesh. Принципы, идеи, применение на практике
С чего началась наша компания? В первую очередь, конечно, с людей и с идеи. Как это обычно бывает, правильные люди абсолютно случайно познакомились друг с другом, и вот я здесь, сижу и пишу этот пост =) Была, однако, и ещё одна очень важная составляющая - данные...
https://habr.com/ru/articles/685626/
MLOPS. Жизненный цикл ML-систем: от идеи до продакшна
Сегодня хочу с вами поделиться нашими практиками MLOPS – что по сути является модным словцом, а на самом деле есть ни что иное как жизненный цикл создания и функционирования ML-систем. Естественно, каждая модель и задача уникальна.
https://habr.com/ru/articles/678150/
Выбор подходящего инструмента для запросов: сравниваем DBeaver с Datagrip
В процессе своего обучения профессии ML engineer, пришло время и мне окунуться в мир баз данных. На курсе нам предложили два инструмента для работы с базами данных - это DataGrip и DBeaver . Я в своей статье задаюсь целью сравнить эти два инструмента - возможно это поможет кому-то с выбором.
https://habr.com/ru/articles/738118/
Чисто научный подход: чего хотят женщины и о чем говорят мужчины
Женщины сами не знают, что хотят, а мужчины говорят о работе. И мои слова - это не стереотипное мышление, а обоснованное на данных заявление.Цель была - сформировать портреты пользователей, но и плюсом пришла к приятному и немного трогательному выводу.
https://habr.com/ru/articles/737084/
2025/06/30 10:51:04
Back to Top
HTML Embed Code: