Telegram Web Link
Полезные TreeMap визуализации для MSSQL, Postgres и MySQL
Я очень люблю визуализации. Человек лучше всего воспринимает информацию через образы. Для трех часто встречающихся баз (MSSQL, Postgres и MySQL) я смастерил плагины к проекту Bell, хотя этот код на Python можно использовать и отдельно.
https://habr.com/ru/articles/729320/
Нейронные сети не могут обобщать периодические зависимости. Как это исправить?
Изучая нейронные сети, все глубже сталкиваешься с тем, что не ко всем задачам применимы полносвязные глубокие нейронные сети с классическими слоями Linear и слоями активации Relu, Sigmoid, Than и их вариации. Почему не используют остальные функции в качестве активации, например, периодические?
https://habr.com/ru/articles/745768/
Волновой алгоритм — это алгоритм поиска пути, который использует волновое распространение для определения кратчайшего пути от начальной вершины до целевой вершины.
Название алгоритму дано не случайно, поведение алгоритма соответствует распространению волны, волна огибает препятствия, постепенно заполняя все пространство
https://habr.com/ru/articles/745294/
Масштабирование данных с помощью Python
Как масштабировать данные, чтобы сделать их пригодными для построения модели.
https://www.kdnuggets.com/2023/07/data-scaling-python.html
5 бесплатных книг по обработке естественного языка для чтения в 2023 году
До ажиотажа вокруг больших языковых моделей (LLM) НЛП создавалось, но развивалось незаметно. Теперь он претерпел революцию после выпуска LLM, таких как ChatGPT. Было показано, что LLM понимают, а также генерируют человекоподобный текст. Такие модели, как ChatGPT, Google Bard и другие, были обучены на больших объемах текстовых данных в рамках архитектуры глубокой нейронной сети.
https://www.kdnuggets.com/2023/06/5-free-books-natural-language-processing-read-2023.html
Data Consistency: как быть уверенным, что с данными всё ок
Я довольно долгое время работала аналитиком в Яндекс.Метрике - системе web аналитики. Такие системы помогают сайтам собирать и анализировать поведение пользователей на сайтах.
Естественно, в таких продуктах как аналитические системы, данные - это главная ценность. Поэтому одна из моих задач как аналитика была мониторинг того, что с данными всё ок.
https://habr.com/ru/articles/743794/
Использование функций регулярных выражений в PostgreSQL / Greenplum
О том, как именно использовать регулярки, написано уже много статей и туториалов. Другой вопрос, что сами по себе регулярные выражения являются параметром, подающимся на вход какой-нибудь функции. Именно функция осуществляет поиск по указанному регулярному выражению.
https://habr.com/ru/articles/747934/
Практический подход к разработке признаков в машинном обучении
В этой статье обсуждается важность изучения признаков в машинном обучении и то, как его можно реализовать с помощью простых практических шагов.

https://www.kdnuggets.com/2023/07/practical-approach-feature-engineering-machine-learning.html
Ошибки, которых следует избегать начинающим специалистам по данным
Ошибки, которых следует избегать начинающим специалистам по данным
Ознакомьтесь с этим списком распространенных ошибок, которые совершают новички в науке о данных, чтобы вы знали, чего следует избегать при поиске работы.

https://www.kdnuggets.com/2022/06/mistakes-newbie-data-scientists-avoid.html
Алгоритм быстрого поиска при помощи хэширования
Есть некая электронная книга, которую одновременно читает неограниченное количество читателей. Нужно сделать так, чтобы заданный читатель в любой момент мог проверить, какая доля пользователей прочитала меньшую часть книги, чем он . Наивным решением было бы хранить в std::map<int,int> в качестве ключа номера страниц, в качестве значения- количество прочитавших их пользователей.
https://habr.com/ru/articles/749600/
Крестики-Нолики (Tic Tac Toe) с компьютером на Python. Мой первый шаг к Machine Learning. Часть 1
Всем привет. Я любитель Python и совсем недолго осваиваю язык всеми доступными способами. Моя цель - понять принципы машинного обучения и его взаимосвязь с нейросетью. В первой части покажу только основные этапы создания игры, где пользователь выбирает роль (Х или О), играя с компьютером.
https://habr.com/ru/articles/748586/
Разделяй и властвуй. Повышение эффективности алгоритмов. Часть 1
Да, мы привыкли, что перемножение двух байт, или двух LONG это операция, которая происходит за константное время и не требует какого то особого алгоритма. Но, что если нам надо перемножить два числа любой длины? Не LONG, не байт, не число от 1 до 10, а любые два числа, которое, имеют в общем случае длину n бит, а результат умножения может иметь длину 2n бит.
https://habr.com/ru/articles/742308/
2025/06/29 15:46:57
Back to Top
HTML Embed Code: