Data Science Links 144 - Telegram Web

Telegram Web Link

Data Science Links

Полезные TreeMap визуализации для MSSQL, Postgres и MySQL
Я очень люблю визуализации. Человек лучше всего воспринимает информацию через образы. Для трех часто встречающихся баз (MSSQL, Postgres и MySQL) я смастерил плагины к проекту Bell, хотя этот код на Python можно использовать и отдельно.
https://habr.com/ru/articles/729320/

Полезные TreeMap визуализации для MSSQL, Postgres и MySQL

Я очень люблю визуализации. Человек лучше всего воспринимает информацию через образы. Для трех часто встречающихся баз ( MSSQL , Postgres и MySQL ) я смастерил плагины к проекту Bell, хотя этот код на...

336 views15:15

Data Science Links

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?
Изучая нейронные сети, все глубже сталкиваешься с тем, что не ко всем задачам применимы полносвязные глубокие нейронные сети с классическими слоями Linear и слоями активации Relu, Sigmoid, Than и их вариации. Почему не используют остальные функции в качестве активации, например, периодические?
https://habr.com/ru/articles/745768/

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

Данная статья состоит из двух частей: Часть 1. Мой опыт применения периодической функции активации в нейронных сетях Часть 2. Перевод некоторых, интересных выжимок из статьи . Часть 1. Мой опыт...

335 views07:30

Data Science Links

Волновой алгоритм — это алгоритм поиска пути, который использует волновое распространение для определения кратчайшего пути от начальной вершины до целевой вершины.
Название алгоритму дано не случайно, поведение алгоритма соответствует распространению волны, волна огибает препятствия, постепенно заполняя все пространство
https://habr.com/ru/articles/745294/

Волновой алгоритм

Иллюстрация решения лабиринта 20×20 Волновой алгоритм — это алгоритм поиска пути, который использует волновое распространение для определения кратчайшего пути от начальной вершины до целевой вершины....

351 views20:32

Data Science Links

Масштабирование данных с помощью Python
Как масштабировать данные, чтобы сделать их пригодными для построения модели.
https://www.kdnuggets.com/2023/07/data-scaling-python.html

362 views13:23

Data Science Links

5 бесплатных книг по обработке естественного языка для чтения в 2023 году
До ажиотажа вокруг больших языковых моделей (LLM) НЛП создавалось, но развивалось незаметно. Теперь он претерпел революцию после выпуска LLM, таких как ChatGPT. Было показано, что LLM понимают, а также генерируют человекоподобный текст. Такие модели, как ChatGPT, Google Bard и другие, были обучены на больших объемах текстовых данных в рамках архитектуры глубокой нейронной сети.
https://www.kdnuggets.com/2023/06/5-free-books-natural-language-processing-read-2023.html

379 views07:01

Data Science Links

Data Consistency: как быть уверенным, что с данными всё ок
Я довольно долгое время работала аналитиком в Яндекс.Метрике - системе web аналитики. Такие системы помогают сайтам собирать и анализировать поведение пользователей на сайтах.
Естественно, в таких продуктах как аналитические системы, данные - это главная ценность. Поэтому одна из моих задач как аналитика была мониторинг того, что с данными всё ок.
https://habr.com/ru/articles/743794/

Data Consistency: как быть уверенным, что с данными всё ок

Я довольно долгое время работала аналитиком в Яндекс.Метрике - системе web аналитики. Такие системы помогают сайтам собирать и анализировать поведение пользователей на сайтах. Естественно, в таких...

300 views07:34

Data Science Links

Использование функций регулярных выражений в PostgreSQL / Greenplum
О том, как именно использовать регулярки, написано уже много статей и туториалов. Другой вопрос, что сами по себе регулярные выражения являются параметром, подающимся на вход какой-нибудь функции. Именно функция осуществляет поиск по указанному регулярному выражению.
https://habr.com/ru/articles/747934/

Использование функций регулярных выражений в PostgreSQL / Greenplum

Начну с баянистой шутки: «Допустим, у вас есть проблема, и вы хотите решить её с помощью регулярных выражений. Теперь у вас две проблемы». О том, как именно использовать регулярки, написано уже много...

305 views07:03

Data Science Links

Практический подход к разработке признаков в машинном обучении
В этой статье обсуждается важность изучения признаков в машинном обучении и то, как его можно реализовать с помощью простых практических шагов.

https://www.kdnuggets.com/2023/07/practical-approach-feature-engineering-machine-learning.html

328 views07:02

Data Science Links

Ошибки, которых следует избегать начинающим специалистам по данным
Ошибки, которых следует избегать начинающим специалистам по данным
Ознакомьтесь с этим списком распространенных ошибок, которые совершают новички в науке о данных, чтобы вы знали, чего следует избегать при поиске работы.

https://www.kdnuggets.com/2022/06/mistakes-newbie-data-scientists-avoid.html

312 views07:02

Data Science Links

Алгоритм быстрого поиска при помощи хэширования
Есть некая электронная книга, которую одновременно читает неограниченное количество читателей. Нужно сделать так, чтобы заданный читатель в любой момент мог проверить, какая доля пользователей прочитала меньшую часть книги, чем он . Наивным решением было бы хранить в std::map<int,int> в качестве ключа номера страниц, в качестве значения- количество прочитавших их пользователей.
https://habr.com/ru/articles/749600/

Алгоритм быстрого поиска при помощи хэширования

В этой статье я хочу представить алгоритм оптимизации хранения данных для быстрого поиска (на примере контейнера map). Итак, задание Есть некая электронная книга, которую одновременно читает...

338 views07:03

Data Science Links

Крестики-Нолики (Tic Tac Toe) с компьютером на Python. Мой первый шаг к Machine Learning. Часть 1
Всем привет. Я любитель Python и совсем недолго осваиваю язык всеми доступными способами. Моя цель - понять принципы машинного обучения и его взаимосвязь с нейросетью. В первой части покажу только основные этапы создания игры, где пользователь выбирает роль (Х или О), играя с компьютером.
https://habr.com/ru/articles/748586/

Крестики-Нолики (Tic Tac Toe) с компьютером на Python. Мой первый шаг к Machine Learning. Часть 1

Всем привет. Я любитель Python и совсем недолго осваиваю язык всеми доступными способами. Моя цель - понять принципы машинного обучения и его взаимосвязь с нейросетью. Никакого опыта в IT не имел, тем...

349 views07:02

Data Science Links

Разделяй и властвуй. Повышение эффективности алгоритмов. Часть 1
Да, мы привыкли, что перемножение двух байт, или двух LONG это операция, которая происходит за константное время и не требует какого то особого алгоритма. Но, что если нам надо перемножить два числа любой длины? Не LONG, не байт, не число от 1 до 10, а любые два числа, которое, имеют в общем случае длину n бит, а результат умножения может иметь длину 2n бит.
https://habr.com/ru/articles/742308/

Разделяй и властвуй. Повышение эффективности алгоритмов. Часть 1

Сложно ли перемножить два числа? Да, мы привыкли, что перемножение двух байт, или двух LONG это операция, которая происходит за константное время и не требует какого то особого алгоритма. Даже в школе...

343 views07:03

Data Science Links

Разделяй и властвуй. Повышение эффективности алгоритмов. Часть 2
На примере из прошлой части, попробуем сформулировать и обобщить принцип «Разделяй и властвуй».
https://habr.com/ru/articles/742404/

Разделяй и властвуй. Повышение эффективности алгоритмов. Часть 2

Ссылка на первую часть . Мастер-теорема На примере из прошлой части, попробуем сформулировать и обобщить принцип «Разделяй и властвуй». Мы беремся за проблему, размера n , делим эту...

357 views07:02

Data Science Links

https://habr.com/ru/articles/745360/

Разделяй и властвуй. Повышение эффективности алгоритмов. Часть 3

В прошлой части мы рассмотрели общий подход к расчету эффективности алгоритмов с принципом "разделяй и властвуй", а также применение принципа к различным базовым алгоритмам. Сегодня поговорим о...

387 views07:02

Data Science Links

https://habr.com/ru/articles/750832/

Крестики-Нолики (Tic Tac Toe) с компьютером на Python. Часть 2: шаг к ML

Всем привет. Я любитель Python и совсем недолго осваиваю язык всеми доступными способами. Моя цель - понять принципы машинного обучения и его взаимосвязь с нейросетью. Никакого опыта в IT не имел, тем...

433 views07:03

Data Science Links

https://habr.com/ru/articles/751050/

Пример уменьшения размерности данных с помощью линейных и нелинейных методов в Python

Уменьшение размерности данных — это подход упрощения сложных наборов данных для облегчения их обработки. По мере того как данные растут и становятся более сложными, извлекать информацию...

416 views07:32

Data Science Links

https://habr.com/ru/articles/751550/

Работа с хребтами (ridge plot) в Seaborn

Введение Визуализация данных является важной частью анализа данных, помогая нам лучше понять данные, выявлять закономерности и тенденции. Среди многих инструментов визуализации данных библиотека...

362 views07:11

Data Science Links

https://habr.com/ru/articles/751898/

Работа со скрипичной диаграммой (Violin Plot) в Seaborn

Скрипичные диаграммы могут эффективно отображать распределение данных, сравнивать различные наборы данных и выявлять аномалии (выбросы) и тенденции. В этой статье мы рассмотрим четыре различных стиля...

395 views07:04

Data Science Links

https://habr.com/ru/articles/751714/

LlamaIndex: создаем AI-бота без боли и страданий

Привет исследователям AI! Меня зовут Марк Конаков, я развиваю NLP в компании Самолет. Мы разрабатываем чат-боты, занимаемся мэтчингом, строим модели для анализа звонков и многим другим. NLP – это...

379 views07:04

Data Science Links

https://habr.com/ru/articles/752264/

How to access real-time smart contract data from Python code (using Lido contract as an example)

Let’s imagine you need access to the real-time data of some smart contracts on Ethereum (or Polygon, BSC, etc.) like Uniswap or even PEPE coin to analyze its data using the standard data...

401 views07:06

2025/06/29 15:46:57
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>