Telegram Web Link
gagliardi_tesi_eng.pdf
13.5 MB
Перевод шикарной обширной работы (диплом на категорию Pro) Антонио Гальярди на тему прессинга — исторический экскурс, систематизация типов, разбор трендов последнего времени.
Хорошая статья, сравнивающая эффективность позиционной модели и пакинга в оценке продвижения мяча (https://statsbomb.com/articles/soccer/unpacking-ball-progression/). В качестве референса оценивается точность предсказания — относится ли конкретная передача к владению, которое завершилось голом или нет. Что удивило из результатов (в таблице) — добавление числа соперников за линией мяча после паса не дает видимого улучшения в результатах если просто использовать позиционную модель в соло.
Занятная статья (https://journals.sagepub.com/doi/10.1177/17479541231172695 — правда за пейволом) c любопытным абстрактом — на тему, как именно определять компактность, соблюдение которой влияет на результат.
Media is too big
VIEW IN TELEGRAM
Анализ, как он должен быть. Та же структура 3-2-5 у Сити, практически тот же сетап у Ливерпуля в обоих матчах, но разницу делают нюансы: несколько метров в позиции у крайнего нападающего и другая интенция у Мареза, чем у Канселу — другая позиция корпуса, большая направленность получить мяч вперед или вообще за спину, чем в недодачу. Это помогает несколько раз вскрыть фланг.
Forwarded from Fit Predict
Statsbomb выкатил новую фичу HOPS: the Header Oriented Performance System

Метрика оценивающая навык вести верховые единоборства. По-факту рейтинг Glicko без фичей (судя по описанию).

Где тут "A New Way To Evaluate Heading Ability" не понятно. Автор этого блога делал более сильную модель еще полтора года назад.

А делалась эта модель под впечатлением от статьи Гарри Гелайда.
Forwarded from Fit Predict
А вообще тяга к "инновациям" статсбомба начинает смешить.

Первая статья (Dan Cervone, Alexander D’Amour, Luke Bornn, and Kirk Goldsberry) посвященная EPV на баскетбольных данных была написана в 2014 году.

После этого EPV-идею стали применять и в футболе. Например, в 2019 примерно теми же авторами.

Но статсбомбу же нужно от всех отличаться, поэтому своя (ничем не примечательная) версия EPV была названа OBV.
Гостевой пост Sergey Cheleevskiy (1/2):

Гюрлюк в Оренбурге — один из самых интригующих трансферов лета в РПЛ.

Игрок дозрел с подходящим для сегодняшнего российского рынка таймингом — без раннего взлёта и лишнего хайпа, как было с Равилем Тагиром и Бураком Индже, другими выпускниками «Алтынорду».

При этом он сходу готов дать Оренбургу внушительный набор качеств, преимущественно в позиции левого вингера, но ситуативно — и в роли десятки и правого форварда.

У Гюрлюка сильная правая, с которой он уверенно и весьма стабильно выполняет почти весь возможный диапазон передач. Он хорошо координирован, умеет уходить вторым касанием в обе стороны, меняя направление при обыгрыше. Плюс к этому — внушительный взрыв на первых шагах и качественная работа корпусом, которой он компенсирует не самое сильное владение левой ногой, оставаясь эффективным, когда выпускают справа.

Эмирджана в нынешнем Алтынорду мало кормят передачами в высоких позициях, команда объективно слабая, но клуб делал всё, чтобы создать максимально подходящие условия для развития главного актива.

Тут совсем не так, как у нескольких топовых российских академий, где почти из каждого возраста выходит поток футболистов, играбельных для РПЛ и при этом, пока нет ясности насчёт их потолка возможностей, удаётся ещё и держать вторую команду в конкурентоспособном виде в ФНЛ практически без привлечения посторонних опытных игроков.

Алтынорду имеет широченное представительство в юношеских турецких сборных, но для команды первой лиги в данный у них не хватает собственных исполнителей — поэтому в клубе много возрастных футболистов извне.

И это важный аспект для оценки перспектив Гюрлюка: в таком составе он в 18-19 лет был не над подтанцовке, а играл ведущую роль.

Алтынорду — 3-и по доле владений с 7+ передач, в топ-5 по ключевым прессинг-метрикам, и Гюрлюк — лидер команды по вовлечённости в длинные владения, заканчивающиеся ударами. Средняя начальная координата его передач — с запасом самая низкая в команде среди всех игроков атакующей группы.

Чтобы максимально подсветить его умения, «Алтынорду» давал ему много свободы, не ограничивая в смещениях под мяч в левом полуфланге, а часто — и в позиции десятки. На уровне Турции-2 Гюрлюк уже готов был делать там что угодно — серийный обыгрыш, переводы во фланг, создание ударных позиций с дистанции для самого себя, комбинации и стенки в сжатых пространствах.

Не обладая качественными партнёрами вокруг и порой заигрываясь, допуская по неопытности неоправданно глупые потери, — всё равно имеет 70% успеха попыток обыгрыша 1 в 1 (у других high-volume дриблёров лиги не набирается и 65%).

14% обводок заканчиваются ударом — не бог весть какое большое значение, у сильных игроков в сильных лигах обычно переваливает за 20%, но с учётом контекста (не кормят мячами в высоких позициях в заготовленной под изоляцию структуру) это всё равно впечатляет. В Турции-2 из тех, кто делает хотя бы 4 попытки обводки за матч, выше 14% — лишь у двоих из тринадцати. Из этих же 13 человек ни у кого нет такой же высокой доли обводок, после которых следует передача.

Налицо нетипичная для молодого игрока зрелость в решениях после ярких действий: обычно в этом возрасте способных дриблёров переклинивает и они не дают конструктивное продолжение после обводок так же часто.
Гостевой пост Sergey Cheleevskiy (2/2):

Необъёмный финишинг, как понятно из вышеизложенного, — скорее следствие слабости партнёров, а не игрока. Мы не можем говорить с уверенностью, доучится ли Гюрлюк таком в важном для перехода на новый уровень компоненте, как открывания за спину, зато минимум сомнений, что его цифры в созидании моментов и финишинге в такой команде, как Оренбург, почти сразу должны пойти в гору. У него есть техническое оснащение, которое нужно эксплуатировать более активно. У Гюрлюка поставленный удар с дистанции, причём со стороны кажется, что он ещё и умудрился прибавить в ударах с нерабочей левой. Хорошо открывается при прострелах в штрафную, отклеивается под второй темп, иногда набегает на дальнюю — бьёт не ахти, но хорошо выпрыгивает — ещё одна перспективная точка роста. Есть кросс и умение подыгрывать в завершении, сохраняя голову поднятой при контроле мяча в чужой штрафной, когда Гюрлюка окружают 2-3 оппонента. При поддержке тех игроков, которыми сегодня обладает Оренбург, — это практически гарантированный рост всех значимых показателей, несмотря на трудности при переходе в гораздо более сильную лигу.

При этом Гюрлюк не ленивый, хорошо переключается, проглядываются зачатки отбора — причём вполне грамотного, в ногах, без излишнего въезжания в корпус. Как раз при единоборствах плечо в плечо нужно прибавлять больше всего, потому что без должного силового компонента, как бы по-игроцки умён ни был Гюрлюк, эффективность такого смелого дриблинга, как у него, в первое время неизбежно просядет.

Когда по лиге нет данных о прессинг-действиях, комбинация «много дуэлей + хороший нон-шот и успешный дриблинг» в большом количестве случаев у вингеров оборачивается историей успеха.

С учётом имеющихся вводных это подписание имеет шансы затмить — с точки зрения качества, сегодняшней цены и будущей ликвидности (в турецкой Суперлиге мало паспортистов с такими данными) — и без того многочисленные в последнее время успехи Оренбурга.
Риторический вопрос: скорректировал бы Пеп позицию Де Брюйне в перерыве, если бы тот не сломался?

Структура Сити с мячом отличалась от их привычной — думаю, что специально под Интер в развитии они расставлялись 3-d-3: тройка защитников, перед ними Родри; Стоунз заходит внутрь, но в более высокую позицию, чем обычно; Де Брюйне наоборот глубже обычного, опускается в левый полуфланг, а Гюндоган условно в позиции десятки. Идея такого перестроения кажется на поверхности — гарантировать численное преимущество в полузащите. Ведь если один из центральных хавов Интера поднимается наверх для помощи в прессинге тройки ЦЗ (например, Барелла — в Аке), еще один прихватывает Родри, то третий остается в полузащите в одиночку против Гюндогана, Стоунза и Де Брюйне — да, ему на помощь может выдернуться один из внешних ЦЗ, но тогда все равно останется еще один адрес (второй внешний ЦЗ не будет рисковать выдергиваться одновременно с первым, ведь дефолтно это слишком большой риск — оставить Холанда 1 в 1), который стабильно можно находить, учитывая уровень того же Эдерсона в начале атаки.

Проблема, которая возникла: Де Брюйне оказался вдали от привычной правой полуфланговой зоны, откуда он обычно дает основную часть остроты — проникающие передачи, ранние кроссы и фирменные забегания в ширину направо под маневр Бернарду, когда тот смещается с мячом в центр, утаскивает за собой защитника, а потом катит Кевину в свободную зону. Он практически не обострял из левого полуфланга (был момент в начале, когда он отдал за спину в небольшой офсайд Холанду, но даже это была больше атака сходу после прессинга, чем позиционная), а направо перебегал буквально несколько раз, когда Сити зажимал соперника в его треть — приемов в правой зоне было очень мало. Лучший момент Сити в первом тайме случился в ситуации, когда он по эпизоду остался в зоне десятки, прошла позиционная атака, он получил между линиями и в итоге прокатил передачу за спину на Холанда.

Возможных решений проблемы было несколько. Понятно, что в идеале бы поменять его местами со Стоунзом, когда команда в развитии атаки, но тогда при переходах владения тот слишком далеко от позиции правого защитника, которую занимает при обороне (и такая же ситуация, что при переходе владения к Сити ему с позиции правого защитника далеко перебегать в левый полуфланг). Тогда остается либо а) внутри этой структуры поменять Де Брюйне местами с Гюндоганом (как и получилось ситуативно в той атаке, когда Холанд не забил 1 в 1), что Кевин имел больше возможностей обострять из центра, либо сдвигаться правее; либо б) перестроиться на привычную структуру в развитии с двумя опорниками (Родри и Стоунз) и двумя игроками в полуфлангах (Гюндоган левее и Де Брюйне правее) — тогда бельгиец вообще в максимально комфортных условиях.
Пользователь твиттера Ben Griffis делает много интересных расчётов и визуализаций на тему футбола. В последнее время у него стали появляться твиты где он считает схожесть игроков по их показателям в прошедшем сезоне. Например, Промес занимает 3 место по схожести для Дибалы.

Вчера Бен выложил свои изыскания на гитхаб и теперь каждый может поиграть с данными. Глубоко в кишки кода я не лез, но похоже, что он считает косинусную близость для игроков, команд и лиг. Обидно, что в файлах с данными лежат уже рассчитанное значение схожести, т.е. нельзя узнать какие показатели с Wyscout он брал для расчёта. Есть несколько парметров, которые могут влиять на ваш расчёт, например можно отфильтровать игроков из непохожих команд/лиг (что может показаться логично, когда вы посмотрите на топ-10 по схожести с Месси без этого фактора), а также считать медиану для трёх показателей: схожесть игроков, команд и лиг (тут мне кажется другая крайность, очень большой буст получают люди из той же лиги, у которых автоматом в этом пункте 100 из 100. Кажется, что тут нужно было бы как-то взвешивать показатели).

Сам расчёт небыстрый, посчитать Месси у меня заняло где-то 45 секунд, судя по вложенным циклам код далеко неоптимальный. Но на пощупать самое то. Код написан на питоне, пакет лежит только на гитхабе, поэтому установить его можно командой:

pip install git+https://github.com/griffisben/griffis_soccer_analysis.git


#soccer #python #advstats

Твиттер автора
Гитхаб проекта
Много правильного сказано о переходе Беллингема — all-rounder, играет несколько позиций, его атакующие и оборонительные метрики зашкаливают (пусть и в Бундеслиге, которая более открытая относительно остальных топ-5), еще далек от своего потолка. Ему предстоит заменить проверенных топов, и есть момент, в котором он сразу может дать большой импакт — это голы от центра полузащиты. Он стабильно добегает в штрафную под кроссы и открывается у дуги под передачи по диагонали назад, либо бьет оттуда с подбора (на карте его удары без стандартов в последнем сезоне Бундеслиги). Его xG на 90 минут (без прямых штрафных) почти вдвое выше, чем суммарный у Крооса и Модрича (0.23 vs 0.03+0.1) — это большой апсайд и серьезная разница, которая только частично объясняется значительно более открытой игрой в Бундеслиге (средняя результативность здесь почти 3.2 гола за игру против чуть более чем 2.5 в Испании).
В последнее время начались несколько соревнований на баскетбольных данных. Я решил сделать небольшой обзор. Призами они не балуют, так что это скорее занятие для энтузиастов спортивной статистики.

1. Первое соревнование на главной площадке для ML-соревнований, kaggle. Нужно предсказать вероятность подбора в нападении после броска. Решение это просто csv-файл с двумя столбцами: id броска и вероятность подбора в нападении. Метрика — Logloss, которая сильнее чем RMSE штрафует за сильные промахи в прогнозе. В данных есть информация о командах и координаты всех 10 игроков на площадке в момент броска. Когда сыграны эти матчи напрямую не сказано, а сам я не разбирался можно ли ту информацию восстановить. Если нет, то конкурс более-менее бессмыслен, просто координаты игроков на площадке без контекста розыгрыша и без информации об игроках на площадке упускают слишком много информации. У меня прошлым летом была обратная идея, попробовать посчитать вероятность подбора в нападении используя по максимуму информацию о броске, розыгрыше и игроках на площадке без конкретных координат самих игроков, только координаты броска. Может я рано забросил, но первые результаты были очень плохими.
Вообще довольно странное соревнование, вкупе с не очень хорошей репутацией ShotQuality в сообществе (есть вопросы к качеству их модели оценки бросков, а также работе с данными) и слабеньким призом (годовая подписка на SQ) привели к тому, что на вечер понедельника в нём участвует 4 команды. Зато всего 20 мегабайт данных, не нужно будет скачивать терабайты картинок.

Kaggle: https://www.kaggle.com/competitions/shotquality-rebounding
Твит о соревновании: https://twitter.com/Shot_Quality/status/1671175892377403392

Ещё два соревнования проводит DeepSportRadar в рамках воркшопа ACM MMSports 2023, площадка конкурсов eval.ai, призовые 1000 долларов (в каждом) и возможность сделать статью для публикации. Данные предоставлены Sportradar и Synergy Sports.

2. Сегментация игроков (а также тренеров и судей) на площадке.
В этом году основной упор делается на решение проблемы окклюзии. Я слаб в CV, но как понимаю нужно хорошо решать проблему перекрытия, когда игрок на изображении как бы разделен на несколько частей другим игроком или игрокам, которые находятся ближе к камере. Результат считается по Occlusion Metric, описание есть в репозитории соревнования. Для самих изображений есть аннотации в COCO формате. Набор небольшой, около 300 изображений и, как я понял, его нельзя обогащать.
Страница соревнования: https://eval.ai/web/challenges/challenge-page/2070/overview
Github: https://github.com/DeepSportradar/instance-segmentation-challenge
Датасет: https://www.kaggle.com/datasets/deepsportradar/basketball-instants-dataset
Paper https://arxiv.org/abs/2209.13899 и код https://github.com/YJingyu/Instanc_Segmentation_Pro решения прошлогоднего победителя

3. Реидентификация игроков.
Здесь предоставлены несколько последовательных кадров игровых моментов и нужно идентифицировать игрока с первого кадра на остальных (как я понял). Метрикой является mAP(https://ml.i-neti.ru/map-mean-average-precision/). Тут я к сожалению понимаю ещё меньше, чем в сегментации, так что описание ограничится набором ссылок.
Страница соревнования: https://eval.ai/web/challenges/challenge-page/2076/overview
Github: https://github.com/DeepSportradar/player-reidentification-challenge/tree/master
Paper https://arxiv.org/abs/2303.11855 и код https://github.com/DeepSportradar/2022-winners-player-reidentification-challenge прошлогоднего победителя (mAP 0.9844).

#basketball #kaggle #mlcompetition #cv
Ситуация с возможным изменением правила офсайда (как будто бы в пользу атаки) может привести немного не к тем последствиям, которые ожидают реформаторы из ФИФА. Повсеместное введение ВАРа несколько лет назад сподвигнуло все больше команд играть агрессивнее и поднимать линию обороны — изменился баланс risk-reward, т.к. раньше ты получал меньше выгод от высокой линии из-за более высокой вероятности, что боковой не увидит офсайд при передаче за спину.

Сейчас же, меняя правило, явно ожидают, что это приведет к повышению результативности: проблема в том, что это может наоборот сподвигнуть большинство команд обороняться ниже, чем сейчас — станет еще сложнее ловить условного Мбаппе, если у него будет легальное преимущество почти в корпус перед защитником. Оборона с высокой линией просто не будет нести такой выгоды, как сейчас — баланс сместится в сторону более осторожного стиля. Таким образом, это может привести не к повышению результативности, а равно наоборот. Как говорил классик: "Я бы не стал ничего менять в правилах. Изменения в них могут привести к непредсказуемым результатам — всегда всплывёт то, о чём вы вообще не думали, внося поправки".
Как-то попадались на глаза отчеты франкфуртского Айнтрахта и говорил с людьми из их аналитического отдела: в качестве одной из метрик тогда они использовали обычное чистое время (ball in play), и если, например, в матчах будущих соперников мяч в игре в среднем был мало, то давали рекомендацию ускорять ввод с аутов, штрафных etc. И тогда, и сейчас это кажется спорной идеей — если в матчах команды низкое чистое время, то это не означает, что они умышленно затягивают и обязательно уязвимы к более быстрым рестартам (но в целом подобная рекомендация может иметь место чисто по видеоанализу — с технической картинки хорошо видно, когда определенная часть состава стабильно теряет концентрацию на лишние несколько секунд, отворачиваясь от мяча, поправляя гетры или просто с запозданиям реагируя на ввод).

Например, в последнем сезоне АПЛ (на картинке) топ-2 команды по затяжке времени перед вводом мяча из аута были Брентфорд и Саутгемптон. По совместительству эти же две команды (особенно первые с отрывом) чаще остальных использовали ауты в чужой трети как полноценные стандарты, совершая длинный бросок. Понятно, что подготовка к такому ауту занимает больше времени — обычно на него приходит минимум один ЦЗ команды атаки, а бросающий еще тратит время на вытирание мяча, — это негативно влияет на чистое время, но совершенно не значит, что команда умышленно его убивает и будет уязвима к более быстрым рестартам.

Когда сейчас, при наличие эвент-фидов, можно разбивать затяжки на типы (перед угловыми, аутами, ударами по воротам и тд), это может дать куда больше инсайтов. Например, можно сопоставлять сколько моментов (как-то нормировать на число вводов) команда допускает после более быстрых возобновлений (каких-то бенчмарков нет — это все можно устанавливать самостоятельно) со стороны соперника, а сколько наоборот — создает после своих быстрых вводов. И здесь картина уже будет более точная, чем если смотреть на общий ball in play.
Мысль Пепа правильная, но конкретно для топ-команд, которые работают на рынке элитных игроков с зарплатой чистыми 3+ в год — в целом по уровню Мареза готовых игроков Сити может рассмотреть не больше десятка, и никто из них полностью не имеет такой же набор качеств. Но если речь про игроков в зарплатном диапазоне 100к — 1 млн, то разнообразные similarity scores могут иметь смысл, т.к. в этих группах игроков сотни и много примеров сильно похожих.
Ни к чему хорошему изменения, описанные в статье, не приведут. Если требования по желтым за несогласия с решениями и любые апелляции в сторону арбитра реально будут выполняться, то на первых порах увидим большое количество дополнительных желтых, что в свою очередь будет приводить к глупым удалениям.

В чрезмерном добавленном времени тоже не вижу ничего хорошего — не столько из-за дополнительной нагрузки (хотя расписание и так перегружено, и люди, отвечающие за здоровье игроков, уже бьют тревогу), сколько даже из-за возрастающей неопределенности, т.к. регулирование затяжек внутри возросшего добавленного времени все равно будет зависеть от человеческого фактора. Непонятно, зачем идти на такие меры, чтобы поднять среднее "мяч в игре" с 55 минут до условно 60, если можно просто ввести чистое время — два тайма по 30 минут с ограничениями по времени на ввод мяча после сигнала арбитра, а если за условно 10 секунд (можно регулировать в зависимости от типа рестарта — например, на удар от ворот давать больше времени) после свистка не ввел мяч, то владение переходит к сопернику.
2025/07/08 19:05:23
Back to Top
HTML Embed Code: