gagliardi_tesi_eng.pdf
13.5 MB
Перевод шикарной обширной работы (диплом на категорию Pro) Антонио Гальярди на тему прессинга — исторический экскурс, систематизация типов, разбор трендов последнего времени.
Хорошая статья, сравнивающая эффективность позиционной модели и пакинга в оценке продвижения мяча (https://statsbomb.com/articles/soccer/unpacking-ball-progression/). В качестве референса оценивается точность предсказания — относится ли конкретная передача к владению, которое завершилось голом или нет. Что удивило из результатов (в таблице) — добавление числа соперников за линией мяча после паса не дает видимого улучшения в результатах если просто использовать позиционную модель в соло.
Занятная статья (https://journals.sagepub.com/doi/10.1177/17479541231172695 — правда за пейволом) c любопытным абстрактом — на тему, как именно определять компактность, соблюдение которой влияет на результат.
Media is too big
VIEW IN TELEGRAM
Анализ, как он должен быть. Та же структура 3-2-5 у Сити, практически тот же сетап у Ливерпуля в обоих матчах, но разницу делают нюансы: несколько метров в позиции у крайнего нападающего и другая интенция у Мареза, чем у Канселу — другая позиция корпуса, большая направленность получить мяч вперед или вообще за спину, чем в недодачу. Это помогает несколько раз вскрыть фланг.
Forwarded from Fit Predict
Statsbomb выкатил новую фичу HOPS: the Header Oriented Performance System
Метрика оценивающая навык вести верховые единоборства. По-факту рейтинг Glicko без фичей (судя по описанию).
Где тут "A New Way To Evaluate Heading Ability" не понятно. Автор этого блога делал более сильную модель еще полтора года назад.
А делалась эта модель под впечатлением от статьи Гарри Гелайда.
Метрика оценивающая навык вести верховые единоборства. По-факту рейтинг Glicko без фичей (судя по описанию).
Где тут "A New Way To Evaluate Heading Ability" не понятно. Автор этого блога делал более сильную модель еще полтора года назад.
А делалась эта модель под впечатлением от статьи Гарри Гелайда.
Hudl Statsbomb | Data Champions
Introducing HOPS: A New Way To Evaluate Heading Ability
The Hudl Statsbomb Data Science team introduce their new model to better evaluate heading ability: the Heading Oriented Performance System (HOPS).
Forwarded from Fit Predict
А вообще тяга к "инновациям" статсбомба начинает смешить.
Первая статья (Dan Cervone, Alexander D’Amour, Luke Bornn, and Kirk Goldsberry) посвященная EPV на баскетбольных данных была написана в 2014 году.
После этого EPV-идею стали применять и в футболе. Например, в 2019 примерно теми же авторами.
Но статсбомбу же нужно от всех отличаться, поэтому своя (ничем не примечательная) версия EPV была названа OBV.
Первая статья (Dan Cervone, Alexander D’Amour, Luke Bornn, and Kirk Goldsberry) посвященная EPV на баскетбольных данных была написана в 2014 году.
После этого EPV-идею стали применять и в футболе. Например, в 2019 примерно теми же авторами.
Но статсбомбу же нужно от всех отличаться, поэтому своя (ничем не примечательная) версия EPV была названа OBV.
Гостевой пост Sergey Cheleevskiy (1/2):
Гюрлюк в Оренбурге — один из самых интригующих трансферов лета в РПЛ.
Игрок дозрел с подходящим для сегодняшнего российского рынка таймингом — без раннего взлёта и лишнего хайпа, как было с Равилем Тагиром и Бураком Индже, другими выпускниками «Алтынорду».
При этом он сходу готов дать Оренбургу внушительный набор качеств, преимущественно в позиции левого вингера, но ситуативно — и в роли десятки и правого форварда.
У Гюрлюка сильная правая, с которой он уверенно и весьма стабильно выполняет почти весь возможный диапазон передач. Он хорошо координирован, умеет уходить вторым касанием в обе стороны, меняя направление при обыгрыше. Плюс к этому — внушительный взрыв на первых шагах и качественная работа корпусом, которой он компенсирует не самое сильное владение левой ногой, оставаясь эффективным, когда выпускают справа.
Эмирджана в нынешнем Алтынорду мало кормят передачами в высоких позициях, команда объективно слабая, но клуб делал всё, чтобы создать максимально подходящие условия для развития главного актива.
Тут совсем не так, как у нескольких топовых российских академий, где почти из каждого возраста выходит поток футболистов, играбельных для РПЛ и при этом, пока нет ясности насчёт их потолка возможностей, удаётся ещё и держать вторую команду в конкурентоспособном виде в ФНЛ практически без привлечения посторонних опытных игроков.
Алтынорду имеет широченное представительство в юношеских турецких сборных, но для команды первой лиги в данный у них не хватает собственных исполнителей — поэтому в клубе много возрастных футболистов извне.
И это важный аспект для оценки перспектив Гюрлюка: в таком составе он в 18-19 лет был не над подтанцовке, а играл ведущую роль.
Алтынорду — 3-и по доле владений с 7+ передач, в топ-5 по ключевым прессинг-метрикам, и Гюрлюк — лидер команды по вовлечённости в длинные владения, заканчивающиеся ударами. Средняя начальная координата его передач — с запасом самая низкая в команде среди всех игроков атакующей группы.
Чтобы максимально подсветить его умения, «Алтынорду» давал ему много свободы, не ограничивая в смещениях под мяч в левом полуфланге, а часто — и в позиции десятки. На уровне Турции-2 Гюрлюк уже готов был делать там что угодно — серийный обыгрыш, переводы во фланг, создание ударных позиций с дистанции для самого себя, комбинации и стенки в сжатых пространствах.
Не обладая качественными партнёрами вокруг и порой заигрываясь, допуская по неопытности неоправданно глупые потери, — всё равно имеет 70% успеха попыток обыгрыша 1 в 1 (у других high-volume дриблёров лиги не набирается и 65%).
14% обводок заканчиваются ударом — не бог весть какое большое значение, у сильных игроков в сильных лигах обычно переваливает за 20%, но с учётом контекста (не кормят мячами в высоких позициях в заготовленной под изоляцию структуру) это всё равно впечатляет. В Турции-2 из тех, кто делает хотя бы 4 попытки обводки за матч, выше 14% — лишь у двоих из тринадцати. Из этих же 13 человек ни у кого нет такой же высокой доли обводок, после которых следует передача.
Налицо нетипичная для молодого игрока зрелость в решениях после ярких действий: обычно в этом возрасте способных дриблёров переклинивает и они не дают конструктивное продолжение после обводок так же часто.
Гюрлюк в Оренбурге — один из самых интригующих трансферов лета в РПЛ.
Игрок дозрел с подходящим для сегодняшнего российского рынка таймингом — без раннего взлёта и лишнего хайпа, как было с Равилем Тагиром и Бураком Индже, другими выпускниками «Алтынорду».
При этом он сходу готов дать Оренбургу внушительный набор качеств, преимущественно в позиции левого вингера, но ситуативно — и в роли десятки и правого форварда.
У Гюрлюка сильная правая, с которой он уверенно и весьма стабильно выполняет почти весь возможный диапазон передач. Он хорошо координирован, умеет уходить вторым касанием в обе стороны, меняя направление при обыгрыше. Плюс к этому — внушительный взрыв на первых шагах и качественная работа корпусом, которой он компенсирует не самое сильное владение левой ногой, оставаясь эффективным, когда выпускают справа.
Эмирджана в нынешнем Алтынорду мало кормят передачами в высоких позициях, команда объективно слабая, но клуб делал всё, чтобы создать максимально подходящие условия для развития главного актива.
Тут совсем не так, как у нескольких топовых российских академий, где почти из каждого возраста выходит поток футболистов, играбельных для РПЛ и при этом, пока нет ясности насчёт их потолка возможностей, удаётся ещё и держать вторую команду в конкурентоспособном виде в ФНЛ практически без привлечения посторонних опытных игроков.
Алтынорду имеет широченное представительство в юношеских турецких сборных, но для команды первой лиги в данный у них не хватает собственных исполнителей — поэтому в клубе много возрастных футболистов извне.
И это важный аспект для оценки перспектив Гюрлюка: в таком составе он в 18-19 лет был не над подтанцовке, а играл ведущую роль.
Алтынорду — 3-и по доле владений с 7+ передач, в топ-5 по ключевым прессинг-метрикам, и Гюрлюк — лидер команды по вовлечённости в длинные владения, заканчивающиеся ударами. Средняя начальная координата его передач — с запасом самая низкая в команде среди всех игроков атакующей группы.
Чтобы максимально подсветить его умения, «Алтынорду» давал ему много свободы, не ограничивая в смещениях под мяч в левом полуфланге, а часто — и в позиции десятки. На уровне Турции-2 Гюрлюк уже готов был делать там что угодно — серийный обыгрыш, переводы во фланг, создание ударных позиций с дистанции для самого себя, комбинации и стенки в сжатых пространствах.
Не обладая качественными партнёрами вокруг и порой заигрываясь, допуская по неопытности неоправданно глупые потери, — всё равно имеет 70% успеха попыток обыгрыша 1 в 1 (у других high-volume дриблёров лиги не набирается и 65%).
14% обводок заканчиваются ударом — не бог весть какое большое значение, у сильных игроков в сильных лигах обычно переваливает за 20%, но с учётом контекста (не кормят мячами в высоких позициях в заготовленной под изоляцию структуру) это всё равно впечатляет. В Турции-2 из тех, кто делает хотя бы 4 попытки обводки за матч, выше 14% — лишь у двоих из тринадцати. Из этих же 13 человек ни у кого нет такой же высокой доли обводок, после которых следует передача.
Налицо нетипичная для молодого игрока зрелость в решениях после ярких действий: обычно в этом возрасте способных дриблёров переклинивает и они не дают конструктивное продолжение после обводок так же часто.
Гостевой пост Sergey Cheleevskiy (2/2):
Необъёмный финишинг, как понятно из вышеизложенного, — скорее следствие слабости партнёров, а не игрока. Мы не можем говорить с уверенностью, доучится ли Гюрлюк таком в важном для перехода на новый уровень компоненте, как открывания за спину, зато минимум сомнений, что его цифры в созидании моментов и финишинге в такой команде, как Оренбург, почти сразу должны пойти в гору. У него есть техническое оснащение, которое нужно эксплуатировать более активно. У Гюрлюка поставленный удар с дистанции, причём со стороны кажется, что он ещё и умудрился прибавить в ударах с нерабочей левой. Хорошо открывается при прострелах в штрафную, отклеивается под второй темп, иногда набегает на дальнюю — бьёт не ахти, но хорошо выпрыгивает — ещё одна перспективная точка роста. Есть кросс и умение подыгрывать в завершении, сохраняя голову поднятой при контроле мяча в чужой штрафной, когда Гюрлюка окружают 2-3 оппонента. При поддержке тех игроков, которыми сегодня обладает Оренбург, — это практически гарантированный рост всех значимых показателей, несмотря на трудности при переходе в гораздо более сильную лигу.
При этом Гюрлюк не ленивый, хорошо переключается, проглядываются зачатки отбора — причём вполне грамотного, в ногах, без излишнего въезжания в корпус. Как раз при единоборствах плечо в плечо нужно прибавлять больше всего, потому что без должного силового компонента, как бы по-игроцки умён ни был Гюрлюк, эффективность такого смелого дриблинга, как у него, в первое время неизбежно просядет.
Когда по лиге нет данных о прессинг-действиях, комбинация «много дуэлей + хороший нон-шот и успешный дриблинг» в большом количестве случаев у вингеров оборачивается историей успеха.
С учётом имеющихся вводных это подписание имеет шансы затмить — с точки зрения качества, сегодняшней цены и будущей ликвидности (в турецкой Суперлиге мало паспортистов с такими данными) — и без того многочисленные в последнее время успехи Оренбурга.
Необъёмный финишинг, как понятно из вышеизложенного, — скорее следствие слабости партнёров, а не игрока. Мы не можем говорить с уверенностью, доучится ли Гюрлюк таком в важном для перехода на новый уровень компоненте, как открывания за спину, зато минимум сомнений, что его цифры в созидании моментов и финишинге в такой команде, как Оренбург, почти сразу должны пойти в гору. У него есть техническое оснащение, которое нужно эксплуатировать более активно. У Гюрлюка поставленный удар с дистанции, причём со стороны кажется, что он ещё и умудрился прибавить в ударах с нерабочей левой. Хорошо открывается при прострелах в штрафную, отклеивается под второй темп, иногда набегает на дальнюю — бьёт не ахти, но хорошо выпрыгивает — ещё одна перспективная точка роста. Есть кросс и умение подыгрывать в завершении, сохраняя голову поднятой при контроле мяча в чужой штрафной, когда Гюрлюка окружают 2-3 оппонента. При поддержке тех игроков, которыми сегодня обладает Оренбург, — это практически гарантированный рост всех значимых показателей, несмотря на трудности при переходе в гораздо более сильную лигу.
При этом Гюрлюк не ленивый, хорошо переключается, проглядываются зачатки отбора — причём вполне грамотного, в ногах, без излишнего въезжания в корпус. Как раз при единоборствах плечо в плечо нужно прибавлять больше всего, потому что без должного силового компонента, как бы по-игроцки умён ни был Гюрлюк, эффективность такого смелого дриблинга, как у него, в первое время неизбежно просядет.
Когда по лиге нет данных о прессинг-действиях, комбинация «много дуэлей + хороший нон-шот и успешный дриблинг» в большом количестве случаев у вингеров оборачивается историей успеха.
С учётом имеющихся вводных это подписание имеет шансы затмить — с точки зрения качества, сегодняшней цены и будущей ликвидности (в турецкой Суперлиге мало паспортистов с такими данными) — и без того многочисленные в последнее время успехи Оренбурга.
Риторический вопрос: скорректировал бы Пеп позицию Де Брюйне в перерыве, если бы тот не сломался?
Структура Сити с мячом отличалась от их привычной — думаю, что специально под Интер в развитии они расставлялись 3-d-3: тройка защитников, перед ними Родри; Стоунз заходит внутрь, но в более высокую позицию, чем обычно; Де Брюйне наоборот глубже обычного, опускается в левый полуфланг, а Гюндоган условно в позиции десятки. Идея такого перестроения кажется на поверхности — гарантировать численное преимущество в полузащите. Ведь если один из центральных хавов Интера поднимается наверх для помощи в прессинге тройки ЦЗ (например, Барелла — в Аке), еще один прихватывает Родри, то третий остается в полузащите в одиночку против Гюндогана, Стоунза и Де Брюйне — да, ему на помощь может выдернуться один из внешних ЦЗ, но тогда все равно останется еще один адрес (второй внешний ЦЗ не будет рисковать выдергиваться одновременно с первым, ведь дефолтно это слишком большой риск — оставить Холанда 1 в 1), который стабильно можно находить, учитывая уровень того же Эдерсона в начале атаки.
Проблема, которая возникла: Де Брюйне оказался вдали от привычной правой полуфланговой зоны, откуда он обычно дает основную часть остроты — проникающие передачи, ранние кроссы и фирменные забегания в ширину направо под маневр Бернарду, когда тот смещается с мячом в центр, утаскивает за собой защитника, а потом катит Кевину в свободную зону. Он практически не обострял из левого полуфланга (был момент в начале, когда он отдал за спину в небольшой офсайд Холанду, но даже это была больше атака сходу после прессинга, чем позиционная), а направо перебегал буквально несколько раз, когда Сити зажимал соперника в его треть — приемов в правой зоне было очень мало. Лучший момент Сити в первом тайме случился в ситуации, когда он по эпизоду остался в зоне десятки, прошла позиционная атака, он получил между линиями и в итоге прокатил передачу за спину на Холанда.
Возможных решений проблемы было несколько. Понятно, что в идеале бы поменять его местами со Стоунзом, когда команда в развитии атаки, но тогда при переходах владения тот слишком далеко от позиции правого защитника, которую занимает при обороне (и такая же ситуация, что при переходе владения к Сити ему с позиции правого защитника далеко перебегать в левый полуфланг). Тогда остается либо а) внутри этой структуры поменять Де Брюйне местами с Гюндоганом (как и получилось ситуативно в той атаке, когда Холанд не забил 1 в 1), что Кевин имел больше возможностей обострять из центра, либо сдвигаться правее; либо б) перестроиться на привычную структуру в развитии с двумя опорниками (Родри и Стоунз) и двумя игроками в полуфлангах (Гюндоган левее и Де Брюйне правее) — тогда бельгиец вообще в максимально комфортных условиях.
Структура Сити с мячом отличалась от их привычной — думаю, что специально под Интер в развитии они расставлялись 3-d-3: тройка защитников, перед ними Родри; Стоунз заходит внутрь, но в более высокую позицию, чем обычно; Де Брюйне наоборот глубже обычного, опускается в левый полуфланг, а Гюндоган условно в позиции десятки. Идея такого перестроения кажется на поверхности — гарантировать численное преимущество в полузащите. Ведь если один из центральных хавов Интера поднимается наверх для помощи в прессинге тройки ЦЗ (например, Барелла — в Аке), еще один прихватывает Родри, то третий остается в полузащите в одиночку против Гюндогана, Стоунза и Де Брюйне — да, ему на помощь может выдернуться один из внешних ЦЗ, но тогда все равно останется еще один адрес (второй внешний ЦЗ не будет рисковать выдергиваться одновременно с первым, ведь дефолтно это слишком большой риск — оставить Холанда 1 в 1), который стабильно можно находить, учитывая уровень того же Эдерсона в начале атаки.
Проблема, которая возникла: Де Брюйне оказался вдали от привычной правой полуфланговой зоны, откуда он обычно дает основную часть остроты — проникающие передачи, ранние кроссы и фирменные забегания в ширину направо под маневр Бернарду, когда тот смещается с мячом в центр, утаскивает за собой защитника, а потом катит Кевину в свободную зону. Он практически не обострял из левого полуфланга (был момент в начале, когда он отдал за спину в небольшой офсайд Холанду, но даже это была больше атака сходу после прессинга, чем позиционная), а направо перебегал буквально несколько раз, когда Сити зажимал соперника в его треть — приемов в правой зоне было очень мало. Лучший момент Сити в первом тайме случился в ситуации, когда он по эпизоду остался в зоне десятки, прошла позиционная атака, он получил между линиями и в итоге прокатил передачу за спину на Холанда.
Возможных решений проблемы было несколько. Понятно, что в идеале бы поменять его местами со Стоунзом, когда команда в развитии атаки, но тогда при переходах владения тот слишком далеко от позиции правого защитника, которую занимает при обороне (и такая же ситуация, что при переходе владения к Сити ему с позиции правого защитника далеко перебегать в левый полуфланг). Тогда остается либо а) внутри этой структуры поменять Де Брюйне местами с Гюндоганом (как и получилось ситуативно в той атаке, когда Холанд не забил 1 в 1), что Кевин имел больше возможностей обострять из центра, либо сдвигаться правее; либо б) перестроиться на привычную структуру в развитии с двумя опорниками (Родри и Стоунз) и двумя игроками в полуфлангах (Гюндоган левее и Де Брюйне правее) — тогда бельгиец вообще в максимально комфортных условиях.
Forwarded from Цифры в спорте
Пользователь твиттера Ben Griffis делает много интересных расчётов и визуализаций на тему футбола. В последнее время у него стали появляться твиты где он считает схожесть игроков по их показателям в прошедшем сезоне. Например, Промес занимает 3 место по схожести для Дибалы.
Вчера Бен выложил свои изыскания на гитхаб и теперь каждый может поиграть с данными. Глубоко в кишки кода я не лез, но похоже, что он считает косинусную близость для игроков, команд и лиг. Обидно, что в файлах с данными лежат уже рассчитанное значение схожести, т.е. нельзя узнать какие показатели с Wyscout он брал для расчёта. Есть несколько парметров, которые могут влиять на ваш расчёт, например можно отфильтровать игроков из непохожих команд/лиг (что может показаться логично, когда вы посмотрите на топ-10 по схожести с Месси без этого фактора), а также считать медиану для трёх показателей: схожесть игроков, команд и лиг (тут мне кажется другая крайность, очень большой буст получают люди из той же лиги, у которых автоматом в этом пункте 100 из 100. Кажется, что тут нужно было бы как-то взвешивать показатели).
Сам расчёт небыстрый, посчитать Месси у меня заняло где-то 45 секунд, судя по вложенным циклам код далеко неоптимальный. Но на пощупать самое то. Код написан на питоне, пакет лежит только на гитхабе, поэтому установить его можно командой:
#soccer #python #advstats
Твиттер автора
Гитхаб проекта
Вчера Бен выложил свои изыскания на гитхаб и теперь каждый может поиграть с данными. Глубоко в кишки кода я не лез, но похоже, что он считает косинусную близость для игроков, команд и лиг. Обидно, что в файлах с данными лежат уже рассчитанное значение схожести, т.е. нельзя узнать какие показатели с Wyscout он брал для расчёта. Есть несколько парметров, которые могут влиять на ваш расчёт, например можно отфильтровать игроков из непохожих команд/лиг (что может показаться логично, когда вы посмотрите на топ-10 по схожести с Месси без этого фактора), а также считать медиану для трёх показателей: схожесть игроков, команд и лиг (тут мне кажется другая крайность, очень большой буст получают люди из той же лиги, у которых автоматом в этом пункте 100 из 100. Кажется, что тут нужно было бы как-то взвешивать показатели).
Сам расчёт небыстрый, посчитать Месси у меня заняло где-то 45 секунд, судя по вложенным циклам код далеко неоптимальный. Но на пощупать самое то. Код написан на питоне, пакет лежит только на гитхабе, поэтому установить его можно командой:
pip install git+https://github.com/griffisben/griffis_soccer_analysis.git
#soccer #python #advstats
Твиттер автора
Гитхаб проекта
Много правильного сказано о переходе Беллингема — all-rounder, играет несколько позиций, его атакующие и оборонительные метрики зашкаливают (пусть и в Бундеслиге, которая более открытая относительно остальных топ-5), еще далек от своего потолка. Ему предстоит заменить проверенных топов, и есть момент, в котором он сразу может дать большой импакт — это голы от центра полузащиты. Он стабильно добегает в штрафную под кроссы и открывается у дуги под передачи по диагонали назад, либо бьет оттуда с подбора (на карте его удары без стандартов в последнем сезоне Бундеслиги). Его xG на 90 минут (без прямых штрафных) почти вдвое выше, чем суммарный у Крооса и Модрича (0.23 vs 0.03+0.1) — это большой апсайд и серьезная разница, которая только частично объясняется значительно более открытой игрой в Бундеслиге (средняя результативность здесь почти 3.2 гола за игру против чуть более чем 2.5 в Испании).
Forwarded from Цифры в спорте
В последнее время начались несколько соревнований на баскетбольных данных. Я решил сделать небольшой обзор. Призами они не балуют, так что это скорее занятие для энтузиастов спортивной статистики.
1. Первое соревнование на главной площадке для ML-соревнований, kaggle. Нужно предсказать вероятность подбора в нападении после броска. Решение это просто csv-файл с двумя столбцами: id броска и вероятность подбора в нападении. Метрика — Logloss, которая сильнее чем RMSE штрафует за сильные промахи в прогнозе. В данных есть информация о командах и координаты всех 10 игроков на площадке в момент броска. Когда сыграны эти матчи напрямую не сказано, а сам я не разбирался можно ли ту информацию восстановить. Если нет, то конкурс более-менее бессмыслен, просто координаты игроков на площадке без контекста розыгрыша и без информации об игроках на площадке упускают слишком много информации. У меня прошлым летом была обратная идея, попробовать посчитать вероятность подбора в нападении используя по максимуму информацию о броске, розыгрыше и игроках на площадке без конкретных координат самих игроков, только координаты броска. Может я рано забросил, но первые результаты были очень плохими.
Вообще довольно странное соревнование, вкупе с не очень хорошей репутацией ShotQuality в сообществе (есть вопросы к качеству их модели оценки бросков, а также работе с данными) и слабеньким призом (годовая подписка на SQ) привели к тому, что на вечер понедельника в нём участвует 4 команды. Зато всего 20 мегабайт данных, не нужно будет скачивать терабайты картинок.
Kaggle: https://www.kaggle.com/competitions/shotquality-rebounding
Твит о соревновании: https://twitter.com/Shot_Quality/status/1671175892377403392
Ещё два соревнования проводит DeepSportRadar в рамках воркшопа ACM MMSports 2023, площадка конкурсов eval.ai, призовые 1000 долларов (в каждом) и возможность сделать статью для публикации. Данные предоставлены Sportradar и Synergy Sports.
2. Сегментация игроков (а также тренеров и судей) на площадке.
В этом году основной упор делается на решение проблемы окклюзии. Я слаб в CV, но как понимаю нужно хорошо решать проблему перекрытия, когда игрок на изображении как бы разделен на несколько частей другим игроком или игрокам, которые находятся ближе к камере. Результат считается по Occlusion Metric, описание есть в репозитории соревнования. Для самих изображений есть аннотации в COCO формате. Набор небольшой, около 300 изображений и, как я понял, его нельзя обогащать.
Страница соревнования: https://eval.ai/web/challenges/challenge-page/2070/overview
Github: https://github.com/DeepSportradar/instance-segmentation-challenge
Датасет: https://www.kaggle.com/datasets/deepsportradar/basketball-instants-dataset
Paper https://arxiv.org/abs/2209.13899 и код https://github.com/YJingyu/Instanc_Segmentation_Pro решения прошлогоднего победителя
3. Реидентификация игроков.
Здесь предоставлены несколько последовательных кадров игровых моментов и нужно идентифицировать игрока с первого кадра на остальных (как я понял). Метрикой является mAP(https://ml.i-neti.ru/map-mean-average-precision/). Тут я к сожалению понимаю ещё меньше, чем в сегментации, так что описание ограничится набором ссылок.
Страница соревнования: https://eval.ai/web/challenges/challenge-page/2076/overview
Github: https://github.com/DeepSportradar/player-reidentification-challenge/tree/master
Paper https://arxiv.org/abs/2303.11855 и код https://github.com/DeepSportradar/2022-winners-player-reidentification-challenge прошлогоднего победителя (mAP 0.9844).
#basketball #kaggle #mlcompetition #cv
1. Первое соревнование на главной площадке для ML-соревнований, kaggle. Нужно предсказать вероятность подбора в нападении после броска. Решение это просто csv-файл с двумя столбцами: id броска и вероятность подбора в нападении. Метрика — Logloss, которая сильнее чем RMSE штрафует за сильные промахи в прогнозе. В данных есть информация о командах и координаты всех 10 игроков на площадке в момент броска. Когда сыграны эти матчи напрямую не сказано, а сам я не разбирался можно ли ту информацию восстановить. Если нет, то конкурс более-менее бессмыслен, просто координаты игроков на площадке без контекста розыгрыша и без информации об игроках на площадке упускают слишком много информации. У меня прошлым летом была обратная идея, попробовать посчитать вероятность подбора в нападении используя по максимуму информацию о броске, розыгрыше и игроках на площадке без конкретных координат самих игроков, только координаты броска. Может я рано забросил, но первые результаты были очень плохими.
Вообще довольно странное соревнование, вкупе с не очень хорошей репутацией ShotQuality в сообществе (есть вопросы к качеству их модели оценки бросков, а также работе с данными) и слабеньким призом (годовая подписка на SQ) привели к тому, что на вечер понедельника в нём участвует 4 команды. Зато всего 20 мегабайт данных, не нужно будет скачивать терабайты картинок.
Kaggle: https://www.kaggle.com/competitions/shotquality-rebounding
Твит о соревновании: https://twitter.com/Shot_Quality/status/1671175892377403392
Ещё два соревнования проводит DeepSportRadar в рамках воркшопа ACM MMSports 2023, площадка конкурсов eval.ai, призовые 1000 долларов (в каждом) и возможность сделать статью для публикации. Данные предоставлены Sportradar и Synergy Sports.
2. Сегментация игроков (а также тренеров и судей) на площадке.
В этом году основной упор делается на решение проблемы окклюзии. Я слаб в CV, но как понимаю нужно хорошо решать проблему перекрытия, когда игрок на изображении как бы разделен на несколько частей другим игроком или игрокам, которые находятся ближе к камере. Результат считается по Occlusion Metric, описание есть в репозитории соревнования. Для самих изображений есть аннотации в COCO формате. Набор небольшой, около 300 изображений и, как я понял, его нельзя обогащать.
Страница соревнования: https://eval.ai/web/challenges/challenge-page/2070/overview
Github: https://github.com/DeepSportradar/instance-segmentation-challenge
Датасет: https://www.kaggle.com/datasets/deepsportradar/basketball-instants-dataset
Paper https://arxiv.org/abs/2209.13899 и код https://github.com/YJingyu/Instanc_Segmentation_Pro решения прошлогоднего победителя
3. Реидентификация игроков.
Здесь предоставлены несколько последовательных кадров игровых моментов и нужно идентифицировать игрока с первого кадра на остальных (как я понял). Метрикой является mAP(https://ml.i-neti.ru/map-mean-average-precision/). Тут я к сожалению понимаю ещё меньше, чем в сегментации, так что описание ограничится набором ссылок.
Страница соревнования: https://eval.ai/web/challenges/challenge-page/2076/overview
Github: https://github.com/DeepSportradar/player-reidentification-challenge/tree/master
Paper https://arxiv.org/abs/2303.11855 и код https://github.com/DeepSportradar/2022-winners-player-reidentification-challenge прошлогоднего победителя (mAP 0.9844).
#basketball #kaggle #mlcompetition #cv
Kaggle
ShotQuality: NCAA Player Location Data & Rebounds
Predict NCAA offensive rebound probability from player locations at shot release points using ShotQuality data.
Forwarded from Fit Predict
Обещанные прогнозы EPV-метрик
Извиняюсь, что не выложил месяц назад. Столкнулся с одной интересной проблемой.
https://www.sports.ru/tribuna/blogs/fitpredict/3141617.html
Извиняюсь, что не выложил месяц назад. Столкнулся с одной интересной проблемой.
https://www.sports.ru/tribuna/blogs/fitpredict/3141617.html
Sports.ru
С помощью машинного обучения предсказываем EPV-метрики на следующий сезон. Готовим шорт-листы для топ-клубов
С помощью машинного обучения предсказываем EPV-метрики на следующий сезон. Готовим шорт-листы для топ-клубов - Fit Predict - Блоги - Sports.ru
Ситуация с возможным изменением правила офсайда (как будто бы в пользу атаки) может привести немного не к тем последствиям, которые ожидают реформаторы из ФИФА. Повсеместное введение ВАРа несколько лет назад сподвигнуло все больше команд играть агрессивнее и поднимать линию обороны — изменился баланс risk-reward, т.к. раньше ты получал меньше выгод от высокой линии из-за более высокой вероятности, что боковой не увидит офсайд при передаче за спину.
Сейчас же, меняя правило, явно ожидают, что это приведет к повышению результативности: проблема в том, что это может наоборот сподвигнуть большинство команд обороняться ниже, чем сейчас — станет еще сложнее ловить условного Мбаппе, если у него будет легальное преимущество почти в корпус перед защитником. Оборона с высокой линией просто не будет нести такой выгоды, как сейчас — баланс сместится в сторону более осторожного стиля. Таким образом, это может привести не к повышению результативности, а равно наоборот. Как говорил классик: "Я бы не стал ничего менять в правилах. Изменения в них могут привести к непредсказуемым результатам — всегда всплывёт то, о чём вы вообще не думали, внося поправки".
Сейчас же, меняя правило, явно ожидают, что это приведет к повышению результативности: проблема в том, что это может наоборот сподвигнуть большинство команд обороняться ниже, чем сейчас — станет еще сложнее ловить условного Мбаппе, если у него будет легальное преимущество почти в корпус перед защитником. Оборона с высокой линией просто не будет нести такой выгоды, как сейчас — баланс сместится в сторону более осторожного стиля. Таким образом, это может привести не к повышению результативности, а равно наоборот. Как говорил классик: "Я бы не стал ничего менять в правилах. Изменения в них могут привести к непредсказуемым результатам — всегда всплывёт то, о чём вы вообще не думали, внося поправки".
Как-то попадались на глаза отчеты франкфуртского Айнтрахта и говорил с людьми из их аналитического отдела: в качестве одной из метрик тогда они использовали обычное чистое время (ball in play), и если, например, в матчах будущих соперников мяч в игре в среднем был мало, то давали рекомендацию ускорять ввод с аутов, штрафных etc. И тогда, и сейчас это кажется спорной идеей — если в матчах команды низкое чистое время, то это не означает, что они умышленно затягивают и обязательно уязвимы к более быстрым рестартам (но в целом подобная рекомендация может иметь место чисто по видеоанализу — с технической картинки хорошо видно, когда определенная часть состава стабильно теряет концентрацию на лишние несколько секунд, отворачиваясь от мяча, поправляя гетры или просто с запозданиям реагируя на ввод).
Например, в последнем сезоне АПЛ (на картинке) топ-2 команды по затяжке времени перед вводом мяча из аута были Брентфорд и Саутгемптон. По совместительству эти же две команды (особенно первые с отрывом) чаще остальных использовали ауты в чужой трети как полноценные стандарты, совершая длинный бросок. Понятно, что подготовка к такому ауту занимает больше времени — обычно на него приходит минимум один ЦЗ команды атаки, а бросающий еще тратит время на вытирание мяча, — это негативно влияет на чистое время, но совершенно не значит, что команда умышленно его убивает и будет уязвима к более быстрым рестартам.
Когда сейчас, при наличие эвент-фидов, можно разбивать затяжки на типы (перед угловыми, аутами, ударами по воротам и тд), это может дать куда больше инсайтов. Например, можно сопоставлять сколько моментов (как-то нормировать на число вводов) команда допускает после более быстрых возобновлений (каких-то бенчмарков нет — это все можно устанавливать самостоятельно) со стороны соперника, а сколько наоборот — создает после своих быстрых вводов. И здесь картина уже будет более точная, чем если смотреть на общий ball in play.
Например, в последнем сезоне АПЛ (на картинке) топ-2 команды по затяжке времени перед вводом мяча из аута были Брентфорд и Саутгемптон. По совместительству эти же две команды (особенно первые с отрывом) чаще остальных использовали ауты в чужой трети как полноценные стандарты, совершая длинный бросок. Понятно, что подготовка к такому ауту занимает больше времени — обычно на него приходит минимум один ЦЗ команды атаки, а бросающий еще тратит время на вытирание мяча, — это негативно влияет на чистое время, но совершенно не значит, что команда умышленно его убивает и будет уязвима к более быстрым рестартам.
Когда сейчас, при наличие эвент-фидов, можно разбивать затяжки на типы (перед угловыми, аутами, ударами по воротам и тд), это может дать куда больше инсайтов. Например, можно сопоставлять сколько моментов (как-то нормировать на число вводов) команда допускает после более быстрых возобновлений (каких-то бенчмарков нет — это все можно устанавливать самостоятельно) со стороны соперника, а сколько наоборот — создает после своих быстрых вводов. И здесь картина уже будет более точная, чем если смотреть на общий ball in play.
Мысль Пепа правильная, но конкретно для топ-команд, которые работают на рынке элитных игроков с зарплатой чистыми 3+ в год — в целом по уровню Мареза готовых игроков Сити может рассмотреть не больше десятка, и никто из них полностью не имеет такой же набор качеств. Но если речь про игроков в зарплатном диапазоне 100к — 1 млн, то разнообразные similarity scores могут иметь смысл, т.к. в этих группах игроков сотни и много примеров сильно похожих.
Ни к чему хорошему изменения, описанные в статье, не приведут. Если требования по желтым за несогласия с решениями и любые апелляции в сторону арбитра реально будут выполняться, то на первых порах увидим большое количество дополнительных желтых, что в свою очередь будет приводить к глупым удалениям.
В чрезмерном добавленном времени тоже не вижу ничего хорошего — не столько из-за дополнительной нагрузки (хотя расписание и так перегружено, и люди, отвечающие за здоровье игроков, уже бьют тревогу), сколько даже из-за возрастающей неопределенности, т.к. регулирование затяжек внутри возросшего добавленного времени все равно будет зависеть от человеческого фактора. Непонятно, зачем идти на такие меры, чтобы поднять среднее "мяч в игре" с 55 минут до условно 60, если можно просто ввести чистое время — два тайма по 30 минут с ограничениями по времени на ввод мяча после сигнала арбитра, а если за условно 10 секунд (можно регулировать в зависимости от типа рестарта — например, на удар от ворот давать больше времени) после свистка не ввел мяч, то владение переходит к сопернику.
В чрезмерном добавленном времени тоже не вижу ничего хорошего — не столько из-за дополнительной нагрузки (хотя расписание и так перегружено, и люди, отвечающие за здоровье игроков, уже бьют тревогу), сколько даже из-за возрастающей неопределенности, т.к. регулирование затяжек внутри возросшего добавленного времени все равно будет зависеть от человеческого фактора. Непонятно, зачем идти на такие меры, чтобы поднять среднее "мяч в игре" с 55 минут до условно 60, если можно просто ввести чистое время — два тайма по 30 минут с ограничениями по времени на ввод мяча после сигнала арбитра, а если за условно 10 секунд (можно регулировать в зависимости от типа рестарта — например, на удар от ворот давать больше времени) после свистка не ввел мяч, то владение переходит к сопернику.
Sky Sports
Rule changes for new football season: Officials to crackdown on dissent, be more lenient on physical challenges and add on wasted…
Premier League and EFL officials will add World Cup-style amounts of injury-time to matches as part of directives for new season; 15 mins additional time in Southamptons win at Sheffield Wed; Leeds & Leicester in action as part of Championship triple-header…