Анализ футбольных данных с использованием моделей машинного обучения может потенциально повысить количество вбрасываний!

Анализ футбольных данных с использованием моделей машинного обучения может потенциально повысить количество вбрасываний!

24 октября 2022 г.

В эпоху стремительного роста интереса к большим данным, анализу данных и искусственному интеллекту футбольные заинтересованные стороны также обращают внимание на машинное обучение, чтобы повысить эффективность футбольных бросков. Внедрение наилучшей аналитической стратегии для футбольных данных не только повышает эффективность игроков, но и позволяет сократить расходы клубных инвесторов.

Многие задаются вопросом: «Могут ли модели машинного обучения помочь улучшить точность и удержание мяча, что приведет к результативности после вбрасывания мяча?» Ответ не надуманный, если вы ищете в правильном направлении.

Teams playing football in a pitch

Команды играют в футбол на поле

Узнайте, как применять исследовательский анализ данных и ключевые модели машинного обучения для получения ценных сведений о футбольных аутах, независимо от того, являетесь ли вы специалистом по данным, футбольным инвестором или преданным болельщиком. Мы создали эту статью на основе диссертации, написанной студентом Beyond-Machine, командой опытных специалистов в области обработки данных, искусственного интеллекта, машинного обучения и программирования. инструкторы под руководством доктора Стилианоса Кампакиса. Если вы изучите наши практические курсы для самостоятельного изучения, вы освоите науку о данных и получите работу своей мечты даже без высшего образования. .

В этой статье используются данные Чешской футбольной лиги в режиме реального времени, которые вы можете использовать в своей лиге или клубе, чтобы получать ценную информацию и принимать решения на основе данных. В последнее время большинство высших лиг начинают ценить роль вбрасываний игроков на поле в общей результативности команды. Таким образом, мы видим необычайно высокий спрос на тренеров, специализирующихся на вбрасывании мячей, в основных лигах, таких как английская Премьер-лига, Лига 1, Серия А и Ла Лига.

При анализе данных о вбрасывании аналитики обращают внимание на то, как каждый атрибут, такой как расстояние вбрасывания, угол вбрасывания и время выполнения вбрасывания, влияет на полноту вбрасывания. Критический анализ данных об этих стандартных положениях позволяет дополнительно оценить, как успешное вбрасывание может улучшить владение мячом, его удержание и вероятность забитого гола.

A football player carries out a throw-in

Футболист выполняет вбрасывание на футбольном поле.

В футбольной аналитике вбрасывания анализируются с помощью исследовательского анализа данных в сочетании с моделями машинного обучения. Аналитики собирают наборы реальных данных из лиг, анализируют, преобразовывают, визуализируют данные и сотрудничают с лицами, принимающими решения в футболе, для реализации полученных выводов.

Исследования прошлых проектов показывают, что более короткие вбрасывания с большей вероятностью будут успешными и владеют мячом, а более быстрые вбрасывания с большей вероятностью будут успешными и удержанными. Вбрасывание назад имеет большую вероятность успеха, и владение мячом сохраняется по сравнению с вбрасыванием вперед. Точно так же вбрасывание с переключением, выполненным в средней или оборонительной зоне, также имеет больше шансов забить гол и избежать пропущенного гола.

Это лишь часть того, как вы можете максимизировать данные для улучшения результатов команды, но данные могут играть более важную роль в футболе, чем в бросках. В следующих разделах рассматривается футбольная аналитика как важнейший инструмент, который футбольные клубы используют, чтобы продолжать побеждать в футбольной индустрии, важные применения аналитики в футболе и эффективное использование моделей машинного обучения при вбрасывании мячей.

Что такое Football Analytics?

Футбольная аналитика предполагает применение современных инструментов анализа цифровых данных для сбора, анализа, хранения, обмена, визуализации и принимать ценные решения на основе данных, используя футбольные данные, полученные на поле и за его пределами. За последнее десятилетие аналитика данных сыграла неоценимую роль в преобразовании здравоохранения, электронной коммерции, банковского дела, исследований, управления и спорта. К сожалению, люди мало внимания уделяли как аналитика данных может преобразовать футбольную индустрию до нескольких лет назад. Клубы, которые внедрили футбольную аналитику раньше, чем их коллеги, уже получают огромные преимущества.

Football data analysts build machine learning models and algorithms for throw-ins.

Аналитики футбольных данных создают модели машинного обучения и алгоритмы для вбрасываний.

Правда в том, что аналитика данных в футболе осталась и будет продолжать расти и расширяться за пределы нынешних масштабов. Клубы, которые стремятся получить конкурентное преимущество на поле и за его пределами, используют данные и используют возможности аналитики для получать огромную прибыль, повышать эффективность игроков, предотвращать травмы и повышать их коммерческую эффективность.

BBC сообщает, что такие клубы, как "Арсенал", "Ливерпуль", "Барселона" и "Манчестер Сити", являются пионерами в области анализа данных и машинного обучения в спорте< /а>. Это позволило им выигрывать матчи, принимая более эффективные решения, основанные на данных. С годами другие клубы, у которых дела шли не так хорошо, в конце концов обнаружили золотую жилу в области футбольной аналитики и последовали их примеру.

3 лучшие модели машинного обучения для оценки футбольных бросков

В футболе термин "вбрасывание" описывает ситуацию, когда мяч возвращается в игру бросающим рукой. Вбрасывание происходит, когда судья останавливает игру, потому что мяч покидает поле за боковой линией. Вбрасывание — это один из пяти различных типов стандартных положений в футболе. Другими типами являются пенальти, штрафные, угловые и удары от ворот.

Во время вбрасывания игрок должен стоять обеими ногами на земле за боковой линией вне игры, а мяч должен быть поднят обеими руками и возвращен в игру. Игрок, не владеющий мячом, должен оставаться на расстоянии не менее двух метров от игрока, подающего мяч. Оценка вероятности успешного паса, вероятности забитого гола или любой другой модели прогнозирования в футболе теперь является жизненно важным аспектом футбола аналитика. Таким образом, несколько моделей прогнозирования уже помогают в принятии футбольных решений, но в этой статье мы углубимся в них.

Модель ожидаемых целей (xG)

Модель xG, используемая в аналитике футбольных вбрасываний, была представлена ​​Сэмом Грином. Это прогностическая модель машинного обучения, используемая для измерения качества шанса путем расчета вероятности гола для каждого удара, сделанного в игре. Когда мы вычисляем xG выстрела, модель xG вычисляет вероятность гола на основе нескольких факторов (параметров): место выстрела; расположение ассиста; тип выстрела; тип помощи; наличие ведения стрелка перед выстрелом; заявление об игре (открытая игра/стандарт); переходная постановка (позиционная/контратака); и оценка наблюдателем опасности выстрела.

Все эти параметры (плюс несколько технических) используются для обучения модели машинного обучения xG на исторических данных и прогнозирования вероятности того, что бросок будет засчитан. Большая вероятность указывает на большую вероятность выигрыша по указанным параметрам. Выстрел со значением xG 0,3 оценивается в 30% случаев по всем параметрам. Штрафы легче рассчитать.

Согласно данным Wyscout, вероятность реализации пенальти составляет около 76 %. Таким образом, значение штрафа xG было установлено равным 0,76. Ожидаемое количество голов против (xGA) — это вероятность того, что удар соперника приведет к забитому голу, исходя из приведенных выше атрибутов. Для простоты xG соперника обозначается как xGA. Ожидаемая разница голов (xGD) рассчитывается путем вычитания значения xG из значения xGA. В практической части этой диссертации мы используем модель xG для оценки эффективности вбрасывания.

Модель ожидаемого прохождения (xPass)

Маттиас Кулловац разработал модель машинного обучения Expected Pass (xPass). xPass вычисляет вероятность успешного прохождения. Успешный пас - это пас, который напрямую находит товарища по команде пасующего. Чтобы быть точным, эта модель присваивает вероятность каждой передаче на основе нескольких параметров из набора данных: местоположение пасующего, местоположение получателя, угол паса, расстояние паса, тип паса (длинный мяч / сквозной мяч) и т. д.

Модели ожидаемого выброса (xThrow) и ожидаемого удержания (xRetain)

Аналитические модели xThrow и xRetain используются для прогнозирования вероятности завершения вбрасывания и вероятности сохранения владения мячом после вбрасывания на основе определенных критериев. Элиот МакКинли разработал эти модели на основе концепции xPass, но включил несколько дополнительных возможностей (параметров). Используемые здесь модели идентичны моделям, использованным в статье Элиота МакКинли. Тем не менее, они будут обучаться на другом наборе данных из другой лиги, поскольку цель состоит в том, чтобы понять шаблоны набора во многих футбольных лигах, таких как Чешская футбольная лига.

Исследовательский анализ данных футбольных вбрасываний с использованием 4 ключевых параметров

Прежде чем создавать любую модель машинного обучения для футбола, необходимо получить представление о влиянии многочисленных факторов на целевая переменная. Эти функции используются в модели машинного обучения, основанной на опыте в области футбола и ранее созданных моделях, например, модели ожидаемого броска Эллиота. На следующих рисунках показано, как функции влияют на целевую переменную (завершение), сохранение владения мячом при бросках и вероятность забить гол на основе статистики xG и Gls, а также то, как они менялись с течением времени.

  1. 1. Место окончания вбрасывания

Чтобы описать визуализацию шага, каждый бин имеет значение, указывающее вероятность выполнения целевой переменной. Эти значения были сглажены, чтобы сделать визуализацию более понятной. Серая стрелка, расположенная рядом с визуализацией футбольного поля, указывает направление игры. Визуализация включает цветные полосы, описывающие математическое значение цветов. Тепловые карты были нормализованы с использованием минимума/максимума как 0/1, чтобы подчеркнуть закономерности между этими двумя статистическими характеристиками.

Что касается конечных точек всех вбрасываний в наборе данных, существует общая тенденция: чем ближе мяч вбрасывается к воротам соперника, тем меньше вероятность того, что вбрасывание будет завершено. Владение сохранение его аналогично. Тем не менее, с точки зрения вратаря, с точки зрения вратаря, более высокая вероятность того, что вбрасывание будет сохранено в центральной зоне защиты поля, как показано ниже. Однако данные отслеживания, содержащие координаты всех игроков на поле, недоступны для подтверждения этой идеи; прессинг игроков соперника снижает вероятность владения мячом у боковой линии поля.

Probabilities of Throw-ins by End Location

Вероятность вбрасываний в зависимости от конечного местоположения

Существенным аспектом этого анализа данных о вбросах является определение какая зона имеет наибольшие шансы забить и пропустить гол (xG/xGA) после вбрасывания в течение 15 секунд. На изображении ниже показана разница в средних значениях xG и xGA, связанных с окончательным местом вбрасывания. Отрицательный xGD показан красными ячейками, равный xGD обозначен белыми ячейками, а положительный xGD выражен синими ячейками. Неудивительно, что значение xGD больше, когда место окончания вбрасывания находится ближе к воротам соперника, потому что это соответствует xGD всех бросков.

xGD difference from throw-ins by the end location

Разница xGD с вбрасываниями (в течение 15 секунд) по конечной точке.

2. Расстояние вбрасывания

Для начала рассмотрим расстояние вбрасывания. Связь между указанными статистическими показателями и дистанцией вбрасывания внутри каждой зоны визуализирована на рисунке ниже. Чем длиннее вбрасывание, тем ниже вероятность успеха, что справедливо для всех зон. В центральной зоне поля вероятность того, что вбрасывание попадет непосредственно к товарищу по команде, выше. Девяносто процентов вбрасываний с расстояния менее 5 метров завершены. Пик скорости завершения составляет от 5 до 10 метров. Частота выполнения вбрасываний с дальности более 30 метров снижается до 78%.

Probabilities of throw-ins by the throw-in distance

Вероятность вбрасывания в зависимости от расстояния вбрасывания

В зоне защиты удержание владения мячом снижается по мере увеличения дистанции вбрасывания , за исключением корзины с 30+ метрами вбрасывания, когда удержание владения немного увеличивается. В средней зоне владение мячом в течение 7 секунд не сильно различается в зависимости от интервала дистанции; вероятность колеблется между 55 и 58 процентами, что является незначительным изменением. За исключением зоны 30+ м для атакующих бросков, где углы броска распределены более равномерно, чем на 25-30 м, наблюдается тенденция к снижению. В средней зоне средний xGD постоянен. Кроме того, в контейнерах все чаще наблюдается тенденция к разделению оборонительных и наступательных зон.

Для иллюстрации на приведенном ниже рисунке показано распределение длинных атакующих бросков для этих двух ранее упомянутых корзин с синими стрелками, указывающими направление каждого броска. Серый оттенок обозначает три отдельные зоны. Обе корзины предлагают одно поле, чтобы визуализировать их распределение вбрасываний. Корзина с длиной вбрасывания 25-30 метров содержит более высокий коэффициент прогрессивных вбрасываний по сравнению с корзиной с длиной вбрасывания 30+ метров. Мы уже знаем, что согласно модели xG бросок мяча ближе к воротам противника увеличивает вероятность забитого гола. Основываясь на фактах, представленных до сих пор, ячейка длиной более 30 метров имеет более высокую вероятность сохранения владения и более низкий средний xGD, чем ячейка длиной 25-30 метров.

The distribution of long attacking throw-ins

Распределение длинных атакующих бросков.

<сильный>3. Угол вбрасывания

Далее рассмотрим угол вбрасывания. Метательные сонары являются дополнительными компонентами рисунка, показанного ниже, а не линейными графиками, как на предыдущей диаграмме вероятности выше. Каждый кусочек пиццы представляет собой корзину. Последовательность бинов начинается слева с бина под углом 180-150 градусов и прогрессирует с шагом в 30º, как показано на линейном графике ниже. Темно-синий фрагмент пиццы отражает процент завершенных бросков мусорного ведра в зоне, тогда как светло-синий фрагмент указывает на коэффициент сохранения владения мячом.

Значения в шестиугольниках на срезе в диапазоне от 0 до 100 обозначают их процент. Что касается вбрасываемых гидролокаторов, то принципиальной разницы между каждой зоной нет. Вбрасывания, направленные к воротам противника, с меньшей вероятностью будут завершены или сохранены.

Probabilities of throw-ins by the throw-in angle with sonars

Вероятность вбрасывания по углу вбрасывания с помощью гидролокаторов.

Тот факт, что угловой бин с 120º–150º ближе к положительному значению среднего значения xGD в оборонительной зоне, является интересным фактором для рассмотрения. Это угловая корзина с наибольшей вероятностью выполнения завершенного или сохраненного вбрасывания. Среднее xGD угловой корзины с перпендикулярными и слегка прогрессивными вбрасываниями снижается до локального минимума. Только после этого два наиболее прогрессивных угловых интервала (с диапазоном от 0° до 60°) начинают приближаться к положительному значению среднего значения xGD.

Другими словами, наиболее успешная стратегия — инициировать вбрасывание из зоны защиты немного назад. В средней зоне небольшая восходящая тенденция по бинам предполагает, что более прогрессивные вбрасывания немного увеличивают вероятность забить и избежать пропущенного гола. Восходящая тенденция xGD справедлива для атакующей зоны. Стоит отметить, что когда берущий, стоящий в зоне атаки, приближается к флажку, тенденция xG (а также коэффициентов успеха и удержания владения) меняется на противоположную, что делает более выгодным выполнение вбрасываний перпендикулярно или немного назад в с точки зрения связи вероятности угла вбрасывания.

<сильный>4. Время приема

Вставки на изображении ниже показывают вероятность, связанную с характеристикой — временем, прошедшим с момента последнего действия. Во всех зонах чем быстрее бросает берущий, тем больше вероятность успеха или сохранения владения мячом; однако скорость завершения снижается через бины через 10-15 секунд после последнего действия. Большие прыжки через корзину для сохранения владения говорят нам о том, что время вбрасывания оказывает более значительное влияние на удержание владения, чем полнота. Удержание владения, с другой стороны, работает аналогично, но с небольшой задержкой около 5 с. Мы можем приписать знание предметной области, так как противник может выстроить защиту в течение 15 секунд, что делает успешный бросок (или сохранение владения мячом) более сложным для исполнения.

Probabilities of throw-ins by timing

Вероятность вбрасывания по времени

Защитная и средняя зоны сопоставимы по среднему xGD. На приведенном выше рисунке показано, что время не оказывает существенного влияния на xG от вбрасывания в этих двух зонах. В зоне атаки среднее значение xGD кажется больше, когда берущий ждет идеального варианта, такого как длинные вбрасывания, направленные в сторону штрафной площадки, которые требуют больше времени, поскольку берущий должен подбегать, чтобы увеличить дистанцию ​​и иногда бить. мяч для лучшего сцепления. Как указывалось ранее, исходя из среднего значения xGD, этот вид вбрасывания имеет больше шансов забить гол, чем пропустить.

Два (2) основных приложения анализа данных и машинного обучения в футболе

За последние несколько лет экспоненциальная скорость совершенствования технологий, поддерживающих сбор, хранение и анализ данных, сопровождалась экспоненциальным ростом человеческого капитала, вложенного в спортивную аналитику. Это привело к резкому увеличению количества и качества наборов данных.

Однако мы считаем, что прогресс, который мы наблюдали в отрасли за последние пять лет, будет ничтожным по сравнению с тем, что произойдет в ближайшие пять лет. По мере того, как наборы данных росли и совершенствовались, количество потенциальных приложений анализа данных в игре увеличивалось, превращая «футбольную аналитику» в общее понятие. Ниже мы попытаемся обобщить основные области применения.

  1. Профилактика травм и реабилитация
  2. Анализ эффективности

* Профилактика травм и реабилитация

С первых дней 21 века наблюдается постоянное улучшение и интерес к исследованиям тренировочных нагрузок клубов. Студии в огромной степени позволили спортивным ученым основывать свои анализы на прочном фундаменте. Сегодня многие ведущие клубы постоянно отслеживают положение игроков на поле и измеряют их скорость с помощью GPS, который в совокупности определяет внешнюю нагрузку или работу, выполняемую каждым игроком. Внешнее отслеживание нагрузки с помощью GPS может помочь прогнозировать риски травм профессиональных игроков.

Football medical team treating an injured football player

Футбольная медицинская бригада оказывает помощь травмированному футболисту

Недавнее исследование Science Daily показывает, что футбольные травмы можно прогнозировать аналитически, анализируя нагрузку футболистов во время тренировки и матчи. Исследователи обнаружили, что наибольший риск травм возникал, когда игроки накапливали очень большое количество коротких всплесков скорости во время тренировок в течение трех недель.

В течение недель, предшествовавших травме, игроки набирали значительно больше метров в минуту, чем в среднем за сезон, что указывает на повышение интенсивности тренировок и игры в преддверии травм. Текущие исследования спортивной биомеханики подтверждают эту тенденцию, показывая, что модели движений спортсменов ухудшаются потенциально опасным образом при повторении интенсивного бега и смены направления.

* Анализ эффективности

Анализ больших данных и машинное обучение помогают нам находить противоречивые факты о футболе, на основе которых мы можем построить инновационную и выигрышную стратегию. Футбольные клубы, а также средства массовой информации и даже болельщики могут с помощью данных легко понять, как команда или игрок выступали на протяжении матча или сезона.

Даже самые основные статистические данные, такие как количество ударов, попаданий в створ и владение мячом, могут быть полезными. Если затем мы улучшим детализацию статистики и включим выбранные показатели эффективности, набор данных постепенно начнет давать более определенную и полную картину того, что произошло на поле, что позволит провести детальный анализ игры. Такая детализация может дать тренеру больше информации о том, как команда выступила и выполнила ли она предматчевые инструкции.

Анализ производительности обычно включает видео и данные. Все чаще встречаются тренеры, которые могут делиться послематчевыми комментариями со своими игроками, объясняя им, что они сделали не так или что можно улучшить с помощью видео и статистики. В конце концов, демонстрация объективных фактов — более эффективный и убедительный способ изложить свою точку зрения.

Округление

Аналитика данных и машинное обучение будут по-прежнему играть огромную роль в понимании того, как футбольные переменные, особенно вбрасывания, влияют на игру команды.

Когда владельцы клубов и должностные лица получат возможность анализировать футбольные данные, они смогут реализовать основанные на данных стратегии, чтобы эффективно получить конкурентное преимущество. Поэтому мы рассчитываем на еще более цифровую футбольную аналитику, благодаря которой данные помогут повысить эффективность игроков, снизить количество травм, сократить расходы и гарантировать победы командам и лигам.

Что дальше?

Хотите устроиться на работу своей мечты, переключиться на прибыльную карьеру с доходом в миллиард долларов или улучшить свои знания в своей области? Почему бы не поучиться у мастеров? Станьте грамотным в работе с данными, расширяя свои знания в области науки о данных, машинного обучения, искусственного интеллекта и языков программирования в своем собственном темпе.

Мы предоставим вам соответствующие навыки работы с данными, чтобы оставаться актуальными в революционной цифровой экономике. Свяжитесь с нашей командой прямо сейчас и откройте для себя мир возможностей в науке о данных, искусственном интеллекте и машинном обучении.

Первоначально опубликовано здесь


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE