Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Моделирование в бизнес-информатике на примере спорта




Использование моделирования и аналитических методов на базе бизнес-информатики может эффективно использоваться в области, которая пока на серьезном уровне недооценивается (по крайней мере, в России). Речь об анализе футбольных матчей с помощью продвинутой статистики и их прогнозировании.

Первая область применения – анализ эффективности игры той или иной команды (практически любой метод в данном секторе основан на анализе больших данных). Это недостаточно серьезно развито в мире, поскольку любой прогресс и продвижение в анализе спортивной статистики (и продвинутой статистики) неразрывно связан с американцами – как только они включаются всерьез, наблюдаются подвижки. Так, например, начиная с 1977 года, начали вестись первые целенаправленные и структурированные исследования, связанные с изучением бейсбольной продвинутой статистики. Затем, с середины 90-х, начались аналогичные процессы в баскетболе, и сейчас игра уже совсем другая – наступила эра так называемого цифрового баскетбола.

Без активного включения американцев прогресс в продвинутой спортивной статистике, на мой взгляд, невозможен. Дело в том, что, видимо, дополнительные ресурсы (человеческие и машинные) для таких задач есть только у США. Китай, Индия и европейские страны заняты более приближенными к обычной жизни задачами и на серьезное изучение спортивной статистики у них просто не остается возможностей. И вот сейчас, наконец, в связи с тем, что соккер (так американцы называют европейский футбол, поскольку свой американский футбол – игру, немного отличающуюся от регби – они называют просто футбол) начал завоевывать популярность среди местного населения, потихоньку вытесняя из большой четверки бейсбол. Поэтому многие аналитики переключились с бейсбола и теперь используют схожие методы при анализе футбольной статистики – создают новые модели.

В России этого нет, и основная проблема России в том, что здесь такие идеи не поощряются. В США совершенно спокойно можно защитить диплом на тему продвинутой статистики или появления 13-ти новых позиций в баскетболе (это при том, что на площадке от одной команды всего 5 человек), причем не в каком-то заштатном колледже, а в лучших университетах страны. MIT, Гарвард и любой университет из Лиги Плюща уже давно имеют в своем кампусе целые кафедры и магистерские программы, направление на воспитание новых спортивных статистиков и аналитиков.

MIT год за годом (с 2006) тратит серьезные средства на организацию постоянной конференции «MIT Sloan Sports Analytics Conference». Это самая крупная студенческая конференция в мире, ежегодно привлекающая учащихся из 170 самых престижных университетов, а также представителей различных профессиональных спортивных лиг, и призванная продвигать улучшение методов статистического анализа в спорте.

В России такого нет, и не будет долго. Поскольку здесь, во-первых, нет запроса на такие умения со стороны государства, лиг и клубов (не беря в расчет ЦСКА и «Зенит», которые покупают информацию за рубежом у Опты). Во-вторых, преподаватели не хотят работать над темами, в которых разбираются поверхностно или не разбираются вовсе. Гораздо проще работать с более общей темой.

А в США принято работать с большими данными во всех областях, и самая популярная на данный момент модель, чьей целью служит анализ футбола, это модель xG (expected goals), разработанная американским аналитиком, работающего в первую очередь на ESPN, Майклом Коли. Ее описание достаточно громоздко (не самый подробный вариант занимает более 6000 слов), но суть заключается в следующем: каждому удару, который наносится в матче, присваивается определенный коэффициент опасности. Он высчитывается на основании того, с какой ноги был нанесен удар, каков был тип передачи, с какой скоростью развивалась атаки, каково было расстояние до ворот, каков был релятивный угол к воротам, в какой лиге проводился матч и т.д. На выходе по каждому матчу получаются вот такие таблички:

По сути, это и есть моделирование, основанное на методах бизнес-информатики: симбиоз математики, анализа больших данных и программирования в качестве вспомогательного инструмента (понятное дело, что посчитать вручную данные для каждого матча – очень трудозатратная задача). Важный плюс такой модели в формализации – есть четкие критерии для каждого удара и для каждого компонента при расчете опасности, что позволяет получать достаточно объективные данные по каждой команде и каждому матчу.

Вот выдержка из работы Коли:

В прошлом году я опубликовал похожий метод, но на этот раз, на мой взгляд, удалось добиться существенного прогресса. В поисках возможностей для улучшения, я отсмотрел очень много футбола, и поговорил об этом с людьми. Для более успешного моделирования большую часть времени я посвятил просмотру того, как создаются и предотвращаются голевые моменты, и самое главное – выслушал мнения умных людей по поводу этих эпизодов.

Мой критерий на протяжении всего процесса разработки этого метода сводился к следующему: «Действительно ли он определяет смысл игры в футбол?» В свое время я достаточно скептично относился к методам, основанным на регрессии. Очень легко найти какие-то «значительные» эффекты, когда поневоле ты вынужден проводить регрессию, но это не значит, что вы обнаружили что-то действительно стоящее и относящееся к футболу. Для создания своей системы я, конечно, провел много вычислений, связанных с регрессией, но, в то же время, я пытался убедиться в ее непрерывности и осознать, какие факторы влияют на создание лучших и худших шансов. Такой подход, вероятно, допускает некоторую математическую погрешность, но в то же время, я надеюсь, что логика системы будет передана достаточно четко.

Моя цель заключалась в использовании минимального количества формул, но в то же время создать классификацию моментов и для каждого типа голевых шансов вывести свои формулы.

Результаты этой модели могут быть использованы, например, для анализа ситуации в конкретном матче. Заслуженно ли победила или проиграла команда? Или она была лучше в создании шансов, но ей просто не повезло с реализацией? Или наоборот: она позволила сопернику создать слишком много шансов, и ей повезло, что соперник не реализовал? Так ли хороши были ее шансы?

Но еще более серьезный плюс такой системы – возможность систематизировать данные и анализировать уже на дистанции, когда события определенного матча уже вылетели из памяти, но цифры позволяют сохранять все под контролем.

Массив данных по длительным периодам позволяет говорить о «везении-невезии» и продуктивности команд более конструктивно. Моделирование, основанное на этих данных, позволяет делать сразу несколько вещей. Во-первых, прогнозировать, какая команда скоро пойдет наверх (поскольку она много создает у чужих ворот, позволяет мало создать у своих и имеет хорошую разницу xG, но ей просто не везет), а какая – вниз (у нее обратная ситуация и динамика). Во-вторых, анализировать, какие параметры команде необходимо улучшить. То есть, если у нее высокий xG, но она мало забивает, то надо работать над реализацией. Или, если она много ударов допускает из DZ, но пока мало пропускает, то вскоре это наверняка изменится, и поэтому надо работать над тем, чтобы улучшить защиту в этих зонах.

И такие цифры можно получить по десяткам показателей – есть с чем работать. Достаточно только выбрать правильные (для своей ситуации, так-то они все правильные) показатели из огромных массивов данных.

Еще один вариант – это использование схожих методов моделирования, но для других целей. Например, для того, чтобы обыгрывать букмекеров, а точнее – искать неточности в тех линиях, которые они выставляют на те или иные события. Например, в линиях на статистические показатели (угловые и желтые карточки) букмекерами учитываются только базисные показатели команд по этим значениям, но не учитываются влияние рефери и более глубокие показатели (число кроссов, лонгболлов и ударов, которые влияют на кол-во угловых). Таким образом, если разработать модель, учитывающую эти факторы, то можно будет играть на недооценке тех или иных событий.

Таким образом, методы бизнес-информатики могут помочь занять еще неосвоенную нишу в России и совершить, по сути, небольшой переворот в спорте. Для этого есть все – в том числе благоприятный опыт США и Европы.





Рекомендуемые страницы:

Воспользуйтесь поиском по сайту:



©2015- 2021 megalektsii.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.