Я всегда интересовался баскетболом и однажды подумал о том, как мне применить в спорте то, что я изучил на занятиях по статистике. Наблюдая за более неизвестными игроками, такими как TJ Leaf и Jeremy Lamb, было сложнее сказать, что за игроки, чем возможность определить, что Стеф Карри был стрелком с 3 очками, а Крис Пол и Раджон Рондо были плеймейкерами. Я решил проверить, смогу ли я создать модель, которая определяет, можно ли отнести игрока к категории стрелка с 3 очками, игрока в стойке, защитника, плеймейкера или универсального игрока, используя наивные байесовские классификаторы, тип вероятностного классификатора. на основе теоремы Байеса.

Моя первая задача после загрузки данных из Basketball Reference заключалась в том, чтобы определить, какие статистические данные следует хранить и применять в качестве классификатора. Я удалил всю статистику, касающуюся общих показателей карьеры, таких как общее количество выигрышей и количество начатых игр.

В моем классификаторе были данные, которые можно было найти в таблице очков, такие как 3 выполненных очка, 2 выполненных указателя, а также блоки и кражи, а также более продвинутая статистика, такая как% блокировок и краж, частота попыток 3 очка и частота попыток штрафных бросков. это могло помочь классифицировать игроков, которые были основными слэшерами и, таким образом, могли бы чаще добираться до линии фола. Я использовал великих историков, таких как Майкл Джордан, Шак и Рэй Аллен, в качестве данных, которые должны были использоваться при построении прогнозов современных игроков.

Результаты - Мои результаты в основном ожидались в соответствии и были созданы точно.

Я применил эту модель к каждому игроку, который играл в сезоне 2018–2019, но при загрузке на Tableau выбрал определенных игроков и команды, в которые нужно было погрузиться.

Я протестировал его на 6 игроках, с которыми Warriors больше всего играли в плей-офф, и получил ожидаемые результаты. Андре Игуодала и Кевон Луни были вашими защитными стопорами с Игудалой на флангах и Луни в штанге. В тылу Стивена Карри и Клэя Томпсона были стрелки с 3 очками, а Дреймонд Грин и Кевин Дюрант были вашими универсальными игроками, которые могли делать почти все.

Судя по этим расчетам, в лиге не хватало слэшеров и плеймейкеров, но это имеет смысл, учитывая, что простоям сложнее определить, поэтому большинство слэшеров в лиге относятся к стражам и крыльям, которые очень часто стреляют двойками и имеют выстрел с 3 очками, который исправен. Данные совпали с ожидаемыми: ДеАарон Фокс, Деррик Роуз, ДеМар ДеРозан и Джру Холидей были в числе самых известных слэшеров в лиге. Это имеет смысл, поскольку похоже, что алгоритм предпочитает более быстрые и быстрые защиты.

Я также попытался провести анализ команды Toronto Raptor вместе с бывшим звездным Raptor и нынешним игроком Spurs ДеМаром ДеРозаном. Кавай Леонард был классифицирован как универсальный игрок, что неудивительно, но Паскаль Сиакам также был классифицирован как универсальный игрок. Учитывая, что этот алгоритм классифицирует многих лучших баскетболистов как универсальных игроков, было бы интересно посмотреть, повернет ли Сиакам за угол и станет ли в следующем году Матч звезд после ухода Леонарда. Кайл Лоури, разыгрывающий команды, был классифицирован как стрелок с 3 очками, но также как плеймейкер, что имеет смысл, поскольку он в значительной степени способствовал атаке.

Я выбрал 3 случайных игроков для анализа и в итоге выбрал центрового Деандре Эйтона, разыгрывающего Милоша Теодосича и центрового Вилли Коли-Штайна. Их классификация довольно точна: Коли-Штайн ценится за его защитные способности, а не за его атакующие, а Милош Теодосич классифицируется как чистый плеймейкер в царствах Раджона Рондо. С другой стороны, Эйтон, я могу утверждать, что он был лучшим внутренним игроком, чем защитник в своем первом сезоне, поэтому я бы сказал, что прогноз был немного неверным.

Моей последней группой игроков, которую я хотел исследовать, были новички и второкурсники прошлого сезона. Лука Дончич был единственным выдающимся игроком в многоборье, что интересно, потому что это может означать его рост в потенциальную пятерку игроков лиги в будущем. Лонзо Болл и Франк Нтиликина, два разыгрывающих, отдавших первый пас, сделали точные прогнозы, поскольку оба играли плеймейкерами. Трей Янг также был точным классификатором, когда он вошел в лигу как миниатюрный Стивен Карри.

Проблемы: Некоторые из проблем, которые были задействованы, касались количества защитников в классификациях. Я объясняю это тем фактом, что защитники набирают меньше очков и, таким образом, большинство игроков на скамейке запасных автоматически попадают в эту категорию независимо от защиты, но я хотел бы дополнительно изучить это, удалив защиту и в следующий раз работая только с атакующей статистикой.

Что я могу сделать с этими данными: Точная проекция игрока - это то, что ищут все в лиге. Что касается статистики в таких местах, как Прибалтика, где разведка менее доступна, в конечном итоге модели могут выполнять свою работу по классификации игроков, даже не наблюдая за их игрой.