Добро пожаловать в третью часть этой серии статей о реорганизации конференций! Это сообщение в блоге, где мы начнем использовать набор данных для обоснования решений о перенастройке. Есть распространенная жалоба на то, что реорганизация конференции разрушает традиционное соперничество и региональный аспект студенческого футбола. Это правда, что студенческий спорт имеет тенденцию быть региональным. Это даже в названии самих конференций: Pacific 12, Atlantic Coast, Southeast и Big East Conferences, и это лишь некоторые из них. Некоторые становятся еще более конкретными, когда мы включаем FCS: Конференцию долины Огайо. Конечно, времена региональных конференций в ФБС давно прошли. В последние несколько дней кажется, что Pac 12 тоже может быть пережитком прошлого.
Эта серия состоит из четырех частей (и полное обоснование ее можно найти в части 1):
- Реорганизация студенческой футбольной конференции — исследовательский анализ данных в Python
- Перестройка студенческой футбольной конференции — регресс
- Реорганизация студенческой футбольной конференции — кластеризация
- Перестройка студенческой футбольной конференции — node2vec
Надеемся, что каждая часть серии даст вам свежий взгляд на будущее любимой игры в американский футбол. Для тех из вас, кто не читал части 1 или 2, краткий обзор заключается в том, что я создал свой собственный набор данных, собранный из источников в Интернете. Эти данные включают в себя основную информацию о каждой программе FBS, неканоническую аппроксимацию всех футбольных соперничеств между колледжами, размер стадиона, исторические результаты, частоту появления в топ-25 опросов AP, является ли школа учреждение AAU или R1 (исторически важное для членства в Большой десятке и Pac 12), количество выбранных на драфте НФЛ, данные о доходах от программ за 2017–2019 гг. и последняя оценка количество фанатов американского футбола. В части 1 мы обнаружили, что есть несколько функций, которые сильно коррелируют с размером базы поклонников, поэтому во второй части мы разработали модель линейной регрессии и регрессии случайного леса для прогнозирования размера базы поклонников.
Кластеризация
Моя мотивация для этого поста следующая: сегодняшние конференции основаны на традиционном ядре. Вы можете думать о них как о новом жестком диске компьютера. Четко организованный в непрерывном порядке в региональных конференциях…