Как работал алгоритм машинного обучения?

Как и у многих из вас, у меня сломался кронштейн. Но это не обязательно вина машины! Ему по-прежнему нужен человек, чтобы просматривать бегущую ленту и принимать решения на основе совпадений. Я виню себя, правда. Для справки, вот команды, которые действительно вышли в «Финал 4» в этом году:

Северная Каролина, Южная Каролина, Гонзага, Орегон

Вот команды, которые понравились машине из моего поста от 04.02.17:

Я считаю, что все эти команды прошли на турнир. В ПОРЯДКЕ! И многие из них сделали это хотя бы по паре раундов. Никаких признаков СК. Хм. Посмотрим, какие прогнозы выдала мне машина за день до начала турнира. (15.03.17)

Так что это был подбрасывание монеты между Виллановой и Канзасом. Обе команды проиграли, но я бы набрал еще несколько очков, выбрав Канзас или Гонзагу в качестве своего пони. По-прежнему никаких признаков SC, и Орегон фактически опустился с 9-го места на 23-е место (скриншот ниже). Шансы Гонзаги выросли с 4-го на 3-е. NC поднялся с 8-го на 5-е место. Похоже, Южная Каролина занимает 34-е место. 0,02 % шанс попасть в финальную четверку.

Так в чем же секретный соус? Какие функции использует машина, чтобы делать эти проницательные прогнозы? Это удивительно просто.

Ему очень нравится, как высоко Ассошиэйтед Пресс оценивало каждую команду на протяжении всего сезона. Он оценивает процент выигрыша и силу графика. Оказывается, на самом деле не имеет значения, являетесь ли вы отличной атакующей или оборонительной командой. Я беспокоюсь, что эта модель немного не подходит. Слишком просто. Тут больше факторов. Самое сложное в машинном обучении — это получение хороших данных. Так что в следующем году, я думаю, я дополню модель дополнительными функциями, такими как турнирный посев или более продвинутая статистика команды. Многие скептики спортивной статистики скажут: «сердце не измеришь!» ну, мы приближаемся к этому.