5 минут на 5 часов чтения
С Новым Годом! Почти все вокруг меня очень легко перенесли рождественские каникулы — с семьями, без чрезмерных поездок, с очень небольшим количеством работы и большим количеством чтения.
Но сейчас, когда закончилась только первая неделя, уже кажется, что каникулы были несколько месяцев назад. Не так ли?
Что ж, вот три статьи с данными, чтобы уверенно начать 2022 год.
- Машинное обучение в реальном времени: проблемы и решения. Проблема состоит из двух компонентов: онлайн-прогнозирования и непрерывного обучения. Онлайн-прогнозирование, очевидно, включает в себя онлайн-выводы, но в конечном итоге речь идет также о включении функций потоковой передачи, захваченных в режиме реального времени в сеансе пользователя. Преимущество перехода от пакетного прогнозирования к онлайн-прогнозу заключается не только в повышении точности прогнозов, но и в открытии возможности для онлайн-оценки модели. Второй компонент — постоянное обучение — обычно понимается как более частое переобучение моделей. Но, как пишет Чип, дело не в частоте переобучения, а в том, как переобучается модель. Непрерывное обучение на самом деле заключается в тонкой настройке модели на новых данных (обучение с отслеживанием состояния — см. изображение выше). Хотя машинное обучение в режиме реального времени в настоящее время используется в основном технологическими компаниями, это тема, за которой стоит следить. Через три года это вполне может стать мейнстримом. (Чип Хьюен)
- Дизайн в эпоху алгоритмов. Очень актуальная статья 2017 года. Алгоритмы машинного обучения влияют на принятие многих решений вокруг нас. И, как говорит Джош: дизайн и представление данных так же важны, как и лежащий в их основе алгоритм. В этой более длинной статье (идеально подходящей для утренней поездки на работу или позднего вечера WFH) мы отправляемся в путешествие по качелям между техническим прогрессом и разочарованием, когда ИИ и машинное обучение создают много волнений с редкими глупыми моментами. И мы также изучаем десять принципов проектирования, чтобы умерить самоуверенность машин, когда они часто предлагают один вариант, предполагая, что это единственный верный ответ (хотя на самом деле они часто просто гадают). Как я обычно говорю, данные и аналитика редко бывают только данными и аналитикой. (большой средний)
- Почему большинство усилий по аналитике терпят неудачу. Многие компании создают системы данных, чтобы иметь возможность быстро принимать решения на основе данных. Здесь мы конкретно говорим об аналитике событий, включающей огромные объемы данных о событиях, генерируемых действиями пользователей в онлайн-мире. Но большой объем мешает сосредоточиться на нужных вещах, что приводит к большому количеству неудачных попыток аналитики событий. Фундаментальные вопросы для любой такой инициативы: Что вы думаете о том, что отслеживать, как это отслеживать и управлять этим с течением времени? Кристал использует свой опыт, чтобы понять симптомы неудачных проектов по анализу событий и увидеть их реальные причины, и в конечном итоге предлагает процесс поиска ответов на фундаментальные вопросы, указанные выше. (Перековать)
У нас была удивительно теплая погода в Цюрихе в последние пару дней, что позволило мне совместить езду на велосипеде с катанием на лыжах, что было потрясающе. Теперь кажется, что зима вернулась, так что давайте проведем большую часть выходных.
На случай, если вы пропустили выпуск журнала Keeping up with data за последнюю неделю
Спасибо, что прочитали!
Пожалуйста, поделитесь своими мыслями или советами по чтению в комментариях.