Реальное влияние, которое проект оказывает с использованием машинного обучения и науки о данных, может изменить правила игры, когда дело доходит до собеседования на должности, связанные с наукой о данных и машинным обучением.

Существует множество веб-сайтов и блогов, которые подчеркивают важность создания портфолио для получения вашей первой работы в области машинного обучения или обработки данных, если у вас недостаточно опыта. Хотя это не может быть дальше от истины, также важно учитывать, какое влияние эти проекты на портфели оказали в реальном мире, если их применять и использовать. Существует множество онлайн-курсов, которые обучают основам машинного обучения и предполагают, что потенциальный кандидат станет экспертом или специалистом, научив их выполнять исследовательский анализ данных, обработку данных, подготовку данных и прогнозирование моделей на игрушечные наборы данных, Одним из них является знаменитый набор данных Титаник. Я бы сказал, что это может быть хорошим началом, и онлайн-курсы учат правильным основам, необходимым для студента. Но если они просто предполагают, что данные реального мира также могут быть очень похожими, и не следует предпринимать никаких дальнейших действий, это может быть ложным предположением.

Учащийся может ознакомиться с общим процессом машинного обучения, с тем, как выполняется подготовка данных, а также со многими другими аспектами, и это хорошо. Однако реальные данные могут быть довольно сложными с большим количеством отсутствующих и перепутанных значений данных. Поэтому значительное количество времени должно быть потрачено только на разработку функций, чтобы найти релевантную информацию для прогнозов.

Хотя это может быть хорошим началом с решения игрушечных наборов данных в начале, реальная проницательность и навыки в области обработки данных проверяются при решении некоторых интересных реальных задач компании на различных веб-сайтах, таких как Kaggle. . Решение некоторых из этих задач может быть чрезвычайно ценным, так как кандидаты могут узнать, как выполняется обработка данных, и в дальнейшем могут предпринять правильные шаги, чтобы сделать данные более приемлемыми для моделей машинного обучения. В дополнение к этому они также могут обсуждать с другими по пути и выяснять лучшие механизмы обработки данных, которые обеспечивают хорошую производительность моделей в зависимости от показателей оценки.

Если вы ищете интересные проекты, которые вы могли бы добавить в свое портфолио по машинному обучению и науке о данных, не стесняйтесь взглянуть на мою предыдущую статью, где я выделяю некоторые из интересных проектов, которые могут принести большую пользу, когда вы создают сильное портфолио по науке о данных. Вы можете добавить и другие проекты, которые, по вашему мнению, могут оказать влияние. На Kaggle доступно много данных, и компании постоянно ищут людей, которые могли бы решить их проблемы и задачи с помощью машинного обучения и обработки данных. Ниже ссылка на мою предыдущую статью.

«Лучшие проекты для демонстрации в портфолио машинного обучения | Сухас Маддали | MLearning.ai | Середина"

Теперь, когда вы решили создать портфолио с проектами, которые решают некоторые из реальных задач, следующей частью будет определение платформы, которая лучше всего подходит для демонстрации проектов. Есть много способов продемонстрировать свое портфолио со всеми своими работами. Один из самых простых способов продемонстрировать эту работу — на GitHub. Одним из предложений было бы добавить файл readme в самом начале страницы вашего портфолио, где вы могли бы размещать дополнительный контент о проекте и информацию о нем. Вы также можете ознакомиться с моим портфолио на GitHub, где я выделил список всех проектов.

suhasmaddali (Сухас Маддали) (github.com)

Отсутствие опыта в области науки о данных иногда может иметь значение, особенно если вы подаете заявку на те роли, которые связаны с прогнозированием в реальном времени и развертыванием приложений машинного обучения. В таких случаях может быть полезно составить портфолио своих работ и продемонстрировать их во время собеседования, чтобы работодатели также могли узнать, как вы подошли к проблеме и насколько она актуальна для рассматриваемого ими проекта. Если вы ищете идеи о том, с чего начать создание портфолио, или вам нужна дополнительная помощь, не стесняйтесь взглянуть на видео ниже, где я рассказываю, как я на самом деле создал свое портфолио. Вы также можете связаться со мной через LinkedIn или Facebook, чтобы я мог помочь вам в разработке и реализации надежного портфолио.

Заключение

Существует большое количество курсов и сертификатов, которые хорошо освещают основы машинного обучения и науки о данных. Однако для того, чтобы стать великим специалистом по данным, всегда важно также решать некоторые из реальных проблем, изучая проблемы, с которыми сталкиваются компании со своими данными, и то, как они внедряют машинное обучение и науку о данных для решения своих проблем. Прочитав эту статью, вы, должно быть, получили хорошее представление о том, как создать сильное портфолио, и поняли важность создания проектов, которые оказывают влияние в реальном времени. Спасибо, что нашли время прочитать эту статью.

Если вам интересно получать последние статьи по науке о данных, не стесняйтесь подписаться на мой список рассылки, а также стать участником Medium, где вы можете иметь доступ к неограниченным статьям без ограничений.

Ваш членский взнос напрямую поддерживает Сухаса Маддали и других писателей, которых вы читаете. Вы также получите полный доступ ко всем историям на Medium. Нажмите на ссылку ниже, чтобы стать участником Medium всего за 5 долларов в месяц и получить доступ к неограниченному списку статей. Ниже приведена ссылка. Спасибо.

https://suhas-maddali007.medium.com/membership

Ниже приведены способы, по которым вы можете связаться со мной или ознакомиться с моей работой.

GitHub: suhasmaddali (Сухас Маддали) (github.com)

LinkedIn: (1) Сухас Маддали, Северо-восточный университет, наука о данных | LinkedIn

Среда:Сухас Маддали — среда