«Уютный тет-а-тет с другом и воспоминания о нем, хороший сон в удобной постели после напряженного рабочего дня, качественное времяпровождение с семьей, волонтерство для дела, в которое вы действительно верите, и вы всегда хотел помочь, смотреть в глаза этому человеку и дать ему почувствовать, насколько он особенный для тебя… »- вот лишь некоторые из лучших вещей в нашей жизни. Существует огромное количество таких обстоятельств, которые действительно помогают нам раскрыть все самое лучшее. Если вы внимательно посмотрите на эти вещи, вы будете очень удивлены, узнав, что все эти лучшие моменты нашей жизни имеют общую характеристику. Да! как следует из названия, «САМЫЕ ЛУЧШИЕ вещи в жизни всегда БЕСПЛАТНЫ».
Сохранять спокойствие! этот пост не о философских аспектах нашей жизни: D. В этом посте я собираюсь отдать свои два цента за обучающую платформу, которая на 100% бесплатна (да, это ЗОЛОТАЯ шахта), где вы можете «делать и учиться». Да! «делай и учись». Пожалуйста, оставайтесь со мной на протяжении всего процесса, я буду объяснять каждую минуту информацию, которую вам нужно знать об этой обучающей платформе. Приведем колеса в движение: D
Я всегда хотел узнать о данных и инженерии данных. Имея опыт работы в области компьютерных наук и имея опыт работы в областях Распознавание образов, Интеллектуальный анализ данных и хранилище данных, Распределенные системы, Высокопроизводительные вычисления ++, я понял, что это вопрос соединения всех точек. Так что я начал серьезно относиться к начать заниматься наукой о данных и инженерией данных. В конце концов я приземлился на Kaggle. Я начал учиться у сверстников, и это дало мне большой толчок. Всякий раз, когда я пытался начать с новой проблемы, мне приходилось возвращаться к предыдущим проектам, которые я делал (что совершенно нормально: D). Я начал с Исследовательской аналитики данных [1] [2] и постепенно учился строить модели и делать серьезные вещи. В то время я проводил анализ рентабельности между Python и R, и я подумал о том, чтобы придерживаться Python.
Python - один из многих способов начать работу. Сначала я думал об освоении как Python, так и R, затем, прочитав несколько тем Reddit и Quora, я пришел к выводу, что на данный момент я собираюсь придерживаться Python. Основная причина в том, что Python больше похож на выбор инженера, где R был выбран статистиками.
Вначале это было медленное, но верное путешествие. Чтобы делать «серьезные вещи», я знал, что мне нужно вытащить палец и «усердно работать». «Усердно работать» означает расширить мое понимание тем в «науке о данных» (я всегда стараюсь найти баланс между «наукой о данных» и «инженерией данных», поскольку я лично предпочитаю работать в полном спектре).
Это момент, когда я осознал важность углубления моего понимания нейронных сетей. Квест начался снова. Я наткнулся на несколько крупных ведущих онлайн-курсов: Нейронные сети для машинного обучения профессора Джеффри Хинтона, Специализация по глубокому обучению профессора Эндрю Нг и Искусственный интеллект - наноразмерная степень глубокого обучения от Udacity. Это, несомненно, лучшие ресурсы для освоения нейронных сетей и преуспевания в них. Вы можете изучить все эти материалы бесплатно (если вы хотите получить сертификат, то вам нужно только заплатить). Несмотря на то, что эти ресурсы являются лучшими и наиболее # трендовыми подходами, которым многие следуют, я все же продолжал искать правильный ответ на свой квест. Затем я наткнулся на площадку Удэмы. После тщательного обзора курсов Udemy я выбрал Глубокое обучение A – Z ™: Практические искусственные нейронные сети, поскольку этот курс сразу же переходит к реализации, не углубляясь в математику. Этот курс стоит 10 долларов США, и я был не против потратить эту сумму на изучение материала, который дает мне хороший импульс. Если вы хотите изучить глубокие концепции и математику, лежащую в основе нейронных сетей, вам необходимо прочитать дополнительные материалы (преподаватели этого курса предоставляют ссылки на эти материалы). Я все еще искал правильный ответ, подходящую платформу для изучения нейронных сетей. В те дни я провожу много времени, сравнивая точку зрения каждого пользователя на Reddit и Quora.
Случилось: D
Я не могу точно вспомнить историю. Я твердо верю, что платформа для обучения, которую я нашел после серьезного поиска, - это правильный ответ на мои потребности.
fast.ai
Имея опыт работы в области компьютерных наук и проработав в отрасли и исследованиях в области компьютерных наук более двух лет, я убежден, что для меня, чтобы изучать нейронные сети, должен быть другой подход, а не сначала изучение теории, а затем ее внедрение, а затем соревнуйтесь в Kaggle, что является разговорным подходом. Fast.ai предлагает практический способ освоить Deep Learning, сразу приступив к написанию кода и реализовав настоящие соревнования Kaggle. Затем, постепенно, он выстраивает твердое понимание основных концепций нейронных сетей, того, как эти концепции могут быть применены к сценариям реального мира, их (нейронных сетей) ограничений. Что действительно очаровывает меня в этом курсе, так это то, что инструкторы этого курса делятся своим собственным опытом, и этот опыт помогает мне соединять точки, о которых я упоминал ранее.
Кратко расскажу об инструкторах этого курса.
Основателями fast.ai являются Джереми Ховард, научный сотрудник Университета Сан-Франциско (ненасытный Кагглер (№1)), и Рэйчел Томас, выбранная Forbes в качестве одной из 20 невероятных женщин, продвигающих исследования искусственного интеллекта . Я рекомендую вам взглянуть на fast.ai/about, чтобы получить больше информации об этих двух невероятных персонажах. Эти две прекрасные души сделали этот курс абсолютно бесплатным для всех ❤
Позвольте мне рассказать вам о курсах, которые предлагаются на fast.ai.
Практическое глубокое обучение для кодеров, часть 1
Это правильная отправная точка для любого, кто имеет опыт работы в области компьютерных наук (или других связанных дисциплин), чтобы начать свой путь в области нейронных сетей. Следуя этому курсу для начинающих, вы будете участвовать в настоящих соревнованиях Kaggle. Среда разработки - Amazon Web Services (AWS) или Paperspace. К концу 7 видеороликов вы получите полное представление о том, «как подойти к вопросу исследования с использованием подхода глубокого обучения». Если вы потратите 6–10 часов в неделю на понимание содержания, вы сделаете первые инвестиции в свою будущую карьеру в качестве специалиста по глубокому обучению. Каждое из этих видео длится не более 2 часов, при просмотре хорошо пересматривать снова и снова один и тот же контент, пока вы не усвоите основы. Это платит БОЛЬШУЮ отдачу. Я все еще слежу за этим курсом, и я сделаю краткий ретроспективный анализ того, что я узнал до сих пор.
Передовое глубокое обучение для кодеров, часть 2
Это продолжение первой части «Практическое глубокое обучение для кодеров, часть 1». Я все еще не начал этот курс, поэтому позвольте мне рассказать, что обещает дать эта часть 2.
Передовое глубокое обучение для программистов, часть 2, где вы узнаете о последних достижениях в области глубокого обучения, о том, как читать и внедрять новые научные статьи, а также о том, как решать сложные комплексные задачи, такие как как перевод на естественный язык (извлечено из https://course.fast.ai/lessons/lessons.html)
Довольно захватывающе правильно: D Я с нетерпением жду возможности «начать делать» эту часть, как только завершу первую.
Возможно, вы думаете, что этот курс посвящен только глубокому обучению. Сохранять спокойствие!!! . И Джереми, и Рэйчел начали fast.ai с целью сделать глубокое обучение доступным для всех. Когда я был на форумах fast.ai, как-то назад я заметил, что эти две прекрасные души выпустили курс по машинному обучению.
Еще одно удовольствие! Ранний доступ к видеороликам «Введение в машинное обучение »
Это третий курс, предлагаемый fast.ai. Хотел бы я найти это на самых ранних этапах моей карьеры в области машинного обучения. В этом курсе Джереми и Рэйчел обсуждают, как можно улучшить свои навыки применения концепций машинного обучения к проблемам реального мира с помощью соревнований Kaggle. Я начал следить за этим материалом, чтобы еще больше углубить свое понимание машинного обучения, чтобы применить машинное обучение к реальным проблемам.
Хорошо, а теперь позвольте мне поделиться своим опытом, подписавшись на fast.ai. Я не буду вдаваться в подробности. Поскольку теперь вы знаете ценность этой платформы fast.ai, я призываю вас испытать эту платформу. Вкратце, я собираюсь отразить то, чему я научился на этой платформе (насколько далеко я ушел от того места, где начал: P).
Собаки против кошек
Собаки против кошек - это соревнование, проводимое в Kaggle, и это первая задача, которую Практическое глубокое обучение для кодеров, часть 1 пытается найти решения с помощью современного подхода. Этот конкурс направлен на разделение изображений на два класса: кошки и собаки. Изначально нам был предоставлен набор обучающих данных, которые помечены соответствующим образом. Наша задача - разработать классификационную модель с использованием этого обучающего набора данных. Наконец, разработанная модель должна правильно классифицировать набор тестовых данных, которые не имеют маркировки. Хорошо, это звучит просто. Но когда вы начнете выполнять задачу, вы столкнетесь с огромным набором новых вещей, с которыми вы никогда раньше не сталкивались.
После завершения этого соревнования я узнал следующее:
- Настройка AWS для глубокого обучения - сначала это может показаться вам странным. Но я думаю, это не могло показаться странным для такого новичка, как я в то время. Для обучения и разработки моделей глубокого обучения вам необходимы большие вычислительные мощности. Раньше я пробовал несколько небольших задач глубокого обучения. Но у меня не было этого требования для перехода на облачную инфраструктуру. Настройка AWS для глубокого обучения дала мне большой опыт работы с инфраструктурой AWS. Я узнал об экземплярах «t2.xlarge» и «p2.xlarge». Настройка ролей в AWS IAM, создание пользователей AWS, применение политик к пользователям, экземпляры EC2, Корзины S3, защищенная учетная запись root при ведении журнала приложения uthenticator, VPC, Dynamo DB и многие другие ++ (последние четыре Я научился, просто играя с консолью управления AWS).
- Настройте AWS на локальном компьютере и используйте псевдонимы для запуска, остановки, получения идентификатора экземпляра через псевдонимы командной строки.
- Использование tmux в многозадачном режиме (раньше tmux не использовался :(: P)
- Модель VGG16 и конкуренция ImageNet. Модель VGG16 - это предварительно обученная модель, использующая широкий спектр помеченных изображений. Основной характеристикой этих изображений, которые использовались для обучения модели VGG16, является то, что эти изображения хорошо видны на самом изображении. Я имел в виду, что на обучающем изображении не видно никаких других объектов, кроме единственного видимого изображения. Позвольте мне быть более ясным. В левой части изображения мы можем ясно видеть собаку на изображении, где, как и в правой части, мы можем видеть двух собак, но эти собаки не являются центром притяжения. Модель VGG16 обучена с использованием изображений, аналогичных левой стороне. Вы можете обратиться к ImangeNet [3] [4] для получения более подробной информации.
- Примените тот же набор методов к другим задачам классификации изображений - вам просто нужно создать ту же структуру папок.
- Чтобы понять и применить модель VGG16
Я думаю, этого достаточно, чтобы вы поняли, почему этот курс является САМЫМ ЛУЧШИМ. Этот курс и вторая часть этого курса теперь развились на гораздо более сложный уровень. В последней серии Джереми Ховард использует библиотеку fastai в качестве базовой библиотеки для всех проектов. На этот раз (по состоянию на 2018 год) облачная инфраструктура от Paperspace.
Теперь позвольте мне рассказать вам о некоторых ключевых результатах обучения, которые я получил после выполнения первого задания из серии видеороликов «Введение в машинное обучение».
Синяя книга для бульдозеров
Это первый проект Kaggle, который Джереми обсуждал в серии Введение в машинное обучение. Цель этого проекта - спрогнозировать продажную цену, которая является переменной, зависящей от непрерывного значения. В этом проекте собраны данные за многие годы. В задаче используется алгоритм Случайный лес. Джереми сразу переходит к вопросу о том, как Случайный лес можно использовать при разработке успешной прогнозной модели. В процессе создания модели и после того, как она построена, он идет глубже и охватывает широту и глубину.
Я призываю вас следить за этими замечательными БЕСПЛАТНЫМИ материалами. Вы найдете это чрезвычайно полезным. Присоединяйтесь к очень интересному форуму сообщества. Я гарантирую, что вы узнаете много интересного от своих коллег. Моя конечная цель в этом посте - рассказать вам, ребята, об этой замечательной платформе fast.ai. Вот почему я использовал только два сценария для выяснения достоинств этой платформы. Я твердо уверен, что мне удалось эффективно донести это послание до вас.
Ниже приведены ключевые моменты, которые я хотел бы выделить после выполнения этой первой задачи:
- Во-первых, я многое узнал о Jupyter Notebook - в основном, чтобы просмотреть реализации функций и документацию в самом блокноте, сочетания клавиш, отладку ++
- Значение свойства «дата» - «дата» может состоять из формата «год-месяц-дата» или «год-месяц-дата-час-минута-секунда». В любой задаче временного ряда чрезвычайно важно тщательно изучить параметр «дата». От «даты» мы можем получить «неделя года», «неделя даты» и многие другие характеристики. Эти функции помогут лучше понять наши данные. Все мы знаем, что разработка функций - важная часть машинного обучения. Если вы просмотрите это видео на платформе fast.ai, вы будете поражены и убеждены в технической разработке функций.
- Процесс и важность преобразования «строковых переменных в категориальные переменные» и то, как внутренняя работа библиотек Python присваивает числовые значения переменным после выполнения этой категоризации.
- Обработка пропущенных значений (числовых и категориальных)
- Сохраняйте данные в том формате, в котором они сохраняются в ОЗУ - эта методика помогает быстро получить проект.
- Способы улучшения регрессора случайного леса
Вкратце, это то, что я узнал после выполнения первого задания.
На этом я хотел бы завершить этот пост и выразить вам сердечную благодарность. Сообщите мне свои мысли и комментарии по поводу этого сообщения. Я восхищаюсь вашими отзывами. Если вы сочтете этот пост полезным, поделитесь с друзьями на Faceboook, Twitter, Google+ и других социальных сетях. Не стесняйтесь дать мне один хлопок, два хлопка, три хлопка или, возможно, большие аплодисменты, чтобы мотивировать меня. Это определенно помогло бы мне сохранить импульс.
Как я уже упоминал в заголовке этого поста:
САМОЕ ЛУЧШЕЕ в жизни - БЕСПЛАТНО !!!
[1] https://www.kaggle.com/omarelgabry/a-journey-through-titanic
[2] https://www.kaggle.com/mrisdal/exploring-survival-on- титаник
[3] https://www.image-net.org/
[4] https://image-net.org/explore