Введение

В моих предыдущих двух постах (post1, post2) я поделился своими подробными заметками о Generative AI Learning Path в Google Cloud Skills Boost. Это отличная коллекция курсов для начала работы с GenAI, особенно по теории, лежащей в основе GenAI.

С тех пор я обнаружил еще один отличный ресурс, чтобы узнать больше о GenAI: Learn Generative AI Short Courses от DeepLearning.AI от Andrew Ng.

В этом посте я резюмирую, чему вас учит каждый курс, чтобы помочь вам решить, какой курс выбрать. Я настоятельно рекомендую пройти все 4 курса. Они полны полезной информации и достаточно кратки, так что даже если вы не полностью заинтересованы в теме, вы все равно можете получить хорошее представление о ней за короткий промежуток времени.

Обзор: изучите генеративный ИИ

Learn Generative AI Short Courses состоит из 4 кратких курсов по GenAI. Прохождение каждого курса занимает около 1–2 часов, и они помечены как бесплатные в течение ограниченного времени.

Каждый курс начинается с некоторой теории, но они быстро погружаются в практические лабораторные работы, которые объясняет инструктор. Мне нравится практический подход, который делает его более конкретным и полезным для понимания того, как GenAI может помочь в разработке приложений.

Я прошла все 4 курса. Я делал подробные заметки для каждого курса, но, поскольку курсы «бесплатны в течение ограниченного времени», я не хотел публиковать подробные заметки для курсов, которые в какой-то момент могут быть платными. Вместо этого я расскажу вам, чему учит каждый курс.

Четыре коротких курса (от самых любимых до наименее любимых):

  1. LangChain для разработки приложений LLM
  2. ChatGPT Prompt Engineering для разработчиков
  3. Создание систем с помощью ChatGPT API
  4. Как работают диффузионные модели

Остановимся на каждом курсе подробнее.

LangChain для разработки приложений LLM

Это был мой самый любимый курс на сегодняшний день. Я много слышал о LangChain, и этот курс дал все базовые знания и практический опыт, необходимые мне, чтобы понять, что это такое и почему это полезно. Если у вас есть время на 1 курс, я бы выбрал этот, так как он полон информации и практических примеров кода.

Курс посвящен среде разработки с открытым исходным кодом для приложений LLM под названием LangChain. Курс охватывает различные компоненты, такие как модели (LLM, модели чата, модели встраивания текста), подсказки (шаблоны, парсеры вывода, селекторы примеров), индексы. strong> (загрузчики документов, разделители текста, хранилища векторов, средства извлечения), цепочки (подсказка + LLM + анализ вывода), модели памяти (буфер диалогов, буфер токенов, буфер сводок ), а также методы вопросов и ответов с использованием моделей встраивания и векторных хранилищ.

Кроме того, курс знакомит с концепцией агентов, которые расширяют функциональные возможности LLM для различных целей. Вы также узнаете, как оценить, насколько хорошо работает ваш LLM.

ChatGPT Prompt Engineering для разработчиков

Этот курс заставил меня понять, насколько плохо я подсказывал LLM. Это открыло мне глаза на то, насколько лучшие ответы вы можете получить от LLM, если подскажете четко и подробно.

Курс посвящен передовым методам подсказок LLM, подчеркивая такие принципы, как написание четких и конкретных инструкций и предоставление модели достаточного времени для обработки информации. Он знакомит с тактикой эффективных подсказок, включая использование разделителей, запрос структурированного вывода и использование несколько подсказок.

Кроме того, курс исследует различные приложения LLM, такие как итеративный анализ и уточнение подсказок, обобщение, анализ настроений, задачи преобразования текста (например, перевод, настройка тона), расширение текста и создание настраиваемых чат-ботов.

В нем подчеркивается необходимость предоставления всестороннего контекста в разговорах с LLM и предлагаются практические методы построения подсказок в формате разговора.

Создание систем с помощью ChatGPT API

Этот курс основан на предыдущем курсе и учит вас, как создавать систему с помощью LLM. Я был особенно впечатлен, узнав, как вы можете использовать LLM для оценки собственных результатов и увидеть, как ваши изменения улучшают систему!

Этот курс посвящен передовым методам разработки приложений, использующих языковые модели (LLM), на примере комплексных систем поддержки клиентов. Курс охватывает различные темы, в том числе шаги, скрытые от пользователей, связь с внешними системами, оценку системы и усовершенствование.

В нем объясняются концепции базовых LLM и LLM с инструкциями, а также процесс преобразования базового LLM в настроенный с инструкциями посредством точной настройки и обучения с подкреплением.

Курс охватывает токенизацию и сообщения системного помощника пользователя. В нем рассматриваются методы классификации и модерации контента с использованием API OpenAI. Курс также посвящен предотвращению незамедлительных инъекций с использованием разделителей и логических рассуждений. Он охватывает подсказки по цепочке для сложных задач и проверки вывода на безопасность и качество. Кроме того, он обучает методам оценки результатов LLM, включая использование рубрик и сравнение ответов с идеальными ответами.

Как работают диффузионные модели

Этот курс был моим наименее любимым курсом, главным образом потому, что в нем много кода в практических разделах, но мало объяснений того, что делает код и почему нам нужны определенные части. Многие детали были замазаны. Кроме того, запуск кода занимает некоторое время из-за обучения, поэтому он не такой интерактивный, как другие курсы.

Курс дает подробное понимание технических аспектов создания изображений с использованием диффузионных моделей. Цель диффузионной модели — генерировать изображения, похожие на те, которые использовались для обучения, захватывая мелкие детали и общие контуры.

Модель достигает этого, добавляя шум на разных уровнях во время обучения и позволяя нейронной сети научиться обрабатывать каждый уровень. В процессе выборки сеть постепенно очищает шум для создания высококачественных изображений спрайтов.

Курс охватывает такие темы, как архитектура нейронной сети (UNet), процедуры обучения, управление выходными данными модели с помощью вложений и усовершенствования методов выборки для ускорения процесса обучения.

В этом посте я стремился представить обзор серии Learn Generative AI Short Courses от DeepLearning.AI.

Эти курсы, от LangChain до быстрого проектирования, создания систем LLM и изучения внутренней работы моделей распространения, представляют большую ценность для изучающих GenAI, таких как я.

Как всегда, если у вас есть вопросы или отзывы, или если вы столкнетесь с другими хорошими курсами GenAI, не стесняйтесь, дайте мне знать в Твиттере @ meteatamel.

Первоначально опубликовано на https://atamel.dev.