Создайте что-нибудь менее чем за 60 минут

GPT-3 и DALL-E 2, вероятно, уже некоторое время наводняют вашу ленту новостей. Если вы похожи на меня, у вас может быть некоторый опыт работы с веб-приложениями и машинным обучением, но вы понятия не имеете, с чего начать, когда дело доходит до использования генеративного ИИ или больших языковых моделей (LLM).

Короткая история

  1. Ознакомьтесь с Руководством по быстрому запуску OpenAI и их репозиторием на github.
  2. Измените подсказки и входные данные и разверните веб-приложение для логического вывода в реальном времени
    (мне нравится использовать Heroku для хостинга информации)
  3. Добавьте в меню несколько подсказок и подключите его к DALL-E 2.
  4. Посмотрите мой репозиторий github с примером, основанным на кратком руководстве (Github Repo; ссылка на веб-приложение)
  5. Дайте мне знать, как это происходит!

Более длинная история

Контекст

GPT-3 и другие большие языковые модели привлекательны, поскольку они могут решать множество общих проблем. Обычно в классическом машинном обучении вы строите классификацию для конкретной проблемы, и ваша модель способна выполнять эту конкретную функцию; у модели не так много возможностей обобщения для решения других подобных задач.

С LLM вы можете обучать модели пониманию и синтезу, чтобы вместо этого решать гораздо более общие проблемы с помощью точно сформулированной подсказки.

Исследование модели

В OpenAI есть площадка для GPT-3 и DALL-E 2; регистрация предоставляет вам определенное количество кредитов. Очень быстро вы увидите, что с помощью нескольких специально подобранных подсказок вы можете включить GPT-3 или DALL-E 2 для создания сложных выходных данных.

Помимо этого, вы можете легко создать собственное веб-приложение, чтобы демонстрировать публике определенные подсказки. OpenAI также имеет простое руководство по быстрому запуску приложения для фляг.

Создание веб-приложения

Существуют всевозможные руководства по созданию пользовательских веб-приложений на Python с использованием Flask или Django. Они позволяют создавать веб-приложения в основном с помощью Python и небольшого количества html и css. Это позволяет вам не только придумывать творческие подсказки и выходные данные GPT-3, но и в основном думать о том, как обслуживать выходные данные OpenAI для потребителей в веб-приложении.

Ниже я сделал очень простое веб-приложение: три подсказки:

  1. Sandwich Namer — после ввода ингредиентов присваивается имя сэндвичу.
  2. Средство выбора книг — после ввода тем оно рекомендует книгу и автора.
  3. Средство создания изображений (стандартное для DALL-E 2)

Использование таких возможностей, как простые веб-приложения, для дальнейшего понимания того, как обслуживать рекомендации и подсказки, может выступать в качестве мощного инструмента обучения и мощного инструмента портфолио.

Проверьте репозиторий Github и дайте мне знать, что вы думаете!