О появлении креативного ИИ
Всего несколько лет назад общепринятая точка зрения Силиконовой долины гласила, что в первую очередь автоматизируются наименее творческие рабочие места. Достижения в области ИИ перевернули эту точку зрения с ног на голову.
В этой статье я расскажу о последних разработках в области творческого ИИ. Затем я помещу свой собственный проект генеративного искусства, popmatic.ai, в этот контекст. (примечание: я публикую эту статью здесь, но в дальнейшем могу просто использовать свой подстек)!
В начале 2021 года исследовательская лаборатория OpenAI публично выпустила модель машинного обучения под названием CLIP. Эта модель была обучена понимать, как соотносятся текст и изображения. В течение нескольких недель небольшое сообщество энтузиастов возродилось, взломав и адаптировав CLIP для создания странных, искусных изображений на основе текстовых подписей. Опираясь на работу OpenAI и подстрекая друг друга через твиттер, эта горстка новаторских мастеров и исследовательских лабораторий раздвинула границы. Качество и точность изображения быстро улучшились. Онлайн-форумы созрели на таких сайтах, как Discord. Примитивные приложения обменивались взад и вперед на Colab, бесплатном сервисе, который сочетает в себе облако Google с блокнотами кода.
Затем последовала коммерциализация. В начале 2022 года приложение для преобразования текста в изображение для iPhone ненадолго опередило Facebook и Snapchat в App Store. И хотя сообщество, занимающееся созданием изображений ИИ, было особенно активным, другие типы творческого ИИ совершенствуются неустанными темпами слишком. Andreessen Horowitz, ведущая венчурная фирма, охарактеризовала текущий момент как кембрийский взрыв возможностей, основанных на искусственном интеллекте. Изображения ниже, все сгенерированные ИИ, хорошо рассказывают историю (кредит, Кристобаль Валенсуэла):
Крупные технологические компании уже давно делают ставку на ИИ. В экосистеме искусственного интеллекта крупные технологии особенно преуспевают, когда используют свои сильные стороны; большие деньги и большие вычисления. Некоторые из самых впечатляющих новых возможностей ИИ связаны с обучением самых больших моделей. Даже при разработке сравнительно небольших моделей инженерные организации часто отслеживают свои счета за облачные вычисления с шагом в 100 000 долларов США.
Но, несмотря на преимущества, связанные с тратой «больших» денег, общий эффект творческих технологий искусственного интеллекта кажется несколько демократизирующим и децентрализующим. В отличие от закрытых исторических исследований, таких как Манхэттенский проект, исследования ИИ в значительной степени рассредоточены и открыты. И все более разнообразная экосистема коммерческих, исследовательских и общественных организаций публично выпускает дорогие, мощные «базовые» модели. Эти организации, в том числе Hugging Face, OpenAI, laion.ai, eleuther.ai и bigscience, сыграли огромную роль в формировании конкурентной среды.
Становится все проще использовать, настраивать и создавать мощные модели с открытым исходным кодом. Всего несколько недель назад отдельному разработчику удалось запустить одну из лучших моделей преобразования текста в изображение, используя всего 2 ГБ ОЗУ и iPhone. Сравнительно низкая стоимость создания этой технологии уже позволяет отдельным лицам и небольшим командам создавать новые типы продуктов с низкими затратами. Несомненно, в следующем году старшеклассник с хорошим компьютером разработает какое-нибудь беспрецедентное, потрясающее приложение для искусственного интеллекта. Это захватывающее время, чтобы быть живым!
Мое личное увлечение творческим ИИ всерьез началось четыре года назад. Я прочитал блог специалиста по машинному обучению по имени Эмиль Валлнер. Эмиль использовал машинное обучение для преобразования скриншотов веб-дизайна в работающие веб-сайты. Я был очарован возможностью использования алгоритмов ИИ для организации существующих дискретных объектов в новые конфигурации.
Дискретный вариант творческих моделей ИИ может выполнять такие действия, как составление слов в предложения, HTML-теги в веб-сайты или даже действия в целенаправленное поведение. Я полагаю, что когда-нибудь этот тип ИИ созреет до такой степени, что сможет персонализировать дизайн всего, от наших домов до наших тостеров. Более конкретно, я думаю, что дискретные генеративные системы ИИ будут обучены составлять персонализированные конструкции из каталогов составных частей, а затем завершать сборку с помощью гибких автоматизированных производственных процессов. Среди других эффектов второго порядка, я думаю, этот тип технологий позволит создать новый опыт проектирования, который сочетает в себе аспекты социальных сетей, торговых площадок и игр.
Поскольку ИИ становится все более способным и творческим, мне интересно думать о том, как будут развиваться человеческое творчество и самовыражение. Я не знаю, как будут развиваться события, но держу пари, что человеческое искусство и самовыражение будут продолжать играть важную роль в том, чтобы сделать жизнь такой стоящей и интересной.
В свободное время я делаю веб-сайт и информационный бюллетень popmatic.ai в качестве своего увлечения. В отличие от популярных сегодня моделей преобразования текста в изображение, которые могут генерировать изображения, соответствующие практически любому описанию, алгоритм искусственного интеллекта Popmatic просто генерирует варианты работы художника, собирая человеческие каракули вместе, как пазл. Пока что результаты не являются эстетически убедительными, но я думаю, что при некоторой вдумчивой итерации они могли бы быть:
Некоторые друзья-музыканты и художники сотрудничают со мной. Каждая совместная работа будет включать в себя коллекцию нарисованных от руки фигур, продукт (например, кофейную кружку или платье) и статью. Стандартный алгоритм обучения с подкреплением (PPO) разложит эти наборы фигур в шаблоны. Покупатели могут указать свои предпочтительные компромиссы между потоком, разнообразием и плотностью своего рисунка, а затем создать персонализированные кружки и одежду.
Я планирую сопровождать выпуск каждого предмета новостной статьей о творчестве художника. Некоторые из этих статей могут касаться машинного обучения. Но в основном статьи будут о том, как интересные личности подходят к своему творческому процессу. Если дела пойдут хорошо, popmatic.ai станет полезным инструментом для творческих личностей, размещающих сообщения на веб-сайте.
Кроме того, как и в случае с некоторыми другими «MVP» с искусственным интеллектом, над созданием которых я принимал участие, веб-сайт на самом деле пока не использует никакого искусственного интеллекта… Но, клянусь, он скоро появится!
Следите за развитием событий, подписавшись на рассылку: