Гелиограф Ньепса, первая фотография в мире, сделанная Нисефором Ньепсом (1765–1833), французским фотографом, с первой камеры изобретение, Camera Obscuraот латыни «темная комната», результат столетий горячих научных и художественных исследований по созданию первой камеры. путешествие фотографии в 1827 году. Впоследствии и до настоящего времени это развитие значительно продвинулось вперед и воспроизвело множество форм.

В свете большего прогресса и использования технологического века знания и способности искусственного интеллекта были внедрены в искусство изображений и концепцию фотографии, одно из этих нововведений включает Dall-E, продукт OpenAI(некоммерческая и коммерческая исследовательская организация в области искусственного интеллекта), которая генерирует изображения из текста. Звучит действительно удивительно, не так ли? Мы вместе рассмотрим это блестящее новшество, изучим некоторые из его многочисленных функций и влияние этого инструмента на человеческое общество, уделив больше внимания последней версии этого шедевра ИИ в разделах этой статьи. Наслаждайтесь и приятного чтения!

Что такое Dall-E?

Dall-E – это результат исследований OpenAI в области искусства создания изображений для удобства выражения мыслей человека с помощью изображений. Это очень мощный инструмент, применимый почти ко всем профессиям, связанным с журналистикой, развлечениями и всеми человеческими делами, связанными с передачей идей посредством использования графических изображений и образов.

Исследования по созданию этого мощного инструмента дали первый результат в январе 2021 года, когда в блоге для широкой публики был представлен Dall-E 1. мощный инструмент для создания изображений, наряду с GPT-3, инструмент AI для генерации текста.

DALL-E 1 была запущена с возможностью генерировать широкий спектр изображений из текстового описания, от простых до сложных идей, таких как животные, транспортные средства и даже сцены из фильмы, он также может генерировать анимацию и 3D-изображения, тем самым открывая новые возможности для фотографов и видеооператоров в создании визуально ошеломляющего и увлекательного контента. У него есть возможность генерировать изображения на основе признаков, которые он извлек из набора данных, на котором он был обучен, и тех, которые он видел ранее.

У Dall-e 1 так много привлекательных черт, и столько же недостатков. Некоторые из его способностей включают в себя: его ограниченную способность работать с набором данных, на котором он был обучен, предоставление не всегда реалистичных изображений, отсутствие способности понимать контекст изображений, которые он генерирует, ограничение на создание изображений только на основе преобразования текста в изображения. а не другие входы и невозможность оценить качество изображения.

Таким образом, эти неспособности привели к созданию Dall-E 2, последней разработки Dall-E.

Dall-E2: Последняя версия Dall-E, сведения о ней и ее функции.

8 июня 2021 г. Dall-E2 с лучшими возможностями и развитием, чем в более ранней версии, включая: улучшенное качество и четкость изображения, возможность создавать изображения из более широкого диапазона текстовых описаний, лучший контроль пользователя над созданием изображений, лучше обрабатывать невидимое концепции, улучшенная работа с изображениями и многое другое.

Подробнее о сравнении этих двух версий читайте в другой версии этой истории.

Его интеграция и принятие стартапами и частными лицами:

С момента запуска стабильной версии Dall-E многие известные компании, в том числе Microsoft, очень близкий деловой партнер OpenAI, интегрировали этот инструмент в свое программное обеспечение, Microsoft встраивает этот инструмент в Bing, а Microsoft Edge со своим инструментом Image Creator, который позволяет пользователям создавать изображения, если веб-результаты не возвращают то, что они ищут. Приложение для дизайна одежды CALA использует API-интерфейс DALL-E 2 для инструмента, который позволяет клиентам уточнять идеи дизайна из текстовых описаний или изображений, а Mixtiles предлагает фото к потоку создания произведений искусства для своих пользователей. А также выпуск этого замечательного инструмента в виде API и запуск его «бета-версии» в июле 2022 года. Более трех миллионов человек интегрируют этот инструмент в создание волшебных идей.

Изучение многих волшебных особенностей Dall-E

https://cdn.openai.com/outpainting/draft-20220829b/girl-with-a-pearl-earring-bts-cropped.mp4

Ограничения и политика компании:

Несмотря на множество возможностей и впечатляющую производительность при создании изображений, Dall-E 2 имеет некоторые ограничения и некоторые правила компании в отношении его использования.

Чтобы самостоятельно обнаружить проблемы и некоторый дисбаланс, которые могли быть известны с Dall-E2, OpenAIнаняла красную команду» и провел серию тестов, в результате которых Альберто Ромеро, специалист по искусственному интеллекту и технологиям CambrianAI, в одной из своих статей выявил эти недостатки. , объясняя Dall-E, в котором он разделил неспособности на две разные категории: социальный и технический аспекты. Я надеюсь, что вы найдете хорошее чтение статьи здесь:



Для его использования создано несколько ограничений и политик, некоторые из которых включают:

Положение о входных фильтрах

⦁ В предварительном просмотре DALL·E 2 фильтры на входе (т. е. текстовые подсказки для «Текст в изображение» и «Раскрашивание») и при загрузке (т. е. изображения для «Раскрашивания» или «Вариации») не позволяют пользователям использовать предварительный просмотр для следующих типов подсказок. и загружает:

⦁ Те, которые связаны с серьезными опасениями по поводу безопасности (например, сексуализированные или вызывающие подозрения изображения детей, жестокие материалы, откровенно политические материалы и токсичные материалы).

⦁ Места, в которых единственное значение контента будет представлять собой нарушение нашей политики в отношении контента (т. е. нарушение не зависит от контекста, в котором этот контент публикуется).

⦁ Подсказки, связанные с вариантами использования, которые мы в настоящее время не поддерживаем (например, в настоящее время мы поддерживаем только подсказки на английском языке).

⦁ Подсказки в областях, где поведение модели неустойчиво или может быть смещено из-за фильтрации перед обучением (например, в результате фильтров перед обучением мы не можем с уверенностью разрешить генерацию изображений, связанных с распространенными американскими символами ненависти, даже в тех случаях, когда пользователь намеревался надлежащим образом контекстуализировать такие символы, а не поддерживать их).

Чтобы получить больше информации об ограничениях и политиках, обратитесь к этому документу, тщательно написанному командой сотрудников Open AI, посвященному правилам, ограничениям, рискам и политике в отношении контента этого шедевра.



Обещания Dall-E 2 человечеству

Очень многие преимущества этого блестящего инструмента искусственного интеллекта нельзя недооценивать, как и его многочисленные обещания человеческому обществу, которые пересекаются с нашими человеческими идеями, относительными областями работы и другими способами, включая:

Его потенциал вносить далеко идущие изменения в то, как мы создаем, понимаем и воспринимаем изображения. Его можно рассматривать как инструмент, который расширяет творческий потенциал человека, позволяя нам генерировать новые и уникальные изобразительные идеи, которые ранее были невообразимы.

С DALL-E 2 мы можем исследовать новые измерения воображения, и это может позволить нам выражать себя новыми и захватывающими способами. Это может предоставить нам новую среду для передачи наших идей, мыслей и эмоций другим.

На более глубоком уровне Его также можно рассматривать как инструмент, который позволяет нам выйти за пределы ограничений нашего физического мира и исследовать царство абстрактного и неосязаемого.

Кроме того, DALL-E 2 можно рассматривать как инструмент, который позволяет нам глубже понять окружающий мир, предоставляя нам новый способ представления и понимания взаимосвязей между различными концепциями и идеями.

По сути, его можно рассматривать как инструмент, который позволяет нам исследовать границы нашего воображения и понимания, и он может сильно повлиять на то, как мы создаем, общаемся и воспринимаем мир.

Глоссарий:

Подсказки. Подсказка — это параметр, который предоставляется API, чтобы он мог определить контекст проблемы, которую необходимо решить. В зависимости от того, как написано приглашение, предоставленное изображение будет пытаться соответствующим образом соответствовать шаблону.

Закрашивание. Закрашивание — это процесс восстановления утерянных или испорченных частей изображений и видео.

Далл-И: смесь имен анимированного робота Pixar, персонажа ВАЛЛ-И и испанского художника-сюрреалиста Сальвадора. Дали.

Модель.Терминология искусственного интеллекта и машинного обучения, используемая для представления выходных данных алгоритма машинного обучения, работающего с данными.

Быстрые ссылки и источники исследований:

О Dall-E на OpenAI: https://openai.com/dall-e-2/

О пользователях Dall-E: https://techcrunch.com/2022/11/03/now-anyone-can-build-apps-that-use-dall-e-2 -to-generate-images/

Подробнее об Open-AI и ChatGPT: https://medium.com/@saulasheriffdeen/the-story-behind-the-open-ai-artificial-intelligence-and-the -magical-chatgpt-tool-56bee0c4e241

Доступ к бета-версии Dall-E 2: https://openai.com/blog/dall-e-now-available-in-beta/

Доступ к Dall-E через пользовательский интерфейс: https://labs.openai.com/e/O0rYn7pKsZLZKakio9EE1l9W.

Поисковые системы: Google, ChatGPT

Благодарим вас за то, что вы потратили свое время на чтение этого материала в потрясающем сенсационном интернет-инструменте искусственного интеллекта — Dall-E2. Пожалуйста, следите за обновлениями, чтобы получать больше технических обновлений, инструкций и новостей!

Мои аккаунты в социальных сетях:

Твиттер: https://mobile.twitter.com/bhai_tweet.

Facebook: https://web.facebook.com/SaulaSheriffdeen

LinkedIn: https://www.linkedin.com/in/saula-sheriffdeen-a86373238/

Канал: https://medium.com/@saulasheriffdeen