Гелиограф Ньепса, первая фотография в мире, сделанная Нисефором Ньепсом (1765–1833), французским фотографом, с первой камеры изобретение, Camera Obscura — от латыни «темная комната», результат столетий горячих научных и художественных исследований по созданию первой камеры. путешествие фотографии в 1827 году. Впоследствии и до настоящего времени это развитие значительно продвинулось вперед и воспроизвело множество форм.
В свете большего прогресса и использования технологического века знания и способности искусственного интеллекта были внедрены в искусство изображений и концепцию фотографии, одно из этих нововведений включает Dall-E, продукт OpenAI(некоммерческая и коммерческая исследовательская организация в области искусственного интеллекта), которая генерирует изображения из текста. Звучит действительно удивительно, не так ли? Мы вместе рассмотрим это блестящее новшество, изучим некоторые из его многочисленных функций и влияние этого инструмента на человеческое общество, уделив больше внимания последней версии этого шедевра ИИ в разделах этой статьи. Наслаждайтесь и приятного чтения!
Что такое Dall-E?
Dall-E – это результат исследований OpenAI в области искусства создания изображений для удобства выражения мыслей человека с помощью изображений. Это очень мощный инструмент, применимый почти ко всем профессиям, связанным с журналистикой, развлечениями и всеми человеческими делами, связанными с передачей идей посредством использования графических изображений и образов.
Исследования по созданию этого мощного инструмента дали первый результат в январе 2021 года, когда в блоге для широкой публики был представлен Dall-E 1. мощный инструмент для создания изображений, наряду с GPT-3, инструмент AI для генерации текста.
DALL-E 1 была запущена с возможностью генерировать широкий спектр изображений из текстового описания, от простых до сложных идей, таких как животные, транспортные средства и даже сцены из фильмы, он также может генерировать анимацию и 3D-изображения, тем самым открывая новые возможности для фотографов и видеооператоров в создании визуально ошеломляющего и увлекательного контента. У него есть возможность генерировать изображения на основе признаков, которые он извлек из набора данных, на котором он был обучен, и тех, которые он видел ранее.
У Dall-e 1 так много привлекательных черт, и столько же недостатков. Некоторые из его способностей включают в себя: его ограниченную способность работать с набором данных, на котором он был обучен, предоставление не всегда реалистичных изображений, отсутствие способности понимать контекст изображений, которые он генерирует, ограничение на создание изображений только на основе преобразования текста в изображения. а не другие входы и невозможность оценить качество изображения.
Таким образом, эти неспособности привели к созданию Dall-E 2, последней разработки Dall-E.
Dall-E2: Последняя версия Dall-E, сведения о ней и ее функции.
8 июня 2021 г. Dall-E2 с лучшими возможностями и развитием, чем в более ранней версии, включая: улучшенное качество и четкость изображения, возможность создавать изображения из более широкого диапазона текстовых описаний, лучший контроль пользователя над созданием изображений, лучше обрабатывать невидимое концепции, улучшенная работа с изображениями и многое другое.
Подробнее о сравнении этих двух версий читайте в другой версии этой истории.
Его интеграция и принятие стартапами и частными лицами:
С момента запуска стабильной версии Dall-E многие известные компании, в том числе Microsoft, очень близкий деловой партнер OpenAI, интегрировали этот инструмент в свое программное обеспечение, Microsoft встраивает этот инструмент в Bing, а Microsoft Edge со своим инструментом Image Creator, который позволяет пользователям создавать изображения, если веб-результаты не возвращают то, что они ищут. Приложение для дизайна одежды CALA использует API-интерфейс DALL-E 2 для инструмента, который позволяет клиентам уточнять идеи дизайна из текстовых описаний или изображений, а Mixtiles предлагает фото к потоку создания произведений искусства для своих пользователей. А также выпуск этого замечательного инструмента в виде API и запуск его «бета-версии» в июле 2022 года. Более трех миллионов человек интегрируют этот инструмент в создание волшебных идей.
Изучение многих волшебных особенностей Dall-E
https://cdn.openai.com/outpainting/draft-20220829b/girl-with-a-pearl-earring-bts-cropped.mp4
Ограничения и политика компании:
Несмотря на множество возможностей и впечатляющую производительность при создании изображений, Dall-E 2 имеет некоторые ограничения и некоторые правила компании в отношении его использования.
Чтобы самостоятельно обнаружить проблемы и некоторый дисбаланс, которые могли быть известны с Dall-E2, OpenAIнаняла красную команду» и провел серию тестов, в результате которых Альберто Ромеро, специалист по искусственному интеллекту и технологиям CambrianAI, в одной из своих статей выявил эти недостатки. , объясняя Dall-E, в котором он разделил неспособности на две разные категории: социальный и технический аспекты. Я надеюсь, что вы найдете хорошее чтение статьи здесь:
Для его использования создано несколько ограничений и политик, некоторые из которых включают:
Положение о входных фильтрах
⦁ В предварительном просмотре DALL·E 2 фильтры на входе (т. е. текстовые подсказки для «Текст в изображение» и «Раскрашивание») и при загрузке (т. е. изображения для «Раскрашивания» или «Вариации») не позволяют пользователям использовать предварительный просмотр для следующих типов подсказок. и загружает:
⦁ Те, которые связаны с серьезными опасениями по поводу безопасности (например, сексуализированные или вызывающие подозрения изображения детей, жестокие материалы, откровенно политические материалы и токсичные материалы).
⦁ Места, в которых единственное значение контента будет представлять собой нарушение нашей политики в отношении контента (т. е. нарушение не зависит от контекста, в котором этот контент публикуется).
⦁ Подсказки, связанные с вариантами использования, которые мы в настоящее время не поддерживаем (например, в настоящее время мы поддерживаем только подсказки на английском языке).
⦁ Подсказки в областях, где поведение модели неустойчиво или может быть смещено из-за фильтрации перед обучением (например, в результате фильтров перед обучением мы не можем с уверенностью разрешить генерацию изображений, связанных с распространенными американскими символами ненависти, даже в тех случаях, когда пользователь намеревался надлежащим образом контекстуализировать такие символы, а не поддерживать их).
Чтобы получить больше информации об ограничениях и политиках, обратитесь к этому документу, тщательно написанному командой сотрудников Open AI, посвященному правилам, ограничениям, рискам и политике в отношении контента этого шедевра.
Обещания Dall-E 2 человечеству
Очень многие преимущества этого блестящего инструмента искусственного интеллекта нельзя недооценивать, как и его многочисленные обещания человеческому обществу, которые пересекаются с нашими человеческими идеями, относительными областями работы и другими способами, включая:
Его потенциал вносить далеко идущие изменения в то, как мы создаем, понимаем и воспринимаем изображения. Его можно рассматривать как инструмент, который расширяет творческий потенциал человека, позволяя нам генерировать новые и уникальные изобразительные идеи, которые ранее были невообразимы.
С DALL-E 2 мы можем исследовать новые измерения воображения, и это может позволить нам выражать себя новыми и захватывающими способами. Это может предоставить нам новую среду для передачи наших идей, мыслей и эмоций другим.
На более глубоком уровне Его также можно рассматривать как инструмент, который позволяет нам выйти за пределы ограничений нашего физического мира и исследовать царство абстрактного и неосязаемого.
Кроме того, DALL-E 2 можно рассматривать как инструмент, который позволяет нам глубже понять окружающий мир, предоставляя нам новый способ представления и понимания взаимосвязей между различными концепциями и идеями.
По сути, его можно рассматривать как инструмент, который позволяет нам исследовать границы нашего воображения и понимания, и он может сильно повлиять на то, как мы создаем, общаемся и воспринимаем мир.
Глоссарий:
Подсказки. Подсказка — это параметр, который предоставляется API, чтобы он мог определить контекст проблемы, которую необходимо решить. В зависимости от того, как написано приглашение, предоставленное изображение будет пытаться соответствующим образом соответствовать шаблону.
Закрашивание. Закрашивание — это процесс восстановления утерянных или испорченных частей изображений и видео.
Далл-И: смесь имен анимированного робота Pixar, персонажа ВАЛЛ-И и испанского художника-сюрреалиста Сальвадора. Дали.
Модель.Терминология искусственного интеллекта и машинного обучения, используемая для представления выходных данных алгоритма машинного обучения, работающего с данными.
Быстрые ссылки и источники исследований:
О Dall-E на OpenAI: https://openai.com/dall-e-2/
О пользователях Dall-E: https://techcrunch.com/2022/11/03/now-anyone-can-build-apps-that-use-dall-e-2 -to-generate-images/
Подробнее об Open-AI и ChatGPT: https://medium.com/@saulasheriffdeen/the-story-behind-the-open-ai-artificial-intelligence-and-the -magical-chatgpt-tool-56bee0c4e241
Доступ к бета-версии Dall-E 2: https://openai.com/blog/dall-e-now-available-in-beta/
Доступ к Dall-E через пользовательский интерфейс: https://labs.openai.com/e/O0rYn7pKsZLZKakio9EE1l9W.
Поисковые системы: Google, ChatGPT
Благодарим вас за то, что вы потратили свое время на чтение этого материала в потрясающем сенсационном интернет-инструменте искусственного интеллекта — Dall-E2. Пожалуйста, следите за обновлениями, чтобы получать больше технических обновлений, инструкций и новостей!
Мои аккаунты в социальных сетях:
Твиттер: https://mobile.twitter.com/bhai_tweet.
Facebook: https://web.facebook.com/SaulaSheriffdeen
LinkedIn: https://www.linkedin.com/in/saula-sheriffdeen-a86373238/