Универсальный агент

DeepMind только что выпустили нового универсального агента по имени Гато. Возможно, целью многих исследований ИИ, которые мы видим сегодня, является создание системы с «общим искусственным интеллектом», то есть системы, способной выполнять любые задачи и способной к самосовершенствованию.

В то время как некоторые скептически относятся к возможности достижения AGI, на этой неделе DeepMind сделала небольшой шаг, продемонстрировав Gato, систему искусственного интеллекта, которая может выполнять невероятно широкий спектр задач, начиная от создания изображений или игры в видеоигры и заканчивая перемещением манипулятора робота. в реальном времени. Хотя это не первая мультимодальная система, созданная исследователями, разнообразие задач, которые можно выполнять, — это действительно шаг вперед.

Подобно GPT-3, модель Gato также использует архитектуру Transformer. Однако, в отличие от GPT-3, который фокусируется только на языковых задачах, GATO также выполняет задачи, которые традиционно зарезервированы для моделей обучения с подкреплением, таких как видеоигры или навигация по средам.

Мало того, что универсальная природа системы невероятна, стоит упомянуть и ее относительный размер. Gato на порядки меньше однозадачных систем, включая GPT-3, по количеству параметров. Параметры — это части системы, полученные из обучающих данных, и, по сути, определяют навыки системы в решении проблемы, такой как генерация текста. У Gato всего 1,2 миллиарда, а у GPT-3 более 170 миллиардов.

Хотя в настоящее время Гато лучше всего описывается как «мастер на все руки и мастер ни в чем», исследовательская группа считает, что с большим количеством данных, параметров и вычислительной мощности систему можно научить лучше выполнять еще большее количество задач.

В настоящее время система работает лучше эксперта «более половины времени» в 450 из 604 задач в своем репертуаре.

Разрушение пластика за дни, а не за столетия

Группа ученых из Техасского университета в Остине создала модифицированный фермент, способный расщеплять пластмассы, на разложение которых в противном случае ушли бы столетия за считанные дни.

Ученые определили его точную структуру с помощью машинного обучения. Алгоритму дали 19 000 белковых структур и научили предсказывать положение аминокислот в белках, которые не оптимизированы для своего локального окружения.

Обнаруженный ими фермент расщепляет пластик на его исходные химические строительные блоки посредством процесса, называемого деполимеризацией. Это позволяет ученым производить свежий пластик с нуля без ущерба для структурной целостности материала и без использования дополнительных нефтяных ресурсов. Это гораздо более устойчиво, чем традиционная переработка лент, при которой пластик плавится, а затем изменяет его форму. Тот факт, что фермент позволяет переработчикам производить полностью свежий пластик на каждом этапе переработки, означает, что пластик можно перерабатывать бесконечно, не теряя качества при каждой переработке.

Хотя исследования ферментов по разрушению пластика не являются чем-то новым, большинство встречающихся в природе ферментов не способны разрушить достаточно большое количество пластика ни при каких pH или температурных условиях. Однако новый фермент, который ученые назвали FAST-PETase, может расщеплять 51 тип ПЭТ в различных условиях температуры и pH.

ML ускоряет формулу 1

Подобно тому, как многие другие виды спорта пережили информационную революцию, машинное обучение привело к значительным улучшениям в Формуле 1. Спорт невероятно богат данными, и такие команды, как Ferarri, используют эти данные, чтобы решить, когда проводить пит-стопы и как точно настроить автомобили на каждом этапе гонки.

В любой момент времени на каждой гоночной машине Формулы-1 установлено более 300 датчиков, генерирующих более 1,1 миллиона точек данных в секунду, передаваемых от машин на пит-лейн. Эта информация используется не только для того, чтобы помочь гоночным командам принимать более правильные и точные решения, но и для предоставления болельщикам интересной информации о трансляциях. Хорошим примером этого является новый график «угроза подрезания», который можно использовать, чтобы показать, насколько автомобили близки к возможности обогнать друг друга, если они сделают пит-стоп.

Данные также используются за кулисами для информирования инженеров, которые занимаются созданием автомобилей Формулы-1. Облачные вычисления позволяют запускать аэродинамические симуляции на 70 % быстрее, чем обычно. Эти симуляции были использованы для создания автомобиля, который снижает потерю прижимной силы с 50% до 15%. Это резкое снижение дает водителю, преследующему его, более высокие шансы на обгон, и при этом предлагает болельщикам больше действий от колеса к колесу. Этот автомобиль следующего поколения будет представлен в сезоне 2022 года.

Google переосмысливает оттенок кожи

После многих лет жесткой критики Google меняет способ чтения информации о тоне кожи, чтобы сделать ее более всеобъемлющей и репрезентативной.

На протяжении десятилетий технологические компании полагались на так называемую шкалу Фитцпатрика для анализа оттенков кожи в своих алгоритмах компьютерного зрения. Эта шкала была первоначально разработана в 1970-х годах и содержит только 6 оттенков кожи, что делает ее не только устаревшей, но и неинклюзивной. Это одна из причин, по которой большие технологии и искусственный интеллект исторически плохо распознавали цветных людей.

Google объявила на конференции разработчиков ввода-вывода 2022 года, что в будущем они будут использовать шкалу «Оттенок кожи монаха» — шкалу из 10 оттенков кожи — в качестве стандарта для своих продуктов, чтобы уменьшить предвзятость в используемых наборах данных. обучать ИИ всему: от здравоохранения до модерации контента. Google Images также предложит возможность сортировать результаты поиска, связанные с макияжем, по оттенку кожи на основе шкалы, а фильтры для людей с большим количеством меланина появятся в Google Фото позже в этом месяце.

По-прежнему необходимы дальнейшие исследования для проверки результатов, которые указывают на предпочтение Монка перед Фитцпатриком, или на то, приводит ли подход Монка к более справедливым алгоритмам. Но первые результаты, особенно для групп, плохо представленных в наборах данных компьютерного зрения, многообещающие.