Последние новости об искусственном интеллекте за последнюю неделю

От Transformers in Robotics (Google AI) до мультимодального SSL (Meta AI) до разработки требований в ML (CMU) и бесплатных курсов. Эта неделя полна увлекательных объявлений: исследовательские работы, технологии, лежащие в основе популярных сервисов, и объявления с открытым исходным кодом!

Вот краткое изложение новости. Мы рассмотрим основные моменты каждого из них в статье ниже.

МО исследование

Google AI представил модель RT-1: Robotics Transformer 😮
Meta AI опубликовала статью с подробным описанием алгоритма data2vec 2.0 с повышенной эффективностью обучения (новая версия data2vec).
OpenAI представляет улучшенную модель встраивания, стоимость которой на 99,8% ниже, чем у модели Davinci.
Исследователи из Университета Карнеги-Меллона представили основу для разработки требований в машинном обучении.

ML-приложения

Amazon Science подробно рассказала о методах непрерывного обучения в Alexa
Google AI думал, что Recorder обнаруживает разных говорящих в режиме реального времени
Meta AI открыла свою службу анонимных учетных данных (ACS) для аутентификации пользователей деидентифицированным способом.

Объявления

Hugging Face создала «Информационный бюллетень по этике и обществу» и уже опубликовала его номер 2.
Университет машинного обучения под кураторством Amazon Science представил бесплатный онлайн-курс «Ответственный ИИ»
IBM выпустила первый эпизод своей бесплатной серии, объясняющей, как работают квантовые вычисления

Давайте погрузимся в новости! Убедитесь, что вы прочитали статью, чтобы найти все ссылки.

МО исследование

Google AI представил модель RT-1: Robotics Transformer 😮

Новое исследование Google AI направлено на решение проблемы отсутствия эффективных, масштабируемых и достаточно быстрых моделей логического вывода в реальном времени в робототехнике.

Robotics Transformer 1 (RT-1) — это многозадачная модель, которая токенизирует входные и выходные действия робота (например, изображения с камеры, инструкции по выполнению задач и моторные команды), чтобы обеспечить эффективный вывод во время выполнения, что делает возможным управление в реальном времени.

Ссылки: оригинальный блог post, оригинальный paper, веб-сайт проекта

Meta AI опубликовала статью с подробным описанием алгоритма data2vec 2.0 с повышенной эффективностью обучения (новая версия data2vec).

data2vec 2.0 работает так же хорошо, как и эти модели, со значительным улучшением времени предварительной подготовки:

Маскированные автоэнкодеры экономят в 16,4 раза время на компьютерном зрении
wav2vec 2.0 в 10,6 раз меньше времени на распознавание речи Librispeech
Модель RoBERTa затрачивает в 2 раза меньше времени на понимание естественного языка GLUE

Ссылки: оригинальный блог post, оригинальный paper, модели и код здесь

OpenAI представляет улучшенную модель встраивания, стоимость которой на 99,8% ниже, чем у модели Davinci.

Модель внедрения преобразует текстовую концепцию в числовой вектор, который затем можно использовать для различных задач машинного обучения. Это числовое представление текста,

позволяет словам с похожими значениями иметь одинаковое представление. Из статьи Мастерство машинного обучения.

Новая модель OpenAI называется text-embedding-ada-002. Он превосходит все старые модели встраивания в следующих задачах:

текстовый поиск
поиск кода
сходство предложений

Он получает сопоставимую производительность при классификации текста.

В то же время он стоит на 99,8% ниже, чем модель Davinci, предыдущая самая мощная модель OpenAI.

Ссылки: оригинальный блог пост, документация, цены

Исследователи из Университета Карнеги-Меллона представили основу для разработки требований в машинном обучении.

Разработка требований (RE) является важнейшим компонентом разработки программного обеспечения. Когда дело доходит до машинного обучения, эта практика не стандартизирована и не определена должным образом и считается одной из самых сложных задач в разработке машинного обучения.

Чтобы восполнить этот пробел, исследователи создали простую систему оценки.

Ссылка: оригинальный блог post

ML-приложения

Amazon Science подробно рассказала о методах непрерывного обучения в Alexa

Компания создала сообщение в блоге, описывающее подход, позволяющий Alexa обнаруживать опечатки или орфографические ошибки в запросах и самостоятельно исправлять их.

Эта концепция называется Перезапись запроса (QR), когда агент искусственного интеллекта автоматически обнаруживает и исправляет неправильные запросы. Amazon Science представила две статьи:

Первая бумага посвящена проблеме перезаписи запросов с помощью новой среды ограниченной генерации (CGF).
Вторая бумага посвящена ограничению метода перезаписи.

Ссылки: оригинальный блог post, (1) paper, (2) paper

Google AI думал, что Recorder обнаруживает разных говорящих в режиме реального времени

Рекордер — это не просто приложение для записи звука. Он использует машинное обучение, чтобы предоставить пользователю больше возможностей. Например, он может транскрибировать речь или предлагать теги для заголовков и т. д.

На прошлой неделе Google AI опубликовал статью об исследовании новой возможности Recorder — функции «метки динамиков».

Система в основном состоит из трех компонентов: модели обнаружения поворота говорящего, которая обнаруживает смену говорящего во входной речи, модели кодировщика говорящего, которая извлекает голосовые характеристики из каждого поворота говорящего, и многоступенчатого алгоритма кластеризации, который аннотирует метки говорящего к каждому. динамик поворачивается очень эффективным способом. Из оригинального блога пост

Ссылки: оригинальный блог post, paper, открытый алгоритм спектральной кластеризации здесь

Meta AI открыла свою службу анонимных учетных данных (ACS) для аутентификации пользователей деидентифицированным способом.

Аутентификация деидентифицированным способом является частью мета-стратегии по минимизации данных. В статье подробно описан подход, лежащий в основе Anonymous Credential Service (ACS).

На высоком уровне ACS поддерживает деидентифицированную аутентификацию, разделяя аутентификацию на две фазы: выдачу токена и погашение токена. Из оригинального блога пост

Ссылки: оригинальный блог post, ACS с открытым исходным кодом repo

Объявления

Hugging Face создала «Информационный бюллетень по этике и обществу» и уже опубликовала его номер 2.

Ссылки: Выпуск №1, Выпуск №2

Университет машинного обучения под кураторством Amazon Science представил бесплатный онлайн-курс «Ответственный ИИ»

Ссылки: оригинальный пост в блоге, Плейлист YouTube курса

IBM выпустила первый эпизод своей бесплатной серии, объясняющей, как работают квантовые вычисления

Ссылки: оригинальный блог пост, YouTube плейлист курса, учебник

Если вам понравился этот выпуск, не забудьте нажать кнопку 👏🏼 «хлопать», 📨 поделиться с друзьями или 💭 написать сообщение в социальных сетях. Я планирую регулярно делать эти еженедельные дайджесты, и мне важна ваша реакция! Каждое ваше действие показывает мне вашу поддержку! 🙌🏼

Artificial Intelligence Machine Learning

смотрите также:

Новые материалы

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…

Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей

В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning