Я провел последнее десятилетие, исследуя и разрабатывая технологии, которые позволяют предприятиям и организациям быстрее внедрять инновации. Совсем недавно я провел пять лет в NVIDIA, исследуя новые подходы к машинному обучению, а именно рандомизацию структурированных доменов, создание Meta-Sim и Sim2SG (Sim-to-Real Scene Graph). Вы можете найти мое исследование здесь.
Почему я потратил так много времени на это пространство, которое может показаться эзотерическим? Я считаю, что эти подходы являются важными шагами к решению критической проблемы с широкими последствиями: «доменной бреши». В этом разница между производительностью реальных и синтетических данных. Разрыв сокращается, но сохраняется, и для оптимальной производительности, как правило, по-прежнему требуются некоторые реальные данные.
Если мы сможем создавать синтетические данные, которые сами по себе могут обучать алгоритмы так же или даже лучше, чем настоящие данные, то мы устраним узкое место данных в ИИ. Самое главное, мы будем использовать компьютерное зрение и преобразовывать возможности везде, где вы видите камеру: камеры видеонаблюдения, роботы, телефон в вашей руке.
Почему меня интересует эта проблема
Сделаем шаг назад. В нашей жизни мы начали осознавать и на каком-то уровне ощущать огромный потенциал ИИ. Тем не менее, большинство приложений ИИ были ограничены ограничениями данных. Мы не можем собрать достаточно фотографий или создать достаточно сценариев реального мира, чтобы обучать компьютеры масштабам мира. Фотография должна быть размечена вручную, чтобы компьютер ее понял, а тренировочные площадки должны быть установлены одна за другой. ИИ, как мы его знаем, не масштабируется.
Очевидный ответ, если он может быть сделан хорошо, состоит в том, чтобы синтезировать учебные материалы и среду. Что, если бы мы могли сгенерировать на компьютере изображения всех возможных объектов и сценариев во всех возможных условиях: сквозняки и ураганы; спутниковые перспективы и подводные виды; одинокий водитель и скопление 18 автомобилей? Если мы сделаем это, мы будем ограничены только графическими процессорами, необходимыми для генерации сотен изображений и сценариев в минуту.
Почему AI.Reverie
Я присоединяюсь к AI.Reverie, потому что среди компаний, разрабатывающих синтетические данные, она добилась самых ощутимых успехов, а ее руководители имеют самое ясное видение будущего.
Команда проводит исследования, необходимые для создания новых технологий. AI.Reverie сотрудничал с In-Q-Tel для публикации статьи, в которой показано, что синтетические данные могут использоваться сами по себе для обучения модели обнаружения и классификации объектов. Они выпустили самый большой открытый набор данных реальных и синтетических изображений с высоты птичьего полета, и вы можете увидеть их исследование в действии в тематическом исследовании Rareplanes.
AI.Reverie также применяет свои синтетические данные для решения широкого круга реальных проблем с такими клиентами, как 7-Eleven, Всемирный банк и ВВС США. Они создают данные, которые можно использовать для обучения моделей, поддерживающих бесконтактные покупки; выявлять поражения в убежищах, уязвимых к изменению климата; и выявление угроз населению и солдатам.
Самое главное, у AI.Reverie есть конкретный план по устранению пробела в доменах в ближайшие два-три года. Мои исследования и запатентованная технология AI.Reverie являются частью уравнения. И если мы устраним разрыв в доменах, ИИ, наконец, начнет масштабироваться.
Присоединяйтесь к нам
Задайте свои вопросы в моей беседе с сооснователем AI.Reverie Дэилом Кимом на вебинаре 26 мая. Зарегистрируйтесь здесь.
Присоединяйтесь к нашей команде в нашем стремлении устранить пробел в домене и раскрыть истинный потенциал ИИ. "Мы нанимаем".
Примите участие в бизнес-задаче через aireverie.com или [email protected].