Создайте свое первое мобильное приложение для машинного обучения

В этой статье мы расскажем, как обучить модель машинного обучения (ML) с помощью Teachable Machine, интегрировать модель с веб-приложениями и мобильными приложениями и, наконец, создать простую камень-ножницы-бумагу. игра для компьютера. В частности, мы будем строить модель классификации изображений, в которой мы показываем свою руку камере, и модель будет предсказывать, является ли рука «камнем», «бумагой» или «ножницами».

Что такое обучаемая машина?

Teachable Machine — это веб-инструмент, который позволяет нам легко обучать модели машинного обучения без особых предварительных знаний с помощью машинного обучения. Инструмент упрощает процесс добавления обучающих данных, обучения модели и экспорта модели. Вы определяете, какие «Классы» вы хотите тренировать, затем добавляете свой вклад с веб-камеры и нажимаете «Обучить». Затем модель быстро запоминает различия между созданными вами классами. Это довольно легко!

Создание проекта

Во-первых, давайте перейдем к https://teachablemachine.withgoogle.com/ и нажмите Начать. На момент написания этой статьи Teachable Machine поддерживает 3 типа классификации — изображения, аудио и позы.

В этой статье мы рассмотрим только первую часть — классификацию изображений. Итак, нажмите «Проект изображения». Во всплывающем диалоговом окне выберите «Стандартная модель изображения». Это модель, которую мы можем использовать для работы в браузере или на вашем мобильном телефоне с удовлетворительной производительностью. Если вы хотите работать на меньшем устройстве с ограниченными возможностями, вы можете попробовать выбрать «Модель встроенного образа».

Классы

Далее давайте создадим классы или категории, которые нам нужно смоделировать для классификации. Поскольку мы создаем модель ML для классификации игры «Камень-ножницы-бумага», мы создадим 4 класса следующим образом.

Ничего: для обнаружения отсутствия жестов рук.
Рок: чтобы определить, когда мы показываем знак «рок»
Бумага: чтобы определить, когда мы показываем «бумажный» знак
Ножницы: чтобы определить, когда мы показываем знак «ножницы».

Добавление обучающих данных

Теперь пришло время собрать тренировочные данные. Вы можете начать с нажатия кнопки «Веб-камера», а затем нажать кнопку «Удерживать для записи», чтобы записать различные изображения, которые вы показываете на веб-камеру.

Ниже я добавил несколько примеров изображений для каждого класса.

То, что вы видели выше, едва ли является примером каждого класса. Что вам нужно сделать, так это добавить больше разных изображений, чтобы модель могла изучить как можно больше разных изображений. Вот несколько идей

Класс «Ничего»: добавьте больше изображений, на которых вы представляете себя в нем, ничего не делая или демонстрируя жесты рук, кроме «Камень», «Бумага» или «Ножницы».
Класс «Камень»: добавление большего количества изображений с левой и правой руки, разное расстояние от камеры, разный фон и т. д.
Вы можете сделать то же самое для классов «Бумага» и «Ножницы». Помните, опять же, цель состоит в том, чтобы представить компьютеру как можно больше разных изображений, чтобы он научился их обобщать и хорошо справлялся, когда мы заставляем их работать.

Попробуйте добавить изображения не менее 100 изображений в класс. В большинстве случаев, чем больше, тем лучше. Обратитесь к этому официальному учебнику для более подробной информации.

Тренироваться

Как только вы добавите достаточно изображений, нажмите «Обучить модель», чтобы обучить вашу модель. Обучение занимает несколько минут в зависимости от объема ваших данных.

Тестовая модель

После того, как это будет сделано, рядом с ним появится новая панель «предварительного просмотра». Затем вы можете показать свою руку веб-камере, и ваша обученная модель постарается классифицировать ее. Вы также можете добавить больше изображений, если считаете, что модель еще недостаточно хороша.

Экспорт модели

Как только он заработает должным образом, вы должны сохранить проект на свой диск Google или загрузить его на свой локальный компьютер для последующего использования, если вы хотите добавить больше изображений или классов в будущем, чтобы вам не пришлось переделывать это. все сначала. Вы можете щелкнуть значок рядом с Teachable Machine в левом верхнем углу и выбрать «Сохранить проект на диск» или «Загрузить проект как файл».

Затем нажмите «Экспорт модели» на панели «Предварительный просмотр» → Выберите вкладку «Tensorflow.js» → Выберите «Загрузить» → и нажмите «Загрузить мою модель», чтобы загрузить обученную модель на свой компьютер для использования позже в приложении.

Давайте напишем наше приложение

Теперь, когда у нас есть модель, давайте научимся использовать ее в приложении и создадим игру камень-ножницы-бумага. Мы будем использовать Vue3 и Framework7 для создания этого приложения. Вы можете клонировать минимальный шаблон из этого Github и начать строить блок за блоком из этой статьи или клонировать это готовое к производству приложение из этого Github. Я рекомендую последний. Вы можете просто лежать, а я объясню основную часть программы.

Прежде чем мы перейдем к кодированию, давайте сначала опишем макет приложения и функциональные возможности, которые мы собираемся создать. На скриншоте выше четыре основные части. Первая часть — это видеопоток в реальном времени с камеры, и он будет классифицировать изображение, которое мы показываем на камеру. Далее у нас есть знак «Рука» как «Игрок» и знак «Ножницы» как компьютер. Знак «Рука» — это то, что наша модель классифицирует по тому, что она видит в камере, а «Ножницы» — это случайный знак, выбранный компьютером. После двух кнопок первая кнопка — это кнопка-переключатель, которая может начать воспроизведение или приостановить игру, а вторая кнопка — это кнопка-переключатель, отображающая камеру или нет. Наконец, последняя часть — это раздел результатов сравнения между выбранной игроком и компьютером рукой.

А вот и код — «src/pages/home.vue»

Создаем 2 элемента из строк 13–18. Элемент видео используется для отображения живого видео с веб-камеры ПК. а элемент изображения используется для проецирования изображений с камеры мобильного телефона. Остальной код должен быть очень простым.

Далее давайте рассмотрим тег «script».

Нам нужно установить еще 2 зависимости — @teachablemachine/image и whatwg-fetch поверх зависимостей для Vue и Framework7. Библиотека Teachablemachine необходима для работы с моделью, обученной с помощью веб-приложения Teachable Machine. Библиотека whatwg-fetch используется для исправления модели загрузки из файловой системы на платформе Android, в которой мы используем строку 31.

В строке 36 мы загружаем модель из этого каталога «static/model/rock-paper-scissors». Поэтому, пожалуйста, разархивируйте загруженную модель в каталог. Есть 3 файла — metadata.json, model.json и weights.bin. metadata.json — это просто метаданные вашей модели. В нем хранится такая информация, как размер изображения, метки, версия и временные метки вашей модели и т. д. Файлы model.json и weights.bin являются важными файлами, представляющими сеть модели. структуру, параметры, веса и смещение, которые вы обучили.

В строке 50 у нас есть функция play. Если мы работаем на мобильном устройстве, мы будем вызывать функцию predictWithCanvasCamera, которая отображает изображение из плагина CanvasCamera и использует веб-API MediaDevices, вызывая функцию predictWithUserMedia при работе в веб-браузере.

Прогнозирование в веб-браузере

В строке 9 мы создаем функцию для подготовки настроек и ограничений для веб-API UserMedia. Мы устанавливаем высоту и ширину точно на 224 пикселя, того же размера, что и размер входного изображения нашей модели. В функции обратного вызова успеха (строка 21) мы назначаем поток с веб-камеры в качестве источника видеоэлемента.

В строке 38 при нажатии кнопки «воспроизведение» мы сначала переключаем значок на «паузу», а затем запускаем два таймера — predictionTimer и gamePlayerTimer. PredictionTimer будет периодически вызывать функцию «классифицировать» с видеоэлементом (videoRef) в качестве входных данных. GamePlayTimer — это интервальный таймер для периодического изменения значения раздачи компьютера. Как только обе руки выбраны, вызывается функция «вычислить» для сравнения и отображения результата. Функция «вычислить» — это просто простая функция для определения того, какая рука выигрывает. В противном случае в строке 45, если нажать кнопку «пауза», мы все сбрасываем.

А вот и функция «классифицировать». Мы вызываем функцию «предсказать» модели TeachableMachine. Метод принимает аргумент в виде элемента изображения или видео. Результат сохраняется в переменной «prediction» в виде массива. Затем мы зацикливаемся, чтобы найти класс с наибольшей вероятностью (значение достоверности). Наконец, мы назначаем и визуализируем изображение для руки игрока, строка 22.

Прогнозирование на мобильном устройстве

Веб-API UserMedia не полностью работает на мобильном устройстве (фреймворк Cordova), поэтому вместо этого мы используем плагин Cordova Canvas Camera. Нам также необходимо установить плагин Cordova File для управления отображением изображений из файловой системы мобильного телефона.

В строке 27, когда плагин камеры обнаруживает приемлемое изображение, он вызывает функцию «readImageFile» для рендеринга изображения. В последней версии Cordova мы больше не можем отображать изображения из источника файловой системы. Таким образом, функция создана для обработки различных файловых протоколов на ios/android и преобразования изображений в большие двоичные объекты перед их назначением элементу изображения (imageRef).

Функция «predictWithCanvasCamera» в строке 57 очень похожа на функцию «predictWithUserMedia». Единственное основное отличие заключается в том, что мы передаем элемент изображения (imageRef) в функцию «классифицировать» вместо элемента видео (videoRef).

И, наконец, остальные функции — в основном вспомогательные.

Запуск на мобильном устройстве

Если вы хотите запустить это приложение на своем телефонном устройстве, зарегистрируйте учетную запись в Monaca и следуйте этому руководству по созданию приложения для Android или iOS.

Что такое Монака?

Кроссплатформенная гибридная платформа разработки мобильных приложений и инструменты в облаке

Если у вас все на месте, приложение должно работать следующим образом

Весь исходный код можно найти здесь — https://github.com/yong-asial/rock-paper-scissors

Заключение

В этой статье мы узнали, как использовать Teachable Machine для обучения пользовательской модели машинного обучения классификации изображений, интеграции их с веб-приложениями с помощью веб-API UserMedia и с помощью мобильное приложение с помощью подключаемого модуля Cordova Canvas Camera. Это длинное руководство, поэтому, если вы обнаружите какую-либо ошибку, сообщите мне об этом в разделе комментариев или откройте для меня вопрос Github.

счастливое кодирование.

смотрите также:

Новые материалы

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли

Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Data Visualization Neural Networks Startup Tutorial Statistics Productivity Reactjs Learning