Глубокое обучение в точном земледелии:
Случай сиамской сети в классификации растений
Аннотация
Глубокое обучение — это дисциплина искусственного интеллекта, которая решает сложные задачи обучения, вдохновленные известными или неизвестными данными, структурированными данными или абстрактными данными. Сравнительные методы глубокого обучения в этом случае обучения с небольшим количеством выстрелов все чаще используются в сельскохозяйственном секторе. В этом техническом документе предлагается изучить проблемы обнаружения болезней растений с помощью алгоритма сиамской нейронной сети, подотрасли обучения за несколько выстрелов.
Введение
1- Эмпирические технологические методы в сельском хозяйстве
Выявление болезней растений является важным вопросом для фермеров. Это позволяет им адекватно лечить заболевания и принимать соответствующие меры для их предотвращения. В зависимости от видов растений существует большое разнообразие заболеваний или инфекций, связанных с паразитическими насекомыми. Эти насекомые-вредители или инфекции могут повлиять на количество и качество урожая.
Со временем было разработано несколько решений с целью выявления болезней сельскохозяйственных культур. Используемая методология близка современной медицине с научным подходом наблюдение — интерпретация — диагностика. Этап наблюдения включает в себя: предварительную информацию о поле и наблюдение за урожаем, этап интерпретации включает в себя: отбор проб, лабораторное исследование, если необходимо, консультацию специалиста, а этап диагностики включает: окончательное обнаружение и рекомендации. Сбор информации позволяет собрать всю информацию, касающуюся урожая, почвы, типов удобрений и метода орошения. Все факторы, такие как качество листа, наличие сорняков, наличие паразитических насекомых и влияние климата, должны быть приняты во внимание, чтобы иметь оптимальный диагноз. Некоторые из этих элементов могут быть отправлены в лабораторию для дальнейшего изучения и интерпретации экспертами. который затем поставит окончательный диагноз и рекомендации. Все эти операции утомительны, и процесс может занять несколько месяцев в зависимости от размера поверхности урожая.
Новейшие методы используют современные технологии для выявления болезней растений. Для наблюдения это будут самолеты или дроны, оснащенные специализированными камерами или спутниковыми снимками разного качества точности. Для интерпретации и отбора проб смартфоны для фотографирования листьев и урожая, наземные датчики для извлечения компонентов, связанных с качеством почвы, программное обеспечение, которое может собирать и обрабатывать всю информацию, связанную с наблюдением.
2- Преимущества искусственного интеллекта в сельском хозяйстве
Эмпирические методы позволяют фермерам лучше ознакомиться со своим урожаем. Они бродят по поверхности, самостоятельно собирают информацию и общаются с лабораториями или экспертами. Они длиннее и требуют много оборудования, затрат и логистики. Поэтому вероятность ошибок как при наблюдении, так и при диагностике очень высока из-за очень незначительной оптимизации и автоматизации. Усталость и ошибки человеческого наблюдения могут привести к искажению отчетов и качества информации. Советы специалистов тоже очень помогают.
Современные методы более автоматизированы с точными датчиками, предназначенными для точного сбора информации. Ошибки минимальны при отсутствии человеческого фактора, усталостного расстояния и сложных лабораторных процессов. Программное обеспечение для интерпретации запрограммировано на основе опыта экспертов в области агрономии и является специализированным. Более современное программное обеспечение использует искусственный интеллект с нейронными сетями для анализа результатов, диагностики и окончательного обнаружения. Эксперты могли бы подтвердить и обогатить результаты, полученные для программного обеспечения, чтобы помочь в окончательной диагностике с помощью человеческого опыта.
Среди решений в области искусственного интеллекта возможны несколько вариантов. Мы сосредоточимся на алгоритме нейронных сетей, включая сиамские нейронные сети, чтобы иметь возможность выполнять оптимальное и точное обнаружение.
1- Описание алгоритмов подобия
a – Косинус сходства в происхождении сиамских сетей
Сиамские нейронные сети получены из алгоритмов косинуса сходства. Принцип состоит в том, чтобы свести две части информации в векторное пространство, в котором он сравнивает образец фотографии больных растений с фотографией нового образца растения и оценивает их сходство. Алгоритм косинуса сходства является основным алгоритмом алгоритма сиамской нейронной сети. Сравнение и оценка эволюции двух моделей являются важными проблемами, которые необходимо решить в области искусственного интеллекта. Речь пойдет о представлении в векторном пространстве двух сравниваемых данных, а затем о вычислении евклидова расстояния между двумя векторами. Значение евклидова расстояния между двумя векторами показывает сходство между двумя документами.
Применением косинуса подобия в машинном обучении является широко используемый td-idf для сегментации текста или исследования рекомендаций на основе ключевых слов. Из очень большого массива текстов можно извлечь все тексты, относящиеся к ключевому слову, с очень высокой производительностью, сокращая вычислительную мощность и время выполнения.
Для сельскохозяйственной области можно будет запустить алгоритм косинуса подобия для анализа текста или изображений. Для корпуса текста это может относиться к анализу поведения клиента с целью найти переменную, которая лучше всего удовлетворит его запрос. Например, ценятся ли органические продукты для конкретного клиента, мы могли бы выполнить поиск в массиве данных об этом покупателе с помощью ключевого слова «органический», чтобы узнать, какие органические заказы он сделал бы, с какой частотой, какой тип продуктов в соответствии с типом результата. мы хотели бы извлечь. Математическая функция, связанная с косинусом подобия:
Рис. 1: Математическая формула косинуса подобия
b – Немногие узнают общие черты
Обучение с небольшим количеством выстрелов — это алгоритм машинного обучения, который позволяет получать отличные результаты при обучении и тестировании в очень маленькой базе данных. Это основная категория сиамских нейронных сетей в классификации алгоритмов глубокого обучения.
Он имитирует человеческую способность учиться и изучать редкие случаи. В этом случае люди могли различать два объекта на основе очень небольшого количества наблюдений. Это позволяет компаниям сократить свои расходы на анализ и подготовку данных, поскольку традиционные методы машинного обучения используют большой объем данных для получения эффективных моделей, в отличие от нескольких методов обучения. Он широко используется, например, в случаях компьютерного зрения (распознавание объектов, классификация изображений, классификация видео, прокат сцен), в изучении естественного языка (переход, завершение предложения, классификация текста) и робототехнике (обучение движению или манипулированию на одной или очень небольшой демонстрации). назвать несколько.
Он объединяет несколько понятий: знание по сходству, понятие сиамской нейронной сети, являющейся предметом нашего исследования; концепция получения знаний из обучения, включая очень популярную технику обучения с подкреплением; а также концепция знаний из данных, включая нейронную статистику и технику аналогии. Это изображение предлагает структуру алгоритма классификации растений, основанного на модели обучения с несколькими выстрелами.
Рис. 2: классификация растений с помощью обучения за несколько выстрелов
c- Сиамские нейронные сети
Близнецовые или сиамские нейронные сети имеют особенность наличия двух или более идентичных нейронных субархитектур, объединенных общей входной архитектурой. Эта конкретная структура дает им высокую эффективность при оценке неопределенности по небольшому набору данных. Преимущество этого метода в том, что он не требует большого количества данных и позволяет проводить постепенный анализ посевов в течение всего сезона. Это технология, которая широко используется для наблюдения за эволюцией изображений раковых органов на протяжении всего лечения. Это многослойная нейронная архитектура с методами оптимизации. Этот метод позволит проследить эволюцию растений при их обработке после первичного выявления заболевания в течение всего сезона.
Этот алгоритм изначально был разработан для задач распознавания изображений, в данном случае распознавания отпечатков пальцев, рукописной подписи, наконец, распознавания лиц, речи и объектов. Он имеет много преимуществ, а именно его устойчивость к несбалансированным классам, простоту связывания с классификатором по сравнению с другими нейронными сетями, его эффективность в изучении лингвистических сходств (очень популярно для поисковых систем и изучения естественного языка).
В области медицины данные о редких случаях очень ограничены. У него могут быть проблемы с переоснащением с очень ограниченными доступными данными. В результате сиамская сеть является очень эффективным решением, поскольку основана на принципе сравнения. Эти модели также могут быть применимы к сельскому хозяйству для оценки здоровья сельскохозяйственных культур. Мы могли бы иметь изображения здоровых растений и больных растений на входе, а затем через сеть определять сравнение или эволюцию здоровья растений. На этом рисунке показана простая архитектура реализации сиамской сети для решения проблемы обнаружения рукописного ввода.
Рис. 3. Архитектура сиамской нейронной сети
3 – Практический пример
a- Глубокое обучение и классификация растений: пример EfficientNet-B0
В этом примере использования представлен дизайн нейронной сети для обнаружения болезней, вызванных грибками пшеницы. Нейронная сеть, стоящая за этим исследованием, называется архитектурой EfficientNet-B0. Мы вместе увидим детали этой архитектуры и ее реализации.
Первым этапом этого исследования является подготовка данных:
- Эта подготовка включает в себя сбор данных из ICLR Workshop Challenge и CGIAR Computer Vision for Crop.
- Фильтрация изображений состоит из неизбыточности данных
- Маркировка изображения позволяет определить характеристику, связанную с изображением, чтобы подготовить его к будущему. На изображениях есть шесть типов болезней, а именно листовая ржавчина, мучнистая роса, септориоз, стеблевой остаток и желтая ржавчина), а также случай здорового или прорастающего растения.
Второе исследование — это реализация архитектуры:
- База данных изображений разделена на три части:
- Обучающие данные (60%) — проверочные данные (20%) — тестовые данные
- ( 20% )
- определение модели выбора в нашем случае будет ImageNet Transfer Learning
- определение нейронной сети в нашем случае EfficientNet-30 со слоями, полностью связанными друг с другом
- определение стратегии выбора: базовый уровень, увеличение базового уровня или увеличение базового уровня, передача в стиле EDA
- Последний этап — оптимизация параметров нейронной сети.
Структура нейронной сети состоит из нескольких частей:
1 Conv3x3, 1 MBConv1/k3x3, 3 MBConv6/k5x5, 4 MBConv6/k3x3, 1 пул Conv1x1 и FC. Код Conv относится к сверточной сети, а код mbconv относится к сверточной сети мобильной сети, которая представляет собой нейронную сеть, подходящую для мобильных приложений. Объединение в пул и FC являются структурами оптимизации параметров.
Рис. 3: Структура EfficientNet-B0
b – Изучение нескольких выстрелов и классификация культур
Обучение с небольшим количеством выстрелов обычно считается N-путевой задачей K-вызовов с N количеством категорий и K количеством выборок в каждой категории. Стратегия обучения включает в себя обучающие тесты и проверки, а стратегия тестирования включает в себя мета-обучение и мета-тесты, которые являются своего рода этапами недообучения в рамках этапов тестирования. А метатесты используются для поиска, настройки и тестирования производительности сети соответственно. Конкретно, этот вариант использования направлен на классификацию типов растений в соответствии с изображением, переданным в качестве входных данных. Набор поддержки содержит все входные категории и наборы запросов, все входные элементы. У нас есть два типа функций: одна для первой нейронной сети и вторая для второй сиамской сети.
Оба входа приводят к схожим нейронным архитектурам. На выходе у нас будет архитектура, которая будет вычислять евклидово расстояние между двумя характеристиками из наборов опор и набора запросов. Евклидово расстояние фактически получено из алгоритма косинуса подобия, который приводит к предсказанию. Существует также другой метод, всегда присутствующий в одном и том же варианте использования, который позволяет вам использовать внешнюю память. Эта внешняя память используется сразу после экстрактора признаков. Эта память имеет вариант алгоритма долговременной кратковременной памяти, называемый нейронной машиной Тьюринга, который лучше подходит для нескольких архитектур обучения.
Последние два метода варианта использования — это увеличение данных и оптимизация параметров. Метод оптимизации параметризации очень утомителен, к тому же метод увеличения данных легче. Метод увеличения данных состоит в создании большего количества данных для преодоления проблемы нехватки данных, обычно возникающей в случае проблем с обучением с небольшим количеством выстрелов. Перед нейронной сетью встроен алгоритм увеличения данных, который передает обычные данные в качестве входных данных. Этот алгоритм позволяет генерировать очень большое количество входных данных, используя вращение, пересечение, отсечение и отражение от текущих изображений, и направлять их в нейронную сеть с обучением за несколько кадров. Из этих методов мы можем вывести таблицу следующих результатов в процентах успеха:
Метод
Результаты по набору данных Omniglot
( 5 выстрелов )
Результаты по набору данных Mini-ImageNet
( 5 выстрелов )
Увеличение данных
-
78.16
Метрическое обучение
99.8
82.41
Внешняя память
99.77
70.13
Оптимизация параметров
98.90
79.5
Рис. 5: Таблица результатов — тематическое исследование обучения за несколько выстрелов
4- Заключение
Методы глубокого обучения для обнаружения болезней растений отличаются друг от друга. В зависимости от поставленной проблемы они позволяют найти конкретные решения, в данном случае в зависимости от их эффективности. Они являются результатом алгоритмов машинного обучения, а именно косинуса сходства, обучения за несколько выстрелов и, точнее, решения, выбранного в официальном документе, который представляет собой сеть сиамских нейронов. Сиамская нейронная сеть — это решение задач распознавания и классификации. Он использует сравнительную архитектуру с двумя похожими ветвями. Он выделяется своей эффективностью в редких случаях и сравнительных исследованиях с течением времени, а также при изучении проблем с небольшой базой данных.
Два тематических исследования, представленные в этой статье, определили эффективность методов глубокого обучения в обнаружении болезней растений и представили различные архитектуры реализации обучения с несколькими выстрелами. Наиболее эффективным методом реализации является метрическое обучение с вероятностью успеха около 82%. Сочетание обнаружения и классификации было бы идеальным решением для случая сиамской нейронной сети, чтобы воспользоваться преимуществами ее устойчивости и надежности.
5- Воспоминание
В этом документе мы хотели бы поблагодарить всех членов команды Alta Robotics, а также председателя совета директоров г-на Стюарта Брауна. Этот технический документ был написан Анже Брика, соучредителем Alta Robotics. Alta уделяет большое внимание исследованиям и разработкам, чтобы предоставить своим клиентам наиболее подходящие решения для удовлетворения их потребностей.
Разработка и модернизация технологии искусственного интеллекта для Ag-Drone на постоянной основе позволяет клиентам Alta использовать самые современные технологии, а значит, и самые информативные доступные данные. Для изучения искусственного интеллекта, компьютерного зрения или глубокого обучения или для получения дополнительной информации о нашем программном обеспечении alta-drone вы можете связаться с нами по указанным ниже координатам.
Контакты:
www.dronecity.net / [email protected] / instagram: @altaroboticscanada / https://www.linkedin.com/company/alta-robotics-canada /
Источник:
https://www.mdpi.com/1424-8220/18/8/2674
https://en.wikipedia.org/wiki/Косинусное_подобие
https://openaccess.thecvf.com/content_cvpr_2018/papers/Sung_Learning_to_Compare_CVPR_2018_paper.pdf4
https://www.enib.fr/~buche/article/FLAIRS_18.pdf
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8706936