От моделей машинного обучения до утреннего кофе
Гаутами Лангарканде – младший инженер по машинному обучению в команде Yara Digital Ag Solution по обработке и анализу данных.
Хотя многие начинают свой день с глотка (или глотков) кофеина, вы можете быть удивлены, узнав, что кофе является вторым по стоимости товаром после нефти.
Кофе был впервые обнаружен в Северной Африке и Западной Азии, а затем стал популярным в остальной части Азии, Европы и Америки.
Yara тесно сотрудничает с производителями кофе в Колумбии. Наши агрономы консультируют, оценивают качество кофейных зерен и помогают фермерам повысить продуктивность, качество и ценность урожая кофе. Мелкие фермеры, выращивающие кофе, продают необжаренные зеленые зерна напрямую кофейным кооперативам.
В Yara’s CoffeeClub есть инструменты, которые связывают мелких фермеров, выращивающих кофе, с профессионалами из группы агрономических знаний Yara. Команда Data Science компании Digital Ag Solution разработала и утвердила инструменты машинного обучения, известные как Coffee Solution, для оценки размера, цвета и качества кофейных зерен.
Проблема: сложность измерения качества
Цена кофейных зерен значительно варьируется в зависимости от качества. Размер и наличие дефектов используются для определения качества кофейных зерен. Целью Coffee Solution было предоставление легкодоступного и надежного инструмента для оценки качества продукции и оценки ожидаемого дохода фермера.
В настоящее время измерение качества основывается на визуальном осмотре на наличие дефектов и сегрегации на основе сита для распределения по размеру в кофейных кооперативах. Процесс полностью ручной и может быть очень субъективным.
Мы предложили и разработали подход к моделированию машинного обучения (ML), чтобы: i) автоматизировать методы измерения качества и ii) ввести общие показатели на основе объективных машинных данных. расчеты.
Предлагаемая модель машинного обучения сможет анализировать изображение образца кофейного зерна и создавать отчет о распределении размеров и информацию о дефектах.
Разработка модели машинного обучения (ML)
Модель ML была разработана поэтапно, как описано ниже. Мы создали экспериментальную установку для фотографирования бобов, чтобы предоставить изображения, используемые для разработки модели машинного обучения.
Мы разработали алгоритмы для следующих компонентов «сборки» модели ML:
1. Балансировка цвета кофейных зерен
Качество кофейного зерна во многом зависит от его цвета. Более темные бобы могут свидетельствовать о росте грибков или о том, что они недостаточно высушены. Фасоль с желтоватым оттенком может быть кисловатой.
Нам нужно было создать «постоянство цвета» на изображении фасоли, чтобы модель могла распознавать истинный цвет независимо от условий освещения для изображения фасоли.
В рамках подготовки изображения нам пришлось настроить и протестировать уровень экспозиции и различные условия освещения. Мы включили круглый «Цветовой жетон» (второе изображение), чтобы помочь изменить цвет изображения до его истинного тона.
2. Удаление фона и тени
Поскольку инструмент предназначен для использования в обычных условиях (т. е. в среде, в которой находится фермер) с неконтролируемой средой обработки изображений, фактические изображения могут иметь тени, тусклое освещение или фон не белого цвета, что может повлиять на качество фотографии.
Мы автоматизировали удаление фона, чтобы гарантировать, что изучается только фактический компонент. Кроме того, поскольку тень влияет на воспринимаемый размер боба, мы также изучили методы удаления теней.
3. Калибровка кофейных зерен
Алгоритм преобразует изображение образца кофейных зерен в график распределения на основе размеров кофейных зерен в соответствии с текущими размерами сита.
Мы построили график, который представляет распределение зерен по размерам в каждом образце. На этом графике показано, какой процент зерен проходит через сита того или иного размера. Потребители предпочитают более крупные бобы, а фермеры, которые могут доказать наличие более крупных бобов в образце, смогут установить более высокую цену за лот.
Обжаривание бобов имеет решающее значение для раскрытия аромата бобов. Чтобы все зерна прожарились равномерно, они должны быть как можно более одинакового размера. Крупные зерна обжариваются медленнее, чем мелкие. Обжаривание зерен разного размера приведет к неравномерному вкусу.
4. Обнаружение дефектов в кофейных зернах
Мы отправили бракованные кофейные зерна арабика с колумбийских кофейных ферм в наш цифровой центр в Сингапуре.
Мы сделали сотни фотографий образцов со смешанными дефектами и вручную аннотировали тысячи бобов.
Используя эти изображения, мы обучили модель обнаружения объектов, чтобы она могла классифицировать бобы по одному из восьми классов дефектов (существует около 18 различных дефектов, на которые обращают внимание покупатели).
В настоящее время эта модель корректно классифицирует дефекты с точностью ~71%.
Эти четыре алгоритма были развернуты в новом прототипе мобильного приложения Android для Coffee Solution, который проходит внутреннее тестирование.
Будущие планы развития
Мы улучшаем модели машинного обучения, чтобы выявлять больше дефектов с большей точностью. Мы также стремимся встроить модели в мобильное приложение, чтобы прототип мог работать в автономном режиме.
Ознакомьтесь с открытыми вакансиями в команде Data Science компании Digital Ag Solutions здесь. Также подпишитесь или свяжитесь с Gautami Langarkande, чтобы обсудить проект машинного обучения более подробно или получить обновления о наших приложениях для фермеров!