Обзор

Индийская промышленность по производству кирпича является вторым по величине производителем кирпича в мире, насчитывая более 100 000 действующих единиц и производя около 250 миллиардов кирпичей в год. Кирпичные печи ежегодно потребляют около 25 миллионов тонн угля — они являются основным источником выбросов в атмосферу твердых частиц и вредных газов, таких как окись углерода и двуокись серы. По оценкам, в период с 2005 по 2030 год строительство зданий в Индии будет расти на 6,6%, что приведет к увеличению спроса на кирпич и другие строительные материалы¹. Таким образом, загрязнение воздуха в результате производства кирпича и его последующее воздействие на благополучие человека и экосистемные услуги стали серьезной экологической проблемой, требующей немедленного внимания².

Большинство печей для обжига кирпича в Индии основаны на традиционном типе траншейных печей с фиксированным дымоходом (FCBTK). Правительство Индии стремится преобразовать существующую печь FCBTK в новую конструкцию, известную как печь Зигзаг, которая является более энергоэффективной и значительно меньше загрязняет воздух. Однако владельцы печей не спешили внедрять зигзагообразную конструкцию из-за затрат на модернизацию новой технологии³.

В июне 2017 года Центральный совет по контролю за загрязнением (CPCB) издал директиву, предписывающую кирпичным печам по всей Индии преобразовать зигзагообразную конструкцию в прямоугольную форму печи. В этой директиве четко указывалось, что печи для обжига кирпича, работающие без разрешения соответствующих государственных органов по контролю за загрязнением окружающей среды (SPCB), будут закрыты. Несмотря на вмешательство государства, многие печи для обжига кирпича продолжают работать с нарушением предписанных норм проектирования — CPCB недавно заявил, что более 70% печей для обжига кирпича работали без согласия⁴. Учитывая их размер, полупостоянство и нерегулируемую деятельность кирпичной промышленности, места расположения кирпичных печей часто остаются не нанесенными на карту — их вклад значительно недопредставлен в кадастрах выбросов, определяющих первичные источники загрязнителей воздуха, что препятствует полномасштабной оценке их регионального воздействия на окружающую среду⁵ .

Из-за его нерегулируемого характера нарушения прав человека широко распространены во всей кирпичной промышленности — рабочие обычно живут в ужасных условиях и работают без доступа к водопроводу и канализации. Большая часть рабочей силы навсегда оказывается в ловушке долговой кабалы — вынуждена работать до 18 часов в день в ужасающих обстоятельствах, чтобы погасить долги владельцам печей. Заработная плата, как правило, удерживается в течение всего сезона — рабочие не видят своего текущего долгового статуса и регулярно получают зарплату ниже установленного законом минимума. Крайняя бедность поощряет детский труд — недавний отчет организации Anti-Slavery International показал, что треть всей рабочей силы, занятой в производстве кирпича в Индии, составляют дети, многие из которых не имеют доступа к начальному образованию⁶.

Несмотря на то, что это запрещено Конституцией Индии, внутренним законодательством и международным правом, кабальный и детский труд по-прежнему лежит в основе производства кирпичных печей и поддерживает бурно развивающийся строительный сектор Индии. Цель устойчивого развития Организации Объединенных Наций 8.7 призывает к немедленному осуществлению эффективных мер по искоренению принудительного труда, ликвидации современного рабства и искоренению детского труда во всех его формах к 2025 году. Правительство Индии изо всех сил пыталось координировать и контролировать стратегический ответ на эти проблемы — законы часто не соблюдаются коррумпированными или недостаточно обеспеченными ресурсами чиновниками, а многие печи в отдаленных районах ускользают от внимания общественности.

Составление реестра с указанием местоположения печей для обжига кирпича, производственных мощностей и типов конструкции в разных регионах имеет решающее значение для количественной оценки их воздействия на окружающую среду, проверки эффективности новых технологий и мероприятий по улучшению качества воздуха, а также для поддержки соблюдения законов о труде и защите детей.

Анализ спутниковых изображений предлагает многообещающее решение для периодического картирования и мониторинга работы кирпичной печи на больших площадях — в отличие от трудоемких наземных съемок.

Кирпичные печи обычно заметно выделяются из окружающего растительного покрова и могут быть легко идентифицированы на оптических спутниковых снимках высокого разрешения по их уникальным геометрическим особенностям. С точки зрения почти надира относительно просто отличить овальные печи FCBTK, круглые печи Хоффмана и более чистые прямоугольные печи типа «зигзаг».

Курирование обучающих данных

В этом исследовании оценивалась возможность обучения сверточных нейронных сетей (CNN) для автоматической идентификации и сегментации оптических спутниковых изображений высокого разрешения. Для этой цели была выбрана модель CNN на основе U-Net, результатом которой было преобразование спутниковых изображений RGB в попиксельную сегментацию, включающую два класса земного покрова — фон / кирпичная печь.

Уточнение результатов исследования Nazir et al. (2020), периметр границы примерно 3000 кирпичных печей по всему Пакистану был очерчен в виде простых многоугольников с 4 точками в реальных координатах с использованием инструментов изображений и аннотаций, доступных в Google Планета Земля Про. Полигоны с географической привязкой были помечены уникальным числовым идентификатором и впоследствии экспортированы в формат GeoJSON с помощью утилит командной строки GDAL/OGR.

Выдержки базовой карты Maxar Vivid в истинном цвете (уровень масштаба 16), совмещенные с аннотированными местоположениями кирпичных печей, были автоматически загружены через Securewatch OGC Web Mapping Tile Service (WMTS) с использованием функциональности проекта WMTS-extractor.

Чтобы уменьшить вычислительные затраты, размеры входного слоя модели U-Net были настроены как (128x128x3) — поэтому изображения RGB Vivid GeoTIFF были обрезаны до размера 128x128 пикселей. Аннотация кирпичной печи, совмещенная с реальным экстентом каждого обучающего изображения, была записана в сопутствующую бинарную маску метки размером 128x128 пикселей с использованием функциональности проекта Image-labeller.

Карта, показанная ниже, показывает географическую протяженность аннотации кирпичной печи в виде красной ограничивающей рамки. Кураторский набор данных впоследствии был разделен на подмножества для обучения, проверки и тестирования — образцы, расположенные рядом с меньшей прямоугольной областью, обозначенной синим многоугольником, были случайным образом назначены подмножествам для проверки и тестирования. После фильтрации подмножество поезда включало примерно 12000 образцов, тогда как около 850 образцов было выделено для подмножеств проверки и тестирования.

Архитектура модели U-Net

Первоначальная архитектура сверточной нейронной сети (CNN) U-Net была разработана Olaf Ronneberger et al. (2015) для автоматического сегментирования клеточных структур в биомедицинских изображениях. Семейство моделей CNN U-Net вычисляет попиксельное преобразование многоканального входного изображения в классификационное изображение с несколькими метками, также известное как семантическая сегментация. В контексте этого исследования модели U-Net были настроены для маркировки пикселей в один из двух классов — либо фон, либо кирпичная печь.

Модели U-Net олицетворяют свою симметричную U-образную архитектуру и состоят из двух основных компонентов: левая часть обычно называется сокращающимся путем (или кодировщиком), а самая правая часть обычно известна как расширяющийся путь (или декодер). Путь сокращения включает в себя повторное применение двух незаполненных сверток 3x3, выходные данные которых подаются через функцию активации выпрямленной линейной единицы (ReLU) и агрегируются с помощью операции максимального объединения 2x2 с шагом 2. После каждого шага свертки количество функциональных каналов равно удваивается, тогда как размеры карты объектов уменьшаются на 2.

И наоборот, после каждого шага расширенного пути карта объектов увеличивается в 2 раза и объединяется с соответствующей обрезанной картой объектов, взятой из сужающегося пути. Затем применяются еще две незаполненные свертки 3x3, и выходные данные передаются через функцию активации ReLU. На последнем уровне используется свертка 1x1 для сопоставления 64-компонентного вектора признаков с желаемым количеством классов. Выходные данные последнего слоя обычно проходят через функцию активации soft-max, значения которой представляют нормализованную вероятность того, что каждый входной элемент (пиксель изображения) принадлежит определенному классу. Всего стандартная архитектура U-Net включает 23 сверточных уровня.

Архитектура U-Net также включает соединения с длинным пропуском, когда выходные данные слоев кодера объединяются со слоями повышающей дискретизации на пути декодера для восстановления мелкозернистой пространственной информации, потерянной при понижающей дискретизации входного изображения.

С помощью библиотеки Python keras-unet-collection — поддерживаемой сообществом реализации Tensorflow/Keras различных архитектур на основе U-Net — была настроена и обучена стандартная модель U-Net для вычисления преобразования изображений Maxar Vivid RGB размером 128x128x3 в пиксельные изображения. изображение бинарной классификации wise 128x128x2 (кирпичная печь, фон). Архитектура состояла из четырех сверточных слоев — 64, 128, 256 и 512 функциональных каналов соответственно. Чтобы стабилизировать процесс обучения, перед применением функции активации ReLU были стандартизированы выходные данные всех сверточных блоков энкодера — так называемая пакетная нормализация.

Результаты обучения

Значения веса в сверточных слоях U-Net были инициализированы случайным образом. Используя случайно выбранные мини-партии (размер выборки 16), обучение было выполнено с использованием оптимизатора Адама (скорость обучения 1e-6), настроенного с функцией потери коэффициента Дайса. Используя специфическую для канала статистику (среднее значение и стандартное отклонение), рассчитанную по всему набору обучающих данных, значения пикселей RGB были преобразованы в стандартные значения z — среднее значение нуля и стандартное отклонение 1,0 — перед вычислением функции потерь. Потери при валидации сошлись к ~ 0,1 после ~ 100 эпох, что свидетельствует о том, что процесс обучения сошелся к достаточно обобщенному решению.

По прошествии 700 эпох обновленные веса моделей были сохранены в файл, а затем повторно загружены для запуска прогнозов на ранее невиданном тестовом наборе данных (~ 800 выборок) для оценки производительности модели U-Net и возможностей обобщения. Пороговое значение >0,5 было применено к вектору вероятности мягкого максимума, сгенерированному моделью U-Net, чтобы назначить пиксели классу печи для обжига кирпича или фонового класса.

Дальнейший анализ был сосредоточен на оценке способности обученной модели U-Net автоматически идентифицировать и очерчивать участки кирпичных печей на ранее невидимых спутниковых снимках большой площади. Для произвольной интересующей области размером 5 км² x 5 км² выводы были вычислены в блоках 128x128, а затем повторно объединены в один результат — результаты были визуально оценены путем наложения маски сегментации U-Net на исходные изображения базовой карты Maxar Vivid RGB. Все участки кирпичных печей были успешно идентифицированы с помощью модели U-Net во время этого анализа, хотя иногда на заднем плане также были очевидны ложные срабатывания. Добавление дополнительных сверточных слоев в архитектуру модели U-Net, вероятно, повысит ее точность и возможности обобщения.

Ресурсы

Исходный код, блокноты и файлы аннотаций, созданные в ходе этого исследования, доступны для загрузки через репозиторий GitHub.