На встрече в Пало-Альто мы завершали разговор о применении спутниковых данных, когда зашла речь о продолжающихся трудностях монетизации космической отрасли. В конце концов, мы только что часами говорили о том, как новые спутники собирают лучшие из когда-либо доступных данных и как алгоритмы и конвейеры машинного обучения (ML) могут находить объекты на изображениях и обнаруживать изменения. С лучшими спутниками, данными и аналитикой, не должно ли это означать, что мы можем открывать другие вещи, которые ранее были непознаваемы? Разве это не возможность? Итак, мы начали обсуждать, почему продукты спутниковой связи, Интернета вещей и машинного обучения используются недостаточно.
Хотя космическая отрасль Силиконовой долины обладает технологиями, позволяющими делать удивительные вещи, помимо самих технологий есть аспекты, которые обычно не обсуждаются, но которые имеют решающее значение для роста этой молодой отрасли. Вот несколько мнений, которые у меня есть на эту тему:
- Обнаружения, сделанные на основе спутниковых изображений и машинного обучения, должны предоставляться клиентам в действенном контексте. Клиенту, использующему данные, нужен одношаговый процесс внедрения новой информации в свою работу. Стопка изображений сама по себе не дает понимания без интерпретации. Так же как и алгоритм обнаружения изменений сам по себе — или даже карта новых пикселей здания, потому что для того, чтобы он был полезен, требуется больше обработки. Клиенты в конце конвейера хотят принимать решения на основе информации, а не делать больше сравнений, анализа или работы. Если вы не уверены, как ваши данные дают представление, оцените, как они напрямую влияют на что-то вроде CapEx или OpEx и за сколько шагов. Если вы не можете обрисовать это в пользовательской истории, ваш продукт неполный.
- Ценность, получаемая от анализа, должна положительно влиять на стоимость данных и анализа. Иметь лучшее понимание недостаточно. Клиент должен получить больше денег (или сэкономить на рабочей силе, времени, эффективности, безопасности, воздействии/опасности на окружающую среду и т. д.), чем он тратит на данные и анализ. Понимание должно стоить стоимости генерации, а дополнительная аналитическая работа (см. номер 1) напрямую увеличивает его цену.
- Общие стандарты данных для поиска и доступа к спутниковым данным и данным Интернета вещей в облаке ускорят внедрение инноваций. Передний край использования пространственных данных и машинного обучения требует объединения данных из разных источников в облаке, но стандарты спутниковых данных и данных IoT не получили широкого распространения или согласования. В то время как один специалист по обработке и анализу данных может справиться с настраиваемым сбором данных из 5 или 10 источников, что произойдет, если команда состоит из 50 человек и имеется 1000 источников? Или 10000? А затем расширить это — как эта модель будет вести себя в производстве, которое более требовательно, чем разработка? И в разных регионах, где требуются разные модели машинного обучения? Как отрасль, у нас есть технологии для поддержки такого типа интеграции данных, но у нас пока нет хорошей системы для правильной организации этого. Вместо общего набора стандартов данных у каждого провайдера свои. Общие стандарты помогут снизить затраты на сбор данных, машинное обучение и внедрение в конце конвейера.
Есть большие надежды и возможности, но нам нужно облегчить людям работу с данными и анализом в рабочих процессах реальных людей (читай, как неспециалистов по ГИС). В связи с этим я хотел бы видеть больше спутниковых данных и данных ML, которые выходят за рамки данных и ML и рассказывают о том, как идеи были реализованы для стимулирования изменений. Нам нужно предоставлять клиентам реальную ценность, а не просто больше данных. Кроме того, (стандартные) стандарты данных, пожалуйста!
Что вы думаете?
Наш голубой мрамор (кредит: Twin Blue Marbles, изображения НАСА, сделанные Рето Штёкли, на основе данных НАСА и NOAA.)