В этом выпуске подкаста Masters of Data я говорю с новым лидером в области данных, человеческого и венчурного капитала. Сара Катандзаро - директор Amplify Partners, венчурной компании, специализирующейся на компаниях на ранних этапах разработки инноваций с помощью машинного обучения и искусственного интеллекта. Сара помогает руководить основателями и новаторами благодаря своему невероятному опыту, накопленному за годы использования науки о данных для инноваций как для частного сектора, так и для защиты национальной безопасности США. Они вместе рассматривают ряд элементов, связанных с данными и ИИ, в том числе то, сколько людей восприняли результаты движения больших данных, как данные часто используются в качестве оружия, а не актив, роль, которую предвзятость играет в сегодняшнем климате науки о технологиях, и важность разнообразия для растущих команд. Сара также откровенно делится своим опытом руководителя в расширяющейся венчурной фирме, будучи женщиной, - что не лишено своих уникальных проблем, но также имеет свои преимущества.
Чтобы начать разговор, мы немного подробнее обсудим прошлое Сары и то, как она нашла свой путь к своей нынешней роли лидера в области данных и венчурного капитала. Как объясняет Сара, она начала свой путь в секторе обороны и разведки, чтобы больше узнать о том, почему люди проявляют агрессивное поведение, и о причинах создания и развития террористических организаций. «Я обнаружил, что статистические подходы можно использовать для лучшего понимания этой организационной динамики, поэтому сразу после колледжа я пошел в Центр перспективных исследований в области обороны, где в центре внимания исследовательской программы, которой я руководил, было по вычислительным моделям поведения противника ». Отсюда Сара начала понимать, что программное обеспечение и данные можно использовать для лучшего понимания поведения людей совершенно по-другому, но в конечном итоге она задала вопрос: «Как мы можем использовать данные для прогнозирования поведения организации?». Так как же она попала из государственного сектора в частный, венчурный, мир? Как она объясняет: «На самом деле это одна и та же тема. Я всегда пытался ответить на вопрос, как эта небольшая тайная организация подрывает действия действующего президента. Как мы прогнозируем их поведение с помощью данных? »
В основе того, чему Сара посвятила свое профессиональное время, была идея данных. Но в наши дни данные стали одним из модных социальных словечек, особенно в мире технологий. Итак, как нам правильно понять, что такое данные? Как отмечает Сара: «Я думаю, что нам нужно всегда напоминать себе, что данные - это представление мира. Данные - это представление о поведении человека ». Основываясь на этом, она отмечает, что «на самом деле это гораздо больше зависит от конфиденциальности и от способов использования данных в качестве оружия для реального подавления, опять же, недостаточно представленных групп населения. Я вижу гораздо меньше усилий, чтобы использовать данные как инструмент поддержки или использовать данные, чтобы по-настоящему выделить тех корявых слонов в комнате, о которых мы не говорим ». Но как насчет предвзятости и ее роли в данных? Трудно говорить о данных, не говоря о той роли, которую предвзятость играет при их получении. Итак, как предвзятость влияет на собираемые данные? «В некотором смысле, в наших данных нет такой вещи, как предвзятость, есть только предвзятость в обществе, предвзятость отдельных лиц, и это находит отражение в наших источниках данных. Я думаю, что меня иногда беспокоит то, что мы видим эти подходы, мы видим эти разговоры об устранении предвзятости в наших наборах данных. Если мы удалим предвзятость из наших наборов данных, то у нас не будет возможности фактически выявить эту предвзятость в обществе », - отмечает Сара.
Еще одна тема для обсуждения - идея разнообразия и его важность в процессе сбора данных и защиты предвзятости, а также его включение для создания устойчивой, растущей команды. Как отмечает Сара: «Разные команды производят лучший анализ… Когда у вас есть разные точки зрения, вы можете представить себе разные крайние случаи, вы можете представить разные результаты, вы можете представить разные интерпретации, и поэтому на самом деле разные команды просто лучше. Особенно в мире науки о данных ». Но она добавляет: «Я думаю, что еще одна проблемная тенденция Кремниевой долины - это стремление нанимать сотрудников ради разнообразия как самоцели». Таким образом, хотя разнообразие имеет решающее значение для поддержания целостности, оно не может быть самоцелью. На самом деле, разнообразие - это то, что Сара сама видела в своей роли женщины, возглавляющей развивающуюся венчурную фирму. Рассказывая о своем опыте, она отмечает: «Я не буду притворяться, что это легко. На самом деле, я думаю, что мне, как женщине в венчурном капитале, нужно поторопиться. Просто у вас нет той социальной структуры, которая может быть у ваших коллег-мужчин, но в определенном смысле у вас больше возможностей для роста ».
Подводя итог дискуссии, они обсуждают будущее ИИ, что означают эти тезисы для обсуждения на годы вперед и на что будет уделено время и внимание по всем направлениям. Для Сары цель ясна. «Один вопрос, который я часто задаю себе, - это во что я верю, во что другие люди не обязательно верят. Например, какие мнения я придерживаюсь относительно противоположных? И, честно говоря, если бы я был очень взволнован тем, что выглядело бы скорее научной фантастикой или, возможно, даже не обязательно чрезмерно преувеличенным, а просто странным, это была бы область расширенного интеллекта. Итак, если я раскрою то и это о том, что предшествует расширенному интеллекту, я думаю, что это будет более сложное понимание того, что люди хороши, и какие машины хороши, и как мы разрабатываем правильные интерфейсы между людьми и машинами ». «Есть много вещей, которые мы делаем сегодня, для которых мы просто не очень хорошо приспособлены, я имею в виду, что мы думаем об определенных элементах памяти, определенных рутинных задачах, которые мы делаем. Мол, как мы можем заполнить эти пробелы в будущем ».
Упомянутые исходящие ссылки и ресурсы
Эпизод подкаста Masters of Data
Узнайте больше о Саре:
Следуйте за Сарой в Twitter @ sarahcat21
Свяжитесь с Сарой в LinkedIn:
Узнайте больше о партнерах Amplify:
Https://amplifypartners.com/about/
Следуйте за Amplify в Twitter @AmplifyPartners
Следите за Amplify в LinkedIn:
Выводы
- Статистические подходы могут использоваться для лучшего понимания организационной динамики и того, почему террористические группы организуются именно таким образом.
- Центр перспективных оборонных исследований фокусируется на таких вопросах, как «Как мы можем использовать программное обеспечение, как мы можем использовать статистику, чтобы понять группу повстанцев или понять террористическую или преступную группу какого-либо другого характера».
- Люди создают алгоритмы, собирают данные, создают эти приложения, но на самом деле они не думают о человечности в процессе.
- Самое сложное в изучении человеческого поведения - сохранять объективность. Вы всегда склонны думать о том, что бы вы сделали в определенной должности или как бы вы поступили. Это просто инстинкт, это сочувствие.
- Данные - это представление мира. Данные - это представление о поведении человека. Таким образом, в каком-то смысле в наших данных нет такой вещи, как предвзятость, есть только предвзятость в обществе, предвзятость отдельных лиц, и это отражается в наших источниках данных.
- Данные можно использовать как оружие для реального подавления недостаточно представленных групп населения, а не как инструмент поддержки.
- Разнообразные команды производят лучший анализ. Когда у вас есть разные точки зрения, вы можете представить себе разные крайние случаи, вы можете представить разные результаты, вы можете представить разные интерпретации, и поэтому на самом деле разные команды просто лучше. Особенно в мире науки о данных.
- Быть женщиной в венчурном капитале непросто, потому что у вас нет тех социальных структур, которые могут быть у ваших коллег-мужчин, но есть больше возможностей для роста.
- Простое знание того, что существует предубеждение, не освобождает вас ни от чего. Следующий шаг - подумать о том, как мы можем использовать набор инструментов, которые у нас есть, чтобы что-то изменить.
- Цель должна состоять в том, чтобы избавиться от этого предубеждения в обществе или, по крайней мере, как-то смягчить его.
- Есть разрыв между большими данными и искусственным интеллектом. При переходе от больших данных к ИИ мы почти относимся к ИИ как к серебряной пуле, и мы как бы забываем о том, что подготовка данных, этот анализ, инженерные практики, подобные этим проблемам, должны быть решены.
- Многие инструменты, которые специалисты по данным используют сегодня, были разработаны для индивидуальных участников, а не для команд.
- Существует более сложное понимание того, в чем хороши люди, и какие машины хороши, и как мы разрабатываем правильные интерфейсы между людьми и машинами.
- Сегодня мы делаем много вещей, для которых мы не очень хорошо приспособлены, я имею в виду определенные элементы памяти, определенные рутинные задачи, которые мы выполняем.