Это первая статья из серии статей о передовых подходах к анализу данных и их применении для организаций социального воздействия (SIO) — без математического и статистического жаргона, обычно используемого для объяснения этих методов.

Прежде всего, это нейронные сети.

На высоком уровне нейронные сети вдохновлены человеческим мозгом. Нейронные сети интерпретируют шаблоны в наборе данных подобно тому, как мозг интерпретирует наборы цветов и форм, чтобы обнаруживать такие вещи, как светофоры или логотип потребительского бренда.

Так как же на самом деле происходит этот перевод? Чтобы имитировать человеческий мозг, нейронные сети в массовом масштабе сопоставляют входные данные с выходными. Нейронная сеть использует ряд вычислительных «слоев» для аппроксимации:

функция f(x) = y

между любым входом x и любым выходом y (конечно, если x и y связаны посредством корреляции или причинно-следственной связи). В процессе обучения нейронная сеть находит нужное f или правильный способ преобразования x в y

Сложность самой сети зависит от сложности проблемы. Общее количество «слоев» в сети примерно зависит от количества переменных, которыми обладает проблема.

Возьмем две гипотетические задачи:

· Анализ различных комбинаций звуков для интерпретации слов на нескольких языках

· Анализ 5 показателей состояния здоровья, чтобы определить вероятность развития у человека диабета II типа.

Первая проблема, решение которой требует обработки миллионов конфигураций, потребует гораздо большего количества сетевых уровней, чем вторая, для решения которой требуется всего несколько тысяч.

Эти сетевые слои сами состоят из вычислительных точек, называемых нейронами или «узлами». Каждый узел взвешивается предыдущими событиями обучения, и с каждым новым вводом данных происходит дополнительное обучение. Нейронные сети изучают и присваивают веса связям между различными нейронами каждый раз, когда сеть обрабатывает данные. Взятые вместе, эти узлы и слои способны предсказать выходное значение практически любой точки данных, введенных в модель.

Нейронные сети особенно хорошо подходят для сложных случаев разработки и развертывания программ, с которыми сталкиваются специалисты по техническому обслуживанию персонала. Это связано с тем, что чем больше входных данных доступно для постановки задачи, тем более ценной становится нейронная сеть.

Одной из важных причин является способность нейронной сети предоставлять более выразительный или действенный результат. Хорошим примером этого являются эффекты взаимодействия. Базовые подходы, такие как линейная регрессия, рассчитывают корреляцию отдельных переменных с целевой выходной переменной, а нейронные сети могут интерпретировать взаимодействия между переменными, что позволяет разработчикам программ и аналитикам понимать совокупные эффекты несколько факторов в проблеме или вопросе - и, как результат, принимать более разумные решения по разработке и выполнению программы.

Давайте возьмем гипотетический пример: продовольственный банк хочет развернуть мобильную кладовую со свежими продуктами для людей с преддиабетом в районах с низким доходом. Продовольственный банк обладает демографическими данными, данными о доходах домохозяйств (HHI) и наборами данных о местоположении.

Линейная регрессия будет моделировать корреляции отдельных атрибутов, но не сможет идентифицировать корреляции критических комбинаций. С другой стороны, нейронная сеть могла бы выявить значительную корреляцию между предиабетом и комбинациями конкретных переменных взаимодействий, таких как уровень HHI (скажем, ‹50 тысяч долларов), этническая принадлежность (скажем, мексиканская) и расстояние до супермаркетов со свежими продуктами. (скажем, 0,25 миль).

В отличие от стандартного линейного регрессионного анализа, нейронная сеть позволяет планировщикам программ разумно расставлять приоритеты в распределении ресурсов среди лиц с самым высоким риском, теоретически максимизируя воздействие программы.

Теперь давайте более подробно рассмотрим две широкие категории проблем, для решения которых хорошо подходят нейронные сети:

Заболеваемость. Предположим, SIO, специализирующийся на злоупотреблении психоактивными веществами, хочет лучше понять тенденции передозировок опиоидами в крупном городе США, чтобы принять программные решения, которые повысят его эффективность в предотвращении передозировок. Нейронная сеть может анализировать отчеты о передозировках и связанные с ними показатели, такие как аресты за наркотики, процентное изменение цен на жилье, расстояние до служб детоксикации и т. д., чтобы предсказать как будущее местоположение, так и объем передозировки опиоидами. Выходные данные нейронной сети могут помочь максимизировать эффективность программы, предоставляя SIO данные, необходимые для разработки типов программ (например, распределения наксалона) и модели доставки (например, мобильной клиники), специально предназначенной для борьбы с ожидаемыми моделями передозировки в будущем.

Заболеваемость. Нейронные сети превосходно предсказывают вероятность возникновения таких заболеваний, как диабет, инсульты или сердечные приступы, на основе больших наборов данных населения или, что еще лучше, жизненно важных показателей и данных с носимых устройств. Предоставление SIO возможности адаптировать программу и режимы лечения на основе прогнозируемой заболеваемости может значительно повысить его экономическую эффективность (сведя к минимуму затраты на получение успешного результата) и общий объем пропускной способности лечения, тем самым увеличив его общее воздействие.

Надеюсь, всем понятно, что нейронные сети и их «выразительный» прогнозный результат предоставляют SIO действенную аналитику данных для создания и предоставления услуг, которые более эффективны и реагируют на сложные системы, в которых они работают.