Проекты по науке о данных могут быть грязными, но они могут дать вам суперудовлетворение от работы.

Около четырех месяцев назад, примерно в середине сентября, я узнал об Omdena и их предложениях по реальным проектам искусственного интеллекта для общественного блага. Я занимался только некоторыми личными проектами на kaggle и никогда не работал над реальными проектами в области машинного обучения или науки о данных. Итак, когда я узнал об Omdena и некоторых проектах, которые были перечислены на их сайте. Я быстро решила подать заявку на участие в одном из проектов по прогнозированию материнской смертности в сельских районах Африки к югу от Сахары, чтобы на раннем этапе выявить беременных женщин из группы высокого риска и как можно раньше предоставить надежные лекарства для снижения материнской смертности в регионе АЮС.

Страны Африки к югу от Сахары входят в первую десятку стран мира с коэффициентом материнской смертности (MMR) более 1000. MMR рассчитывается как число смертей беременных женщин на 100 000 беременностей. давайте углубимся в мой опыт работы над этим проектом более 8 недель.

В этой статье я расскажу вам о процессе подачи заявки в Omdena на участие в конкурсах инноваций в области искусственного интеллекта. Мой опыт работы над задачей искусственного интеллекта в течение двух месяцев и то, что я узнал из этого проекта. Итак, приступим!

Как подать заявку на участие в инновационных конкурсах Omdena AI

Omdena — крупнейшая в мире общественная организация, занимающаяся инновационными задачами в области искусственного интеллекта для решения реальных проблем из разных уголков мира. Многие некоммерческие организации сотрудничают с Omdena для проведения различных задач и проектов, направленных на создание эффективных решений ИИ для конкретной проблемы.

Если вы никогда не слышали об Omdena, я настоятельно рекомендую посетить их официальный сайт. (ссылка на веб-сайт) Omdena часто выпускает новые интересные задачи в различных областях ИИ, таких как компьютерное зрение, НЛП, чат-боты, дистанционное зондирование и т. д.

  1. Нажмите на любой инновационный проект ИИ, на который вы хотите подать заявку
  2. Прочтите описание проекта и постановку задачи
  3. Проверьте требования
  4. Если вы подходите для проекта, нажмите кнопку Применить, чтобы запустить приложение.

О чем следует помнить при подаче заявки на участие в конкурсе ИИ.

  • Отвечайте кратко и лаконично
  • Поделитесь самой сложной проблемой машинного обучения, которую вы решили
  • Опишите любой проект, который вы инициировали, и каково было влияние этого проекта.
  • Наконец, сколько часов в неделю вы можете посвятить проекту, на который подаете заявку?

Если вы сможете сообщить, на что вы способны, ожидайте, что вы будете выбраны для участия в этом испытании.

Мой опыт работы над задачей искусственного интеллекта по снижению материнской смертности в регионе АЮС

Работа в Omdena была отличным опытом из-за реальных формулировок проблем, создание проекта, который оказывает реальное влияние на мир, а работа с разнообразной командой глобальных сотрудников делает его еще более стоящим.

Двигаясь вперед, позвольте мне поделиться кратким изложением проблемы и некоторым контекстом проекта, над которым я работал:

Постановка задачи

Решение ИИ, которое позволит человеку отправлять свою матрицу данных (связанных с личным здоровьем), и решение ИИ будет предсказывать потенциальный риск смерти, с которым человек может столкнуться во время беременности. Целью такой системы ИИ будет снижение материнской смертности.

При желании задача ИИ может также создать сквозной инструмент, который позволит человеку загружать свои данные с помощью инструмента, и человек может увидеть результат модели ИИ.

Контекст

Воздействие, которое оказывает эта технология, заключается в снижении материнской смертности в странах АЮС (страны Африки к югу от Сахары). Эта технология позволяет будущим матерям быть в авангарде своей беременности и оптимизировать рабочие процессы поставщиков медицинских услуг для повышения эффективности, доступности и качества медицинской помощи с использованием искусственного интеллекта (ИИ).

Я работал над проектом от начала до конца вместе с 25+ участниками со всего мира. Организатором проекта выступила MobileUurka, инициатива, основанная магистрантом Университета Врие в Амстердаме. Вы можете посмотреть видео на YouTube об их инициативе.

Мы начали с стартового звонка примерно в конце сентября 2022 года с введения в постановку задачи проекта и обзора возможных результатов проекта. основная цель заключалась в снижении материнской смертности, возникающей из-за различных проблем со здоровьем и осложнений беременности, с которыми сталкиваются женщины в странах Африки к югу от Сахары.

В течение первых двух недель мы в основном работали над первоначальным набором данных, которым поделился хост проекта. Набор данных был о записях пациентов с различными показателями здоровья и демографическими показателями. мы разделили команды на 5 рабочих групп, чтобы эффективно сотрудничать, разделять подзадачи и избегать повторяющейся работы. Я также возглавил рабочую группу Форматирование и сбор данных для сбора данных из различных источников и проведения начального анализа для дальнейшей обработки.

В этом проекте понимание контекста и проблемы было действительно важно, поскольку это было в области здравоохранения. Мы, как команда, тесно сотрудничали, чтобы собрать различные исследовательские работы по схожим формулировкам проблем. мы извлекли ключевые идеи из этих исследовательских работ и узнали особенности, которые влияют на материнскую смертность в регионах SSA, какие алгоритмы машинного обучения оказались эффективными для решения задач прогнозной аналитики и т. д.

В основном я работал над очисткой данных, исследовательским анализом данных в наборах данных, алгоритмами кластеризации и созданием синтетических данных, чтобы решить проблемы с небольшим количеством точек данных и классификацией дисбаланса. Нам также нужно было поработать над сбором внешних наборов данных, имеющих отношение к этой постановке задачи, поскольку у нас было меньше точек данных для разработки точных и обобщенных моделей машинного обучения. Некоторые члены команды могли найти некоторые исследовательские работы и наборы данных, которые также помогли нам ранее построить базовый уровень.

У нас были еженедельные встречи целевой группы и расписания общих собраний, чтобы обсудить еженедельное обновление задач, ключевые результаты и проблемы, с которыми мы столкнулись при работе над различными задачами. Это была прекрасная возможность измерить наш прогресс, провести мозговой штурм и найти потенциальные проблемы для решения поставленной задачи.

По мере того, как мы приближались к концу задачи, нам нужно было создать веб-интерфейс и обслуживать модель, чтобы конечные пользователи могли ее использовать. Сначала мы решили использовать платформу AWS для развертывания модели, но позже из-за нехватки ресурсов нам пришлось переключиться на бесплатный инструмент развертывания Streamlit, который также помогает в разработке пользовательского интерфейса с меньшим количеством кода по сравнению с другими интерфейсными технологиями. Я работал над разработкой демо-приложения с использованием Streamlit для внутренней команды, чтобы понять, как оно будет обслуживать модель, построенную на определенном наборе функций.

По истечении 9 недель мы смогли разработать и развернуть конечный продукт в облаке Streamlit и представить его хосту проекта — MobileUurka. (Примечание: из соображений конфиденциальности я не могу делиться ни одним из файлов кода или окончательной ссылкой на проект в соответствии с политикой Omdena AI Challenge)

Мои выводы из этого проекта

  1. Важность обширного исследования постановки проблемы
  2. Работа в команде и дух сотрудничества - вот путь
  3. Внимательно следите за ограничениями ресурсов и ограничениями проекта
  4. Научился находить компромиссы в методах и инструментах
  5. Общение является золотым, попросите ответить на вопросы своим товарищам по команде
  6. Использование нескольких метрик для измерения производительности модели машинного обучения, а не только одной метрики

Заключение

В конце концов, в целом это был отличный опыт работы над этим проектом с участием участников из разных слоев общества. Причина, по которой задачи Omdena стоят того, заключается в обширном опыте, который она дает. от работы с широким кругом людей со всего мира до исследований, кодирования, решения проблем и веселья вдобавок к моральному импульсу, который он дает, это реально.

Чтобы узнать больше о таких блогах, подписывайтесь на меня в Medium, Twitter и Linkedin.

Посетите мой профиль GitHub для проектов по науке о данных и машинному обучению