Вы действительно думали, что все миллиардеры одинаковы?

В последнее время меня немного одолел один процент от одного процента - миллиардеры. Я был заинтригован, когда наткнулся на статьи, рассказывающие нам, кто и что на самом деле миллиардеры. В статьях говорилось что-то вроде: У большинства предпринимателей нет ученой степени или среднему миллиардеру было за 30 до того, как он начал свой бизнес. Мне показалось, что это было чем-то вроде обобщения, и я объясню. Давайте посмотрим на Билла Гейтса и Хадзиме Сатоми, генерального директора Sega. Оба миллиардеры, но действительно ли они одинаковы? В последнее десятилетие Билл Гейтс становился миллиардером каждый год, а Хадзиме трижды выпадал из списка Forbes. Справедливо ли помещать этих двух людей в одну коробку, публиковать хорошие статьи и давать хорошую статистику, когда никто не хочет быть Хадзиме? Я думаю, что нет - особенно когда только за это десятилетие непоследовательные миллиардеры, такие как Хадзиме, составляют более 50% от общего числа миллиардеров. Обсуждение различий между миллиардерами - вот о чем этот пост. Мы собираемся выделить интересные факты о постоянных миллиардерах и, в конце концов, выяснить, что отличает постоянных миллиардеров от остальных.

Что я имею в виду под последовательными миллиардерами? Что ж, вот для чего мы здесь. 🙂

Для таких ботаников, как я, вот как я это сделал

  • Источники данных. Большая часть данных была взята из 3000 профилей Forbes. Две дополнительные переменные были собраны из исследовательской работы: База данных характеристик миллиардеров. Охваченные миллиардеры - это те, кто были или были миллиардерами в период с 2007 по июнь 2017 года.
  • Сбор данных. Используя имена миллиардеров, я создал URL-адреса их профилей в Forbes и собрал необходимые мне данные с помощью RSelenium и rvest. Я буду откровенен. Это было совсем не сексуально. Я делал много ВПР в Excel, проверял вручную и манипулировал строками, чтобы получить работоспособный набор данных.
  • Очистка данных: я создал столбцы из строк с помощью stringr.

Код можно найти здесь.

Сколько типов миллиардеров существует?

Вот что я придумал:

  • Последовательные: это, как следует из названия, люди, которые из года в год неизменно становились миллиардерами. В него также входят миллиардеры, которых не было в списке максимум год (например, Марк Цукерберг в 2008 году). До 2015 года они должны были стать миллиардерами.
  • Призраки: это миллиардеры, которые покинули список и не возвращались в течение последних четырех лет. Они также должны были дебютировать до 2015 года.
  • The Hustlers: в эту категорию входят все миллиардеры, дебютировавшие до 2015 года.
  • Те, что уходили более одного раза, и каждый раз возвращались.
  • Те, кто хоть и вернулись в список, но отыграли больше года.
  • Те, кто еще не вернулся, но не выбыл из списка более 4 лет.
  • Новички: это миллиардеры, дебютировавшие в период с 2015 по 2017 год. Они входят в отдельную группу, потому что я считаю, что было бы несправедливо помещать их куда-либо еще, поскольку данных недостаточно. отнести их к любой другой категории. Тем не менее, я думаю, было бы интересно посмотреть, чем они занимаются.

Итак, приступим!

Знаете ли вы об этом?

Последовательные миллиардеры хорошо образованы.

Около 55% постоянных миллиардеров имеют хотя бы одну степень.

Фактически, у постоянных миллиардеров больше всего людей со степенями бакалавра, доктора философии, магистра и почти со всеми другими степенями.

Средний Консистентный миллиардер начал свой бизнес на семь лет старше среднего Призрака.

Это касается миллиардеров, которые заработали самостоятельно и начали свой бизнес. Средний Последовательный миллиардер начинает свой бизнес в среднем в 30 лет, что согласуется со статьей об успешном начале 30 лет.

Говорит ли миллиардер-призрак, начинающий свой бизнес по крайней мере на два года раньше, чем все остальные, о том, что у молодых предпринимателей меньше шансов сохранить свое состояние? Наверное. Однако, если вы посмотрите на новичков, они в основном тоже начинали молодыми. Возникает вопрос: станет ли средний новичок Призраком или игровое поле изменилось за последние несколько лет? Мы сможем ответить на этот вопрос через несколько лет. 🙂

Три основных сектора, которые производят самый высокий процент постоянных миллиардеров, - это телекоммуникации, мода и диверсифицированные портфели.

Выглядит очень популярно, правда? Но мода? Действительно?

Примечание. «Мода и розничная торговля» не означает «розничная торговля». Это означает, что компании продают в розницу модные товары, такие как Zara, H&M и т. Д.

Африканские миллиардеры, скорее всего, будут последовательными миллиардерами

Около 70% африканских миллиардеров последовательны - больше, чем в любом другом регионе мира. Ближайшим регионом является Северная Америка с 53%.

Однако в эпоху новичков Азия, кажется, доминирует над всеми остальными регионами, и это число в основном определяется Китаем. Фактически, за этот период к списку присоединилось более 50% китайских миллиардеров.

С другой стороны, ближневосточные миллиардеры чаще всего являются призраками. Я знаю, о чем ты думаешь. Цены на нефть, да? Наверное. Однако у большинства ближневосточных миллиардеров диверсифицированные портфели.

Миллиардеров с докторской степенью больше, чем бросивших школу.

Это моя любимая.

Это относится ко всем другим степеням, таким как MBA, MSc и т. Д. Только профессиональные степени, такие как право или медицина, имеют меньше миллиардеров, чем бросивших учебу. Однако в категориях «Новичок» и «Хастлер» людей с профессиональным образованием даже больше, чем выбывших.

11% постоянных миллиардеров - женщины.

Единственная категория с более обнадеживающим соотношением женщин и мужчин - это категория новичков - около 16 процентов. Однако, учитывая, что соотношение мужчин и женщин в мире составляет 50:50, категории новичков все еще не хватает на 34 процента. Хорошая новость в том, что дела идут лучше. С 2015 года вероятность того, что женщина станет миллиардером, почти в два раза выше, чем до этого.

64% Последовательных миллиардеров сделали себя сами.

Единственная категория с меньшим процентом - Призрак. Хорошая новость (или плохая - в зависимости от того, откуда вы надеетесь получить свое богатство) заключается в том, что у новичка-миллиардера более высокий процент, чем этот. Это означает, что в последнее время создается больше «нового» богатства. Кроме того, похоже, что быть самодельными - не такая уж особенность, поскольку в каждой категории более 60% миллиардеров сделали себя сами.

Круто, что теперь?

Миллиардеры, которых мы все знаем и любим, хорошо образованы и, честно говоря, в целом скучны.

«Насколько это важно, если вы хотите стать постоянным миллиардером?»

Чтобы ответить на этот вопрос, мы немного займемся машинным обучением (потерпите меня, это может быть немного техническим). Используя пакет машинного обучения h2o.ai (обожаю!), Мы обучаем модели предсказывать, в какую категорию попадет миллиардер. Мы бы сделали это для всех категорий, кроме Новичок, потому что, в отличие от других, все, что отличает эту группу, - это то, когда они присоединились к списку, а не их результативность в нем. Мы также будем использовать действительно независимые переменные для обучения наших моделей. Например, переменная, которая использовалась для создания категорий, например, количество раз, когда они покидали список, не будет использоваться. Если бы мы использовали такие переменные, это все равно что знать ответ и работать в обратном направлении, верно? Затем мы проверяли, какие переменные лучше всего подходят для предсказания категории миллиардера, чтобы ответить на наш вопрос. Код также доступен в том же скрипте, который описан выше.

Сначала я бы использовал пакет purrr и h2o, чтобы найти лучший алгоритм между машинами повышения градиента, случайным лесом и глубоким обучением.

Похоже, что точность алгоритма GBM на тестовом наборе превосходит другие алгоритмы машинного обучения.

Давайте проверим, какие переменные GBM считает наиболее важными при прогнозировании категории миллиардера.

Мы видим три переменных выше относительной важности 50%: страна, сектор и год основания компании, которая принесла им богатство.

Что это говорит нам о стойких миллиардерах? Во-первых, в нем говорится, что, хотя Последователи могут быть хорошо образованы, это определенно не то, что их туда привело. То, что Country и Sector являются важными переменными, не шокирует, но «год основания» интригует. Это может означать, что построить устойчивый бизнес становится все труднее или легче.

Опять же, довольно просто и скучно. Создайте благоприятную среду в нужное время для сектора, в котором вы играете, и БУМ! Вы зарабатываете устойчивое богатство. На данный момент я чувствую себя обязанным сказать, что 84% технологических миллиардеров проживают в Северной Америке и Азии. В настоящее время нет никого из Африки (см. Предложение выше о благоприятных условиях для вашего сектора), но, опять же, вы можете быть пионером, так что прислушайтесь к моему совету с мешком соли. Удачи!

О чем нужно помнить

Данные получены из Forbes. Это означает, что я по своей природе ограничен их методами, оценками и ошибками. Например, данные говорят, что есть только один миллиардер от Politics. Я очень сомневаюсь, что это правда.

  • В конце концов, у меня было более 30 переменных, и я не могу рассказать обо всех из них в одном посте, поэтому вот несколько визуализаций, которые вы можете поиграть и сами узнаете, как стать последовательным миллиардером. 😉
  • Хотите узнать, кто такие постоянные миллиардеры? Узнайте, используя полный набор данных здесь.
  • В своем следующем посте я собираюсь рассмотреть, какие отрасли, страны и годы основания являются лучшими для того, чтобы стать последовательным миллиардером и;
  • У меня МАЛЕНЬКИЙ сюрприз. 🙂

Первоначально опубликовано на сайте theartandscienceofdata.wordpress.com 7 октября 2017 г.