Наука о данных быстро становится одной из самых важных и прибыльных областей в мире. Просеивание и создание ощущения от больших наборов данных может изменить жизнь, помогая людям делать все, от лучшего понимания потребительских тенденций до повышения их производительности. Если вы только начинаете свой путь к тому, чтобы стать специалистом по данным, или хотите освежить последние отраслевые знания, следующие 10 книг необходимы для тех, кто интересуется наукой о данных.

Книга № 1 — Что я хотел бы знать при изучении анализа данных: руководство для нестатистиков

Это компиляция работы и идей шести экспертов по анализу данных. Они обсуждают, как они изучили основы, и некоторые личные уроки, как стать лучшими аналитиками. Информация в этой книге предназначена для людей, которые хотят больше узнать об анализе данных, но не имеют опыта работы со статистикой.

Темы включают в себя нахождение ценности в данных, работу с другими, рассказывание историй с данными и избежание распространенных ошибок.

Книга №2 — Как не ошибиться: сила математического мышления

В книге «Как не ошибаться: сила математического мышления» автор Джордан Элленберг исследует, как математика может помочь людям принимать более правильные решения и избегать распространенных ошибок. Он представляет множество примеров того, как математику можно использовать в повседневной жизни. Эта книга представляет собой исследование силы и простоты математики. Ошибиться в этой книге означает не недостаток, а что-то знакомое для всех нас. На самом деле, один математик сказал:

Ни один образованный человек не может сомневаться в том, что квадратный корень из двух иррационален.

Темы включают диаграммы Венна, эвристику, теорему Байеса, математическое ожидание и байесовские рассуждения.

Книга №3 — Машинное обучение для чайников

Машинное обучение для чайников — отличная книга для новичков в науке о данных. В нем содержится обзор области и рассказывается о некоторых основных методах, которые вы можете использовать немедленно. Автор не рассматривает какие-либо предварительные знания о машинном обучении, поэтому это отличное место для начала, если вы хотите узнать больше об этой теме. Кроме того, многие упражнения помогают читателям проверить свое понимание книги. Он также включает бесплатный код на GitHub, где читатели могут экспериментировать с реальными алгоритмами машинного обучения. Это фантастическое чтение для тех, кто хочет начать заниматься наукой о данных или просто освежить в памяти ранее изученные темы!

Книга № 4 — Python для анализа данных: обработка данных с помощью Pandas, NumPy и IPython

Python для анализа данных — это всеобъемлющее и красиво написанное введение в обработку данных с помощью Python. Он предоставляет широкий охват инструментов, необходимых для практического анализа данных, от базовых операций NumPy и Pandas до взаимодействия с базой данных.

Акцент книги на четких, подробных объяснениях и практических примерах гарантирует, что читатели полностью поймут эти важные инструменты, независимо от того, являются ли они новичками в программировании или нет. Более опытные программисты, которые хотят использовать Python в качестве простого инструмента для всех типов анализа данных, должны найти книгу незаменимым справочником.

Книга № 5 — Программирование коллективного разума

Programming Collective Intelligence — одна из лучших книг по науке о данных, которая охватывает всю широту темы, от сбора и обработки данных до машинного обучения и социальных сетей. Он содержит подробный технический обзор для тех, кто знаком с методами программирования, и включает практические примеры для нетехнических читателей.

Книга научит вас использовать алгоритмы интеллектуального анализа данных, такие как кластеризация, классификация и регрессионный анализ, а также более сложные темы, такие как нейронные сети, генетическое программирование и методы опорных векторов.

Книга №6 — Предсказуемая иррациональность

Рецензия на книгу Дэна Ариели «Предсказуемая иррациональность».

Дэн Ариэли обсуждает свои эксперименты и опыт принятия решений в своей книге, чтобы узнать, как и почему люди принимают иррациональные решения. Он рассказывает, как он использовал эти знания, например, для улучшения рынка фильмов.

Эта книга наполнена убедительными примерами и экспериментами, которые заставят вас посмеяться и задуматься над собственными решениями. Прочтите эту книгу, если вам интересно, что движет иррациональным поведением людей.

Книга №7 — Сверхразум: пути, опасности, стратегии

Суперинтеллект был написан Ником Бостромом, шведским философом, специализирующимся на искусственном интеллекте и экзистенциальном риске. В книге рассматриваются возможные будущие результаты развития ИИ и то, как эти результаты могут быть связаны с людьми.

В нем обсуждается, что мы можем сделать сейчас, чтобы лучше подготовиться к этим сценариям, и какие шаги мы можем предпринять в одиночку или как сообщества, чтобы предотвратить неблагоприятный исход.

Бостром исследует некоторые из многих способов, которыми сверхразум может появиться из нашего нынешнего положения, в том числе с помощью алгоритмов машинного обучения, обученных на больших наборах данных; самосовершенствующееся программное обеспечение на основе алгоритмов, разработанных с использованием глубоких нейронных сетей; автономные роботы, способные инженерно решать непредвиденные проблемы; а также благодаря развитию квантовых вычислений.

Книга № 8 — Сигнал и шум: почему так много предсказаний сбываются, а некоторые — нет

В своей книге «Сигнал и шум: почему так много предсказаний сбываются, а некоторые нет» автор Нейт Сильвер проводит различие между сигналом и шумом. Он утверждает, что, хотя предсказание сложно, оно не невозможно. Чтобы преуспеть в наших прогнозах, нам нужно знать, какая информация полезна, а какая нет (сигнал), и быть готовыми признать, когда мы ошибаемся (шум). Это отличное чтение для тех, кто ищет понимание того, как работает наука о данных. Silver занимается некоторыми из самых сложных аспектов прогнозирования, такими как регрессионный анализ и предсказание результатов бейсболистов. Его рассуждения ясны, лаконичны и увлекательны.

Книга № 9 — Поваренная книга по программированию на R

R Programming Cookbook — это всеобъемлющее руководство, содержащее рецепты решения распространенных задач по обработке и анализу данных. Книга охватывает типы и структуры данных, построение графиков, регрессионный анализ, статистические тесты, прогнозирование временных рядов, одномерный и многомерный анализ данных, а также дополнительные темы, такие как многомерный анализ данных и байесовские методы. Это всеобъемлющее руководство, содержащее более 500 страниц и десятки примеров кода и тематических исследований, станет идеальным компаньоном для всех, кто интересуется наукой о данных.

Книга №10 — SQL для маркетологов, знающих Excel (серия практических занятий)

SQL для маркетологов, знающих Excel (серия практических занятий) — первая книга в серии, в которой читатели узнают, как использовать SQL в Excel. Книга была написана Джо Мако, опытным специалистом по маркетингу и исследователем данных, использующим SQL более десяти лет.

В своей книге Джо рассказывает читателям, как он использует Excel в качестве мощного инструмента для извлечения информации из баз данных и других источников данных, таких как журналы веб-сервера. Затем он показывает читателям, как можно автоматизировать этот процесс с помощью SQL. Практические упражнения составлены таким образом, чтобы каждый, у кого есть базовые знания Excel, мог выполнять их в своем собственном темпе, обучаясь по ходу дела.