Публикации по теме 'towards-data-science'
Полное руководство по средам Conda
Как управлять средами с помощью conda для Python и R.
Среды Conda похожи на кузенов виртуальных сред Python . Оба служат, чтобы помочь управлять зависимостями и изолировать проекты, и они работают аналогичным образом, с одним ключевым отличием: среды conda не зависят от языка . То есть они поддерживают языки, отличные от Python.
☄️ В этом руководстве мы рассмотрим основы создания сред и управления ими с помощью conda для Python и R.
⚠️ Примечание. В этом руководстве мы будем..
Когда и как создать команду Data Science
Когда и как создать команду по анализу данных
Оцените свой уровень зрелости, найдите необходимые навыки и создайте культуру данных
Все больше стартапов всего спектра обращаются к искусственному интеллекту (ИИ), который поможет им в решении бизнес-задач и повышении эффективности. Многочисленные преимущества создания возможностей искусственного интеллекта в вашем стартапе никого не должны удивлять.
Фактически, преимущества для бизнеса настолько велики, что, по прогнозам PwC, к..
Аминь! Это самая большая проблема, с которой я сталкиваюсь как нынешний специалист по данным, пытаясь снизить…
Аминь! Это самая большая проблема, с которой я сталкиваюсь как нынешний Data Scientist, пытаясь снизить ожидания тех, кто выходит на поле. На самом деле выполнение бита ML обычно является самой маленькой частью проекта.
Это не для всех, но я думаю, что люди должны попробовать и увлечься процессом в целом . Это то, что движет мной. Я хочу поставлять системы или решения, которые полностью решают реальную бизнес-проблему. От получения данных, работы с ними и преобразования их в..
Как мы, двое новичков, попали в 4% лучших в соревновании Kaggle
Как мы вошли в 4% лучших в соревновании Kaggle
и как ты тоже можешь
Если вы следите за новостями Kaggle, возможно, вы знакомы с недавно закрытой Лабораторией инновационных наук в Гарварде Механизм действия конкурса . С гордостью могу сказать, что мне и моему партнеру Энди Вангу удалось попасть в 4% лучших - 152-е место из 4373 команд.
Что интересно, мы относительно новички в соревнованиях Kaggle. Что касается машинного обучения, то мы не совсем профессионалы - мы оба учащиеся,..
Основы машинного обучения (II): нейронные сети
Основы машинного обучения (II): нейронные сети
В моем предыдущем посте я описал, как работает машинное обучение, продемонстрировав центральную роль, которую функции затрат и градиентный спуск играют в процессе обучения. Этот пост основан на этих концепциях, исследуя, как работают нейронные сети и глубокое обучение. В этом посте мало объяснений и много кода. Причина этого в том, что я не могу придумать какой-либо способ более четко разъяснить внутреннюю работу нейронной сети, чем..
Топ-3 функции Pandas, о существовании которых вы не знали
Вы не наткнетесь на них случайно - гарантированно!
Панды в представлении не нуждаются. Эта библиотека использовалась в экосистеме Python в течение многих лет и навсегда останется с ней. В библиотеке доступны сотни функций, и знание всех из них не под силу даже самым опытным пользователям.
Сегодня вы познакомитесь с тремя ценными функциями, которым не уделяют особого внимания. Вы не найдете их практически ни в одном руководстве по науке о данных, хотя они могут быть полезны в..
Начало работы с машинами для повышения градиента - с использованием параметров XGBoost и LightGBM
Psst .. Признание: в прошлом я использовал и настраивал модели, даже не зная, что они делают. Я попытался сделать то же самое с машинами для повышения градиента - LightGBM и XGBoost - и это было ... разочаровывающе!
Этот метод (или, скорее, ленивость) отлично работает для более простых моделей, таких как линейная регрессия, деревья решений и т. Д. У них всего несколько гиперпараметров - learning_rate , _2 _, _ 3_ - и легко понять, что они означают. .
Но GBM - это другой..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..