Публикации по теме 'data-science'
Сентябрьское издание: вероятностное программирование
Ежемесячный выпуск
Сентябрьское издание: вероятностное программирование
Моделирование очень сложного мира вокруг нас
Мы - невероятный вид: мы чрезвычайно интересуемся окружающим миром, любим учиться и часто находим новые способы и инструменты для этого. Одним из таких достижений за последние пару десятилетий стали вычисления. Улучшив архитектуру вычислительных механизмов, мы стали лучше моделировать сложную динамику, перечислять большое количество потенциальных результатов и..
Простота — ключ к хорошему программному обеспечению
Сложность заманчива.
Часто команды разработчиков (и целые компании) втягиваются в нежелательные функции и ненужную сложность.
Это приводит к раздуванию, потере внимания и плохим результатам.
Наименьший способ создания стоимости
Как я могу помочь кому-то?
Это основной вопрос, стоящий за любым бизнесом. Вы пытаетесь решить проблему.
Вы могли бы придумать классное решение предполагаемой проблемы. Инвестируйте много времени и энергии в создание большого решения.
Или вы можете..
Производительность модели — Чего ожидать, когда вы ожидаете
Как обнаружить и предотвратить дрейф модели в быстро меняющемся мире
Одна из ваших целей как специалиста по данным — обучить модель, которая будет максимально точной с точки зрения желаемых показателей оценки. Таким образом, вы следуете процессу, которому вы следовали сотни раз: определяете проект, собираете и очищаете данные, выбираете алгоритм модели, предварительно обрабатываете данные, обучаете модель и, наконец, проверяете окончательную производительность на тестовом наборе (или..
Понимание критериев сходства в машинном обучении
Существует более 5 широко используемых дистанционных функций.
Измерение сходства между двумя объектами вычисляется с помощью математических формул, называемых функциями расстояния.
Почти все алгоритмы машинного обучения в течение своей жизни вычисляют расстояние. kNN использует его на этапе классификации, нейронные сети используют его во время обучения, а k-means использует его на этапе кластеризации.
Метрика расстояния - один из основных вычислительных блоков, которые используются..
Как создавать определяемые пользователем функции в Python
Улучшите свою игру Python, определив свои собственные функции
Вы когда-нибудь думали: «Хотел бы я, чтобы у Python была функция, которая выполняла ________». Заполнить бланк. Если да, то у меня отличные новости! Python дает вам возможность создавать свои собственные пользовательские функции. Вам нужно понять несколько вещей, но это не так уж и сложно. Итак, приступим.
Пользовательские функции - отличный способ красиво упаковать повторно используемые блоки кода. На самом базовом..
Code Candy: стратегии оптимизации SQL
Данные — это масло нового тысячелетия. К счастью для нас, программистов, для извлечения данных требуется не установка огромных буровых установок и наем высокооплачиваемых специалистов, а использование всего нескольких технологических инструментов и правильных навыков, которые можно приобрести на практике.
Большинство гигантских ИТ-систем, таких как банки, здравоохранение и больницы, имеют огромные данные и используют реляционные базы данных для своих повседневных операций. Любой, кто..
Классификатор Наивного Байеса и предсказание результатов матча в Dota 2
Сезон Dota 2 приближается! После прошлогоднего перерыва из-за пандемии, за исключением региональных онлайн-турниров по Dota 2, сезон DPC возвращается в новом формате и стартует сегодня.
Для тех, кто не в курсе, Dota 2 — крупнейший титул в киберспорте, а последний выпуск его крупнейшего турнира, The International 10, собрал самый большой призовой фонд во всех турнирах в размере 40 миллионов долларов США, несмотря на то, что он был отложен из-за пандемии. . Также 29 из 30 игроков с самым..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..