Отель или курорт?
Введение
Вам было любопытно узнать, что люди больше любят посещать отели или курорты? или какие блюда люди предпочитают больше всего в отелях? Если вам так же любопытно, как и мне, не волнуйтесь, это некоторые из интересных открытий и многое другое, что мы собираемся раскрыть в процессе визуализации и анализа данных об отелях.
Для человека, увлекающегося путешествиями и отдыхом, мне было интересно визуализировать данные о спросе на бронирование отелей. Мне удалось узнать удивительные вещи об отелях и моделях поведения людей, которые их посещают, и я с удовольствием поделюсь с вами этими удивительными открытиями в этой статье, и я уверен, что они вам понравятся.
Так что посидите, пока мы изучаем данные отеля.
Источник данных
Эти данные были получены из хранилища данных Kaggle. Kaggle — общедоступный онлайн-репозиторий данных, который позволяет пользователям получать доступ и анализировать данные, взятые из разных источников. Данные об отелях показывают довольно много характеристик, которые отражают различные характеристики разных людей, посещающих отели. Некоторые из характеристик включают день прибытия, время выполнения, тип депозита и многое другое. Вы можете найти данные здесь, на Kaggle.
Обработка данных и визуализация
Язык программирования python — классный язык в том смысле, что в нем есть много классных библиотек, упрощающих очистку, сортировку, визуализацию и обработку данных. Самая популярная из них — библиотека панды, построенная поверх библиотеки NumPy. Он управляет различными задачами анализа данных, от загрузки данных до их очистки и обработки и даже визуализации данных. Популярная библиотека Matplotlib — это еще одна библиотека, которая также была построена на библиотеке панды, чтобы упростить визуализацию с помощью различных функций, которые она предоставляет. Библиотека Seaborn также была разработана для создания более привлекательной и наглядной статистической графики, позволяющей лучше понять сюжеты.
Если вам нужна дополнительная информация об этой библиотеке и о том, как они работают, вы можете ознакомиться с их документацией.
Вот краткий обзор того, как выглядят данные
Коды можно найти здесь на Github.
Давайте перейдем к визуализации различных столбцов.
Тип отеля
Наблюдение
Мы видим, что примерно в два раза от общего числа людей, забронировавших отели, они предпочитают городские отели отелям курорта.
Тип депозита
наблюдение
Это показывает, что довольно большое количество людей не вносило никаких депозитов.
Типы клиентов в сегментах рынка
наблюдение
Из графика мы видим:
- Наибольшее количество людей, которые посещают отель, - это временные клиенты, и огромное количество из них приходят из сегмента рынка онлайн-ТА, следующего за офлайн-ТА/ТО.
- Очень мало людей, которые бронируют в отелях у контрактных клиентов
- Большое количество временных клиентов приходит из группового сегмента рынка, следующего за автономным TA/TO.
Месяцы прибытия
наблюдение
Больше людей прибыло в отель в августе, а наименьшее - в январе.
Сегмент рынка
Наблюдение
Сегмент рынка, который покровительствует отелям, больше всего приходится на онлайн-ТА, а меньше всего приходится на авиацию.
В какой день люди прибывают в отель больше всего?
Наблюдение
В среднем большинство клиентов приходят 15-го числа месяца.
Какие клиенты чаще всего отменяют бронирования
Наблюдение
Большинство отмененных бронирований происходит от временных клиентов, следующих за временными клиентами, затем от контактных клиентов, а затем от групп.
Какое блюдо клиенты предпочитают больше
Наблюдение
Отсюда мы видим, что многие клиенты предпочитают завтрак в постель (BB), в то время как лишь немногие предпочитают FB.
Какой год самый загруженный
Наблюдение
Судя по данным, 2016 год был самым загруженным
Из какой страны чаще всего приезжают посетители
Наблюдение
Самые частые посетители этого отеля из PRT.
В каком сегменте рынка больше всего времени пребывания в выходные дни
Наблюдение
У онлайн-ассистента было больше пребывания на выходных рядом с оффлайн-ТА/ТО, чем с группами и остальными.
Какие блюда больше всего нравятся постоянным гостям?
наблюдение
Большинство вернувшихся гостей также любят завтракать в постель.
Взаимосвязь между временем выполнения заказа и отмененными бронированиями
У людей, которые отменили бронирование, в среднем больше времени выполнения заказа, чем у тех, кто не отменял свое бронирование. Более высокая дисперсия также существует среди тех, кто не отменил бронирование.
Коды можно найти здесь.
Моделирование
После выполнения множества визуализаций мне пришлось использовать Pandas.getdummies для всех категориальных переменных для упрощения моделирования. Это классификационная задача. Таким образом, логистическая регрессия подходит для этого лучше всего (не волнуйтесь, это не так сложно, как кажется). Я импортировал confusion_matrix и f1_score, чтобы измерить точность классификации.
Заключение
- Многие люди любили посещать городские отели, а не курортные.
- Больше людей прибыло в отель в августе месяце, что имеет смысл, потому что август приходится на летние каникулы в северном полушарии, а самый низкий уровень приходится на январь, что вполне объяснимо, потому что январь - это начало года. и книги, как правило, больше сосредотачиваются на работе
- Большинство людей, которые бронируют номера в отелях, приходят в онлайн-сегмент рынка ТА, поскольку многие люди проводят большую часть своего времени в Интернете, что облегчает им бронирование номеров в отеле.
- Большинство клиентов предпочитают завтрак в постель (BB). В конце концов, кто не любит удовольствия?
Если вы найдете статью полезной, похлопайте в ладоши и поделитесь ею. Вы также можете связаться со мной в LinkedIn и Twitter.