1. Введение:
1.1 Предпосылки:
Открыть ресторан и успешно его запустить - задача не из простых. Перед открытием ресторана нужно подумать над множеством вещей, таких как целевые клиенты, частота посетителей, парковка, окружающая среда, фирменные блюда, конкуренты и т. Д. Для владельцев ресторанов было бы полезно найти места для открытия своих ресторанов, что отвечает на несколько вопросов, например:
а. Количество ресторанов в пределах 1000 метров от места b. Типы ресторанов в пределах 1000 метров от места c. Рейтинги и обзоры ресторанов d. Какие популярные заведения находятся в пределах 1000 метров от этого места?
1.2 Бизнес-проблема
Это поможет тем, кто готов открыть ресторан, чтобы они могли открыться в месте, где меньше или нет конкурентов, и вести свой бизнес в городе Хайдарабад с прибылью.
2. Данные
2.1 Источники данных:
Для продолжения проекта нам необходимы районы города Хайдарабад. Мы можем получить его по адресу https://mapsofindia.com/pincode/india/telangana/hyderabad/.
Очистил веб-страницу, чтобы получить таблицу с функциями «Местоположение», «Пинкод», «Штат», «Район», используя BeautifulSoup и библиотеку запросов Python.
Позже с помощью геокодеров сгенерировал широту и долготу локаций в вышеупомянутой таблице, которая будет использоваться для определения мест в радиусе 1000 метров или 2000 метров с помощью FourSquare API.
В частности, поскольку нас интересуют только заведения типа «Ресторан», мы отфильтруем заведения типа «Ресторан» из фрейма данных.
здесь мы используем еще один источник данных - Foursquare API, который предоставляет данные о местоположении.
2.2 Очистка данных
Первоначально пин-коды Хайдарабада были извлечены в виде таблицы с использованием библиотеки запросов Beautiful Soup и Python. Затем с помощью геокодеров были найдены координаты широты и долготы для всех мест в Хайдарабаде. Но для некоторых местоположений широта и долгота не найдены, поэтому мы заменяем эти пустые значения на «NaN». Всего у нас есть 227 местоположений, включая значение широты NaN. После фильтрации и удаления местоположений со значением широты «NaN» у нас остается 159 местоположений.
Используя API данных о местоположении FourSquare, запрашиваются места в радиусе 2000 метров от широты и долготы мест. В общей сложности FourSquare API вернул 4042 ряда площадок для 159 заведений.
Головная часть полученного фрейма данных выглядит следующим образом:
Всего было представлено 263 уникальных категории заведений, в том числе «Перекресток», «Отель», «Спа», «Винный магазин», «Студия массажа»
«Ресторан морепродуктов», «Японский ресторан», «Русский ресторан»
' Тренажерный зал / фитнес-центр 'Plaza' Dance Studio 'Museum' Gourmet Shop '
' Wings Joint 'Theater' Coffee Shop 'Азиатский ресторан' Yoga Studio '
' Магазин спорттоваров 'Гимнастический зал' Дорога 'Буфет' Магазин для новобрачных '
' Магазин одежды 'Книжный магазин' Салон / Барбершоп 'Итальянский ресторан'
'Караоке-бар' Бутик 'Магазин подарков' 'Bakery' BBQ Joint '
' Кавказский ресторан 'Винный бар' Стейкхаус 'Design Studio
' Health & Beauty Service 'Исторический музей' Pizza Place 'Fountain'
'Культурный центр' 'Магазин женской одежды' 'Музыкальный центр' Коктейль-бар 'Бар в отеле'
'Художественный музей' Концертный зал 'Круглосуточный магазин' Художественная галерея '
' Живописная смотровая площадка ' Еда и напитки 'Ювелирный магазин' Speakeasy '
Магазин мужской одежды' Бассейн 'Ресторан' Music Stor e ’« Gun Range »и т. д.
Но поскольку нас интересует только тип / категория «Ресторан», результаты только этого типа заведений отфильтровываются из фрейма данных. Вычислили частоту появления общих мест в каждом из мест, и результаты были упорядочены в порядке убывания в зависимости от частоты встреч.
T Рассчитано 5 мест для каждого местоположения.
3. Методология
3.1 Машинное обучение
Используя неконтролируемый алгоритм, K-Means, были сформированы кластеры, а значение k было скорректировано до 4.
3.2 Исследовательский анализ
Карта с кластерами построена с использованием фолиума.
Наиболее распространенное место проведения (10 мест) было получено на основе данных. Сообщалось об отдельных кластерах с локацией площадок.
3.3 Исследование кластеров
4. Результаты
1. места с наименьшим количеством заведений с ресторанами
2. места без ресторанов