1. Введение:

1.1 Предпосылки:

Открыть ресторан и успешно его запустить - задача не из простых. Перед открытием ресторана нужно подумать над множеством вещей, таких как целевые клиенты, частота посетителей, парковка, окружающая среда, фирменные блюда, конкуренты и т. Д. Для владельцев ресторанов было бы полезно найти места для открытия своих ресторанов, что отвечает на несколько вопросов, например:

а. Количество ресторанов в пределах 1000 метров от места b. Типы ресторанов в пределах 1000 метров от места c. Рейтинги и обзоры ресторанов d. Какие популярные заведения находятся в пределах 1000 метров от этого места?

1.2 Бизнес-проблема

Это поможет тем, кто готов открыть ресторан, чтобы они могли открыться в месте, где меньше или нет конкурентов, и вести свой бизнес в городе Хайдарабад с прибылью.

2. Данные

2.1 Источники данных:

Для продолжения проекта нам необходимы районы города Хайдарабад. Мы можем получить его по адресу https://mapsofindia.com/pincode/india/telangana/hyderabad/.

Очистил веб-страницу, чтобы получить таблицу с функциями «Местоположение», «Пинкод», «Штат», «Район», используя BeautifulSoup и библиотеку запросов Python.

Позже с помощью геокодеров сгенерировал широту и долготу локаций в вышеупомянутой таблице, которая будет использоваться для определения мест в радиусе 1000 метров или 2000 метров с помощью FourSquare API.

В частности, поскольку нас интересуют только заведения типа «Ресторан», мы отфильтруем заведения типа «Ресторан» из фрейма данных.

здесь мы используем еще один источник данных - Foursquare API, который предоставляет данные о местоположении.

2.2 Очистка данных

Первоначально пин-коды Хайдарабада были извлечены в виде таблицы с использованием библиотеки запросов Beautiful Soup и Python. Затем с помощью геокодеров были найдены координаты широты и долготы для всех мест в Хайдарабаде. Но для некоторых местоположений широта и долгота не найдены, поэтому мы заменяем эти пустые значения на «NaN». Всего у нас есть 227 местоположений, включая значение широты NaN. После фильтрации и удаления местоположений со значением широты «NaN» у нас остается 159 местоположений.

Используя API данных о местоположении FourSquare, запрашиваются места в радиусе 2000 метров от широты и долготы мест. В общей сложности FourSquare API вернул 4042 ряда площадок для 159 заведений.

Головная часть полученного фрейма данных выглядит следующим образом:

Всего было представлено 263 уникальных категории заведений, в том числе «Перекресток», «Отель», «Спа», «Винный магазин», «Студия массажа»
«Ресторан морепродуктов», «Японский ресторан», «Русский ресторан»
' Тренажерный зал / фитнес-центр 'Plaza' Dance Studio 'Museum' Gourmet Shop '
' Wings Joint 'Theater' Coffee Shop 'Азиатский ресторан' Yoga Studio '
' Магазин спорттоваров 'Гимнастический зал' Дорога 'Буфет' Магазин для новобрачных '
' Магазин одежды 'Книжный магазин' Салон / Барбершоп 'Итальянский ресторан'
'Караоке-бар' Бутик 'Магазин подарков' 'Bakery' BBQ Joint '
' Кавказский ресторан 'Винный бар' Стейкхаус 'Design Studio
' Health & Beauty Service 'Исторический музей' Pizza Place 'Fountain'
'Культурный центр' 'Магазин женской одежды' 'Музыкальный центр' Коктейль-бар 'Бар в отеле'
'Художественный музей' Концертный зал 'Круглосуточный магазин' Художественная галерея '
' Живописная смотровая площадка ' Еда и напитки 'Ювелирный магазин' Speakeasy '
Магазин мужской одежды' Бассейн 'Ресторан' Music Stor e ’« Gun Range »и т. д.

Но поскольку нас интересует только тип / категория «Ресторан», результаты только этого типа заведений отфильтровываются из фрейма данных. Вычислили частоту появления общих мест в каждом из мест, и результаты были упорядочены в порядке убывания в зависимости от частоты встреч.

T Рассчитано 5 мест для каждого местоположения.

3. Методология

3.1 Машинное обучение

Используя неконтролируемый алгоритм, K-Means, были сформированы кластеры, а значение k было скорректировано до 4.

3.2 Исследовательский анализ

Карта с кластерами построена с использованием фолиума.

Наиболее распространенное место проведения (10 мест) было получено на основе данных. Сообщалось об отдельных кластерах с локацией площадок.

3.3 Исследование кластеров

4. Результаты

1. места с наименьшим количеством заведений с ресторанами

2. места без ресторанов