Проект 1 — Airbnb 🏢

Я начал писать код на Python для моего проекта первой недели для Corise. Я нашел язык невероятно универсальным и простым в освоении, применяя различные функции Numpy. Я обнаружил, что использование Numpy упростило мой код и создало более лаконичный конечный продукт, что позволило мне уделять больше времени алгоритмам. Мы работали над нашим проектом в пространстве для совместной работы Google. Однако я обнаружил, что использование компьютера в общем пространстве иногда может отвлекать. В итоге я переключил все свои настройки общего доступа к экрану на частные, что хорошо сработало для меня, поскольку я больше сосредоточился на правильном коде, а не на том, что делают другие люди. До того, как мы начали проект, у меня было очень мало опыта программирования, поэтому я очень нервничал по поводу создания простой программы, использующей Numpy.

Начало работы с Python и Numpy 👾

Чтобы начать работу с Numpy, мы загрузили набор данных Airbnb для очистки. Набор данных состоял из информации о местонахождении сдаваемой в аренду недвижимости, собранной пользователями Airbnb в Амстердаме. Когда я загрузил набор данных, я не удивился, увидев, что это большой файл. После того, как набор данных был загружен, пришло время его очистить. Мы хотели избавиться от заголовков, нижних колонтитулов, повторяющихся идентификаторов и прочего мусора, который затруднял чтение файла.

  • Удалите первый столбец и строку.
  • Распечатайте первые четыре столбца.
  • Сдвиньте матрицу на 90 градусов с помощью команды «matrix. функция транспонирования.
  • Распечатайте первые 5 строк.
  • Удалите строку и столбец заголовка и распечатайте последние 3 столбца.

После выполнения приведенных выше строк кода нам теперь нужно было избавиться от «$» и «,» с помощью функции «заменить».

Затем мы добавили оператор «print» для отображения результатов каждого из вышеперечисленных шагов.

Конвертация валюты в Numpy 🧮

Теперь, когда мы очистили данные, мы хотели использовать код «currency_converter», чтобы конвертировать их в валюту по нашему выбору. Сначала я импортировал библиотеку, используя ‘from currency_converter import CurrencyConverter’. После того, как это было завершено, я решил использовать валюту «GBP» и конвертировать валюту из «USD» в «GBP».

  • Используемый код был следующим:
  1. gbp_rate = cc.convert(1, ‘USD’, ‘GBP’)
  2. print(gbp_rate) …… а затем инструкции по умножению столбца доллара на используемую валюту (т.е.: GBP) для расчета курса.)
  3. print(matrix[:, 1]) …… а затем инструкция для печати значения долларов в матрице.
  4. # Умножьте столбец доллара на процент инфляции (1,00 + инфляция)
  5. матрица [:, 1] = матрица [:, 1] * 1,07
  6. print(matrix[:, 1]) …… следует инструкция напечатать значение долларов в матрице после его умножения на процент инфляции.

Петли и векторы ⌨️

Этот раздел был довольно простым и быстрым. Мы создали цикл, чтобы вычислить расстояние для широты и долготы из нашего загруженного набора данных. Этот раздел был довольно простым и быстрым. Для этой части проекта мы создали функцию, которая могла перебирать каждый элемент вектора долготы и широты. Созданная функция называлась «расстояние» и принимала два аргумента: широту и долготу. Затем я использовал эту строку кода для перебора значений в каждом столбце набора данных.

Код, используемый в функции timeit, показан ниже:

# Разрешить использование функции Python (полу-)векторизованным способом›› conv_to_meters = np.vectorize(from_location_to_airbnb_listing_in_meters)

# Применяем функцию, используем time›››› conv_to_meters(широта, долгота, матрица[:, 2], матрица[:, 3])

Создание приложения в Streamlit и его развертывание на GitHub 🕹

Используя платформу Streamlit, мы создали приложение для нашего портфолио, чтобы отображать приведенный выше код, представляющий Данные Airbnb. При этом мы смогли создать репозиторий на GitHub, в котором размещались необработанные данные, приложение с потоковой подсветкой, в котором данные отображались, и веб-страница, на которой размещен весь портфель кода. Отсюда я могу сделать приложение общедоступным, чтобы пользователи могли посещать то, что было создано. Если они решили внести свой вклад, они могут просто разветвить проект на свою собственную учетную запись GitHub и оттуда отправить любые изменения и обновления, которые они сделали, в репозиторий или внести любые корректировки по своему усмотрению, пока они сохраняют свою исходную учетную запись, связанную с исходным репозиторием. .

Вывод 🍾

В целом, этот проект научил меня основам Numpy, продемонстрировав бесконечные возможности, когда дело доходит до манипулирования и анализа данных с использованием этой программы и другого программного обеспечения для анализа данных, такого как R. Я считаю, что знание того, как манипулировать данными и просматривать их, очень важно. имеет решающее значение для успеха в любой области науки. Я также считаю, что возможность манипулировать данными из таких разнообразных источников позволяет лучше понять, как устроен мир. На этой неделе мы начинаем наше путешествие в Pandas, чему я тоже очень рад. Я думаю, что эти инструменты помогут нам структурировать наши данные таким образом, чтобы мы могли извлекать из них полезную информацию.

Не стесняйтесь подписываться на меня в Medium, Twitter, LinkedIn и Github. Я буду публиковать больше материалов во время моего путешествия по данным здесь и в других моих социальных аккаунтах.