Нет, мы здесь не для того, чтобы говорить об IPO и ценах на акции. Я здесь, чтобы поговорить с инвестором, который хочет инвестировать в Сиэтл, используя данные ABNB Сиэтла для анализа с использованием процесса CRISP-DM, чтобы помочь принять инвестиционные решения.

Данные ABNB в Сиэтле можно найти на Kaggle.

Данные Сиэтла ABNB включают 3 файла. Календарь с 1393570 строками и 4 столбцами. Этот файл содержит все списки с января 2016 года по январь 2017 года, как доступные, так и недоступные списки. Листинговые файлы содержат 3818 строк с 92 столбцами. Файл обзора содержит 84849 строк и 6 столбцов. Чтобы ответить на три вопроса, я использовал данные календаря и листинга.

Вопросы, на которые я хотел бы ответить в этом проекте анализа данных.

  1. Какая самая популярная цена и в каком районе самая высокая цена.
  2. В какое время года ABNB наиболее прибыльный?
  3. Какой тип недвижимости приносит наибольший доход?

Чтобы ответить на вопросы, я буду следовать процессу CRISP-DM (межотраслевому стандартному процессу интеллектуального анализа данных).

Первый шаг — понять движущие силы бизнеса. Убедитесь, что ценность предоставлена ​​в правильных областях фокуса. Это включает в себя понимание бизнес-контекста и предметной области. Понимание данных

Второй шаг заключается в сборе данных, описании и изучении данных. Обычно включает проверку на наличие проблем с качеством данных и понимание того, какие данные доступны, а какие нет. Подготовка данных

Третий шаг — выбрать релевантные данные в контексте наших вопросов, очистить данные и создать новые поля данных, а также интегрировать данные. На выходе будут наборы данных, готовые для использования в анализе и моделировании. Моделирование

На четвертом шаге выберите технику моделирования (простую или сложную), постройте модель и оцените модель. Оценка

Пятый шаг — оценить, какая модель соответствует бизнес-целям и отвечает на бизнес-вопросы. В идеале мы делаем выводы, связанные с поставленными вопросами. План возможных будущих шагов.

6-й шаг — это финальное развертывание, я называю его фазой выполнения. На этом этапе вы определяете стратегию развертывания.

Если посмотреть на данные о листингах, в районе Рузвельта была самая высокая цена листинга в Сиэтле. Это говорит мне, что Рузвельт должен быть дорогим районом. В то время как стоимость аренды является самой высокой, стоимость этих свойств также будет намного выше.

Я объединил данные списков с данными календаря и исключил все доступные свойства свойств. Я предположил, что если недвижимость недоступна, значит, она распродана, и это хорошие данные для понимания типа получения дохода. Отфильтрованный кадр данных состоял из 459028 записей и 33 столбцов.

Когда отфильтрованный набор данных был построен по средней цене по месяцам, он дает мало информации о данных. Средняя цена кажется высокой и составляет около 137 долларов с середины января по март, а также в мае, июне и июле. После июля цена падает на 10 долларов до 127 долларов до конца года. Это говорит мне о том, что первая половина года является более загруженным временем для ABNB в Сиэтле, чем вторая половина. Теперь это основано на данных за 2016 год, и могут быть задействованы некоторые экономические факторы, и следующий год может не иметь такой же модели.

Теперь у нас есть представление о сезонности и цене по месяцам, однако нам нужно знать, в какой тип недвижимости инвестировать. Если мы просто посмотрим на доход, дом и апартаменты принесут самый высокий доход из всех различных типов собственности. Однако этой информации недостаточно, поэтому давайте нанесем данные по месяцам.

Сначала смотрим на количество транзакций по месяцам. Несмотря на то, что количество транзакций, начиная с января, примерно одинаковое, количество транзакций в квартирах несколько выше в течение года.

Здесь, на этой диаграмме, мы видим общий доход по типу недвижимости за год. Этот график показывает нам, что тип недвижимости «Дом» принес самый высокий доход из всех типов недвижимости. По сравнению с квартирами, хотя на предыдущем графике было показано больше транзакций, доход, полученный от дома, выше, чем от квартиры за первые 6 месяцев. Во второй половине года они оба приносят одинаковый доход.

Мы уже знаем, что дом и апартаменты являются хорошим типом ABNB для инвестиций, но два графика заставляют нас сосредоточить наше внимание на приобретении домов, а не квартир.

В заключение ABNB Сиэтла за 2016 год показывает, что из всех различных типов ABNB квартиры и дома занимают самые высокие места по транзакциям и доходам. Я бы посоветовал инвестировать в дом с максимальным количеством спален и вместимостью, исходя из высокой корреляции, отражающейся на цене.

Кроме того, похоже, что с середины января по март и май, июнь и июль - это несколько месяцев, когда цены выше, средняя цена подскакивает до 138 со 128, что указывает на часы пик для посещения Сиэтла. Я бы предложил приобрести недвижимость в ноябре/декабре или, возможно, в апреле, когда сезон низкий, и, вероятно, закрыть сделку к приближению пикового сезона. Это поможет новому покупателю получить хорошую сделку при покупке недвижимости в низкий сезон, а затем извлечь выгоду из пиковых ставок и доходов в первые несколько месяцев владения.

Код: https://github.com/vasutaria/CRISP-DM_Seattle_ABNB.git