АНАЛИЗ ДАННЫХ НАБОРЫ ИНДИЙСКИХ ДАННЫХ ПО ФИНАНСИРОВАНИЮ СТАРТАПОВ… !!!!

В этом блоге мы увидим процесс анализа данных и выводы, которые можно сделать на основе «набора данных о финансировании стартапов в Индии».



Чтобы дать вам четкое представление об анализе данных, мы можем назвать его «процессом проверки, очистки, преобразования и моделирования данных для обнаружения полезной информации, обоснования выводов и поддержки принятия решений».

Процесс анализа в основном состоит из пяти этапов:

  1. Задавать правильные вопросы
  2. Преобразование данных, преобразование данных или предварительная обработка данных
  3. Исследовательский анализ данных (EDA)
  4. Делать выводы
  5. Сообщение результатов

Шаг 1. Какие вопросы мы можем задать по этому конкретному набору данных? ..

  1. Сколько средств обычно получают стартапы в Индии? (Максимальное финансирование, минимальное финансирование)
  2. Какие отрасли предпочитают инвесторы для финансирования? (ИЛИ) Какие типы компаний получили более легкое финансирование?
  3. Играют ли города важную роль в финансировании? (ИЛИ) В каком городе максимальное количество стартапов?
  4. Кто является важными инвесторами в индийской экосистеме?
  5. Какие существуют типы финансирования стартапов?

В каком городе максимальное количество стартапов?

Шаг 2. Преодоление / изменение данных ... !!

Преодоление данных, иногда называемое искажением данных, - это процесс преобразования и сопоставления данных из одной «необработанной» формы данных в более подходящие и ценные для различных последующих целей. например, аналитика.

Итак, на этом этапе мы собираемся получить доступ и очистить наш набор данных для более подходящего использования в процессе дальнейшего анализа.

Data Wrangling состоит из 3 шагов:

  1. Сбор данных:

При этом мы собираем данные из различных источников, таких как файлы CSV, API, базы данных или веб-парсинг.

Данные Indian Startup Funding находятся в формате CSV, поэтому нам просто нужно импортировать библиотеки и прочитать наш CSV-файл. И наш набор данных готов для процесса анализа.

2. Оценка данных:

После сбора данных нам нужно провести некоторый анализ, чтобы получить правильное представление о нашем наборе данных, например о том, сколько строк и столбцов присутствует в нашем наборе данных, или какова форма наших данных или поиск информации о наших данных.

Из вышеприведенного вывода мы видим, что в нашем наборе данных всего 2372 строки и 10 столбцов. А из data.info () мы можем идентифицировать столбцы, содержащие ненулевые значения (NaN), которые необходимо удалить или заполнить.

3. Очистка данных:

Здесь мы проводим анализ для обнаружения и исправления отсутствующих или неточных записей из набора данных.

Поскольку мы проводим анализ набора данных о финансировании стартапов в Индии, давайте посмотрим, как очистить данные, которые нам нужно сделать в этом -

Из результатов выше видно, что значение учитывается в столбце IndustryVertical, здесь почти 80% данных или значений мы получаем из трех верхних полей, т. Е. Потребительский интерес, технологии и электронная коммерция . Итак, чтобы сделать наши данные более подходящими для анализа, мы берем только эти три категории, используя функцию isin, а остальные данные столбца IndustryVertical мы их отбрасываем.

Здесь мы используем функцию dropna в таких столбцах, как AmountInUSD, CityLocation, IndustryVertical, InvestmentType, чтобы удалить не- нулевые значения.

ШАГ 3. Исследовательский анализ данных (EDA) .. !!

После того, как данные собраны, очищены и обработаны, они готовы к анализу. Здесь мы должны найти корреляцию, ковариацию данных, используя график, гистограмму, круговую диаграмму и т. Д.

ШАГ 4. Выводы… !!

Теперь, когда мы сделали наш анализ, мы можем сделать вывод или сделать некоторые прогнозы.

Из этого набора данных мы можем сделать некоторые выводы на основе описательного анализа, такие как:

  1. В Бангалоре больше всего запусков.
  2. Большая часть инвестиционного типа - это частный капитал.
  3. Индустрия потребительского Интернета использует большую часть начальных инвестиций.
  4. Максимальное финансирование, которое обычно получают стартапы в Индии, составляет около 1400000000.
  5. Минимальное финансирование, которое обычно получают стартапы в Индии, составляет около 18000.

Это некоторые из выводов / результатов, которые мы смогли сделать после нашего анализа набора данных.

ШАГ 5. Сообщение результатов / повествование данных .. !!

Теперь самое важное - передать всю эту процедуру анализа нашим старшим, товарищам по команде, сделав отчет или сделав ppt / слайды с использованием различных методов визуализации данных, для чего мы должны иметь хорошие коммуникативные навыки.