Всем привет, я так долго писал статью. Это будет первая статья в серии блогов Data Science.

Итак, давайте начнем сейчас.

Что такое Pandas?
Это модуль Python, используемый для работы с табличными данными.

Технически это определяется как программная библиотека, которая используется для обработки и анализа данных. Он предлагает структуры данных и операции для работы с числовыми таблицами и временными рядами.

Импорт модуля Pandas

Чтобы использовать модуль pandas в нашем проекте, сначала нам нужно его импортировать.

import pandas
В большинстве случаев люди импортируют таким образом.
import pandas as pd

Давайте создадим фрейм данных

Что такое Dataframe?
Обычно dataframe — это объект, который хранит данные в строках и столбцах. Мы можем создать фрейм данных, извлекая даже такие файлы, как листы Excel и файлы CSV (значения, разделенные запятыми). В фрейме данных каждый столбец имеет собственное имя, и столбец может содержать значения любого типа данных, например int, float, tuple и т. д. Имя столбца будет строкой, а каждая строка имеет индекс, который будет целым числом.

Единственное ограничение, которому следует кадр данных, заключается в том, что все столбцы должны быть одинаковой длины.

Закодируйте кадр данных😊

Кодирование — это лучшее, что нам нравится в компьютерных науках. Итак, давайте теперь запачкаем руки кодом.

Существует два способа создания фрейма данных.
Чтобы добавить элементы в столбец

df1 = pd.DataFrame({

«имя»: [«Джон Смит», «Джейн Доу», «Джо Шмо»],

«адрес»: [‘123 Main St.’, ‘456 Maple Ave.’, ‘789 Broadway’],

«возраст»: [34, 28, 51]

})

Так вот, в виде словаря. Где каждое значение ключа словаря представляет имя столбца. И элементы в списке, в частности, относятся к столбцу ключа.

Другой способ создания фрейма данных — использование вложенных циклов.

Где каждый представляет строку данных.

df2 = pd.DataFrame([

['Джон Смит', '123 Main St.', 34],

[«Джейн Доу», «456 Мейпл-авеню», 28],

['Джо Шмо', 'Бродвей 789', 51]],

columns=['имя', 'адрес', 'возраст'])

Мы используем столбцы имен аргументов для создания списка имен столбцов в фрейме данных.

До сих пор я показывал вам способ создания собственного фрейма данных с добавлением данных вручную. Но в некоторых случаях у вас уже есть данные, которые вы хотите использовать в своем проекте.
Данные могут находиться в CSV-файлах, которые, как известно, содержат значения, разделенные запятыми.

Чтобы загрузить данные из файлов csv, выполните следующие действия:

данные = pd.read_csv («файл.csv»)

Здесь вызывается метод read_csv, а file.csv — это файл, передаваемый в качестве аргумента метода.

Мы также можем сохранить данные в файлы csv, передав метод ниже:

data.to_csv('новый_файл.csv')

Продолжение в следующей части……