Всем привет, я так долго писал статью. Это будет первая статья в серии блогов Data Science.
Итак, давайте начнем сейчас.
Что такое Pandas?
Это модуль Python, используемый для работы с табличными данными.
Технически это определяется как программная библиотека, которая используется для обработки и анализа данных. Он предлагает структуры данных и операции для работы с числовыми таблицами и временными рядами.
Импорт модуля Pandas
Чтобы использовать модуль pandas в нашем проекте, сначала нам нужно его импортировать.
import pandas
В большинстве случаев люди импортируют таким образом.
import pandas as pd
Давайте создадим фрейм данных
Что такое Dataframe?
Обычно dataframe — это объект, который хранит данные в строках и столбцах. Мы можем создать фрейм данных, извлекая даже такие файлы, как листы Excel и файлы CSV (значения, разделенные запятыми). В фрейме данных каждый столбец имеет собственное имя, и столбец может содержать значения любого типа данных, например int, float, tuple и т. д. Имя столбца будет строкой, а каждая строка имеет индекс, который будет целым числом.
Единственное ограничение, которому следует кадр данных, заключается в том, что все столбцы должны быть одинаковой длины.
Закодируйте кадр данных😊
Кодирование — это лучшее, что нам нравится в компьютерных науках. Итак, давайте теперь запачкаем руки кодом.
Существует два способа создания фрейма данных.
Чтобы добавить элементы в столбец
df1 = pd.DataFrame({
«имя»: [«Джон Смит», «Джейн Доу», «Джо Шмо»],
«адрес»: [‘123 Main St.’, ‘456 Maple Ave.’, ‘789 Broadway’],
«возраст»: [34, 28, 51]
})
Так вот, в виде словаря. Где каждое значение ключа словаря представляет имя столбца. И элементы в списке, в частности, относятся к столбцу ключа.
Другой способ создания фрейма данных — использование вложенных циклов.
Где каждый представляет строку данных.
df2 = pd.DataFrame([
['Джон Смит', '123 Main St.', 34],
[«Джейн Доу», «456 Мейпл-авеню», 28],
['Джо Шмо', 'Бродвей 789', 51]],
columns=['имя', 'адрес', 'возраст'])
Мы используем столбцы имен аргументов для создания списка имен столбцов в фрейме данных.
До сих пор я показывал вам способ создания собственного фрейма данных с добавлением данных вручную. Но в некоторых случаях у вас уже есть данные, которые вы хотите использовать в своем проекте.
Данные могут находиться в CSV-файлах, которые, как известно, содержат значения, разделенные запятыми.
Чтобы загрузить данные из файлов csv, выполните следующие действия:
данные = pd.read_csv («файл.csv»)
Здесь вызывается метод read_csv, а file.csv — это файл, передаваемый в качестве аргумента метода.
Мы также можем сохранить данные в файлы csv, передав метод ниже:
data.to_csv('новый_файл.csv')
Продолжение в следующей части……