Исследовательский анализ данных — часть 1

  1. Импорт набора данных
import pandas as pd
df = pd.read_csv("/content/drive/MyDrive/Data/DS/Iris.csv")
df.head()

2. Бросить Колома

df.drop(columns='Id', inplace=True)
df.head()

3. Размер и Нама Колом

df.shape #mengecek dimensi data
df.columns #mengecek nama kolom
df.dtypes #mengecek type data

4. Информация о подробных данных и отсутствующих значениях

df.info() #cek informasi detail data
df.isna().values.any() #cek missing value

5. Дублирование данных

df.duplicated().value_counts() #Cek Jumlah Data Duplikasi

df[df.duplicated(keep=False)] #Menampilkan Data Duplikasi

df.drop_duplicates(inplace=True) #Drop Data Duplikasi
df.shape

6. Описание Статистика

df.describe()

7. Кореласи

df.corr()