Исследовательский анализ данных — часть 1
- Импорт набора данных
import pandas as pd df = pd.read_csv("/content/drive/MyDrive/Data/DS/Iris.csv") df.head()
2. Бросить Колома
df.drop(columns='Id', inplace=True) df.head()
3. Размер и Нама Колом
df.shape #mengecek dimensi data df.columns #mengecek nama kolom df.dtypes #mengecek type data
4. Информация о подробных данных и отсутствующих значениях
df.info() #cek informasi detail data df.isna().values.any() #cek missing value
5. Дублирование данных
df.duplicated().value_counts() #Cek Jumlah Data Duplikasi
df[df.duplicated(keep=False)] #Menampilkan Data Duplikasi
df.drop_duplicates(inplace=True) #Drop Data Duplikasi df.shape
6. Описание Статистика
df.describe()
7. Кореласи
df.corr()