Введение в графики Pandas, которые вы можете использовать для перевода анализа и визуализации данных из Microsoft Excel в Python

Для этой статьи и для того, чтобы немного встряхнуть ситуацию, я решил использовать набор данных FIFA 21 от Kaggle - вы можете скачать его здесь. Отсюда я буду анализировать эти рейтинги игроков в первую очередь с помощью библиотеки Pandas, чтобы отобразить ряд различных простых, но полезных сюжетов.

Начиная

Давайте поместим наши данные в фрейм данных. Первоначально я не включал параметр delimiter для метода read_csv(), однако быстро стало очевидно, что это необходимо, когда я взглянул на пять верхних строк. Я импортировал matplotlib.pyplot, чтобы отображать свои графики повсюду.

Сводные статистические данные

Здесь мы уже можем сделать некоторые выводы из наших данных. Самому молодому игроку в наборе данных FIFA 21 всего 17 лет, а самому старому игроку 43 года! Лучший игрок в целом имеет рейтинг 94, что, учитывая, что наивысший потенциал игрока - 95, это очень хорошо.

Распределение данных

Здесь мы видим, что наши данные не распределяются нормально (если вы сильно не прищурились). На момент выхода FIFA 21 было несколько возрастов, в которых было значительно больше игроков. Однако, как и ожидалось, в игру войдет меньше очень молодых игроков, и многие игроки старшего возраста уйдут из игры на высоком уровне.

Кто лучшие игроки?

Используя метод nlargest, мы можем определить 10 лучших игроков на основе их «общего» рейтинга. Между Месси и Роналду всегда ведутся большие споры, но я очень доволен этим приказом ...

Неудивительно, что после победы в Премьер-лиге в прошлом сезоне там оказались четыре игрока «Ливерпуля». Однако я не ожидал увидеть не одного, а двух вратарей.

Построив это, мы видим, что между их рейтингами на самом деле не так много. EA Sports, похоже, также считает, что большинство этих игроков достигли своего максимального потенциала!

Лучшие команды

В этой статье я решил ранжировать лучшие команды, взяв среднее значение по всем их рейтингам игроков. Здесь я использовал метод groupby() и суммировал столбец «общий», взяв среднее значение. Затем я отсортировал значения в порядке убывания и построил 10 лучших.

Как фанат "Арсенала", я не очень рад этому, однако я мог бы выбрать другой способ измерения лучших команд, чтобы, надеюсь, включить их в список.

Возраст по сравнению с общим

Используя этот график разброса, мы видим, что ни один из самых молодых игроков не имеет рейтинга выше 80. Это неудивительно, поскольку они все еще развиваются. Здесь мы видим, что Месси и Роналду в настоящее время являются исключительными на своем уровне в своем возрасте!

Возраст против потенциала

Здесь мы видим, где сидит большая часть игроков. Есть более молодые игроки с потенциалом около 75, но у большего количества игроков среднего возраста в настоящее время потенциал ниже, около 70.

Выводы

Что касается рейтингов игроков FIFA 21, мы подтвердили, что Месси и Роналду все еще борются за первые места. Что касается библиотеки Pandas, мы показали примеры следующих типов графиков: гистограмма, гистограмма, разброс и шестиугольник.

Вот еще несколько графиков, с которыми вы можете поэкспериментировать: гистограмма с накоплением, прямоугольная диаграмма, круговая диаграмма и линейная диаграмма.

Как всегда, спасибо за чтение!