Что такое Rich, когда его использовать, в каком контексте стоит и почему меня это должно волновать?

Rich - это пакет python для улучшения вывода терминала по умолчанию или, как говорится в официальной документации:

« Rich - это библиотека Python для богатого текста и красивого форматирования в терминале.».

Вы можете использовать его в любое время и в любом месте (работает в Windows, Linux и MacO), просто установите его с помощью pip, и все готово! Rich работает даже в Jupyter Notebooks! Единственное требование - работать с Python 3.6.1 или новее.

pip install rich

Rich легко изучить и внедрить, однако я не могу сказать вам, в каких ситуациях стоит использовать его в вашем конкретном случае, это будет зависеть от вас. Что в моих руках, так это показать вам, как я использую это в своей повседневной работе с тех пор, как узнал об этом. Для этого я покажу вам два примера скриптов с Rich в качестве примера задачи, которую мне приходится выполнять часто.

Но на данный момент вопрос все еще витает в воздухе: «Почему мне это нужно?». Что ж, это правда. Rich не такой важный инструмент, как pandas или numpy, и я не пытаюсь убедить вас в обратном, особенно потому, что это тоже не для меня. Но я расскажу вам, почему мне так небезразлично, чтобы написать эту статью: я забочусь, потому что за последний месяц я включил Rich почти в каждый сценарий, который так или иначе написал, даже без предварительного уведомления! . И в целом, потому что я убежден, что Rich удается сочетать простоту и скорость скрипта для работы с данными с удобством использования только терминала.

Улучшение печати фрейма данных Pandas по умолчанию

Все дело в данных. Большую часть времени, которое мы тратим на разработку решений на основе ИИ, мы тратим на очистку, преобразование и агрегирование данных. Поскольку этот процесс очень итеративен, я принимаю все, что должно сделать его проще или приятнее, и если это требует разумных затрат времени и усилий, я принимаю его.

Выше мы можем видеть стандартный вывод печати фрейма данных pandas. Это очень хорошо, но я пишу эту функцию для печати в форме таблицы, которая, на мой взгляд, более удобна. Вот результат (я также включил некоторую логику в распечатку, которая в реальном примере была бы адаптирована к конкретной ситуации, в этом случае зеленые поплавки соответствуют значениям больше, чем среднее значение каждого особенность).

Добавление визуальной информации в статистический тест

Позвольте мне проиллюстрировать на этом примере, как я использую Rich, чтобы облегчить интерпретируемость результатов, отображаемых на экране.

В этом примере мы должны применить статистический тест, Шапиро-Уилка, чтобы проверить, поступают ли некоторые данные из нормального распределения. Это действительно распространенная ситуация, когда мы хотим сделать вывод. Также, когда нам может потребоваться проверка нормальности, когда мы работаем с некоторыми линейными и обобщенными линейными моделями.

Выводы и бонус

Для меня этот пакет, как я уже говорил, сочетает в себе простоту и скорость скрипта для работы с данными с удобством использования только терминала. Вот почему я использовал так много, как инструмент повышения производительности.

Я действительно думаю, что этот Rich - очень полезный инструмент, который можно включить в повседневную практику машинного обучения, и в этой статье мы лишь поверхностно коснемся его возможностей (настраиваемые таблицы, настраиваемые индикаторы выполнения, подсветка синтаксиса, включите уценку в свои выходные данные, и список параметров продолжится).

Чтобы попрощаться, позвольте мне сказать, что я действительно надеюсь, что этот текст был чем-то полезным для кого-то. Если у вас есть какие-либо вопросы или комментарии к статье или примерам, или вы обнаружите какие-либо ошибки в коде, не стесняйтесь обращаться ко мне. Любые отзывы приветствуются.

Спасибо за чтение!