Введение

Из множества различных потоковых платформ сложно найти ту, которая действительно стоит вашего времени и денег. Ни один из потоковых сервисов не похож на другой. Среди крупных потоковых сервисов, таких как Netflix, Prime Video, Hulu и Disney+, существует большая конкуренция. Но как узнать, какой потоковый сервис лучше всего подходит для ваших нужд?

Netflix всегда был стриминговой платформой номер один до появления таких конкурентов, как Prime Video и Hulu.

В этой статье я собираюсь использовать подход науки о данных, чтобы найти, какой потоковый сервис лучше всего соответствует вашим потребностям с использованием Python.

Анализ

Набор данных для этого проекта был найден на kaggle.

Подробно опишем атрибуты данных:

  • ID: Это уникальный ID для каждой записи.
  • Название: Это название телешоу.
  • Год: год выхода телешоу.
  • IMDb: рейтинг IMDB телешоу.
  • Rotten Tomatoes: рейтинг телешоу Rotten Tomatoes.
  • Netflix: можно ли найти телешоу на Netflix
  • Hulu: можно ли найти телешоу на Hulu
  • Prime Video: можно ли найти телешоу на Prime Video
  • Disney+: можно ли найти сериал на Disney+
  • Тип: телешоу

Я начну с импорта необходимых библиотек и набора данных в Jupyter Lab.

Мы продолжим некоторую очистку данных, например, проверим наличие дубликатов и заменим любые отсутствующие значения в наборе данных.

Учитывая, что название каждого телешоу представлено либо как 0 («нет»), либо как 1 («присутствует») на каждой потоковой платформе, было бы проще, если бы мы создали столбец, сообщающий нам, на какой платформе транслируется конкретное телешоу. . Новый набор данных будет создан с помощью функции Melt(), а затем объединен с исходным набором данных. Нерелевантные столбцы также будут удалены.

Теперь мы можем выполнить некоторый статистический анализ набора данных, чтобы получить полезную информацию.

Во-первых, давайте посмотрим, на какой потоковой платформе больше всего телешоу. Мы создадим гистограмму и круговую диаграмму, чтобы показать это.

Мы видим, что у Netflix самое большое количество телешоу, а Prime Video занимает второе место, за ним следует Hulu. У Disney+ наименьшее количество телешоу, что разумно, учитывая, что это довольно новая потоковая платформа, запущенная в ноябре 2019 года.

Теперь давайте визуализируем данные на основе возрастной классификации. Классификация возрастных диапазонов ТВ была создана с использованием возрастного рейтинга, найденного здесь.

У Disney + больше шоу с рейтингом G (общая аудитория) и PG (родительский контроль), чего и следовало ожидать, поскольку это платформа, более подходящая для семейного просмотра. Neflix, с другой стороны, имеет более зрелый контент, за которым следует Hulu, а затем Prime Video. Учитывая, что большая часть возрастного рейтинга Prime Videos неизвестна, это может быть неточным представлением.

Далее мы рассмотрим рейтинги IMDb и Rotten Tomatoes для каждой потоковой платформы и посмотрим, на какой платформе больше всего телешоу с высоким рейтингом. Поскольку IMDb и Rotten Tomatoes являются объектными типами, нам нужно преобразовать их в целые числа.

Теперь мы собираемся создать сюжет

Из сюжета видно, что у Netflix больше шоу с более высокими рейтингами как на IMDb, так и на Rotten Tomatoes по сравнению с другими.

Заключение

Проанализировав данные, мы можем сделать вывод, что Netflix предоставляет лучшие телешоу с точки зрения качества (рейтинг IMDb и Rotten Tomatoes) и количества (количество доступных телешоу). Netflix также предоставляет более широкий спектр контента для взрослых по сравнению с другими потоковыми платформами.

Еще одна вещь, которую следует учитывать, это то, что Netflix предоставляет целые эпизоды телешоу, что позволяет вам смотреть различные шоу запоем. Hulu, с другой стороны, часто предлагает доступ на следующий день к некоторым телешоу, которые в настоящее время транслируются по кабелю. Prime Video также группирует свои шоу по сезонам и предлагает надстройки для других телеканалов за дополнительную плату.

Я надеюсь, что эта статья была вам полезна, и вы получили такое же удовольствие от ее чтения, как и я от ее написания. Спасибо.