Введение
Из множества различных потоковых платформ сложно найти ту, которая действительно стоит вашего времени и денег. Ни один из потоковых сервисов не похож на другой. Среди крупных потоковых сервисов, таких как Netflix, Prime Video, Hulu и Disney+, существует большая конкуренция. Но как узнать, какой потоковый сервис лучше всего подходит для ваших нужд?
Netflix всегда был стриминговой платформой номер один до появления таких конкурентов, как Prime Video и Hulu.
В этой статье я собираюсь использовать подход науки о данных, чтобы найти, какой потоковый сервис лучше всего соответствует вашим потребностям с использованием Python.
Анализ
Набор данных для этого проекта был найден на kaggle.
Подробно опишем атрибуты данных:
- ID: Это уникальный ID для каждой записи.
- Название: Это название телешоу.
- Год: год выхода телешоу.
- IMDb: рейтинг IMDB телешоу.
- Rotten Tomatoes: рейтинг телешоу Rotten Tomatoes.
- Netflix: можно ли найти телешоу на Netflix
- Hulu: можно ли найти телешоу на Hulu
- Prime Video: можно ли найти телешоу на Prime Video
- Disney+: можно ли найти сериал на Disney+
- Тип: телешоу
Я начну с импорта необходимых библиотек и набора данных в Jupyter Lab.
Мы продолжим некоторую очистку данных, например, проверим наличие дубликатов и заменим любые отсутствующие значения в наборе данных.
Учитывая, что название каждого телешоу представлено либо как 0 («нет»), либо как 1 («присутствует») на каждой потоковой платформе, было бы проще, если бы мы создали столбец, сообщающий нам, на какой платформе транслируется конкретное телешоу. . Новый набор данных будет создан с помощью функции Melt(), а затем объединен с исходным набором данных. Нерелевантные столбцы также будут удалены.
Теперь мы можем выполнить некоторый статистический анализ набора данных, чтобы получить полезную информацию.
Во-первых, давайте посмотрим, на какой потоковой платформе больше всего телешоу. Мы создадим гистограмму и круговую диаграмму, чтобы показать это.
Мы видим, что у Netflix самое большое количество телешоу, а Prime Video занимает второе место, за ним следует Hulu. У Disney+ наименьшее количество телешоу, что разумно, учитывая, что это довольно новая потоковая платформа, запущенная в ноябре 2019 года.
Теперь давайте визуализируем данные на основе возрастной классификации. Классификация возрастных диапазонов ТВ была создана с использованием возрастного рейтинга, найденного здесь.
У Disney + больше шоу с рейтингом G (общая аудитория) и PG (родительский контроль), чего и следовало ожидать, поскольку это платформа, более подходящая для семейного просмотра. Neflix, с другой стороны, имеет более зрелый контент, за которым следует Hulu, а затем Prime Video. Учитывая, что большая часть возрастного рейтинга Prime Videos неизвестна, это может быть неточным представлением.
Далее мы рассмотрим рейтинги IMDb и Rotten Tomatoes для каждой потоковой платформы и посмотрим, на какой платформе больше всего телешоу с высоким рейтингом. Поскольку IMDb и Rotten Tomatoes являются объектными типами, нам нужно преобразовать их в целые числа.
Теперь мы собираемся создать сюжет
Из сюжета видно, что у Netflix больше шоу с более высокими рейтингами как на IMDb, так и на Rotten Tomatoes по сравнению с другими.
Заключение
Проанализировав данные, мы можем сделать вывод, что Netflix предоставляет лучшие телешоу с точки зрения качества (рейтинг IMDb и Rotten Tomatoes) и количества (количество доступных телешоу). Netflix также предоставляет более широкий спектр контента для взрослых по сравнению с другими потоковыми платформами.
Еще одна вещь, которую следует учитывать, это то, что Netflix предоставляет целые эпизоды телешоу, что позволяет вам смотреть различные шоу запоем. Hulu, с другой стороны, часто предлагает доступ на следующий день к некоторым телешоу, которые в настоящее время транслируются по кабелю. Prime Video также группирует свои шоу по сезонам и предлагает надстройки для других телеканалов за дополнительную плату.
Я надеюсь, что эта статья была вам полезна, и вы получили такое же удовольствие от ее чтения, как и я от ее написания. Спасибо.