Использование эмоциональной кривой траектории фильмов, чтобы предвосхитить самые прибыльные и ориентированные на зрителей блокбастеры

С развитием технологий и постоянным интересом зрителей к кинематографии в этой области возникла колоссальная конкуренция в выпуске лучших фильмов, которые остаются в сердцах людей на всю жизнь. Поклонники имитируют ауру своих любимых персонажей из фильма и то и дело цитируют знаменитые диалоги из мега-хитов.

Учитывая масштабы отрасли, создатели фильма вынуждены создавать такой дизайн, чтобы продукт точно отражал предпочтения зрителей. Что может быть лучше, чем разработать модель, которая учитывает комплексные ключевые факторы, включая рейтинг IMDb, фильмы, номинированные на награды, доход от кассовых сборов, количество отзывов, которые они получают от зрителей. критики и т. д. предсказывают, какая категория фильмов пользуется наибольшим успехом и остается самой обсуждаемой.

Индийская киноиндустрия была одним из крупнейших производителей фильмов в мире с денежным эквивалентом 2,5 миллиарда долларов в 2019 финансовом году. Помимо того, что рынок оценивается в миллиард долларов, платформа является важным направлением для повествования. . Истории, представленные в фильмах, имеют тенденцию эмоционально соединяться с персонажами, размышлять и соотноситься с их жизненным опытом. Искусство написания сценариев во многом определяет успех фильма. Лаборатория вычислительной истории в Университете Вермонта разработала методологию с использованием НЛП для очерчивания сюжетов романов с помощью шести эмоциональных дуг, которые подходят для всех типов рассказов. Они были именно

  1. Из грязи к богатству: эмоциональная дуга, изображающая непрерывный эмоциональный подъем.
  2. Превращение богатства в лохмотья: эмоциональная дуга, изображающая непрерывное эмоциональное падение.
  3. Человек в дыре: эмоциональная дуга, изображающая эмоциональное падение, за которым следует эмоциональный подъем.
  4. Икар: эмоциональная дуга, изображающая эмоциональный подъем, за которым следует эмоциональное падение.
  5. Золушка: эмоциональная дуга, изображающая непрерывный эмоциональный подъем, падение, подъем.
  6. Эдип: эмоциональная дуга, изображающая непрерывное эмоциональное падение, подъем, падение.

Эту систему эмоциональных дуг можно также использовать для кластеризации фильмов по шести вышеупомянутым категориям. Чтобы реализовать эту инновационную модель в индустрии Болливуда, нам сначала потребуется набор данных. Для этого нам нужно извлечь файл субтитров различных фильмов из разных источников и удалить дублирование, чтобы разделить их на шесть кластеров. Когда у нас есть набор файлов с субтитрами, следующий шаг включает в себя сбор данных о производственных бюджетах и ​​внутреннем валовом доходе фильмов в одинаковой валюте для всех строк данных.

Наконец, информацию из IMDb необходимо использовать для сбора информации о следующем:

  • Дата выхода фильма
  • Средний рейтинг IMDb от 1 до 10 (от очень плохого до отличного)
  • Отзывы критиков и зрителей
  • Информация о различных жанрах, указанная на сайте
  • Информация о наградах
  • Продолжительность фильма в минутах
  • Режиссер фильма.

После этого проверьте всю информацию из различных источников и сформируйте отфильтрованный набор данных, включающий пересечение всей информации, необходимой для фильма. Включите фильм в окончательный набор данных только в том случае, если он содержит все вышеперечисленные данные.

После того, как у нас есть окончательный набор данных, следует этап оценки. Теперь мы можем реализовать анализ настроений в файле субтитров, чтобы получить их эмоциональную категорию дуги, используя библиотеку TextBlob от python. TextBlob находит все слова, которым он может присвоить полярность, а субъективность усредняет их вместе. Полярность описывает, насколько позитивным (+1) или насколько негативным (-1) является слово, в то время как субъективность дает представление о том, является ли это фактом (0) или субъективным мнением (+1).

Результирующая кривая для каждого фильма может быть равномерно распределена на сто частей или элементов, так что дуга настроений каждого фильма проходит от 0% (начало истории) до 100% (конец истории).

Затем, чтобы оценить успех фильма, мы можем сравнить каждый кластер эмоциональной траектории с факторами, начиная с данных, полученных из IMDb. Мы берем средний внутренний валовой доход для фильмов, относящихся к соответствующим кластерам, и анализируем, какой эмоциональный кластер получает максимальный средний внутренний валовой доход. Мы также можем рассчитать среднюю продолжительность фильма, среднее количество номинаций на награды, количество отзывов и оценок пользователей и критиков, чтобы увидеть, какой кластер наиболее вероятен среди людей.

Производство кинофильмов обходится дорого, и, безусловно, важно знать, сколько первоначальных инвестиций необходимо сделать, и иметь справедливую оценку доходов. Жанр фильма - еще один фактор, влияющий на успех фильма. Список возможных жанров может включать комедию, триллер, романтику, боевик, научную фантастику, ужасы, драму, анимацию, биографию и приключения. Фильмы, упомянутые на IMDb, имеют связанные с ними жанры, и каждый фильм может быть отнесен к более чем одному жанру. Результаты для жанра и кластера эмоциональной траектории можно проанализировать с помощью тепловой карты, чтобы увидеть, какая категория для какого типа кластера вызывает максимальный интерес среди людей.

Недавний прогресс в области науки о данных дал нам более широкий взгляд на понимание человеческих эмоций. Эти знания позволили нам предсказать, что зрители будут заинтересованы смотреть на большом экране. Используя методологию НЛП, мы можем исследовать, в какой степени эмоции стимулируют интерес потребителей к индустрии развлечений. Таким образом, мы можем исследовать, какие истории, выраженные в кинофильмах, пользуются наибольшим успехом.

Интересно, что при тщательном выборе сочетания жанра и производственного бюджета любая эмоциональная траектория может создать финансово успешный фильм.