Статистика Twitter позволяет предсказывать кассовые сборы фильмов


Двое сотрудников Исследовательской лаборатории компании HP в Пало-Альто (США) показали, что анализ общего числа сообщений в сети Twitter, посвященных конкретному кинофильму, дает точную оценку его коммерческих перспектив.
Список  
отобранных фильмов (здесь и далее иллюстрации авторов работы).
Список отобранных фильмов (здесь и далее иллюстрации авторов работы).
Авторы рассматривали массовое кино, представленное с ноября прошлого года по февраль нынешнего. В финальный список попали фильмы с такими названиями, которые выделяются в тексте обычного сообщения (скажем, «2012» Роланда Эммериха исследователи по вполне понятным причинам проигнорировали). Кроме того, все отобранные ленты были выпущены в прокат по стандартной схеме с пятничной премьерой.
Составленная за три месяца база данных содержала 2,89 млн коротких сообщений от 1,2 млн пользователей, которые обсуждали 24 кинофильма. Расположенные в конце заметки графики иллюстрируют довольно очевидные закономерности: самое активное обсуждение разворачивается в премьерные выходные, а количество посвященных той или иной картине записей в микроблогах в пересчете на одного автора не слишком сильно изменяется за «критический период» (одну неделю, предшествующую запуску в прокат, и две следующие). Логично и то, что подавляющее большинство пользователей интересуется каким-то одним фильмом, а не пытается рассуждать обо всех новинках.

Получив эти данные, ученые постарались выяснить, какой эффект дает распространение рекламных и информационных материалов. Перед премьерой в Интернете появляются фотографии, трейлеры, обзоры, плакаты, и процент относящихся к фильму записей в микроблогах, содержащих ссылки на все эти материалы, должен возрастать. Кроме того, авторы ожидали увеличения количества ретвитов (повторных публикаций чужих сообщений, которые можно разослать друзьям по социальной сети).
Как выяснилось, незадолго до выхода фильма в прокат число «кинематографических» сообщений, содержащих ссылки, действительно, увеличивается и доходит до 39,5% от общего числа, а затем, на неделе после премьеры, снижается до 25,5%; количество ретвитов, напротив, почти не меняется. Хотя число ссылок и ретвитов положительно коррелировало с суммой кассовых сборов, коэффициент детерминации R2 оказался невысок (0,39 и 0,2). Следовательно, предсказать финансовую судьбу фильма по этим параметрам очень сложно.
Более информативным стал другой показатель — среднее число сообщений, относящихся к определенному фильму и отправленных в течение одного часа. Рассчитав его значение на предпремьерной неделе и рассматривая сборы в первые выходные, исследователи получили более солидный R2 = 0,8. К примеру, провалившаяся в прокате комедия «Трансильмания» удостоилась всего 2,75 сообщения в час, тогда как гораздо более популярные и финансово успешные фильмы «Аватар» и «Сумерки. Сага. Новолуние» собирали по 1212,8 и 1365,8 сообщения в час. Когда авторы усложнили алгоритм, рассчитав скорость появления записей в микроблогах по отдельным дням недели и введя новую переменную (число кинотеатров, в которых прошла премьера картины), коэффициент детерминации повысился до 0,973.
Ученые также показали возможность прогнозирования общих кассовых сборов всех фильмов за конкретный уик-энд. В этом случае необходимо вводить еще одну переменную — число недель, прошедших с момента выхода фильма в прокат. При исследовании четырех уик-эндов в январе и феврале этого года коэффициент детерминации не опускался ниже 0,9.
Такой метод, как утверждается, дает более точные прогнозы, чем предложенные ранее способы. Он обходит даже популярный виртуальный рынок предсказаний Hollywood Stock Exchange, участники которого могут продавать и покупать «акции» фильмов, актеров и режиссеров. Стоимость этих ценных бумаг отражает представления игроков о том, какими будут кассовые сборы фильма; прогноз получается весьма надежным, но для сборов в первые выходные величина R2 составляет лишь 0,965.
Изменение количества сообщений, относящихся к различным фильмам.
Изменение количества сообщений, относящихся к различным фильмам.
Изменение среднего числа сообщений о конкретном фильме,  
приходящихся на одного пользователя.
Изменение среднего числа сообщений о конкретном фильме, приходящихся на одного пользователя.
Распределение количества фильмов, обсуждаемых в сообщениях одним  
пользователем.
Распределение количества фильмов, обсуждаемых в сообщениях одним пользователем.
Сравнение прогнозов Hollywood Stock Exchange (HSX) и Twitter.Сравнение прогнозов Hollywood Stock Exchange (HSX) и Twitter.

Комментариев нет:

Популярные сообщения