Математический анализ влияние различных факторов на число зрителей Лан-турниров
И приветствую всех на новом спецвыпуске Бородатого Киберспорта. В таких выпусках мы не просто смотрим на последние новости и события из индустрии, а стараемся заглянуть поглубже. Понять суть вещей или посчитать какую то интересную статистику.
В этот раз мы решили не просто поверхностно что-то посмотреть и посчитать базовые параметры, а заглянуть совсем глубоко и провести почти научное исследование касательно киберспортивных турниров и их аудитории.
Мы посмотрим на то, как и благодаря чему формируется аудитория смотрящая оффлайн турниры по Dota 2 на трансляциях. Какие факторы на неё влияют и можно ли её посчитать и спрогнозировать.
Почему оффлайн турниры? Потому что они имеют самый струтурированный формат, у них чёткое и стабильное расписание, нету долгих перерывов и непонятного числа матчей за день. Ну и просто потому что все самые крупные турниры проходят на сцене.
Почему Dota 2? Во первых это наиболее интересно для нашей СНг аудитории, ну и потому что тут имеются турниры разного размера, разного статуса и разного уровня. Но как-нибудь провести похожее исследование по CS мне бы тоже хотелось бы.
И так, что мы будем делать? Мы будем, используя метод линейной регрессии, находить коэффициенты для различных переменных и их модификаций. Если проще, то мы для простой формулы ЧИСЛО зрителей = x*призовой_ФОНД + y*уровень_турнира постараемся найти те самые значения x и y которые надо будет подставить для вычисления.
Смотреть и находить мы будем два значения. Среднее число зрителей на трансляциях и Максимальное значение зрителей. Данные о них взяты с сайта escharts для всех записанных и зарегистрированных крупных лан-турниров по Dota 2 на этом сайте. Мы для финального исследования не брали цифры с турниров The International. Они, во первых, сильно ломают все расчёты, и, во вторых, сильно выбиваются из общего ряда. Также из-за специфики сайта и некоторых стриминговых платформ у нас нет точных цифр по Китайским трансляциям. Так что для данного исследование влияние Китая будет заметно ниже, чем оно есть в реальности, но к сожалению достоверно посчитать их цифры не представляется возможным.
Объяснять у нас всё это будут значения призового фонда (которые легко находятся) и условный уровень турнира. В данном контексте это показатель того, насколько сильные и интересные команды есть на турнире. Находился он на основе суммы Glicko рейтинга всех команд участников за день до начала турнира. Данные о рейтинге взяты с сайта datdota. Цифра идёт именно суммой рейтинга, а не нахождением среднего от всех команд. Второй вариант также рассматривался и был посчитан, но выдавал худшие результаты. Ну и по обычной логике чем больше команд на турнире, тем больше потенциальных зрительских сообществ турнир затронет, так что больше команд это лучше.
Среди прочих факторов, которые могли оказать влияние были взяты официальный статус турнира, регион места проведения, длительность турнира и время года, в которое проходит турнир.
Ну и перед тем как начнём основную часть, сразу скажу что я не буду в своих результатах и поисках подробно расписывать все шаги, все результаты и все проверки. Это прежде всего не официальное научное исследование (от написание которых меня тошнит), а более простое, но, как я надеюсь, и более доступное и понятное для людей исследование. Так что про гетероскедастичность, автокорреляцию, мультиколлинеарность и прочее вы здесь не услышите.
Ну и так же если вы не настолько интересуетесь конкретными цифрами, то можете послушать аудио версию в виде подкаста, где будет продиктован примерно этот же материал, но без примеров с цифрами.
Ну что же, приступим.
Что влияет, а что нет?
Что вообще может повлиять на число зрителей киберспортивного турнира? Многие часто любят говорить про призовые фонды и зависящее от них внимание к турниру, но настолько ли призовой фонд турнира рекламирует его для зрителей? И что делать если все турниры в году имеют примерно одинаковый призовой фонд? Другие же, заглядывая чуть глубже в мотивацию зрителей, говорят о влиянии команд, которые принимают в нём участие. Как можно оценить влияние команды и то, насколько много зрителей она принесёт? Можно посчитать условное число подписчиков в соц. сетях, но будет ли оно отражать реальность? Можно также взглянуть с точки зрения силы команд. Насколько они хороши на текущий момент, насколько мощный состав участников набирается. Ведь чем интереснее потенциальные матчи, тем и больше зрителей будет. И призовой фонд и уровень силы команд участниц сильно влияют на итоговое число зрителей.
По результатам моих вычислений это получается неоспоримым фактом. Они конечно влияют в разной степени, но влияние и одного и другого точно есть.
А что касательно прочих характеристик?
Начнём с того, является ли турнир официальным турниром одобренным Valve или нет.
Наверняка ведь его статус в сезоне Dota Pro Circuit(DPC) должен влиять на интерес к нему? Но по итогам исследований получилось что DPC статус турнира почти не влияет на его аудиторию. Major ли это или Minor. И в противовес к казалось бы обычной логике, получается что Minor турниры наоборот ухудшают коэффициенты. Скорее всего это связано с тем, что если организатор собирается проводить оффлайн турнир, то он постарается сделать его довольно крупным и интересным. А вот Minor турниры по их составу участников по сути напоминают скорее небольшие Онлайн турниры, чья финальная стадия почему то играется на сцене. Такая некоторая вымученность Майнор турниров и могла сыграть здесь в сильный минус для их показателей.
Регион проведения турнира с первого взгляда не должен сильно влиять на итоговые цифры. Да он может привлечь местных зрителей и от него зависит часовой пояс турнира, но лично мне казалось что влияние региона будет не особо большим. И как же я удивился, когда получилось что это чуть ли не одна из самых важных вещей, которая и влияет на цифры зрителей. Получилось что СНГ и Европейский регион всегда приносят больше зрителей на трансляциях. Китай вообще почти не влияет на итоговые цифры (наверняка во многом из-за того что в расчёт не бралась китайская аудитория). А вот влияние на турниры в Северной Америке и Юго-Восточной Азии довольно неоднозначно.
Число дней, которые длится турнир может показаться не самым очевидным фактором, который может оказывать влияние, но где он мог бы сыграть, так это в среднем числе зрителей. Чем короче турнир, тем больше важность каждого матча и внимание к каждой встрече. Но по статистике получилось что влияние от данной характеристики минимально и если и есть, то незначительно.
Наконец также на число зрителей могло бы повлиять время года, в которое он проходит. И я говорю здесь не о логике вроде того, что летом дети не в школе, зимой все сидят дома и т.д. Я скорее рассчитывал на результат,связанный с частью сезона, в которой проходит турнир. Осенью сезон только начинается, многие команды ещё не участвуют в турнирах, а сидят в отпуске. Плюс важность матчей для сезона не очень велика. Зимой начинает уже формироваться большой интерес к тому кто же будет лидером в этом сезоне. По идее зрителей должно быть больше.Весной играются решающие матчи турнира, борьба за The International накаляется до предела и должно быть максимально зрителей. и наконец летом все в ожидании The International и уже и турниры менее интересные и команды не особо хотят их играть. Но не смотря на какую то казалось бы логику в этих словах, цифры всё опровергли. Ни одно из времён года и части сезона не оказывает существенное влияние на интерес к турниру и к матчам.
Перейдём к цифрам
Пробуя различные вариации и модификации оригинальной формулы для вычисления Среднего числа зрителей получилась формула, в которой призовой фонд всегда вносит одинаковое влияние не смотря на различные факторы. Влияние от рейтинга участвующих команд более зависимо и меняется в большую сторону для турниров проходящих в СНГ, Европе и Северной Америке. Дополнительно для СНГ региона было найдено намного меньшее влияние рейтинга для Minor турниров. Итоговая информация по переменным выглядит так:
Первое число это коэффициент, на который надо домножить данные значения для получения результата. Последнее это, если говорить простым языком, вероятность того что число и значение не равно нулю. То есть что эта переменная и эта характеристика несут какое то значение и вносят изменения в итоговый результат. Вероятность более 99% считается почти точной. Также вероятность выше 95% также считается допустимой и вполне значимой. Значение выше 90% может считаться допустимым, но с большой оговоркой.
Таким образом у нас могут быть некоторые сомнения на счёт влияния региона Северной Америки, но они не очень велики. Общая достоверность модели можно посмотреть по значению R2. Оно равно 0,83 что конечно не напрямую значит что она на 83% верна, но значения более 0,8 обычно принято считать достаточно точными и отражающими общие направления и значения, хоть и не показывающих всё идеально точно
Если переводить это в более понятную форму обычной математической формулы, то получается следующее:
Среднее_число_зрителей = 0,034641*Призовой_фонд 2,736633*Суммарный_рейтинг + 4,183147*Суммарный_рейтинг*В_СНГ? — 3,617404*Суммарный_рейтинг*В_СНГ?*Майнор? + 1,471904*Суммарный_рейтинг*В_Европе? + 1,192764*Суммарный_рейтинг*В_Америке?
Значения с знаком вопроса могут быть 1 или 0 в зависимости от того верны ли они.
Переводя всё к ещё боле простому и понятному виду можно сделать следующую формулу:
То есть получается что за каждую тысячу долларов среднее число зрителей увеличивается на 34,6 человека. Для европейского оффлайн турнира каждая команда с 2.000 рейтинга (он обычно варьируется от 1.500 до 3.000) принесёт 8.417 дополнительных зрителей.
Если быстро посмотреть на сравнение реальных и прогнозируемых цифр и то как это выглядит в реальности, то скажем у нас есть турнир Starladder Minor. 300.000 призового фонда и 12.712 рейтинга. По нему получается что среднее число просмотров должно равняться 10.392+41.979=52.371 зрителей. В реальности было 48 тысяч. Довольно близко
Далее можно посмотреть на график сравнения настоящих цифр, и тех что выходят на основе выведенной формулы:
Переходя к максимальным значениям по зрителям на турнирах мы видим немного другую, но тоже вполне логичную картину. Для как раз значения более случайных и временных зрителей, в отличии от более постоянных средних зрителей, более важен и используем показатель Призового фонда, а рейтинг во всех ситуациях кроме майнор турнира влияет с одним и тем же уровнем. Такая же таблица как в прошлый раз, но для пикового значения выглядит следующим образом:
Как видим здесь модельне настолько точна и даёт менее надёжные цифры. И сам показатель R2 немного меньше и вероятности значимости переменных тоже меньшие. Так влияние проведения турнира в ЮВА не до конца доказано и может быть незначительным. Для некоторых остальных переменных значения тоже не идеальны. точно доказано только влияние призового фонда на Европейские и СНГ турниры, а также влияние чистого рейтинга команд во всех регионах.
В виде формулы данное уравнение выглядит так:
Пиковое_Значение = 0,056325*Призовой_фонд + 0,149466*Призовой_фонд*В_СНГ? + 0,075890*Призовой_фонд*В_Европе? + 0,105365*Призовой_фонд*В_ЮВА? + 9,479886*Суммарный_рейтинг — 2,671629*Суммарный_рейтинг*Майнор?
Ну и наконец в самом понятном виде всё выглядит так:
Логика в числах такая же как и до этого.
Возьмем для примера скажем турнир Epicenter Major. 1.000.000 призового фонда и 28.725 рейтинга. В итоге прогнозируемое пиковое значение зрителей равно 205.791+272.309=478.100. А на самом деле в итоге пиковое число равнялось 523.986. Опять таки, довольно близко к настоящему.
Общее сравнение реальности и прогнозов выглядит так:
Для Максимальных пиковых значений результаты не настолько точны, но тут и больше разных факторов может влиять. Конечно данная формула не идеальна и только примерно подсчитывает цифры. Мы не учли маркетинг турнира и доверие к организатору. Не учли множество других мелких вещей, которые сложно оценить, но которые влияют на турнир.
Наконец всегда есть простая случайность, которая тоже может повлиять. Но в целом общее представление о приблизительном размере аудитории данные формулы дают.
Если сравнивать влияние Призового фонда и Рейтинга, то можно посчитать сколько они вносят в каждом из примером на турнирах. Для среднего числа зрителей почти всегда влияние от призового фонда в 2 или 3 раза меньше чем от рейтинга.Есть 2 исключения, но это скорее именно исключение. Как правило рейтинг более важен. Что касается Пикового значения зрителей, то для него при таком же подсчёте результаты оказываются ещё больше в пользу рейтинга вплоть до 7-10 кратного преимущества. То есть как правило можно сказать что призовой фонд влияет на интерес к турниру, но команды влияют больше. Но конечно заманить крутые команды на турнир за 10 тысяч долларов вряд ли удастся. так что здесь нужен баланс. Достаточный призовой фонд для привлечения сильных команд, но не слишком большой чтобы потратиться на него сверх меры без нужной отдачи.
Дадим Прогноз
В заключении хочется дать приблизительный прогноз на предстоящие Майнор и Мэйджор по числу аудитории, которые их посмотрят. Конечно цифры рейтинга ещё недоступны, но примерно прикинуть мы сможем. Итак для WePlay! Bukovel Minor 2020 мы получаем ожидаемое среднее число зрителей в 10.392+45.438=55.830. Пиковое значение должно быть в районе 61.737+93.674=155.411. По своим цифрам это очень похоже на ESL One Mumbai 2019. Или из Майноров на MDl Macau или Starladder Minor 2.
Что касается Мэйджор турнира DreamLeague Season 13: The Leipzig Major, то для него среднее число зрителей должно быть в районе 34.641+122.434=157.075.Пиковое значения, по формуле, должно быть около 133.215+275.788=409.003. И те и те цифры очень похожи на то, что было на прошлой Dreamleague 11 или на Bucharest Major, так что могут быть близки к реальности.
Что можно сказать по итогу. На внимание аудитории больше всего влияет уровень команд. Также, но в меньшей степени, влияет размер призового фонда. Также может повлиять место проведения турнира и его Minor статус. Все остальные вещи вроде хронологического места в сезоне, времени года, длительности турнира не особо влияет на интерес к нему. Самый большой интерес к турнирам заметен в СНГ и Европе. По Китаю сказать нельзя, поскольку у нас нет данных о местных зрителях.
Ну и на этом я заканчиваю. Надеюсь что вам было интересно и вы узнали для себя что-то новое, а может и будете в каком-то виде использовать данные исследования. У нас также есть канал в Telegram где мы регулярно рассказываем о различных вещах и новостях в мире киберспорта и даём аналитику на это. Также у нас есть подкаст, где происходит примерно то же самое, но в еженедельном аудио формате. Спасибо всем за внимание.
Хорошего вам Нового года!