Стог сена — рынок киберспортивных данных, а иголка — это искусственный интеллект DataLouna, прогнозирующий результаты CS:GO-матчей. Создать искусственный интеллект — нетривиальная задача, но разработка алгоритма для прогнозов матчей начинается не тогда, когда разработчик открывает редактор и пишет первую строчку кода.
Первым делом нужно определиться с тем, что влияет на исход матчей, как правильно собирать эту информацию, после чего постоянно тестировать и дорабатывать модель. В DataLouna.ru этим занимаются аналитики с огромным опытом на соревновательной сцене CS:GO.
Эрик «AKIMOV» Акимов играет в CS с нулевых и прошел путь от игрока в любительских лигах до работы профессиональным тренером и аналитиком. Проанализировал тысячи часов демок, помог десяткам игроков найти себя, а сейчас работает со всеми накопленными знаниями и делится опытом с остальной частью команды.
Второй аналитик DataLouna — Святослав «svyat» Довбах. За свою карьеру Svyat попал в топ-20 HLTV, дважды отбирался на мейджоры (на один из которых не получилось попасть из-за ковидных ограничений) и крупные международные LAN-турниры. В своих командах всегда был капитаном и частично совмещал тренерские обязанности.
Краткое (и очень простое!) объяснение принципа работы нейросетей: машина обучается на тысячах матчей, находит закономерности в статистике и самостоятельно учится прогнозировать исходы матчей.
Понятно, что обучаться нужно на каких-то статистических данных, и самый очевидный вариант — пойти на HLTV (главный сайт со статистикой и новостями CS:GO) или в саму CS и взять все данные оттуда: киллы, ассисты, смерти, процент хедшотов, ADR, KAST и много других разных интересных аббревиатур. Так?
Обычная статистика вроде количества фрагов не объяснит, почему одна или другая команда выиграла матч. Это итоговый результат, ты не узнаешь за счет чего он получился из сухих цифр. И это мы еще не поднимали тему качества таких данных.
Казалось бы, что сложного посчитать понятные всем вещи, например, экономику? Но даже тут есть куча проблем, которые приходится решать аналитикам DataLouna.
Например, на HLTV используется только 4 типа закупа, когда на про-сцене их около 7, и их нельзя определить, просто подсчитав сумму потраченных денег.
Есть ли предел в количестве собираемой ДатаЛуной статистикой, и когда надо остановиться?
Сейчас аналитики разработали более 400 ивентов (статистических событий), которые уже учитываются в модели или находятся в разработке у программистов. И это не только экономика, вот несколько фундаментальных примеров, которые будут завязаны с другой статистикой:
В некоторых ивентах я уверен, буду топить за них при разработке, потому что знаю по своему опыту, что эта вещь не может не влиять. Это может быть субъективная оценка, но она выработана опытом и не одним годом потраченного времени”, — рассказал о планах Эрик Акимов.
Вот пара примеров статистики, которая собирается в связке с геометрией карты и не только:
В чем проблема текущей модели DataLouna, и как она будет улучшена
Несмотря на то, что средняя точность предсказаний DataLouna.ru чуть больше 70%, в прогнозах есть один большой вызов.
Сейчас искусственный интеллект анализирует данные и делает прогноз на основе команды как единого целого. То есть все данные о сильных и слабых сторонах игроков собираются в одно целое, условно мы называем такую модель “команда — карта”.
И если команда решафлится, то модель первое время работает хуже — она работает только со статистикой на уровне команды, не видит отдельных игроков. Поэтому в первый день турнира, перед которым прошло много решафлов, результат может быть плохим . Но из-за того, что модель обучается на свежих данных, второй турнирный день будет лучше. А следующий — еще лучше.
Мы учли эти недочеты и уже тестируем новую модель “игрок — раунд”, и она показывает лучшие результаты. Теперь искусственному интеллекту не понадобится день на “разогрев” — модель с самого начала начнет выдавать лучшие результаты, и при этом продолжит дообучаться по ходу соревнования.
“Если мы начнем смотреть от раунда и игрока, у нас будут более точные данные, и мы сможем лучше прогнозировать тот или иной исход.
Это то, что было нужно сделать сразу, но на тот момент это было долго и сложно, даже невозможно. Сейчас же это наши ближайшие планы”, — рассказал AKIMOV.
Чего уже добилась DataLouna и где следить за ее успехами
Любой может зарегистрироваться на DataLouna.ru, на сайте есть все исторические данные — 427 проанализированных матчей топ-турниров с начала 2022 года.
Мы не скрываем неудачи (полная статистика прогнозов доступна на сайте бесплатно после регистрации), но одновременно гордимся своими успехами — после месячного перерыва в соревновательном сезоне наша модель смогла правильно спрогнозировать результаты 70% матчей BLAST Premier Fall Groups 2022.
Следить за успехами ИИ можете и вы — подписывайтесь на VC (и на DTF) или регистрируйтесь на DataLouna.ru, чтобы посмотреть на результаты работы команды аналитиков и программистов.
Связаться можно через личные сообщения на VC/DTF или [email protected]
В следующем посте мы расскажем о взгляде на проект программистов — это будет продолжением серии постов о DataLouna. Предыдущие посты:
Стартап с оценкой в $1 млн. Как не погибнуть в «долине смерти» и есть ли жизнь после 24 февраля?