«GameFuse — научный полигон для апробации нетривиальных технологических подходов»
Студенты и сотрудники мастерской игровой инженерии и интерактивных систем МИЭМ ВШЭ изучают возможности обработки мультитекстовых данных — объектов, представленных набором текстов и метаинформации о них. Команда собрала датасет GameFuse, научный проект был представлен его руководителем Федором Захаровым на конференции IEMTRONICS 2024. Исследовательская работа получила сертификат за лучшую статью в 2024 году по мнению рецензентов.
Ежегодная конференция Лондонского имперского колледжа IEMTRONICS 2024 посвящена интернету вещей, информационным технологиям, электронике и мехатронике.
Датасет GameFuse был собран в рамках исследования на основе данных о видеоиграх для анализа методов обработки объектов, описываемых несколькими текстами. В научной работе приняли участие студенты 4-го курса МИЭМ ВШЭ: Федор Захаров, возглавивший исследование, Руслан Молоканов и Егор Литвиненко (ОП «Прикладная математика»), Карина Малышкина и Алексей Маркин (ОП «Информатика и вычислительная техника»), а также руководитель мастерской игровой инженерии и интерактивных систем Илья Семичаснов. Научный руководитель проекта — профессор Александр Белов.
Федор Захаров
«Мы искали способ обработки объектов, представленных множеством текстов. Любой объект, как правило, описывается именно набором текстов. Так, например, компьютерные игры могут быть представлены комментариями геймеров, ревью журналистов и описанием от разработчиков, — поделился подробностями задачи Федор Захаров. — Все эти тексты очень разные, но современные методы обработки совершенно не учитывают эти особенности. Уже существующие решения позволяют хорошо анализировать единичные тексты или же объекты, представленные разными типами данных, например изображением и текстом. Мы же задумались, как можно было бы скомбинировать и применить эти подходы к описанной задаче».
Поскольку анализ научных исследований продемонстрировал отсутствие работ, посвященных мультитекстовой модальности, и, следовательно, нехватку общедоступных данных для анализа, команда приняла решение организовать сбор данных самостоятельно. В результате датасет GameFuse, разработанный учеными, соответствует следующим условиям:
- включает в себя различное количество текстов, описывающих один объект;
- позволяет выделить из множества текстов несколько кластеров со схожими свойствами;
- к каждому тексту прилагается метаинформация.
С помощью мультитекстовых данных можно описать множество областей жизни человека или общества. Авторы статьи выбрали для работы данные о видеоиграх, так как по этой тематике существует обширный объем информации, находящейся в открытом доступе и удовлетворяющей ранее описанным требованиям. Это значительно упрощает процесс сбора и обработки данных.
Датасет включает информацию о 13 117 играх. Каждая игра описывается двумя типами текстов — комментариями игроков и рецензиями критиков (ревью). Комментарии представляют собой неструктурированные короткие тексты, больше выражающие эмоции игроков, чем объективный опыт. Ревью, в свою очередь, являются полноценными субъективными текстами, отражающими как положительные, так и отрицательные аспекты игры. Всего было собрано порядка миллиона комментариев и 70 тысяч ревью.
В ходе исследования были разработаны три нейросетевые модели, использующие методы мультитекстовой обработки данных, архитектура которых не имеет сегодня аналогов.
«Новизна состоит в том, что мы стараемся имитировать процесс чтения текста человеком. Читатель в конкретный момент времени читает один текст, держа при этом в уме, что он уже прочитал. Мозг устроен таким образом, что каждый прочитанный текст воспринимается как законченное и осмысленное высказывание. При этом при сборе информации мы старались учитывать важные детали разных типов текстов, — рассказал Федор Захаров. — Например, при изучении колонок в специализированном журнале мы акцентируем внимание на разносторонних описаниях объекта статьи (информация), в то время как при чтении комментариев в интернете прежде всего отслеживаем эмоции автора».
Для сравнения результатов также были обучены две модели, использующие исключительно методы классического NLP. В основе каждой из них лежит технология BERT (Bidirectional Encoder Representations from Transformers) — нейросетевой метод извлечения информации из текста.
В ходе исследования были проведены два эксперимента. В первом эксперименте решалась задача предсказания наличия определенных тегов, относящихся к игре (например, «спорт», «шутер» и так далее). Во втором эксперименте, направленном на прогнозирование популярности игры на рынке, в качестве целевых признаков для прогноза использовались коммерческие данные об игре, включая нижнюю и верхнюю оценки количества покупок в сервисе.
Итоги обеих серий экспериментов подтвердили следующие предположения:
предлагаемый метод обработки превосходит классические методы NLP в задачах, связанных с получением представления мультитекстового объекта;
раздельная обработка различных типов текстов улучшает результат прогнозирования;
добавление метаинформации о текстах может улучшить прогнозы, если эта информация релевантна для данных прогнозов.
Илья Семичаснов, руководитель мастерской игровой инженерии и интерактивных систем МИЭМ НИУ ВШЭ
«Во многих своих проектах мастерская использует технологии искусственного интеллекта. Ребята занимаются невероятным: совмещают сложные исследования в области машинного обучения с разработкой игрового ПО. GameFuse — флагманский проект по этому направлению, который не только вызывает интерес у фондов и акселераторов, но и является отличным научным полигоном для апробации нетривиальных технологических подходов. Я искренне горжусь проектом и уверен, что это не последнее достижение команды в ИИ».
По словам Федора Захарова, на протяжении всего обучения в Вышке ему хотелось заняться настоящей научной задачей, поэтому, когда такая возможность представилась, он выложился на полную. «Основным аспектом, поразившим меня при работе, было обилие свободы, которая присутствовала на всех этапах исследования — от построения гипотез и поиска научной литературы до проведения экспериментов и аналитики их результатов, — отметил он. — И распорядиться этой свободой, пробуя вновь и вновь разные методы решения, стало настоящим удовольствием!»
Александр Белов
«Не секрет, что сейчас вопросы разработки компьютерных игр, так же как и сами игры, привлекают все больше внимания со стороны ИТ-сообщества. К сожалению, специализированных научных конференций в области игровой инженерии проводится крайне мало, — говорит Александр Белов, профессор, руководитель департамента прикладной математики МИЭМ ВШЭ. — Поэтому, получив результаты исследования, выполненного в рамках проекта по применению методов ИИ к анализу текстовой информации, получаемой от пользователей компьютерных игр, было решено принять участие в ежегодной международной конференции IEMTRONICS 2024. Подготовка статьи потребовала много времени и сил, но они были потрачены не зря».