• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей

Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей

© iStock

Исследователи факультета компьютерных наук НИУ ВШЭ улучшили метод обучения генеративных потоковых нейросетей для работы с неструктурированными задачами. Это поможет искать новые лекарства эффективнее. Результаты работы были представлены на одной из ведущих конференций по машинному обучению — ICLR 2025. Текст работы доступен в репозитории Arxiv.org.

Генеративные потоковые сети (GFlowNets) — особый тип алгоритмов машинного обучения, который строит сложные объекты шаг за шагом. Ученые применяют их для поиска белков, лекарств и оптимизации транспортных систем. 

Чтобы GFlowNets находили такие сложные структуры, исследователи объясняют им  свойства объекта, который они хотели бы получить. Чем ближе решение нейросети по свойствам к заданным, тем более высокую награду она получит. Сеть стремится решить задачу так, чтобы получить максимальный приз. На данные она не обращает внимание, только на вознаграждение. Оно вычисляется через уравнение, которое называют функцией вознаграждения.

Процесс поиска сложного объекта можно сравнить со сборкой модели из блоков Lego. Вы последовательно добавляете детали, пока не получится что-то цельное, при этом у каждого объекта есть своя заданная ценность. Собранная модель растения, например, может оцениваться дороже модели животного. В отличие от других методов машинного обучения, которые будут стремиться любой ценой получить растение, GFlowNets будут собирать много разных объектов, но растения чаще, чем животных: так выгоднее.

При таком типе поиска GFlowNets используют две вероятностные модели, которые работают в паре: прямую и обратную. Прямая модель — прораб-строитель, который решает, куда идти дальше, и предсказывает вероятность последующего состояния, а обратная модель — эксперт-разборщик, который определяет, каким был предыдущий шаг. Важно, чтобы эти потоки были сбалансированы, но сделать это очень сложно. Во-первых, требуются большие вычислительные мощности, во-вторых, обратная модель не обладает достаточной гибкостью: обычно исследователи запрещают ей меняться в процессе поиска и подсматривать за действиями прямой.

Ученые НИУ ВШЭ нашли способ оптимизировать обратную модель с помощью метода Trajectory Likelihood Maximization (TLM). Они доработали алгоритмы обратной модели таким образом, чтобы она могла постоянно сверяться с действиями прямой модели.

Тимофей Грицаев

«Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В  задачах с большой степенью неизвестности обратная модель — лишь вспомогательный инструмент, улучшающий результаты прямой модели. Мы искали способ сделать работу обратной модели гибкой и наконец смогли его получить», — поясняет один из авторов работы, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев.

После внедрения TLM функция вознаграждения, описывающая успешность решения задачи для обратной модели, стала сложнее. Однако, несмотря на увеличение сложности, вся система поиска стала быстрее и эффективнее.

Никита Морозов

«Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением», — говорит Никита Морозов, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.

Авторы исследования уверены, что их работа поможет специалистам, применяющим GFlowNets в различных областях, таких как поиск новых лекарственных соединений, разработка материалов с заданными свойствами, а также тонкая настройка крупных языковых моделей. Благодаря способности таких сетей эффективно исследовать огромное пространство решений и быстро находить наиболее оптимальные варианты можно заметно сократить нагрузку на вычислительные мощности.

Вам также может быть интересно:

ВШЭ ищет новые идеи для ИИ-агентов: стартовал конкурс инициатив

Высшая школа экономики приглашает исследователей и преподавателей представить концепции новых цифровых продуктов на базе искусственного интеллекта. Лучшие проекты получат экспертную и технологическую поддержку. Заявки принимаются до 19 декабря.

В Вышке создан Институт робототехнических систем

Решение об этом принял Ученый совет НИУ ВШЭ. У нового института будет мощная фундаментальная база, он будет сотрудничать с другими профильными подразделениями, вовлекать студентов и аспирантов в исследования и разработки. К каким практическим результатам приведет работа института и как планируется организовать взаимодействие с его индустриальным партнером, «Вышке.Главное» рассказал первый проректор НИУ ВШЭ, директор Института статистических исследований и экономики знаний Леонид Гохберг.

Ученые обнаружили один из самых долгих случаев ковида

Международная группа исследователей при участии ученых из НИУ ВШЭ изучила необычный образец вируса SARS-CoV-2 у ВИЧ-положительной пациентки. Генетический анализ позволил выявить множественные мутации и установить, что вирус эволюционировал в организме на протяжении 2 лет. Это подтверждает теорию о том, что вирус способен годами оставаться в организме отдельных людей, постепенно накапливать мутации и затем выплескиваться в популяцию. Результаты опубликованы в журнале Frontiers in Cellular and Infection Microbiology.

НИУ ВШЭ стал лидером рейтинга вузов — участников программы «Приоритет-2030»

Министерство науки и высшего образования РФ опубликовало обновленный список участников программы «Приоритет-2030». Всего поддержку в этом году получат 106 университетов. Высшая школа экономики вошла в первую группу и возглавила рейтинг вузов.

Ученые НИУ ВШЭ нашли рецепт против выгорания студентов

Исследователи Института образования НИУ ВШЭ показали, сколько времени имеет смысл тратить на учебу, внеучебную активность и личную жизнь, чтобы поддерживать успеваемость в вузе без ущерба для ментального здоровья. Анализ ответов 2753 студентов и их реальных академических показателей выявил точки риска, например избыток домашних заданий, и точки роста: сон, спорт, умеренную вовлеченность в проекты. С учетом полученных результатов ученые подготовили практические рекомендации для студентов и университетов. Работа опубликована в European Journal of Education.

«У нас возникают эффекты перелива идей от фундаментальных проектов к прикладным и — обратные»

Созданная 11 лет назад Международная лаборатория экономики нематериальных активов (МЛЭНА) дала старт созданию институционализированных научных подразделений в пермском кампусе Вышки. Компетенции сотрудников лаборатории по обработке и анализу данных позволили им сочетать фундаментальные исследования и прикладные проекты, в том числе по разработке моделей рисков и кибербезопасности для Сбера. О деятельности МЛЭНА «Вышке.Главное» рассказали заведующий лабораторией профессор Петр Паршаков и старший научный сотрудник профессор Мария Молодчик.

«Сегодня мы живем в эпохе “рутинной новизны”»

В НИУ ВШЭ продолжается реализация стратегического технологического проекта (СТП) «Национальный центр социально-экономического и научно-технологического прогнозирования». Новостная служба «Вышка.Главное» рассказывает о том, как в систему прогнозирования вписываются культура и общественные ценности и как на них влияет искусственный интеллект.

Преподаватели Вышки награждены премией Yandex ML Prize 2025

Премия Yandex ML Prize вручается преподавателям и руководителям образовательных программ, благодаря которым в России развивается область искусственного интеллекта. В этом году лауреатами, отобранными из 300 соискателей, стали 10 человек, и среди них трое сотрудников факультета компьютерных наук (ФКН) Вышки. Также была вручена специальная награда «Зал славы» — за вклад в становление машинного обучения как образовательного направления. Одним из ее обладателей стал Дмитрий Ветров, профессор-исследователь ФКН ВШЭ.

Ученые ВШЭ показали, как с помощью МЭГ точнее картировать речь в мозге

Ученые из Центра языка и мозга ВШЭ показали, как точнее определять границы речевых зон в мозге. Для этого они использовали магнитоэнцефалографию (МЭГ) вместе с заданием на завершение предложений, которое активирует речевые области и показывает их работу в реальном времени. Такой подход поможет врачам лучше планировать операции и повысит точность диагностики в тех случаях, когда фМРТ не является оптимальным методом. Исследование опубликовано в журнале European Journal of Neuroscience.

НИУ ВШЭ представил новый инструмент для оценки потенциальных рисков для территорий

В Высшей школе экономики прошла презентация доклада по финансовым решениям для климатической адаптации в России. Учитывая, что, по оценкам, каждый градус повышения среднегодовой температуры может привести к негативному эффекту в размере до 3 трлн рублей ежегодно, меры по адаптации сейчас необходимы, считают эксперты. На презентации ученые НИУ ВШЭ представили цифровой инструмент, который позволяет построить климатический риск-профиль территорий.