• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Красота в деталях: ученые Вышки и AIRI разработали метод высококачественного редактирования изображений

Энди Уорхол. Диптих Мэрилин, 1962г.

Энди Уорхол. Диптих Мэрилин, 1962г.
crossarea.ru/art

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета разработали новый метод редактирования изображений на основе глубинного обучения — StyleFeatureEditor. Он позволяет точно воссоздавать мельчайшие детали изображения и сохранять их при редактировании. С его помощью пользователи смогут изменять цвет волос или выражение лица без потери качества изображения. Результаты работы опубликованы на самой цитируемой конференции по компьютерному зрению CVPR 2024. 

Искусственный интеллект уже научился генерировать изображения и редактировать их. Это стало возможным благодаря генеративно-состязательным нейросетям (GANs — generative adversarial networks). Архитектура предполагает две независимые сети: генератор производит изображения, дискриминатор различает реальные и сгенерированные образцы, и они соревнуются друг с другом. Новым этапом в развитии генеративно-состязательных сетей стала модель StyleGAN. Она может генерировать изображения и изменять их отдельные части по запросу пользователя, но не умеет работать с реальными фото или картинками.

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета предложили способ быстро и качественно редактировать реальные изображения. Ученые создали метод (StyleFeatureEditor) с двумя модулями: первый воссоздает (реконструирует) исходное изображение, а второй редактирует эту реконструкцию. Результат работы модулей передается в StyleGAN в понятном для нейросети наборе внутренних представлений, из которых и создается редактированное изображение. При этом разработчикам удалось решить проблемы, которые возникали в предыдущих исследованиях: при небольшом наборе представлений нейросеть хорошо редактировала изображение, но теряла детали исходного изображения, а при большом наборе все детали сохранялись, но нейросеть не понимала, как их правильно преобразовать с учетом поставленной задачи. 

Для решения этой проблемы исследователи предложили следующее: первый модуль ищет и большие, и маленькие представления, а второй учится редактировать большие на примере редактуры маленьких представлений. 

Однако, чтобы обучить эти модули правильно редактировать представления, нейросети нужны настоящие изображения и их отредактированные версии. 

Денис Бобков

«Нам нужны были образцы, например одно и то же лицо с разной мимикой, прической, деталями. К сожалению, таких пар изображений не существует на данный момент. И мы придумали хитрость: с помощью метода, работающего с малыми представлениями, мы создали реконструкцию настоящего изображения и пример редактирования этой реконструкции. Несмотря на то что получились довольно простые примеры без деталей, модель четко поняла, как правильно совершать редактирования», — рассказывает один из авторов статьи, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН, младший научный сотрудник лаборатории Fusion Brain AIRI Денис Бобков. 

Однако обучение только на сгенерированных (простых) примерах ведет к потере деталей при работе с реальными (сложными) изображениями. Чтобы этого не происходило, ученые добавили реальные изображения в обучающую выборку. И нейросеть училась воссоздавать их в деталях. 

Таким образом, показав модели и как редактировать простые, и как воссоздавать сложные изображения, ученым удалось создать условия, при которых нейросеть научилась редактировать сложные изображения. В частности, разработанный подход справляется с добавлением новых элементов стиля, а также лучше сохраняет детали исходных изображений по сравнению с другими существующими методами.

Рис. 1. Сравнение работы StyleFeatureEditor (SFE) с другими методами на наборе лиц с большим числом деталей.
© Высшая школа экономики

В случае простой реконструкции (первый ряд) StyleFeatureEditor аккуратно воспроизвел шляпку, в то время как большинство других методов ее практически потеряло. Лучшее качество разработанный метод показал в случае добавления аксессуаров (третий ряд): большинство методов справились с добавлением очков, но только StyleFeatureEditor сохранил исходный цвет глаз. 

Айбек Аланов

«Благодаря технике обучения на сгенерированных данных, мы получили модель с хорошим качеством редактирования, а также быструю скорость работы за счет использования подхода с достаточно легковесными нейросетями. Фреймворку StyleFeatureEditor требуется всего 0,07 секунды на редактирование одного изображения», — говорит Айбек Аланов, заведующий Центром глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН, руководитель научной группы «Контролируемый генеративный ИИ» лаборатории Fusion Brain AIRI. 

Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве РФ. 

Результаты исследования будут представлены в докладе на ежегодной конференция по искусственному интеллекту и машинному обучению Fall into ML 2024, которая пройдет в НИУ ВШЭ 25-26 октября. На площадке Высшей школы экономики ведущие ученые в области искусственного интеллекта обсудят лучшие работы, опубликованные на конференциях А* в 2024 году — флагманских событиях этой области. Демо разработанного метода можно опробовать на HuggingFace, код — в Github репозитории.

Вам также может быть интересно:

С помощью ученых НИУ ВШЭ и Сбера преподаватели смогут повысить качество онлайн-обучения

Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка научились определять вовлеченность участников онлайн-мероприятий. Метод, основанный на анализе видео лица, помогает выявить, насколько слушатель заинтересован в материале. Научная статья о проведенном исследовании опубликована в рамках Международной конференции по искусственному интеллекту в образовании — AIED 2024.

Вышка расширит сотрудничество с Агентством стратегических инициатив для разработки передовых решений

В Высшей школе экономики прошел День знакомства университета и Агентства стратегических инициатив (АСИ). Стороны представили свои исследовательские и аналитические проекты и наметили направления совместной работы. Задача ученых и экспертов — повысить эффективность и ускорить внедрение в практику прорывных научных разработок по широкому спектру направлений — от экономических прогнозов до нейропротезирования.

Исследователи НИУ ВШЭ и Сбера добавят эмоций искусственному интеллекту

Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка разработали специальную систему, которая с помощью больших языковых моделей сделает искусственный интеллект (AI) более эмоциональным при общении с человеком. Синтезом AI-эмоций займутся набирающие популярность мультиагентные модели. Научная работа о проведенном исследовании опубликована в рамках Международной совместной конференции по искусственному интеллекту — IJCAI 2024.

Вышка и «Яндекс» научат преподавателей российских вузов ИИ-грамотности

«Яндекс Образование» и факультет компьютерных наук НИУ ВШЭ (ФКН ВШЭ) создали совместный онлайн-гайд, посвященный промптингу — формулированию запросов к нейросетям. Он доступен всем на платформе «Яндекса» и в первую очередь будет полезен преподавателям, которые никогда не пользовались GPT в работе или только начинают применять ИИ-инструменты. Как правильно создать запрос к нейросети? Как грамотно использовать GPT-модели в образовательных целях? Какие задачи преподаватели могут решать с помощью искусственного интеллекта? Гайд отвечает на эти и другие вопросы по работе с нейросетями.

«Оставаться конкурентным специалистом без применения нейросетей может стать нелегкой задачей»

Цифровые технологии прочно вошли в нашу жизнь и продолжают стремительно развиваться. Неудивительно, что все чаще возникает вопрос, сможет ли однажды искусственный интеллект полностью заменить специалистов. О перспективах лингвистики в эпоху нейросетей рассуждает Даниил Осипов, кандидат филологических наук, доцент Школы иностранных языков НИУ ВШЭ.

В НИУ ВШЭ разработали нейросеть для оценки уровня владения английским языком

Нейросеть «ИИ Лингво» была разработана совместно Центром искусственного интеллекта, Школой иностранных языков и онлайн-кампусом НИУ ВШЭ. Модель обучена на основе тысяч экспертных оценок устных и письменных текстов. Система позволяет оценить способность к устному и письменному общению на английском языке.

Ученые НИУ ВШЭ рассказали о будущем искусственного интеллекта в судопроизводстве

Современные технологии меняют не только нашу повседневную жизнь, но и такие консервативные сферы, как судебная система. Сотрудники кафедры конституционного и административного права НИУ ВШЭ в Нижнем Новгороде Ирина Михеева и Олег Шерстобоев проанализировали возможности и вызовы, связанные с внедрением ИИ в судебный процесс. Исследование опубликовано в журнале «Вестник Российского университета дружбы народов».

«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»

Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.

В Вышке упростили разработку интеллектуальных сервисов

Ученые НИУ ВШЭ разработали MLOps-платформу, применение которой поможет внедрять эффективные и безопасные ИИ-решения во всех кампусах и подразделениях университета. В дальнейшем рассматривается возможность масштабирования инструмента на внешний рынок.

Бизнес-разработки и студенты в науке: какие еще задачи у новой лаборатории Института ИИ и цифровых наук

Лабораторию теоретических основ моделей ИИ возглавил старший научный сотрудник факультета компьютерных наук Никита Пучкин, за прикладные разработки будет отвечать руководитель проектов Института ИИ и цифровых наук Елизавета Жемчужина. О том, чем будет заниматься лаборатория, как планируется организовать сотрудничество с индустриальными партнерами и какая роль в ее работе отводится студентам Вышки, они рассказали в интервью «Вышке.Главное».