В NVIDIA научились обучать ИИ на небольшом количестве данных

Технологии
monsitj via Getty Images

Обычно для тренировки нейросетей используется огромный объём данных, но новый подход NVIDIA к обучению генеративных состязательных сетей (GAN) существенно отличается от традиционных.

Каждая GAN состоит из двух конкурирующих нейронных сетей: генератора и дискриминатора. В одной из них целью алгоритма является создание новых изображений, а в другой — исследование тысяч образцов изображений. Для создания стабильно достоверных результатов традиционным GAN необходимо от 50 000 до 100 000 тренировочных изображений. Если их слишком мало, то нейросети, как правило, сталкиваются с проблемой. В таких случаях дискриминатор не имеет достаточной базы, чтобы эффективно тренировать генератор.

В прошлом исследователи ИИ пытались обойти эту проблему дополнением данных, создавая «искаженные» копии того, что имеется в наличии. Искажение может означать обрезку изображения, его поворот или перелистывание. Идея здесь в том, что сеть никогда не видит одно и то же изображение дважды. Проблема такого подхода заключается в том, что GAN училась имитировать эти искажения, вместо того, чтобы создавать что-то новое. Новый подход NVIDIA к адаптивному дискриминаторному увеличению все еще использует увеличение данных, но делает это адаптивно. Вместо того, чтобы искажать изображения на протяжении всего тренировочного процесса, она делает это выборочно, чтобы GAN избежала перегрузки.

Потенциальный результат подхода NVIDIA более значителен, чем может показаться. Обучить ИИ навыкам написания новой текстовой приключенческой игры очень просто, потому что алгоритм работает с большим количеством материала. Но того же нельзя сказать о многих других задачах, с которыми исследователи могут обратиться за помощью к GAN.

Например, обучить алгоритм распознавания редкого неврологического расстройства мозга сложно именно из-за его редкости. Однако GAN, обученные с помощью подхода NVIDIA, могут обойти эту проблему. В качестве дополнительного бонуса врачи и исследователи могли бы проще делиться своими результатами, так как они работают на основе изображений, созданных ИИ, а не пациентами в реальном мире. Подробнее о новом подходе NVIDIA расскажет на предстоящей конференции NeurIPS, которая начнётся 6 декабря.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Мы в Мы Вконтакте

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: