DeepMind разработала универсальную архитектуру для создания искусственного интеллекта
Специалисты лаборатории DeepMind создали универсальную архитектуру Perceiver IO для обработки всех типов входных и выходных данных.
To tackle all the challenges we meet while solving intelligence, we need tools that are as adaptable as possible. Announcing the paper & code for Perceiver IO, an architecture that handles a wide range of data and tasks, all while scaling gracefully: https://t.co/9UU9b6276q 1/4 pic.twitter.com/PO9JSHt7yL
— DeepMind (@DeepMind) August 3, 2021
В ее основе — оригинальная модель Perceiver, представленная в июне 2021 года. Она обрабатывает изображения, аудио, видео и их комбинации, однако ограничивается задачами с простыми выходными данными, такими как классификация.
Для решения этой проблемы исследователи создали более общую версию архитектуры — Perceiver IO. Она может выдавать широкий спектр выходных данных из разнообразия входящей информации, что делает ее применимой к таким областям, как обработка естественного языка, компьютерное зрение и мультимодальное понимание.
Результаты оценки оптического потока или отслеживания движения всех пикселей изображения с помощью Perceiver IO. Цвет каждого пикселя показывает направление и скорость движения. Данные. DeepMind.
Perceiver и Perceiver IO построены на архитектуре трансформеров, которые хорошо работают для входных данных, содержащих нескольких тысяч элементов. Однако, по словам исследователей, изображения, аудио и видео могут содержать миллионы таких элементов.
«С помощью оригинального Perceiver мы решили главную проблему универсальной архитектуры: масштабирование трансформеров на очень большие входные данные без введения допущений, специфичных для предметной области», — говорится в блоге.
Исследователи также считают, что Perceiver IO может достичь беспрецедентного уровня универсальности.
Они опубликовали исходный код архитектуры на GitHub и надеются, что это поможет исследователям и практикам разрабатывать приложения без необходимости тратить ресурсы на создание индивидуальных решений с использованием специализированных систем.
Напомним, в конце июля DeepMind представила обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта.
В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold.
В июне ученые из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением.
Источник: Источник