Разработан новый способ обучения универсальных роботов / Все новости / Главная

Ученые из Массачусетского технологического института (MIT) разработали новый подход к обучению универсальных роботов, вдохновленный успехом больших языковых моделей искусственного интеллекта, таких как GPT-4. Новый метод, названный «Гетерогенные предварительно обученные трансформаторы» (HPT), позволяет роботам обучаться и адаптироваться к широкому спектру задач, что ранее было сложной задачей.

Это исследование может привести к будущему, в котором роботы будут не просто специализированными инструментами, а гибкими помощниками, способными быстро осваивать новые навыки и адаптироваться к меняющимся обстоятельствам, становясь по-настоящему универсальными роботизированными помощниками.

Комплексное обучение

Традиционно обучение роботов было трудоемким и дорогостоящим процессом, требующим от инженеров сбора специальных данных для каждого робота и задачи в контролируемых условиях. В результате роботы с трудом адаптировались к новым ситуациям или неожиданным препятствиям.

Новая методика команды MIT объединяет большие объемы разнородных данных из различных источников в единую систему, способную обучать роботов широкому спектру задач.

В основе архитектуры HPT лежит трансформатор, тип нейронной сети, которая обрабатывает входные данные от различных датчиков, включая данные зрения и проприоцепции, и создает общий «язык», который модель ИИ может понимать и изучать.

«В робототехнике люди часто утверждают, что у нас недостаточно данных для обучения. Но, по моему мнению, другая большая проблема заключается в том, что данные поступают из столь разных областей, модальностей и аппаратного обеспечения роботов. Наша работа показывает, как можно обучить робота, объединив все эти данные», — говорит Лируй Ван, ведущий автор исследования и аспирант по электротехнике и компьютерным наукам (EECS) в MIT.

Одним из ключевых преимуществ подхода HPT является его способность использовать массивный набор данных для предварительного обучения. Исследователи собрали набор данных, состоящий из 52 наборов данных с более чем 200 000 траекторий роботов по четырем категориям, включая видео с демонстрацией человека и симуляции.

Это предварительное обучение позволяет системе эффективно передавать знания при обучении новым задачам, требуя лишь небольшого количества специфичных для задачи данных для дообучения.

Как в симулированных, так и в реальных задачах метод HPT превосходил традиционные подходы обучения с нуля более чем на 20 процентов. Система HPT также продемонстрировала улучшенные результаты даже при столкновении с задачами, значительно отличающимися от данных предварительного обучения.

Теперь исследователи из MIT стремятся улучшить систему HPT, изучая, как разнообразие данных может повысить ее производительность. Они также планируют расширить возможности системы для обработки немаркированных данных, аналогично тому, как работают большие языковые модели, такие как GPT-4.

«Наша мечта — иметь универсальный мозг робота, который можно было бы загрузить и использовать для своего робота без какой-либо подготовки. Хотя мы находимся лишь на ранних стадиях, мы будем продолжать упорно работать и надеемся, что масштабирование приведет к прорыву в роботизированных политиках, как это произошло с большими языковыми моделями», - говорят исследователи.

Исследование будет представлено на Конференции по нейронным информационным системам обработки (Conference on Neural Information Processing Systems) в декабре этого года.

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: