В лаборатории Toyota Research Lab в Кембридже, штат Массачусетс, разработчики занимаются созданием роботов, способных к самостоятельному обучению и выполнению сложных задач. Один из таких экспериментов – это использование роботизированных рук с двухпальцевыми щипцами для уборки рассыпанных бобов на столе. Этот процесс, хоть и кажется простым, требует от робота значительной адаптации и гибкости.
Проект Toyota не ограничивается одной только уборкой. В лаборатории роботы осваивают различные домашние задачи: от чистки овощей до приготовления блинов. Особое внимание уделяется использованию языковых моделей, подобных ChatGPT, для обучения роботов. Подобные модели содержат информацию о физическом мире, что помогает роботам понимать предметы и способы их использования.
Основной прорыв в области обучения роботов связан с использованием машинного обучения, в частности, диффузионной политики – метода, похожего на те, что используются в генераторах изображений AI. Этот метод разработан Toyota совместно с исследователями из Колумбийского университета и Стэнфордского университета. Он позволяет роботу выбирать правильные действия из множества вариантов в считанные секунды, опираясь на множественные источники данных.
Ещё одним новшеством является попытка обучить роботов, используя видео с YouTube. Такой подход может превратить видеоплатформу в мощный ресурс для тренировки роботов. Однако, как отмечает Расс Тедрейк, вице-президент по исследованиям робототехники в Toyota Research Institute и профессор Массачусетского технологического института, для полного понимания физического мира роботам все же необходим базовый опыт взаимодействия с реальным миром.
Toyota объявила о создании своего института робототехники в Кембридже в 2015 году, а также о втором институте и штаб-квартире в Пало-Альто, Калифорния. Компания надеется, что роботы помогут людям сохранять независимость с возрастом, не только в Японии, но и в других развитых странах.
Несмотря на впечатляющие демонстрации и значительный прогресс в области робототехники, стоит отметить, что роботы все еще допускают ошибки и иногда ведут себя странно, подобно ранним версиям моделей, стоящих за ChatGPT.
Toyota не единственная компания, стремящаяся использовать языковые модели для продвижения исследований в области робототехники. Например, недавно команда Google DeepMind представила программное обеспечение Auto-R, которое использует большую языковую модель для помощи роботам в определении задач, которые они могут выполнять в реальном мире безопасно и реалистично.
Источник: SecurityLab