Подход с использованием искусственного интеллекта позволяет получить “атлетически умную” роботизированную собаку

Когда-нибудь, когда начнутся землетрясения, пожары и наводнения, первыми спасателями могут стать стаи собак-роботов-спасателей, спешащих на помощь заблудшим душам. Эти четвероногие, работающие на батарейках, будут использовать компьютерное зрение, чтобы определять размеры препятствий, и использовать навыки собачьей ловкости, чтобы преодолевать их.

Для достижения этой благородной цели исследователи искусственного интеллекта из Стэнфордского университета и Шанхайского института Ци Чжи говорят, что они разработали новый алгоритм, основанный на зрении, который помогает рободогам взбираться на высокие объекты, перепрыгивать через пропасти, проползать под порогами и протискиваться сквозь щели, а затем бросаться к следующему испытанию. Алгоритм представляет собой мозг рободога.

“Автономность и диапазон сложных навыков, которым научился наш четвероногий робот, весьма впечатляют”, – сказала Челси Финн, доцент кафедры компьютерных наук и старший автор новой рецензируемой статьи, в которой рассказывается о подходе команд к миру, который будет представлен на предстоящей конференции по обучению роботов, которая состоится в ноябре. 6-9 в Атланте. “И мы создали его, используя недорогих готовых роботов — на самом деле, двух разных готовых роботов”.

Ключевым достижением, по словам авторов, является то, что их robodog является автономным — то есть он способен оценивать физические трудности и представлять, а затем выполнять широкий спектр навыков маневренности, основываясь просто на препятствиях, которые он видит перед собой.

“То, что мы делаем, – это комбинируем восприятие и контроль, используя изображения с камеры глубины, установленной на роботе, и машинное обучение для обработки всех этих входных данных и перемещения ног, чтобы преодолевать препятствия, проходить под ними и огибать их”, – сказал Ципенг Фу, докторант лаборатории Финна и первый автор исследования. автор исследования вместе с Цзивэнь Чжуан из Шанхайского института Ци Чжи.

Это не первый рободог, демонстрирующий такую ловкость — класс легкой атлетики, известный как “паркур”, — но он первый, кто сочетает самодостаточность с широким спектром навыков.

“Наши роботы обладают как видением, так и автономией — спортивным интеллектом, позволяющим оценить сложность задачи и самостоятельно выбирать и применять навыки паркура в соответствии с требованиями момента”, – сказал Фу.

Существующие методы обучения часто основаны на сложных системах вознаграждения, которые должны быть точно настроены с учетом конкретных физических препятствий. Соответственно, они плохо адаптируются к новым или незнакомым условиям. Другие связанные подходы позволяют обучаться, используя реальные данные, имитировать навыки ловкости других животных. Этим рободогам не хватает широкого набора навыков, и они не обладают возможностями видения новых рободогов. Оба существующих метода также являются вычислительно “запаздывающими” — другими словами, медленными.

Это первое приложение с открытым исходным кодом, позволяющее достичь этих целей с помощью простой системы вознаграждения, не использующей реальных справочных данных, пишут авторы в исследовании.

Чтобы добиться успеха, они сначала синтезировали и отточили алгоритм с помощью компьютерной модели, а затем перенесли его на двух реальных рободогов. Затем, в процессе, называемом обучением с подкреплением, роботы пытались двигаться вперед любым способом, который они считали нужным, и получали вознаграждение в зависимости от того, насколько хорошо они справлялись. Именно так алгоритм в конечном итоге находит наилучший способ решения новой задачи.

На практике большинство существующих систем вознаграждения за обучение с подкреплением включают слишком много переменных, чтобы быть эффективными, что замедляет производительность вычислений. Это то, что делает оптимизированный процесс вознаграждения за robodog parkour исключительным, хотя и удивительно простым.

“На самом деле это довольно просто”, – сказал Финн. “Мы основывали это в основном на том, как далеко вперед движется робот и сколько усилий он приложил для этого. Со временем робот осваивает более сложные двигательные навыки, которые позволяют ему продвигаться вперед”.

Тесты в реальных условиях

Затем команда провела обширные эксперименты с использованием реальных рободогов, чтобы продемонстрировать свой новый подход к маневренности в особо сложных условиях, используя только готовые компьютеры, визуальные датчики и системы питания этих рободогов.

В общих чертах, новые и улучшенные рободоги были способны преодолевать препятствия, превышающие их высоту более чем в полтора раза, перепрыгивать промежутки, превышающие их длину в полтора раза, проползать под барьерами на три четверти их высоты и наклоняться, чтобы протиснитесь через щель тоньше, чем их ширина.

Далее команда надеется использовать достижения в области 3D-зрения и графики для добавления реальных данных в свои моделируемые среды, чтобы обеспечить новый уровень автономии своего алгоритма в реальном мире.