IT Imperial представила часть системы Vision Action для роботов
Инженеры IT Imperial продемонстрировали возможность, которая еще недавно казалась лабораторной экзотикой: робот-гуманоид берет прозрачную пластиковую бутылку из любого положения, переворачивает ее и наливает воду в стакан, стоящий в произвольной точке рабочей зоны. Операция выполняется без джойстика и VR-очков — только с использованием камер, нейросетей и алгоритмов машинного зрения.
Разработка получила название Vision Action и базируется на концепции Vision-Language-Action (VLA) — сквозной архитектуре, где визуальная сцена не просто распознается, а транслируется в моторные команды с учетом физики объекта и окружающей обстановки.
«Попробуйте объяснить роботу, что бутылка может быть скользкой, стакан — стоять где угодно, а вода не терпит спешки, — комментируют в компании. — Это не задача «захвати и неси». Это одновременное решение трех задач: семантической сегментации, оценки 6D-позы и планирования траектории с тактильным контролем».
Разработка проходила в два этапа. Сначала сценарии моделировались в цифровом двойнике робота: бутылка падала, стакан опрокидывался, алгоритм ошибался в расчетах глубины. Затем отобранные варианты переносились на физическую платформу. В результате робот выполняет операцию из любого стартового положения, контролируя захват и пролив.
Демонстрация IT Imperial происходит на фоне роста интереса к физическому искусственному интеллекту (Physical AI).
«Мы видим запрос на решения, которые позволят роботу действовать автономно в условиях, где невозможно или нецелесообразно прямое управление, — комментирует Анна Багдасарян, заместитель генерального директора IT Imperial. — Vision Action — это шаг к тому, чтобы робот не просто выполнял заложенную программу, а понимал задачу в контексте и адаптировался к изменениям».
Способность налить воду в стакан может казаться бытовой мелочью. Однако именно такие операции — захват объекта из произвольного положения, оценка его физических свойств, планирование безопасной траектории — формируют базу для практического использования гуманоидных роботов в промышленности.