Процессоры для автономных агентов
О наступлении эпохи автономных агентов (АА) я писал полгода назад. И вот со стороны корпорации NVIDIA, последовал шаг, который продемонстрировал, что их время уже действительно наступает. Как известно, эта корпорация выросла на так называемых графических процессорах (GPU, ГП).
Но ГП при всей их вычислительной мощи совсем не подходит для АА, и вот почему.
Графические процессоры могут параллельно выполнять огромное количество операций над матрицами, поэтому они широко применяются для машинного обучения (МО) нейросетей — необходимой операции для получения больших языковых моделей (LLM), для генерации изображений и др. Таких систем сейчас уже многие сотни. Для них строят колоссальных размеров центры обработки данных (ЦОДы и суперЦОДы). Текущее число разнообразных LLM весьма трудно оценить, хотя многие из них, например ChatGPT, GigaChat и другие, уже несколько лет на слуху и каждый год появляются все новые и более мощные.
Но проблема тут в том, что активный агент выполняет не только нейросетевые вычисления. Его цикл работы в общем случае состоит из следующих этапов:
Восприятие реального мира
↓
LLM
↓
Планирование действий
↓
Запуск инструментов и управление ими
↓
Оценка результата
↓
Коррекция плана действий
↓
Следующее действие …
Многие из перечисленных этапов требуют большого числа операций: взаимодействия с внешним миром, которое заключается в работе с видеокамерами, сканерами, датчиками, микрофонами и т. п., операций с оперативной памятью и управления ею, операций поиска, логических операций и других, которые исходно лучше реализуются обычными процессорами. Кроме того, для такой системы важны маршрутизация запросов, распределение вычислений между ЦП, сетевые операции и т. д.
Вот некоторые требования к процессорам для активных агентов:
- Поддержка многоканальной оперативной памяти (от 4-х каналов и более) для взаимодействия АА с базой знаний (БЗ) и быстрой обработки контекста.
- Как было показано выше, АА требуют параллельной обработки множества задач, для этого необходима многоядерность процессора и наличие у него достаточного объёма кэш-памяти.
- Кроме того, может быть желательно наличие в ЦП выделенных нейропроцессорных модулей (NPU), что позволяет разгрузить основные ядра при запуске небольших локальных моделей и для других задач.
В этом плане очень интересна позиция корпорации NVIDIA, которая активно продвигает идею, что после эпохи LLM наступает эпоха автономных агентов (AI agent), а затем и агентов для физического ИИ (physical AI) — это роботы, автономные машины, промышленные системы. Однако важно понимать: пока NVIDIA не предлагает какой-то специальный «процессор для активных агентов» в узком смысле. Скорее она строит целую платформу для агентных систем, когда один запрос пользователя запускает не одну модель, а целую команду агентов и сервисов. При этом исполнением LLM-модели будет заниматься ГП, а остальными операциями — центральный (ЦП, CPU) процессор и/или специализированные процессоры. Для этой цели корпорация представила процессор Vera — собственный ЦП корпорации на ARM-архитектуре, пришедший на смену платформе Grace, высокопроизводительный ЦП, который входит в платформу Vera Rubin (эта платформа объединяет ЦП Vera и ГП Rubin). По традиции называть новые архитектуры в честь знаменитых ученых корпорация дала платформе имя в честь американского астронома Веры Рубин (Vera Rubin, 1928–2016) (Пишут, что она стала знаменитой благодаря исследованиям вращения галактик, которые дали одно из самых сильных наблюдательных подтверждений существования темной материи).
По заявлениям экспертов, данная платформа разрабатывалась под следующую волну ИИ-нагрузок, которую составят агентный ИИ, мультимодальные модели, робототехника с встроенным физическим ИИ.
С Vera NVIDIA связывает большие надежды, поскольку совершенно новый рынок процессоров для автономных агентов оценивается ею в $200 млрд. Отмечу, что с появлением Vera корпорация пытается войти в сегмент серверных процессоров, который исторически принадлежал корпорациям Intel и AMD. До ЦП Grace у NVIDIA практически не было собственных серверных процессоров.
Но Vera — это все же не нечто суперновое в процессорных архитектурах. Для агентных систем сейчас прорабатываются и другие интересные решения, такие как нейроморфные процессоры (некоторые из них уже выпускаются), графовые процессоры, вычисления, ориентированные на оперативную память. Полагаю, что уже в этом году мы о них услышим.