
Яндекс переписывает правила игры в робототехнике
Традиционная робототехника строится на едином правиле: каждый робот умеет делать ровно то, чему его научили. Роборука собирает детали на конвейере — отлично. Мобильный робот возит коробки по складу — прекрасно. Но стоит чему-то измениться, и система рушится. Новый товар другой формы? Нужна перенастройка руки-манипулятора. Склад переехал? Требуется перепрограммирование в новом пространстве. Компании вынуждены нанимать специалистов, тратить месяцы на адаптацию, переучивать персонал. Часто это дорого, долго и неэффективно.
Яндекс решил заняться тем, чтобы сделать робота универсальным и мыслящим. Вместо того чтобы жёстко прописывать алгоритмы, инженеры создали модель VLA (Vision-Language-Action), которая воспринимает команды как человеческие инструкции и переводит их в действия. Голос, текст, жест — робот понимает все. В перспективе сервисному или промышленному роботу можно будет показываешь видео с тем, как работник собирает коробки, и машина считает последовательность действий. Или вводить текстовую команду вроде «возьми коробку и положи в левый отсек» — он выполнит. Это сложнее, чем кажется: модели нужно уметь моделировать пространство, понимать физику, предвидеть исход.
Текущая версия VLA-модели поддерживает более десяти базовых операций: взять, положить, перенести, закрыть, открыть и другие. Это не много, но в промышленности работает принцип: большинство задач состоит из небольшого набора простых движений. На конечном этапе развития модель должна освоить более сотни команд. Параллельно Яндекс разработал Yandex RMS — систему управления роботами, которая позволяет контролировать машины разных типов и производителей из единого интерфейса. Раньше компании вынуждены были использовать отдельное ПО для каждого робота. Теперь всё в одной панели: видишь положение каждой машины, её статус, где она застряла. Кроме того Yandex RMS развивается, чтобы роботы могли сами определять, какую комбинацию действий им необходимо применить для решения разных задач. Причем, они смогут сделать это сами, а смогут скооперироваться с другими роботами и объединить усилия.
Конкурентов у Яндекса в этой области предостаточно. Tesla работает над усовершенствованием гуманоидов Optimus, Boston Dynamics создаёт многоногих и антропоморфных сервисных роботов, а в Китае идёт настоящая гонка в робототехнике. Но Яндекс имеет главное преимущество: опыт на реальных данных. Компания годами разрабатывает беспилотники, роботов-доставщиков, логистические системы. Эти знания и датасеты — именно то, что нужно для совершенствования Physical AI и продуктов на его основе. Это не теоретический проект, это шаг в будущее России, которое уже совсем близко.