image-block
23.10.2025Светина Майя
post image

Яндекс переписывает правила игры в робототехнике

Разработчики рассказали о Physical AI, физический искусственный интеллект, который позволит машинам разговаривать с людьми, как с равными, видеть мир трёхмерным и самостоятельно принимать решения. Вместо программирования под каждую задачу достаточно будет показать роботу инструкцию для человека — и он её выполнит. Благодаря нововведениям роботы-доставщики смогут переходить улицу на нужный сигнал светофора, автономные автомобили заранее оценят дорожную обстановку в снегопад, а гуманоиды, в ближайшем будущем, смогут пожарить для нас яичницу и полить цветы.

Традиционная робототехника строится на едином правиле: каждый робот умеет делать ровно то, чему его научили. Роборука собирает детали на конвейере — отлично. Мобильный робот возит коробки по складу — прекрасно. Но стоит чему-то измениться, и система рушится. Новый товар другой формы? Нужна перенастройка руки-манипулятора. Склад переехал? Требуется перепрограммирование в новом пространстве. Компании вынуждены нанимать специалистов, тратить месяцы на адаптацию, переучивать персонал. Часто это дорого, долго и неэффективно.

Яндекс решил заняться тем, чтобы сделать робота универсальным и мыслящим. Вместо того чтобы жёстко прописывать алгоритмы, инженеры создали модель VLA (Vision-Language-Action), которая воспринимает команды как человеческие инструкции и переводит их в действия. Голос, текст, жест — робот понимает все. В перспективе сервисному или промышленному роботу можно будет показываешь видео с тем, как работник собирает коробки, и машина считает последовательность действий. Или вводить текстовую команду вроде «возьми коробку и положи в левый отсек» —  он выполнит. Это сложнее, чем кажется: модели нужно уметь моделировать пространство, понимать физику, предвидеть исход.

Текущая версия VLA-модели поддерживает более десяти базовых операций: взять, положить, перенести, закрыть, открыть и другие. Это не много, но в промышленности работает принцип: большинство задач состоит из небольшого набора простых движений. На конечном этапе развития модель должна освоить более сотни команд. Параллельно Яндекс разработал Yandex RMS — систему управления роботами, которая позволяет контролировать машины разных типов и производителей из единого интерфейса. Раньше компании вынуждены были использовать отдельное ПО для каждого робота. Теперь всё в одной панели: видишь положение каждой машины, её статус, где она застряла. Кроме того Yandex RMS развивается, чтобы роботы могли сами определять, какую комбинацию действий им необходимо применить для решения разных задач. Причем, они смогут сделать это сами, а смогут скооперироваться с другими роботами и объединить усилия. 

Конкурентов у Яндекса в этой области предостаточно. Tesla работает над усовершенствованием гуманоидов  Optimus, Boston Dynamics создаёт многоногих и антропоморфных сервисных роботов, а в Китае идёт настоящая гонка в робототехнике. Но Яндекс имеет главное преимущество: опыт на реальных данных. Компания годами разрабатывает беспилотники, роботов-доставщиков, логистические системы. Эти знания и датасеты — именно то, что нужно для совершенствования Physical AI и продуктов на его основе. Это не теоретический проект, это шаг в будущее России, которое уже совсем близко.