Лидеры мысли
Эра гуманоидов не наступит — она уже наступила

Ранее в этом месяце в Китае был создан человекоподобный робот по имени Шуан Шуан вышел на сцену На выпускном церемонии в старшей школе в провинции Фуцзянь, где он получил диплом, пожимая руки и вызывая восторг как у учеников, так и у учителей. Такие моменты символизируют значимый сдвиг, в ходе которого человекоподобные роботы начинают заметно входить в общественную жизнь.
Эти моменты знаменуют собой нечто большее, чем простое любопытство публики — они сигнализируют о переходе к интеграции с реальным миром. В этой статье мы исследуем, как гуманоиды переходят от зрелищности и зрелищности к функциональности, и почему то, что кажется исключительно аппаратным достижением, на самом деле связано с интегрированным интеллектом, который позволяет этим машинам ходить, взаимодействовать и учиться в средах, не предназначенных для автоматизации. Мы также обсудим наш подход к коммерциализации, основанный на раннем внедрении и долгосрочном партнерстве.
Как гуманоиды внедряют ИИ в реальный мир
Разрыв между виртуальной производительностью и физической надёжностью остаётся одной из самых недооценённых проблем в области искусственного интеллекта. Чат-бот может генерировать абзацы беглого текста, не выполняя никаких действий — точно так же, как модель зрения может распознать шаг на изображении, не совершая по нему никаких физических движений и не рискуя упасть. Гуманоиды не могут себе этого позволить.
Чтобы функционировать в реальном мире, ИИ должен отказаться от статических наборов данных и контролируемых условий. Он должен видеть, принимать решения и действовать в условиях, которые меняются каждую секунду. Это включает в себя неровные полы, неуместные предметы, непредсказуемое поведение человека и контекстно-зависимые невербальные сигналы. В результате ему ежедневно приходится сталкиваться с шумом, неоднозначностью и потенциальными сбоями.
Именно здесь воплощенное мышление, где язык основан на пространстве, времени и последствиях, начинает значить больше, чем шаблонное предсказание. Например, если человек говорит: «Осторожно, скользко», роботу необходимо связать эту фразу не только с определением слова, но и с пространственным восприятием, потенциальными рисками и корректировками в режиме реального времени.
В то же время мультимодальное обучение становится необходимым, поскольку ни один входной канал не может работать достаточно надёжно в одиночку. Камера может пропустить скользкую поверхность, но датчики давления в стопе могут обнаружить внезапную потерю сцепления. Или, в другой ситуации, распознавание речи может дать сбой в шумном складе, но визуальные подсказки или жесты могут заполнить пробел.
Обобщение также становится критически важным. Робот не может полагаться на то, что дважды увидит одно и то же окружение. Ему необходимо адаптировать своё поведение к мокрому полу, изменению освещения или тому, что коробка не там, где была вчера. Это и есть разница между успешным выполнением и неудачей.
Именно поэтому в Humanoid мы начинаем тестирование с коммерческими партнёрами на ранних этапах. Мы интегрируем наших роботов в реальные условия, чтобы быстро обнаружить потенциальные недостатки и обеспечить оптимальную работу до внедрения. Робот, который хорошо работает в симуляции или на демонстрации, не то же самое, что робот, заслуживший доверие в условиях стресса, поскольку это доверие в конечном итоге строится на реальном опыте.
Мы знаем, что гуманоиды поступят в продажу в течение следующих двух лет, но мы не ждём. Для нас коммерциализация начинается рано. Это означает построение долгосрочных партнёрских отношений на основе реальных сценариев использования. Благодаря серии пилотных программ мы не только знакомим партнёров с технологией, но и учимся вместе с ними. Этот совместный процесс обучения также помогает нам оптимизировать структуру затрат и надёжность работы с первого дня, обеспечивая наилучшую совокупную стоимость владения (TCO) по мере масштабирования систем.
Почему гуманоиды являются идеальным испытательным полигоном для общего интеллекта
Мир, созданный нами за последние сто лет, рассчитан на человеческий масштаб. Дверные ручки, погрузчики, склады — всё имеет определённые размеры, диапазоны движения и подразумеваемые социальные модели поведения. Гуманоиды должны адаптироваться к этой реальности, иначе их функциональность будет крайне ограничена.
Чтобы подняться по лестнице, нести предмет, интерпретировать указательный жест или распознать нерешительность в голосе, робот должен понимать контекст, выходящий далеко за рамки визуальной классификации или запрограммированного планирования движений. Он должен делать выводы о намерениях, изучать новую задачу, наблюдая за человеком, адаптировать этот навык к немного изменившейся обстановке и со временем улучшать свою эффективность. На практике эта система фактически расширяет возможности ИИ в условиях реальных ограничений.
В Humanoid мы ускоряем этот процесс благодаря дистанционному управлению. На ранних этапах разработки операторы-люди руководят роботом, выполняя ключевые задачи. Эти практические данные становятся основой для обучения новым моделям поведения. Со временем эти демонстрации используются в наших сквозных моделях, помогая нам двигаться к надёжной автономности.
От узких систем к интегрированному интеллекту
Большинство современных систем искусственного интеллекта (ИИ) отлично справляются с узкими задачами. По отдельности каждая из них работает хорошо. Но гуманоидам не нужны отдельные специалисты. Для успешной интеграции нам нужны системы, способные мыслить в разных модальностях и временных рамках.
Гуманоид может получить относительно расплывчатую инструкцию — «Принеси мне желтую коробку из кладовки напротив» — и ему придется расшифровать ее в последовательность подзадач: локализовать говорящего, пройти по коридору, найти нужную коробку, отрегулировать силу хвата, избежать столкновений и, конечно, благополучно вернуться.
Каждый элемент этой последовательности включает в себя отдельную подсистему: зрение, движение, язык, манипуляцию и обратную связь. И надёжность всей системы зависит от того, насколько хорошо эти элементы взаимодействуют в меняющихся условиях.
Модульная архитектура — один из способов решения этой задачи. Она позволяет нам независимо итерировать подсистемы, обеспечивая при этом общесистемную координацию. Кроме того, это позволяет масштабировать возможности в различных средах без необходимости перестраивать систему с нуля. Так мы переходим от закрытых демонстраций к производительности в открытом мире.
Ставки огромны — и они глобальны.
Легко представить гуманоидов как нечто фантастическое. Но когда мы общаемся с нашими клиентами, потребность в них очевидна. Многие склады, сборочные линии и другие некогда загруженные рабочие площадки теперь испытывают трудности с укомплектованием штата.
Дефицит рабочей силы – это демографическая проблема. В Японии почти 30% населения старше 65 летВ Европе ключевые секторы, которые имеют совокупный фонд заработной платы в размере 1.7 триллиона долларов - являются с трудом набирает молодых работников. Это не те роли, которые хочет большинство людей, и всё чаще люди не готовы их играть.
Выступая в роли помощников, а не замены, гуманоиды могут выполнять физически сложные, повторяющиеся или опасные задачи — перемещение инвентаря, погрузку поддонов, управление оборудованием — без риска усталости или травм. Это освобождает рабочих, позволяя им сосредоточиться на более сложных, творческих или межличностных аспектах работы.
Более того, это обеспечивает долгосрочную экономическую устойчивость. В условиях нестабильности или нехватки рабочей силы интеллектуальные машины могут помочь обеспечить непрерывность производства — без ущерба для безопасности, качества или адаптивности.
Ещё один аспект, который следует отметить, — это нормативно-правовая база. Большинство команд, особенно в юрисдикциях со слабым регулированием, не торопятся с размышлениями. Мы начали с этого. Европейские законы о безопасности и защите данных — одни из самых жёстких в мире, но вместо того, чтобы воспринимать их как препятствие, мы считаем их нашим конкурентным преимуществом. По мере того, как другие рынки принимают более строгие правила, мы будем готовы к ним, в то время как другие компании могут столкнуться с трудностями.
Новая раса искусственного интеллекта — но не та, о которой вы думаете
Сегодня большая часть дискуссий вокруг ИИ сосредоточена на вычислительной мощности, параметрах и данных для обучения. Но настоящий прорыв может произойти на другом фронте: в интеграции с физическим миром. Именно здесь интеллект должен научиться действовать, а не просто предсказывать.
В этом отношении гонка идёт за самую эффективную систему — ту, которая способна работать в общественных местах, с соблюдением мер безопасности и с участием людей. Эта система, помимо обучения на основе данных, будет также — и это особенно важно — учиться на основе реальных данных и работать бок о бок с людьми, не нарушая привычный ход событий.
Именно поэтому мы не ждём начала развёртывания. С самого начала мы работаем напрямую с коммерческими партнёрами над интеграцией в реальную среду, гарантируя, что система будет совершенствоваться именно там, где это наиболее важно: на практике.
Именно такого рода обучение в реальном мире и не хватает узким системам. Хотя они и продвинули нас далеко, они никогда не были предназначены для такой сложности. Гуманоидам требуется нечто другое — координация, выносливость и, как уже упоминалось, способность учиться на неожиданностях.
Перед нами открываются колоссальные возможности. Не автоматизировать всё, а создавать машины, способные понимать человеческий мир, ориентироваться в нём и взаимодействовать с ним.












