๋ก๋ณดํฑ์ค
ํด๋จผ๋ ธ์ด๋ ์๋๋ ์ค์ง ์๋๋ค – ์ด๋ฏธ ์ฌ๊ธฐ ์๋ค

이번 달 초, 중국에서 휴먼노이드 로봇인 Shuang Shuang는 푸젠의 한 고등학교 졸업식에서 무대에 올라 디플로마를 받으며 학생들과 교사들을 기쁘게 했다. 이러한 순간은 의미 있는 변화를 나타낸다. 즉, 휴먼노이드 로봇이 매우 가시적인 방식으로 공공 생활에 들어가기 시작한다.
이러한 순간은 공공의 호기심을 넘어서 실제 세계 통합으로의 전환을 나타낸다. 이 글은 휴먼노이드가 쇼와 스펙타클에서 기능으로 이동하는 방법과 하드웨어뿐만 아니라 이러한 기계를 작동시키는 통합 지능에 대해 설명한다. 또한 초기 배치와 장기 파트너십을 통해 상업화를 어떻게 접근하는지에 대해 논의한다.
휴먼노이드가 현실 세계로 AI를 밀어넣는 방법
가상 성능과 물리적 신뢰성 간의 격차는 AI에서 가장 간과되는 도전 중 하나이다. 채팅봇은 자동으로 텍스트를 생성할 수 있지만 실제로 행동할 필요는 없다. 비전 모델은 이미지에서 단계를 식별할 수 있지만 실제로 이동하거나 넘어지는 위험을 무시할 수 있다. 휴먼노이드는 이러한 특권이 없다.
현실 세계에서 작동하려면 AI는 정적 데이터셋과 제어된 환경을 떠나야 한다. 그것은 매초 변하는 환경에서 볼 수 있어야 하고, 결정하고 행동해야 한다. 이것에는 불규칙한 바닥, 잘못된 물체, 예측할 수 없는 인간 행동, 맥락에 따른 비언어적 신호가 포함된다. 결과는 매일 노이즈, 모호성, 그리고 잠재적인 실패와의 대면이다.
이것이 공간, 시간, 결과와 관련된 언어를 의미하는 구체적 사고가 중요해지는 곳이다. 예를 들어,一个人이 “조심해, 미끄러진다”고 말하면, 로봇은 단어 정의에 연결되는 것이 아니라 공간 인식, 잠재적 위험, 실시간 조정과 연결되어야 한다.
同时, 다중 모드 학습이 필수적이다. 왜냐하면 단일 입력 채널은 독자적으로 작동하기에 충분하지 않기 때문이다. 카메라는 미끄러운 표면을 놓칠 수 있지만, 발에 있는 압력 센서는突然적인 마찰 감소를 감지할 수 있다.또는 다른 상황에서 음성 인식이 시끄러운 창고에서 실패할 수 있지만, 시각적 신호 또는 제스처가 간격을 메울 수 있다.
일반화도 중요하다. 로봇은 동일한 환경을 두 번 볼 수 있는 것을 의존할 수 없다. 그것은 행동을 변경해야 한다. 바닥이 젖었을 때, 조명이 변경되었을 때, 또는 어제와 달리 박스가 없는 경우에 대해서도 vậy이다. 이것은 성공적인 실행과 실패 사이의 차이이다.
휴먼노이드에서는 초기에 상업 파트너와 함께 테스트를 시작한다. 우리는 실제 환경에 로봇을 통합하여 잠재적인 결함을 신속하게 발견하고 배치 전에 최적의 작동을 보장한다. 시뮬레이션 또는 데모에서 잘 작동하는 로봇은 압력하에서 신뢰를 얻는 로봇과 다르다. 왜냐하면 그 신뢰는 궁극적으로 실제 세계의 학습에 기반하기 때문이다.
우리는 휴먼노이드가 향후 2년 내에 상업적으로 이용 가능해질 것이라는 것을 알고 있다. 그러나 우리는 기다리지 않는다. 상업화는 초기에 시작된다. 실제 사용 사례를 중심으로 장기적인 파트너십을 구축하는 것을 의미한다. 파일럿 프로그램을 통해 우리는 파트너에게 기술에 대해 교육하는 동시에 함께 학습한다. 이 공동 학습 프로세스는 또한 초기부터 비용 구조와 성능 신뢰성을 tinh chỉnh하는 데 도움이 된다. 시스템이 확장됨에 따라 최상의 총 소유 비용(TCO)을 보장한다.
휴먼노이드는 일반 지능의 궁극적인 테스트 베드이다
우리가 지난 100년 동안 만들어온 세계는 인간의 규모에 맞춰져 있다. 문 손잡이, 포크리프트, 창고 – 모든 것이 특정한 치수, 동작 범위, 암시적인 사회적 행동을 가정한다. 휴먼노이드는 그 현실에 적응해야 하거나 매우 제한적인 기능을 가질 위험이 있다.
계단을 오르거나, 물건을 운반하거나, 제스처를 해석하거나, 목소리에서 주저함을 인식하려면 로봇은 시각적 분류나 스크립트된 동작 계획을 넘어서서 맥락을 이해해야 한다. 그것은 의도를 추론해야 하며, 인간이 하는 것을看着 새로운 작업을 배우고, 약간 다른 레이아웃에 그 기술을 적용하며, 시간이 지남에 따라 성능을 향상시켜야 한다. 실제로, 이 시스템은 실제 제약 조건 하에서 AI가 할 수 있는 것을 확장하는 것이다.
휴먼노이드에서는 원격 조작을 통해 그 과정을 가속화한다. 초기 개발 단계에서 인간 운용자가 로봇을 주요 작업을 수행하도록 안내한다. 이러한 수동 데이터는 새로운 행동을 훈련하는 데 필요한 데이터가 된다. 시간이 지남에 따라, 이러한 시범은 우리의 종단간 모델을 구축하는 데 도움이 되며, 안정적인 자율성을 향한 발전을 도와준다.
협소한 시스템에서 통합 지능으로
오늘날 대부분의 AI 시스템은 협소한 작업에 탁월하다. 각각이 분리되어 작동하면 잘 작동한다. 그러나 휴먼노이드는 분리된 전문가가 필요 없다. 성공적으로 통합하기 위해서는 우리는 다양한 모드와 시간尺度에서 추론할 수 있는 시스템이 필요하다.
휴먼노이드는 비교적 모호한 지시를 받을 수 있다 – “저기서 노란색 박스를 가져와” – 그리고 그것을 서브タ스크의 순서로 해석해야 한다: 화자의 위치를 찾기, 복도를 이동하기, 올바른 박스를 식별하기,握力의 강도를 조정하기, 충돌을 피하기, 그리고 물론 안전하게 돌아오기.
이 순서의 모든 부분은 서로 다른 하위 시스템을 포함한다 – 비전, 이동, 언어, 조작, 피드백. 그리고 전체의 신뢰성은 이러한 부분이 변경되는 조건하에서 얼마나 잘 통신하는지에 달려 있다.
모듈식 아키텍처는 이러한 도전을 극복하는 방법이다. 이것은 하위 시스템을 독립적으로 반복하면서 시스템 전체의 조정을 달성할 수 있도록 한다. 또한, 이것은 여러 환경에서 기능을 확장할 수 있게 해주며, 처음부터 다시 구축할 필요가 없다. 이것이 폐쇄된 데모에서 개방형 세계의 성능으로 이동하는 방법이다.
전세계적이며 막대한 이해관계가 걸린 것
휴먼노이드를 미래적으로 보는 것은 쉽다. 그러나 고객과 이야기할 때, 필요는 즉각적이다. 많은 창고, 조립 라인, 다른 번잡한 작업장은現在 인력을 유지하기 위해 어려움을 겪고 있다.
이러한 노동력 부족은 인구 통계학적 문제이다. 일본에서는 거의 30%의 인구가 65세 이상이다. 유럽에서는 주요 부문 – 총 급여가 1.7조 달러인 -이 젊은 근로자를 모집하기 위해 어려움을 겪고 있다. 이러한 역할은 대부분 사람들이 원하는 것이 아니며, 점점 더 많은 사람들이 이러한 역할을 수행하기를 원하지 않는다.
휴먼노이드는 도움이 되는 손으로, 대체하는 것이 아니라, 물리적으로 요구되는, 반복적인, 또는 위험한 작업 – 재고 이동, 팔레트 적재, 기계 작동 -을 수행할 수 있다. 이는 인간 근로자가 더 복잡한, 창의적인, 또는 대인적인 측면에 집중할 수 있도록 해준다.
또한, 이것은 장기적인 경제적 회복력을 창조한다. 노동력이 불안정하거나 이용할 수 없을 때, 지능형 기계는 연속성을 보장할 수 있다. 이는 안전성, 품질, 또는 적응성의 희생 없이 가능하다.
또한 규제 프레임워크를 강조해야 한다. 대부분의 팀 – 특히 느슨하게 규제된 관할 구역에서 – 규제를 생각하기 위해 기다린다. 우리는 그곳에서 시작했다. 유럽의 안전 및 데이터 법은 세계에서 가장 엄격한 법 중 하나이지만, 우리는 그것을 장애물로 생각하지 않는다. 다른 시장에서 더 엄격한 규제를 채택할 때, 우리는 그것을 충족하기 위해 준비할 것이다. 다른 회사들은 방황할 수 있다.
새로운 AI 경쟁 – 그러나 당신이 생각하는 것이 아니다
오늘날 AI에 대한 대부분의 논의는 컴퓨팅 파워, 매개 변수, 훈련 데이터에 관한 것이다. 그러나 실제 돌파구는 다른 전선에서 나올 수 있다 – 물리적 세계의 통합이다. 지능은 예측하는 것보다 수행해야 한다.
이 경우, 경쟁은 가장 능숙한 시스템에 관한 것이다 – 공공 공간에서 작동할 수 있고, 안전 제약을 충족하며, 인간이 루프에 있는 시스템이다. 이 시스템은 데이터에서 학습하는 것 외에도 현실에서 학습할 것이며, 물건의 흐름을 방해하지 않고 사람들과 함께 일할 것이다.
그것이 우리가 배치하기 전에 시작하지 않는 이유이다. 처음부터 우리는 상업 파트너와 함께 실제 환경에 통합하여 시스템이 가장 중요한 곳에서 개선되도록 한다 – 실제로.
그种의 실제 세계 학습은 협소한 시스템이 부족한 곳이다. 이러한 시스템은 우리를 멀리 데려갔지만, 이러한 복잡성을 위해 설계되지 않았다. 휴먼노이드는 다른 것을 필요로 한다 – 조정, 견고성, 그리고 예상치 못한 것에서 학습하는 능력.
그것이 우리 앞에 있는 막대한 기회이다. 모든 것을 자동화하는 것이 아니라, 인간 세계를 이해하고, 탐색하고, 협력할 수 있는 기계를 구축하는 것이다.












