Vođe misli
Era humanoida ne dolazi - već je ovdje

Ranije ovog mjeseca, u Kini, humanoidni robot pod nazivom Shuang Shuang je stupio na pozornicu na svečanosti dodjele diplome srednjoj školi u Fujianu kako bi primili diplomu - rukovali su se i oduševili učenike i nastavnike. Trenuci poput ovih predstavljaju značajnu promjenu, onu u kojoj humanoidni roboti počinju ulaziti u javni život na vrlo vidljive načine.
Ovi trenuci označavaju više od puke znatiželje javnosti - oni signaliziraju pomak prema integraciji u stvarnom svijetu. Ovaj članak istražuje kako humanoidi prelaze iz spektakla u funkcionalnost - i zašto se ono što se čini kao isključivo hardverski podvig zapravo odnosi na integriranu inteligenciju koja omogućuje tim strojevima hodanje, interakciju i učenje u okruženjima koja nisu predviđena za automatizaciju. Također ćemo raspravljati o tome kako pristupamo komercijalizaciji kroz rano uvođenje i dugoročna partnerstva.
Kako humanoidi guraju umjetnu inteligenciju u stvarni svijet
Jaz između virtualnih performansi i fizičke pouzdanosti ostaje jedan od najzanemarenijih izazova u umjetnoj inteligenciji. Chatbot može generirati odlomke tečnog teksta bez potrebe da ikada reagira na njih - na isti način na koji model vida može identificirati korak na slici bez potrebe za fizičkim navigacijom ili rizikom pada. Humanoidi nemaju taj luksuz.
Da bi funkcionirala u stvarnom svijetu, umjetna inteligencija mora ostaviti iza sebe statične skupove podataka i kontrolirane uvjete. Mora vidjeti, odlučivati i djelovati u okruženjima koja se mijenjaju iz sekunde u sekundu. To uključuje neravne podove, pogrešno postavljene predmete, nepredvidivo ljudsko ponašanje i neverbalne znakove ovisne o kontekstu. Rezultat je svakodnevno suočavanje s bukom, dvosmislenošću i potencijalnim neuspjehom.
Ovdje utjelovljeno zaključivanje - gdje je jezik utemeljen u prostoru, vremenu i posljedicama - počinje biti važnije od predviđanja simbola. Na primjer, ako čovjek kaže „pazi, sklisko je“, robot treba povezati tu frazu ne samo s definicijom riječi, već i s prostornom sviješću, potencijalnim rizicima i prilagodbama u stvarnom vremenu.
Istovremeno, multimodalno učenje postaje ključno, jer nijedan ulazni kanal nije dovoljno pouzdan da bi radio samostalno. Kamera bi mogla propustiti klizavu površinu, ali senzori tlaka u stopalu mogu detektirati iznenadni gubitak prianjanja. Ili, u drugoj situaciji, prepoznavanje govora može zakazati u bučnom skladištu, ali vizualni znakovi ili geste mogu popuniti prazninu.
Generalizacija također postaje ključna. Robot se ne može osloniti na to da će dvaput vidjeti istu okolinu. Mora prilagoditi svoje ponašanje kada je pod mokar, osvjetljenje se promijeni ili kutija nije tamo gdje je bila jučer. To postaje razlika između uspješnog izvršenja i neuspjeha.
U Humanoidu, zato rano započinjemo s testiranjem s komercijalnim partnerima. Integriramo naše robote u stvarna okruženja kako bismo brzo otkrili potencijalne nedostatke i osigurali optimalno funkcioniranje prije implementacije. Robot koji dobro radi u simulaciji ili demonstraciji nije isti kao onaj koji zaslužuje povjerenje pod pritiskom, jer se to povjerenje u konačnici gradi na učenju u stvarnom svijetu.
Znamo da će humanoidi biti komercijalno dostupni u sljedeće dvije godine - ali ne čekamo. Za nas, komercijalizacija počinje rano. To znači izgradnju dugoročnih partnerstava oko stvarnih slučajeva upotrebe. Kroz niz pilot programa ne samo da educiramo naše partnere o tehnologiji - već i učimo zajedno s njima. Ovaj zajednički proces učenja također nam pomaže da od prvog dana usavršimo strukture troškova i pouzdanost performansi - osiguravajući najbolje moguće ukupne troškove vlasništva (TCO) kako se sustavi skaliraju.
Zašto su humanoidi ultimativno poligon za testiranje opće inteligencije
Svijet koji smo stvorili tijekom posljednjih sto godina prilagođen je ljudskoj mjeri. Kvake na vratima, viličari, skladišta - sve poprima određene dimenzije, raspone kretanja i implicitno društveno ponašanje. Humanoidi se moraju prilagoditi toj stvarnosti ili riskiraju da budu izuzetno ograničeni u svojoj funkcionalnosti.
Da bi se popeo uz stepenice, nosio predmet, interpretirao gestu pokazivanja ili prepoznao oklijevanje u glasu, robot mora razumjeti kontekst daleko izvan vizualne klasifikacije ili skriptiranog planiranja kretanja. Mora zaključiti o namjeri, naučiti novi zadatak promatrajući čovjeka, prilagoditi tu vještinu malo drugačijem rasporedu i s vremenom poboljšati svoje performanse. U praksi, ovaj sustav učinkovito proširuje ono što umjetna inteligencija može učiniti pod stvarnim ograničenjima.
U Humanoidu ubrzavamo taj proces teleoperacijom. U ranim fazama razvoja, ljudski operateri vode robota kroz ključne zadatke. Ovi praktični podaci postaju temelj za obuku novih ponašanja. S vremenom se ove demonstracije uklapaju u naše end-to-end modele, pomažući nam u izgradnji pouzdane autonomije.
Od uskih sustava do integrirane inteligencije
Većina AI sustava danas izvrsno obavlja uske zadatke. U izolaciji, svaki od njih dobro funkcionira. Ali humanoidima nisu potrebni nepovezani stručnjaci. Za uspješnu integraciju potrebni su nam sustavi koji mogu rasuđivati u različitim modalitetima i vremenskim skalama.
Humanoid bi mogao primiti relativno nejasnu uputu - "Donesi mi žutu kutiju iz skladišta s druge strane hodnika" - i morao bi je dekodirati u niz podzadataka: lokalizirati govornika, snalaziti se u hodniku, identificirati pravu kutiju, prilagoditi snagu stiska, izbjegavati sudare i, naravno, sigurno se vratiti.
Svaki dio tog slijeda uključuje drugačiji podsustav - vid, kretanje, jezik, manipulaciju i povratnu informaciju. A pouzdanost cjeline ovisi o tome koliko dobro ti dijelovi komuniciraju u promjenjivim uvjetima.
Modularna arhitektura je način za rješavanje ovog izazova. To nam omogućuje neovisno ponavljanje na podsustavima uz istovremeno postizanje koordinacije na razini cijelog sustava. Osim toga, to nam omogućuje skaliranje mogućnosti u više okruženja bez potrebe za ponovnom izgradnjom od nule. Na ovaj način prelazimo sa zatvorenih demo verzija na performanse u otvorenom svijetu.
Ulozi su ogromni - i globalni su
Lako je humanoide prikazati kao futurističke. Ali kada razgovaramo s našim kupcima, potreba je hitna. Mnoga skladišta, montažne trake i druga nekada prometna radna mjesta sada se bore s time da zadrže osoblje.
Ovi nedostaci radne snage su demografski problemi. U Japanu, gotovo 30% stanovništva je starije od 65 godinaU Europi, ključni sektori - koji imaju kombinirani plaće od 1.7 bilijuna dolara — su muke s zapošljavanjem mlađih radnikaTo nisu uloge koje većina ljudi želi, a sve više ni uloge koje su ljudi spremni obavljati.
Dolazeći kao pomoćne ruke, a ne kao zamjena, humanoidi mogu preuzeti fizički zahtjevne, repetitivne ili opasne zadatke - premještanje inventara, utovar paleta, upravljanje strojevima - bez rizika od umora ili ozljeda. To oslobađa ljudske radnike da se usredotoče na složenije, kreativnije ili međuljudske aspekte posla.
Nadalje, to stvara dugoročnu ekonomsku otpornost. Kada je radna snaga nestabilna ili nedostupna, inteligentni strojevi mogu pomoći u osiguravanju kontinuiteta - sve bez žrtvovanja sigurnosti, kvalitete ili prilagodljivosti.
Još jedan aspekt koji treba istaknuti je regulatorni okvir. Većina timova - posebno u labavo reguliranim jurisdikcijama - pričeka s razmišljanjem o ovome. Mi smo tamo počeli. Europski zakoni o sigurnosti i podacima jedni su od najstrožih na svijetu, ali umjesto da ih tretiramo kao prepreke, smatramo ih našom konkurentskom prednošću. Kako druga tržišta usvajaju strože propise, bit ćemo spremni ispuniti ih, dok se druge tvrtke mogu boriti.
Nova AI rasa - ali ne ona kakvu mislite
Velik dio rasprave o umjetnoj inteligenciji danas se usredotočuje na računalnu snagu, parametre i podatke za obuku. Ali pravi proboj mogao bi doći s druge granice: integracije u fizički svijet. Tu inteligencija mora naučiti funkcionirati, umjesto da samo predviđa.
U tom smislu, utrka se vodi oko najsposobnijeg sustava - onog koji može raditi u javnim prostorima, pod sigurnosnim ograničenjima i s ljudima u petlji. Ovaj sustav, osim što će učiti iz podataka, također će - i posebno - učiti iz stvarnosti i raditi zajedno s ljudima bez ometanja tijeka stvari.
Zato ne čekamo implementaciju da bismo započeli. Od samog početka izravno surađujemo s komercijalnim partnerima kako bismo integrirali sustav u stvarna okruženja – osiguravajući da se sustav poboljša tamo gdje je najvažnije: u praksi.
Upravo takva vrsta učenja u stvarnom svijetu je ono u čemu uski sustavi zakazuju. Iako su nas oni daleko doveli, nikada nisu bili dizajnirani za ovu vrstu složenosti. Humanoidima je potrebno nešto drugo - koordinacija, robusnost i, kao što je spomenuto, sposobnost učenja iz neočekivanog.
To je ogromna prilika pred nama. Ne automatizirati sve, već izgraditi strojeve koji mogu razumjeti, navigirati i surađivati s ljudskim svijetom.