Connect with us

În interiorul noii curse a roboticii: date, modele și producție

Lideri de opinie

În interiorul noii curse a roboticii: date, modele și producție

mm

Inovația rareori apare în izolare. Mai mult, ea se naște în conversațiile dintre ingineri, fondatori, cercetători și investitori care încearcă să înțeleagă încotro se îndreaptă tehnologia.

De-a lungul unui an, am participat la zeci de conferințe din întreaga lume. Călătoriile de afaceri pot dura uneori luni, iar întâlnirile cu parteneri și clienți au loc de la Asia până în America de Nord. Însă una dintre călătoriile mele recente în Elveția s-a dovedit a fi deosebit de interesantă – în mare parte datorită oamenilor și conversațiilor care au avut loc acolo.

Zurich s-a dovedit a fi unul dintre locurile unde viitorul roboticii și al Physical AI este activ discutat astăzi. Și cu cât aceste conversații merg mai adânc, cu atât mai evident devine că adevărata cursă în robotica se desfășoară în jurul datelor.

Europa Silicon Valley

Zurich a fost tradițional asociat cu sectorul financiar, dar în ultimii ani a fost din ce în ce mai mult numit Europa Silicon Valley. O mare parte din această reputație este legată de ETH Zurich, una dintre cele mai respectate universități de inginerie din Europa. Acesta atrage cercetători, studenți doctoranzi, antreprenori și ingineri din întreaga lume. Ca rezultat, s-a format un puternic ecosistem tehnologic în jurul universității, unde cercetarea, startup-urile și proiectele industriale evoluează aproape simultan.

Unul dintre motivele călătoriei mele a fost să obțin o înțelegere mai profundă a ceea ce Introspector poate oferi pieței roboticii, care a fost în plină expansiune de la începutul anului 2025. Este o industrie în care o gamă largă de startup-uri încearcă să intre, în timp ce progresele tehnologice ale companiilor mari tehnologie activează să o reshapeze. Însă, în ciuda tuturor acestor impulsuri, domeniul ridică încă mai multe întrebări decât răspunsuri.

Zurich este, de asemenea, casa partenerilor noștri Lightly, care m-au ajutat să întâlnesc colegi care lucrează la intersecția roboticii, a viziunii calculate și a inteligenței artificiale. Există un aspect important al ecosistemului local de tehnologie pe care aș dori să-l subliniez: oamenii de aici sunt remarcabil de deschiși și primitori. Ei nu se tem să-și împărtășească ideile și ipotezele, să vorbească despre provocările pe care încearcă să le rezolve și despre experimentele pe care le rulează. Ca rezultat, începeți să înțelegeți contextul real al pieței și încotro se îndreaptă industria mult mai rapid.

Între timp, când oamenii mă întreabă cum se diferențiază “Silicon Valley” european de cel american, răspunsul adesea îi surprinde. La Zurich, echilibrul dintre muncă și viață personală se simte mult mai puternic: sport dimineața, muncă concentrată pe parcursul zilei într-un ritm calm, dar productiv, și seri petrecute în munți cu familia sau pur și simplu relaxându-te. În San Francisco, există adesea senzația că trebuie să dovedești că lucrezi mai mult decât toată lumea. La Zurich, ritmul este diferit – mai durabil. Însă nivelul de ambiție tehnologică de aici nu este cu nimic mai scăzut.

Date mai bune înainte de roboți mai buni

Una dintre principalele concluzii ale acestei călătorii a fost o observație destul de simplă: multe persoane astăzi doresc să lucreze în robotica. Însă, în ciuda interesului enorm pentru industrie, multe echipe sunt încă într-o fază de explorare, încercând să înțeleagă care este rolul lor în noua undă a roboticii și a Physical AI, și ce contribuție pot aduce.

Multe conversații se converg în cele din urmă asupra aceluiași subiect: datele. Industria lipsește de date despre sarcinile de dexteritate, adică, abilitățile motorii fine. În această zonă, capacitățile roboților rămân extrem de limitate. Ceea ce oamenii fac cu mâinile lor aproape automat – ridicarea unui obiect, răsucirea lui, plasarea lui cu grijă undeva sau efectuarea unei mici manipulări – rămâne una dintre cele mai dificile sarcini pentru roboți.

Cheia progresului aici se află în principal în seturile de date mari, colectate corect. Astăzi, oamenii vorbesc adesea despre seturi de date egocentrice, înregistrate dintr-o perspectivă în primă persoană, unde sistemul capturează acțiunile umane ca și cum le-ar efectua el însuși. Însă, în practică, se dovedește că însăși conceptul de “set de date egocentric” poate însemna lucruri foarte diferite și ridică o serie de întrebări tehnice. Unde ar trebui plasată camera? Pe frunte, pe piept sau poate la nivelul ochilor? Care senzori ar trebui să însoțească înregistrarea video? Dacă capturăm mișcări ale mâinii, ar trebui operatorii să poarte mănuși speciale? Și, dacă da, ar trebui aceste mănuși să includă senzori tactili, giroscopuri sau alte sisteme de urmărire a mișcării?

O întrebare și mai complexă apare: cum să capturăm corect adâncimea mișcării. După cum este important să înțelegem nu doar poziția unei mâini într-un plan bidimensional, ci și cum se mișcă prin spațiu tridimensional – înainte, înapoi, în sus sau în jos.

Până acum, industria nu a ajuns la un răspuns unificat. De aceea, multe echipe astăzi experimentează cu diferite configurații de senzori, metode de înregistrare și formate de seturi de date.

Sisteme multimodale

Îndată ce conversația se îndreaptă spre colectarea de date pentru robotica, un alt subiect apare rapid – senzori suplimentari și multimodalitate, care permit capturarea mișcărilor corpului, acțiunilor mâinii și interacțiunilor obiectelor cu o precizie mai mare. Ei ajută, de asemenea, la reducerea erorilor în timpul colectării seturilor de date.

Când o persoană înregistrează acțiunile sale pe cameră, există întotdeauna riscul ca o parte a materialului să fie inutilizabilă. Camera poate să se miște ușor, unghiul de filmare poate fi incorect, operatorul poate să se întoarcă accidental în direcția greșită sau operatorul poate efectua o mișcare prea rapidă. Ca rezultat, o parte semnificativă a materialului înregistrat este eliminată. Un exemplu simplu: pentru a obține o oră de material video realmente util, un operator trebuie adesea să înregistreze aproximativ două ore de material brut.

Senzorii suplimentari ajută la compensarea unora dintre aceste probleme. Chiar dacă camera se mișcă ușor, datele senzorilor pot face posibilă reconstruirea mișcării mâinii sau a poziției corpului în spațiu. Ca rezultat, în loc de două ore de înregistrare, ar putea fi necesare aproximativ o oră și douăzeci de minute pentru a obține aceeași cantitate de date utile. Acest lucru crește semnificativ eficiența colectării seturilor de date și reduce costul creării lor.

Nu este o coincidență faptul că multe echipe observă, de asemenea, o creștere a interesului pentru anotarea multimodală a datelor. Acesta a devenit unul dintre trendurile mai vizibile direct legate de dezvoltarea roboticii și a inteligenței artificiale încorporate.

Următorul punct este etichetarea unor astfel de seturi de date. Am întâlnit întrebări similare la Keymakr atunci când am lucrat cu seturi de date ale clienților pentru cazuri de robotica: cum ar trebui să arate o astfel de anotare în practică? Ar trebui să fie scheletică? Bidimensională sau tridimensională? Ar trebui să incorporeze elemente de învățare prin întărire în pipeline? Există zeci de astfel de întrebări. Inginerii înșiși admit că nimeni nu poate spune încă cu certitudine care anume configurație de date va conduce în cele din urmă la un adevărat progres tehnologic.

Aceste preocupări sunt înțelese. Construirea unor seturi de date complexe este un proces scump. Fiecare greșeală în structura datelor poate costa mii sau chiar milioane de dolari. Este posibil să se colecteze “setul de date greșit” sau să se înregistreze în condiții care sunt greu de reprodus în lumea reală, subminând în cele din urmă întregul proiect. De aceea, astăzi, se acordă din ce în ce mai multă atenție atât modelelor însele, cât și calității și arhitecturii datelor pe care aceste modele sunt antrenate.

Ce fel de roboți are nevoie piața?

Roboții industriali clasici, care au funcționat pe linii de asamblare auto de decenii, necesită de fapt foarte puțină viziune computerizată sau modele complexe de inteligență artificială. Sarcina lor este extrem de specifică: să efectueze mișcări strict repetitive – stânga, dreapta, sus, jos – cu precizie și consistență ridicată. În această zonă, ei au depășit de mult oamenii.

O categorie complet diferită o reprezintă roboții umanoizi. Aceste sisteme necesită “creiere”: capacitatea de a naviga în spațiu, de a percepe mediul înconjurător, de a înțelege contextul unei situații și de a controla manipulatori nu prin traiectorii preprogramate, ci prin adaptarea la lumea reală.

Chiar și cu nivelul ridicat de automatizare de pe pardoselile fabricilor moderne, multe sarcini sunt încă efectuate de oameni. Mutarea unui obiect, ridicarea unei cutii, sortarea pieselor, fixarea unui component sau organizarea materialelor – acestea sunt acțiuni mici care necesită flexibilitate și coordonare. Această zonă rămâne una dintre cele mai dificile de automatizat, și este exact aici unde sistemele umanoide pot găsi rolul lor.

Multe dintre echipele cu care am vorbit folosesc un model de afaceri similar. Ei se apropie de o fabrică și propun rezolvarea unui anumit caz de producție. De exemplu, un lucrător poate petrece întreaga zi mutând cutii între zonele depozitului. Inginerii sugerează un experiment relativ simplu: echiparea lucrătorului cu o cameră și un set de senzori, înregistrarea a mii de ore de acțiuni și utilizarea acestor date pentru a antrena un model care va controla un robot umanoid. În acest fel, robotul învață să efectueze exact sarcinile efectuate de lucrătorul uman.

În esență, compania cumpără o platformă umanoidă, în timp ce echipa de dezvoltare construiește un model personalizat care replică comportamentul unui operator specific. Acesta nu este un tip de inteligență universală capabilă să rezolve orice sarcină. Mai degrabă, este un set de abilități antrenate pentru un anumit scenariu sau grup de sarcini de producție. Pentru mulți ingineri de astăzi, această abordare pare mult mai realistă. În loc de a încerca să creeze un robot universal imediat, echipele se concentrează asupra unor scenarii de automatizare înguste, dar viabile din punct de vedere economic.

Dimensiunea de afaceri

Dacă viitorul constă în modele personalizate, este important să înțelegem că, din punct de vedere economic, aceasta este o cale de dezvoltare relativ lungă.

Fiecare industrie este, în esență, o lume proprie. Fiecare mediu de producție are propriile sale procese, fluxuri de lucru și excepții. Un robot antrenat să funcționeze într-o fabrică auto nu poate fi transferat pur și simplu în producția de alimente sau logistică de depozit. În fiecare caz, sistemul trebuie reantrenat de la zero.

Acest lucru conduce la următoarea întrebare logică: cine vor fi primii clienți ai unei astfel de tehnologii?

În acest stadiu, principalii adoptatori sunt probabil să fie întreprinderi mari – cele cu bugete și pentru care automatizarea poate genera un impact economic semnificativ. Astăzi, un robot umanoid costă aproximativ 60.000-90.000 de dolari doar pentru hardware. Acesta este doar configurația de bază. Pe lângă aceasta, există costuri de întreținere, baterii, stații de încărcare, infrastructură și software.

Ca rezultat, companiile care sunt cel mai capabile să experimenteze cu astfel de sisteme sunt organizații mari, producători auto, corporații alimentare și întreprinderi industriale majore.

Desigur, sectoarele mai mici pot vedea, de asemenea, adoptatori timpurii. Unele companii pot cumpăra unul sau două roboți pentru sarcini specifice. Însă, în majoritatea cazurilor, aceste afaceri nu sunt încă pregătite să investească sute de mii de euro în colectarea și anotarea seturilor de date personalizate necesare pentru a antrena sisteme pentru scenarii operaționale foarte specifice. Pentru ele, forța de muncă umană rămâne încă opțiunea mai ieftină.

Jocul lung al inovației în robotica

Ajungem, în cele din urmă, la o întrebare economică fundamentală: ce este mai eficient – un om sau un robot? Dacă ne uităm la economia de astăzi, răspunsul este evident: forța de muncă umană este mai ieftină, se adaptează mai rapid la noile condiții și nu necesită infrastructură complexă.

Deci, de ce industria continuă să investească în robotica de astăzi? Răspunsul este, în mare măsură, strategic.

Multe companii înțeleg că o cursă pentru conducerea tehnologică este în desfășurare. Ei dezvoltă soluții, în ciuda costurilor ridicate, pentru a fi înainte când economia roboticii se va schimba.

Pe măsură ce electronica progresează, costurile componentelor scad, și eficiența calculului se îmbunătățește, robotica va deveni inevitabil mai accesibilă. Și când se va întâmpla acest lucru, avantajul va aparține companiilor care au deja construit modele, acumulat date și stabilit infrastructura tehnologică necesară.

Imaginați-vă, de exemplu, că apar regulamente noi care permit utilizarea pe scară largă a roboților umanoizi în producție. Sau că guvernele încep să subvenționeze robotizarea industriilor. Într-un astfel de scenariu, piața ar putea crește dramatic în doar câțiva ani. Și cei care s-au pregătit în avans, cei cu modele existente, cercetare, seturi de date și o stivă tehnologică pregătită, vor fi cei care vor beneficia cel mai mult.

De aceea, dezvoltarea continuă chiar și acum, în ciuda faptului că economia de afaceri poate nu arată încă ideal. Pentru multe companii, acesta este un investiție în viitor – în momentul în care tehnologiile devin mai accesibile, și cererea crește brusc.

Și în această cursă, ca și în multe revoluții tehnologice, un factor se dovedește adesea decisiv: cine a început mai devreme. În acest sens, robotica de astăzi seamănă puternic cu etapele inițiale ale inteligenței artificiale. Atunci, existau și mai multe întrebări decât răspunsuri. Însă au fost echipele care au început să lucreze cu date și infrastructură mai devreme decât altele cele care, în cele din urmă, au modelat direcția întregii industrii.

Michael Abramov este fondatorul și CEO-ul Introspector, aducând peste 15+ ani de experiență în inginerie software și sisteme de inteligență artificială de viziune computerizată pentru construirea de instrumente de etichetare de nivel întreprindere.

Michael și-a început cariera ca inginer software și manager de cercetare și dezvoltare, construind sisteme de date scalabile și gestionând echipe de ingineri cross-funcționale. Până în 2025, el a ocupat funcția de CEO al Keymakr, o companie de servicii de etichetare a datelor, unde a inovat fluxurile de lucru cu omul în buclă, sistemele avansate de control al calității și instrumentele personalizate pentru a sprijini nevoile de date de viziune computerizată și autonomie la scară largă.

El deține o diplomă de licență în științe computaționale și o pregătire în inginerie și arte creative, aducând o perspectivă multidisciplinară pentru rezolvarea problemelor dificile. Michael trăiește la intersecția inovației tehnologice, a conducerii strategice a produsului și a impactului în lumea reală, conducând înainte următoarea frontieră a sistemelor autonome și a automatizării inteligente.