Interviuri

Sohaib Khan, Co-Fondator & CEO al Hazen.ai – Seria de Interviuri

Published August 24, 2020

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Sohaib Khan, este Co-Fondator & CEO al Hazen.ai, o companie care utilizează viziunea computerizată și învățarea profundă pentru a proiecta software de analitică de trafic inteligent care este proiectat pentru a „înțelege” mișcarea fiecărui vehicul.

Ce v-a atras inițial în domeniul inteligenței artificiale?

A fost în timpul studiilor universitare că am citit pentru prima dată despre modul în care funcționează viziunea stereo (sau viziunea binoculară – estimarea adâncimii din două camere). Acest lucru m-a făcut să fiu interesat de explorarea viziunii computerizate mai mult. În mod interesant, am citit despre acest lucru într-o carte pe care am cumpărat-o de la un târg tradițional de vineri, unde se vindeau cărți vechi second-hand pe o stradă laterală din orașul nostru natal. Am continuat să fac un doctorat în acest domeniu din Statele Unite.

Ați fost anterior profesor la una dintre cele mai mari universități din Pakistan, The Lahore University of Management Sciences (LUMS). Care au fost interesele dvs. de predare și cercetare?

Când am intrat la LUMS după doctorat, am creat primul laborator de cercetare pentru studenții din ciclul superior din universitate, cu fonduri pe care le-am primit de la o organizație de apărare. Programul de studii superioare în informatică era foarte nou, și nu existau laboratoare de cercetare la acea vreme. Am predat Viziunea Computerizată timp de 12+ ani la LUMS și am avut un laborator activ în acest domeniu. La început, viziunea computerizată era predată foarte puțin la universitățile din Pakistan, dar mai târziu a devenit o materie standard, și de fapt, mulți dintre studenții mei predau acum la universitățile din Pakistan.

Puteți discuta ce v-a inspirat să lansați o companie care se specializează în viziunea computerizată și algoritmi de învățare profundă pentru analiza video?

Viziunea computerizată, timp de mulți ani, a fost în mare parte un domeniu de cercetare experimentală, cu aplicații limitate în produse. Acest lucru se datorează în principal faptului că maturitatea algoritmilor necesari pentru construirea de produse nu a fost atinsă. Pentru un produs, algoritmul de înțelegere a imaginii trebuie să funcționeze într-o varietate de condiții de imagine și iluminare, și nu doar în câteva experimente controlate. Aveam o glumă printre studenții noștri din laboratorul de doctorat, când făceam doctoratul în 2000, că dacă puteți găsi trei imagini pe care algoritmul dvs. funcționează, puteți scrie un articol. Dacă funcționează pe trei videoclipuri, obțineți un articol foarte bun! Punctul este că mulți algoritmi de viziune funcționau doar în scenarii de laborator atent curate, și nu erau foarte robusti.

Dar acum lucrurile s-au schimbat. Cu apariția învățării profunde în 2012, am văzut progrese rapide și fascinante în înțelegerea imaginilor. Când am văzut acest lucru, am simțit că acum este momentul potrivit pentru a construi produse solide care pot avea un impact semnificativ.

Ce tipuri de încălcări ale regulamentului de circulație poate monitoriza Hazen.ai?

Scopul nostru este de a putea identifica toate tipurile de comportamente periculoase la volan pe drumuri. Acest lucru este determinat de obiectivul nostru general de a reduce accidentele rutiere. Fiecare 24 de secunde, cineva moare într-un accident de circulație, ceea ce este echivalent cu aproximativ 15 avioane 787-8 care se prăbușesc în fiecare zi! Așadar, acesta este motivul care ne motivează. De aceea, construim software care poate detecta diferite tipuri de comportamente periculoase și nesigure, cum ar fi schimbarea ilegală a benzilor, viraje ilegale, trecerea pe semaforul roșu sau oprirea la semafor, blocarea trecerii pietonilor, nepurtarea centurii de siguranță sau conducerea sub influența alcoolului. De asemenea, lucrăm pentru a construi funcții în software-ul nostru, în special pentru siguranța pietonilor și a cicliștilor, deoarece mai mult de jumătate din decesele în accidente rutiere se produc în segmentul de utilizatori vulnerabili ai drumurilor, pietoni, cicliști și motocicliști.

Ce sunt unele dintre provocările unice din spatele utilizării viziunii computerizate pentru a monitoriza obiectele care se deplasează la astfel de viteze ridicate?

Există două tipuri de provocări: prima este performanța algoritmilor de viziune computerizată înșiși – doriți să aveți un produs care poate funcționa în condiții de trafic dificile 24/7 în toate variațiile de iluminare. Deși a existat mult progres tehnic în acest sens, există încă țări în care densitatea utilizatorilor drumurilor este atât de mare, cum ar fi grupuri de motocicliști sau pietoni în proximitate foarte strânsă, astfel încât este încă o provocare pentru algoritmi să urmărească individual și să înțeleagă scena. Dar, în al doilea rând, o provocare și mai mare este crearea unui produs solid din algoritmi de viziune computerizată, care poate fi implementat pe resurse hardware limitate la margine și poate fi monitorizat și gestionat ușor, în ciuda faptului că este distribuit în toată orașul. Deoarece produsele de viziune computerizată manipulează o cantitate mare de date video, implementarea acestora la margine, ca dispozitiv IoT, și gestionarea lor eficientă, rămâne o sarcină dificilă.

Care este procesul pentru utilizatorul final de a configura software-ul pentru diferite configurații de drum?

Fiecare intersecție oferă un scenariu unic, în ceea ce privește volumul de trafic, configurația benzilor și tipul de vehicul, cicliști sau interacțiuni pietonale. Mai mult, interesul managerilor de trafic poate fi specific, pentru a identifica un anumit tip de comportament de trafic la fiecare sit. De exemplu, poliția rutieră poate interzice virajul la stânga la o intersecție pentru a fluidiza traficul și este interesată să capteze această statistică. De aceea, am păstrat software-ul nostru configurabil pentru diferite scenarii. Când o cameră este configurată cu software-ul nostru, o configurăm printr-un proces simplu pentru ceea ce utilizatorul final necesită la acel sit. Intern, am construit un limbaj de nivel înalt în care putem descrie compact scenarii de trafic de interes într-un mod simplu. Acest lucru ne permite să configurăm rapid un sit pentru clienții noștri.

Ce tip de hardware este necesar pentru a opera acest sistem?

Analiza video necesită o putere de calcul semnificativă. Am optimizat codul nostru pentru a rula pe GPU-urile Nvidia mai mici, care pot fi implementate la margine, cum ar fi seria Jetson, și de asemenea pe procesoarele Intel pentru anumite funcții pe care le oferim. În ultimii ani, s-a făcut disponibil hardware de margine mai puternic la un punct de preț rezonabil, ceea ce conduce la multe aplicații interesante.

Puteți discuta dacă vreo jurisdicție utilizează în prezent sau testează tehnologia Hazen.ai?

Acum avem teste în desfășurare în mai multe țări, Regatul Unit, Statele Unite, Egipt, Arabia Saudită, Pakistan, Oman, Peru și suntem implicați cu clienți potențiali din alte țări.

Există altceva pe care ați dori să îl împărtășiți despre Hazen.ai?

În general, simțim că tehnologiile de siguranță a traficului nu au progresat suficient, comparativ cu amploarea problemei. Cu toate acestea, acum este momentul potrivit, datorită progresului masiv în viziunea computerizată și învățarea profundă, precum și a disponibilității ieftine a camerelor și hardware-ului de calcul. Vom vedea multe aplicații ale viziunii computerizate bazate pe margine în anii următori. Acestea sunt fundamentul care conduce Hazen.ai.

Mulțumim pentru interviu, cititorii care doresc să afle mai multe ar trebui să viziteze Hazen.ai

Antoine Tardif, CEO & Founder of Unite.AI

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.

Unite.AI

Sohaib Khan, Co-Fondator & CEO al Hazen.ai – Seria de Interviuri

You may like