Connect with us

Sohaib Khan, Co-Founder & CEO von Hazen.ai – Interview-Serie

Interviews

Sohaib Khan, Co-Founder & CEO von Hazen.ai – Interview-Serie

mm

Sohaib Khan ist der Co-Founder & CEO von Hazen.ai, einem Unternehmen, das Computer-Vision und Deep Learning verwendet, um intelligente Verkehrsanalyse-Software zu entwickeln, die das Verhalten jedes Fahrzeugs “verstehen” soll.

Was hat Sie ursprünglich zum Bereich KI hingezogen?

Das war während meines Bachelor-Studiums, als ich zum ersten Mal über Stereo-Vision (oder binokulare Vision – Schätzung von Tiefen aus zwei Kameras) las. Das hat mich dazu gebracht, Computer-Vision genauer zu erforschen. Interessanterweise las ich darüber zum ersten Mal in einem Buch, das ich auf einem traditionellen Freitagmarkt gekauft hatte, wo alte gebrauchte Bücher auf einer Straßenseite in unserer Heimatstadt verkauft wurden. Ich ging dann zum PhD in diesem Bereich in den USA.

Sie waren vorher Professor an einer der größten Universitäten in Pakistan, der Lahore University of Management Sciences (LUMS). Was waren Ihre Lehr- und Forschungsinteressen?

Als ich nach meinem PhD an die LUMS kam, baute ich das erste Graduate-Forschungslabor an der Universität auf, das durch eine große Förderung von einer Verteidigungsorganisation finanziert wurde. Das Graduate-Programm in Informatik war sehr neu, und es gab keine Forschungslabore zu dieser Zeit. Ich unterrichtete Computer-Vision über 12 Jahre an der LUMS und hatte ein aktives Labor in diesem Bereich. Am Anfang wurde Computer-Vision kaum an pakistanischen Universitäten unterrichtet, aber später wurde es zu einem Standardfach, und tatsächlich unterrichten viele meiner Studenten jetzt auch an pakistanischen Universitäten.

Können Sie darüber sprechen, was Sie dazu inspiriert hat, ein Startup zu gründen, das sich auf Computer-Vision und Deep-Learning-Algorithmen für Video-Analytics spezialisiert?

Computer-Vision war lange Zeit ein experimentelles Forschungsgebiet mit begrenzten Anwendungen in Produkten. Dies lag hauptsächlich daran, dass die Reife der Algorithmen, die für die Entwicklung von Produkten benötigt wurden, nicht vorhanden war. Für ein Produkt muss der Bildverständigungs-Algorithmus in verschiedenen Bild- und Beleuchtungsbedingungen funktionieren und nicht nur in kontrollierten Experimenten. Wir hatten einen Witz unter den Graduate-Studenten in unserem Labor, als ich meinen PhD um 2000 herum machte, dass wenn man drei Bilder findet, auf denen der Algorithmus funktioniert, man einen Artikel schreiben kann. Wenn es auf drei Videos funktioniert, bekommt man einen sehr guten Artikel! Der Punkt ist, dass viele Bildverständigungs-Algorithmen nur in sorgfältig kuratierten Labor-Szenarien funktionierten und nicht sehr robust waren.

Aber jetzt haben sich die Dinge geändert. Mit dem Aufkommen von Deep Learning im Jahr 2012 haben wir sehr schnelle und faszinierende Fortschritte im Bildverständnis gesehen. Als wir das sahen, fühlten wir, dass jetzt der richtige Zeitpunkt ist, um vielleicht solide Produkte zu entwickeln, die einen signifikanten Einfluss haben können.

Welche Art von Verkehrsverstößen kann Hazen.ai überwachen?

Unser Ziel ist es, alle Arten von gefährlichem Fahrverhalten auf den Straßen zu identifizieren. Dies wird von unserem übergeordneten Ziel getrieben, die Zahl der Verkehrstoten zu reduzieren. Jede 24 Sekunden stirbt jemand bei einem Verkehrsunfall, was etwa 15 787-8 Dreamlinern entspricht, die jeden Tag abstürzen! Also ist das wirklich, was uns motiviert. Deshalb entwickeln wir Software, die verschiedene Arten von gefährlichem und unsicheren Verhaltensweisen erkennen kann, wie unsichere Spurwechsel, illegale Abbiegevorgänge, Rotlicht- oder Stop-Schild-Übertretungen, Blockieren von Fußgängerüberwegen, Nicht-Tragen von Sicherheitsgurten oder Texten-während-des-Fahrens. Wir arbeiten auch daran, Funktionen in unserer Software speziell für die Sicherheit von Fußgängern und Radfahrern zu entwickeln, da mehr als die Hälfte der Todesfälle bei Verkehrsunfällen in der verletzlichen Gruppe der Fußgänger, Radfahrer und Motorradfahrer auftreten.

Was sind einige der einzigartigen Herausforderungen beim Einsatz von Computer-Vision, um Objekte zu überwachen, die mit so hoher Geschwindigkeit bewegt werden?

Es gibt zwei Arten von Herausforderungen: Erstens ist es die Leistung der Computer-Vision-Algorithmen selbst – man will ein Produkt, das in anspruchsvollen Verkehrsbedingungen 24/7 in allen Beleuchtungsvarianten funktionieren kann. Während es in dieser Hinsicht große Fortschritte gegeben hat, gibt es immer noch Länder, in denen die Dichte der Verkehrsteilnehmer so hoch ist, wie z.B. Gruppen von Motorrädern oder Fußgängern in sehr enger Nähe, dass es für Algorithmen immer noch eine Herausforderung ist, sie individuell zu verfolgen und die Szene zu verstehen. Aber zweitens ist eine größere Herausforderung, ein solides Produkt aus Computer-Vision-Algorithmen zu entwickeln, das auf begrenzten Hardware-Ressourcen am Rand deployt werden kann und leicht überwacht und verwaltet werden kann, obwohl es über die ganze Stadt verteilt ist. Da Computer-Vision-Produkte eine Menge Video-Daten verarbeiten, bleibt die Deployment auf dem Rand als IoT-Gerät und die effektive Verwaltung eine schwierige Aufgabe.

Was ist der Prozess für den Endbenutzer, um die Software für verschiedene Straßenkonfigurationen zu konfigurieren?

Jede Kreuzung bietet ein einzigartiges Szenario, in Bezug auf Verkehrsvolumen, Spurkonfiguration und Art der Fahrzeug-, Radfahrer- oder Fußgänger-Interaktionen. Darüber hinaus können die Interessen der Verkehrsmanager spezifisch sein, um eine bestimmte Art von Verkehrsverhalten an jedem Standort zu identifizieren. Zum Beispiel kann die Verkehrspolizei ein U-Turn an einer Kreuzung verbieten, um den Verkehrsfluss zu glätten, und ist an der Erfassung dieser Statistik interessiert. Deshalb haben wir unsere Software so konfiguriert, dass sie auf verschiedene Szenarien eingestellt werden kann. Wenn eine Kamera mit unserer Software eingerichtet wird, konfigurieren wir sie durch einen einfachen Prozess für das, was der Endbenutzer an diesem Standort benötigt. Intern haben wir eine Hochsprache entwickelt, in der wir Verkehrsszenarien von Interesse auf einfache Weise kompakt beschreiben können. Dies ermöglicht es uns, einen Standort schnell für unsere Kunden zu konfigurieren.

Welche Art von Hardware ist erforderlich, um dieses System zu betreiben?

Video-Analytics erfordert erhebliche Rechenleistung. Wir haben unseren Code optimiert, um auf den kleineren Nvidia-GPUs zu laufen, die am Rand deployt werden können, wie ihre Jetson-Serie, und auch auf Intel-CPUs für bestimmte Funktionen, die wir anbieten. In den letzten Jahren wird leistungsfähigere Edge-Hardware zu einem vernünftigen Preis angeboten, was viele aufregende Anwendungen antreibt.

Können Sie darüber sprechen, ob einige Gerichtsbarkeiten derzeit Hazen.ai-Technologie testen oder verwenden?

Wir haben derzeit laufende Tests in mehreren Ländern, UK, USA, Ägypten, Saudi-Arabien, Pakistan, Oman, Peru und sind mit potenziellen Kunden in anderen Ländern im Gespräch.

Gibt es noch etwas, das Sie über Hazen.ai teilen möchten?

Insgesamt fühlen wir, dass Verkehrssicherheitstechnologien nicht genug fortgeschritten sind, im Vergleich zum Umfang des Problems. Aber jetzt ist der richtige Zeitpunkt, weil des massiven Fortschritts in Computer-Vision und Deep Learning sowie der günstigen Verfügbarkeit von Kameras und Rechenhardware. Wir werden in den kommenden Jahren viele weitere Anwendungen von Edge-basiertem Computer-Vision sehen. Diese sind die Grundlagen, die Hazen.ai antreiben.

Vielen Dank für das Interview. Leser, die mehr erfahren möchten, sollten Hazen.ai besuchen.

Antoine ist ein visionärer Führer und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv für die Gesellschaft sein wird wie Elektrizität, und wird oft dabei ertappt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.