Vernetzen Sie sich mit uns

Interviews

Sohaib Khan, Mitbegründer und CEO von Hazen.ai – Interviewreihe

mm

Sohaib Khan ist Mitbegründer und CEO von Hazen.ai, ein Unternehmen, das Computer Vision und Deep Learning nutzt, um intelligente Verkehrsanalysesoftware zu entwickeln, die darauf ausgelegt ist, die Bewegung jedes Fahrzeugs zu „verstehen“.

Was hat Sie ursprünglich an der KI interessiert?

Während des Studiums habe ich zum ersten Mal darüber gelesen, wie Stereosehen (oder binokulares Sehen – die Tiefenschätzung mit zwei Kameras) funktioniert. Das hat mich dazu gebracht, mich mehr mit Computer Vision zu befassen. Interessanterweise habe ich zum ersten Mal davon in einem Buch gelesen, das ich auf einem traditionellen Freitagsmarkt mitgenommen habe, wo auf einem Bürgersteig in unserer Heimatstadt alte gebrauchte Bücher verkauft wurden. Anschließend habe ich in den USA auf diesem Gebiet promoviert.

Zuvor waren Sie Professor an einer der größten Universitäten Pakistans, der Lahore University of Management Sciences (LUMS). Was waren Ihre Lehr- und Forschungsinteressen?

Als ich nach meiner Promotion zu LUMS kam, baute ich mit Mitteln, die ich aus einem großen Zuschuss einer Verteidigungsorganisation erhielt, das erste Graduiertenforschungslabor der Universität auf. Das Graduiertenprogramm in CS war sehr neu und es gab zu dieser Zeit noch keine Forschungslabore. Ich habe mehr als 12 Jahre lang Computer Vision an der LUMS unterrichtet und hatte ein aktives Labor in diesem Bereich. Anfangs wurde Computer Vision kaum an einer pakistanischen Universität gelehrt, später wurde es jedoch zum Standardfach, und tatsächlich lehren viele meiner Studenten mittlerweile auch an pakistanischen Universitäten.

Können Sie erläutern, was Sie dazu inspiriert hat, ein Startup zu gründen, das sich auf Computer Vision und Deep-Learning-Algorithmen für Videoanalysen spezialisiert hat?

Computer Vision war lange Zeit weitgehend ein experimentelles Forschungsgebiet mit begrenzten Anwendungen in Produkten. Dies lag vor allem daran, dass die für die Produktentwicklung erforderlichen Algorithmen noch nicht ausgereift waren. Für ein Produkt muss der Bildverständnisalgorithmus unter verschiedenen Bild- und Lichtbedingungen funktionieren und nicht nur in einigen sehr kontrollierten Experimenten. Als ich im Jahr 2000 meine Doktorarbeit schrieb, witzelten wir unter den Doktoranden in unserem Labor: Wenn man drei Bilder findet, auf denen der Algorithmus funktioniert, kann man eine Arbeit schreiben. Wenn es bei drei Videos klappt, erhält man eine sehr gute Arbeit! Der Punkt ist, dass viele Vision-Algorithmen nur in sorgfältig kuratierten Laborszenarien funktionierten und nicht sehr robust waren.

Aber jetzt haben sich die Dinge geändert. Mit dem Aufkommen von Deep Learning im Jahr 2012 haben wir einige sehr schnelle und faszinierende Fortschritte beim Bildverständnis erlebt. Als wir das sahen, dachten wir, dass jetzt der richtige Zeitpunkt ist, vielleicht solide Produkte zu entwickeln, die eine erhebliche Wirkung haben können.

Welche Art von Verkehrsverstößen kann Hazen.ai überwachen?

Unser Ziel ist es, alle Arten gefährlichen Fahrverhaltens im Straßenverkehr erkennen zu können. Dies geschieht im Rahmen unseres übergeordneten Ziels, die Zahl der Verkehrstoten zu reduzieren. Alle 24 Sekunden kommt jemand bei einem Verkehrsunfall ums Leben, das entspricht etwa dem Unfall von 15 787-8 Dreamlinern pro Tag! Das ist es also, was uns wirklich motiviert. Aus diesem Grund entwickeln wir Software, die verschiedene Arten gefährlicher und unsicherer Verhaltensweisen erkennen kann, wie unsichere Spurwechsel, illegales Abbiegen, Überfahren einer roten Ampel oder eines Stoppschilds, Blockieren eines Fußgängerüberwegs, Nichtanlegen des Sicherheitsgurts oder SMS-Schreiben -während des Fahrens. Wir arbeiten auch daran, in unsere Software Funktionen speziell für die Sicherheit von Fußgängern und Radfahrern einzubauen, da mehr als die Hälfte der Todesopfer bei Verkehrsunfällen auf die gefährdete Verkehrsteilnehmergruppe der Fußgänger, Radfahrer und Motorradfahrer zurückzuführen ist.

Was sind einige der besonderen Herausforderungen beim Einsatz von Computer Vision zur Überwachung von Objekten, die sich mit solch hohen Geschwindigkeiten bewegen?

Es gibt zwei Arten von Herausforderungen: Erstens geht es um die Leistung der Computer-Vision-Algorithmen selbst – Sie möchten ein Produkt haben, das unter schwierigen Verkehrsbedingungen rund um die Uhr und bei allen Beleuchtungsvarianten funktionieren kann. Obwohl es technisch gesehen große Fortschritte auf dem Weg zu diesem Ziel gegeben hat, gibt es immer noch Länder, in denen die Dichte der Verkehrsteilnehmer so hoch ist, wie z. B. Gruppen von Motorrädern oder Fußgängern in unmittelbarer Nähe, dass es für Algorithmen immer noch schwierig ist, dies zu erreichen Verfolgen Sie sie einzeln und verstehen Sie die Szene. Aber zweitens besteht eine größere Herausforderung darin, aus Computer-Vision-Algorithmen ein solides Produkt zu machen, das auf begrenzten Hardware-Ressourcen am Rande eingesetzt werden kann und trotz der Verteilung über die ganze Stadt einfach überwacht und verwaltet werden kann. Da Computer-Vision-Produkte viele Videodaten verarbeiten, bleibt es eine schwierige Aufgabe, sie am Rande als IoT-Gerät bereitzustellen und effektiv zu verwalten.

Wie muss der Endbenutzer die Software für verschiedene Straßenkonfigurationen konfigurieren?

Jede Kreuzung bietet ein einzigartiges Szenario in Bezug auf Verkehrsaufkommen, Fahrspurkonfiguration und Fahrzeugtyp sowie Interaktionen zwischen Radfahrern und Fußgängern. Darüber hinaus könnte das Interesse von Verkehrsmanagern spezifisch sein, eine bestimmte Art von Verkehrsverhalten an jedem Standort zu identifizieren. Beispielsweise könnte die Verkehrspolizei das Wenden an einer Kreuzung verbieten, um den Verkehrsfluss zu glätten, und ist an der Erfassung dieser Statistik interessiert. Aus diesem Grund haben wir unsere Software für verschiedene Szenarien konfigurierbar gehalten. Wenn eine Kamera mit unserer Software eingerichtet wird, konfigurieren wir sie in einem einfachen Prozess entsprechend den Anforderungen des Endbenutzers an diesem Standort. Intern haben wir eine Hochsprache aufgebaut, in der wir interessante Verkehrsszenarien auf einfache Weise kompakt beschreiben können. Dadurch können wir schnell eine Site für unsere Kunden konfigurieren.

Welche Art von Hardware ist für den Betrieb dieses Systems erforderlich?

Videoanalysen erfordern erhebliche Rechenleistung. Wir haben unseren Code für die Ausführung auf kleineren Nvidia-GPUs optimiert, die am Edge eingesetzt werden können, wie etwa der Jetson-Serie, und für bestimmte von uns angebotene Funktionen auch auf Intel-CPUs. In den letzten Jahren ist leistungsstärkere Edge-Hardware zu einem vernünftigen Preis verfügbar geworden, was wirklich viele spannende Anwendungen vorantreibt.

Können Sie besprechen, ob es derzeit Gerichtsbarkeiten gibt, die die Hazen.ai-Technologie testen oder nutzen?

Wir haben derzeit laufende Versuche in mehreren Ländern, Großbritannien, den USA, Ägypten, Saudi-Arabien, Pakistan, Oman und Peru, und engagieren uns auch bei potenziellen Kunden in anderen Ländern.

Gibt es noch etwas, das Sie über Hazen.ai mitteilen möchten? 

Insgesamt sind wir der Meinung, dass die Verkehrssicherheitstechnologien angesichts des Ausmaßes des Problems nicht weit genug fortgeschritten sind. Aufgrund der enormen Fortschritte in den Bereichen Computer Vision und Deep Learning sowie der günstigen Verfügbarkeit von Kamera- und Computerhardware ist jetzt jedoch der richtige Zeitpunkt gekommen. Wir werden in den kommenden Jahren viele weitere Anwendungen von Edge-basierter Computer Vision sehen. Dies sind die Grundlagen, die Hazen.ai antreiben.

Vielen Dank für das Interview, Leser, die mehr erfahren möchten, sollten vorbeischauen Hazen.ai

Antoine ist ein visionärer Leiter und Gründungspartner von Unite.AI, angetrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Als Serienunternehmer glaubt er, dass KI für die Gesellschaft ebenso umwälzend sein wird wie Elektrizität, und schwärmt oft vom Potenzial disruptiver Technologien und AGI.

Als Futuristwidmet er sich der Erforschung, wie diese Innovationen unsere Welt prägen werden. Darüber hinaus ist er der Gründer von Wertpapiere.io, eine Plattform, deren Schwerpunkt auf Investitionen in Spitzentechnologien liegt, die die Zukunft neu definieren und ganze Branchen umgestalten.