Interviews
Yashar Behzadi, der CEO von Synthesis AI – Interviewreihe

Yashar Behzadi PhD ist der CEO und Gründer von Synthesis AI. Er ist ein erfahrener Unternehmer, der transformative Unternehmen in den Bereichen KI, Medizintechnik und IoT aufgebaut hat. Er hat die letzten 14 Jahre in Silicon Valley damit verbracht, datenzentrierte Technologieunternehmen aufzubauen und zu skalieren. Yashar hat über 30 Patente und anhängige Patente und einen PhD von der UCSD mit dem Schwerpunkt auf räumlich-zeitlicher Modellierung von funktioneller Hirnbildgebung.
Synthesis AI ist ein Startup im Bereich von Deep Learning und CGI, das ein neues Paradigma für die Entwicklung von Computer-Vision-Modellen schafft. Sie ermöglichen es Kunden, bessere Modelle in Bruchteilen der Zeit und Kosten herzustellen als herkömmliche Ansätze, die auf menschlicher Annotation basieren.
Wie sind Sie ursprünglich in die Informatik und KI eingestiegen?
Ich habe 2006 einen PhD von der UCSD erworben, der sich auf Computer-Vision und räumlich-zeitliche Modellierung von Hirnbildgebungsdaten konzentrierte. Anschließend arbeitete ich in Silicon Valley an der Schnittstelle von Sensoren, Daten und Machine Learning in verschiedenen Branchen für die nächsten 16 Jahre. Ich fühle mich sehr glücklich, dass ich die Gelegenheit hatte, an einigen bemerkenswerten Technologien zu arbeiten, und ich habe über 30 Patente, die erteilt oder eingereicht wurden, die sich auf Signalverarbeitung, Machine Learning und Data Science konzentrieren.
Können Sie die Genesis-Geschichte von Synthesis AI teilen?
Bevor ich Synthesis AI 2019 gründete, leitete ich ein globales KI-Dienstleistungsunternehmen, das sich auf die Entwicklung von Computer-Vision-Modellen für führende Technologieunternehmen konzentrierte. Egal, wie groß das Unternehmen war, stellte ich fest, dass wir durch die Qualität und Menge der gelabelten Trainingsdaten extrem eingeschränkt waren. Als Unternehmen sich geografisch ausdehnten, ihre Kundenbasis erweiterten oder neue Modelle und neue Hardware entwickelten, waren neue Trainingsdaten erforderlich, um sicherzustellen, dass die Modelle ausreichend funktionierten. Es wurde auch klar, dass die Zukunft von Computer-Vision nicht mit dem heutigen menschlichen Annotation-Paradigma erfolgreich sein würde. Neuere Computer-Vision-Anwendungen in Autonomie, Robotik und AR/VR/Metaverse-Anwendungen erfordern eine reiche Menge an 3D-Labels, Tiefeninformationen, Materialien, detaillierte Segmentierung usw., die Menschen nicht annotieren können. Ein neues Paradigma war erforderlich, um die notwendige reiche Menge an Labels zur Verfügung zu stellen, um diese neuen Modelle zu trainieren. Zusätzlich zu den technischen Treibern sahen wir eine zunehmende Verbraucher- und regulatorische Überwachung im Zusammenhang mit ethischen Fragen im Zusammenhang mit Modellbias und Verbraucherdatenschutz.
Ich gründete Synthesis AI mit dem Ziel, das Computer-Vision-Paradigma zu revolutionieren. Die synthetische Daten-Generierungsplattform des Unternehmens ermöglicht die On-Demand-Generierung von photorealistischen Bildaten mit einer erweiterten Menge an 3D-Pixel-Labels. Unsere Mission ist es, synthetische Daten-Technologien zu entwickeln, um die ethische Entwicklung von leistungsfähigeren Modellen zu ermöglichen.
Für Leser, die mit diesem Begriff nicht vertraut sind, können Sie bitte definieren, was synthetische Daten sind?
Synthetische Daten sind computer-generierte Daten, die als Alternative zu Echtzeit-Daten dienen. Synthetische Daten werden in simulierten digitalen Welten erstellt, anstatt in der realen Welt gesammelt oder gemessen zu werden. Durch die Kombination von Tools aus der Welt der visuellen Effekte und CGI mit generativen KI-Modellen ermöglicht Synthesis AI Unternehmen, große Mengen an photorealistischen, vielfältigen Daten auf Abruf zu erstellen, um Computer-Vision-Modelle zu trainieren. Die Daten-Generierungsplattform des Unternehmens reduzierte die Kosten und die Geschwindigkeit, um hochwertige Bildaten zu erhalten, um ein Vielfaches, während die Privatsphäre erhalten blieb.
Können Sie erläutern, wie synthetische Daten generiert werden?
Ein synthetischer Datensatz wird künstlich erstellt, anstatt durch Echtzeit-Daten. Technologien aus der visuellen Effektindustrie werden mit generativen neuronalen Netzen kombiniert, um große, vielfältige und photorealistische gelabelte Bildaten zu erstellen. Synthetische Daten ermöglichen es, Trainingsdaten zu erstellen, bei denen die Kosten und die Zeit im Vergleich zu herkömmlichen Ansätzen um ein Vielfaches reduziert werden.
Wie schafft die Nutzung von synthetischen Daten einen Wettbewerbsvorteil?
Derzeit nutzen die meisten KI-Systeme “überwachtes Lernen”, bei dem Menschen Schlüsselattribute in Bildern annotieren und dann KI-Algorithmen trainieren, um Bilder zu interpretieren. Dies ist ein ressourcen- und zeitaufwändiger Prozess und wird durch das begrenzt, was Menschen genau annotieren können. Zusätzlich haben Bedenken hinsichtlich KI-Demografische Verzerrung und Verbraucherdatenschutz es immer schwieriger gemacht, repräsentative menschliche Daten zu erhalten.
Unsere Herangehensweise besteht darin, photorealistische digitale Welten zu erstellen, die komplexe Bildaten synthetisieren. Da wir die Daten erstellen, wissen wir alles über die Szenen, einschließlich noch nie zuvor verfügbarer Informationen über die 3D-Lokalisierung von Objekten und ihre komplexen Interaktionen miteinander und der Umgebung. Das Erhalten und Annotieren dieser Menge an Daten mit herkömmlichen Ansätzen würde Monate, wenn nicht Jahre, dauern. Dieses neue Paradigma wird es ermöglichen, die Effizienz und Kosten um ein Vielfaches zu verbessern und eine neue Klasse von leistungsfähigeren Modellen zu ermöglichen.
Da synthetische Daten künstlich generiert werden, werden viele Verzerrungen und Datenschutzbedenken im Zusammenhang mit der traditionellen Datenerfassung aus der realen Welt eliminiert.
Wie ermöglicht die On-Demand-Datengenerierung eine beschleunigte Skalierung?
Das Erfassen und Vorbereiten von Echtzeit-Daten für die Modelltrainierung ist ein langwieriger und mühsamer Prozess. Die Bereitstellung der notwendigen Hardware kann für komplexe Computer-Vision-Systeme wie autonome Fahrzeuge, Robotik oder Satellitenbilder prohibitiv teuer sein. Sobald die Daten erfasst sind, annotieren und annotieren Menschen wichtige Funktionen. Dieser Prozess ist fehleranfällig, und Menschen sind in ihrer Fähigkeit, wichtige Informationen wie die 3D-Position zu annotieren, die für viele Anwendungen erforderlich ist, begrenzt.
Synthetische Daten sind um ein Vielfaches schneller und günstiger als herkömmliche Ansätze, die auf menschlicher Annotation basieren, und werden die Bereitstellung neuer und leistungsfähigerer Modelle in verschiedenen Branchen beschleunigen.
Wie ermöglichen synthetische Daten eine Reduzierung oder Vermeidung von KI-Verzerrungen?
KI-Systeme sind allgegenwärtig, können jedoch inhärente Verzerrungen enthalten, die bestimmte Gruppen von Menschen beeinträchtigen können. Datensätze können unbalanciert sein, wobei bestimmte Klassen von Daten über- oder unterrepräsentiert sind. Der Bau von menschenzentrierten Systemen kann oft zu Geschlechts-, Ethnie- und Altersverzerrungen führen. Im Gegensatz dazu ist design-generierte Trainingsdaten ordnungsgemäß ausgewogen und frei von menschlichen Verzerrungen.
Synthetische Daten könnten eine robuste Lösung für das Verzerrungsproblem von KI werden. Synthetische Daten werden teilweise oder vollständig künstlich generiert, anstatt gemessen oder extrahiert zu werden. Wenn der Datensatz nicht vielfältig oder groß genug ist, kann KI-generierte Daten die Lücken füllen und einen unvoreingenommenen Datensatz bilden. Das Beste daran? Die manuelle Erstellung dieser Datensätze kann Teams mehrere Monate oder Jahre dauern. Mit synthetischen Daten kann dies über Nacht erfolgen.
Außerhalb von Computer-Vision, welche anderen potenziellen Anwendungsfälle für synthetische Daten gibt es?
Neben den zahlreichen Computer-Vision-Anwendungsfällen im Zusammenhang mit Verbraucherprodukten, Autonomie, Robotik, AR/VR/Metaverse und mehr werden synthetische Daten auch andere Daten-Modi beeinflussen. Wir sehen bereits, dass Unternehmen synthetische Daten-Ansätze für strukturierte tabellarische Daten, Sprache und Sprachverarbeitung nutzen. Die zugrunde liegenden Technologien und Generierungs-Pipelines unterscheiden sich für jeden Modus, und in naher Zukunft erwarten wir, dass wir multi-modale Systeme (z. B. Video + Sprache) sehen werden.
Gibt es noch etwas, das Sie über Synthesis AI teilen möchten?
Letztes Jahr veröffentlichten wir HumanAPI, eine bedeutende Erweiterung der synthetischen Daten-Fähigkeiten von Synthesis AI, die die programmatische Generierung von Millionen einzigartiger, hochwertiger 3D-Digitalhumans ermöglicht. Diese Ankündigung erfolgte Monate nach dem Launch des FaceAPI-synthetischen Daten-als-Service-Produkts, das über 10 Millionen gelabelte Gesichtsbilder für führende Smartphone-, Telekonferenz-, Auto- und Technologie-Unternehmen geliefert hat. HumanAPI ist der nächste Schritt in der Reise des Unternehmens, um fortschrittliche Computer-Vision-KI-Anwendungen zu unterstützen.
HumanAPI ermöglicht auch eine Vielzahl neuer Möglichkeiten für unsere Kunden, einschließlich intelligenter KI-Assistenten, virtueller Fitness-Trainings und natürlich der Welt von Metaverse-Anwendungen.
Durch die Erstellung einer digitalen Kopie der realen Welt wird das Metaverse neue Anwendungen ermöglichen, darunter neu konzipierte soziale Netzwerke, Unterhaltungserlebnisse, Telekonferenzen, Spiele und mehr. Computer-Vision-KI wird grundlegend für die Art und Weise sein, wie die reale Welt in der digitalen Welt erfasst und mit hoher Fidelität rekonstruiert wird. Photorealistische, ausdrucksstarke und verhaltensgenaue Menschen werden ein wesentlicher Bestandteil der Zukunft von Computer-Vision-Anwendungen sein. HumanAPI ist das erste Produkt, das es Unternehmen ermöglicht, große Mengen an perfekt gelabelten Ganzkörper-Daten auf Abruf zu erstellen, um leistungsfähigere KI-Modelle zu bauen, einschließlich Pose-Erkennung, Emotions-Erkennung, Aktivitäts- und Verhaltens-Charakterisierung, Gesichts-Rekonstruktion und mehr.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Synthesis AI besuchen.












