Stummel Yashar Behzadi, der CEO von Synthesis AI – Interviewreihe – Unite.AI
Vernetzen Sie sich mit uns

Interviews

Yashar Behzadi, der CEO von Synthesis AI – Interview Series

mm

Veröffentlicht

 on

Yashar Behzadi PhD ist der CEO und Gründer von Synthese-KI. Er ist ein erfahrener Unternehmer, der transformative Unternehmen in den Märkten KI, Medizintechnik und IoT aufgebaut hat. Er hat die letzten 14 Jahre im Silicon Valley damit verbracht, datenorientierte Technologieunternehmen aufzubauen und zu skalieren. Yashar verfügt über mehr als 30 Patente und angemeldete Patente sowie einen Ph.D. von UCSD mit Schwerpunkt auf räumlich-zeitlicher Modellierung der funktionellen Bildgebung des Gehirns.

Synthese-KI ist ein Startup an der Schnittstelle von Deep Learning und CGI, das ein neues Paradigma für die Entwicklung von Computer-Vision-Modellen schafft. Sie ermöglichen es Kunden, bessere Modelle zu einem Bruchteil der Zeit und Kosten herkömmlicher, auf menschlichen Anmerkungen basierender Ansätze zu entwickeln.

Wie sind Sie ursprünglich zur Informatik und KI gekommen?

Ich habe einen Ph.D. erworben. Sein Studium an der UCSD im Jahr 2006 konzentrierte sich auf Computer Vision und räumliche und zeitliche Modellierung von Bilddaten des Gehirns. Anschließend arbeitete ich die nächsten 16 Jahre im Silicon Valley an der branchenübergreifenden Schnittstelle von Sensoren, Daten und maschinellem Lernen. Ich fühle mich sehr glücklich, die Gelegenheit zu haben, an einigen bemerkenswerten Technologien zu arbeiten, und ich habe über 30 erteilte oder angemeldete Patente mit den Schwerpunkten Signalverarbeitung, maschinelles Lernen und Datenwissenschaft.

Könnten Sie die Entstehungsgeschichte von Synthesis AI erzählen?

Bevor ich 2019 Synthesis AI gründete, leitete ich ein globales KI-Dienstleistungsunternehmen, das sich auf die Entwicklung von Computer-Vision-Modellen für führende Technologieunternehmen konzentrierte. Unabhängig von der Größe des Unternehmens stellte ich fest, dass wir durch die Qualität und Menge der gekennzeichneten Schulungsdaten äußerst eingeschränkt waren. Da Unternehmen geografisch expandierten, ihren Kundenstamm vergrößerten oder neue Modelle und neue Hardware entwickelten, waren neue Trainingsdaten erforderlich, um sicherzustellen, dass die Modelle angemessen funktionieren. Es wurde auch klar, dass die Zukunft des Computer Vision mit dem heutigen Human-in-the-Loop-Annotationsparadigma nicht erfolgreich sein würde. Neue Computer-Vision-Anwendungen in den Bereichen Autonomie, Robotik und AR/VR/Metaverse-Anwendungen erfordern einen umfangreichen Satz an 3D-Beschriftungen, Tiefeninformationen, Materialeigenschaften, detaillierter Segmentierung usw., die Menschen nicht beschriften können. Es war ein neues Paradigma erforderlich, um die notwendigen umfangreichen Etiketten zum Trainieren dieser neuen Modelle bereitzustellen. Zusätzlich zu den technischen Faktoren sahen wir eine zunehmende kritische Prüfung durch Verbraucher und Regulierungsbehörden in Bezug auf ethische Fragen im Zusammenhang mit Modellvoreingenommenheit und Verbraucherschutz.

Ich habe Synthesis AI mit der Absicht gegründet, das Computer-Vision-Paradigma zu transformieren. Die synthetische Datengenerierungsplattform des Unternehmens ermöglicht die On-Demand-Generierung fotorealistischer Bilddaten mit einem erweiterten Satz pixelgenauer 3D-Beschriftungen. Unsere Mission ist es, Pionierarbeit bei synthetischen Datentechnologien zu leisten, um die ethische Entwicklung leistungsfähigerer Modelle zu ermöglichen.

Könnten Sie für Leser, die mit diesem Begriff nicht vertraut sind, definieren, was synthetische Daten sind?

Synthetische Daten sind computergenerierte Daten, die als Alternative zu realen Daten dienen. Synthetische Daten werden in simulierten digitalen Welten erstellt und nicht in der realen Welt gesammelt oder gemessen. Synthesis AI kombiniert Tools aus der Welt der visuellen Effekte und CGI mit generativen KI-Modellen und ermöglicht es Unternehmen, bei Bedarf große Mengen fotorealistischer, vielfältiger Daten zu erstellen, um Computer-Vision-Modelle zu trainieren. Die Datengenerierungsplattform des Unternehmens reduzierte die Kosten und die Geschwindigkeit, um qualitativ hochwertige Bilddaten zu erhalten, um Größenordnungen und schützte gleichzeitig die Privatsphäre.

Könnten Sie besprechen, wie synthetische Daten generiert werden?

Ein synthetischer Datensatz wird künstlich und nicht anhand realer Daten erstellt. Technologien aus der Visual-Effects-Branche werden mit generativen neuronalen Netzen gekoppelt, um umfangreiche, vielfältige und fotorealistisch beschriftete Bilddaten zu erstellen. Synthetische Daten ermöglichen die Erstellung von Trainingsdaten zu einem Bruchteil der Kosten und des Zeitaufwands aktueller Ansätze.

Wie schafft die Nutzung synthetischer Daten einen Wettbewerbsvorteil?

Derzeit nutzen die meisten KI-Systeme „überwachtes Lernen“, bei dem Menschen Schlüsselattribute in Bildern kennzeichnen und dann KI-Algorithmen trainieren, um Bilder zu interpretieren. Dies ist ein ressourcen- und zeitintensiver Prozess und wird durch die genaue Kennzeichnung durch den Menschen begrenzt. Darüber hinaus haben die Bedenken hinsichtlich der demografischen Verzerrung der KI und der Privatsphäre der Verbraucher zugenommen, was es immer schwieriger macht, repräsentative menschliche Daten zu erhalten.

Unser Ansatz besteht darin, fotorealistische digitale Welten zu schaffen, die komplexe Bilddaten synthetisieren. Da wir die Daten generieren, wissen wir alles über die Szenen, einschließlich nie zuvor verfügbarer Informationen über die 3D-Position von Objekten und ihre komplexen Interaktionen untereinander und mit der Umgebung. Die Erfassung und Kennzeichnung dieser Datenmenge mit aktuellen Ansätzen würde Monate, wenn nicht Jahre dauern. Dieses neue Paradigma wird eine 100-fache Verbesserung der Effizienz und Kosten ermöglichen und eine neue Klasse leistungsfähigerer Modelle hervorbringen.

Da synthetische Daten künstlich generiert werden, werden viele Vorurteile und Datenschutzbedenken bei der herkömmlichen Erfassung von Datensätzen aus der realen Welt beseitigt.

Wie ermöglicht die On-Demand-Datengenerierung eine beschleunigte Skalierung?

Die Erfassung und Aufbereitung realer Daten für das Modelltraining ist ein langer und mühsamer Prozess. Der Einsatz der erforderlichen Hardware kann für komplizierte Computer-Vision-Systeme wie autonome Fahrzeuge, Robotik oder Satellitenbilder unerschwinglich teuer sein. Sobald die Daten erfasst sind, beschriften und kommentieren Menschen wesentliche Merkmale. Dieser Prozess ist fehleranfällig und der Mensch ist nur begrenzt in der Lage, wichtige Informationen wie die für viele Anwendungen erforderliche 3D-Position zu kennzeichnen.

Synthetische Daten sind um Größenordnungen schneller und kostengünstiger als herkömmliche, von Menschen kommentierte Echtdatenansätze und werden den Einsatz neuer und leistungsfähigerer Modelle in allen Branchen beschleunigen.

Wie ermöglichen synthetische Daten eine Reduzierung oder Vermeidung von KI-Bias?

KI-Systeme sind allgegenwärtig, können jedoch inhärente Vorurteile enthalten, die sich auf bestimmte Personengruppen auswirken können. Datensätze können bei bestimmten Datenklassen und entweder über- oder unterrepräsentierten Personengruppen unausgewogen sein. Der Aufbau menschenzentrierter Systeme kann häufig zu Vorurteilen hinsichtlich Geschlecht, ethnischer Zugehörigkeit und Alter führen. Im Gegensatz dazu sind designgenerierte Trainingsdaten angemessen ausbalanciert und weisen keine menschlichen Vorurteile auf.

Synthetische Daten könnten eine robuste Lösung zur Lösung des Bias-Problems der KI sein. Synthetische Daten werden teilweise oder vollständig künstlich generiert und nicht gemessen oder aus realen Ereignissen oder Phänomenen extrahiert. Wenn der Datensatz nicht vielfältig oder groß genug ist, können KI-generierte Daten die Lücken füllen und einen unvoreingenommenen Datensatz bilden. Der beste Teil? Die manuelle Erstellung dieser Datensätze kann für Teams mehrere Monate oder Jahre dauern. Bei der Entwicklung mit synthetischen Daten kann dies über Nacht erfolgen.

Welche weiteren potenziellen Anwendungsfälle für synthetische Daten gibt es außerhalb von Computer Vision?

Zusätzlich zu der Vielzahl von Computer-Vision-Anwendungsfällen im Zusammenhang mit Konsumgütern, Autonomie, Robotik, AR/VR/Metaverse und mehr werden synthetische Daten auch Auswirkungen auf andere Datenmodalitäten haben. Wir sehen bereits, dass Unternehmen synthetische Datenansätze für strukturierte Tabellendaten, Sprachverarbeitung und Verarbeitung natürlicher Sprache nutzen. Die zugrunde liegenden Technologien und Erzeugungspipelines unterscheiden sich für jede Modalität, und in naher Zukunft erwarten wir multimodale Systeme (z. B. Video + Sprache).

Gibt es noch etwas, das Sie über Synthesis AI mitteilen möchten?

Ende letzten Jahres haben wir veröffentlicht HumanAPI, eine bedeutende Erweiterung der synthetischen Datenfähigkeiten von Synthesis AI, die die programmatische Generierung von Millionen einzigartiger, hochwertiger digitaler 3D-Menschen ermöglicht. Diese Ankündigung erfolgt Monate nach der Einführung des synthetischen Data-as-a-Service-Produkts FaceAPI, das über 10 Millionen gekennzeichnete Gesichtsbilder für führende Smartphone-, Telefonkonferenz-, Automobil- und Technologieunternehmen geliefert hat. HumanAPI ist der nächste Schritt auf dem Weg des Unternehmens zur Unterstützung fortschrittlicher Computer-Vision-Anwendungen mit künstlicher Intelligenz (KI).

HumanAPI eröffnet unseren Kunden außerdem eine Vielzahl neuer Möglichkeiten, darunter intelligente KI-Assistenten, virtuelle Fitnesstrainer und natürlich die Welt der Metaverse-Anwendungen.

Durch die Schaffung eines digitalen Doppelgängers der realen Welt wird das Metaversum neue Anwendungen ermöglichen, die von neu konzipierten sozialen Netzwerken, Unterhaltungserlebnissen, Telefonkonferenzen, Spielen und mehr reichen. Computer-Vision-KI wird von grundlegender Bedeutung dafür sein, wie die reale Welt im digitalen Bereich mit hoher Wiedergabetreue erfasst und wiederhergestellt wird. Fotorealistische, ausdrucksstarke und verhaltensgenaue Menschen werden ein wesentlicher Bestandteil der Zukunft von Computer-Vision-Anwendungen sein. HumanAPI ist das erste Produkt, das es Unternehmen ermöglicht, bei Bedarf große Mengen perfekt gekennzeichneter Ganzkörperdaten zu erstellen, um leistungsfähigere KI-Modelle zu erstellen, einschließlich Posenschätzung, Emotionserkennung, Aktivitäts- und Verhaltenscharakterisierung, Gesichtsrekonstruktion und mehr.

Vielen Dank für das tolle Interview, Leser, die mehr erfahren möchten, sollten vorbeischauen Synthese-KI.

Ein Gründungspartner von unite.AI und Mitglied der Forbes Technology Council, Antoine ist ein Futurist der sich leidenschaftlich für die Zukunft von KI und Robotik interessiert.

Er ist auch der Gründer von Wertpapiere.io, eine Website, die sich auf Investitionen in bahnbrechende Technologien konzentriert.