Vernetzen Sie sich mit uns

Interviews

Maisa Benatti, CEO von AIUTA – Interviewreihe

mm

Maísa Benatti Die CEO von AIUTA ist eine visionäre Führungskraft im Bereich Fashion-Tech und generativer KI. Seit Dezember 2024 leitet sie von London aus die Mission des Unternehmens, digitale Modeerlebnisse zu revolutionieren. In ihrer Rolle als CEO konzentriert sie sich auf die Entwicklung skalierbarer KI-Lösungen, die Marken dabei unterstützen, hochwertige visuelle Inhalte zu erstellen, die Customer Journey zu optimieren und Wachstumschancen zu erschließen. Dabei greift sie auf ihre umfassende Expertise in Produktdesign, UX-Forschung und KI zurück, die sie in ihrer vorherigen Position als Chief Product Officer bei AIUTA sowie in leitenden Produktpositionen bei Unternehmen wie FARFETCH und Amazon erworben hat. Ihr Hintergrund umfasst generative KI für Personalisierung und Produktempfehlungen, große Sprachmodelle und Innovationen im E-Commerce. Sie treibt kontinuierlich KI-Anwendungen voran, die das Mode-Shopping intuitiver und ansprechender gestalten.

AIUTA ist eine modulare KI-Innovationsplattform, die die Online-Kundenansprache von Modemarken und -händlern revolutioniert. Sie integriert fortschrittliche Technologien wie virtuelles Anprobieren, personalisiertes Styling und KI-gestützte Content-Erstellung direkt in digitale Shops. Die Lösungen des Unternehmens ermöglichen immersive, interaktive Einkaufserlebnisse, die die Conversion-Rate steigern und Retouren reduzieren. Kundinnen und Kunden können Kleidung in Echtzeit an sich selbst visualisieren, während Marken dank proprietärer KI-Modelle, die für realistische Darstellungen, körperschonende virtuelle Passformen und eine nahtlose Katalogintegration sorgen, professionelle Visualisierungen und Outfit-Empfehlungen skalieren können.

Ihre Karriere begann im Modedesign und in der Trendforschung, bevor Sie bei Farfetch und Amazon Fashion in kundenorientierte Positionen und im Produktmanagement wechselten. Wie haben diese frühen Erfahrungen in der Modebranche Ihre Sichtweise darauf geprägt, wo KI im Handel den größten Einfluss ausüben kann?

Ich bin nicht in die Modebranche gekommen, weil ich schöne Dinge entwerfen wollte – ich bin hineingekommen, weil ich neugierig war, wie die Branche tatsächlich funktioniert. Schon früh interessierten mich Fragen wie: Wie lässt sich das skalieren? Warum ist das so teuer? Warum geht es kaputt, sobald es beim Kunden ankommt?

Als ich bei Farfetch und später bei Amazon Fashion in den Kunden- und Produktbereich wechselte, wurde aus dieser Neugier etwas sehr Konkretes. Mir wurde bewusst, wie sehr das Online-Shopping-Erlebnis von visuellen Darstellungen abhängt und wie wenig diese tatsächlich darüber aussagen, wie ein Kleidungsstück sitzt oder sich am Körper anfühlt.

Hier begann KI für mich wirklich Bedeutung zu bekommen – nicht als kreative Spielerei, sondern als Möglichkeit, die Kluft zwischen Markenversprechen und tatsächlicher Kundenzufriedenheit zu schließen. Wenn KI dazu beitragen könnte, Kleidung authentischer und in größerem Umfang darzustellen, könnte das das Vertrauen stärken, Abfall reduzieren und den Handel für alle Beteiligten effizienter gestalten.

Künstliche Intelligenz in der Modebranche ist oft von einem Hype umgeben. Was sind die größten Missverständnisse von Marken hinsichtlich des Einsatzes von Computer Vision und generativer KI im Einzelhandel, und wo scheitern die meisten Initiativen?

Der größte Irrtum ist die Annahme, dass etwas, das in einer Demo beeindruckend aussieht, auch produktionsreif ist. In Wirklichkeit sind das zwei völlig verschiedene Dinge.

Die Modebranche ist voller Sonderfälle: unterschiedliche Körpertypen, Stoffe, Schnitte und Markenstandards. Viele KI-Tools sind nicht darauf ausgelegt, diese Komplexität zuverlässig zu bewältigen. Sie generieren möglicherweise etwas, das einmal gut aussieht, aber bei der Anwendung auf einen gesamten Katalog völlig unbrauchbar wird.

Ein weiteres Problem besteht darin, dass Mode oft als rein visuelles Problem behandelt wird. Das ist sie nicht. Kleidung ist ein physisches Objekt, und wenn ein System nicht versteht, wie sich Kleidungsstücke in der Realität verhalten, mag das Ergebnis zwar ansprechend aussehen, ist aber nicht vertrauenswürdig. Die Auswirkungen dieser Diskrepanz sind erheblich: Rund 40 % der Online-Modebestellungen werden zurückgeschickt, was sowohl den Gewinn der Händler als auch die Umwelt belastet. Wenn visuelle Darstellungen Passform oder Aussehen falsch wiedergeben, steigt die Unsicherheit, und genau hier scheitern KI-Initiativen meist.

Viele Einzelhändler nennen Unsicherheiten bezüglich Passform und Aussehen als Hauptgrund für Retouren. Was genau ist Ihrer Erfahrung nach im Bereich Größe und Passform bei Farfetch und Amazon nötig, damit KI Retouren messbar reduziert?

Bei der Reduzierung von Retouren geht es nicht darum, eine Funktion hinzuzufügen, sondern darum, das Vertrauen im Moment des Kaufs zu stärken.

Größe und Passform haben je nach Region unterschiedliche Bedeutungen. Passformerwartungen sind kulturell geprägt. Was in einem Markt als „perfekte Passform“ gilt, kann in einem anderen zu eng oder zu weit sein. Künstliche Intelligenz kann diese Muster erkennen und Empfehlungen basierend auf regionalem Verhalten und individuellen Präferenzen personalisieren, nicht nur auf Messwerten.

Auch in der Modefotografie gibt es ein strukturelles Problem. Die meisten Produkte werden an einem einzigen Konfektionsmodell fotografiert, das oft im Studio so zurechtgezupft wird, dass es vorteilhafter wirkt. Das weckt unrealistische Erwartungen. Ideal wäre es, jedes Kleidungsstück an verschiedenen Körpertypen zu fotografieren, aber für die meisten Unternehmen ist das betrieblich zu aufwendig und zu teuer.

Hier entfaltet KI ihre transformative Kraft. Sie ermöglicht es Marken, in großem Umfang und mit realistischer Darstellung zu zeigen, wie sich Kleidungsstücke an unterschiedlichen Körpertypen und Hauttönen verhalten.

Realismus ist entscheidend. Wenn die Kunden das Angebot im gesamten Katalog als wahrheitsgetreu und einheitlich empfinden, steigt das Vertrauen. Steigendes Vertrauen führt zu weniger Retouren.

Virtuelle Anproben können für sich genommen beeindruckend wirken, doch die Skalierung auf Tausende von Artikeln stellt eine ganz andere Herausforderung dar. Welche technischen oder betrieblichen Hürden ergeben sich bei einem so großen Produktkatalog, und wie hat AIUTA diese bewältigt?

Bei größeren Projekten wird schnell klar, dass eine gute Demo nicht ausreicht. Meine Erfahrung mit virtuellen Anprobe- und Passformprojekten bei Farfetch und Amazon zeigt, dass die größten Herausforderungen nicht nur die Genauigkeit betrafen, sondern auch Kosten, Geschwindigkeit und operative Komplexität. Systeme, die in Pilotprojekten funktionierten, erwiesen sich bei der Einführung im realen Produktkatalog als zu teuer, zu langsam oder zu manuell.

Die Latenz spielt dabei eine große Rolle. Dauert das Laden einer virtuellen Anprobe zu lange, nutzen Kunden sie schlichtweg nicht, egal wie präzise sie ist. Deshalb war die Performance von Anfang an ein zentrales Designkriterium für uns. Heute lädt die virtuelle Anprobe von AIUTA im Produktionsbetrieb in etwa 4 bis 7 Sekunden – deutlich schneller als die meisten anderen Lösungen auf dem Markt.

Die operative Komplexität ist ebenso wichtig. Viele Lösungen erfordern aufwändige Vorbereitung, detaillierte Eingaben oder fortlaufende manuelle Arbeit von den Markenteams. AIUTA hingegen ist so konzipiert, dass es mit sehr einfachen Eingaben arbeitet und den Aufwand für Einzelhändler minimiert, ohne dabei die Genauigkeit der Kleidungsstücke zu beeinträchtigen. Dadurch können wir die Generierung von Hunderten von Bildern pro Woche auf Tausende von Bildern pro Tag steigern und Marken so ermöglichen, virtuelle Anproben für große Kataloge zu skalieren, ohne zusätzlichen operativen Aufwand zu verursachen.

Und schließlich die Konsistenz. Viele Systeme verzerren Stoffe oder Proportionen bei der Skalierung. Durch die Kontrolle des gesamten Prozesses – von der Erfassung und Annotation der Kleidungsstücke bis hin zum Modelltraining und der Bereitstellung – können wir die Identität und den Realismus der Kleidungsstücke in dem Umfang erhalten, in dem große Einzelhändler tatsächlich arbeiten.

AIUTA kombiniert Computer-Vision-Pipelines mit generativen Modellen. Wie lässt sich Realismus und Genauigkeit bei der Kleidungsstückdarstellung gewährleisten und gleichzeitig eine ausreichend schnelle Ergebnisbereitstellung für unternehmensweite Workflows gewährleisten?

Wir gehen sehr bewusst vor, worauf wir optimieren. Geschwindigkeit ist wichtig, aber Genauigkeit hat oberste Priorität.

Unsere Systeme sind speziell auf Modedaten trainiert, und dieser Unterschied ist wichtig. Wir greifen nicht auf Standard-E-Commerce-Datensätze zurück, die immer wieder dieselben schmalen Körpertypen abbilden – typischerweise große, schlanke Models. Stattdessen besitzen und haben wir einen äußerst vielfältigen Datensatz synthetisch erstellt, der auf realistischen menschlichen Darstellungen mit unterschiedlichen Körperformen, Proportionen und Kleidungskonstruktionen basiert.

Da die Modelle auf dieser Vielfalt trainiert werden, verstehen sie Dinge wie Stoffstruktur, Fall und Konstruktion wesentlich realistischer. Dadurch müssen wir die Ergebnisse nicht nachträglich korrigieren. Realismus ist von Anfang an im System integriert.

Auch im Bereich der Infrastruktur haben wir massiv in die Leistungsfähigkeit investiert. Das Ergebnis: Marken können innerhalb von Sekunden, nicht Minuten, hochwertige Ergebnisse generieren. Dadurch ist die Technologie nicht nur für Experimente, sondern auch für reale Produktionsumgebungen einsetzbar.

Was sind die größten Herausforderungen für Unternehmen bei der Integration von KI-Tools in bestehende Kreativ-, Merchandising- und Content-Produktions-Workflows?

Die meisten Unternehmen verfügen bereits über komplexe Systeme und Prozesse. Die größte Herausforderung besteht darin, dass viele KI-Tools als eigenständige Produkte und nicht als Teil eines umfassenderen Workflows entwickelt wurden.

Damit KI tatsächlich Akzeptanz findet, muss sie sich technisch und operativ reibungslos integrieren lassen. Das bedeutet APIs, Einhaltung von Sicherheitsstandards, vorhersehbare Qualität und klare Verantwortlichkeiten im Fehlerfall.

Auch Vertrauen spielt eine Rolle. Marken sind verständlicherweise vorsichtig, wenn es darum geht, generative Systeme an ihre wichtigsten visuellen Elemente heranzulassen. Deshalb sind Zuverlässigkeit und Qualitätskontrolle genauso wichtig wie Innovation.

Sie haben KI- und Personalisierungsinitiativen in großen Marktplätzen geleitet. Worin unterscheidet sich die Entwicklung von KI innerhalb einer großen Plattform vom Aufbau eines Deep-Tech-Unternehmens, das sich ausschließlich auf KI-Infrastruktur für die Modebranche konzentriert?

Innerhalb einer großen Plattform ist KI nur eines von vielen beweglichen Teilen. Oftmals optimiert man innerhalb bestehender Beschränkungen und wägt konkurrierende Prioritäten ab.

Der Aufbau von AIUTA gestaltet sich ganz anders, da sich das gesamte Unternehmen auf ein einziges Problem konzentriert: Modevisualisierung. Diese Fokussierung ermöglicht es uns, technisch und kreativ tiefer in die Materie einzutauchen und schneller zu reagieren, wenn wir in der Produktion einen Fehler feststellen.

Es ermöglicht uns außerdem, langfristige Infrastruktur anstatt kurzfristiger Funktionen aufzubauen. Wir lösen nicht nur die heutigen Anwendungsfälle, sondern entwickeln Systeme, die sich mit der Technologie weiterentwickeln können.

Wie lässt sich Personalisierung mit Datenschutz in Einklang bringen, wenn man mit Größenangaben, Körperdarstellungen und Signalen zum Kaufverhalten arbeitet?

Datenschutz muss von Anfang an in das System integriert sein. Man kann ihn nicht nachträglich hinzufügen.

Bei AIUTA konzentrieren wir uns auf eine bessere Repräsentation, anstatt mehr personenbezogene Daten zu sammeln. Indem wir Kleidung und Körpervielfalt in ihrer Gesamtheit besser verstehen, können wir relevantere Erlebnisse bieten, ohne auf sensible personenbezogene Daten angewiesen zu sein.

Dieses Gleichgewicht ist entscheidend – insbesondere in der Modebranche, wo Vertrauen eine so große Rolle bei Kaufentscheidungen spielt.

KI-generierte Bilder werfen Bedenken hinsichtlich der Verschönerung von Körpern oder der falschen Darstellung von Kleidung auf. Wie lässt sich Authentizität und Markenintegrität gewährleisten, wenn generative Systeme in großem Umfang eingesetzt werden?

Das ist etwas, worüber wir ständig nachdenken, und für mich ist es auch zu einer sehr persönlichen Angelegenheit geworden.

Während meiner Schwangerschaft wurde mir viel bewusster, wie eingeschränkt die meisten KI-Systeme sind, wenn es darum geht, Körper darzustellen, die von engen Normen abweichen. Schwangerschaft ist zwar vorübergehend, aber ein sehr realer körperlicher Zustand, und dennoch fehlt sie oft völlig in den Trainingsdaten. Ich konnte selbst erleben, wie leicht KI versagt, wenn sich Körper auch nur geringfügig von dem unterscheiden, was das System als „Standard“ betrachtet.

Viele generative Systeme sind darauf ausgelegt, Dinge „besser“ aussehen zu lassen, was für viele fälschlicherweise glatter, schlanker oder idealisierter bedeuten kann. Doch in der Mode zerstört dieser Ansatz schnell das Vertrauen. Wird der Körper verschönert oder das Kleidungsstück subtil verändert, erhalten Kundinnen und Kunden am Ende ein Produkt, das nicht dem entspricht, was ihnen gezeigt wurde.

Bei AIUTA legen wir bewusst Wert auf Realismus. Unser Ziel ist es, Kleidung an echten Körpern zu präsentieren, auch an solchen, die nicht den gängigen Branchenstandards entsprechen – sei es aufgrund unterschiedlicher Größen, Proportionen oder komplexerer anatomischer Gegebenheiten wie Schwangerschaftsverläufe. Wir kombinieren KI mit menschlicher Qualitätskontrolle, um Sonderfälle zu erkennen und sicherzustellen, dass jedes Produkt den Markenstandards entspricht.

Authentizität ist für uns nicht nur ein Wert, sondern unerlässlich für die langfristige Akzeptanz. Wenn Kunden und Marken dem Gesehenen nicht vertrauen, wird die Technologie schlichtweg nicht funktionieren.

Mit Blick auf die Zukunft: Wie wird generative KI Ihrer Meinung nach das gesamte Modeökosystem umgestalten, einschließlich digitaler Zwillinge, Monetarisierungsmodelle und die Zukunft der kreativen Produktion?

Ich glaube, wir bewegen uns auf eine Welt zu, in der visuelle Elemente keine statischen Objekte mehr sind, sondern lebendige Systeme.

Digitale Zwillinge, sowohl für Kleidungsstücke als auch für Models, werden deutlich häufiger eingesetzt. Das eröffnet neue Monetarisierungsmodelle und ermöglicht es, kreative Arbeit in bisher ungekannter Weise zu skalieren.

Generell wird die kreative Produktion schneller, flexibler und reaktionsschneller werden. Letztendlich werden diejenigen Marken erfolgreich sein, die KI gezielt einsetzen und sie als Infrastruktur implementieren, die Genauigkeit, Kreativität und Vertrauen fördert.

Vielen Dank für das tolle Interview, Leser, die mehr erfahren möchten, sollten vorbeischauen AIUTA.

Antoine ist ein visionärer Leiter und Gründungspartner von Unite.AI, angetrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Als Serienunternehmer glaubt er, dass KI für die Gesellschaft ebenso umwälzend sein wird wie Elektrizität, und schwärmt oft vom Potenzial disruptiver Technologien und AGI.

Als Futuristwidmet er sich der Erforschung, wie diese Innovationen unsere Welt prägen werden. Darüber hinaus ist er der Gründer von Wertpapiere.io, eine Plattform, deren Schwerpunkt auf Investitionen in Spitzentechnologien liegt, die die Zukunft neu definieren und ganze Branchen umgestalten.