Connect with us

Andersons Blickwinkel

Mit KI einen Blockbuster-Film vorhersagen

mm
ChatGPT-4o and Adobe Firefly

Obwohl die Film- und Fernsehbranche oft als kreative und offene Industrie angesehen wird, ist sie seit langem risikoscheu. Hohe Produktionskosten (die möglicherweise demnächst den Vorteil günstigerer Auslandsdrehorte verlieren, zumindest für US-Projekte) und eine fragmentierte Produktionslandschaft machen es unabhängigen Unternehmen schwer, einen erheblichen Verlust zu absorbieren.

Deshalb hat die Branche in den letzten zehn Jahren ein wachsendes Interesse daran, ob maschinelles Lernen Trends oder Muster in der Reaktion des Publikums auf vorgeschlagene Film- und Fernsehprojekte erkennen kann.

Die wichtigsten Datenquellen bleiben das Nielsen-System (das Skalierbarkeit bietet, obwohl seine Wurzeln in TV und Werbung liegen) und stichprobenbasierte Methoden wie Fokusgruppen, die Skalierbarkeit gegenüber kuratierten Demografien eintauschen. Zu dieser Kategorie gehören auch Bewertungen von kostenlosen Filmvorschauen – jedoch ist zu diesem Zeitpunkt der größte Teil des Produktionsbudgets bereits ausgegeben.

Die “Großer Hit”-Theorie/Theorien

Zunächst nutzten ML-Systeme traditionelle Analysemethode wie lineare Regression, K-Nearest-Neighbors, Stochastic-Gradient-Abstieg, Entscheidungsbaum und Wälder sowie Neuronale Netze, normalerweise in verschiedenen Kombinationen, die eher an die vor-KI-statistische Analyse erinnern, wie z. B. eine 2019-Initiative der University of Central Florida, erfolgreiche TV-Shows vorherzusagen, basierend auf Kombinationen von Schauspielern und Autoren (unter anderem Faktoren):

Eine 2018-Studie bewertete die Leistung von Episoden basierend auf Kombinationen von Charakteren und/oder Autoren (die meisten Episoden wurden von mehr als einer Person geschrieben). Quelle: https://arxiv.org/pdf/1910.12589

Eine 2018-Studie bewertete die Leistung von Episoden basierend auf Kombinationen von Charakteren und/oder Autoren (die meisten Episoden wurden von mehr als einer Person geschrieben). Quelle: https://arxiv.org/pdf/1910.12589

Die relevantesten verwandten Arbeiten, zumindest die, die im Feld eingesetzt werden (obwohl oft kritisiert), sind im Bereich der Empfehlungssysteme:

Eine typische Video-Empfehlungspipeline. Videos im Katalog werden mit Funktionen indiziert, die manuell annotiert oder automatisch extrahiert werden können. Empfehlungen werden in zwei Stufen generiert, indem zunächst Kandidaten-Videos ausgewählt und dann nach einem Benutzerprofil, das aus den Anzeigevorlieben abgeleitet wird, gerankt werden. Quelle: https://www.frontiersin.org/journals/big-data/articles/10.3389/fdata.2023.1281614/full

Eine typische Video-Empfehlungspipeline. Videos im Katalog werden mit Funktionen indiziert, die manuell annotiert oder automatisch extrahiert werden können. Empfehlungen werden in zwei Stufen generiert, indem zunächst Kandidaten-Videos ausgewählt und dann nach einem Benutzerprofil, das aus den Anzeigevorlieben abgeleitet wird, gerankt werden. Quelle: https://www.frontiersin.org/journals/big-data/articles/10.3389/fdata.2023.1281614/full

Jedoch analysieren diese Ansätze Projekte, die bereits erfolgreich sind. Im Falle von prospektiven neuen Sendungen oder Filmen ist es nicht klar, was für eine Art von Grundwahrheit am besten anwendbar wäre – nicht zuletzt, weil Änderungen im öffentlichen Geschmack, kombiniert mit Verbesserungen und Erweiterungen der Datenquellen, bedeuteten, dass in der Regel keine konsistenten Daten über mehrere Jahrzehnte verfügbar sind.

Dies ist ein Beispiel für das Kaltstart-Problem, bei dem Empfehlungssysteme Kandidaten ohne vorherige Interaktionsdaten bewerten müssen. In solchen Fällen bricht die traditionelle kollaborative Filterung zusammen, da sie auf Mustern im Benutzerverhalten (wie Ansehen, Bewerten oder Teilen) angewiesen ist, um Vorhersagen zu generieren. Das Problem ist, dass im Falle der meisten neuen Filme oder Sendungen noch nicht genug Zuschauerfeedback vorhanden ist, um diese Methoden zu unterstützen.

Comcast prognostiziert

Ein neues Papier von Comcast Technology AI, in Zusammenarbeit mit der George Washington University, schlägt eine Lösung für dieses Problem vor, indem es ein Sprachmodell mit strukturierten Metadaten über unveröffentlichte Filme auffordert.

Die Eingaben umfassen Cast, Genre, Zusammenfassung, Inhaltsbewertung, Stimmung und Auszeichnungen, wobei das Modell eine gerankte Liste der wahrscheinlichen zukünftigen Hits zurückgibt.

Die Autoren verwenden die Ausgabe des Modells als Ersatz für das Interesse des Publikums, wenn keine Interaktionsdaten verfügbar sind, in der Hoffnung, eine frühe Voreingenommenheit gegenüber Titeln zu vermeiden, die bereits gut bekannt sind.

Das sehr kurze (drei-seitige) Papier, betitelt Blockbuster-Filme vorhersagen, bevor sie passieren, mit LLMs, stammt von sechs Forschern von Comcast Technology AI und einem von GWU und besagt:

‘Unsere Ergebnisse zeigen, dass LLMs, wenn sie Film-Metadaten verwenden, die Baselines deutlich übertreffen können. Dieser Ansatz könnte als unterstützendes System für mehrere Anwendungsfälle dienen, um die automatische Bewertung großer Mengen an neuem Inhalt zu ermöglichen, der täglich und wöchentlich veröffentlicht wird.

‘Indem sie frühzeitige Einblicke liefern, bevor Redaktionsteams oder Algorithmen ausreichend Interaktionsdaten gesammelt haben, können LLMs den Inhalt-Überprüfungsprozess rationalisieren.

‘Mit kontinuierlichen Verbesserungen der LLM-Effizienz und dem Aufstieg von Empfehlungsagenten sind die Erkenntnisse aus dieser Arbeit wertvoll und anpassbar an eine breite Palette von Bereichen.’

Wenn der Ansatz robust ist, könnte er die Abhängigkeit der Branche von retrospektiven Metriken und stark beworbenen Titeln verringern, indem er eine skalierbare Möglichkeit einführt, vielversprechenden Inhalt vor der Veröffentlichung zu identifizieren. Somit könnten Redaktionsteams anstelle von Benutzerverhalten, das die Nachfrage signalisiert, frühzeitige, metadatengetriebene Vorhersagen des Publikumsinteresses erhalten, was möglicherweise die Exposition über eine breitere Palette von Neuveröffentlichungen verteilen könnte.

Methode und Daten

Autor über maschinelles Lernen, Domänen-Spezialist in der menschlichen Bildsynthese. Ehemaliger Leiter der Forschungsinhalte bei Metaphysic.ai.