Andersons Blickwinkel
Eine persönliche Sicht auf die Literaturtrends zum Thema Computer Vision im Jahr 2025

Ethische Offenlegungen und Gaussian Splatting nehmen ab, während die schiere Menge an eingereichten Arbeiten ein neues Problem darstellt, mit dem sich die KI im Jahr 2026 auseinandersetzen muss.
Meinung Seit etwa sieben Jahren verfolge ich die Forschung im Bereich Computer Vision und Bildsynthese auf arXiv und verwandten Plattformen – lange genug, um wiederkehrende Muster und Trendverschiebungen zu erkennen. Diese Beobachtungen sind jedoch anekdotisch. Ich wünschte ehrlich, ich hätte die Zeit, die riesigen, stetig wachsenden Datenmengen allein des arXiv-Publikationsstroms, die sicherlich reich an verborgenen Erkenntnissen sind, mithilfe von maschinellem Lernen zu analysieren. So kann ich nur beiläufig berichten, was mir aufgefallen ist. seit ich mich das letzte Mal mit der Angelegenheit befasst habe.
Lautstärke bei 11
Viele der Trends bei den eingereichten KI-Forschungsarbeiten, die ich 2024 beobachtet habe, haben sich 2025 als fest etabliert; nicht zuletzt der unaufhaltsame und anhaltende Anstieg von Volumen von KI-bezogenen Veröffentlichungen, die ihrerseits von KI angetrieben werden, bis hin zu dem Punkt eine wahrgenommene Krise:

Monatliche Einreichungen im Bereich Informatik auf Arxiv, Oktober 2023 bis November 2025, mit ĂĽberlagertem gleitenden 3-Monats-Durchschnitt. Quelle
Dieses Wachstumstempo wurde als exponentielle Verdopplung des Volumens der eingereichten wissenschaftlichen Arbeiten zum Thema KI charakterisiert. vor einigen Jahrenund diese Entwicklung hat sich durch das jüngste Aufkommen von KI-Investitionswahn hat sowohl die Anforderungen als auch die verfügbaren Fördermittel für KI-bezogene Forschung erhöht.
Die vollständigen Statistiken für 2025 liegen noch nicht vor, die oben dargestellten aggregierten Statistiken zeigen jedoch den allgemeinen Anstieg in allen Kategorien. Im Folgenden ist ersichtlich, dass die Informatik weiterhin einen dominanten Trend aufweist und deutlich vor ihren verwandten Bereichen liegt:

Anstieg der Informatik-Einreichungen zwischen 2022 und 2025. Quelle
Die Spreu vom Weizen trennen
Im Oktober, dem Beginn der Herbstkonferenzsaison, die normalerweise eine Flut neuer Forschungsergebnisse mit sich bringt, brachte stattdessen Folgendes mit sich: Anzahl der Einsendungen auf dem Niveau eines DOS-Angriffswodurch dem bisher wenig beachteten Forschungszweig zusätzlicher Schwung und Dringlichkeit verliehen wird Analyse von ForschungstrendsMit anderen Worten: Es erscheinen immer mehr Artikel und Datenbanken, die ihrerseits versuchen, das sich verschlechternde Signal-Rausch-Verhältnis in der Forschungslandschaft zu durchbrechen.
Das jüngste Beispiel kam erst letzte Woche, in Form von Neuheitsrangherunter, eine Krepppapier und GitHub-Repository die LLMs wie z.B. feinabstimmen Qwen3-4B-Instruct-2507 und SciBERT damit sie eine binäre Klassifizierung der eingereichten Arbeiten durchführen können (Vorhersage des Neuheitsgrades anhand früherer Einreichungen) oder alternativ einen paarweisen Neuheitsvergleich (Vergleich der aktuellen Einreichungen auf Neuheitsgrad):

Das NoveltyRank-System vergleicht Titel und Abstract einer Einreichung mit ähnlichen früheren Arbeiten, fasst die Unterschiede mithilfe eines LLM zusammen und übergibt diese an ein feinabgestimmtes Qwen3-4B-Modell, das entscheidet, ob die Arbeit als „konzeptionell neu“ gilt. Quelle
Das Problem bei solchen „Sieb“-Ansätzen ist die Herausforderung der Definition sinnvoller VariablenDer NoveltyRank-Ansatz verwendet die Annahme eines Papers zu einer Konferenz als Neuheitsindex und – vielleicht etwas abwertend – die Veröffentlichung auf Arxiv als Hintergrundindex. Negativ Neuheit.
Dies setzt zwei falsche Annahmen voraus: erstens, dass alle für eine Konferenz angenommenen Beiträge neuartig oder von Bedeutung seien, was offenkundig nicht der Fall ist; und zweitens, dass Neuheit an sich einen uneingeschränkten Wert besitze. Jeder, der eine halbe Stunde mit einigen der fadenscheinigen, ja sogar lächerlichen Beiträge verschwendet hat – vielleicht nur, um diese Annahme aufrechtzuerhalten –, wird feststellen, dass… „Veröffentlichen-oder-untergehen“-QuotenSie werden wissen, dass Neuheiten oft trivial sind, schrittweise Verbesserungen hingegen oft von großer Bedeutung.
Das Verständnis des Wertes einer neuen Veröffentlichung betrifft einen Bereich, in dem KI derzeit noch eine wichtige Rolle spielt. sehr schwach – langfristig KontextAufgrund der oft irreführenden Art und Weise, wie sie verfasst werden, können Arbeiten, die bahnbrechend erscheinen, sehr oft als geringfügige Fortschritte gegenüber bestehenden Arbeiten entlarvt werden; automatisierte Systeme müssen jedoch eine „Intuition“ für solche Fälle entwickeln, ohne dabei zahlreiche Fehlalarme auszulösen und ohne sich auf die Ehrlichkeit der einreichenden Autoren zu verlassen.
Ethischer Sprung
Da ich vorher beobachtetPortale wie Arxiv sind recht resistent gegenĂĽber Laissez-faire Beim Web-Scraping und den dabei gewonnenen Datenmengen mangelt es oft an detaillierten Informationen.
Selbst wenn ich also über die Ressourcen und die Zeit verfügen würde, Merkmale aus einem ausreichend repräsentativen Querschnitt von Informatik-Veröffentlichungen herunterzuladen und zu extrahieren, wären viele der subtileren Trends nicht erfasst oder analysiert worden.
Eines davon ist das Vorhandensein oder Fehlen von ethische Erklärungen (Zusätze); langes an obligatorische Einbeziehung Bei den Biowissenschaften, die sich mit Tierversuchen befassen, erreichte der Trend zur ethischen Charakterisierung der vorgeschlagenen Arbeit im Jahr 2024 seinen Höhepunkt, und zwar am Ende der eingereichten Arbeiten in der Kategorie Informatik.
Anekdotisch betrachtet, habe ich den Eindruck, dass diese Praxis im Laufe des Jahres 2025 stark zurückgegangen ist. Ich vermute, dass die vehementen Deregulierungsbemühungen der aktuellen US-Regierung im Bereich der KI-Entwicklung der Forschungsgemeinschaft sowohl in den USA als auch im Ausland eine gewisse größere Handlungsfreiheit und ein Gefühl des impliziten Schutzes vor rechtlichen Konsequenzen verschafft haben.
Ungeachtet dessen Unterstützung Was die Regulierung von Deepfakes angeht, hat die derzeitige US-Regierung im Wesentlichen die „Wildwest“-Haltung wiederhergestellt, die die Ära 2021-23 kennzeichnete – obwohl sich der Kontext rein wissenschaftlicher Forschung, der sie definierte, seither zu einem leidenschaftlichen, ja sogar historischen Investitionsniveau entwickelt hat.
Generative Video-Veröffentlichungen als „KI-Schrott“
Mit der Einführung des Hunyuan Video und WAN Generative Videoserien aus dem letzten Winter haben gezeigt, dass KI-Videos bis 2025 eine völlig neue Dimension erreicht haben. Alte Hindernisse wie die Schwierigkeit bei der Erstellung von Avataren mit vollständigem Körperbau, Oder von überzeugende Profilansichten erhalten Eine Person wurde offenbar über Nacht fortgespült.
Die zahlreichen, mit Gewichten versehenen Veröffentlichungen dieser Art aus China haben, wohlSie gaben in diesem Jahr den Ton für generative Videoveröffentlichungen an und üben zumindest einen Gegendruck auf die Tendenz westlicher KI-Videoarchitekturen aus, weitaus stärker zensiert, vorkommerziell ausgerichtet und vorgeschrieben zu sein.
Die Fehlen eines Burggrabens In dieser ironischerweise demokratischen, von der UdSSR dominierten Szene haben Hunderte, wenn nicht Tausende von Unternehmen versucht, den entstehenden Markt für Datenanalysen durch benutzerfreundliche Portale zu erschließen, wobei die Akteure so unterschiedlich sind wie civit.ai und RunPod Sie profitieren von Verfahren und Technologien, die in vielen Fällen auch auf Heimcomputern ausgeführt werden könnten.
Im Allgemeinen handelt es sich bei diesen Initiativen um kurzfristige Gewinnmaximierungsversuche, die davon ausgehen, durch eine spätere Marktkonsolidierung verdrängt zu werden (wobei ihre Gründer zweifellos nichts dagegen hätten, zufällig auf einen dominanten Marktanteil zu stoßen, sollte dies eintreten).
Dieselbe Banalität und Wiederholung hat auch den Bereich der generativen Videos in den Arxiv-Einreichungen von 2025 erfasst. Wie ich beobachtet letzte WocheDas Signal-Rausch-Verhältnis in dieser Kategorie hat einen erschreckenden Höhepunkt erreicht, da Forscher öffentlich um die enormen Mengen an potenziellen Fördermitteln konkurrieren, die die diesjährigen Durchbrüche zweifellos freigesetzt haben.
Allerdings stellen die meisten Einreichungen dieser Art bestenfalls nur geringfügige Fortschritte dar. Die Kernprobleme der generativen KI traten dieses Jahr kaum in den Vordergrund: die Notwendigkeit, Identität wahren, LoRA-Stil, während der gesamten Charakterdarstellung; der Bedarf an längeren Laufzeiten für Ausgabevideos, wobei die allgemeine Konsistenz (d. h. von Umgebungen und Themen usw., nicht nur der ID) beibehalten werden muss; und für eine verbesserte Audioerzeugung und Manipulation innerhalb generativer Video- und Videobearbeitungsarchitekturen; unter anderem.
Das Netzfieber lässt nach
Ich habe letztes Jahr beobachtet, dass die Szene einen bemerkenswerten Anstieg an Veröffentlichungen verzeichnete, die Systeme propagierten, die auf traditioneller CGI basieren (d. h. netzbasierte Darstellungen (von der Art, die aus den 1970er Jahren stammt), oder Integriere es in neuronale FrameworksIch habe einen deutlichen Rückgang der Dynamik hin zu netzbasierten Lösungen beobachtet, insbesondere in der zweiten Jahreshälfte 2025.
Viele der in dieser früheren Welle von Veröffentlichungen enthaltenen CGI-basierten Lösungen, insbesondere jene, die sich mit parametrischen menschlichen „Kontrollfiguren“ wie beispielsweise … befassten, 3D-morphbare ModelleMöglicherweise wurden sie durch die neuen Fähigkeiten diffusionsbasierter generativer Frameworks wie Veo, Kling, Hunyuan und WAN, neben vielen anderen, ersetzt.
Gleichzeitig erschienen Artikel, die sich mit folgenden Themen befassten: Gaußscher Splat Offenbar wurden die Ansätze auch entweder durch Entwicklungsstagnation beeinträchtigt oder dadurch, dass sie von den auf Diffusion basierenden Gen-KI-Systemen des Jahres 2025 überholt wurden; oder beides.
Vor einem Jahr stellte ich fest, dass die anfängliche Begeisterung für GSplat, das ein bemerkenswerter Eindruck Ende 2023Die Forschung hatte sich auf engere Bereiche verengt. Dieses Jahr sehe ich eine Flut von Veröffentlichungen, die sich unter anderem mit dem erheblichen Ressourcenbedarf dieses Ansatzes befassen.
Obwohl ich Gaussian Splatting als „derzeit stagnierend“ bezeichnen würde, sollten wir nicht vergessen, dass diese Technologie aus den frühen 1990er Jahren stammt und von Natur aus wiederkehrend ist.
Eine Ausnahme von diesem allgemeinen Rückzug von netzbasierten Ansätzen bildet das scheinbar zunehmende Interesse an der Integration von KI in Frameworks für den 3D-Druck.
RĂĽckgang der Einreichungen zum Thema KI-Sicherheit
Meine abschließende Beobachtung für 2025 ist, dass die Kategorie „Security“ im Bereich Informatik auf Arxiv im Jahr 2025 einen merklichen Rückgang in Häufigkeit und Qualität der Einreichungen verzeichnet hat, und es ist nicht leicht zu erraten, warum.
Die Kryptographie und Sicherheit Archive waren wohl schon immer eher ein zweitklassiger Ort für die Veröffentlichung von Aufsätzen, da dieser Forschungszweig wenig überraschend von firmeneigenem geistigem Eigentum des Privatsektors dominiert wird – davon taucht wenig in wissenschaftlichen Zeitschriften auf und fast gar nichts davon ist auf freien Plattformen wie Arxiv zu sehen.
Darüber hinaus weisen Einreichungen in dieser Kategorie auf Arxiv überdurchschnittlich viele Fallstricke auf – versteckte, oft unerwartete Informationen, die den scheinbaren Wert und die Neuheit der Arbeit mindern. Ein Beispiel hierfür wäre eine scheinbar aufsehenerregende Methode zur Sicherheitsverletzung, die tatsächlich auf einem „White-Box“-Aspekt beruht – also auf einem privilegierten Zugriff auf Daten oder Verfahren, den ein Angreifer wahrscheinlich nicht erlangen könnte.
Was Sie 2026 erwartet?
Obwohl die Medien Riffing ständig zum Gen-AI-Boom als Wiederholung des Dotcom-Booms und -Bust-Debakels der frühen 2000er Jahre (mit einige abweichende MeinungenDies scheint tatsächlich eine Art trügerische Sicherheit darzustellen. In Bezug auf Infrastruktur, Investitionen und Kultur und Nach eingehender Forschung hat es in der Menschheitsgeschichte wohl noch nie eine vergleichbare Zeit gegeben.
Daher ist es schwer vorherzusagen, in welche Richtung sich die Forschungslandschaft im Jahr 2026 entwickeln wird, außer dass – wie üblich – eine Reihe langfristiger Bemühungen zwischen jetzt und April ihren Höhepunkt erreichen werden, wobei sie durch einen gewissen „Stempel“ der Obsessionen und Trends des Jahres 2025 gekennzeichnet sein werden.
Eine Entwicklung, die die Krise hinsichtlich des Einreichungsvolumens bei Arxiv und anderen Portalen lindern könnte, wäre ein Verbot oder eine Überprüfung von KI-generierten/unterstützten Artikeln, da Arxiv hat kürzlich eine Funktion für Übersichtsartikel eingeführt. – Allerdings dürfte es sich als schwierig erweisen, den Umfang der Beteiligung von KI an einer einzelnen Veröffentlichung zu quantifizieren, da KI durchdrang die Forschungskultur (und Peer-Review) ähnlich wie es in andere Bereiche vorgedrungen ist – als ein Tropfen „Tinte“, der das gesamte (bestehende) Glas Wasser beeinflusst, anstatt das Medium radikal zu verändern.
Erstveröffentlichung Montag, 22. Dezember 2025


