

Eine neue Forschungskooperation zwischen Israel und Japan behauptet, dass Fußgängererkennungssysteme inhärente Schwächen aufweisen, die es gut informierten Personen ermöglichen, Gesichtserkennungssysteme zu umgehen, indem sie navigieren ...


Die Vorhersage zukünftiger Zustände ist eine kritische Aufgabe in der Computer Vision-Forschung – nicht zuletzt in der Robotik, wo reale Situationen berücksichtigt werden müssen. Maschinelle Lernsysteme, die diesen Aufgaben anvertraut werden, sind...


In diesem Artikel erfahren Sie, wie Sie Windows-basierte Software installieren und verwenden, mit der Sie Hunyuan-Video-LoRA-Modelle trainieren können, sodass der Benutzer benutzerdefinierte Persönlichkeiten erstellen kann …


Die kürzlich erfolgte öffentliche Veröffentlichung des generativen KI-Modells Hunyuan Video hat die laufenden Diskussionen über das Potenzial großer multimodaler Bildsprachenmodelle, eines Tages …, intensiviert.


Bisher wurde Facial Attractionness Prediction (FAP) hauptsächlich im Rahmen der psychologischen Forschung, in der Schönheits- und Kosmetikindustrie und im Zusammenhang mit … untersucht.


Aufgrund der Art einiger der hier besprochenen Inhalte enthält dieser Artikel weniger Verweise und Abbildungen als üblich. Aktuell findet etwas Bemerkenswertes statt…


Ich verfolge die Forschungsszene im Bereich Computer Vision (CV) und Bildsynthese bei Arxiv und anderswo seit etwa fünf Jahren kontinuierlich, sodass sich im Laufe der Zeit Trends abzeichnen ...


Neue Forschungsergebnisse aus China bieten eine verbesserte Methode zur Interpolation der Lücke zwischen zwei zeitlich auseinander liegenden Videobildern – eine der größten Herausforderungen in …


Eine überzeugende neue Studie aus Deutschland kritisiert die Definition des Begriffs „Deepfake“ im EU-KI-Gesetz als zu vage, insbesondere im Zusammenhang mit digitalen Bildern …


Trotz der Begeisterung der Community und der Investoren für visuelle generative KI sind die Ergebnisse solcher Systeme nicht immer für den Einsatz in der realen Welt bereit. Ein Beispiel dafür ist, dass generative KI …


Die große Hoffnung für KI-Modelle auf Basis visueller Sprache besteht darin, dass sie eines Tages zu größerer Autonomie und Vielseitigkeit fähig sein werden und dabei die Prinzipien physikalischer Gesetze einbeziehen...


Während das Jahr 2022 das disruptive Potenzial der generativen KI erstmals breite öffentliche Aufmerksamkeit erregte, war 2024 das Jahr, in dem Fragen zur Rechtmäßigkeit von ... aufgeworfen wurden.


Eine aktuelle Studie aus den USA hat ergeben, dass die tatsächliche Leistung beliebter Retrieval Augmented Generation (RAG)-Recherchesysteme wie Perplexity und Bing Copilot …


Die Forschungsabteilung von Disney bietet eine neue Methode zur Bildkomprimierung an, die auf dem Open-Source-Modell Stable Diffusion V1.2 basiert und realistischere Bilder bei geringerer Dateigröße erzeugen soll.


Die Video-Frame-Interpolation (VFI) ist ein offenes Problem in der generativen Videoforschung. Die Herausforderung besteht darin, Zwischenbilder zwischen zwei vorhandenen Bildern in einem Video zu erzeugen...