Stummel

Kunal Kejriwal, Autor bei Unite.AI

Vernetzen Sie sich mit uns

Kunal Kejriwal

„Von Beruf Ingenieur, von Herzen Schriftsteller“. Kunal ist ein technischer Autor mit einer tiefen Liebe und einem tiefen Verständnis für KI und ML, der sich der Vereinfachung komplexer Konzepte in diesen Bereichen durch seine ansprechende und informative Dokumentation widmet.

Artificial IntelligenceVor 4 Tagen
AniPortrait: Audiogesteuerte Synthese fotorealistischer Porträtanimationen
Im Laufe der Jahre hat die Erstellung realistischer und ausdrucksstarker Porträtanimationen aus statischen Bildern und Audio eine Reihe von Anwendungen gefunden, darunter Spiele, digitale Medien usw.
Artificial Intelligence2 Wochen her
Mini-Gemini: Das Potenzial multimodaler Vision-Sprachmodelle ausschöpfen
Die Fortschritte bei großen Sprachmodellen haben die Entwicklung der Verarbeitung natürlicher Sprache (NLP) erheblich beschleunigt. Die Einführung des Transformer-Frameworks erwies sich als...
Artificial Intelligence2 Wochen her
AIOS: Betriebssystem für LLM-Agenten
In den letzten sechs Jahrzehnten haben sich Betriebssysteme schrittweise weiterentwickelt, von einfachen Systemen bis hin zu komplexen und interaktiven Betriebssystemen, die die heutigen Geräte antreiben. Anfänglich,...
Artificial Intelligence3 Wochen her
Instant-Style: Stilerhaltung bei der Text-zu-Bild-Generierung
In den letzten Jahren haben auf Tuning basierende Diffusionsmodelle bei einem breiten Spektrum von Bildpersonalisierungs- und Anpassungsaufgaben bemerkenswerte Fortschritte gemacht. Doch trotz ihres Potenzials...
Artificial Intelligence3 Wochen her
LoReFT: Darstellungsfeinabstimmung für Sprachmodelle
Parametereffiziente Feinabstimmungs- oder PeFT-Methoden zielen darauf ab, große Sprachmodelle durch Aktualisierungen an eine kleine Anzahl von Gewichten anzupassen. Ein Großteil der vorhandenen Interpretierbarkeitsarbeiten ...
Artificial Intelligence4 Wochen her
POKELLMON: Ein Human-Parity-Agent für Pokémon-Kämpfe mit LLMs
Große Sprachmodelle und generative KI haben bei einer Vielzahl von Aufgaben der Verarbeitung natürlicher Sprache beispiellose Erfolge gezeigt. Nach der Eroberung des NLP-Bereichs folgt der nächste...
Artificial Intelligence4 Wochen her
Visuelle autoregressive Modellierung: Skalierbare Bilderzeugung mittels Next-Scale-Vorhersage
Das Aufkommen von GPT-Modellen hat zusammen mit anderen autoregressiven oder AR-Modellen für große Sprachen eine neue Epoche im Bereich des maschinellen Lernens eingeleitet und ...
Artificial Intelligence1 Monat
InstructIR: Hochwertige Bildwiederherstellung nach menschlichen Anweisungen
Ein Bild kann viel vermitteln, kann aber auch durch verschiedene Probleme wie Bewegungsunschärfe, Dunst, Rauschen und geringen Dynamikbereich beeinträchtigt werden.
Artificial Intelligence1 Monat
MoE-LLaVA: Expertenmischung für große Vision-Sprach-Modelle
Jüngste Fortschritte bei Large Vision Language Models (LVLMs) haben gezeigt, dass die Skalierung dieser Frameworks die Leistung bei einer Vielzahl nachgelagerter Aufgaben erheblich steigert. LVLMs, einschließlich MiniGPT,...
Artificial Intelligence1 Monat
BlackMamba: Expertenmischung für State-Space-Modelle
Die Entwicklung von Large Language Models (LLMs), die aus reinen Decoder-Transformermodellen aufgebaut sind, hat eine entscheidende Rolle bei der Transformation des Bereichs Natural Language Processing (NLP) gespielt, da ...
Artificial Intelligence1 Monat
DynamiCrafter: Animieren von Open-Domain-Bildern mit Videodiffusions-Priors
Computer Vision ist heute eines der aufregendsten und am besten erforschten Gebiete innerhalb der KI-Community, und trotz der raschen Weiterentwicklung der Computer Vision-Modelle ...
Artificial Intelligence2 Monate her
AnimateLCM: Beschleunigung der Animation personalisierter Diffusionsmodelle
In den letzten Jahren haben Diffusionsmodelle großen Erfolg und Anerkennung für Bild- und Videogenerierungsaufgaben erzielt. Insbesondere Videodiffusionsmodelle wurden...
Artificial Intelligence2 Monate her
YOLO-World: Echtzeit-Objekterkennung mit offenem Vokabular
Die Objekterkennung ist eine grundlegende Herausforderung in der Computer-Vision-Branche mit Anwendungen in der Robotik, dem Bildverständnis, autonomen Fahrzeugen und der Bilderkennung. In den vergangenen Jahren,...
Artificial Intelligence2 Monate her
InstantID: Identitätserhaltende Zero-Shot-Generierung in Sekundenschnelle
Die KI-gestützte Bilderzeugungstechnologie hat in den letzten Jahren ein bemerkenswertes Wachstum erlebt, seitdem große Text-zu-Bild-Diffusionsmodelle wie DALL-E, GLIDE, Stable Diffusion usw. zum Einsatz kommen.
Artificial Intelligence2 Monate her
Mobile-Agents: Autonomer multimodaler Agent für mobile Geräte mit visueller Wahrnehmung
Das Aufkommen multimodaler großer Sprachmodelle (MLLM) hat eine neue Ära mobiler Geräteagenten eingeläutet, die in der Lage sind, die Welt zu verstehen und mit ihr zu interagieren ...

Seite 1 von 512 3 4 5