Najnowsze artykuły
-

Sztuczna inteligencja 11 października 2024SHOW-O: Pojedynczy Transformer Ujednolicający Zrozumienie i Generowanie Wielomodalne
W ostatnich latach nastąpiły znaczące postępy w dużych modelach językowych (LLM), co zainspirowało rozwój wielomodowych dużych modeli językowych (MLLM). Wczesne próby MLLM, takie jak LLaVA, MiniGPT-4...
-
Sztuczna inteligencja 9 września 2024Sapiens: Przełom w modelach widzenia ludzkiego
Niezwykły sukces dużych, z پیشtreningowanych modeli językowych, a następnie dostosowanych do konkretnych zadań, ustanowił ten podejście jako standardową praktykę. Podobnie, metody komputerowego widzenia stopniowo przyjmują obszerne...
-
Sztuczna inteligencja 6 sierpnia 2024SGLang: Wydajna Wykonywanie Programów Modeli Językowych
Duże modele językowe (LLM) są coraz częściej wykorzystywane do złożonych zadań wymagających wielu wywołań generacji, zaawansowanych technik promptowania, sterowania przepływem i strukturalnych danych wejściowych/wyjściowych. Jednak efektywne...
-
Sztuczna inteligencja 29 lipca 2024MINT-1T: Skalowanie otwartoźródłowych multimodalnych danych o 10 razy
Trening dużych modeli multimodalnych (LMM) wymaga dużych zbiorów danych z przeplatanymi sekwencjami obrazów i tekstu w postaci swobodnej. Chociaż modele LMM otwartoźródłowe ewoluowały szybko, nadal brakuje...
-
Sztuczna inteligencja 16 lipca 2024DIAMOND: Wizualne szczegóły mają znaczenie w Atari i dyfuzji dla modelowania świata
W 2018 roku po raz pierwszy wprowadzono ideę uczenia wzmacniania w kontekście środowiska modelu neuronowej sieci, a niedługo potem ten fundamentalny princip został zastosowany w modelach...
-
Sztuczna inteligencja 9 lipca 2024MarkLLM: Narzędzie do znakowania modeli językowych
Znakowanie modeli językowych, które integruje niewidoczne, ale wykrywalne sygnały w danych wyjściowych modelu w celu identyfikacji tekstu wygenerowanego przez modele językowe, jest niezbędne do zapobiegania nadużywaniu...
-
Sztuczna inteligencja 6 czerwca 2024LLaVA-UHD: Wydajne postrzeganie obrazów w dowolnym stosunku boków i wysokiej rozdzielczości
Niedawne postępy i rozwój dużych modeli językowych przyniosły znaczny wzrost zdolności rozumnienia, zrozumienia i interakcji z językiem wizualnym. Współczesne ramy osiągają to, wprowadzając sygnały wizualne do...
-
Sztuczna inteligencja 31 maja 2024Uni-MoE: Skalowanie Zjednoczonych Wielomodalnych Modeli Językowych z Mixture of Experts
Ostatnie postępy w architekturze i wydajności wielomodalowych dużych modeli językowych (MLLM) podkreśliły znaczenie skalowalnych danych i modeli w celu poprawy wydajności. Chociaż ten podejście poprawia wydajność,...
-
Sztuczna inteligencja 24 maja 2024MambaOut: Czy Mamba jest naprawdę potrzebna do zadań związanych z widzeniem?
W nowoczesnych ramach uczenia maszynowego i sztucznej inteligencji, transformery są jednym z najczęściej używanych komponentów w różnych dziedzinach, w tym w serii GPT, BERT w przetwarzaniu...


