Connect with us

Sztuczna inteligencja

Głębokie zanurzenie w generacji wspomaganej przez pobieranie w LLM

mm
Retrieval Augmented Generation Illustration using Midjourney

Wyobraź sobie, że jesteś analitykiem i masz dostęp do dużej językowej modelu. Jesteś podekscytowany perspektywami, które przynosi Twojej pracy. Ale potem pytasz go o najnowsze ceny akcji lub obecny poziom inflacji, a on odpowiada:

“Przepraszam, ale nie mogę dostarczyć danych w czasie rzeczywistym lub po dacie zakończenia szkolenia. Moje ostatnie dane szkoleniowe sięgają tylko do stycznia 2022 r.”

Duże językowe modele, pomimo swojej językowej mocy, nie posiadają możliwości zrozumienia “teraźniejszości”. A w szybko zmieniającym się świecie, “teraźniejszość” jest wszystkim.

Badania wykazały, że duże wstępnie wytrenowane modele językowe (LLM) są również repozytorium wiedzy faktograficznej.

Zostały one wytrenowane na tak dużej ilości danych, że wchłonęły wiele faktów i liczb. Po dalszym szkoleniu mogą osiągać znakomite wyniki w różnych zadaniach NLP.

Spędziłem ostatnie pięć lat, zanurzając się w fascynującym świecie Machine Learning i Deep Learning. Moja pasja i ekspertyza doprowadziły mnie do udziału w ponad 50 różnych projektach inżynierii oprogramowania, ze szczególnym uwzględnieniem AI/ML. Moja nieustanna ciekawość również skierowała mnie w stronę Natural Language Processing, dziedziny, którą chcę bardziej zbadać.