Connect with us

Rozwiązywanie Bieżących Problemów W ramach LLM & Spójrz Na To, Co Następuje

Liderzy opinii

Rozwiązywanie Bieżących Problemów W ramach LLM & Spójrz Na To, Co Następuje

mm

Dziś dostępnych jest kilkadziesiąt publicznie dostępnych dużych modeli językowych (LLM), takich jak GPT-3, GPT-4, LaMDA lub Bard, a ich liczba jest nieustannie-growing wraz z wydaniem nowych modeli. LLM rewolucjonizowały sztuczną inteligencję, całkowicie zmieniając sposób, w jaki взаимодействujemy z technologią w różnych branżach. Te modele pozwalają nam uczyć się z wielu zbiorów danych językowych i otworzyły nowe możliwości innowacji, kreatywności i efektywności.

Jednak wraz z wielką mocą przychodzi wielka złożoność. Istnieją wewnętrzne wyzwania i problemy etyczne związane z LLM, które muszą być rozwiązane, zanim będziemy mogli wykorzystać je w pełni. Na przykład, niedawne badanie Stanford wykazało rasową i płciową stronniczość, gdy obserwowano ChatGPT-4 w sposób, w jaki traktuje pewne zapytania, które zawierają imiona i nazwiska sugerujące rasę lub płeć. W tym badaniu program został poproszony o radę, ile powinno się zapłacić za używanego rower, który jest sprzedawany przez kogoś o imieniu Jamal Washington, co dało znacznie niższą kwotę w porównaniu z tym, gdy sprzedawcą był Logan Becker. Ponieważ te odkrycia nadal przychodzą do światła, potrzeba rozwiązania problemów LLM tylko rośnie.

Jak Zmniejszyć Powszechne Obawy Dotyczące LLM

Stronniczość

Jednym z najczęściej dyskutowanych problemów wśród LLM jest stronniczość i sprawiedliwość. W niedawnym badaniu eksperci przetestowali cztery niedawno opublikowane LLM i stwierdzili, że wszystkie wyrażały stronnicze założenia dotyczące mężczyzn i kobiet, szczególnie tych zgodnych z ludzkimi percepcjami, a nie tymi opartymi na faktach. W tym kontekście stronniczość odnosi się do nierównego traktowania lub wyników wśród różnych grup społecznych, najprawdopodobniej z powodu historycznych lub strukturalnych nieequilibrium.

W LLM, stronniczość jest spowodowana selekcją danych, demografią twórców i językową lub kulturową skłonnością. Stronniczość selekcji danych występuje, gdy teksty wybrane do szkolenia LLM nie reprezentują pełnej różnorodności języka używanego w sieci. LLM szkolone na obszernych, ale ograniczonych, zbiorach danych mogą odziedziczyć stronniczości już w tych tekstach. Z demografią twórców pewne grupy demograficzne są bardziej uwypuklone niż inne, co ilustruje potrzebę większej różnorodności i inkluzywności w tworzeniu treści, aby zmniejszyć stronniczość. Na przykład Wikipedia, powszechny źródło danych szkoleniowych, wykazuje znaczącą nieequilibrium demograficzne wśród swoich redaktorów z przewagą mężczyzn (84%). Jest to podobne do skłonności, którą można znaleźć w języku i kulturze. Wiele źródeł, na których LLM są szkolone, jest skłonnych, przechylonych ku angielskiemu, co tylko czasami tłumaczy się dokładnie na inne języki i kultury.

Jest niezwykle ważne, aby LLM były szkolone na przefiltrowanych danych, a także aby były w miejsce barier, które tłumią tematy, które nie są spójnymi reprezentacjami danych. Jednym ze sposobów, aby to zrobić, jest przez techniki oparte na augmentacji danych. Można dodać przykłady z grup niedoreprezentowanych do danych szkoleniowych, rozszerzając różnorodność zbioru danych. Inną taktyką mitigacji jest filtrowanie i przypisywanie wagi danych, które koncentrują się głównie na precyzyjnym celowaniu konkretnych, niedoreprezentowanych przykładów w ramach istniejącego zbioru danych.

Halucynacje

W kontekście LLM, halucynacje są zjawiskiem charakteryzującym się wytwarzaniem tekstu, który, chociaż jest gramatycznie poprawny i zdaje się spójny, odbiega od faktologicznej dokładności lub intencji materiału źródłowego. W rzeczywistości, niedawne raporty wykazały, że pozew dotyczący prawa w Minnesocie jest bezpośrednio dotknięty halucynacjami LLM. Zaświadczenie złożone w celu poparcia prawa zawierało nieistniejące źródła, które mogły być wytworzone przez ChatGPT lub inny LLM. Te halucynacje mogą łatwo zmniejszyć niezawodność LLM.

Istnieją trzy podstawowe formy halucynacji:

  1. Halucynacja sprzeczna z wejściem: Zdarza się to, gdy wyjście LLM odbiega od wejścia użytkownika, które zwykle obejmuje instrukcje zadania i rzeczywisty materiał wymagający przetworzenia.
  2. Halucynacja sprzeczna z kontekstem: LLM mogą generować wewnętrznie niespójne odpowiedzi w scenariuszach obejmujących przedłużone dialogi lub wiele wymian. To sugeruje potencjalną wadę w zdolności modelu do śledzenia kontekstu lub utrzymania spójności w różnych interakcjach.
  3. Halucynacja sprzeczna z faktami: Ten rodzaj halucynacji pojawia się, gdy LLM wytwarza treść sprzeczną z ustaloną wiedzą faktologiczną. Pochodzenie takich błędów jest różnorodne i może wystąpić na różnych etapach cyklu życia LLM.

Wiele czynników przyczyniło się do tego zjawiska, takich jak braki wiedzy, które wyjaśniają, jak LLM mogą nie posiadać wiedzy lub zdolności do asymilacji informacji w sposób poprawny podczas wstępnego szkolenia. Dodatkowo, stronniczość w danych szkoleniowych lub sekwencyjna strategia generacji LLM, określana jako “halucynacyjny śnieg”, może tworzyć halucynacje.

Istnieją sposoby, aby złagodzić halucynacje, chociaż zawsze będą one cechą LLM. Pomocne strategie mitigacji halucynacji są mitigacją podczas wstępnego szkolenia (ręczne udoskonalanie danych przy użyciu technik filtracji) lub dostrajaniem (kuracją danych szkoleniowych). Jednak mitigacja podczas inferencji jest najlepszym rozwiązaniem ze względu na jej efektywność kosztową i kontrolę.

Prywatność

Wraz ze wzrostem internetu, zwiększona dostępność informacji osobistych i innych danych prywatnych stała się powszechnie rozpoznanym problemem. Badanie wykazało, że 80% amerykańskich konsumentów obawia się, że ich dane są wykorzystywane do szkolenia modeli AI. Ponieważ najbardziej znane LLM są pochodzenia ze stron internetowych, musimy rozważyć, jak to stanowi ryzyko dla prywatności i pozostaje w dużej mierze nierozwiązanym problemem dla LLM.

Najprostszym sposobem, aby zapobiec rozpowszechnianiu informacji osobistych przez LLM, jest usunięcie ich z danych szkoleniowych. Jednak biorąc pod uwagę ogromną ilość danych zaangażowanych w LLM, jest prawie niemożliwe, aby zagwarantować, że wszystkie informacje prywatne zostaną usunięte. Innym powszechnym rozwiązaniem dla organizacji, które polegają na zewnętrznie opracowanych modelach, jest wybranie modelu LLM open-source zamiast usługi takiej jak ChatGPT.

Z tego podejścia, kopia modelu może być wdrożona wewnętrznie. Wypowiedzi użytkowników pozostają bezpieczne w sieci organizacji, a nie są narażone na usługi osób trzecich. Chociaż to dramatycznie zmniejsza ryzyko wycieku wrażliwych danych, dodaje to również znaczącej złożoności. Biorąc pod uwagę trudności w pełnym gwarantowaniu ochrony danych prywatnych, jest nadal niezwykle ważne, aby deweloperzy aplikacji rozważyli, jak te modele mogą narażać ich użytkowników na ryzyko.

Następna Granica Dla LLM

Podczas gdy kontynuujemy rozwój i kształtowanie kolejnych ewolucji LLM poprzez mitigowanie bieżących ryzyk, powinniśmy oczekiwać przełomu agentów LLM, których już widzimy w firmach takich jak H z Runner H, zaczynając wydawać. Przejście od czystych modeli językowych do architektur agentywnych reprezentuje zmianę w projekcie systemu AI; branża będzie przechodziła poza wewnętrzne ograniczenia interfejsów czatu i prostych mechanizmów generacji uzupełnionej o pobieranie. Te nowe ramy agentów będą miały zaawansowane moduły planistyczne, które rozkładają złożone cele na atomowe podzadania, utrzymują pamięć epizodyczną do rozumowania kontekstowego i wykorzystują specjalistyczne narzędzia za pomocą dobrze zdefiniowanych API. To tworzy bardziej solidne podejście do automatyzacji zadań.

Wraz z LLM, będzie większy nacisk na szkolenie mniejszych modeli językowych ze względu na ich efektywność kosztową, dostępność i łatwość wdrożenia. Na przykład, modele językowe specyficzne dla domeny są specjalizowane w określonych branżach lub dziedzinach. Te modele są starannie dostrojone z danymi i terminologią specyficznymi dla danej dziedziny, co sprawia, że są one idealne dla złożonych i uregulowanych środowisk, takich jak medyczne lub prawne, gdzie precyzja jest niezwykle ważna. To ukierunkowane podejście zmniejsza prawdopodobieństwo błędów i halucynacji, które modele ogólnego przeznaczenia mogą produkować, gdy mają do czynienia z treścią specjalistyczną.

Podczas gdy kontynuujemy eksplorację nowych granic w LLM, jest niezwykle ważne, aby popychać granice innowacji i rozwiązywać oraz mitigować potencjalne ryzyka związane z ich rozwojem i wdrożeniem. Tylko poprzez identyfikację i proaktywne rozwiązywanie wyzwań związanych ze stronniczością, halucynacjami i prywatnością możemy stworzyć bardziej solidną podstawę dla LLM, aby prosperować w różnych dziedzinach.

Uday Kamath jest Dyrektorem ds. Analiz w firmie Smarsh, światowym liderem w dziedzinie danych i wywiadu komunikacyjnego. Jego rola obejmuje kierowanie nauką o danych i badaniami w dziedzinie sztucznej inteligencji konwersacyjnej. Z ponad 25-letnim doświadczeniem w rozwoju analitycznym i tytułem doktora w dziedzinie maszynowego uczenia się, znaczące wkład Kamatha obejmują liczne czasopisma, konferencje, książki i patenty. Jest on również aktywnym członkiem Rady Doradczej dla podmiotów, w tym komercyjnych firm takich jak Falkonry i instytucji akademickich, takich jak Centrum Partnerstwa Człowiek-Maszyna na GMU.