Umělá inteligence

Souboj jazykových modelů s otevřeným zdrojovým kódem vs. uzavřený zdroj: Technická analýza

Zveřejněno

3 měsíci

Února 12, 2024

Velké jazykové modely (LLM) v posledních letech uchvátily komunitu umělé inteligence a vedly k průlomům ve zpracování přirozeného jazyka. Za humbukem se skrývá složitá debata – měly by tyto výkonné modely být open source nebo closed source?

V tomto příspěvku budeme analyzovat technické rozdíly mezi těmito přístupy, abychom pochopili příležitosti a omezení, které každý z nich představuje. Budeme se zabývat následujícími klíčovými aspekty:

Definice open source vs. uzavřený zdroj LLM
Architektonická transparentnost a přizpůsobitelnost
Výkonnostní benchmarking
Výpočtové požadavky
Všestrannost aplikace
Přístupnost a licencování
Ochrana osobních údajů a důvěrnost
Komerční podpora a podpora

Na konci budete mít informovaný pohled na technické kompromisy mezi open source a uzavřeným zdrojovým LLM pro vedení vaší vlastní AI strategie. Pojďme se ponořit!

Definice Open Source vs Closed Source LLM

Open source LLM mají veřejně přístupné architektury modelů, zdrojový kód a váhové parametry. To umožňuje výzkumníkům kontrolovat vnitřnosti, hodnotit kvalitu, reprodukovat výsledky a vytvářet vlastní varianty. Mezi přední příklady patří ConstitutionalAI společnosti Anthropic, LLaMA společnosti Meta a GPT-NeoX společnosti EleutherAI.

Naproti tomu LLM s uzavřeným zdrojem považují modelovou architekturu a váhy za vlastnická aktiva. Komerční subjekty jako Anthropic, DeepMind a OpenAI je vyvíjejí interně. Bez přístupného kódu nebo detailů návrhu čelí omezením reprodukovatelnost a přizpůsobení.

Architektonická transparentnost a přizpůsobitelnost

Přístup k vnitřním prvkům LLM s otevřeným zdrojovým kódem odemyká možnosti přizpůsobení, které jednoduše nejsou možné s uzavřenými alternativami.

Úpravou architektury modelu mohou výzkumníci prozkoumat techniky, jako je zavedení řídké konektivity mezi vrstvami nebo přidání vyhrazených klasifikačních tokenů pro zvýšení výkonu u specializovaných úkolů. Díky přístupu k parametrům hmotnosti mohou vývojáři přenášet existující reprezentace nebo inicializovat varianty pomocí předem trénovaných stavebních bloků, jako jsou vložení T5 a BERT.

Tato přizpůsobitelnost umožňuje open source LLM lépe sloužit specializovaným doménám, jako je biomedicínský výzkum, generování kódu a vzdělávání. Potřebné odborné znalosti však mohou zvýšit bariéru při poskytování implementací v kvalitě produkce.

Uzavřené LLM nabízejí omezené možnosti přizpůsobení, protože jejich technické detaily zůstávají ve vlastnictví. Jejich podporovatelé však věnují rozsáhlé zdroje na interní výzkum a vývoj. Výsledné systémy posouvají hranice toho, co je možné se zobecněnou architekturou LLM.

Takže i když jsou méně flexibilní, LLM s uzavřeným zdrojovým kódem vynikají v široce použitelných úlohách přirozeného jazyka. Také zjednodušují integraci tím, že vyhovují zavedeným rozhraním, jako je standard OpenAPI.

Srovnávání výkonu

Navzdory transparentnosti architektury přináší měření výkonu open source LLM výzvy. Jejich flexibilita umožňuje nespočet možných konfigurací a strategií ladění. Umožňuje také modelům s předponou „open source“ skutečně zahrnovat proprietární techniky, které zkreslují srovnání.

LLM s uzavřeným zdrojem se mohou pochlubit jasněji definovanými výkonnostními cíli, protože jejich podporovatelé porovnávají a inzerují konkrétní prahové hodnoty metrik. Anthropic například zveřejňuje přesnost ConstitutionalAI na kurátorských problémových sadách NLU. Microsoft zdůrazňuje, jak GPT-4 překonává lidské základní linie na sadě nástrojů pro porozumění jazyku SuperGLUE.

To znamená, že tato úzce definovaná měřítka čelila kritice za nadhodnocování výkonu v reálných úkolech a nedostatečné zobrazení selhání. Skutečně nestranné hodnocení LLM zůstává otevřenou výzkumnou otázkou – pro přístupy s otevřeným i uzavřeným zdrojem.

Výpočetní požadavky

Trénink velkých jazykových modelů vyžaduje rozsáhlé výpočetní zdroje. OpenAI utratila miliony na školení GPT-3 v cloudové infrastruktuře, zatímco společnost Anthropic spotřebovala GPU v hodnotě více než 10 milionů dolarů pro ConstitutionalAI.

Účet za takové modely vylučuje většinu jednotlivců a malých týmů z komunity open source. EleutherAI ve skutečnosti musela odstranit model GPT-J z veřejného přístupu kvůli explodujícím nákladům na hosting.

Bez hluboko do kapsy využívají příběhy úspěšných LLM s otevřeným zdrojovým kódem darované výpočetní zdroje. LAION vytvořil svůj technologicky zaměřený model LAION-5B pomocí crowdsourcovaných dat. Neziskový projekt Anthropic ConstitutionalAI využíval dobrovolnické výpočty.

Velké technologické zázemí společností jako Google, Meta a Baidu poskytuje úsilí uzavřeného zdroje finanční palivo potřebné k industrializaci rozvoje LLM. To umožňuje škálování do délek nepochopitelných pro místní iniciativy – podívejte se na model Gopher s 280 miliardami parametrů společnosti DeepMind.

Všestrannost aplikace

Přizpůsobitelnost open source LLM umožňuje řešit vysoce specializované případy použití. Výzkumníci mohou agresivně upravovat vnitřní části modelu, aby zvýšili výkon u specializovaných úkolů, jako je predikce struktury proteinů, generování dokumentace kódu a matematické ověřování důkazů.

To znamená, že možnost přístupu a úpravy kódu nezaručuje efektivní řešení specifické pro doménu bez správných dat. Komplexní školicí datové sady pro úzké aplikace vyžadují značné úsilí, aby byly spravovány a aktualizovány.

Zde LLM s uzavřeným zdrojem těží ze zdrojů pro získávání školicích dat z interních úložišť a komerčních partnerů. Například DeepMind licencuje databáze jako ChEMBL pro chemii a UniProt pro proteiny, aby rozšířil dosah aplikací. Přístup k datům v průmyslovém měřítku umožňuje modelům, jako je Gopher, dosáhnout pozoruhodné všestrannosti navzdory architektonické neprůhlednosti.

Přístupnost a licencování

Povolující licencování open source LLM podporuje volný přístup a spolupráci. Modely jako GPT-NeoX, LLaMA a Jurassic-1 Jumbo využívají dohody jako Creative Commons a Apache 2.0, aby umožnily nekomerční výzkum a spravedlivou komercializaci.

Naproti tomu LLM s uzavřeným zdrojem nesou restriktivní licence, které omezují dostupnost modelu. Komerční subjekty přísně kontrolují přístup, aby chránily potenciální zdroje příjmů z predikčních API a podnikových partnerství.

Organizace jako Anthropic a Cohere pochopitelně účtují poplatky za přístup k rozhraní ConstitutionalAI a Cohere-512. To však riskuje zdražení důležitých oblastí výzkumu, což posune vývoj směrem k dobře financovaným odvětvím.

Otevřené licencování také představuje problémy, zejména pokud jde o připisování a odpovědnost. Pro případy použití ve výzkumu však svobody poskytované přístupností open source nabízejí jasné výhody.

Ochrana osobních údajů a důvěrnost

Školicí datové sady pro LLM obvykle shromažďují obsah z různých online zdrojů, jako jsou webové stránky, vědecké články a diskusní fóra. To riskuje, že se ve výstupech modelu objeví osobně identifikovatelné nebo jinak citlivé informace.

U LLM s otevřeným zdrojovým kódem poskytuje kontrola složení datové sady nejlepší ochranu před problémy s důvěrností. Hodnocení zdrojů dat, postupy filtrování a dokumentace týkající se příkladů nalezených během testování může pomoci identifikovat zranitelná místa.

Bohužel LLM s uzavřeným zdrojem takový veřejný audit vylučují. Namísto toho se spotřebitelé musí spolehnout na přísnost interních kontrolních procesů založených na vyhlášených politikách. Pro kontext Azure Cognitive Services slibuje filtrování osobních údajů, zatímco Google specifikuje formální kontroly ochrany osobních údajů a označování dat.

Celkově lze říci, že LLM s otevřeným zdrojovým kódem umožňují proaktivnější identifikaci rizik důvěrnosti v systémech AI dříve, než se tyto nedostatky projeví ve velkém měřítku. Uzavřené protějšky nabízejí relativně omezenou transparentnost postupů nakládání s daty.

Komerční podpora a podpora

Potenciál zpeněžit uzavřené zdroje LLM podněcuje významné komerční investice do vývoje a údržby. Microsoft například v očekávání lukrativních výnosů ze svého portfolia Azure AI souhlasil s mnohamiliardovými partnerstvími s OpenAI v oblasti modelů GPT.

Naproti tomu open source LLM spoléhají na dobrovolníky, kteří přidělují osobní čas na údržbu nebo na granty poskytující časově omezené financování. Tato asymetrie zdrojů ohrožuje kontinuitu a životnost open source projektů.

Překážky komercializace však také umožňují komunitám s otevřeným zdrojovým kódem soustředit se na vědecký pokrok nad ziskem. A decentralizovaná povaha otevřených ekosystémů zmírňuje přílišné spoléhání se na trvalý zájem každého jednotlivého podporovatele.

Nakonec každý přístup přináší kompromisy kolem zdrojů a pobídek. Uzavřené LLM se těší větší bezpečnosti financování, ale koncentrují vliv. Otevřené ekosystémy podporují rozmanitost, ale trpí zvýšenou nejistotou.

Navigace v prostředí LLM s otevřeným zdrojem vs

Rozhodování mezi LLM s otevřeným nebo uzavřeným zdrojem vyžaduje sladění organizačních priorit, jako je přizpůsobitelnost, dostupnost a škálovatelnost, s možnostmi modelu.

Výzkumníkům a začínajícím firmám poskytuje open source větší kontrolu pro vyladění modelů pro konkrétní úkoly. Licence také usnadňuje bezplatné sdílení poznatků mezi spolupracovníky. Břemeno získávání školicích dat a infrastruktury však může podkopat životaschopnost v reálném světě.

Naopak LLM s uzavřeným zdrojem slibují značné zlepšení kvality díky dostatečnému financování a datům. Omezení týkající se přístupu a úprav však omezují vědeckou transparentnost a zároveň zavazují nasazení k plánům dodavatelů.

V praxi mohou otevřené standardy týkající se specifikací architektury, kontrolních bodů modelu a vyhodnocovacích dat pomoci kompenzovat nevýhody obou přístupů. Sdílené základy jako Google Transformer nebo Oxfordské REALTO benchmarky zlepšují reprodukovatelnost. Standardy interoperability jako ONNX umožňují míchání komponent z otevřených a uzavřených zdrojů.

Nakonec záleží na výběru správného nástroje – otevřeného nebo uzavřeného zdroje – pro danou práci. Komerční subjekty, které podporují LLM s uzavřeným zdrojem, mají nepopiratelný vliv. Ale vášeň a principy otevřených vědeckých komunit budou i nadále hrát klíčovou roli v rozvoji AI.

Nahoru Další

Nové technologické trendy pro rok 2024: Zpráva společnosti Mastercard odhaluje dopad generativní umělé inteligence na obchod

Nenechte si ujít

The State of Multilingual LLMs: Moving Beyond English

Aayush Mittal

Posledních pět let jsem strávil ponořením se do fascinujícího světa strojového učení a hlubokého učení. Moje vášeň a odborné znalosti mě vedly k tomu, abych se podílel na více než 50 různých projektech softwarového inženýrství se zvláštním zaměřením na AI/ML. Moje neustálá zvědavost mě také přivedla ke zpracování přirozeného jazyka, což je obor, který bych rád dále prozkoumal.