Kunstig intelligens

Snowflake Arctic: Den avancerede LLM til virksomheds-AI

Udgivet den 25. april 2024

Opdateret den 21. maj 2026

Aayush Mittal Mittal

Snowflake Arctic: The Cutting-Edge LLM for Enterprise AI

div]:bg-bg-300 [&_pre]:-mr-4 md:[&_pre]:-mr-9″>

Virksomhederne søger i dag efter måder at udnytte store sprogmodeller (LLM’er) til at øge produktiviteten og skabe intelligente applikationer. Men mange af de tilgængelige LLM-valgmuligheder er generiske modeller, der ikke er tilpasset specialiserede virksomhedsbehov som dataanalyse, kodning og opgaveautomatisering. Indtast Snowflake Arctic – en stat-of-the-art LLM, der er designet og optimeret til kernevirksomhedsbrug.

Udviklet af Snowflakes AI-forskningshold, fører Arctic grænserne for, hvad der er muligt med effektiv træning, omkostningseffektivitet og en enestående niveau af åbenhed. Denne revolutionerende model excellerer i nøglevirksomhedsbenchmarks, mens den kræver langt mindre beregningskraft i forhold til eksisterende LLM’er. Lad os dykke ned i, hvad der gør Arctic til en spilvender for virksomheds-AI.

Virksomhedsintelligens gendefineret I sin kerne er Arctic fokuseret på at levere exceptionel præstation på metrics, der virkelig betyder noget for virksomheder – kodning, SQL-forespørgsler, komplekse instruktioner og produktion af grundede, faktabaserede output. Snowflake har kombineret disse kritiske funktioner i en ny “virksomhedsintelligens“-metric.

Resultaterne taler for sig selv. Arctic opfylder eller overgår modeller som LLAMA 7B og LLAMA 70B på virksomhedsintelligensbenchmarks, mens den bruger mindre end halvdelen af beregningsbudgettet til træning. Forbløffende, på trods af at den bruger 17 gange færre beregningsressourcer end LLAMA 70B, opnår Arctic lighed på specialiserede tests som kodning (HumanEval+, MBPP+), SQL-generering (Spider) og instruktionsfølging (IFEval).

Men Arctics kunnen går ud over blot at bestå virksomhedsbenchmarks. Den opretholder en stærk præstation på tværs af generel sprogforståelse, begrundelse og matematisk dygtighed i forhold til modeller, der er trænet med eksponentielt højere beregningsbudgetter som DBRX. Denne holistiske funktion gør Arctic til et uovervindeligt valg til at tackle de forskellige AI-behov i en virksomhed.

Innovationen

Dense-MoE Hybrid Transformer Hvordan byggede Snowflakes hold sådan en utrolig kapabel, men effektiv LLM? Svaret ligger i Arctics avancerede Dense Mixture-of-Experts (MoE) Hybrid Transformer-arkitektur.

Traditionelle dense transformer-modeller bliver stadig mere kostbare at træne, når deres størrelse øges, med beregningskrav, der øges lineært. MoE-designet hjælper med at omgå dette ved at anvende multiple parallele feed-forward-netværk (eksperter) og kun aktivere en undermængde for hvert input-token.

Men blot at anvende en MoE-arkitektur er ikke nok – Arctic kombinerer styrkerne fra både dense og MoE-komponenter på en genial måde. Den parrer en 10 milliarder parameter dense transformer-encoder med en 128-ekspert residual MoE multi-layer perceptron (MLP)-lag. Denne dense-MoE hybridmodel har i alt 480 milliarder parametre, men kun 17 milliarder er aktive på et given tidspunkt ved hjælp af top-2 gating.

Konsekvenserne er dybtgående – Arctic opnår en hidtil uset modelkvalitet og kapacitet, mens den forbliver bemærkelsesværdigt beregnings-effektiv under træning og inferens. For eksempel har Arctic 50% færre aktive parametre end modeller som DBRX under inferens.

Men modelarkitektur er kun en del af historien. Arctics excellence er kulminationen af flere banebrydende teknikker og indsigt udviklet af Snowflakes forskningshold:

Virksomhedsfokuseret træningsdata-curriculum Gennem omfattende eksperimenter fandt holdet ud af, at generiske færdigheder som fællessansbehandling burde læres tidligt, mens mere komplekse specialiseringer som kodning og SQL bedst erhverves senere i træningsprocessen. Arctics data-curriculum følger en tretrins-tilgang, der ligner menneskelige læringsfremskridt.

De første teratokens fokuserer på at bygge en bred generel base. De næste 1,5 teratokens koncentrerer sig om at udvikle virksomhedsspecifikke færdigheder gennem data tilpasset til SQL, kodning og mere. De sidste teratokens refinerer yderligere Arctics specialiseringer ved hjælp af raffinerede datasets.

Optimal arkitekturvalg Mens MoE’er lover bedre kvalitet per beregning, er det afgørende at vælge de rette konfigurationer, men dette er dårligt forstået. Gennem detaljeret forskning fandt Snowflake frem til en arkitektur, der anvender 128 eksperter med top-2 gating i hvert lag efter at have evaluereet kvalitets-effektivitets-tradeoffs.

At øge antallet af eksperter giver flere kombinationer, hvilket forbedrer modelkapaciteten. Men dette øger også kommunikationsomkostningerne, så Snowflake valgte 128 omhyggeligt designede “kondensed” eksperter, der aktiveres via top-2 gating som det optimale balance.

System Co-Design Men selv en optimal modelarkitektur kan undermineres af systembottlenecks. Så Snowflakes hold innoverede også her – ved at co-designe modelarkitekturen hånd i hånd med den underliggende trænings- og inferenssystem.

Til effektiv træning blev de dense og MoE-komponenter struktureret til at enable overlappende kommunikation og beregning, hvilket skjuler betydelige kommunikationsomkostninger. På inferenssiden udnyttede holdet NVIDIAs innovationer til at enable meget effektiv udvikling, på trods af Arctics størrelse.

Teknikker som FP8-kvantificering tillader at placere den fulde model på en enkelt GPU-node til interaktiv inferens. Større batcher engagerer Arctics paralleliseringsfunktioner på tværs af multiple noder, mens de forbliver imponerende beregnings-effektive takket være deres kompakte 17B aktive parametre.

Med en Apache 2.0-licens er Arctics vægte og kode tilgængelige uden begrænsninger til personligt, forsknings- eller kommercielt brug. Men Snowflake er gået langt videre, ved at åbne deres komplette dataopskrifter, modelimplementeringer, tips og dybe forskningsindsigt, der driver Arctic.

“Arctic Cookbook” er en omfattende videnbase, der dækker hver enkelt aspekt af at bygge og optimere en stor MoE-model som Arctic. Den destillerer nøglelæring på tværs af datakilder, modelarkitekturdesign, system co-design, optimerede trænings-/inference-schemer og mere.

Fra at identificere optimale datakurriculum til at arkitekturere MoE’er, mens man co-optimerer compilere, schedulere og hardware – denne omfattende videnbase demokratiserer færdigheder, der tidligere var begrænset til elite-AI-laboratorier. Arctic Cookbook accelererer læringskurver og giver virksomheder, forskere og udviklere globalt mulighed for at skabe deres egne kosteffektive, tilpassede LLM’er til næsten enhver brugstilfælde.

Kom i gang med Arctic

For virksomheder, der ønsker at udnytte Arctic, tilbyder Snowflake flere muligheder for at komme i gang hurtigt:

Serverless Inferens: Snowflake-kunder kan få adgang til Arctic-modellen gratis på Snowflake Cortex, virksomhedens fuldt administrerede AI-platform. Ud over dette er Arctic tilgængelig på alle større modelkataloger som AWS, Microsoft Azure, NVIDIA og mere.

Start fra scratch: De åbne modelvægte og implementeringer giver udviklere mulighed for at integrere Arctic direkte i deres apps og tjenester. Arctic-repositoriet indeholder kodeeksempler, installationsvejledninger, finjusteringsopskrifter og mere.

Byg din egen model: Takket være Arctic Cookbooks udførlige vejledninger kan udviklere bygge deres egne brugerdefinerede MoE-modeller fra scratch, optimeret til enhver specialiseret brugstilfælde, ved hjælp af lærdomme fra Arctics udvikling.

En ny æra for åben virksomheds-AI Arctic er mere end bare en kraftfuld sprogmodel – det markerer en ny æra for åben, kosteffektiv og specialiseret AI-kapacitet, designet specifikt til virksomheder.

Fra at revolutionere dataanalyse og kodningsproduktivitet til at aktivere opgaveautomatisering og smartere applikationer, gør Arctics virksomheds-DNA den til et uovervindeligt valg over for generiske LLM’er. Og ved at åbne ikke kun modellen, men hele forskningsprocessen bag den, fremmer Snowflake en kultur af samarbejde, der vil hæve hele AI-økosystemet.

Da virksomhederne i stigende grad accepterer generativ AI, tilbyder Arctic en dristig skitse for udvikling af modeller, der er objektivt overlegne til produktionsarbejdsbelastninger og virksomhedsmiljøer. Dets samspil af avanceret forskning, usædvanlig effektivitet og en fast åben etos sætter en ny standard for at demokratisere AI’s transformative potentiale.

Her er et afsnit med kodeeksempler på, hvordan du kan bruge Snowflake Arctic-modellen:

Hands-On med Arctic

Nu, hvor vi har dækket, hvad der gør Arctic til noget virkelig banebrydende, lad os dykke ned i, hvordan udviklere og datavidenskabsfolk kan begynde at bruge denne kraftfulde model.
Ud af æsken er Arctic tilgængelig forudtrænet og klar til at blive deployet gennem større modelhubs som Hugging Face og partner-AI-platforme. Men dens sande kraft kommer frem, når den tilpasses og finjusteres til specifikke brugstilfælde.

Arctics Apache 2.0-licens giver fuld frihed til at integrere den i dine apps, tjenester eller brugerdefinerede AI-workflows. Lad os gå igennem nogle kodeeksempler, der bruger transformers-biblioteket til at komme i gang:

Grundlæggende inferens med Arctic


<p>from transformers import AutoTokenizer, AutoModelForCausalLM</p>

<p># Indlæs tokenizer og model
tokenizer = AutoTokenizer.from_pretrained("Snowflake/snowflake-arctic-instruct")
model = AutoModelForCausalLM.from_pretrained("Snowflake/snowflake-arctic-instruct")</p>

<p># Opret en simpel input og generer tekst
input_text = "Her er et grundlæggende spørgsmål: Hvad er hovedstaden i Frankrig?"
input_ids = tokenizer.encode(input_text, return_tensors="pt")</p>

<p># Generer respons med Arctic
output = model.generate(input_ids, max_length=150, do_sample=True, top_k=50, top_p=0.95, num_return_sequences=1)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)</p>

print(generated_text)

Dette burde give noget i retning af:

“Hovedstaden i Frankrig er Paris. Paris er den største by i Frankrig og landets økonomiske, politiske og kulturelle center. Det er hjem til berømte landemærker som Eiffel-tårnet, Louvre-museet og Notre-Dame-katedralen.”

Som du kan se, forstår Arctic problemfrit spørgsmålet og giver en detaljeret, grundet respons, der udnytter dens robuste sprogforståelseskvaliteter.

Finjustering til specialiserede opgaver

Selv om det er imponerende ud af æsken, skinner Arctic virkelig, når den tilpasses og finjusteres på din egen data til specialiserede opgaver. Snowflake har leveret omfattende opskrifter, der dækker:

Curering af højkvalitets træningsdata tilpasset til dit brugstilfælde
Implementering af tilpassede multi-stages træningskurriculum
Udnyttelse af effektive LoRA, P-Tuning eller FactorizedFusion finjusteringsmetoder
Optimale tilpasninger til SQL, kodning eller andre nøglevirksomhedsfærdigheder

Her er et eksempel på, hvordan du kan finjustere Arctic på dine egne kodningsdatasets ved hjælp af LoRA og Snowflakes opskrifter:


<p>from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import LoraConfig, get_peft_model, prepare_model_for_int8_training</p>

<p># Indlæs basis-Arctic-model
tokenizer = AutoTokenizer.from_pretrained("Snowflake/snowflake-arctic-instruct")
model = AutoModelForCausalLM.from_pretrained("Snowflake/snowflake-arctic-instruct", load_in_8bit=True)</p>

<p># Initialiser LoRA-konfiguration
lora_config = LoraConfig(
r=8,
lora_alpha=16,
target_modules=["query_key_value"],
lora_dropout=0.05,
bias="none",
task_type="CAUSAL_LM"
)</p>

<p># Forbered model til LoRA-finjustering
model = prepare_model_for_int8_training(model)
model = get_peft_model(model, lora_config)</p>

<p># Din kodningsdataset
data = load_coding_datasets()</p>

<p># Finjuster med Snowflakes opskrifter
train(model, data, ...)</p>

Dette kodeeksempel viser, hvordan du kan indlæse Arctic, initialisere en LoRA-konfiguration tilpasset til kodegenerering og derefter finjustere modellen på dine egne kodningsdatasets, ved hjælp af Snowflakes vejledning.

Tilpasset og finjusteret bliver Arctic til en privat powerhouse, der kan levere en ubesværet præstation på dine kernevirksomhedsarbejdsgange og stakeholderbehov.

Arctics hurtige innovationscyklus

En af de mest imponerende aspekter af Arctic er den lynhurtige takt, hvormed Snowflakes AI-forskningshold konceptualiserede, udviklede og frigav denne avancerede model til verden. Fra koncept til åben kilde tog hele Arctic-projektet under tre måneder og anvendte kun omkring en ottendedel af beregningsbudgettet, der normalt er nødvendigt for at træne lignende store sprogmodeller.

Denne evne til at hurtigt iterere, innovere og produktivisere avanceret AI-forskning er virkelig bemærkelsesværdig. Det demonstrerer Snowflakes dybe tekniske kompetencer og positionerer virksomheden til at fortsætte med at skubbe grænserne for udvikling af nye, virksomheds-optimiserede AI-kapaciteter.

Arctic-familien og indlejring

Arctic er kun begyndelsen på Snowflakes ambitioner i virksomheds-LLM-rummet. Virksomheden har allerede åbnet kilden for Snowflake Arctic Embed-familien af branchens førende tekstindlejningsmodeller, der er optimeret til hentningspræstationer på tværs af flere størrelsesprofiler.

Som vist nedenfor opnår Arctic Embed-modellerne state-of-the-art hentningsnøjagtighed på den respekterede MTEB (teksthentning)-benchmark, overgående andre førende indlejningsmodeller, herunder lukkede tilbud fra større teknologivirksomheder.

[Indsæt billede, der viser MTEB-hentningsbenchmark-resultater for Arctic Embed-modeller]

Disse indlejningsmodeller supplerer Arctic LLM og giver virksomheder mulighed for at bygge kraftfulde spørgsmål-svar og hentningsforstærket generationsløsninger fra en integreret åben kilde-stak.

Men Snowflakes vejledning strækker sig langt ud over blot Arctic og indlejring. Virksomhedens AI-forskere arbejder hårdt på at udvide Arctic-familien med nye modeller tilpasset til multimodale opgaver, tale, video og mere frontierskapaciteter – alle bygget med samme principper om specialisering, effektivitet og åbenhed.

Partnerskab for et åbent AI-økosystem Snowflake forstår, at realiseringen af det fulde potentiale for åben, virksomhedsgradig AI kræver dyrkning af et rigt økosystem af partnerskaber på tværs af AI-fællesskabet. Arctics frigivelse har allerede galvaniseret samarbejder med større platforme og leverandører:

NVIDIA har tæt samarbejdet med Snowflake for at optimere Arctic til effektiv udvikling ved hjælp af NVIDIAs avancerede AI-inferensstak, herunder TensorRT, Triton og mere. Dette giver virksomheder mulighed for at servere Arctic på en større skala til en rimelig pris.

Hugging Face, den førende åbne kilde-modelhub, har velkommen Arctic i deres biblioteker og model-repositorier. Dette giver mulighed for en naiv integration af Arctic i eksisterende Hugging Face-baserede AI-workflows og -applikationer.

Platforme som Replicate, SageMaker og mere har hurtigt tilbudt værter, API’er og flinke integrationsveje for Arctic, hvilket accelererer dens adoption.

Åben kilde styrede udviklingen af Arctic, og åbne økosystemer forbliver centrale for dens udvikling. Snowflake er dedikeret til at fremme rigt samarbejde med forskere, udviklere, partnere og virksomheder globalt for at skubbe grænserne for, hvad der er muligt med åbne, specialiserede AI-modeller.

Accelererende dens adoption. Åben kilde styrede udviklingen af Arctic, og åbne økosystemer forbliver centrale for dens udvikling. Snowflake er dedikeret til at fremme rigt samarbejde med forskere, udviklere, partnere og virksomheder globalt for at skubbe grænserne for, hvad der er muligt med åbne, specialiserede AI-modeller.

Aayush Mittal, Mittal

Jeg har brugt de sidste fem år på at dykke ned i den fascinerende verden af Machine Learning og Deep Learning. Min passion og ekspertise har ført mig til at bidrage til over 50 forskellige software-ingeniørprojekter, med en særlig fokus på AI/ML. Min fortsatte nysgerrighed har også ført mig mod Natural Language Processing, et felt jeg er ivrig efter at udforske yderligere.