Connect with us

Udnyttelse af silicium: Hvordan interne chip-enheder former fremtiden for AI

Kunstig intelligens

Udnyttelse af silicium: Hvordan interne chip-enheder former fremtiden for AI

mm

Kunstig intelligens, ligesom alle andre software, afhænger af to grundlæggende komponenter: AI-programmerne, ofte omtalt som modeller, og den computermæssige hardware, eller chip, der driver disse programmer. Indtil nu har fokus i AI-udviklingen været på at forfine modellerne, mens hardwaren typisk blev set som en standardkomponent leveret af tredjepartsleverandører. Ligeledes har denne tilgang dog begyndt at ændre sig. Store AI-virksomheder som Google, Meta og Amazon har begyndt at udvikle deres egne AI-chip. Den interne udvikling af brugerdefinerede AI-chip markerer en ny æra i AI-fremgang. Denne artikel vil undersøge årsagerne bag denne ændring i tilgang og vil fremhæve de seneste udviklinger i dette udviklende område.

Hvorfor intern AI-chip-udvikling?

Skiftet mod intern udvikling af brugerdefinerede AI-chip drives af flere kritiske faktorer, som omfatter:

Øget efterspørgsel efter AI-chip

Oprettelse og brug af AI-modeller kræver betydelige computermæssige ressourcer for effektivt at håndtere store mængder data og generere præcise forudsigelser eller indsigt. Traditionelle computerchip kan ikke håndtere computermæssige krav, når der trænes på billioner af datapunkter. Dette har ført til oprettelsen af avancerede AI-chip, der specifikt er designet til at opfylde de høje ydelses- og effektivitetskrav for moderne AI-anvendelser. Da AI-forskning og -udvikling fortsætter med at vokse, stiger også efterspørgslen efter disse specialiserede chip.
Nvidia, en leder i produktionen af avancerede AI-chip og langt foran sine konkurrenter, oplever udfordringer, da efterspørgsel overgår deres produktionskapacitet. Dette har ført til, at ventelisten for Nvidia‘s AI-chip er forlænget til flere måneder, en forsinkelse, der fortsætter med at vokse, da efterspørgslen efter deres AI-chip stiger. Desuden oplever chipmarkedet, der inkluderer store spillere som Nvidia og Intel, udfordringer i chipproduktion. Dette problem stammer fra deres afhængighed af den taiwanesiske producent TSMC til chip-samling. Denne afhængighed af en enkelt producent fører til forlængede leveringstider for fremstilling af disse avancerede chip.

Gør AI-regningen energibesparende og bæredygtig

Den nuværende generation af AI-chip, der er designet til tung computering, har tendens til at forbruge meget strøm og generere betydelig varme. Dette har ført til betydelige miljømæssige konsekvenser for træning og brug af AI-modeller. OpenAI-forskere bemærker, at: Siden 2012 er den computermæssige kapacitet, der kræves for at træne avancerede AI-modeller, fordoblet hver 3,4 måned, hvilket tyder på, at ved 2040 kan udledning fra sektoren for information og kommunikation (ICT) udgøre 14% af de globale udledninger. En anden undersøgelse viste, at træning af en enkelt stor skala sprogmodel kan udledte op til 284.000 kg CO2, hvilket svarer til energiforbrug af fem biler i deres levetid. Desuden estimeres det, at energiforbrug i datacentre vil vokse 28 procent inden 2030. Disse resultater understreger nødvendigheden af at finde en balance mellem AI-udvikling og miljøansvar. Som svar investerer mange AI-virksomheder nu i udviklingen af mere energibesparende chip, med målet om at gøre AI-træning og -drift mere bæredygtig og miljøvenlig.

Tilpasse chip til specialiserede opgaver

Forskellige AI-processer har varierende computermæssige krav. For eksempel kræver træning af dybe læringmodeller betydelig computermæssig kapacitet og høj gennemstrømning for at håndtere store datasæt og udføre komplekse beregninger hurtigt. Chip, der er designet til træning, er optimeret til at forbedre disse operationer, forbedre hastighed og effektivitet. På den anden side kræver inferensprocessen, hvor en model anvender sin erhvervede viden til at lave forudsigelser, hurtig behandling med minimalt energiforbrug, især i edge-enheder som smartphones og IoT-enheder. Chip til inferens er konstrueret til at optimere ydelse pr. watt, sikrer prompt respons og batteribesparelse. Denne specifikke tilpasning af chip-design til træning og inferensopgaver tillader, at hver chip kan justeres præcist til sin intention, forbedrer ydelse på tværs af forskellige enheder og anvendelser. Denne form for specialisering understøtter ikke kun mere robuste AI-funktioner, men fremmer også større energibesparelse og økonomisk effektivitet i bred forstand.

Reducerer finansielle byrder

Den finansielle byrde for beregning til AI-modeltræning og -drift er fortsat betydelig. OpenAI bruger for eksempel en omfattende supercomputer oprettet af Microsoft til både træning og inferens siden 2020. Det kostede OpenAI omkring 12 millioner dollars at træne sin GPT-3-model, og omkostningerne steg til 100 millioner dollars for træning af GPT-4. Ifølge en rapport af SemiAnalysis har OpenAI brug for omkring 3.617 HGX A100-servere, i alt 28.936 GPU’er, for at understøtte ChatGPT, hvilket bringer den gennemsnitlige omkostning pr. forespørgsel til omkring 0,36 dollars. Med disse høje omkostninger i mente søger Sam Altman, administrerende direktør for OpenAI, ifølge en Bloomberg rapport efter betydelige investeringer for at opbygge et globalt netværk af AI-chip-produktionsfaciliteter.

Harnessing kontrol og innovation

Tredjeparts AI-chip kommer ofte med begrænsninger. Virksomheder, der afhænger af disse chip, kan finde sig selv begrænsede af standardløsninger, der ikke fuldt ud harmonerer med deres unikke AI-modeller eller -anvendelser. Intern chip-udvikling tillader tilpasning tilpasset specifikke brugsområder. Uanset om det er til autonome biler eller mobile enheder, giver kontrol over hardware virksomhederne mulighed for fuldt ud at udnytte deres AI-algoritmer. Tilpassede chip kan forbedre bestemte opgaver, reducere latency og forbedre den samlede ydelse.

Seneste fremskridt i AI-chip-udvikling

Dette afsnit dykker ned i de seneste fremskridt, der er gjort af Google, Meta og Amazon i opbygning af AI-chip-teknologi.

Googles Axion-processorer

Google har konstant fremgang i feltet af AI-chip-teknologi siden introduktionen af Tensor Processing Unit (TPU) i 2015. Bygget på denne grundlag har Google nyligt lanceret Axion Processorerne, deres første brugerdefinerede CPU’er specifikt designet til datacentre og AI-arbejdsbyrde. Disse processorer er baseret på Arm-arkitektur, kendt for deres effektivitet og kompakte design. Axion Processorerne sigter mod at forbedre effektiviteten af CPU-baseret AI-træning og -inferens, samtidig med at de opretholder energibesparelse. Denne fremgang markerer også en betydelig forbedring af ydelse for forskellige generelle arbejdsbyrder, herunder web- og app-servere, containeriserede mikrotjenester, åbne kilde-databaser, i-minde-caches, data-analyse-motorer, mediebehandling og mere.

Meta’s MTIA

Meta fører frem i AI-chip-teknologi med sin Meta Training and Inference Accelerator (MTIA). Dette værktøj er designet til at forbedre effektiviteten af træning og inferensprocesser, især for rangordnings- og anbefalingsalgoritmer. Meta har nyligt fremhævet, hvordan MTIA er en nøglekomponent i deres strategi for at styrke deres AI-infrastruktur ud over GPU’er. Oprindeligt planlagt til at lancere i 2025 har Meta allerede sat både versioner af MTIA i produktion, viser en hurtigere tempo i deres chip-udviklingsplaner. Mens MTIA i øjeblikket fokuserer på træning af bestemte typer algoritmer, sigter Meta mod at udvide dets brug til at omfatte træning for generativ AI, som deres Llama-sprogmodeller.

Amazon’s Trainium og Inferentia

Siden introduktionen af deres brugerdefinerede Nitro-chip i 2013 har Amazon udvidet sin AI-chip-udvikling betydeligt. Virksomheden har nyligt præsenteret to innovative AI-chip, Trainium og Inferentia. Trainium er specifikt designet til at forbedre AI-modeltræning og er planlagt til at blive integreret i EC2 UltraClusters. Disse clusters, der kan rumme op til 100.000 chip, er optimeret til træning af grundlæggende modeller og store sprogmodeller på en energibesparende måde. Inferentia, på den anden side, er tilpasset til inferensopgaver, hvor AI-modeller er aktivt anvendt, fokuserer på at reducere latency og omkostninger under inferens for bedre at betjene behovene for millioner af brugere, der interagerer med AI-drevne tjenester.

Det endelige punkt

Bevægelsen mod intern udvikling af brugerdefinerede AI-chip af store virksomheder som Google, Microsoft og Amazon afspejler en strategisk skift for at imødekomme de øgende computermæssige behov for AI-teknologier. Denne tendens fremhæver nødvendigheden for løsninger, der specifikt er tilpasset til at understøtte AI-modeller effektivt, og opfylder de unikke krav for disse avancerede systemer. Da efterspørgslen efter AI-chip fortsætter med at vokse, er det sandsynligt, at branchens ledere som Nvidia vil opleve en betydelig stigning i markedsværdi, hvilket understreger den vitale rol, som brugerdefinerede chip spiller i at fremme AI-innovation. Ved at opbygge deres egne chip forbedrer disse teknologigiganter ikke kun ydelsen og effektiviteten af deres AI-systemer, men fremmer også en mere bæredygtig og økonomisk fremtid. Denne udvikling sætter nye standarder i branchen, driver teknologisk fremgang og konkurrencemæssig fordel i et hurtigt ændrende globalt marked.

Dr. Tehseen Zia er en fastansat lektor ved COMSATS University Islamabad, med en ph.d. i AI fra Vienna University of Technology, Østrig. Specialiseret i kunstig intelligens, maskinlæring, datavidenskab og computer vision, har han gjort betydelige bidrag med publikationer i anerkendte videnskabelige tidsskrifter. Dr. Tehseen har også ledet forskellige industrielle projekter som hovedundersøger og fungeret som AI-rådgiver.