Meddelanden

Argonne National Laboratory lanserar stor skala AI-inferenstjÀnst för öppen vetenskap

mm

Kapplöpningen att bygga större AI-modeller har dominerat rubrikerna under många år, men en av de största utmaningarna inom vetenskaplig datoranvändning har förblivit i stort sett olöst: hur forskare kan använda avancerade AI-system i stor skala utan att bygga sin egen dyra infrastruktur.

Det är det problem som Argonne National Laboratory nu siktar på att lösa med lanseringen av vad de beskriver som den första stor skala AI-inferenstjänsten som är speciellt utformad för öppen vetenskap.

Den nya tjänsten, som utvecklats genom Argonne Leadership Computing Facility (ALCF), ger forskare moln-liknande åtkomst till stora språkmodeller, vetenskapliga grundmodeller och datorseende-system som körs direkt på Argonnes högpresterande datorinfrastruktur. Istället för att träna sina egna modeller eller hantera specialiserad maskinvara, kan forskare använda en delad inferenstjänst som är optimerad för storskaliga forskningsflöden.

Varför AI-inferens är viktig för vetenskap

Mycket av AI-samtalet har kretsat kring modellträning, men inferens är där AI-system blir praktiskt användbara. AI-inferens är det skede där tränade modeller analyserar data, genererar förutsägelser, tolkar resultat eller assisterar med beslutsfattande i realtid.

För vetenskaplig forskning kan inferens dramatiskt påskynda takten i experiment. Stora datamängder från partikelacceleratorer, teleskop, fusionsexperiment, genomicsprojekt och molekylsimuleringar kan ofta överväldiga traditionella analyspipeliner. AI-inferenssystem kan snabbt tolka dessa datamängder, vilket hjälper forskare att identifiera mönster eller avvikelser som annars skulle ta veckor eller månader att upptäcka.

Argonnes nya tjänst är avsedd att eliminera en stor flaskhals genom att göra avancerade inferensfunktioner tillgängliga som en central resurs istället för att kräva att varje institution distribuerar sin egen AI-stack.

Michael Papka, chef för ALCF, beskrev initiativet som en övergång från att erbjuda rå beräkningskraft till att tillhandahålla integrerade AI-aktiverade vetenskapliga tjänster.

En nationell AI-infrastruktur för forskning

Inferenstjänsten är nära kopplad till den amerikanska energidepartementets bredare Genesis Mission, en nationell initiativ som syftar till att accelerera vetenskaplig upptäckt genom AI-driven infrastruktur. Uppdraget syftar till att koppla samman superdatorer, vetenskapliga instrument och stora datamängder till ett enhetligt AI-ekosystem som kan stödja nästa generations forskning.

Argonnes system stöder redan forskare från flera DOE-laboratorier, inklusive Brookhaven National Laboratory, Lawrence Berkeley National Laboratory, Oak Ridge National Laboratory och Los Alamos National Laboratory. Den bredare visionen är att skapa en sammanhängande nationell forskningsplattform där AI-verktyg, experimentdata och superdatorresurser kan fungera tillsammans utan problem.

Detta är särskilt viktigt eftersom vetenskapliga AI-arbetsbelastningar alltmer involverar agenter som återkommande interagerar med simuleringsystem, databaser och analytiska verktyg. Dessa arbetsbelastningar kan generera enorma tokenkonsumtion och beräkningskostnader när de körs på kommersiella AI-plattformar. Argonnes infrastruktur är utformad för att stödja dessa arbetsbelastningar internt för vetenskapliga tillämpningar.

Teknologin bakom plattformen

Tjänsten ger tillgång till flera modellfamiljer, inklusive Googles Gemma-modeller, Metas LLaMA-familj och OpenAIs GPT-OSS-system, samt domänspecifika vetenskapliga grundmodeller och internt utvecklade system som AuroraGPT.

AuroraGPT är särskilt anmärkningsvärd eftersom den representerar Argonnes bredare ambition att bygga AI-system som tränats specifikt på vetenskaplig litteratur, datamängder och multimodala forskningsinmatningar. Projektet har utforskat extremt storskaliga arkitekturer som är optimerade för vetenskapligt resonemang och högpresterande datormiljöer.

Infrastrukturen i sig körs på dedikerade ALCF-system, inklusive Sophia och Metis, med planerad framtida expansion till NVIDIA-aktiverade system som heter Tara och Minerva.

Bortom chattrobotar: riktiga vetenskapliga tillämpningar

Medan den offentliga AI-diskussionen ofta kretsar kring konversationsassistenter, ligger Argonnes fokus fast på forskningsacceleration.

I fusionenergiforskning kan inferensmodeller övervaka plasma-beteende i realtid och potentiellt förutsäga störningar innan de inträffar. I astronomi och partikelfysik kan AI-system analysera enorma strömmar av teleskop- eller kollisionsdata för att identifiera sällsynta händelser mer effektivt. I kemi och materialvetenskap kan inferenssystem koordinera komplexa molekylsimuleringar och automatisera storskaliga beräkningsflöden.

Ett exempel som Argonne lyfter fram är ChemGraph, ett AI-drivet ramverk som är utformat för att förenkla molekylsimuleringsflöden. Systemet använder upprepad AI-verktygsanrop för att koordinera simuleringar, dataanalys och iterativ experiment i ett mer sammanhängande flöde.

Den bredare implikationen är att vetenskaplig datoranvändning utvecklas från isolerade superdatorjobb till kontinuerligt interaktiva AI-assisterade forskningsmiljöer.

Argonnes växande roll i AI-infrastruktur

Argonne National Laboratory grundades 1946 och har länge varit en av USA:s viktigaste vetenskapliga forskningsinstitutioner, särskilt inom högpresterande datoranvändning, energisystem, materialvetenskap och kärnforskning. Laboratoriet drivs av den amerikanska energidepartementet och har spelat en central roll i flera generationer av amerikansk superdatorinitiativ.

Under de senaste åren har Argonne blivit alltmer inflytelserik i AI-för-vetenskap-utveckling genom projekt som är kopplade till exaskalig datoranvändning och stora vetenskapliga grundmodeller. ALCF i sig rymmer några av landets mest avancerade datorsystem, inklusive Aurora, en av världens snabbaste superdatorer.

Lanseringen av inferenstjänsten speglar en större övergång som sker inom både akademi och företagsdatoranvändning: från fristående AI-modeller till integrerade AI-infrastrukturplattformar som kan stödja kontinuerliga, storskaliga resonemangsarbetsbelastningar.

För vetenskaplig forskning kunde den övergången potentiellt komprimera tidsintervallet mellan rådata-generering och meningsfull upptäckt.

Antoine Àr en visionÀr ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och frÀmja framtidens AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika störande för samhÀllet som elektricitet, och han fÄngas ofta i att prata om potentialen för störande teknologier och AGI.

Som en futurist, han Àr dedikerad till att utforska hur dessa innovationer kommer att forma vÄr vÀrld. Dessutom Àr han grundare av Securities.io, en plattform som fokuserar pÄ att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.