Artificiell intelligens
AI som forskare: Första vetenskapligt granskade forskningsartikel skriven utan mÀnniskor

Artificiell intelligens har passerat ytterligare en viktig milstolpe som utmanar vÄr förstÄelse av vad maskiner kan Ästadkomma pÄ egen hand. För första gÄngen i vetenskapens historia har ett AI-system skrivit en komplett forskningsartikel som har godkÀnts genom peer review vid en akademisk konferens utan nÄgon mÀnsklig hjÀlp i skrivprocessen. Detta genombrott kan vara ett fundamentalt skifte i hur vetenskaplig forskning kan bedrivas i framtiden.
Historisk prestation
En artikel producerad av The AI-forskare-v2 godkÀnde peer review-processen vid en workshop pÄ en internationell toppkonferens inom AI. Forskningen lÀmnades in till en ICLR 2025 workshopen, som Àr en av de mest prestigefyllda platserna inom maskininlÀrning. Artikeln genererades med hjÀlp av en förbÀttrad version av originalet AI-forskare, kallad AI-forskaren-v2.
Det accepterade dokumentet, med titeln âKompositionell regularisering: OvĂ€ntade hinder för att förbĂ€ttra generaliseringen av neurala nĂ€tverkâ, fick imponerande betyg frĂ„n mĂ€nskliga granskare. Av de tre artiklar som skickades in för granskning fick en betyg som placerade den över acceptansgrĂ€nsen. Detta genombrott Ă€r ett betydande framsteg eftersom AI nu kan delta i den grundlĂ€ggande processen för vetenskapliga upptĂ€ckter som har varit uteslutande mĂ€nsklig i Ă„rhundraden.
Forskargruppen frÄn Sakana AI, i samarbete med medarbetare frÄn University of British Columbia och University of Oxford, genomförde detta experiment. De fick godkÀnnande frÄn den institutionella granskningsnÀmnden och arbetade direkt med ICLR-konferensarrangörerna för att sÀkerstÀlla att experimentet följde korrekta vetenskapliga protokoll.
SĂ„ fungerar AI-forskaren-v2
AI Scientist-v2 har uppnÄtt denna framgÄng tack vare flera stora framsteg jÀmfört med dess företrÀdareTill skillnad frÄn sin föregÄngare eliminerar AI Scientist-v2 behovet av mÀnskligt skapade kodmallar, kan fungera över olika maskininlÀrningsdomÀner och anvÀnder en trÀdsökmetod för att utforska flera forskningsvÀgar samtidigt.
Systemet fungerar genom en heltÀckande process som speglar hur mÀnskliga forskare arbetar. Det börjar med att formulera vetenskapliga hypoteser baserade pÄ det forskningsomrÄde det har tilldelats att utforska. AI:n utformar sedan experiment för att testa dessa hypoteser, skriver den nödvÀndiga koden för att genomföra experimenten och kör dem automatiskt.
Det som gör det hÀr systemet sÀrskilt avancerat Àr dess anvÀndning av agentisk trÀdsökningsmetodik. Denna metod gör det möjligt för AI:n att utforska flera forskningsriktningar samtidigt, ungefÀr som hur mÀnskliga forskare kan övervÀga olika metoder för att lösa ett problem. Detta innebÀr att köra experiment via agentisk trÀdsökning, analysera resultat och generera ett utkast. En dedikerad experimentansvarig agent koordinerar hela processen för att sÀkerstÀlla att forskningen förblir fokuserad och produktiv.
Systemet inkluderar ocksÄ en förbÀttrad AI-granskare som anvÀnder vision-sprÄk modeller att ge feedback pÄ bÄde innehÄllet och den visuella presentationen av forskningsresultat. Detta skapar en iterativ förfiningsprocess dÀr AI:n kan förbÀttra sitt eget arbete baserat pÄ feedback, liknande hur mÀnskliga forskare förfinar sina manuskript baserat pÄ kollegors input.
Vad gjorde denna forskningsartikel speciell
Den accepterade artikeln fokuserade pÄ ett utmanande problem inom maskininlÀrning som kallas kompositionell generaliseringDetta hÀnvisar till neurala nÀtverks förmÄga att förstÄ och tillÀmpa inlÀrda koncept i nya kombinationer som de aldrig sett förut. AI Scientist-v2 undersökte nya regulariseringsmetoder som kan förbÀttra denna förmÄga.
Intressant nog rapporterade artikeln Àven negativa resultat. AI:n upptÀckte att vissa tillvÀgagÄngssÀtt som den antog skulle förbÀttra neurala nÀtverks prestanda faktiskt skapade ovÀntade hinder. Inom vetenskapen Àr negativa resultat vÀrdefulla eftersom de hindrar andra forskare frÄn att följa improduktiva vÀgar och bidrar till vÄr förstÄelse av vad som inte fungerar.
Forskningen följde rigorösa vetenskapliga standarder genom hela processen. AI Scientist-v2 genomförde flera experiment för att sÀkerstÀlla statistisk validitet, skapade tydliga visualiseringar av sina resultat och citerade korrekt relevant tidigare arbete. Hela manuskriptet formaterades enligt akademiska standarder och skrev omfattande diskussioner om sin metod och sina resultat.
De mÀnskliga forskarna som övervakade projektet genomförde sin egen grundliga granskning av alla tre genererade artiklar. De fann att Àven om den accepterade artikeln var av workshopkvalitet, innehöll den vissa tekniska problem som skulle förhindra godkÀnnande vid huvudkonferensens spÄr. Denna Àrliga bedömning visar de nuvarande begrÀnsningarna samtidigt som den erkÀnner de betydande framsteg som gjorts.
Tekniska funktioner och förbÀttringar
AI Scientist-v2 uppvisar flera anmÀrkningsvÀrda tekniska funktioner som skiljer den frÄn tidigare automatiserade forskningssystem. Systemet kan fungera inom olika maskininlÀrningsomrÄden utan att krÀva förskrivna kodmallar. Denna flexibilitet innebÀr att den kan anpassa sig till nya forskningsomrÄden och generera originella experimentella metoder snarare Àn att följa förutbestÀmda mönster.
TrÀdsökningsmetoden Àr en betydande innovation inom automatisering av AI-forskning. IstÀllet för att följa en enda forskningsriktning kan systemet upprÀtthÄlla flera hypoteser samtidigt och allokera berÀkningsresurser baserat pÄ vad varje riktning lovar. Denna metod speglar hur erfarna mÀnskliga forskare ofta upprÀtthÄller flera forskningstrÄdar samtidigt som de fokuserar mest pÄ de mest lovande vÀgarna.
En annan avgörande förbÀttring Àr integrationen av visionssprÄksmodeller för att granska och förfina de visuella elementen i forskningsartiklar. Vetenskapliga figurer och visualiseringar Àr avgörande för att effektivt kommunicera forskningsresultat. AI:n kan nu utvÀrdera och förbÀttra sina egna datavisualiseringar iterativt.
Systemet visar ocksÄ förstÄelse för vetenskapliga skrivkonventioner. Det strukturerar artiklar korrekt med lÀmpliga avsnitt, upprÀtthÄller konsekvent terminologi genom hela manuskriptet och skapar ett logiskt flöde mellan olika delar av forskningsberÀttelsen. AI:n visar medvetenhet om hur man presenterar metodologi, diskuterar begrÀnsningar och kontextualiserar resultat inom befintlig litteratur.
Aktuella begrÀnsningar och utmaningar
Trots denna historiska prestation begrÀnsar flera viktiga begrÀnsningar den nuvarande kapaciteten för AI-genererad forskning. Företaget uppgav att ingen av deras AI-genererade studier klarade deras interna standard för ICLR:s konferenspublikationsstandarder. Detta indikerar att Àven om AI kan producera forskning av workshopkvalitet, Àr det fortfarande svÄrt att nÄ de högsta nivÄerna av vetenskaplig publicering.
Antagningsgraden ger ett viktigt sammanhang för att utvĂ€rdera denna prestation. Artikeln accepterades vid ett workshopspĂ„r, vilket vanligtvis har mindre strikta krav Ă€n huvudkonferensen (60â70 % antagningsgrad jĂ€mfört med de 20â30 % som Ă€r typiska för huvudkonferensspĂ„r). Ăven om detta inte minskar betydelsen av prestationen, tyder det pĂ„ att det fortfarande Ă€r möjligt att producera verkligt banbrytande forskning inom AI:s nuvarande möjligheter.
AI Scientist-v2 uppvisade ocksÄ vissa svagheter som mÀnskliga forskare identifierat under sin granskningsprocess. Systemet gjorde ibland citeringsfel, vilket tillskrev forskningsresultat till felaktiga författare eller publikationer. Det hade ocksÄ problem med vissa aspekter av experimentell design som mÀnskliga experter skulle ha hanterat annorlunda.
Kanske viktigast av allt fokuserade den AI-genererade forskningen pÄ stegvisa förbÀttringar snarare Àn paradigmskiftande upptÀckter. Systemet verkar mer kapabelt att genomföra grundliga undersökningar inom etablerade forskningsramar Àn att föreslÄ helt nya sÀtt att tÀnka kring vetenskapliga problem.
VÀgen framför
Den framgĂ„ngsrika expertgranskningen av AI-genererad forskning Ă€r början pĂ„ en ny era inom vetenskaplig forskning. I takt med att grundmodellerna fortsĂ€tter att förbĂ€ttras kan vi förvĂ€nta oss att The AI ââScientist och liknande system kommer att producera alltmer sofistikerad forskning som nĂ€rmar sig och potentiellt övertrĂ€ffar mĂ€nskliga förmĂ„gor inom mĂ„nga omrĂ„den.
Forskargruppen förvÀntar sig att framtida versioner kommer att kunna producera artiklar vÀrda att accepteras vid konferenser och tidskrifter i toppklass. Den logiska utvecklingen tyder pÄ att AI-system sÄ smÄningom kan bidra till banbrytande upptÀckter inom omrÄden som strÀcker sig frÄn medicin till fysik och kemi.
Denna utveckling vÀcker ocksÄ viktiga frÄgor om forskningsetik och publikationsstandarder. VetenskapssamhÀllet mÄste utveckla nya normer för att hantera AI-genererad forskning, inklusive nÀr och hur man ska redovisa AI-inblandning och hur man ska utvÀrdera sÄdant arbete tillsammans med mÀnskligt genererad forskning.
Den transparens som forskargruppen visat i detta experiment ger en vÀrdefull modell för framtida utvÀrdering av AI-forskning. Genom att arbeta öppet med konferensarrangörer och utsÀtta deras AI-genererade arbete för samma standarder som mÀnsklig forskning har de skapat viktiga prejudikat för ansvarsfull utveckling av automatiserade forskningsfunktioner.
The Bottom Line
Att en artikel skriven om AI har tagits emot vid en ledande workshop om maskininlĂ€rning Ă€r ett betydande framsteg inom AI-kapacitet. Ăven om arbetet Ă€nnu inte har nĂ„tt en toppkonferens, visar det en tydlig riktning mot att AI-system ska bli seriösa bidragsgivare till vetenskapliga upptĂ€ckter. Utmaningen ligger nu inte bara i att utveckla tekniken utan ocksĂ„ i att forma de etiska och akademiska ramverk som kommer att styra denna nya forskningsfront.