Andersons vinkel

Kan AI utveckla en nÀsa för nyheter?

mm
AI-generated image (GPT-1.5) featuring a dog journalist in a photorealistic newsroom, who has spotted a lead, and attracted the attention of his co-workers.

AI blir bättre på att skriva nyhetsartiklar, men blir inte mycket bättre på att identifiera dem.

 

Åsikt I de fem år som har gått sedan jag senast tittade på AI:s förmåga att hitta en het nyhetsstory, har landskapet förändrats avsevärt, med ökade nivåer av AI-driven automatisering åtföljd av de oundvikliga växande smärtorna och kontroverserna.

Nyligen presenterade en WSJ-rapport om en produktiv, AI-assisterad Fortune-medarbetare den framtida journalisten som befriad från triviala uppgifter som att translitterera pressmeddelanden, och lämnar utrymme för att skriva artiklar och göra research som bara större publikationer vanligtvis har budget för.

Men vad vi hör mycket mindre om är AI:s förmåga att upptäcka en nyhetsstory.

Bullerreducering

I artikeln från 2021 koncentrerade jag mig på författare som täckte forskningsområdet, eftersom det är där jag tillbringar mest av min tid; och kanske den största effekten som den nya AI-revolutionen har haft på det är att den skapade en oövervinnelig blizzard av AI-drivna forskningsartiklar, som höjer signal-till-brus-förhållandet så högt att även att täcka Arxiv AI-relaterade domäner komprehensivt är nu bortom en enskild persons förmåga.

Säkert är detta där AI excellerar – vid att iterera genom stora mängder data som människor inte kan lösa, för att hitta ‘utbrytare’ (som vi kommer till strax) på några sekunder som skulle ha tagit människor dagar, om de kunde ha gjort det alls.

Varför är AI fortfarande så dålig på att identifiera en het nyhetsstory från de tusentals, till och med tiotusentals, dagliga kandidater?

Bakåtriktad AI

Denna massiva spridning av AI-genererat innehåll sker långt bortom den akademiska sektorn som jag diskuterade tidigare. Sent förra året uppskattades att hälften av allt nytt skrivande på webben är nu ‘skrivet av AI’, med ännu större acceleration av denna trend förväntad. Därför är bullret öronbedövande överallt, inte bara inom akademin.

Även om det har skett viss framsteg i AI/algoritmisk identifiering av en ‘het’ story under de senaste åren, tenderar dessa system att koncentrera sig på stratifierade och förutsägbart organiserade dataflöden, vilket innebär att de bara kan fungera i en ganska skör kontext.

I detta avseende har Stanford-postdoktorand och tidigare New York Times-journalist Alexander Spangher gjort flera försök att definiera ‘nyhetsvärdighet’ i termer som kan tillämpas på maskinlärningsprocesser och statistisk analys; och har producerat bevis för automatiserad lead-generering i korpus såsom domstolsdokument, statliga räkningar och stadsrådsmöten, samt allmänna offentliga dokument – den typen av schemadriven utdata som Fortune’s AI-drivna skribent kan förvandla till 6-7 nyhetsartiklar om dagen:

VÀrmen i ordistributioner hÀmtade frÄn korpus av offentliga dokument. I det hÀr fallet kan vi se att 'auktoriserande' har ett högt vÀrde, kanske för att det representerar beslut, förÀndring och nyhet. KÀlla - https://arxiv.org/pdf/2311.09734

Värmen i ordistributioner hämtade från korpus av offentliga dokument. Källa

Men problemet med tillvägagångssätt som den Spangher-ledda 2023 erbjudandet Spåra nyhetsvärdigheten av offentliga dokument, är att de i typisk AI-anda, fokuserar på iakttagbara trender i data. Med andra ord, de observerar saker som gjorde bra nyheter tidigare, och fortsätter att leta efter mer av samma.

I den riktiga världen är oväntade källor nästan alltid en ‘one hit wonder’; och för hur obskyra de var, kunde ingen ha förutsett deras plötsliga framträdande. Sedan, efter att ha varit fruktbara en gång, och trots tillfälliga försök att kapitalisera på flyktig berömmelse eller notoritet, kommer de vanligtvis aldrig att producera något användbart igen.

Tecken på tiden

Därför, eftersom övervakning av denna typ av one-and-done-nyhetskälla vanligtvis bara kommer att lägga till mer buller till den allmänna blizzard, kan AI inte identifiera tecknen på en källa som en dag kommer att bli fruktbar? Om man kunde ta reda på vilken typ av källa som kan ge nyheter, kunde man fokusera på dess egenskaper snarare än dess kontext eller metoder.

Genom den logiken kunde man sluta sig till att vem som nyligen lämnat anställning hos CIA (eller en liknande organisation) skulle vara värt att följa som en potentiell källa till en framtida scoop.

Men det finns inga RSS-flöden eller API:er som sannolikt kan automatisera denna typ av kontinuerlig övervakning, eftersom LinkedIn och många andra tidigare öppna källor till data drar sig tillbaka inför rovlysten och laglösa AI-webbskrapare. Även om det fanns, skulle frekvens vara ett problem, eftersom man inte kan fråga en API eller en webbplats var femte sekund; förutom resurskostnaden, skulle IP-bannlysningar från plattformarna göra detta till en ohållbar aktivitet.

Det finns tydligt en ‘mänsklig dimension’ i sådana avslöjanden som är svåra att automatisera.

Nyhetsinsamling med personlig touch: bild frÄn en skivrelease av 1976 Ärs Alan Pakula-film 'All The President's Men', med informatören som kommer ut ur skuggan. KÀlla - https://blueprintreview.co.uk/2016/11/all-the-presidents-men/

Nyhetsinsamling med personlig touch: bild från en skivrelease av 1976 års Alan J. Pakula-film ‘All The President’s Men’, med informatören som kommer ut ur skuggan. Källa

Även i den riktiga världen är det förskräckligt svårt att identifiera definierande egenskaper hos en framtida nyhetskälla. Det är antagligen inte ‘personer som nyligen lämnat CIA’, och det är definitivt inte definierat av en protokoll: plattformar som X eller GitHub producerar för mycket signal i sig själva, och även om man begränsar sig till söktermer eller postkategorier, gör det liten skillnad – bara om man är involverad i problemet och engagerad i samhället (eller repo, etc.), är man verkligen benägen att känna igen betydelsen av en utveckling.

Även en term såsom ‘säkerhetsvarning’ kan inte ge sammanhang till den verkliga allvarligheten eller nyhetsvärdigheten av en incident, eftersom hänvisningar av det slaget kastas runt dagligen, tusentals gånger, i sådana samhällen – men har ingen bred nyhetsvärde; och även om man begränsar den typen av övervakning till engelska språket ensamt, skulle variationerna i idiom, tillsammans med användningen av otydlig språk, göra det mycket svårt att tolka en ‘i det vilda’ post till en sann nyhetsvarning.

Den smala vägen

Den nuvarande skörden av AI-drivna nyhetsvärdighetsidentifieringssystem beror på formaliserade datastrukturer (såsom JSON-utdata från en API), eller informella datastrukturer som AI-utvecklade algoritmer har en chans att tolka till en strukturerad schema (såsom pressmeddelanden från en viss organisation):

En tolkad RSS/XML-flöde, som visar den rigida hierarkin av datacontainrar. KÀlla - https://www.xml.com/articles/2023/03/06/visualising-xml-schemas/

En tolkad RSS/XML-flöde, som visar den rigida hierarkin av datacontainrar. Källa

Tydligt är att tillvägagångssätt av det här slaget är väl lämpade för programmatisk utdata, såsom det triviala arbetet som den ovannämnda Fortune-reportern förklarar att AI har befriat honom från, inklusive väder, aktier och sportresultat, samt rutinmässiga pressmeddelanden från kommunala och andra statliga organisationer.

Även om det är möjligt att fästa ‘mänskliga varningssignaler’ till statistiska flöden som väder (plötsliga stormar), aktier (plötsliga ras) och sport (oväntade segrar/förluster, med viss förberedelse), krävs fortfarande mänsklig uppmärksamhet, till och med för mycket stratifierade statliga utgåvor, för att bedöma nyhetsvärdighet.

Även om termer som ‘död’, ‘oväntad sjukdom’, ‘läcka’ och ‘olycka’ kan hjälpa till att identifiera nyhetsvärda händelser, kan de bara hantera ‘rutinmässiga’ händelser, och kan inte heller ta hänsyn till alternativt språk (eller språk).

Återkomsten av de elitiska författarna?

Under de senaste åren har data-driven journalistik blivit en framträdande del i nyhetsrapportering, med redaktionella avdelningar som inte längre är begränsade till ‘söta’ scoop-erbjudanden som ger dem tidig tillgång till specialrapporter och vitböcker från stora förlag; istället kan de krossa siffrorna själva.

Men detta är ingen gratis lunch; eftersom den uppenbara värdet av att tolka offentliga data med AI på det här sättet har växt, har en hyres-/AI-blockerande reaktion följt – eller till och med förutsagt – efterfrågan, och drivit de stora AI-spelarna in i smygaktiga taktiker.

Den extra friktionen från den nya tillbakadragningen återställer troligen en viss mängd makt från ‘medborgarjournalister’ tillbaka till traditionella medier – eller åtminstone, välfinansierade nyhetsorganisationer som har bandbredden att absorbera den extra manuella arbetet som krävs för att samla in, förädla och utvärdera data, i en era där förlag och domäner alltmer begränsar tillgången.

Så, på sätt och vis, kanske den praktiska manifestationen av AI i journalistik, i termer av hur stora aktörer och marknader har svarat på AI-baserad innovation och antagande, faktiskt kan ta oss tillbaka i tiden: avdemokratisera medlen för nyhetsproduktion, och lägga till hinder för meningsfulla data-drivna nyhetsvärdighetsbedömningssystem.

Gemensamma instinkter

Dessa begränsningar leder oss tydligt tillbaka till ‘magkänsla’ som en oundviklig komponent i att bedöma nyhetsvärdigheten av en story.

Naturligtvis är detta tröstande för dem som är professionellt engagerade i detta område; men självbelåtenhet vore ett misstag, eftersom denna instinkt, till viss del, kan destilleras och operationaliseras på ett mycket allmänt sätt som inte beror på att studera besattheter eller hobbyhästar hos en enskild person eller organisation: i en studie från 2022 använde forskare från Northwestern University crowd-sourced utvärderingar av potentiellt nyhetsvärda berättelser för att träna en prediktiv modell, specifikt inriktad på nyhetsvärdigheten av nyligen publicerade Arxiv-forskningsartiklar:

EnkÀtfrÄgor som gavs till studiedeltagare för att fÄ trÀningsdata för en 'nyhetsvÀrdighetsprediktions'-AI-modell. KÀlla - https://nishalsach.github.io/pdfs/2022-newsworthiness.pdf

Enkätfrågor som gavs till studiedeltagare för att få träningsdata för en ‘nyhetsvärdighetsprediktions’-AI-modell. Källa

Systemet rankar kandidater ganska bra, med cirka 80% av dess topp 10-val också bedömda som nyhetsvärda av experter. Men överensstämmelsen med experter visade sig vara måttlig, med resultaten som saknade faktorer som ramverk eller publikpassning.

Systemet bygger på principerna i 2020-papperet Computational News Discovery: Towards Design Considerations for Editorial Orientation Algorithms in Journalism. Som med de flesta liknande projekt, tacklar detta arbete vetenskapsjournalistik snarare än abstrakt nyhetsinsamling – kanske för att den vetenskapliga litteraturen tenderar mot mallbaserad utdata som potentiellt kan tolkas till träningsbara och tolkningsbara datapunkter.

Ja, som jag observerade 2021, skulle detta vara fallet, men forskningsvetare frekvent abuserar konventionerna för forskningsartikelsinskickning för att dölja eller nedspela imponerande resultat, eller till och med direkt misslyckande.

Ännu mer av en utmaning är den stora svårigheten som AI-system har med att tolka figurer och tabeller i vetenskapliga artiklar, till den grad att denna strävan nyligen har blivit en aktiv sträng i litteraturen:

FrÄn papperet 'SciFigDetect: A Benchmark for AI-Generated Scientific Figure Detection', som visar riktiga vetenskapliga figurer, deras genereringsprompt och syntetiska motsvarigheter producerade av Nano Banana och GPT över tre kategorier: illustration, översikt och experimentella figurer. KÀlla - https://arxiv.org/pdf/2604.08211v1

Från papperet ‘SciFigDetect: A Benchmark for AI-Generated Scientific Figure Detection’, som visar riktiga vetenskapliga figurer, deras genereringsprompt och syntetiska motsvarigheter producerade av Nano Banana och GPT över tre kategorier: illustration, översikt och experimentella figurer. Källa

Det är ofta fallet att en graf eller tabell innehåller resultat som huvuddelen av artikeln antingen rapporterar med selektiv bias eller annars ignorerar alla negativa konsekvenser som är implicita i tabellens/grafens resultat. Därför är denna vägspärr i AI-driven vetenskapsjournalistik inte en liten.

Mer talande är det faktum att en artikel är derivativ, eller bara en liten framsteg (om någon) på den befintliga kunskapsnivån, ofta begraven i en nästan ogenomtränglig citat (dvs. man måste söka efter termen, hitta en läsbar PDF-kopia och förstå omfattningen av den tidigare konsten, innan man kan förstå bristen på originalitet eller nyhet i det nya arbetet).

Ensam igen, naturligt

Den crowd-sourced metoden ovan antyder viss överensstämmelse mellan allmänna åsikter om potentiellt nyhetsvärda berättelser och professionell utvärdering av samma. Men utan sammanhang kan bara de breda dragen i nyhetsvärdighet bestämmas.

AI:s styrka ligger i dess förmåga, beroende på konfiguration, att isolera utbrytare – antingen för att kasta bort dem som en kurvblåsande och meningslös undantag till en trend i en datamängd, eller (mer relevant för nyhetsinsamling) för att identifiera meningsfulla och värdefulla ovanliga instanser och händelser:

Utbrytare (i rött) i en spridningsplot. KÀlla - https://stackoverflow.com/questions/73079324/python-removing-outliers-from-plotly-scatter-plot

Utbrytare (i rött) i en spridningsplot. Källa

På principen att blixten sällan slår två gånger är nästan alla nyhetsvärda berättelser utbrytare. I fall där de kommer från ett aktivt och volatilt område, såsom ett pågående krig, kan det området skannas noggrant med en hög sannolikhet för nyhetsvärda berättelser som kommer att dyka upp – men till priset av massiv kontrovers, eftersom allmän uppmärksamhet sannolikt också är fokuserad på området.

Många nyhetsvärda vetenskapliga ledtrådar är, per definition, inte centrum för språkfördelningen. De är sällsynta kombinationer av metoder, överraskande negativa resultat eller anomala replikationer. Om modellens kompetens försämras oproportionerligt på sådana lågfrekventa grupperingar, då blir den region där en redaktionell ‘näsa’ behöver vara skarp, den region där modellen är minst tillförlitlig.

Förtroendeproblem

Vid sökande efter nya berättelser balanserar journalister flera begränsningar, inklusive tid, tillgång, trovärdighet, publik och organisatoriska prioriteringar), vilket leder till icke-uppenbara val. En litteraturöversikt från 2022 från Danmark karakteriserade journalister som balanserande flera bekymmer, akut medvetna om att källor kan ha agendor eller vara felinformerade; och ofta kringgår direkt kontroll till förmån för indirekta förtroendesignaler när de arbetar under tryck.

De här ‘förtroendeproblemen’ skulle vara ett utvecklingshinder i något definitivt AI-drivet nyhetsvärdighetsidentifieringssystem, eftersom engagemang med en sådan plattform kräver att användaren litar på att alla algoritmiskt bortkastade artiklar verkligen inte är värda författarens tid.

Omfattande beta-testning och omträning eller finjustering, med mänsklig övervakning som plockar upp stragglare, kunde så småningom förbättra tillförlitligheten i ett sådant tillvägagångssätt; men en förändring i nationell eller global kultur – såsom överraskande förändringar i det politiska landskapet, eller utbrottet av krig – kunde oåterkalleligt störa alla grundläggande prioriteringar i ett sådant fint justerat system, och lämna den AI-baserade författaren att bygga om sin nödvändiga ‘inre domänmodell’ nästan från scratch.

 

Publicerad första gången måndagen den 20 april 2026.
Ändrad torsdagen den 23 april 2026 14:13:25, för att ersätta ‘WSJ’ med ‘Fortune’ i ‘Den smala vägen’, para 2 (tack till Mark Riley från mathison.ai för att ha påpekat det).

Författare pÄ maskinlÀrande, domÀnspecialist inom mÀnsklig bildsyntes. Före detta chef för forskningsinnehÄll pÄ Metaphysic.ai.