Andersonin kulma
Tekoäly voi auttaa tunnistamaan “pink slime” -uutiset

Agendan mukaiset mielipidemyllyt, jotka on suunniteltu vaikuttamaan enemmän yleiseen mielipiteeseen kuin palvelemaan yleisöä, saattavat olla vaikeampia havaita, jos tekoälyä käytetään tekemään niistä kuulostamaan enemmän alkuperäisiltä ja järkeviltä. Niinpä kilpailu on käynnissä pysyäkseen edellä “pink slime -havaitsemis” -pelissä.
Perinteisten paikallisten media-alustojen rahoituksen loppuminen viimeisen 20 vuoden aikana sekä median kehitystrendeihin että viimeaikaisiin Yhdysvaltain hallituksen politiikkaan liittyvien syiden vuoksi on jättänyt tyhjiön alueelliseen uutisointiin, jonka puolueelliset organisaatiot ovat innostuneesti ottaneet haltuunsa tekoälyä hyödyntäen agendansa ajamiseen.
“Puolueellinen” -termiä tarkasteltaessa (koska mikään uutisorganisaatio ei ole täysin vapaa poliittisista taipumuksista), puhumme öljy-yhtiöistä, jotka pyörittävät paikallisia uutissivustoja etäältä ilman paikallisia resursseja, mutta joiden tehtävänä on puolustaa yhtiön julkista mainetta; poliittisesti motivoituneista uutissivustoista, joilla ei ole tulovirtaa, jotka valmistautuvat vaaleihin; ja koko verkostoista republikaanien uutissivustoista, jotka ilmaantuvat yhtäkkiä, lähellä äänestystä.
Vuonna 2024 arvioitiin, että tekoälyohjattu “pink slime” -uutisointi oli viimein ylittänyt aidosti uutismedian; tuolloin australialainen tutkimus osoitti, että 41 %:lla kuluttajista suositi “pink slime” -lähteitä “oikeiden” lähteiden sijaan.
Tämänkaltaista salaa vaikuttamista voidaan väittää kehittyneen pelkästä pimeästä taiteesta olemassaoloksi uhaksi demokratalle (poliittisesti motivoituneiden uutissivustojen suhteen) ja julkisen luottamuksen kohtuullisiin uutisointivaihtoehtoihin.
Menetelmiä, joilla voidaan erottaa “pink slime” -julkaisijoiden ja uutissivustojen ominaisuuksia perinteisemmistä media-alustoista, olisi suuresti avuksi ainakin ymmärtääkseen, ketkä ovat toimijat ja voimat, jotka vaikuttavat nykyiseen tietoklimaattiin.
Koska perinteisten uutisorganisaatioiden kaavat ja mallit ovat erittäin helppoja jäljitellä, ja tekoäly tekee skaalautuvan julkaisemisen nykyään ja edullisesti, käyttäen monia samoja temppuja, jotka ovat omaksuttu myös “vanhan median” kustantajien ja uutissivustojen toimesta.
Signaali ja kohina
Yhdysvaltalainen tutkimus käsittelee tätä ongelmaa tutkimalla kasvavaa tekoälyn käyttöä “pink slime” -sivustojen tekemiseen vähemmän geneerisiksi ja helpommin havaittaviksi, ja luomalla oppimisviitekehyksen, joka on suunniteltu pysymään mukana “pink slime” -muutosten kehityksessä.
Tutkimuksen otsikko on Pink Slime -journalismin paljastaminen: kielelliset signaalit ja kestävä havaitseminen LLM:ien luomia uhkia vastaan, ja se on tehty viidelle tutkijalle Texasin yliopistosta.
Tutkimus tutkii, miten massatuotetut paikalliset “pink slime” -uutiset eroavat legitiimeistä uutisoinnista, keskittyen niiden riippuvuuteen lyhyistä, toistuvista rakenteista ja mallipohjaisista lauseista vähäisellä muuntelulla; ja tutkijat toteavat, että “pink slime” -artikkeleissa uudelleen käytetään samoja malleja, jotka on suunniteltu vaikuttamaan yleiseen mielipiteeseen, ja jotka korostavat tunteita sisällössään:

Tutkimuksesta – useat sivustot julkaisevat lähes identtisiä artikkeleita, joissa on vain sijaintitiedot muutettu, paljastaen kopiointistrategian, jolla luodaan sisältöä, joka jäljittelee legitiimiä paikallista uutisointia. Lähde
Perinteiset havaitsemismallit, jotka on koulutettu näille piirteille, toimivat hyvin tällaisia sisältöjä vastaan, mutta epäonnistuvat, kun artikkeleita uudelleen kirjoitetaan tekoälyllä, jotta ne kuulostaisivat enemmän luonnollisilta tai sofistikoituneilta.
Tutkijoiden omat testit osoittavat, että jopa pienet tyyliin liittyvät muutokset, jotka tekoälyllä tehdään, voivat laskea havaitsemistarkkuuden jopa 40 prosentilla. Tätä vastaan tutkijat ehdottavat jatkuvaan oppimiseen perustuvaa viitekehyksen, joka kouluttaa uudelleen havaitsemismalleja sekä alkuperäisistä että tekoälyllä uudelleen kirjoitetuista artikkeleista, sopeutumaan muuttuviin kielellisiin malleihin.
Menetelmä
Tutkimuksen aineiston luomiseksi tutkijat käyttivät Pink Slime -tietokantaa, joka sisältää 7,9 miljoonaa artikkelia, jotka kattavat 1093 sivustoa vuosina 2021-2023, ja saivat 9472 “pink slime” -artikkelia suodattamisen jälkeen. He käyttivät myös LIAR-tietokantaa, joka sisältää merkittyjä vääriä uutisia, sekä NELA-GT-2021 -kokoelmaa, joka sisältää ainoastaan Yhdysvaltojen artikkeleita*.
Tutkijat käyttivät T-distributed Stochastic Neighbor Embedding (t-SNE) -algoritmiä vähentämään artikkeleiden upotukset kahteen ulottuvuuteen. Sitten he sovelsivat dataklusterointialgoritmi Density-Based-Spatial-Clustering-of-Applications-with-Noise (DBSCAN) erottamaan samankaltaisia “pink slime” -artikkeleita.
Kunkin klusterin kohdalla tutkijat käsitelivät sen ryhmänä liittyviä tarinoita, joista useat seurasivat edelleen samaa mallia, vaikka tutkijat pyrkivät poistamaan duplikaatit.
Estämään samankaltaisten artikkeleiden esiintymistä sekä koulutus- että testijoukoissa, tutkijat valitsivat satunnaisesti koko klusterin, ja käyttivät 80 % koulutukseen ja 20 % testaukseen. Koska legitiimit uutiset eivät muodostaneet selkeästi määriteltyjä klustereita, tutkijat sovelsivat satunnaisen jakoa sen sijaan.
Tätä prosessia toistettiin kolme kertaa, varmistaakseen johdonmukaisuuden ja vähentääksesi otantavirhettä.
Pink Slimen ominaisuudet
Kommentoidessaan “pink slimen” ja tavallisen uutisoinnin erottavia piirteitä, tutkijat toteavat, että “pink slime” -tyyliset paikalliset uutisartikkeleissa on merkittävästi lyhyempiä ja yksinkertaisempia kuin legitiimi uutisointi, ja ne keskimäärin sisältävät vähemmän kuin yhdeksän lausetta artikkelia kohden.
Suurempi osuus yksinkertaisia lauseita ja suurempi riippuvuus adjektiiveista ovat “pink slimelle” tyypillisiä, kuten tutkimus toteaa, ja ne osoittavat taipumusta toistuvaan, emotionaalisesti latautuneeseen kieleen.
Sanavarallisuus mitattiin Root-Type-Token-Ratio (RTTR) -menetelmällä, ja se osoittautui selvästi alhaisemmaksi “pink slime” -artikkeleissa, jotka myös sisälsivät paljon vähemmän yksilöllisiä substantiivifraseja.
Nämä mallit osoittavat rajoitetun sanaston ja kaavan, joka on vastakohtainen legitiimille paikallisille uutisille, joissa on monimutkaisia part-of-speech -malleja, jotka perustuvat apuverbeihin, pronomineihin ja konjunktioihin. Sen sijaan väärit artikkeleissa suositaan perusnomini-prepositio-rakenteita, joissa käytetään usein pisteperäisiä trigrameja, mikä viittaa vähemmän viralliseen, hajanaisempaan tyyliin.
Testit
Tutkijat arvioivat kahta pääasiallista lähestymistapaa “pink slime” -sisällön havaitsemiseksi: luokittelu, joka perustuu käsinkirjoitettuihin kielellisiin piirteisiin; ja transformer-pohjainen hienosäätö.
Käsinkirjoitetussa lähestymistavassa korostettiin rakenteellisia ominaisuuksia semanttisten sijaan, käyttäen lauseiden määrää; sanavarallisuutta; syntaktista syvyyttä; part-of-speech -yhteistyön todennäköisyyksiä; riippuvuuden yhteistyön todennäköisyyksiä; lukukelpoisuutta; ja part-of-speech -laskureita.
Kolme mallia testattiin tällä ominaisuusjoukolla: XGBoost; Random Forest; ja Support Vector Machine (SVM) – malli, jossa Random Forest osoitti hieman vahvempia tuloksia yleisesti.
Molemmat XGBoost ja Random Forest antoivat korkean ennusteen tärkeyden ominaisuuksille, kuten lauseiden määrälle ja yksilöllisten substantiivifrazien määrälle. Lukukelpoisuus ja sanavarallisuus mitat vaikuttivat myös luokitteluun, vaikka mallit painottivat niitä eri tavoin, XGBoost suosien Flesch- ja RTTR -mittoja, kun taas Random Forest suosi CTTR:ää.

Ominaisuuden tärkeysarvot, jotka perustuvat SHAP: iin (SHapley Additive exPlanations), korostavat, miten kunkin syötteen ominaisuus vaikuttaa mallin tuloksiin. Tässä tapauksessa SHAP-arvot paljastavat, että sekä XGBoost että Random Forest luottivat eniten lauseiden määrään ja yksilöllisiin substantiivifraaseihin erottamaan pink slime -artikkeleita oikeista uutisista, ja antoivat eri painoarvoja sanavarallisuuden ja lukukelpoisuuden mittareille.
Kuten aiemmissa ominaisuusvertailuissa näkyy, “pink slime” -artikkeleissa suositaan sensaatiota yksityiskohtien sijaan, vähäisemmällä sanavarallisuudella ja vähemmän yksilöllisillä substantiivifraaseilla – vahvistaen johtopäätöstä, että tällainen sisältö on erittäin kaavamaisen ja toistuvan.
Part-of-speech -trigrammit vahvistavat, että legitiimi paikallinen uutisointi suosii monimutkaisempia rakenteita, jotka sisältävät apuverbejä, pronomineja ja konjunktioita, kun taas “pink slime” suosii perusrakenteita ja yksinkertaisia lauseita, usein pisteperäisillä trigrameilla, mikä viittaa vähemmän viralliseen ja hajanaisempaan tyyliin.
Toisessa testikierroksessa tutkijat hienosäätöivät transformer-malleja koko artikkelien tekstiin, jotta ne voivat havaita sekä semanttisen sisällön että syntaktisen rakenteen.
BERT, XLNet ja Flan-T5 testattiin, ja BERT saavutti korkeimman F1-lukeman 89,31 prosentilla – vaikka tutkimus toteaa, ettei suorituskykyerojen välillä ollut tilastollisesti merkittävää eroa. Toisin kuin käsinkirjoitetut luokittelijat, nämä mallit päivittävät kaikki painot koulutuksen aikana, mikä mahdollistaa niiden oppimisen tehtävän mukaisia edustuksia suoraan aineistosta.
Lisäksi yksi upotuspohjainen menetelmä, jossa käytettiin täysin yhdistettyä alimallia, suoritti paremmin kuin käsinkirjoitetut mallit, mutta ei saavuttanut hienosäätöiden tarkkuutta.
Nämä lähestymistavat hyötyivät laajemmasta kielellisestä kontekstista – mikä on edullista, koska “pink slime” -artikkeleissa usein kierrätetään sisältöä eri sivustoilla. Käsinkirjoitetut ominaisuudet, toisaalta, riippuvat ainoastaan pinnan tason syntaksista, mikä rajoittaa niiden kykyä yleistää eri lähteiden yli.
Havaitseminen
Tutkijat arvioivat kahta pääasiallista lähestymistapaa “pink slime” -sisällön havaitsemiseksi: luokittelu, joka perustuu käsinkirjoitettuihin kielellisiin piirteisiin; ja transformer-pohjainen hienosäätö.
Käsinkirjoitetussa lähestymistavassa korostettiin rakenteellisia ominaisuuksia semanttisten sijaan, käyttäen lauseiden määrää; sanavarallisuutta; syntaktista syvyyttä; part-of-speech -yhteistyön todennäköisyyksiä; riippuvuuden yhteistyön todennäköisyyksiä; lukukelpoisuutta; ja part-of-speech -laskureita.
kolme mallia testattiin tällä ominaisuusjoukolla: XGBoost; Random Forest; ja Support Vector Machine (SVM) – malli, jossa Random Forest osoitti hieman vahvempia tuloksia yleisesti.
Molemmat XGBoost ja Random Forest antoivat korkean ennusteen tärkeyden ominaisuuksille, kuten lauseiden määrälle ja yksilöllisten substantiivifrazien määrälle. Lukukelpoisuus ja sanavarallisuus mitat vaikuttivat myös luokitteluun, vaikka mallit painottivat niitä eri tavoin, XGBoost suosien Flesch- ja RTTR -mittoja, kun taas Random Forest suosi CTTR:ää.

Ominaisuuden tärkeysarvot, jotka perustuvat SHAP: iin (SHapley Additive exPlanations), korostavat, miten kunkin syötteen ominaisuus vaikuttaa mallin tuloksiin. Tässä tapauksessa SHAP-arvot paljastavat, että sekä XGBoost että Random Forest luottivat eniten lauseiden määrään ja yksilöllisiin substantiivifraaseihin erottamaan pink slime -artikkeleita oikeista uutisista, ja antoivat eri painoarvoja sanavarallisuuden ja lukukelpoisuuden mittareille.
Kuten aiemmissa ominaisuusvertailuissa näkyy, “pink slime” -artikkeleissa suositaan sensaatiota yksityiskohtien sijaan, vähäisemmällä sanavarallisuudella ja vähemmän yksilöllisillä substantiivifraaseilla – vahvistaen johtopäätöstä, että tällainen sisältö on erittäin kaavamaisen ja toistuvan.
Part-of-speech -trigrammit vahvistavat, että legitiimi paikallinen uutisointi suosii monimutkaisempia rakenteita, jotka sisältävät apuverbejä, pronomineja ja konjunktioita, kun taas “pink slime” suosii perusrakenteita ja yksinkertaisia lauseita, usein pisteperäisillä trigrameilla, mikä viittaa vähemmän viralliseen ja hajanaisempaan tyyliin.
Toisessa testikierroksessa tutkijat hienosäätöivät transformer-malleja koko artikkelien tekstiin, jotta ne voivat havaita sekä semanttisen sisällön että syntaktisen rakenteen.
BERT, XLNet ja Flan-T5 testattiin, ja BERT saavutti korkeimman F1-lukeman 89,31 prosentilla – vaikka tutkimus toteaa, ettei suorituskykyerojen välillä ollut tilastollisesti merkittävää eroa. Toisin kuin käsinkirjoitetut luokittelijat, nämä mallit päivittävät kaikki painot koulutuksen aikana, mikä mahdollistaa niiden oppimisen tehtävän mukaisia edustuksia suoraan aineistosta.
Lisäksi yksi upotuspohjainen menetelmä, jossa käytettiin täysin yhdistettyä alimallia, suoritti paremmin kuin käsinkirjoitetut mallit, mutta ei saavuttanut hienosäätöiden tarkkuutta.
Nämä lähestymistavat hyötyivät laajemmasta kielellisestä kontekstista – mikä on edullista, koska “pink slime” -artikkeleissa usein kierrätetään sisältöä eri sivustoilla. Käsinkirjoitetut ominaisuudet, toisaalta, riippuvat ainoastaan pinnan tason syntaksista, mikä rajoittaa niiden kykyä yleistää eri lähteiden yli.
Pink Slimen tehostaminen LLM:llä
Tutkijat testasivat, voivatko “pink slime” -artikkeleita tehdä vaikeammaksi havaita kirjoittamalla ne uudelleen suurilla kielimalleilla. Ohjelmat suunniteltiin parantamaan kirjoitustyyliä laajentamalla sisältöä, lisäämällä lauseiden monimutkaisuutta, vähentämällä adjektiivien yliksiitäntää, asettamalla neutraalin sävyn, käyttämällä monipuolisempaa sanastoa ja lisäämällä yksilöllisten substantiivifrazien määrää, tavoitteena piilottaa pinnan tasolla olevat piirteet, joista useimmat havaitsemisjärjestelmät riippuvat.
Mallit, jotka testattiin, olivat Gemma-2B; Mistral-7B; Llama-1B; Llama-3B; Llama-8B; Qwen-7B; GPT-4o mini; ja Claude-3.5-Haiku.

Hienosäätöiden BERT-luokittelijan havaitsemistehokkuus (F1), kun pink slime -artikkeleita uudelleenkirjoitetaan eri LLM:llä. Alempien arvojen osoittama suurempi onnistumisen määrä piilottaa havaitsemisen.
Tutkijat toteavat:
‘Avoinna olevien mallien joukossa Qwen oli tehokkain havaitsemisen välttämisessä: kun sitä testattiin aiemmin hienosäätöityn BERT-luokittelijan (perusviitearvo F1: 89%) kanssa, se aiheutti 28,34 prosentin laskun havaitsemistehokkuudessa.’
‘Suljettujen mallien vaikutus oli merkittävästi voimakkaampi, ja sekä GPT-4o-mini että Claude-3.5-Haiku laskivat F1-arvoa keskimäärin 40 prosentilla, korostaen haasteen, jonka korkealaatuiset LLM:llä luodut hämäykset aiheuttavat.’
Tutkijat väittävät, että nämä tulokset osoittavat, kuinka helposti LLM:t voivat piilottaa “pink slime” -sisällön, mikä tekee siitä paljon vaikeamman nykyisten työkalujen havaita.
Johtopäätös
Mielipide Tässä tutkimuksessa on joitakin mielenkiintoisia paradokseja, joista yksi on, että niin monet ihmiset (ainakin yhden mainitun tutkimuksen mukaan) tukevat “pink slime” -sisältöä, tietäen, mitä se on, mikä asettaa kielteisen kontekstin kyseenalaiseksi. On kuin ihmiset tietäisivät, että “Soylent Green on ihmisiä”, mutta he kohauttavat olkansa ja jatkavat syömistä; tai niin voi näyttää, liberaalista näkökulmasta katsottuna.
Tämä yleisön välinpitämättömyys algoritmisen uutisoinnin suhteen saattaa kehittyä ja jopa kääntyä takaisin – mutta toistaiseksi se näyttää syvenevän.
Toinen asia, joka minua askarrutti tutkimusta lukiessani, oli se, miten “pink slimen” yksinkertaisempi proosa ja reduktionismi kohdeltiin puutteena, jolla on tekninen ratkaisu, kun taas minimalismi, emotionalismi ja rajoitettu sanasto ovat selvästi tarkoituksenmukaisia.
Jos “pink slimen” taustalla olevat eri ryhmät haluavat laajentaa vaikutusvaltaansa enemmän älymystöön tai liberaaleihin, vaikka tämä ei välttämättä olisi heidän vahvuuksia, on todennäköisempää, että he perustavat leirinsä lähemmäs kohdeyleisöään, eikä muuta tyyliä ja sävyä, joka on jo saavuttanut heidän tavoitteensa olemassa olevilla alustoilla.
* Tutkimuksessa on valitettavasti jonkin verran huonoa muotoilua, eikä ylimääräinen paikallisten uutisten lähde ole selkeästi mainittu. Tutkimuksen lukijan on viitattava alkuperäiseen tutkimukseen ja arvioitava, kumpi “Horne” -viittauksista soveltuu.
** Tässä viitataan lukijaa alkuperäiseen tutkimukseen, jossa on tarkemmat tiedot tutkimuksen lopputuloksia ja lisätutkimuksia.
Julkaistu ensimmäisen kerran perjantaina, 12. joulukuuta 2025












