Connect with us

Tankeledere

Rensning af vores rodne data: Hvordan AI ændrer spillet

mm

Vi drukner i data. Hver platform, smartwatch og smartphone splitter vores liv op i kvantificerbare bidder, men det meste af det forbliver ukoherent og ubrugeligt. 

Virksomhederne ved dette, og det er derfor, tech-giganten Meta investerede 14 milliarder USD sidste sommer for at købe en 49% ejerandel i data-mærkningsstartuppen Scale AI, hvilket var en beregnet og strategisk beslutning for at sikre højkvalitets træningsdata til deres AI-modeller.

Pålideligheden af store sprogmodeller afhænger helt af kvaliteten af de data, de får – kort sagt, “skrald ind, skrald ud.” I dag er den virkelige udfordring, som virksomhederne står overfor, at omdanne en flod af rå information til handlingsdata. 

Løsningen kan være skjult i åbenlysning: AI selv kan hjælpe med at generere strategier til at omgå den kedelige opgave at mærke massive datasæt eller gennemgå endeløse regneark, og omdanne kaos til brugbar, menneskelig intelligens. 

Når data bliver rodne: De skjulte omkostninger for virksomheder

Ifølge Gartner-forskning fra 2020 koster dårlig datakvalitet organisationer mindst 12,9 millioner USD om året, hvilket påvirker produktiviteten og fører til dårligt informerede beslutninger og ukorrekte rapportering. 

Konsekvenserne af rodne data er endnu mere tydelige i sektorer som sundhedssektoren. Ufuldstændige sundhedsjournaler, faktureringsdetaljer og mismatchede data på tværs af systemer kan føre til misdiagnoser, behandlingsfejl og ineffektiv ressourceallokering. På længere sigt driver dette op for omkostningerne og undergraver tilliden til disse systemer.

Imens kan mismatchede data mellem leverandører og distributører i logistiksektoren føre til forsinkelser eller lagermangel. En forkert leveringsadresse eller en forældet lageroptegnelse kan have en rippleffekt på hele forsyningskæden, hvilket fører til missede deadline og utilfredse kunder. 

“Ved at kunne forudse eller forstå, hvad der kan ske [langs ruten] – baseret på kombineret, tidligere data – kan man virkelig reducere disse ineffektiviteter,” Asparuh Koev, CEO for logistik AI-virksomheden Transmetrics, bemærkede i en samtale med Unite AI.

I mere praktiske termer er rodne data kostbare. 1-10-100-reglen illustrerer dette: det koster 1 USD at kontrollere data, mens de indtastes, 10 USD at rense dem bagefter, og 100 USD, hvis intet gøres.

Hvad AI-drevne platforme bringer til bordet

Da virksomheder kæmper med stadig større mængder af snavset data, søger de efter løsninger i AI. Fremvoksende AI-drevne platforme automatiserer i dag datarengøringsprocessen, hvilket sikrer omkostningseffektivitet og forbedrer nøjagtighed.

Robert Giardina, grundlægger af Claritype, en sådan platform, forklarede AI-processen: 

“Det konvergerer data til en fælles format: en del af processen er at konvertere hver enkelt dato til en kanonisk format, der passer til virksomheden.” 

Claritypes AI går dog ud over enkel standardisering. Platformens supervised reparation tillader organisationer at krydse systemgrænser i jagten på svar på deres mest presserende spørgsmål, og bryder ned siloer. 

“Systemer, der tidligere var adskilt, indeholder hver især en del af svaret på spørgsmål, der omfatter hele virksomheden,” sagde Giardina til Unite AI

Hvis en nøgleleverandør påvirkes af en forsinkelse, kan virksomheden kun ved at tilknytte leverandører til ordrer og kundeinformation bestemme, hvilke af deres største kunder, der skal underrettes først om forsinkelsen.

“Vores ultimative mål er at udvide denne forbundne tænkning til at samle alle datafragmenter i virksomheden, så vi kan gøre hvert spørgsmål let og øjeblikkeligt at besvare,” sagde Giardina. 

Denne type forbundne tænkning repræsenterer den bredere ændring i mindset, der finder sted i virksomheder i dag, da de går over fra ad hoc-datarengøring til systematisk datastyring. I stedet for at behandle datakvalitet som en engangsreparation udvikler organisationer strukturerede processer til at sikre konsistens og pålidelighed på tværs af alle deres systemer.

Datastyring anses nu for at være en værdifuld forretningsproces, og ikke kun en IT-opgave. Ved at integrere datastyring i deres overordnede strategier kan virksomheder træffe bedre beslutninger og få mere meningsfulde indsighter fra deres data.

Hvordan AI rengør data og de udfordringer, det står overfor

At afhænge for meget af AI kan være farligt. For Giardina er “de bekymringsvækkende automatiske datakonverteringer dem, der går ud over standardiseringen og ind i gætværk.” 

For eksempel kan forkortelser let misfortolkes. “International Business Machines, Inc.” eller “I.B.M.” ville normalt blive konverteret til “IBM”, men hvis konverteringen var automatiseret, og “I.B.” blev forkert konverteret til “IBM”, kunne det medføre betydelige problemer for begge virksomheder.

Manglende og ukorrekte data er to af de mest almindelige problemer, og at afhænge udelukkende af AI til at udfylde hullerne i overensstemmelse med konteksten kan let mislykkes. Som Giardina påpeger, “når effekterne er på nogen måde betydelige, har vi brug for en menneskelig godkendelse af hver gæt.” 

Balance mellem automatisering og menneskelig indsigt

Rodne data fremhæver dybe fejl i, hvordan organisationer håndterer information. For at gå fremad og forbedre beslutningstagningen må virksomheder ophøre med at se på data som en ren teknisk sag og gå over til styringsmodeller, der kombinerer menneskelig ekspertise, etisk bevidsthed og en langsigtede strategisk vision. 

Renere data skaber mere effektiv AI, som igen hjælper med at forbedre datakvaliteten; denne gensidigt forstærkende cyklus er lovende, men fungerer som en påmindelse om, at automatisering alene ikke vil løse vores problem med rodne data. Denne potentiale kan kun realiseres ved at parre algoritmepræcision med menneskelig dømmekraft og en bevidsthed om de fordomme, det kan introducere, hvilket sikrer gennemsigtighed og mere tillid til de systemer, vi bygger.

Alex Sandoval, CEO for fremstillingsintelligens AI-firmaet, Allie AI, understregede også, hvordan generative AI-co-piloter ikke kun kører på algoritmer, men også afhænger af menneskelig flydighed i fabrikkens logik. 

“I dag er de mest succesfulde implementeringer ikke kun om at fodre modeller med store mængder programmerbar logik (PLC)-data, operatørnoter og overholdelsesprotokoller. De afhænger af en ny type frontlinjearbejder: en, der kan oversætte mellem maskinadfærd og digital intuition,” sagde han.

Gabrielle Degeorge er en journalist og multilingual kommunikationsspecialist med base i Rom, Italien. Hun har en master i specialiseret oversættelse fra Universitetet i Genève, og hendes arbejde understreger, hvordan AI samarbejder med mennesker for at forbedre industrier og samfund.