Tankeledere
Hvorfor datavern blir det avgjørende teknologiske problemet i 2024

I søkelyset til teknologiverdenen vekker AI-drevne chatbots som ChatGPT oppmerksomhet, og omformer bransjer slik vi kjenner dem. Med hvert fremskritt forsvinner tradisjonelle roller – forfattere, markedsføringsguruer, til og med IT-eksperter befinner seg på hugget. Bare i juni 2023, svimlende 3,900 amerikanere tapte jobbene deres til AI. Likevel er denne forstyrrelsen bare et forspill til det som ligger foran oss.
Ettersom AI fortsetter sine erobringer på tvers av bransjer, vokser en bølge av frykt angående brudd på opphavsrett og personvern. Spørsmålet reiser seg stort: hvordan kan vi sikre en delikat balanse mellom fremgang og personvern?
Gnister av bekymring
For å begynne med, la meg forklare hvordan AI-modeller som ChatGPT fungerer. De genererer resultater basert på data de lærer under trening. Hvis modellen kan lage tekst som ser ut som om den var skrevet av Shakespeare i samme gamle engelske litteraturstil, betyr det at den allerede har «sett» dette innholdet før i forberedelsesperioden, før utgivelsen.
Faktisk er maskinlæringsalgoritmene (ML) bak hver AI-modell trent på enorme mengder data for å gi gode resultater. For eksempel er det systemer som hjelper leger med diagnostikk - de analyserer CT-skanninger og finner abnormiteter som kan indikere spesifikke sykdommer som lungekreft. De er vanligvis trent på millioner av medisinske bilder. Uten det kunne de ikke gjenkjenne artefakter på skanninger.
Ettersom etterspørselen etter AI-verktøy øker eksponentielt, samler teknologigiganter i økende grad inn enorme mengder data for å trene modellene sine. Og noen ganger inkluderer disse dataene sensitiv informasjon om mennesker og organisasjoner. Dessuten oppnås det ofte gjennom å skrape millioner av nettsider uten noen avtaler fra eierne.
Dette vekker offentlige bekymringer om personvern, åpenhet og kontroll over personlig informasjon på internett. EN 2023 Deloitte-undersøkelse avduket at flertallet av respondentene søker mer beskyttelse og kontroll over hvordan dataene deres brukes. Nesten ni av 10 uttrykte et ønske om å se og slette innsamlede data, og 80 % følte at de fortjener kompensasjon for selskaper som tjener på dataene deres. Bare i USA har innbyggerne vokst mer bekymret om hvordan dataene deres brukes, med omtrent syv av ti amerikanske voksne (71 %) som deler disse bekymringene, opp fra 64 % i 2019.
Juridiske kamper
I tillegg tar noen organisasjoner disse sakene til retten. I følge Fortune, fra november 2023, var der var over 100 AI-relaterte søksmål som navigerer gjennom rettssystemet. Disse sakene dekker en rekke bekymringer, inkludert åndsverkstvister, spredning av skadelig innhold og tilfeller av diskriminering.
Blant disse sakene var søksmål anlagt av kunstnere som anklaget utviklere for dyp læring og tekst-til-bilde-modeller som Stable Diffusion og Midjourney for å bruke deres digitale kunst i AI-trening uten samtykke. De argumentert at selskapene bak disse produktene hadde samlet inn milliarder av bilder fra internett, inkludert deres, for å instruere modeller i å generere sine egne bilder.
I desember 2023 gikk den store amerikanske avisen The New York Times inn i disse juridiske kampene ved å saksøke OpenAI, utvikleren bak det blomstrende ChatGPT, for brudd på opphavsretten. Rettssaken understreket at millioner av artikler publisert av medieorganisasjoner ble brukt til å trene automatiserte chatbots, som nå konkurrerer med nyhetsmediet som en kilde til pålitelig informasjon.
Fremtidige problemer
Som svar på disse presserende bekymringene samles regjeringer over hele verden for å møte offentlig bekymring. For eksempel representanter fra tolv reguleringsorganer globalt utstedt en felles uttalelse i august 2023, med fokus på dataskraping og personvern. Uttalelsen kom fra myndigheter i Argentina, Australia, Canada, Colombia, Hong Kong, Jersey, Mexico, Marokko, New Zealand, Norge, Sveits og Storbritannia. I mellomtiden, i California, var sletteloven signert inn i lov, målrette datameglere og etablere tilleggsbestemmelser for innsamling og håndtering av personopplysninger.
Til tross for felles innsats, ser jeg for meg at bekymringer om personvern og dataeierskap vil beholde sin fremtredende plass i den offentlige diskursen gjennom 2024 og utover. Dessuten signaliserer økningen i rettssaker om immaterielle rettigheter bare toppen av isfjellet. Vi vil sannsynligvis være vitne til en økning i saker som fokuserer på datanøyaktighet og sikkerhet, spesielt midt i den voldsomme spredningen av dype forfalskninger og feilinformasjon.
Selv om både myndigheter og næringsliv må doble innsatsen, er en forsiktig tilnærming avgjørende. Til tross for økende bekymring er det verdt å merke seg at åpne data fortsatt spiller en sentral rolle i å drive forskning og utvikling fremover. Ta for eksempel den uvurderlige rollen offentlig tilgang til helsejournaler spilte under COVID-19-krisen, som fremskyndet utviklingen av livreddende medisinske gjennombrudd, som vaksinene som ble lansert av Moderna og Pfizer.
Betydningen av åpne data understrekes av det historiske eksemplet på US Human Genome Project, der offentlig deling av gendata transformerte genetisk forskning. På lignende måte kan AI-analyse og læring på dataene være til nytte for samfunnet, fra å kategorisere genetiske mutasjoner til å håndtere presserende utfordringer som klimaendringer.
I næringslivet er data samlet inn av nettskrapere uvurderlig for markedsintelligens, konkurrentsporing og gjenkjennelse av rådende trender. Hvis nettskraping blir mer begrenset, kan bedrifter møte begrenset tilgang til viktige data for å ta informerte beslutninger, noe som potensielt kan føre til redusert konkurranse og åpenhet i priser, hindringer for innovasjon og dårlig brukeropplevelse på grunn av tregere og mindre nøyaktig dataoppdatering.
Likevel, midt i disse voksende utfordringene, finnes det veier å konfrontere dem direkte. Jeg setter min lit til kraften til proxyer til å navigere i disse turbulente farvannene. Disse innovative teknologiene skjuler brukernes opprinnelige IP-adresser og kanaliserer deres onlineaktiviteter gjennom alternative servere. Ikke bare styrker de datasikkerheten, men de fremstår også som uunnværlige verktøy for å harmonisere teknologiske fremskritt med beskyttelse av individuelle friheter.