Interviews

Denas Grybauskas, Chief Governance and Strategy Officer at Oxylabs – Intervieuserie

mm

Denas Grybauskas er Chief Governance and Strategy Officer hos Oxylabs, en global leder inden for web-intelligenssamling og premium-proxy-løsninger.

Oxylabs blev grundlagt i 2015 og tilbyder et af verdens største etisk kildesortede proxy-netværk – med over 177 millioner IP-adresser i 195 lande – samt avancerede værktøjer som Web Unblocker, Web Scraper API og OxyCopilot, en AI-drevet scraping-assistent, der konverterer naturligt sprog til strukturerede dataforespørgsler.

De har haft en imponerende juridisk og governance-rejse gennem Litauens juridiske teknologi-sektor. Hvad motiverede dem personligt til at tackle en af AI’s mest polariserende udfordringer – etik og ophavsret – i deres rolle hos Oxylabs?

Oxylabs har altid været bannerføreren for ansvarlig innovation i branchen. Vi var de første til at fremme etisk proxy-kilde og web-scraping-industristandarder. Nu, hvor AI udvikler sig så hurtigt, må vi sikre, at innovationen er balanceret med ansvar.

Vi så dette som et stort problem for AI-industrien, og vi kunne også se løsningen. Ved at tilbyde disse datasæt kan vi aktivere AI-virksomheder og skabere til at være på samme side, når det kommer til fair AI-udvikling, hvilket er til gavn for alle parter. Vi vidste, hvor vigtigt det var at holde skabernes rettigheder i forgrunden, men også at tilbyde indhold til udviklingen af fremtidige AI-systemer, så vi skabte disse datasæt som noget, der kan imødekomme markedets krav i dag.

Storbritannien er midt i en intens ophavsretssag, med stærke stemmer på begge sider. Hvordan tolker de den nuværende debat mellem AI-innovation og skabernes rettigheder?

Det er vigtigt, at den britiske regering prioriterer produktiv teknologisk innovation, men det er også vigtigt, at skaberne føler sig styrket og beskyttet af AI, ikke stjålet fra. Den retlige ramme, der nu er under debat, må finde en balance mellem at fremme innovation og samtidig beskytte skaberne, og jeg håber, at vi i de kommende uger ser, at de finder en måde at strike en balance på.

Oxylabs har lige lanceret verdens første etiske YouTube-datasæt, der kræver skabernes samtykke til AI-træning. Hvordan fungerer dette samtykke-proces – og hvor skalerbart er det for andre brancher som musik eller udgivelse?

Alle de millioner af originale videoer i datasættene har skabernes eksplisitte samtykke til at blive brugt til AI-træning, og dermed forbinder skabere og innovatorer på en etisk måde. Alle datasæt, der tilbydes af Oxylabs, inkluderer videoer, transskriptioner og rig metadata. Selvom sådanne data har mange potentielle anvendelser, har Oxylabs finjusteret og forberedt dem specifikt til AI-træning, som er den anvendelse, som indholdsskaberne bevidst har accepteret.

Mange tekniske ledere mener, at kravet om eksplisit opt-in fra alle skabere kunne “dræbe” AI-industrien. Hvad er deres svar på denne påstand, og hvordan viser Oxylabs’ tilgang, at det ikke er tilfældet?

Kravet om, at der for hver brug af materiale til AI-træning skal være et forudgående eksplisit opt-in, stiller betydelige operationelle udfordringer og ville komme med en betydelig omkostning for AI-innovationen. I stedet for at beskytte skabernes rettigheder kunne det utilsigtet motivere virksomheder til at flytte udviklingsaktiviteterne til jurisdiktioner med mindre strenge love eller forskellige ophavsretssystemer. Men dette betyder ikke, at der ikke kan findes en midtervej, hvor AI-udvikling kan fremmes, samtidig med at ophavsretten respekteres. Tværtimod har vi brug for fungerende mekanismer, der simplificerer forholdet mellem AI-virksomheder og skabere.

Disse datasæt tilbyder en vej fremad. Opt-out-modellen, hvor indhold kan bruges, medmindre ophavsretshaveren eksplisit fravælger det, er en anden mulighed. En tredje vej ville være at facilitere aftalegørelse mellem udgivere, skabere og AI-virksomheder gennem teknologiske løsninger, såsom online-platforme.

Til sidst skal enhver løsning fungere inden for rammerne af gældende ophavsrets- og dataværnslove. Hos Oxylabs mener vi, at AI-innovation skal forfølges på en ansvarlig måde, og vores mål er at bidrage til lovlige, praktiske rammer, der respekterer skaberne, samtidig med at de muliggør fremskridt.

Hvad var de største hindringer, som deres team havde at overvinde for at gøre samtykke-baserede datasæt livskraftige?

Vejen for os blev åbnet af YouTube, der muliggjorde, at indholdsskabere let og bekvemt kunne licensere deres arbejde til AI-træning. Efter det var vores arbejde overvejende teknisk, og involverede indsamling af data, rensning og strukturering af dem for at forberede datasættene, samt opbygning af den tekniske infrastruktur, så virksomhederne kunne få adgang til de data, de havde brug for. Men dette er noget, vi har gjort i årevis, på en eller anden måde. Selvfølgelig stiller hver sag sine egne udfordringer, især når man har at gøre med noget så stort og komplekst som multimodalt data. Men vi havde både viden og teknisk kapacitet til at gøre det. Givet dette var det, efter at YouTube-forfatterne fik chancen til at give samtykke, kun et spørgsmål om at bruge tid og ressourcer på det.

Ud over YouTube-indhold, ser de en fremtid, hvor andre store indholdstyper – som musik, skrift eller digital kunst – også kan licenseres systematisk til brug som træningsdata?

I lang tid har vi pointeret på behovet for en systematisk tilgang til samtykke-givning og indhold-licensering for at muliggøre AI-innovation, samtidig med at det balanceres med skabernes rettigheder. Først når der er en bekvem og samarbejdende måde for begge parter at opnå deres mål på, vil der være gensidig fordel.

Dette er kun begyndelsen. Vi mener, at tilbud som vores datasæt på tværs af en række brancher kan tilbyde en løsning, der endelig kan bringe ophavsret-debatten til en fredelig afslutning.

Varierer vigtigheden af tilbud som Oxylabs’ etiske datasæt afhængigt af forskellige AI-styrings-tilgange i EU, Storbritannien og andre jurisdiktioner?

På den ene side vil tilgængeligheden af eksplisit-samtykke-baserede datasæt jævne banen for AI-virksomheder baseret i jurisdiktioner, hvor regeringerne læner mod strengere regulering. Hovedbekymringen for disse virksomheder er, at i stedet for at støtte skaberne vil strengere regler for at opnå samtykke kun give en urimelig fordel til AI-udviklere i andre jurisdiktioner. Problemet er ikke, at disse virksomheder ikke bekymrer sig om samtykke, men at uden en bekvem måde at opnå det på vil de være dømt til at blive bagud.

På den anden side mener vi, at hvis samtykke og adgang til licenseret data til AI-træning simplificeres, er der ingen grund til, at denne tilgang ikke kan blive den foretrukne vej globalt. Vores datasæt, der er baseret på licenseret YouTube-indhold, er et skridt i retning af denne simplificering.

Med den voksende offentlige mistillid til, hvordan AI trænes, hvordan kan gennemsigtighed og samtykke blive konkurrencefordele for teknologivirksomheder?

Selvom gennemsigtighed ofte ses som en hindring for den konkurrencemæssige fordel, er det også vores største våben til at bekæmpe mistilliden. Jo mere gennemsigtighed AI-virksomheder kan tilbyde, jo mere bevis der er for etisk og gavnligt AI-træning, og dermed genopbygge tillid til AI-industrien. Og på den måde vil skaberne, der ser, at de og samfundet kan få gavn af AI-innovation, have mere grund til at give samtykke i fremtiden.

Oxylabs er ofte associeret med data-scraping og web-intelligens. Hvordan passer denne nye etiske initiativ ind i virksomhedens overordnede vision?

Udgivelsen af etisk kildesortede YouTube-datasæt fortsætter vores mission hos Oxylabs med at etablere og fremme etisk branchepolitik. Som en del af dette har vi medstiftet initiativet for etisk web-data-indsamling (EWDCI) og introduceret en branche-først transparent niveau-ramme for proxy-kilde. Vi har også lanceret Projekt 4β som en del af vores mission om at enable forskere og akademikere til at maksimere deres forskningsindflydelse og forbedre forståelsen af kritisk offentlig web-data.

Settende blikket fremad, mener de, at regeringer skal pålægge samtykke som standard for træningsdata, eller skal det forblive en frivillig branch-ledet initiativ?

I en fri markedsøkonomi er det generelt bedst at lade markedet korrigere sig selv. Ved at lade innovation udvikle sig i respons til markedets behov kan vi kontinuerligt genskabe og fornye vores velstand. Lovgivning er aldrig det bedste førstevalg og bør kun pålægges, når alle andre muligheder for at sikre retfærdighed, samtidig med at innovation tillades, er udtømt.

Det ser ikke ud til, at vi endnu har nået det punkt i AI-træning. YouTubes licensmuligheder for skabere og vores datasæt viser, at dette økosystem aktivt søger måder at tilpasse sig til nye realiteter på. Derfor, mens klart regulerende rammer er nødvendige for at sikre, at alle handler inden for deres rettigheder, kan regeringer måske ønske at gå forsigtigt til værks. I stedet for at kræve udtrykt samtykke i hvert enkelt tilfælde kan de undersøge, hvordan brancher kan udvikle mekanismer til at løse de nuværende spændinger og tage deres signaler fra det, når de lovgiver for at fremme innovation i stedet for at hæmme den.

Hvad er deres råd til startups og AI-udviklere, der ønsker at prioritere etisk data-brug uden at hæmme innovation?

En måde, startups kan hjælpe med at facilitere etisk data-brug, er ved at udvikle teknologiske løsninger, der simplificerer processen med at opnå samtykke og skabe værdi for skaberne. Når muligheder for at erhverve gennemsigtigt kildesortede data opstår, behøver AI-virksomheder ikke at gå på kompromis med hastighed; derfor råder jeg dem til at holde øjnene åbne for sådanne tilbud.

 Tak for det store interview, læsere, der ønsker at lære mere, kan besøge Oxylabs.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.