Intervjuer
Denas Grybauskas, Chief Governance and Strategy Officer i Oxylabs – Intervju-serie

Denas Grybauskas er Chief Governance and Strategy Officer i Oxylabs, en global leder innen web-intelligenssamling og premium-proxyløsninger.
Oxylabs ble etablert i 2015 og tilbyr ett av de største etisk-sourcede proxy-nettverkene i verden – med over 177 millioner IP-er i 195 land – samt avanserte verktøy som Web Unblocker, Web Scraper API og OxyCopilot, en AI-drevet skraping-assistent som konverterer naturlig språk til strukturerte dataforespørsler.
Hva motiverte deg personlig til å ta på deg en av AI-s største utfordringer – etikk og opphavsrett – i din rolle i Oxylabs?
Oxylabs har alltid vært en forkjemper for ansvarlig innovasjon i bransjen. Vi var de første som gikk inn for etisk proxy-sourcing og web-skraping-industri-standarder. Nå, med AI som utvikler seg så raskt, må vi sikre at innovasjonen er balansert med ansvar.
Vi så på dette som et stort problem som AI-bransjen sto overfor, og vi kunne også se løsningen. Ved å tilby disse datasettene, muliggjører vi at AI-selskaper og skapere kan være på samme side når det gjelder rettferdig AI-utvikling, som er til nytte for alle parter involvert. Vi visste hvor viktig det var å prioritere skaperes rettigheter, men også å tilby innhold for utvikling av fremtidige AI-systemer, så vi skapte disse datasettene som noe som kan møte markedets behov i dag.
Hvordan tolker du den nåværende debatten mellom AI-innovasjon og skaperes rettigheter i Storbritannia?
Det er viktig at den britiske regjeringen prioriterer produktiv teknologisk innovasjon, men det er like viktig at skaperne føler seg styrket og beskyttet av AI, ikke stjålet fra. Den rettslige rammen som nå er under debatt, må finne en balanse mellom å fremme innovasjon og å beskytte skaperne, og jeg håper at de i de kommende ukene finner en måte å strike en balanse på.
Oxylabs har nettopp lansert verdens første etiske YouTube-datasett, som krever skaperes samtykke for AI-trening. Hvordan fungerer dette samtykke-prosessen – og hvor skalerbart er det for andre industrier som musikk eller publisering?
Alle de millioner av originale videoene i datasettene har skaperes eksplisitte samtykke til å bli brukt til AI-trening, og kobler skapere og innovatører sammen på en etisk måte. Alle datasett som tilbys av Oxylabs inkluderer videoer, transkripter og rike metadata. Selv om slike data har mange potensielle bruksområder, har Oxylabs finjustert og preparert dem spesifikt for AI-trening, som er bruken som skaperne har samtykket til.
Mange teknologiledere hevder at å kreve eksplisitt samtykke fra alle skapere kan “drepe” AI-bransjen. Hva er din respons på dette kravet, og hvordan viser Oxylabs’ tilnærming at det ikke er tilfelle?
Å kreve at det for hver bruk av materiale til AI-trening, må det være et tidligere eksplisitt samtykke, presenterer betydelige operative utfordringer og ville komme med en betydelig kostnad for AI-innovasjon. I stedet for å beskytte skaperes rettigheter, kunne det utilsiktet incentivere selskaper til å flytte utviklingsaktiviteter til jurisdiksjoner med mindre strenge regler eller forskjellige opphavsrettsregimer. Men dette betyr ikke at det ikke kan finnes en midtvei hvor AI-utvikling kan fremmes samtidig som opphavsrett respekteres. Det vi trenger, er fungerende mekanismer som forenkler forholdet mellom AI-selskaper og skapere.
Disse datasettene tilbyr en måte å gå fremover på. Opt-out-modellen, hvor innhold kan brukes med mindre opphavsrettsinnehaveren eksplisitt velger å ikke bruke det, er en annen måte. En tredje måte ville være å fasilitere avtaleinngåelse mellom utgivere, skapere og AI-selskaper gjennom teknologiske løsninger, som online-plattformer.
Til slutt må ethvert løsning fungere innenfor rammen av gjeldende opphavsretts- og datavernlovens regler. Hos Oxylabs tror vi at AI-innovasjon må drives på en ansvarlig måte, og vårt mål er å bidra til lovlige, praktiske rammer som respekterer skapere samtidig som de muliggjør fremgang.
Hva var de største hindrene dine team hadde å overvinne for å gjøre samtykke-baserte datasett mulige?
Vegen for oss ble åpnet av YouTube, som muliggjorde at skapere kunne enkelt og bekvemt lisensiere sitt arbeid for AI-trening. Etter det var vårt arbeid hovedsakelig teknisk, med å samle inn data, rense og strukturere den for å preparere datasettene, og bygge hele den tekniske oppsettet for at selskaper kunne få tilgang til de dataene de trengte. Men dette er noe vi har gjort i mange år, på en eller annen måte. Selvfølgelig presenterer hver enkelt sak sin egen sett med utfordringer, spesielt når du har å gjøre med noe så stort og komplekst som multimodalt data. Men vi hadde både kunnskapen og den tekniske kapasiteten til å gjøre dette. Gitt dette, så snart YouTube-forfattere fikk sjansen til å gi samtykke, var resten bare et spørsmål om å bruke tid og ressurser på det.
Ser du en fremtid hvor andre store innholdstyper – som musikk, skriving eller digital kunst – også kan bli systematisk lisensiert for bruk som treningdata?
I en stund nå har vi pekt på behovet for en systematisk tilnærming til samtykke-giving og innhold-lisensiering for å muliggjøre AI-innovasjon samtidig som det balanseres med skaperes rettigheter. Bare når det finnes en enkel og samarbeidende måte for begge parter å nå sine mål, vil det være gjensidig nytte.
Dette er bare begynnelsen. Vi tror at å tilby datasett som våre over hele industrien kan tilby en løsning som endelig kan bringe opphavsrettsdebatten til en fredelig avslutning.
Varierer viktigheten av tilbud som Oxylabs’ etiske datasett avhengig av forskjellige AI-styrings-tilnærminger i EU, Storbritannia og andre jurisdiksjoner?
På den ene siden, gjør tilgjengeligheten av eksplisitt-samtykke-baserte datasett feltet jevnt for AI-selskaper basert i jurisdiksjoner hvor regjeringer hellere strekker seg mot strengere regulering. Hovedbekymringen til disse selskapene er at, i stedet for å støtte skapere, kan strenge regler for å oppnå samtykke kun gi en urettferdig fordel til AI-utviklere i andre jurisdiksjoner. Problemet er ikke at disse selskapene ikke bryr seg om samtykke, men at uten en enkel måte å oppnå det på, er de dømt til å ligge etter.
På den andre siden, tror vi at hvis å gi samtykke og å få tilgang til lisensiert data for AI-trening forenkles, er det ingen grunn til at denne tilnærmingen ikke kan bli den foretrukne måten globalt. Våre datasett bygget på lisensiert YouTube-innhold er et skritt mot denne forenklingen.
Hvordan tror du at transparens og samtykke kan bli konkurransefordeler for teknologiselskaper?
Selv om transparens ofte sees på som en hindring for konkurransefordel, er det også vårt beste våpen for å bekjempe mistillit. Jo mer transparens AI-selskaper kan tilby, jo mer bevis er det for etisk og nyttig AI-trening, og dermed gjenoppretter tillit til AI-bransjen. Og til slutt, når skapere ser at de og samfunnet kan få nytte av AI-innovasjon, vil de ha mer grunn til å gi samtykke i fremtiden.
Oxylabs er ofte assosiert med data-skraping og web-intelligens. Hvordan passer denne nye etiske initiativet inn i selskapets bredere visjon?
Lanseringen av etisk-sourcede YouTube-datasett fortsetter vår misjon i Oxylabs om å etablere og fremme etiske bransjepraksiser. Som en del av dette, var vi med å etablere Ethical Web Data Collection Initiative (EWDCI) og introduserte en bransje-først transparent nivå-ramme for proxy-sourcing. Vi lanserte også Project 4β som en del av vår misjon om å muliggjøre at forskere og akademikere kan maksimere sin forskningsimpakt og forbedre forståelsen av kritisk offentlig web-data.
Ser du fremover, bør regjeringer pålegge samtykke-som-standard for treningdata, eller bør det forbli en frivillig industri-drevet initiativ?
I en fri markedsøkonomi, er det vanligvis best å la markedet korrigere seg selv. Ved å la innovasjon utvikle seg i respons til markedets behov, oppnår vi kontinuerlig å fornye og gjenopprette vår velstand. tungt-håndtet lovgivning er aldri et godt førstevalg og bør bare brukes når alle andre måter å sikre rettferdighet samtidig som innovasjon er uttømt.
Det ser ikke ut til at vi har nådd det punktet i AI-trening enda. YouTubes lisensieringsmuligheter for skapere og våre datasett demonstrerer at dette økosystemet aktivt søker måter å tilpasse seg nye realiteter. Derfor, mens klargjøring er, selvfølgelig, nødvendig for å sikre at alle handler innenfor sine rettigheter, kan regjeringer ønske å gå forsiktig til verks. I stedet for å kreve uttrykt samtykke i hver enkelt sak, kan de ønske å undersøke måtene industrien kan utvikle mekanismer for å løse de nåværende spenningene og ta sine signaler fra det når de lovgir for å fremme innovasjon i stedet for å hindre den.
Hva råd ville du gi til startups og AI-utviklere som ønsker å prioritere etisk data-bruk uten å stanse innovasjon?
En måte startups kan hjelpe med å fasilitere etisk data-bruk er ved å utvikle teknologiske løsninger som forenkler prosessen med å oppnå samtykke og å skape verdi for skapere. Når muligheter til å anskaffe transparent-sourcede data dukker opp, trenger AI-selskaper ikke å kompromittere med hastighet; derfor råder jeg dem til å holde øye på slike tilbud.
Takk for det flotte intervjuet, lesere som ønsker å lære mer kan besøke Oxylabs.












