Intervjuer
Denas Grybauskas, Chief Governance och Strategi Officer pĂ„ Oxylabs – Intervju-serie

Denas Grybauskas är Chief Governance och Strategi Officer på Oxylabs, en global ledare inom webbintelligensinsamling och premiumproxylösningar.
Oxylabs grundades 2015 och erbjuder ett av världens största etiskt källmärkta proxynätverk, med över 177 miljoner IP-adresser i 195 länder, samt avancerade verktyg som Web Unblocker, Web Scraper API och OxyCopilot, en AI-driven skrapningsassistent som omvandlar naturligt språk till strukturerade datafrågor.
Du har haft en imponerande juridisk och styrningsresa inom Litauens juridiska tekniksatsning. Vad motiverade dig personligen att ta itu med en av AI:s mest polariserande utmaningar – etik och upphovsrätt – i din roll på Oxylabs?
Oxylabs har alltid varit banerförare för ansvarsfull innovation inom branschen. Vi var de första som förespråkade etisk proxykällmärkning och webbskrapningsindustristandarder. Nu, när AI utvecklas så snabbt, måste vi se till att innovationen balanseras med ansvar.
Vi såg detta som ett stort problem som AI-branschen stod inför, och vi kunde också se lösningen. Genom att tillhandahålla dessa datamängder möjliggör vi för AI-företag och skapare att vara på samma sida när det gäller rättvis AI-utveckling, vilket är till nytta för alla inblandade. Vi visste hur viktigt det var att ha skaparnas rättigheter i främsta rummet, men också att tillhandahålla innehåll för utvecklingen av framtida AI-system, så vi skapade dessa datamängder som något som kan möta dagens marknadsbehov.
Storbritannien är mitt i en upphetsad upphovsrättsstrid, med starka röster på båda sidor. Hur tolkar du den nuvarande debatten mellan AI-innovation och skaparers rättigheter?
Det är viktigt att den brittiska regeringen prioriterar produktiv teknisk innovation, men det är också viktigt att skapare ska känna sig förstärkta och skyddade av AI, inte stulna från. Den rättsliga ramen som för närvarande debatteras måste hitta en balans mellan att främja innovation och att skydda skaparna, och jag hoppas att vi inom de närmaste veckorna ser att de hittar ett sätt att hitta en balans.
Oxylabs har just lanserat världens första etiska YouTube-datamängder, som kräver skaparers samtycke för AI-träning. Hur fungerar detta samtyckesprocess och hur skalbart är det för andra branscher som musik eller publicering?
Alla miljontals ursprungliga videor i datamängderna har skaparnas uttryckliga samtycke till att användas för AI-träning, och kopplar samman skapare och innovatörer på ett etiskt sätt. Alla datamängder som Oxylabs erbjuder innehåller videor, transkriptioner och rik metadata. Även om sådan data har många potentiella användningsområden, har Oxylabs finslipat och preparerat den specifikt för AI-träning, vilket är det användningsområde som innehållsskaparna medvetet har samtyckt till.
Många teknikledare hävdar att krav på uttryckligt samtycke från alla skapare kan “döda” AI-branschen. Vad är ditt svar på detta påstående, och hur visar Oxylabs tillvägagångssätt att det inte stämmer?
Att kräva uttryckligt samtycke för varje användning av material för AI-träning presenterar betydande operativa utmaningar och skulle komma att kosta AI-innovationen dyrt. Istället för att skydda skaparnas rättigheter, kunde det oavsiktligt uppmuntra företag att flytta utvecklingsaktiviteter till jurisdiktioner med mindre rigorös tillämpning eller skilda upphovsrättsregimer. Men det betyder inte att det inte finns någon mittpunkt där AI-utveckling kan främjas samtidigt som upphovsrätt respekteras. Tvärtom, vad vi behöver är fungerande mekanismer som förenklar relationen mellan AI-företag och skapare.
Detta erbjuder en väg framåt. Opt-out-modellen, där innehåll kan användas såvida inte upphovsrättsinnehavaren uttryckligen väljer att inte delta, är en annan. Det tredje sättet vore att underlätta avtal mellan förlag, skapare och AI-företag genom tekniska lösningar, såsom onlineplattformar.
Slutligen måste varje lösning fungera inom ramen för tillämpliga upphovsrätts- och dataskyddslagar. På Oxylabs tror vi att AI-innovation måste bedrivas på ett ansvarsfullt sätt, och vårt mål är att bidra till lagliga, praktiska ramar som respekterar skapare samtidigt som de möjliggör framsteg.
Vilka var de största hindren som ditt team hade att övervinna för att göra samtyckesbaserade datamängder livskraftiga?
Vägen för oss öppnades av YouTube, som möjliggjorde för innehållsskapare att enkelt och bekvämt licensiera sitt arbete för AI-träning. Därefter var vårt arbete främst tekniskt, med insamling av data, rensning och strukturering av den för att förbereda datamängderna, och byggandet av den tekniska infrastrukturen för att företag ska kunna komma åt den data de behöver. Men detta är något som vi har gjort i åratal, på ett eller annat sätt. Naturligtvis presenterar varje fall sin egen uppsättning utmaningar, särskilt när du hanterar något så stort och komplext som multimodal data. Men vi hade både kunskapen och den tekniska kapaciteten att göra detta. Givet detta, när YouTube-författarna fick chansen att ge sitt samtycke, var resten bara en fråga om att lägga tid och resurser på det.
Utöver YouTube-innehåll, ser du en framtid där andra stora innehållstyper – som musik, skrivande eller digital konst – också kan licensieras systematiskt för användning som träningsdata?
För en tid sedan har vi pekat på behovet av en systematisk approach till samtyckesgivning och innehållslicensiering för att möjliggöra AI-innovation samtidigt som skaparers rättigheter balanseras. Först när det finns en bekväm och samarbetsvillig väg för båda parter att uppnå sina mål, kommer det att finnas ömsesidig nytta.
Detta är bara början. Vi tror att tillhandahållande av datamängder som våra, över hela spektrumet av branscher, kan erbjuda en lösning som slutligen bringar upphovsrättsdebatten till ett harmoniskt slut.
Varierar vikten av erbjudanden som Oxylabs etiska datamängder beroende på olika AI-styrningsansatser i EU, Storbritannien och andra jurisdiktioner?
Å ena sidan, nivellerar tillgången till uttryckligt samtyckesbaserade datamängder spelplanen för AI-företag baserade i jurisdiktioner där regeringar lutar åt strängare reglering. Det primära problemet för dessa företag är att, snarare än att stödja skapare, stränga regler för att erhålla samtycke bara kommer att ge en orättvis fördel till AI-utvecklare i andra jurisdiktioner. Problemet är inte att dessa företag inte bryr sig om samtycke, utan snarare att utan en bekväm väg att erhålla det, är de dömda att halka efter.
Å andra sidan, tror vi att om samtycke och tillgång till licensierad data för AI-träning förenklas, finns det ingen anledning till varför denna approach inte ska bli den föredragna globalt. Våra datamängder, byggda på licensierat YouTube-innehåll, är ett steg mot denna förenkling.
Med ökande allmän misstro mot hur AI tränas, hur tror du att transparens och samtycke kan bli konkurrensfördelar för teknikföretag?
Även om transparens ofta ses som ett hinder för konkurrensfördel, är det också vårt främsta vapen för att bekämpa misstro. Ju mer transparens AI-företag kan tillhandahålla, desto mer bevis finns det för etisk och nyttig AI-träning, och därmed återuppbygga förtroendet för AI-branschen. Och i sin tur, kommer skapare som ser att de och samhället kan få nytta av AI-innovation, ha mer anledning att ge sitt samtycke i framtiden.
Oxylabs är ofta associerat med datainsamling och webbintelligens. Hur passar denna nya etiska initiativ in i företagets bredare vision?
Släppandet av etiskt källmärkt YouTube-datamängder fortsätter vår mission på Oxylabs att etablera och främja etiska branschpraxis. Som en del av detta, har vi medgrundat initiativet för etisk webbdatainsamling (EWDCI) och introducerat en branschledande transparent nivåstruktur för proxykällmärkning. Vi har också lanserat Projekt 4β som en del av vår mission att möjliggöra för forskare och akademiker att maximera sin forskningspåverkan och förbättra förståelsen av kritisk offentlig webbdata.
Om man ser framåt, tror du att regeringar bör kräva samtycke som standard för träningsdata, eller bör det förbli en frivillig branschledd initiativ?
I en fri marknadsekonomi, är det vanligtvis bäst att låta marknaden korrigera sig själv. Genom att tillåta innovation att utvecklas i svar till marknadsbehov, återuppfinns och förnyas vår välfärd kontinuerligt. Tunga lagstiftningsåtgärder är aldrig ett bra första val och bör endast tillgripas när alla andra vägar för att säkerställa rättvisa samtidigt som innovation tillåts, har uttömts.
Det ser inte ut som att vi har nått den punkten i AI-träning ännu. YouTubes licensieringsalternativ för skapare och våra datamängder visar att denna ekosystem aktivt söker sätt att anpassa sig till nya verkligheter. Därför, medan tydlig reglering naturligtvis behövs för att säkerställa att alla agerar inom ramen för sina rättigheter, kan regeringar vilja gå försiktigt fram. Istället för att kräva uttryckligt samtycke i varje fall, kan de vilja undersöka de sätt branscherna kan utveckla mekanismer för att lösa de nuvarande spänningarna och ta sina signaler från det när de lagstiftar för att uppmuntra innovation snarare än att hämma den.
Vad råd skulle du ge till startups och AI-utvecklare som vill prioritera etisk dataanvändning utan att hämma innovation?
Ett sätt som startups kan bidra till etisk dataanvändning är genom att utveckla tekniska lösningar som förenklar processen för att erhålla samtycke och skapa värde för skapare. När alternativ för att förvärva transparent källmärkt data dyker upp, behöver AI-företag inte kompromissa med hastighet; därför råder jag dem att hålla ögonen öppna för sådana erbjudanden.
Tack för den underbara intervjun, läsare som vill lära sig mer kan besöka Oxylabs.












