Interviews
Denas Grybauskas, Chief Governance en Strategy Officer bij Oxylabs – Interviewreeks

Denas Grybauskas is de Chief Governance en Strategy Officer bij Oxylabs, een wereldleider in webintelligentie en premium proxyoplossingen.
Oxylabs is in 2015 opgericht en biedt een van de grootste ethisch verzamelde proxy-netwerken ter wereld, met meer dan 177 miljoen IP’s in 195 landen, evenals geavanceerde tools zoals Web Unblocker, Web Scraper API en OxyCopilot, een AI-gebaseerde schraaptool die natuurlijke taal omzet in gestructureerde gegevensquery’s.
U heeft een indrukwekkende juridische en governance-reis door de juridische technologie van Litouwen. Wat heeft u persoonlijk gemotiveerd om een van de meest polariserende uitdagingen van AI aan te pakken – ethiek en auteursrecht – in uw rol bij Oxylabs?
Oxylabs is altijd de banierdrager geweest van verantwoorde innovatie in de industrie. We waren de eerste die pleitten voor ethische proxy-sourcing en web scraping-industrienormen. Nu AI zo snel evolueert, moeten we ervoor zorgen dat innovatie in balans is met verantwoordelijkheid.
We zagen dit als een enorm probleem voor de AI-industrie en we konden ook de oplossing zien. Door deze datasets te bieden, maken we het mogelijk voor AI-bedrijven en creators om op één lijn te staan met betrekking tot eerlijke AI-ontwikkeling, wat voor iedereen beter is. We wisten hoe belangrijk het was om de rechten van creators voorop te stellen, maar ook om content te bieden voor de ontwikkeling van toekomstige AI-systemen, dus we hebben deze datasets gemaakt als iets dat kan voldoen aan de eisen van de huidige markt.
Hoe interpreteren wij de huidige staat van de debat tussen AI-innovatie en creators-rechten in het VK?
Terwijl het belangrijk is dat de regering van het VK productieve technologische innovatie als prioriteit heeft, is het essentieel dat creators zich versterkt en beschermd voelen door AI, en niet bestolen. Het juridische kader dat momenteel wordt besproken, moet een zoet punt vinden tussen het stimuleren van innovatie en het beschermen van creators, en ik hoop dat we in de komende weken zien dat ze een manier vinden om dit evenwicht te bereiken.
Oxylabs heeft onlangs de werelds eerste ethische YouTube-datasets gelanceerd, die de toestemming van creators vereisen voor AI-training. Hoe werkt dit toestemmingsproces precies – en hoe schaalbaar is het voor andere industrieën zoals muziek of publicatie?
Alle miljoenen oorspronkelijke video’s in de datasets hebben de expliciete toestemming van de creators om te worden gebruikt voor AI-training, waardoor creators en innovators ethisch met elkaar verbonden zijn. Alle datasets die door Oxylabs worden aangeboden, omvatten video’s, transcripts en rijke metadata. Hoewel deze gegevens veel potentiële toepassingen hebben, heeft Oxylabs ze specifiek voor AI-training gerefineerd en voorbereid, wat de toepassing is waarvoor de content creators bewust hebben ingestemd.
Velen tech-leiders beweren dat het vereisen van expliciete toestemming van alle creators de AI-industrie kan “doden”. Wat is uw reactie op deze bewering, en hoe bewijst de aanpak van Oxylabs het tegendeel?
Het vereisen van expliciete toestemming voor elk gebruik van materiaal voor AI-training levert significante operationele uitdagingen op en zou een aanzienlijke kostenpost voor AI-innovatie betekenen. In plaats van de rechten van creators te beschermen, zou dit onbewust bedrijven aanmoedigen om ontwikkelingsactiviteiten te verplaatsen naar rechtsgebieden met minder strikte handhaving of verschillende auteursrechtregimes. Echter, dit betekent niet dat er geen middenweg is waar AI-ontwikkeling wordt gestimuleerd en auteursrecht wordt gerespecteerd. Integendeel, wat we nodig hebben zijn werkbare mechanismen die de relatie tussen AI-bedrijven en creators vereenvoudigen.
Deze datasets bieden een aanpak om vooruit te komen. Het opt-out-model, waarbij content kan worden gebruikt tenzij de auteursrechthebbende expliciet opt-out, is een andere. De derde manier zou zijn om overeenkomsten te faciliteren tussen uitgevers, creators en AI-bedrijven via technologische oplossingen, zoals online platforms.
Uiteindelijk moet elke oplossing binnen de grenzen van de toepasselijke auteursrecht- en gegevensbeschermingswetten opereren. Bij Oxylabs geloven we dat AI-innovatie verantwoordelijk moet worden nagestreefd, en ons doel is om bij te dragen aan wettelijke, praktische kaders die creators respecteren en vooruitgang mogelijk maken.
Wat waren de grootste hindernissen die uw team moest overwinnen om toestemmingsgebaseerde datasets haalbaar te maken?
De weg voor ons werd geopend door YouTube, waardoor content creators hun werk gemakkelijk en handig konden licenseren voor AI-training. Daarna was ons werk voornamelijk technisch, waarbij we gegevens verzamelden, schoonmaakten en structureerden om de datasets voor te bereiden, en de hele technische setup bouwden voor bedrijven om toegang te krijgen tot de gegevens die ze nodig hadden. Maar dit is iets dat we al jaren doen, op een of andere manier. Natuurlijk heeft elke zaak zijn eigen set uitdagingen, vooral wanneer je te maken hebt met iets zo groot en complex als multimodale gegevens. Maar we hadden zowel de kennis als de technische capaciteit om dit te doen. Gegeven dit, zodra YouTube-auteurs de kans kregen om toestemming te geven, was de rest alleen een kwestie van tijd en middelen.
Verdergaand dan YouTube-content, ziet u een toekomst waarin andere belangrijke contenttypen – zoals muziek, schrijven of digitale kunst – ook systematisch kunnen worden gelicenceerd voor gebruik als trainingsgegevens?
Al een tijdje wijzen we op de noodzaak van een systematische aanpak voor toestemmingsgeving en content-licensering om AI-innovatie mogelijk te maken en in balans te brengen met de rechten van creators. Pas wanneer er een handige en coöperatieve manier is voor beide partijen om hun doelen te bereiken, zal er een wederzijds voordeel zijn.
Dit is alleen het begin. We geloven dat het bieden van datasets zoals de onze in een reeks industrieën een oplossing kan bieden die uiteindelijk het auteursrechtdebat tot een einde kan brengen.
Varieert de belangrijkheid van aanbiedingen zoals de ethische datasets van Oxylabs afhankelijk van de verschillende AI-governance-benaderingen in de EU, het VK en andere rechtsgebieden?
Aan de ene kant niveauert de beschikbaarheid van expliciet toestemmingsgebaseerde datasets het speelveld voor AI-bedrijven die zijn gevestigd in rechtsgebieden waar regeringen de voorkeur geven aan striktere regulering. De primaire zorg van deze bedrijven is dat, in plaats van creators te ondersteunen, strikte regels voor het verkrijgen van toestemming alleen een oneerlijk voordeel zullen geven aan AI-ontwikkelaars in andere rechtsgebieden. Het probleem is niet dat deze bedrijven zich niet bekommeren om toestemming, maar eerder dat, zonder een handige manier om deze te verkrijgen, ze gedoemd zijn om achter te blijven.
Aan de andere kant geloven we dat, als het geven van toestemming en het verkrijgen van gelicenceerde gegevens voor AI-training wordt vereenvoudigd, er geen reden is waarom deze aanpak niet wereldwijd de voorkeur zou moeten krijgen. Onze datasets, die zijn opgebouwd uit gelicenceerde YouTube-content, zijn een stap in de richting van deze vereenvoudiging.
Hoe denkt u dat transparantie en toestemming concurrerende voordelen kunnen worden voor tech-bedrijven, gezien de groeiende publieke wantrouwen tegen de manier waarop AI wordt getraind?
Hoewel transparantie vaak wordt gezien als een hindernis voor concurrerend voordeel, is het ook ons grootste wapen om wantrouwen te bestrijden. Hoe meer transparantie AI-bedrijven kunnen bieden, hoe meer bewijs er is voor ethische en nuttige AI-training, waardoor vertrouwen in de AI-industrie wordt hersteld. En op hun beurt zullen creators, die zien dat ze en de samenleving waarde kunnen krijgen van AI-innovatie, meer reden hebben om toestemming te geven in de toekomst.
Oxylabs wordt vaak geassocieerd met data-schrapen en webintelligentie. Hoe past deze nieuwe ethische initiatief in de bredere visie van het bedrijf?
De release van ethisch verzamelde YouTube-datasets zet onze missie voort om ethische industriepraktijken te vestigen en te promoten. Als onderdeel hiervan hebben we de Ethical Web Data Collection Initiative (EWDCI) mede-opgericht en een industrie-first transparante tier-framework voor proxy-sourcing geïntroduceerd. We hebben ook Project 4β gelanceerd als onderdeel van onze missie om onderzoekers en academici in staat te stellen hun onderzoeksimpact te maximaliseren en de kennis van kritische openbare webgegevens te vergroten.
Kijkt u vooruit, denkt u dat regeringen toestemming-door-standaard voor trainingsgegevens moeten verplichten, of moet dit een vrijwillige, door de industrie geleide initiatief blijven?
In een vrije markteconomie is het over het algemeen het beste om de markt zichzelf te laten corrigeren. Door innovatie te laten ontwikkelen in reactie op marktbehoeften, vernieuwen en verjongen we voortdurend onze welvaart. Zware wetgeving is nooit een goede eerste keuze en moet alleen worden gebruikt wanneer alle andere wegen om gerechtigheid te waarborgen en innovatie toe te staan, zijn uitgeput.
Het lijkt er niet op dat we al op dat punt zijn in AI-training. De licentieopties van YouTube voor creators en onze datasets demonstreren dat dit ecosysteem actief zoekt naar manieren om zich aan te passen aan nieuwe realiteiten. Daarom, terwijl duidelijke regulering nodig is om ervoor te zorgen dat iedereen binnen zijn rechten handelt, zouden regeringen misschien lichtvoetig moeten treden. In plaats van expliciete toestemming in elk geval te vereisen, zouden ze de manieren moeten onderzoeken waarop industrieën mechanismen kunnen ontwikkelen om de huidige spanningen op te lossen en hun aanwijzingen daaruit moeten halen bij het wetgeven om innovatie te stimuleren in plaats van deze te hinderen.
Wat is uw advies aan start-ups en AI-ontwikkelaars die ethisch gegevensgebruik willen prioriteren zonder innovatie te hinderen?
Een manier waarop start-ups ethisch gegevensgebruik kunnen faciliteren, is door technologische oplossingen te ontwikkelen die het proces van toestemming verkrijgen en waarde creëren voor creators vereenvoudigen. Aangezien opties om transparant verzamelde gegevens te verkrijgen naar voren komen, hoeven AI-bedrijven niet te compromitteren op snelheid; daarom adviseer ik hen om hun ogen open te houden voor dergelijke aanbiedingen.
Bedankt voor het geweldige interview, lezers die meer willen leren, kunnen Oxylabs bezoeken.












