Rozhovory

Denas Grybauskas, Chief Governance a Strategy Officer v Oxylabs – Interview Series

mm

Denas Grybauskas je Chief Governance a Strategy Officer v Oxylabs, globálním lídru ve sběru webových inteligencí a premium proxy řešení.

Založená v roce 2015, Oxylabs poskytuje jednu z největších eticky získaných proxy sítí na světě – pokrývající více než 177 milionů IP adres ve 195 zemích – spolu s pokročilými nástroji, jako je Web Unblocker, Web Scraper API a OxyCopilot, AI poháněný pomocník pro sběr, který převádí přirozený jazyk na strukturované dotazy.

Měli jste působivé právní a governance zkušenosti v litovském právním technologickém prostoru. Co vás osobně motivovalo k řešení jedné z nejvíce polarizujících výzev AI – etiky a autorských práv – ve vaší roli v Oxylabs?

Oxylabs vždy byli vlajkovou lodí pro odpovědnou inovaci v odvětví. Byli jsme první, kdo hájil etické zdroje proxy a standardy pro sběr webových dat. Nyní, s tak rychlým rozvojem AI, musíme zajistit, aby inovace byly vyvážené s odpovědností.

Viděli jsme, že to je velký problém, kterým čelí odvětví AI, a viděli jsme také řešení. Poskytováním těchto dat umožňujeme společnostem AI a tvůrcům být na stejné straně, pokud jde o spravedlivý rozvoj AI, což je prospěšné pro všechny zúčastněné. Věděli jsme, jak důležité je umístit práva tvůrců na přední místo, ale také poskytnout obsah pro rozvoj budoucích systémů AI, a proto jsme vytvořili tato data, aby mohla splnit požadavky dnešního trhu.

Ve Spojeném království probíhá vášnivá debata o autorských právech, s silnými názory na obou stranách. Jak interpretujete současný stav debaty mezi inovací AI a právy tvůrců?

Zatímco je důležité, aby vláda Spojeného království podporovala produktivní technologickou inovaci jako prioritu, je zásadní, aby tvůrci cítili, že jsou posíleni a chráněni AI, a ne okradeni. Právní rámec, který je nyní projednáván, musí najít rovnováhu mezi podporou inovací a ochranou tvůrců, a doufám, že v následujících týdnech najdou způsob, jak tuto rovnováhu najít.

Oxylabs právě spustil první etické YouTube datové sady, které vyžadují souhlas tvůrců pro školení AI. Jak přesně funguje tento proces souhlasu – a jak je škálovatelný pro ostatní odvětví, jako je hudba nebo vydavatelství?

Všechny miliony původních videí v datech mají výslovný souhlas tvůrců k použití pro školení AI, spojující tvůrce a inovátory eticky. Všechna data nabízená Oxylabs zahrnují videa, přepisy a bohatá metadata. Ačkoli tato data mají mnoho potenciálních použití, Oxylabs je vyčistil a připravil speciálně pro školení AI, pro které tvůrci vědomě souhlasili.

Mnozí technologičtí lídři tvrdí, že vyžadování výslovného souhlasu od všech tvůrců by mohlo “zničit” odvětví AI. Jaký je váš názor na tuto tvrzení, a jak přístup Oxylabs dokazuje, že tomu tak není?

Vyhrazování, že pro každé použití materiálu pro školení AI je nutný předchozí výslovný souhlas, představuje významné provozní výzvy a bude mít významnou cenu za inovaci AI. Místo ochrany práv tvůrců by to mohlo neúmyslně motivovat společnosti k přesunu vývojových aktivit do jurisdikcí s méně přísnou kontrolou nebo odlišnými autorskými režimy. Nicméně to neznamená, že nemůže existovat střední cesta, kde je rozvoj AI podporován, zatímco je respektováno autorské právo. Naopak, co potřebujeme, jsou funkční mechanismy, které zjednodušují vztah mezi společnostmi AI a tvůrci.

Tato data nabízejí jeden přístup k pokroku. Model opt-out, podle kterého lze obsah použít, pokud vlastník autorských práv výslovně neodmítne, je další. Třetí cesta by spočívala v usnadňování dohodování mezi vydavateli, tvůrci a společnostmi AI prostřednictvím technologických řešení, jako jsou online platformy.

Konečně, jakékoli řešení musí fungovat v rámci platných autorských a zákonů o ochraně údajů. V Oxylabs věříme, že inovace AI musí být sledována odpovědně, a náš cíl je přispět k právním, praktickým rámcům, které respektují tvůrce, zatímco umožňují pokrok.

Jaké byly největší překážky, kterým vaše tým musel čelit, aby mohl vytvořit datové sady založené na souhlasu?

Cesta pro nás byla otevřena YouTube, který umožnil tvůrcům snadno a pohodlně licencovat svou práci pro školení AI. Poté naše práce spočívala hlavně v technických úkolech, jako je shromažďování dat, čištění a strukturování, aby byla data připravena pro společnosti, které je potřebují. Ale tohle je něco, co jsme dělali po mnoho let, jedním způsobem nebo jiným. Samozřejmě, každá případnost představuje svou vlastní sadu výzev, zejména když máte co do činění s něčím tak obrovským a komplexním, jako je multimodální data. Ale měli jsme znalosti a technickou kapacitu, abychom to mohli udělat. Když autoři YouTube dostali šanci dát souhlas, zbytek byl pouze otázkou času a zdrojů.

Předpokládáte budoucnost, kdy lze systémově licencovat další hlavní typy obsahu – jako hudba, psaná tvorba nebo digitální umění – pro použití jako trénovací data?

Už nějakou dobu upozorňujeme na potřebu systematického přístupu k udělování souhlasu a licencování obsahu, aby bylo možné umožnit inovaci AI a vyvážit ji s právy tvůrců. Teprve když existuje pohodlný a kooperativní způsob, jak obě strany dosáhnout svých cílů, bude existovat vzájemný prospěch.

To je teprve začátek. Věříme, že poskytování dat, jako jsou ta naše, napříč různými odvětvími, může poskytnout řešení, které konečně uzavře debatu o autorských právech.

Lze předpokládat, že důležitost nabídek, jako jsou etické datové sady Oxylabs, se liší v závislosti na různých přístupech k řízení AI v EU, Spojeném království a dalších jurisdikcích?

Na jedné straně dostupnost dat založených na výslovném souhlasu vyrovnává podmínky pro společnosti AI založené v jurisdikcích, kde vlády směřují k přísnější regulaci. Hlavním problémem těchto společností je, že místo ochrany tvůrců by přísná pravidla pro získání souhlasu mohla dát nespravedlivou výhodu vývojářům AI v jiných jurisdikcích. Problém není, že tyto společnosti nepečují o souhlas, ale spíše, že bez pohodlného způsobu, jak jej získat, jsou odsouzeny k tomu, aby zaostaly.

Na druhé straně věříme, že pokud je zjednodušeno udělování souhlasu a přístup k datům licencovaným pro školení AI, není žádný důvod, proč by tento přístup neměl být globálně preferován. Naše datové sady postavené na licencovaném obsahu YouTube jsou krokem k tomuto zjednodušení.

Jak můžete říci, že transparentnost a souhlas se stanou konkurenční výhodou pro technologické společnosti?

Ačkoli je transparentnost často považována za překážku konkurenční výhody, je to také naše největší zbraň proti nedůvěře. Čím více transparentnosti mohou společnosti AI poskytnout, tím více důkazů existuje pro etické a prospěšné školení AI, a tím více se buduje důvěra v odvětví AI. A naopak, tvůrci, kteří vidí, že mohou získat prospěch z inovací AI, budou mít více důvodů, proč souhlasit v budoucnu.

Oxylabs je často spojován s odškrabáváním dat a webovou inteligencí. Jak se tato nová etická iniciativa vejde do širší vize společnosti?

Vydání eticky získaných dat YouTube pokračuje v naší misi v Oxylabs, aby byla stanovena a propagována etická odvětvová praxe. V rámci toho jsme spoluzaložili Iniciativu etického sběru webových dat (EWDCI) a představili průmyslový první transparentní rámec pro zdroje proxy. Spustili jsme také Projekt 4β jako součást naší mise, aby výzkumníci a akademici mohli maximalizovat dopad svého výzkumu a zlepšit pochopení kritických veřejných webových dat.

Předpokládáte, že by vlády měly vyžadovat souhlas jako výchozí hodnotu pro trénovací data, nebo by to mělo zůstat dobrovolnou iniciativou odvětví?

V tržní ekonomice je obecně nejlepší nechat trh, aby se sám opravil. Povolováním inovací, aby se vyvíjely v reakci na potřeby trhu, neustále obnovujeme a obnovujeme náš blahobyt. Závažná legislativa by neměla být prvním výběrem a měla by být použita pouze tehdy, když všechny ostatní cesty k zajištění spravedlnosti, zatímco inovace jsou povoleny, jsou vyčerpány.

Nemá se za to, že jsme již dosáhli tohoto bodu ve školení AI. Možnosti licencování YouTube pro tvůrce a naše datové sady demonstrují, že toto ekosystém aktivně hledá způsoby, jak se přizpůsobit novým realitám. Proto by vlády mohly jít pomalu. Místo vyžadování vyjádřeného souhlasu v každém případě by mohly zkoumat, jak odvětví mohou vyvinout mechanismy pro řešení aktuálních napětí a brát si podněty z nich, když legislativně podporují inovace, spíše než je brzdí.

Jakou radu byste nabídli startupům a vývojářům AI, kteří chtějí prioritizovat etické použití dat, aniž by brzdili inovace?

Jedním ze způsobů, jak startupy mohou pomoci usnadnit etické použití dat, je vyvinout technologická řešení, která zjednodušují proces získání souhlasu a získání hodnoty pro tvůrce. Když se objeví možnosti získání transparentně získaných dat, společnosti AI nemusí kompromitovat rychlost; proto bych je poradil, aby měli oči otevřené pro takové nabídky.

 Děkuji za skvělý rozhovor, čtenáři, kteří chtějí se dozvědět více, by měli navštívit Oxylabs.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.