์ธํ„ฐ๋ทฐ

Oxylabs์˜ Denas Grybauskas, Chief Governance and Strategy Officer – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

mm

Denas Grybauskas는 Oxylabs의 Chief Governance and Strategy Officer로서, 웹 인텔리전스 수집과 프리미엄 프록시 솔루션의 글로벌 리더입니다.

2015년에 설립된 Oxylabs는 세계에서 가장 큰 윤리적으로 소싱된 프록시 네트워크 중 하나를 제공하며, 195개국에 걸쳐 1억 7,700만 개의 IP를 보유하고 있습니다. 또한 Web Unblocker, Web Scraper API, OxyCopilot과 같은 고급 도구를 제공하며, OxyCopilot은 자연어를 구조화된 데이터 쿼리로 변환하는 AI 기반 스크레이핑 어시스턴트입니다.

리투아니아의 법률 기술 분야에서 인상적인 법률 및 거버넌스 여정을 거치셨습니다. Oxylabs에서 윤리와 저작권과 같은 AI의 가장 극단적인 도전을 개인적으로 어떻게 해결하시게 되셨나요?

Oxylabs는 항상 산업에서 책임 있는 혁신의 기치입니다. 우리는 최초로 윤리적인 프록시 소싱과 웹 스크레이핑 산업 표준을 주장했습니다. 이제 AI가 så 빠르게 발전하고 있기 때문에, 우리는 혁신이 책임 있게 균형을 이루고 있는지 확인해야 합니다.

우리는 이것이 AI 산업이 직면한巨大한 문제라는 것을 보았으며, 우리는 또한 해결책을 볼 수 있었습니다. 이러한 데이터셋을 제공함으로써, 우리는 AI 회사와 창작자들이 공정한 AI 개발에 대해 동일한 페이지에 있도록启発하고 있습니다. 이는 모든 관련자에게 유익합니다. 우리는 창작자의 권리를 최우선으로 두면서도 미래의 AI 시스템 개발을 위한 콘텐츠를 제공해야 한다는 것을 알았습니다. 따라서 우리는 이러한 데이터셋을 오늘날의 시장需求을 충족할 수 있는 것으로 만들었습니다.

영국은 저작권 논쟁의 한가운데에 있으며, 양측 모두 강한 목소리가 있습니다. 현재의 논쟁 상태를 어떻게 해석하시나요?

영국 정부가 생산적인 기술 혁신을 우선시하는 것이 중요하지만, 창작자들이 AI에 의해 강화되고 보호되는 것이 아니라 도난당하는 것이 아니라 중요합니다. 현재 논의 중인 법적 프레임워크는 혁신을 촉진하면서 창작자를 보호하는 균형점을 찾아야 합니다. 앞으로 몇 주 안에 그들이 균형을 찾는 방법을 보기를 바랍니다.

Oxylabs는 창작자 동의를 얻은 유튜브 데이터셋을 출시했습니다. 이 동의 과정은 어떻게 진행되며, 음악이나 출판과 같은 다른 산업에서도 확장될 수 있나요?

데이터셋에 포함된 수백만 개의 원본 비디오는 모두 AI 훈련을 위해 사용될 수 있도록 창작자의 명시적인 동의를 얻었습니다. Oxylabs가 제공하는 모든 데이터셋에는 비디오, 자막, 및 풍부한 메타데이터가 포함되어 있습니다. 이러한 데이터는 많은 잠재적인 사용 사례를 가지고 있지만, Oxylabs는 이를 AI 훈련을 위해 특별히 준비했습니다. 이는 콘텐츠 창작자가 의식적으로 동의한 용도입니다.

많은 기술 리더들은 모든 창작자로부터 명시적인 동의를 얻는 것이 AI 산업을 “죽일” 수 있다고 주장합니다. 이러한 주장에 대한您的 반론은 무엇인가요?

모든 AI 훈련 자료 사용에 대해 이전의 명시적인 동의를 요구하는 것은 상당한 운영상의課題를 제기하며, 이는 AI 혁신에 상당한 비용을 초래할 것입니다. 대신에 창작자의 권리를 보호하는 것이 아니라, 이러한 규칙을 엄격하게 적용하지 않는 다른 관할 구역으로 개발 활동을 이전하도록 회사들에게 부추길 수 있습니다. 그러나 이것은 중간 지점이 없다는 것을 의미하지 않습니다. 우리는 AI 개발을 촉진하면서 저작권을尊重하는 실용적인 메커니즘을 필요로 합니다.

이러한 데이터셋은 하나의 접근 방식을 제공합니다. 콘텐츠가 명시적으로 옵트아웃하지 않는 한 사용할 수 있는 옵트아웃 모델은 또 다른 방법입니다. 세 번째 방법은 기술 솔루션을 통해 출판사, 창작자, 및 AI 회사 간의 거래를 촉진하는 것입니다.

궁극적으로, 모든 해결책은 적용 가능한 저작권 및 데이터 보호 법률의 범위 내에서 운영되어야 합니다. Oxylabs에서는 AI 혁신이 책임 있게 추구되어야 한다고 믿으며, 창작자를 존중하면서 진행을 가능하게 하는 합법적이고 실용적인 프레임워크에 기여하는 것이 우리의 목표입니다.

您的 팀이 동의 기반 데이터셋을 구현하기 위해 극복해야 했던 가장 큰 장애물은 무엇인가요?

우리의 길은 유튜브가 창작자들이 쉽게 그리고 편리하게 자신의 작품을 AI 훈련을 위해 라이선스할 수 있도록 해줌으로써 열렸습니다. 그 후에, 우리의 작업은 주로 데이터를 수집하고, 구조화하여 데이터셋을 준비하고, 회사들이 필요한 데이터에 접근할 수 있는 기술적 설정을 구축하는 것이었습니다. 그러나 이것은 우리가 이미 여러 해 동안 해왔던 것입니다. 물론, 각 경우에는 자신의課題가 있지만, 특히 멀티모달 데이터와 같은 복잡한 것을 다룰 때는 더 그렇습니다. 그러나 우리는 이러한 것을 수행할 지식과 기술적 능력을 가지고 있었습니다. 따라서, 유튜브 저자들이 동의할 수 있는 기회를 얻은 후, 나머지는 단지 시간과 자원을 투입하는 문제였습니다.

유튜브 콘텐츠를 넘어서, 음악, 글쓰기, 또는 디지털 아트와 같은 다른 주요 콘텐츠 유형도 체계적으로 라이선스되어 AI 훈련 데이터로 사용될 수 있는 미래를 상상하실 수 있나요?

일찍부터 우리는 창작자와 혁신자 간의 협력적인 방법을 통해 콘텐츠 라이선싱과 동의를 위한 체계적인 접근 방식의 필요성을 강조해 왔습니다. 양측 모두가 목표를 달성할 수 있는 편리한 방법이 있을 때, 상호 이익이 있을 것입니다.

이것은 시작에 불과합니다. 우리는 다양한 산업에서 이러한 데이터셋을 제공함으로써 저작권 논쟁을 평화적으로 해결할 수 있는 해결책을 제공할 수 있다고 믿습니다.

EU, 영국, 및 기타 관할 구역에서 AI 거버넌스 접근 방식의 차이가 Oxylabs의 윤리적 데이터셋과 같은 제공의 중요성을 어떻게 영향을 미치나요?

일부에서는, 명시적인 동의 기반 데이터셋의 가용성이 규제가 더 엄격한 관할 구역에 기반을 둔 AI 회사들에게 경쟁력을 제공할 수 있습니다. 이러한 회사의 주요 관심사는, 창작자를 지원하는 것이 아니라, 엄격한 규칙으로 인해 다른 관할 구역에 있는 AI 개발자들에게 불공平한 이점을 제공할 수 있다는 것입니다. 문제는 이러한 회사들이 창작자의 동의를 중요하게 생각하지 않는다는 것이 아니라, 편리한 방법으로 동의를 얻을 수 없기 때문에 뒤처질 수 있다는 것입니다.

반면에, 우리는 동의를 얻고 AI 훈련을 위한 라이선스된 데이터에 접근하는 것이 간단해진다면, 이러한 접근 방식이全球적으로 선호되는 방법이 될 이유가 없다고 믿습니다. 우리의 라이선스된 유튜브 콘텐츠를 기반으로 하는 데이터셋은 이러한 간소화를 위한 한 걸음입니다.

AI 훈련에 대한 증가하는 대중의 불신을 고려할 때, 어떻게 투명성과 동의가 기술 회사들에게 경쟁 우위를 제공할 수 있나요?

투명성이 종종 경쟁 우위를 방해하는 것으로 보이지만, 사실 이는 우리가 불신을 싸우는 데에 가장 강력한 무기입니다. AI 회사들이 제공할 수 있는 투명성이 càng 많으면, 윤리적이고 유익한 AI 훈련에 대한 증거가 더 많아지며, 이는 AI 산업에 대한 신뢰를 재건하는 데 도움이 됩니다. 그리고 반대로, 창작자들이 자신과 사회가 AI 혁신으로부터 가치를 얻을 수 있다는 것을 볼 때, 미래에 동의를 더 많이 제공할 이유가 더 많아집니다.

Oxylabs는 데이터 스크레이핑과 웹 인텔리전스와 관련이 있습니다. 이 새로운 윤리적 이니셔티브는 회사 전체의 비전에 어떻게 들어맞나요?

윤리적으로 소싱된 유튜브 데이터셋의 출시로, 우리는 산업에서 윤리적인 관행을 정립하고 촉진하는 Oxylabs의 임무를 계속하고 있습니다. 이에 따라, 우리는 Ethical Web Data Collection Initiative (EWDCI)를 공동 설립하고, 프록시 소싱을 위한 최초의 투명한 티어 프레임워크를 도입했습니다. 또한, 연구자와 학자들이 중요한 공공 웹 데이터에 대한 연구 영향을 최대화하고 이해를 높이는 것을 가능하게 하는 Project 4β를 시작했습니다.

향후, 정부는 훈련 데이터에 대한 동의를 기본으로 해야 합니까, 아니면 이것은 자발적인 산업 주도적인 이니셔티브로 남아야 합니까?

자유 시장 경제에서, 일반적으로 시장에 의해 자신을 교정하는 것이 가장 좋습니다. 시장의需求에 응하여 혁신을 발전시키는 것은 우리의 번영을 지속적으로 재창조하고 재생성하는 것입니다. 중대한 입법은 좋은 첫 선택이 아니며, 모든 다른 방법으로 정의와 혁신을 보장하는 모든 방법이 소진된 후에만 사용해야 합니다.

현재 AI 훈련에 도달하지 않은 것으로 보입니다. 유튜브의 라이선스 옵션과 우리의 데이터셋은 이 생태계가 새로운 현실에 적응하는 방법을 찾고 있음을 보여줍니다. 따라서, 명확한 규제가 필요하지만, 정부는 경각심을 가지고 접근해야 합니다. 모든 경우에 대한 명시적인 동의를 요구하는 대신, 산업이 현재의 긴장을 해결하는 메커니즘을 개발하는 방법을 조사하고, 입법을 통해 혁신을 촉진하는 대신 방해하지 않도록 할 수 있습니다.

윤리적인 데이터 사용을 우선시하면서도 혁신을 방해하지 않는 방법에 대한 조언은 무엇인가요?

스타트업과 AI 개발자가 윤리적인 데이터 사용을 촉진하는 한 가지 방법은 창작자에게 가치를 제공하고 동의를 얻는 과정을 간소화하는 기술 솔루션을 개발하는 것입니다. 투명하게 소싱된 데이터를 얻을 수 있는 옵션이 등장함에 따라, AI 회사들은 속도를 양보할 필요가 없습니다. 따라서, 이러한 제공을 주시하도록 조언합니다.

 이번 인터뷰에 감사드립니다. 더 많은 정보를 원하는 독자는 Oxylabs를 방문하십시오.

์•™ํˆฌ์•ˆ์€ Unite.AI์˜ ๋น„์ „์žˆ๋Š” ๋ฆฌ๋”์ด์ž ๊ณต๋™ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, AI์™€ ๋กœ๋ด‡๊ณตํ•™์˜ ๋ฏธ๋ž˜๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ์ด‰์ง„ํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ๋ถˆ๋ณ€์˜ ์—ด์ •์— ์˜ํ•ด ์ถ”๋™๋ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„์ ์ธ ๊ธฐ์—…๊ฐ€๋กœ์„œ, ๊ทธ๋Š” AI๊ฐ€ ์‚ฌํšŒ์— ๋Œ€ํ•œ ์ „๊ธฐ์™€ ๊ฐ™์€ ํŒŒ๊ดด๋ ฅ์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๋ฏฟ์œผ๋ฉฐ, ์ข…์ข… ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ ๊ณผ AGI์˜ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•ด ์—ด๊ด‘ํ•ฉ๋‹ˆ๋‹ค.

ไฝœไธบ futurist, ๊ทธ๋Š” ์ด๋Ÿฌํ•œ ํ˜์‹ ์ด ์šฐ๋ฆฌ์˜ ์„ธ๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ํ˜•์„ฑํ• ์ง€ ํƒ๊ตฌํ•˜๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ทธ๋Š” Securities.io์˜ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, ๋ฏธ๋ž˜๋ฅผ ์žฌ์ •์˜ํ•˜๊ณ  ์ „์ฒด ๋ถ€๋ฌธ์„ ์žฌํ˜•์„ฑํ•˜๋Š” ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ํˆฌ์žํ•˜๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.