Connect with us

ํ•„ ํ™€, LXT์˜ ์„ฑ์žฅ ์ฑ…์ž„์ž – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

์ธํ„ฐ๋ทฐ

ํ•„ ํ™€, LXT์˜ ์„ฑ์žฅ ์ฑ…์ž„์ž – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

mm

LXT의 성장 책임자 필 홀은 전 애플린(Appen) 임원이며 포브스 기술위원회(Forbes Technology Council) 회원입니다. 애플린에서 그는 1,000명 이상의 직원을 이끌었으며 17년 연속 매출 증가와 강한 수익성을 달성하는 데 중요한 역할을 했습니다. 현재 LXT에서 그는 성장 목표를 달성하기 위해 전문가 팀과 함께 일하고 있습니다.

LXT는 글로벌 조직을 위한 지능형 기술을 구동하는 AI 훈련 데이터의 신흥 리더입니다. 국제 네트워크의 기여자와 협력하여 LXT는 기업이 요구하는 속도, 규모, 그리고 민첩성을 갖춘 여러 모달리티에서 데이터를 수집하고 주석을 달습니다. 그들은 115개 이상의 국가와 750개 이상의 언어 로케일에서 전문 지식을 보유하고 있습니다. 2010년에 설립된 LXT는 캐나다 토론토에 본사를 두고 있으며 미국, 호주, 이집트, 영국, 터키에 현지 조직을 보유하고 있습니다. 이 회사는 북미, 유럽, 아시아 태평양, 중동의 고객을 지원합니다.

언제부터 언어에 대한 열정을 발견하셨나요?

저는 언어에 대한 관심을 언제부터인지 정확히 기억하지는 못합니다. 그러나 언어와 언어학에 대한 직접적인 참여는 저에게 하나의 중요한 전환점이 있었습니다. 우리 아이가 난독증이 있다는 것을 알게 되고, 학교에서 추가적인 지원을 요청했을 때 학교 측에서 프로그램을 제공할 수는 있지만 저도 학교에서 자원봉사자로 활동할 수 있다고 했습니다. 그것이 잘 진행되면서 저는 언어학을 공부하게 되고 두 개의 대학에서 가르치게 되었습니다.

언어학을 가르치던 시절에 음성 데이터 분야로 관심을 전환하게 된 계기가 무엇인가요?

시드니에 기반을 둔 애플린은 집에서 운영되던 사업을 정식 상업적인 사업으로 전환하는 중이었습니다. 저는 그곳에서 언어학자가 필요하다는 소식을 듣고 창립자 줄리와 크리스 폰빌러를 만나게 되었습니다. 전환은渐進적으로 진행되었으며 약 2년 정도 걸렸습니다. 저는 가르치는 것을 떠나기 싫었습니다. 특히 초기에 세계 최고의 언어 기술 전문가들과 어려운 문제를 해결하는 것이 매우 흥미로웠습니다.

은퇴 후 LXT에 합류하게 된 동기는 무엇인가요?

그것은 흥미로운 질문입니다. 저는 은퇴 후에도 즐거운 나날을 보냈었습니다. 사실, 공동 창립자이자 CEO인 모하마드 오마르가 초기에 접촉했을 때 저는 은퇴한 상태였기 때문에 전혀 고려하지 않았습니다. 모하마드와 LXT 팀의 다른 구성원들과 이야기하면서 언어에 대한 공통의 열정을 즉시 인식했습니다. 모하마드가 구성한 팀은 창의적 사고와 무한한 에너지를 갖춘 전문가들로 구성되어 있었습니다.

현재 대규모 데이터 수집의 주요 도전 과제는 무엇인가요?

도전 과제는 응용 프로그램의 다양성만큼 다양합니다.

실제적인 관점에서 도전 과제는 진실성, 신뢰성, 정확성, 보안性, 그리고 데이터가 목적에 적합한지 확인하는 것입니다. 그리고 이는 데이터 수집의 법적 및 윤리적 도전 과제를 고려하지 않은 것입니다.

예를 들어, 자율 주행 자동차를 지원하는 기술 개발에는 실제 상황에서 반응하는 방법을 이해하기 위해 매우大量의 데이터를 수집해야 합니다. 운전 중에 발생할 수 있는 무수한 에지 케이스가 있으며 이러한 경우를 다루기 위해 알고리즘이 데이터셋을 필요로 합니다. 그리고 날씨 조건을 고려하면 필요한 훈련 데이터의 양이 기하급수적으로 증가합니다. 자율 주행 분야에 진출하는 자동차 회사들은 신뢰할 수 있는 데이터 파이프라인을 구축해야 하며, 이를 자체적으로 수행하는 것은大量의 자원을 필요로 합니다.

또 다른 사용 사례는 기존의 음성 AI 제품을 새로운 시장으로 확장하여 시장 점유율과 새로운 고객을 획득하는 것입니다. 이는 필연적으로 언어 데이터를 필요로 하며, 정확성을 달성하기 위해 다양한 dân tộc 프로필의 원어민으로부터 음성 데이터를 수집해야 합니다. 데이터를 수집한 후, 제품의 NLP 알고리즘을 훈련하기 위해 음성 파일을 전사해야 합니다. 여러 언어로 이러한 양의 데이터를 수집하고 전사하는 것은 특히 내부 전문 지식이 부족한 회사에서는 매우 어려운 도전 과제입니다.

이들은 대규모 AI 데이터 수집의 몇 가지 도전 과제의 예입니다. 하지만 가정 자동화, 모바일 디바이스, 생체 데이터 수집 각각에도 특정한 도전 과제가 있습니다.

LXT에서 현재 데이터를 수집하고 주석을 달는 방법은 무엇인가요?

LXT에서 우리는 각 고객을 위해 데이터를 수집하고 주석을 달는 방식을 다르게 합니다. 모든我们的 참여는 고객의 사양을 충족하도록 맞춤형으로 진행됩니다. 우리는 오디오, 이미지, 음성, 텍스트, 비디오와 같은 다양한 데이터 유형에서 작업합니다. 데이터 수집을 위해 우리는 글로벌 계약자 네트워크와 협력하여 이러한 다양한 모달리티에서 데이터를 수집합니다. 수집은 실제 환경에서 데이터를 수집하는 것부터 특정 음성 데이터 수집 프로젝트의 경우에는 스튜디오에서 경험 있는 엔지니어와 함께 작업하는 것까지 다양합니다.

我们的 데이터 주석 능력도 여러 모달리티를 다룹니다. 우리의 경험은 음성 분야에서 시작되어 지난 12년 동안 115개 이상의 국가와 750개 이상의 언어 로케일로 확장되었습니다. 이는 모든 규모의 회사들이 LXT를 통해 다양한 시장에 진출하고 새로운 고객 세분을 획득할 수 있음을 의미합니다. 최근 우리는 텍스트, 이미지, 비디오 데이터로 확장했으며, 내부 플랫폼을 사용하여 고객에게 높은 품질의 데이터를 제공합니다.

또 다른 흥미로운 성장 분야는 우리의 보안 주석 작업입니다. 올해 우리는 ISO 27001 보안 시설의 규모를 2곳에서 5곳으로 확대했습니다. 우리는 새로운 시설을 몇 개월 만에 구축할 수 있는 플레이북을 개발했습니다. 이러한 보안 시설에서 우리는 현재 음성 데이터 주석과 전사를 중점적으로 지원하고 있지만, 이는 다양한 데이터 유형의 주석에 사용될 수 있습니다.

이러한 방식으로 데이터를 수집하는 것이 합성 데이터보다 우수한 대안인 이유는 무엇인가요?

합성 데이터는 AI 분야에서 흥미로운 발전이며, 특히 실제 세계에서 캡처하기 어려운 에지 케이스와 같은 특정 사용 사례에 적합합니다. 합성 데이터의 사용은 특히 초기 실험 단계에서 AI 성숙도를 가진 회사에서 증가하고 있습니다. 그러나 우리의 연구에 따르면, 조직이 AI 전략을 성숙시키고 더 많은 모델을 프로덕션으로 이동할수록, 감독된 또는 반감독된 기계 학습 방법을 사용할 가능성이 더 높아집니다. 이러한 방법은 인간이 주석을 단 데이터에 의존합니다.

인간은 컴퓨터보다 데이터의细微한 점을 이해하는 데 더 나은 능력을 가지고 있으며, 인간의 감시도 편향을 줄이는 데 중요합니다.

이 데이터는 음성 및 자연어 처리에 왜 इतन 중요할까요?

음성과 자연어 처리 알고리즘이 의도된 시장에서 효과적으로 작동하려면, 문화적 맥락을 가진 원어민으로부터 높은 데이터 볼륨을 수집하여 훈련해야 합니다. 이러한 데이터가 없으면 음성 AI의 채택에는 심각한 제한이 있을 것입니다.

또한, 음성 데이터를 수집할 때 환경을 고려해야 합니다. 예를 들어, 자동차에서 음성 AI 솔루션이 사용될 경우, 도로 및 날씨 조건과 같은 다양한 요인이 음성에 영향을 미칩니다. 이러한 복잡한 시나리오에서 경험 있는 데이터 파트너가 도움이 될 수 있습니다.

LXT에 대한 추가 정보가 있다면 무엇인가요?

먼저, 저의 이야기를 공유할 수 있는 기회를 주셔서 감사합니다! 저는 LXT가 모든 규모의 조직이 AI 이니셔티브에 성공하도록 도와주는 데 헌신되어 있음을 강조하고 싶습니다. 우리는 12년 이상 세계 각지의 회사에 맞춤형 AI 데이터를 제공해 왔으며, 신뢰할 수 있는 데이터 파이프라인을 구축하여 AI 프로젝트를 지원하고자 하는 누구든지 연결할 수 있습니다.

훌륭한 인터뷰에 감사드립니다. 더 많은 정보를 원하는 독자는 LXT를 방문할 수 있습니다.

์•™ํˆฌ์•ˆ์€ Unite.AI์˜ ๋น„์ „์žˆ๋Š” ๋ฆฌ๋”์ด์ž ๊ณต๋™ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, AI์™€ ๋กœ๋ด‡๊ณตํ•™์˜ ๋ฏธ๋ž˜๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ์ด‰์ง„ํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ๋ถˆ๋ณ€์˜ ์—ด์ •์— ์˜ํ•ด ์ถ”๋™๋ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„์ ์ธ ๊ธฐ์—…๊ฐ€๋กœ์„œ, ๊ทธ๋Š” AI๊ฐ€ ์‚ฌํšŒ์— ๋Œ€ํ•œ ์ „๊ธฐ์™€ ๊ฐ™์€ ํŒŒ๊ดด๋ ฅ์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๋ฏฟ์œผ๋ฉฐ, ์ข…์ข… ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ ๊ณผ AGI์˜ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•ด ์—ด๊ด‘ํ•ฉ๋‹ˆ๋‹ค.

ไฝœไธบ futurist, ๊ทธ๋Š” ์ด๋Ÿฌํ•œ ํ˜์‹ ์ด ์šฐ๋ฆฌ์˜ ์„ธ๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ํ˜•์„ฑํ• ์ง€ ํƒ๊ตฌํ•˜๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ทธ๋Š” Securities.io์˜ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, ๋ฏธ๋ž˜๋ฅผ ์žฌ์ •์˜ํ•˜๊ณ  ์ „์ฒด ๋ถ€๋ฌธ์„ ์žฌํ˜•์„ฑํ•˜๋Š” ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ํˆฌ์žํ•˜๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.