부본 Mohammad Omar, LXT 공동 창립자 겸 CEO - 인터뷰 시리즈 - Unite.AI
Rescale 미팅 예약

인터뷰

Mohammad Omar, LXT 공동 창립자 겸 CEO – 인터뷰 시리즈

mm
업데이트 on

모하마드 오마르(Mohammad Omar)는 LXT, 세계에서 가장 큰 기술 회사를 포함하여 글로벌 조직을 위한 지능형 기술을 지원하는 AI 교육 데이터의 신흥 리더입니다. 국제 기여자 네트워크와 협력하여 LXT는 기업이 요구하는 속도, 규모 및 민첩성과 함께 여러 양식에 걸쳐 데이터를 수집하고 주석을 추가합니다. 2010년에 설립된 LXT는 캐나다 토론토에 본사가 있으며 미국, 호주, 인도, 터키, 영국 및 이집트에 지사를 두고 있습니다.

LXT의 기원 이야기를 들려주실 수 있나요?

LXT는 12년 전 고용주가 직면한 데이터에 대한 절실한 요구에 대응하여 설립되었습니다. 그 당시 회사는 아랍어 데이터가 필요했지만 데이터를 소싱할 올바른 공급업체가 없었습니다. 본질적으로 위험을 감수하고 기업가이기 때문에 저는 제 역할을 그만두고 새 회사를 설립하고 바로 돌아서 이전 고용주에게 서비스를 제공하기로 결정했습니다. 즉시 우리는 우리가 성공적으로 수행한 그들의 가장 어려운 프로젝트 중 일부를 받았고 거기에서 모든 것이 성장했습니다. XNUMX년이 지난 지금 우리는 이 회사와 강력한 관계를 구축하여 고품질 언어 데이터를 제공하는 공급업체가 되었습니다.

AI를 대규모로 배포하는 데 있어 가장 큰 문제는 무엇입니까?

좋은 질문입니다. 저희는 최근 연구 보고서에 이 질문을 포함시켰습니다. AI 성숙도를 향한 길. 응답자들이 언급한 가장 큰 과제는 기존 또는 레거시 시스템을 AI 솔루션에 통합하는 것이었습니다. 디지털 전환 전략으로 합리화해야 하는 조직 전체에 일련의 기술 시스템을 보유할 가능성이 가장 큰 대기업을 조사한 사실을 고려할 때 이는 이치에 맞습니다. 응답자들이 높게 평가한 다른 문제는 숙련된 인재 부족, 교육 또는 리소스 부족, 양질의 데이터 소싱이었습니다. 일반적으로 인용되는 이러한 응답에 놀라지 않았습니다. 물론 데이터 문제가 우리 조직의 존재 이유이기 때문입니다.

데이터 문제와 관련하여 LXT는 기계 학습 알고리즘이 이를 이해할 수 있도록 데이터 소스와 레이블을 지정할 수 있습니다. 우리는 대규모로 민첩하게 이를 수행할 수 있는 장비를 갖추고 있습니다. 이는 고품질 데이터를 매우 빠르게 제공한다는 의미입니다. 고객들은 출시를 준비하고 자신의 제품이 고객들에게 호평을 받고 있는지 확인하고 싶을 때 종종 우리를 찾아옵니다. 

우리와 협력하여 데이터를 소싱하고 레이블을 지정함으로써 회사는 팀이 혁신적인 솔루션을 구축하는 데 집중할 수 있도록 하여 리소스 및 인재 부족을 해결할 수 있습니다.

LXT는 750개 이상의 언어를 지원하지만 언어 자체의 구조를 넘어서는 번역 및 현지화 문제가 있습니다. LXT가 이러한 문제에 어떻게 대처하는지 논의할 수 있습니까?

확실히 번역 및 현지화 문제가 있습니다. 특히 공식적인 지위를 갖는 경향이 있는 가장 널리 사용되는 언어와 그에 따른 표준화 수준을 넘어서는 경우에는 더욱 그렇습니다. 우리가 사용하는 많은 언어에는 공식적인 맞춤법이 없기 때문에 팀 전체에서 일관성을 관리하는 것이 어려운 일이 됩니다. 우리는 품질 보증을 위한 엄격한 프로세스를 마련하여 이러한 문제 및 기타 문제(예: 사기 행위 감지)를 해결합니다. 다시 한 번 AI 성숙도 연구 보고서에서 AI 데이터로 작업하는 대부분의 조직에서 품질이 우선 순위 목록의 맨 위에 있음이 매우 분명했습니다. 그리고 조사에 응한 대부분의 조직은 이것을 얻기 위해 더 많은 비용을 지불할 의향이 있다고 밝혔습니다. 

데이터 소싱 및 데이터 주석이 필요한 회사의 경우 애플리케이션 개발 여정의 초기 단계에서 이 데이터 소싱을 시작해야 합니까?

조직이 AI 사용 사례를 식별하는 즉시 데이터 전략을 수립하는 것이 좋습니다. 응용 프로그램이 개발될 때까지 기다리면 불필요한 재작업이 많이 발생할 수 있습니다. AI가 잘못된 것을 학습하고 품질 데이터로 재훈련해야 하므로 소싱하고 개발 프로세스에 통합하는 데 시간이 걸릴 수 있습니다.

데이터를 업데이트해야 하는 빈도를 알기 위한 경험 법칙은 무엇입니까?

개발 중인 애플리케이션의 유형과 이를 지원하는 데이터가 중요한 방식으로 변경되는 빈도에 따라 달라집니다. 즉, 데이터는 실생활의 표현이며 시간이 지남에 따라 세상에서 일어나는 일을 정확하게 반영하기 위해 데이터를 업데이트해야 합니다. 우리는 이 현상을 모델 드리프트라고 부르며 두 가지 유형이 있으며 각각 알고리즘의 재교육이 필요합니다.

  • 개념 드리프트는 교육 데이터와 AI 출력 간의 상당한 차이가 변경될 때 발생하며, 이는 갑자기 또는 더 점진적으로 발생할 수 있습니다. 예를 들어 소매업체는 과거 고객 데이터를 사용하여 AI 애플리케이션을 교육할 수 있습니다. 그러나 소비자 현실에 엄청난 변화가 발생하면 이를 반영하기 위해 알고리즘을 재교육해야 합니다.

 

  • 데이터 드리프트는 응용 프로그램을 교육하는 데 사용되는 데이터가 프로덕션에 들어갈 때 마주치는 실제 데이터를 더 이상 반영하지 않을 때 발생합니다. 이는 인구통계학적 변화, 계절성 또는 새로운 지역에서의 애플리케이션 상황을 포함한 다양한 요인으로 인해 발생할 수 있습니다.

LXT는 최근 “2023년 AI 성숙도로 가는 길". 이 보고서에서 당신을 놀라게 한 요점은 무엇이었습니까?

그리 놀라운 일은 아니었지만 정말 눈에 띄는 것은 애플리케이션의 다양성이었습니다. XNUMX~XNUMX개의 활동 영역이 우세할 것으로 예상했을 수도 있지만, 응답자들에게 AI 노력을 어디에 집중할 계획인지, AI를 어디에 배치할 계획인지 물었을 때 처음에는 아무 추세도 없는 혼돈처럼 보였습니다. 그러나 데이터를 살펴보고 질적 응답을 살펴보면 추세가 없다는 것이 분명해졌습니다. is 경향. 적어도 응답자의 눈에는 문제가 있는 경우 누군가가 그것에 대한 AI 솔루션을 작업하고 있을 가능성이 실제로 있습니다.

제너레이티브 AI가 전 세계를 강타하고 있습니다. 언어 제너레이티브 모델이 업계에서 어느 정도까지 진출할 수 있는지에 대해 어떻게 생각하십니까?

이것에 대한 나의 개인적인 생각은 생성 인공 지능의 진정한 힘의 중심입니다. 여기서는 강조를 위한 약어 대신 단어를 사용하기로 선택했습니다. 자연어 이해입니다. AI의 '지능'은 언어를 통해 학습됩니다. 복잡한 문제를 다루고 궁극적으로 해결하는 능력은 반복적이고 누적되는 자연어 상호 작용을 통해 조정됩니다. 이를 염두에 두고 언어 생성 모델이 AI의 다른 요소와 완전히 일치할 것이라고 믿습니다.

AI의 미래와 LXT의 미래에 대한 당신의 비전은 무엇입니까?

나는 천성적으로 낙관주의자이고 그것이 여기에서 나의 대답에 영향을 주겠지만, AI의 미래에 대한 나의 비전은 AI가 모든 사람의 삶의 질을 향상시키는 것을 보는 것입니다. 우리의 세상을 더 안전한 곳, 미래 세대를 위한 더 나은 곳으로 만들기 위해서입니다. 미시적 수준에서 LXT에 대한 저의 비전은 조직이 지속적으로 강점을 기반으로 성장하고, 우리의 비즈니스를 가능하게 하는 글로벌 커뮤니티를 위해 선택한 고용주이자 선을 위한 힘이 되는 것을 보는 것입니다. 거시적 수준에서 LXT에 대한 나의 비전은 AI의 미래에 대한 낙관적으로 왜곡된 비전을 실현하는 데 중요하고 의미 있는 방식으로 기여하는 것입니다.

훌륭한 인터뷰 감사합니다. 자세한 내용을 알고 싶은 독자는 방문하세요. LXT.

unite.AI의 창립 파트너이자 포브스 기술 위원회, 앙투안은 미래파 예술가 AI와 로봇공학의 미래에 열정을 갖고 있는 사람입니다.

그는 또한 증권.io, 파괴적인 기술에 대한 투자에 초점을 맞춘 웹사이트입니다.