인공지능
닐 야거 박사, Phrasee의 공동 창립자 및 최고 과학자 – 인터뷰 시리즈

닐 야거 박사는 Phrasee</a)의 최고 과학자이며, Phrasee 방법의 설계자입니다. Phrasee는 AI를 기반으로 하는 копи라이팅 도구로, 세계에서 가장 잘 알려진 브랜드 중 일부를 위한 마케팅 복사를 최적화하는 데 도움을 주었습니다. 이러한 브랜드로는 eBay, Groupon, Virgin 등이 있으며, 20개 이상의 언어로, 영어에서 일본어까지, 호주에서 미국까지 다양한 지역에서 활동하고 있습니다. 야거 박사는 10개 이상의 학술 간행물을 저술했으며, 데이터 마이닝에 관한 책을 저술했으며, 여러 특허를 보유하고 있습니다. 그는 상업용 인공 지능 분야의 세계 최고 전문가 중 한 명으로, 호주 뉴사우스웨일즈 대학교에서 컴퓨터 과학 박사 학위를 취득했습니다.
테크 산업에서 20년 이상의 베테랑입니다. 이전에 관련된 AI 관련 역할은 무엇입니까?
저는 2000년대 중반부터 박사 학위를 취득한 이후 AI 관련 업무에 참여해 왔습니다. 그러나 그 이후로 이 분야는 여러 번의 재브랜딩을 거쳤습니다. 예를 들어, 15년 전에는 “통계적 패턴 인식”을 공부했습니다. 몇 년 후에 이것은 “기계 학습”으로 더 잘 알려지게 되었습니다. 최근에는 기계 학습(및 “딥 러닝” 특히)이 일반적으로 “인공 지능”과 동의어가 되었습니다. 저는 이에 대해 복잡한 감정을 가지고 있습니다. 한편으로, Phrasee에서 일하면서 브랜딩의 중요성을 배웠습니다. 다른 한편으로, “인공 지능”이라는 용어는 기술에 대한 오해를 불러일으킬 수 있습니다. 저는 만약 우리가 모두 여전히 “통계적 패턴 인식”이라고 불렀다면 어디에 있을지 궁금합니다.
저의 대부분의 이전 업무는 신호 처리와 컴퓨터 비전 분야에서 이루어졌습니다. Phrasee 이전에는 자연어 처리에 대한 노출이 많지 않았습니다. 그러나 이후에 언어는 아마도 AI에서 가장 어려운 문제라는 것을 배웠습니다.
2008년에 저술한 책 ‘바이오메트릭 시스템 및 데이터 분석: 설계, 평가, 데이터 마이닝‘은 통계와 기계 학습의 측면을 다루어 바이오메트릭 데이터를 평가, 해석, 이해하기 위한 포괄적인 가이드를 제공합니다. 더 많은 컴퓨팅 자원이 아닌 경우, 이 분야는 책이 출판된 이후로 진화했는지 생각하시나요? 어떻게 진화했는지 설명해 주시겠습니까?
딥 러닝은 컴퓨터 비전, 언어 처리, 기계 학습 분야에서 이 책을 쓴 이후로 큰 변화를 가져왔습니다. 딥 러닝 없이 이 책을 쓸 수 없습니다.
딥 러닝 혁명은 2012년에 ImageNet 경쟁에서 딥 러닝 모델이 우승하면서 시작되었습니다. ImageNet은 컴퓨터가 이미지를 인식하여 무엇이 있는지 결정하는(예: “개” 또는 “풍선”) 시각적 객체 인식 데이터셋입니다. 수십 년 동안 연구자들은 벤치마크 데이터셋에서 점진적인 개선을 이루어 왔습니다. 각 하위 분야는 독립적으로 작동하며 도메인별 전문 지식을 크게 의존했습니다. 거의 한밤중에 모든 모델이 수년간 구축된 것이 구식이 되었습니다. 외부인들이 설계한 딥 러닝 알고리즘이 큰 차이로 경쟁에서 승리했습니다. 이것은 AI 산업을 변革했습니다.
이 분야는 여전히 빠르게 움직이고 있으며 Phrasee를 시작한 지 몇 년 후에도 여전히 진화하고 있습니다. 예를 들어, 현재 우리가 의존하는 딥 러닝 도구는 회사를 설립했을 때 존재하지 않았습니다. 혁신의 속도는 자체적인 도전을 가져옵니다.
Phrasee가 비즈니스에 제공할 수 있는 기능에 대해 자세히 알려주실 수 있습니까?
Phrasee는 비즈니스에 두 가지 문제를 해결합니다. 첫째, 마케팅 복사를 작성하는 문제입니다. 현재보다 더 많은 광고 채널이 있습니다(예: 이메일, AdWords, 소셜, 인쇄, 팟캐스트 등). 모든 채널에서 높은 품질의 복사를 작성하고 브랜드의 스타일과 음색에 맞추는 것이 어렵습니다. Phrasee는 자동으로 복사를 생성하여 규모의 문제를 해결합니다. 둘째, 사용되는 모든 언어가 효과적인지 확인하는 것이 중요합니다. Phrasee는 언어를 생성할 뿐만 아니라 성능을 예측하고 최적화하는 데 기계 학습을 사용합니다.
자연어 처리(NLP)와 딥 러닝을 사용하여 광고 복사의 힘을 강화하는 아이디어에 끌렸던 것은 무엇입니까?
디지털 마케팅 캠페인의 영향을 최대화하기 위한 AI의 사용은 새로운 아이디어가 아닙니다. 물리학 박사 학위를 가진 사람들이 광고 최적화를 위해 일하기 위해 고용되었습니다. 그러나 대부분의 경우 mereka는 대상 세분화, 개인화, 전달 시각, 광고 배치, 글꼴 등에 대한 연구 개발 노력을 집중하고 있습니다. Phrasee의 아이디어를 처음 논의할 때 우리는 거의 모든 것이 최적화되고 있지만 실제 사용되는 언어가 최적화되지 않았 음을 알게 되었습니다! 우리는 이것을 시장의 간격으로 식별했고,巨大한 기회로 보았습니다.
Phrasee는 일본어를 포함한 20개 이상의 언어로 마케팅 복사를 개선할 수 있습니다. 외국어에서 발생하는 고유한 자연어 처리 문제에 대해 논의해 주시겠습니까?
최근에 추가된 언어는 러시아어입니다. 이것은 슬라브어로 다른 인도유럽어와는 다릅니다. 이 경우 언어 생성 시스템에 새로운 규칙을 구축하여 출력이 유창하고 문법적으로 올바른지 확인해야 합니다. 이것은 언어 문제만이 아닙니다. 이것은 또한 소프트웨어 개발 문제입니다. 시스템의 출력이 개발자의 모국어일 때는 오류를 쉽게 식별하고 모든 것이 올바르게 작동하는지 확인할 수 있습니다. 그러나 러시아어 또는 일본어로 작업할 때 우리는 아무도 모르는 무의미한 출력을 생성할 수 있습니다. QA 프로세스에 네이티브 스피커가密接적으로 참여하는 것이 중요합니다.
도전은 외국어만이 아닙니다. 지역 간에도 일부 интересные 차이점이 있습니다. 예를 들어, 영어는 미국, 영국, 호주, 캐나다 등에서 철자 변형이 있습니다. 또한 문법적인 차이도 있습니다. 영국 영어에서는 “have a look”을 사용하지만 미국 영어에서는 “take a look”을 사용합니다. 단어의 의미도 장소에 따라 다를 수 있습니다. “rubber”는 영국에서 지우개이지만 북미에서 콘돔을 의미합니다! 비즈니스 응용 프로그램을 위한 NLG 시스템은 이러한 모든 차이를 처리해야 합니다.
Phrasee에서 딥 러닝을 사용하는 세부 사항을 공유해 주시겠습니까?
Phrasee의 기술에는 2つの 주요 AI 구성 요소가 있습니다. 첫 번째는 자연어 생성(NLG)으로 언어를 생성합니다. 두 번째는 딥 러닝으로 성능에 중점을 둡니다. 성능은 상황에 따라 다를 수 있습니다. 예를 들어, 이메일 제목 줄의 목표는 수신자가 이메일을 열어 내용을 확인하도록 유도하는 것입니다. 페이스북의 경우 목표는 좋아요 또는 공유를 최대화하는 것입니다.大量의 역사 데이터가 주어지면 인간이 인식하지 못할 수 있는 미묘한 경향과 패턴을 찾을 수 있습니다. 이것은 표준적인 기계 학습 문제입니다.
딥 러닝은 전통적인 기계 학습 접근 방식보다 몇 가지 장점을 제공합니다. 전통적인 기계 학습에는 “기능 공학”에 강한 초점이 있습니다. 즉, 개발자는 언어의 가장 중요한 기능을 결정해야 합니다(예: 단어, 길이, 이모지 사용 등). 문제는 이것이 개발자의 기술과 상상력에 제한된다는 것입니다. 그러나 딥 러닝에서는 원시 텍스트를 모델에 입력하고 언어에 대한 자신의 기계적인 표현을 구축합니다(이것을 종단 간 학습이라고 합니다). 따라서 인간의 편향에서 자유로워지고 강력한 접근 방식입니다. 그러나 모델이 특정 방식으로 작동하는 이유를 이해하기가 어렵습니다. “설명 가능성”은 딥 러닝 커뮤니티 내에서 활발한 연구 분야입니다. 그러나 시스템의 복잡성과 우리가 이해할 수 있는 능력 사이에는 근본적인 트레이드 오프가 있습니다. 인간 언어는 지저분하므로 성공적인 NLP 솔루션은 일반적으로 높은 복잡성을 갖습니다.
Phrasee는 브랜드의 고유한 음색으로 작성할 수 있습니다. 어떻게 수행되는지 자세히 설명해 주시겠습니까?
새로운 고객을 등록할 때 우리는 첫 번째로 고객의 브랜드 통신 스타일에 대한 정보를 수집합니다. 이것에는 공식 브랜드 지침, 역사적인 마케팅 캠페인 및 언어 기술자들이 이 목적으로 개발한 일련의 설문조사가 포함됩니다. 이러한 모든 정보는 고객별 “언어 모델”을 구축하는 데 사용됩니다. 우리의 언어 모델은 생성 가능하므로 고객의 고유한 스타일로 전에 본 적 없는 언어를 생성할 수 있습니다.
언어 모델은 언제든지 업데이트할 수 있습니다. 예를 들어, 현재 우리는 COVID-19 위기의 정점에 있습니다. 언어 팀은 우리의 모델을 검토하여 부적절한 언어가 생성되지 않도록 합니다. 몇 달 전에는 無害했지만 현재 전 세계적 대유행 중에는 명백히 부적절한 구절입니다. 이것은 우리 시스템의 유연성을 보여줍니다.
Phrasee를 시작하려는 회사에 필요한 데이터 유형은 무엇입니까?
정확하게 말하자면, 시작하기 위해 많은 데이터가 필요하지 않습니다. 첫 번째 단계는 적합한 프로젝트 영역을 식별하는 것입니다. 예를 들어, 주간 프로모션 이메일의 제목 줄이 될 수 있습니다. 이상적으로는 상대적으로 큰 청중이 있으며 통신이 정기적으로 발생하는 것이 좋습니다. 프로젝트가 식별되면 언어 모델을 구축하기 위해 주제 및 브랜드 음성에 대한 정보가 필요합니다. Phrasee는 성능 결과를 지속적으로 필요로 합니다. 우리의 솔루션은 기계 학습을 사용하기 때문에 주요 메트릭을 시간이 지남에 따라 측정하고 추적하는 것이 중요합니다. 이 정보는 우리의 시스템에 피드백되어 계속해서 참여를 최적화할 수 있도록 합니다.
Phrasee에 대해 더 공유하고 싶은 내용이 있습니까?
Parry, Victoria 및 저가 Phrasee를 5년 전에 시작했을 때 우리는 다른 스타트업이 유사한 제품으로 곧 나타날 것이라고 생각했습니다. 우리의 계획은 경쟁을 앞서고 한 발 앞서 있는 것이었습니다. 그러나 우리는 이 공간에 입장한 다른 شرکت의 부족에 놀랐습니다. 모두 어디에 있습니까? 몇 가지 이유가 있지만 주요한 이유 중 하나는 언어가 매우 어려운 문제라는 것입니다. 다른 사람들이 유사한 제품을 만들려고 시도했지만 초기 연구 개발 단계에서 실패한 것으로 추측합니다. 이것은 우리의 기술이 얼마나 고유한지에 대한 증거입니다.
자연어 처리, 자연어 생성, 딥 러닝에 대한 정보를 제공해 주신 Phrasee의 닐 야거 박사님께 감사드립니다. 자세한 정보는 Phrasee를 방문하실 수 있습니다.












