人工知能
Dr. Neil Yager, Phraseeの共同創設者兼チーフサイエンティスト – インタビューシリーズ

Dr. Neil Yagerは、Phraseeのチーフサイエンティストであり、Phrasee方法のアーキテクトです。Phrasee方法は、AIを利用したコピーライティングツールで、eBay、Groupon、Virginなど、世界で最も認知されているブランドのマーケティングコピーを最適化するのに役立ちました。また、オーストラリアからアメリカまで、20以上の言語、英語から日本語まで対応しています。
Dr. Yagerは、10以上の学術論文を著しており、データマイニングに関する本を執筆しています。また、特許も複数取得しています。AIの商業化における世界をリードする専門家の一人であり、オーストラリアのニューサウスウェールズ大学でコンピューターサイエンスの博士号を取得しています。
あなたは20年のテクノロジー業界のベテランです。以前のAI関連の役割について教えてください。
私は2000年代中期の博士課程以来、AI関連の仕事に携わっています。しかし、この分野はそれ以来何度もブランド変更されてきました。例えば、15年前私は「統計パターン認識」を研究していました。数年後、この分野は「機械学習」と呼ばれるようになりましたが、これはより魅力的名前です。最近では、機械学習(特に「ディープラーニング」)は一般的に「人工知能」と呼ばれるようになりました。我々はこの点について複雑な感覚を持っています。一方で、私の仕事はPhraseeのブランドの重要性を教えました。他方で、「人工知能」という用語は技術についての誤解を招く可能性があります。もし私たちがまだ「統計パターン認識」と呼んでいたらどうなっていたでしょうか。
私のほとんどの前の仕事は、信号処理とコンピュータービジョンの分野で行われました。Phraseeに入るまで、自然言語処理の経験はありませんでした。言語は、AIで最も難しい問題であることを最近学びました。
2008年に、あなたは『バイオメトリックシステムとデータ分析:設計、評価、データマイニング』という本を共同執筆しました。この本は、統計と機械学習の側面を結び付け、バイオメトリックデータの評価、解釈、理解のための包括的なガイドを提供しています。この本が出版されてから、この分野はどのように進化しましたか?説明してください。
ディープラーニングは、コンピュータービジョン、言語処理、機械学習の分野を2012年から激変させました。当時、私はこの本を書くことができませんでした。ディープラーニングは、2012年にImageNetというコンピュータービジョンの大会で優勝し、視覚的なオブジェクト認識データセットでコンピューターが画像の中にあるもの(例:「犬」または「風船」)を判断する能力を示しました。数十年間、研究者たちはベンチマークデータセットで少しずつ進歩を遂げていました。各サブ分野は独立して運営され、ドメイン固有の専門知識に大きく依存していました。ほぼ一夜にして、数多くのモデルは時代遅れになりました。ディープラーニングアルゴリズムは、外部の開発者によって設計され、競争で大きな差で勝利しました。これがAI業界を変えました。
この分野はまだ急速に進化しています。Phraseeを設立してから数年で、利用しているディープラーニングツールは存在しませんでした。イノベーションのスピードは独自の課題をもたらします。
Phraseeがビジネスに提供できるものについて教えてください。
Phraseeはビジネスに2つの問題を解決します。まず、マーケティングコピーを書く問題があります。現在、広告チャネルは以前よりも多くあります(例:メール、AdWords、ソーシャルメディア、印刷、ポッドキャストなど)。すべてのチャネルで高品質のコピーを書き、ブランドのスタイルとトーンに合うのは難しいです。Phraseeは、自動的にコピーを生成することでスケールの問題に対処します。2つ目は、使用される言語が効果的であることが重要です。Phraseeは言語を生成するだけでなく、機械学習を使用してメッセージの影響を予測し、最適化します。
あなたが自然言語処理(NLP)、ディープラーニングを使用して広告コピーの力を高めるというアイデアに惹かれた理由について教えてください。
AIを使用してデジタルマーケティングキャンペーンの影響を最大化するというアイデアは新しいものではありません。物理学の博士号を持つチームが広告の最適化に取り組んでいます。しかし、ほとんどの場合、彼らはオーディエンスのセグメント化、パーソナライゼーション、配信タイミング、広告の配置、フォントなどに研究開発の努力を集中させています。Phraseeのアイデアを出しているときに、私たちはほとんどの広告では実際に使用されている言語が最適化されていないことを認識しました。市場でのギャップと大きな機会を見出しました。
Phraseeは20以上の言語、包括して日本語でマーケティングコピーを改善できます。外国語で遭遇する独自の自然言語処理の問題について説明してください。
私たちが最近追加した言語はロシア語です。これはスラヴ語派であり、他のインド・ヨーロッパ語族とはかなり異なります。この場合、私たちの言語生成システムに新しいルールを組み込む必要がありました。そうすれば、出力が流暢で文法的に正しいことになります。これは言語の問題だけではありません。ソフトウェア開発の問題でもあります。開発者の母国語がシステムの出力言語と同じ場合、エラーを発見し、すべてが正しく動作していることを確認することは比較的簡単です。しかし、ロシア語や日本語の場合、システムが意味のないことを出力していることに気付かない可能性があります。QAプロセスにネイティブスピーカーが密接に関与していることは非常に重要です。
課題は外国語だけではありません。地域間の違いもあります。例えば、英語にはアメリカ、イギリス、オーストラリア、カナダなどでスペルが異なります。また、文法の違いもあります。イギリス英語では「have a look」と言いますが、アメリカ英語では「take a look」と言います。単語の意味も場所によって異なります。イギリスでは「rubber」は消しゴムですが、北米ではコンドームのことです。ビジネスアプリケーションでNLGシステムを使用するには、これらのニュアンスをすべて処理する必要があります。
Phraseeでディープラーニングがどのように使用されているかについて教えてください。
Phraseeの技術には2つの主要なAIコンポーネントがあります。1つは自然言語生成(NLG)で、言語を生成します。2つ目はディープラーニングで、ここではパフォーマンスに焦点を当てています。パフォーマンスとは、コンテキストによって異なることがあります。例えば、メールの件名の目標は、受信者がメールを開いて中身を確認することです。Facebookの場合、目標は「いいね」や「シェア」の最大化である可能性があります。大量の歴史データがあれば、人間が気付かないような繊細な傾向やパターンを見つけることができます。これは標準的な機械学習の問題です。
ディープラーニングには、従来の機械学習アプローチに対するいくつかの利点があります。従来の機械学習では、「特徴量エンジニアリング」に強い焦点があります。これは、開発者が言語の最も重要な特徴(例:単語、長さ、絵文字の使用など)を決定する必要があることを意味します。問題は、これが開発者のスキルと想像力によって制限されることです。ディープラーニングでは、生のテキストがモデルに直接入力され、言語の独自のマシン表現(エンドツーエンド学習と呼ばれる)を構築します。したがって、人間の偏見から自由であり、強力なアプローチです。しかし、欠点は、モデルがなぜそのように動作するのかを理解するのが難しいことです。「説明可能性」はディープラーニングコミュニティ内で活発な研究分野です。しかし、システムの複雑さと私たちがそれを理解する能力の間には基本的なトレードオフがあります。人間の言語は汚いので、成功したNLPソリューションは通常、高い複雑さを持っています。
Phraseeは、ブランドのユニークなトーンで書く機能があります。詳しく教えてください。
私たちが新しい顧客を獲得すると、最初にすることは、ブランドのコミュニケーションのスタイルに関する情報を収集することです。これには、正式なブランドガイドライン、過去のマーケティングキャンペーン、言語技術者がこの目的のために開発した一連の質問が含まれます。このすべての情報は、顧客固有の「言語モデル」を構築するために、私たちの言語技術者のチームによって使用されます。私たちの言語モデルは生成可能です。つまり、顧客のユニークなスタイルで、以前見たことがない言語を生成することができます。
言語モデルはいつでも更新できます。例えば、現在はCOVID-19の危機のピークにあります。私たちの言語チームは、不適切な言語が生成されないようにモデルを確認しています。たとえば、「これらのデALSはウイルス的に広がっている!」というフレーズは数ヶ月前に無害だったかもしれませんが、世界的なパンデミックの最中に明らかに不適切です。これは私たちのシステムの柔軟性を示しています。
Phraseeを始めるために必要なデータの種類について教えてください。
正直、始めるために必要なデータは多くありません。最初のステップは、適切なプロジェクト領域を特定することです。例えば、これは週刊プロモーションメールの件名である可能性があります。理想的には、これは比較的大きなオーディエンスを持ち、定期的なコミュニケーションが行われるものです。プロジェクトが特定されると、言語モデルを構築するために、目的のトピックとブランドの声に関する情報が必要です。Phraseeでは、パフォーマンスの結果が継続的に必要です。私たちのソリューションは機械学習を使用しているため、重要なメトリックを時間の経過とともに測定して追跡する必要があります。この情報は私たちのシステムにフィードバックされ、エンゲージメントを最適化するために使用されます。
Phraseeについてさらに共有したいことはありますか?
私たちがPhraseeを5年前に設立したとき、すぐに多くのスタートアップが類似の製品で市場に出てくるだろうと考えました。私たちの計画は、競争に先んじて、一歩先を行くことでした。しかし、この分野に参入する企業が少ないことに驚かされています。どこにいるのでしょうか?いくつかの理由があると思いますが、主な理由の1つは、言語が非常に難しい問題であるということです。他の企業が類似の製品を作成しようとしたが、R&Dの初期段階で失敗したのではないかと思います。これは私たちのテクノロジーのユニークさを証明しています。
自然言語処理、自然言語生成、ディープラーニングについての情報に富んだインタビュー、ありがとうございます。詳細については、Phraseeを訪問してください。












