人工知能
Marc Sloan, Scoutの共同創設者兼CEO – インタビュー・シリーズ

Marc Sloanは、Scoutの共同創設者兼CEOです。Scoutは、世界初のウェブブラウザチャットボットであり、オンラインで何でもできるデジタルアシスタントです。Scoutは、オンラインでの行動に基づいて、ユーザーに役立つことができることを提案します。
あなたがAIに惹かれたきっかけは何ですか?
AIに取り組んだ私の最初の経験は、学部の研究の一環としてGCHQの自然言語処理研究チームで働いていたときでした。私は、機械学習が現実世界の問題に与える影響と、それがもたらす違いを直接見ることができました。
それが私の考え方を変えることになりました。ソフトウェアエンジニアリングは、データを入力して結果を出力するプログラムを作ることを教えてくれますが、機械学習は、データを入力して結果を出力するプログラムを作ることができます。つまり、同じフレームワークを使用して、さまざまな問題を解決できるのです。これは、各問題に対してプログラムを書く必要があるよりも、はるかに大きな影響があると思いました。
私はすでに、数学とコンピュータサイエンスを並行して勉強しており、自然言語処理に関する研究をしています。大学に戻った後、AIに焦点を当て、UCLで情報検索の博士課程を申請する前に、音声処理に関する論文を完成させました。
David Silverの指導の下で、Web検索における強化学習を研究しました。研究の内容についてお話しください。
私の博士論文は、情報検索におけるランキング問題に強化学習を適用することについてでした。これは、私が創設した「Dynamic Information Retrieval」と呼ばれる分野です。私は、エージェントベースの強化学習の専門家であるJun Wang教授とDavid Silver教授の指導を受けました。
私たちの研究は、検索エンジンがユーザーの行動から学習して、検索結果を自動的に改善する方法について調べました。マルチアームドバンディットアプローチを使用して、システムはさまざまな検索ランキングを試み、クリック行動を収集してその有効性を判断しました。個々のユーザーにも適応でき、曖昧な検索クエリの処理にも特に効果的でした。当時、DavidはGo問題に深く取り組んでおり、私にこの特定の問題に対する強化学習の設定を決定するのに役立ちました。
David Silverと働いたことで、起業家として学んだ教訓についてお話しください。
UCLでの研究は、しばしば起業家精神を持っています。Davidは以前、Elixir StudiosをDemis Hassabisと共同設立し、後にDeepMindに参加してAlpha Goに取り組みました。他のメディアフューチャーズ研究グループのメンバーも、さまざまなスタートアップを設立しました。JunはMediagamma(オンライン広告支出にRLを適用)を設立し、Simon Chanはprediction.io(SalesForceに買収)を設立し、Jagadeesh GorlaはJaggu(電子商取引のレコメンデーションサービス)を設立しました。私たちのチームは、研究が商業的に与える影響についてよく議論しました。私は、UCLがロンドンに基盤を置いていることが、ビジネスを創設する自然な出発点になっているのかもしれません。
Scoutという世界初のウェブブラウザチャットボットを最近立ち上げました。Scoutを立ち上げるきっかけは何でしたか?
アイデアは自然に私の博士論文の研究から生まれました。私は博士号を取得した後すぐにEntrepreneur Firstに参加し、研究を製品に変える方法について考え始めました。
それ以前、私はMicrosoft Researchでインターンをして、研究をBingに適用しました。当時の私の研究から得た主な教訓は、オンラインユーザーの行動に基づいて情報の検索を予測できるということでした。しかし、検索エンジンでこれらの予測を表面化させる唯一の実際的な方法は、自動提案を改善することだったので、ユーザーのオンライン体験全体をこれらの予測を使用して改善する方法について考え始めました。
これらの思考が、私と私の新しい共同創設者が、Entrepreneur Firstでブラウザアドオンを作成するきっかけとなりました。アドオンはユーザーの行動を観察し、オンラインでユーザーが次に必要とする情報を予測し、それを取得します。数年間の実験とプロトタイプの後、これはブラウザがユーザーと会話するチャットボットインターフェイスに進化しました。
Scoutはどのウェブブラウザと互換性がありますか?
現在、Chromeに焦点を当てています。Chromeは最も人気のあるウェブブラウザであり、成熟したアドオンアーキテクチャを持っているからです。しかし、FirefoxとSafariのプロトタイプも動作しており、モバイルアプリもあります。
Scoutのショッピングアシスタント機能は、ユーザーが時間とお金を節約できるように思います。Amazonで製品を調査している場合、バックエンドでは何が起こるのでしょうか?また、Scoutはユーザーとどのようにやり取りしますか?
アイデアは、Scoutをインストールした後、通常のウェブ使用を続けることです。ショッピングの場合、Amazonに製品を調べるために訪れるかもしれません。その時点で、ScoutはAmazonでショッピングしていることと、見ている製品を認識し、「こんにちは」と言うでしょう。Scoutは、ウェブページにチャットウィジェットとして表示されます。Intercomのように動作しますが、Scoutは、ほぼどのウェブページでも表示できます。
ショッピング中なので、Scoutはユーザーに支援方法を提案し始めます。レビューの表示、他の価格、YouTubeの製品ビデオなどを表示するかどうかを尋ねます。ボタンを押すことで、ユーザーがやり取りをします。Scoutは、情報(YouTubeのビデオなど)をチャットスレッド内に埋め込むので、友達がWhatsAppでメディアを共有するように見えます。時間の経過とともに、ユーザーはブラウザと会話することになり、ブラウザがユーザーをサポートします。
ウェブページの処理は、ブラウザ自体内で行われます。バックエンドでは、チャットスレッドのみが表示されます。つまり、プライバシーへの影響は最小限です。
オンラインブラウジングの行動を理解し、ユーザーとの会話を管理するための独自のアーキテクチャを持っています。タスクを支援する方法と、ユーザーに支援する方法を決定するために、機械学習を使用しています。もともと、ユーザーの好みに適応するために強化学習を使用しました。しかし、AIスタートアップを運営することで学んだ最も重要な教訓の1つは、プロセスを簡素化し、機械学習を使用して既存のプロセスを最適化することだけに留めることです。したがって、ルールエンジンを使用して、強化学習でスケールアップする必要があるときにタスクを管理しています。
Scoutは、イベントプランニングを支援する方法の例をいくつか示してください。
イベントプランニング(および旅行の予約)は、オンラインショッピングとあまり異なりません。製品を調べ、レビューを読み、購入/参加を決定します。したがって、私たちがショッピングのために構築したものの多くは、ここでも適用されます。
最大の違いは、時間と場所が重要になることです。たとえば、Ticketmasterでコンサートチケットを調べている場合、Scoutは会場の住所を特定し、現在の場所から会場への道順を提案したり、Uberの料金を調べたり、イベントの時間に合わせて出発する時間を提案したりできます。Scoutがカレンダーに接続されている場合、Scoutはイベントの時間に利用可能かどうかを確認し、カレンダーにイベントを追加できます。
将来的には、Scoutユーザーがイベントプランニング、ショッピング、仕事などのオンラインでの活動について、プラットフォームを介して友達と会話できるようになることを想定しています。
Scoutがユーザーと会話を始めるためのダイアログトリガーについて説明してください。
デフォルトでは、Scoutは、ユーザーが支援を必要とする可能性があることを示すトリガーに出会うまで、ユーザーを邪魔しません。トリガーにはいくつかの種類があります。
- 特定のウェブサイトを訪問すること。
- 特定の種類のウェブサイト(ニュース、ショッピングなど)を訪問すること。
- 特定の種類の情報(住所、ビデオなど)を含むウェブサイトを訪問すること。
- ウェブページのリンクまたはボタンをクリックすること。
- Scoutとボタンを押してやり取りすること。
- Scoutが特定の種類のメディア(ビデオ、音楽、ツイートなど)を取得すること。
将来的には、ユーザーがScoutが反応するトリガーの種類を微調整できるようにしたいと考えています。最終的には、ユーザーの好みを自動的に学習できるようにしたいと考えています。
Scoutがユーザーと会話を始めることを決定した場合に、本当に役立つものであることを保証することの難しさについて議論してください。
ユーザーの関与を非常に重要視し、Scoutが会話を始めた結果が、ポジティブな結果にもネガティブな結果にもつながるかどうかを測定しようとします。Scoutが会話を始める頻度と、実際に使用される頻度の良いバランスを保つことを目指しています。しかし、これは難しいバランスです。常に改善しようとしています。
この製品の侵入性の性質により、インターフェイスとUXを正しく設計することは非常に重要です。完全に異なるインターフェイスとユーザーとのやり取り方法を試すのに多くの時間を費やしました。この作業により、現在のチャットボットスタイルのインターフェイスに至りました。これは、私たちが提供できる支援に最も大きな柔軟性を提供し、ユーザーに最もなじみのあるものであり、ユーザーの労力を最小限に抑えるものです。
Scoutがエンドユーザーを支援できる他のシナリオについて説明してください。
現在、Scoutの特定のアプリケーションを市場テスト中です。ショッピングやイベントプランニングについて既に触れましたが、Scoutがアカデミック(研究論文、著者情報、参照ネットワークの検索)やギタリスト(ギターシートミュージック、音楽、ビデオの検索)を支援できる方法も調べています。オンラインでの採用、金融分析、法律などのプロフェッショナルシナリオも調査しました。
最終的には、Scoutはほぼどのウェブサイトでも動作し、どのようなシナリオでも支援できる可能性があります。これが、このテクノロジーを非常に興奮させるものですが、同時に開始を難しくしています。
Scoutについてさらに共有したいことがありますか?
ブラウザがあなたと話すことができるようになるとどうなるかを見たい場合は、Scoutのブログを読むことができます。
ユニークなタイプのチャットボットを設計することについての興味深い説明ありがとうございます。このプロジェクトを追っていきたいと思います。Marc Sloanのウェブサイトを訪れて、詳細を確認してください。












