スタブ アンドレア・ヴァッターニ氏、Spiketrap 共同創設者兼主任研究員 - インタビュー シリーズ - Unite.AI
私達と接続

記事執筆

スパイクトラップの共同創設者兼主任研究員、アンドレア・ヴァッターニ – インタビューシリーズ

mm

公開済み

 on

アンドレア・ヴァッターニ氏は、 スパイクトラップは、クリエイター、プラットフォーム、ブランドの視聴者インテリジェンスとメディア パフォーマンスを強化するコンテキスト化企業です。 独自の Clair AI は、非構造化データセットのノイズから信号を抽出し、特に高速オンライン環境において、比類のない明瞭さとコンテキストを提供します。

最初にコンピューター サイエンスと AI に惹かれたのは何ですか?

偶然の状況が重なって、統計専攻の入学試験を受けるためにローマ大学に行ったのですが、なんと XNUMX 日遅れていたことが分かりました。 私は代わりにコンピュータサイエンスに応募し、XNUMX年後に統計部門に戻るよう勧められました。 私はコンピューター サイエンスの入学試験 (その日でした!) を受けに行きましたが、合格しました。統計学に戻ることはありませんでした。 私の AI への興味は、コンピューターが物事の自動化にどのように役立つか、そして AI は究極の自動化機械であると認識したことから始まりました。 また、自然言語と人々がそれをどのように使用するかについては、常に私の興味がありました。高校では古典の勉強に重点を置き、古代ギリシャ語とラテン語を勉強しました。これはおそらく、機械が言葉の流れを与えられたときにどのように感じるかに似ています。

あなたは以前、Amazon Goodreads でシニア リード ソフトウェア エンジニアとして働いていましたが、取り組んだプロジェクトにはどのようなものがありましたか?また、この経験から得た重要な点は何でしたか?

Goodreads に在籍中、私はスパム検出や書籍推奨エンジンのスケーリングなど、複数の機械学習プロジェクトに取り組みました。そこにいたときの教訓は、ビジネスと顧客の目標に合致する ML メトリクスを定義することの重要性を学んだことです。例を挙げると、レコメンデーション エンジンは非常に長い間存在していました。 2009 年に開催された、より優れた映画の推薦を目的とした「Netflix 賞」コンテストを覚えていますか?上位のソリューションからのいくつかの分析結果では、映画を視聴する可能性は、その映画が好きかどうかによって決まるのではなく、主に自分の興味と似ているかどうかによって左右されることが示唆されています。映画の場合は 90 分の短い上映時間なのでこれでうまくいくかもしれませんが、本の場合はそうではありません。適切な目標を指標に組み込むことが重要です。

Spiketrap で私が学んだもう XNUMX つの教訓は、探索と研究だけに焦点を当てた孤立したチームではなく、デリバリー指向で製品ロードマップと統合された AI チームを構築することです。 これにより、目標、スケジュール、ROI のより適切な定義が可能になります。 また、チームが純粋に精度を重視するのではなく、モデルの速度と実用性に重点を置くことも自然に有利になります。 Netflix のコンテストの例に戻ると、優勝チームのモデルは精度が向上したにもかかわらず十分に実用的ではなかったため、統合されることはありませんでした。

あなたの研究は数多くのジャーナルに掲載されていますが、これまでで最も重要な論文は何だと思いますか?

博士課程の頃私は幸運にも、機械学習、「ビッグデータ」、ソーシャルデータ分析、ゲーム理論など、さまざまな分野の数人の研究者と共同研究することができました。 シンプルさと応用性の点で私が気に入っている論文は、「スケーラブルな K-Means++”: K-means++ は、データセットを K 個の一貫したグループに分割するために広く使用されている教師なしクラスタリング手法です。 これは一度に XNUMX つのグループを追加することで行われるため、大量のデータとグループがある場合は非常に遅くなります。 この論文では、メソッドを並列化することで、同等の、あるいはそれ以上の精度を達成する方法を示します。 私たちの方法論は非常にシンプルで、いくつかの機械学習ライブラリに実装されています。

スパイクトラップの誕生秘話を教えていただけますか?

Goodreads で働いた後、私と Spiketrap の共同創設者である Kieran と Virgilio は、ニッチなソーシャル プラットフォームから高度なブランド インサイトにアクセスするには業界にギャップがあることに気づきました。 AI テクノロジーを適用することで、この問題に効率的に対処できるようになります。

今日の経済では、企業が顧客やそれぞれの業界全体の意見に耳を傾けることが不可欠です。 しかし、ブランドについての顧客の意見の多くは聞き入れられません。 毎日、何百万人もの人々が Twitter、Reddit、Twitch などのプラットフォームで率直に意見を表明しています。 コンテンツを大規模に文脈化できる場合、これはあらゆる市場調査者にとって非常に貴重なリソースであることが証明されています。 問題は、インサイト業界がデジタルの行動や言語の進化に追いついていないことです。

リスニング ツールは依然としてキーワードとブール検索に依存しており、特定のブランドに起因する可能性がある、またそうあるべき会話の多くを見逃しています。 一方、市場調査会社は、定量的でコストに制約のある方法論から定性的な洞察を確認しようとして、ますます困難なバランスに陥っています。

つまり、人々は視聴者を大規模に理解するために必要なツールを欠いています。 販売数と視聴者数は、視聴者の行動の「何を」には答えますが、「なぜ」は答えられません。 文脈がなければ、相関関係と因果関係を理解するのは推測ゲームです。 この空白を認識し、文脈を理解するためのソリューションがどのようなものかを掘り下げ、Spiketrap が誕生しました。

Spiketrap で使用されている機械学習テクノロジーにはどのようなものがありますか?

通常の Scikit-Learn から Pytorch などの深層学習ライブラリまで、多数のテクノロジーを使用しています。 ライブラリを除けば、私たちが使用する方法論、モデル、データセットのほとんどは独自のものです。 既製の手法やモデルでは限界までしか解決できませんが、実際に問題を解決するには、目標から始めてモデル アーキテクチャとデータセットに至るまで、実際に自分で取り組む必要があることがわかりました。 例を挙げると、トピック モデリングは、テキストの集合からテーマを抽出するタスクです。 当社の「Spiketrap Convos」は、視聴者に関する重要な洞察を顧客に提供し、シグナルの XNUMX つとしてトピック モデリングを使用します。 トピック モデリングの一般的な頼りになる手法は LDA (Latent Dirichlet Allocation) ですが、残念ながら、これはあまりにも一貫性がなく、予測不可能であり、単に十分強力ではありません。 スペクトルの反対側では、Bert-Topics などの最新の事前トレーニング済みモデルを試すことができます。これは、強力で包括的である一方で、非常に硬直的で遅いという特徴もあります。 NLP と言語 AI は過去 XNUMX 年間で飛躍的に進歩しましたが、既存のモデルを製品に変えるのは依然として最適とは程遠く、危険な賭けです。

Spiketrap がクリエイター、プラットフォーム、ブランドの瞬時の視聴者の理解をどのように強化するかについて詳しく教えていただけますか?

広告主や代理店は、当社のインフルエンサー リーダーボードとブランド アフィニティ ツールを使用して、コミュニティ全体のブランド セーフティだけでなく、有毒、冒涜的、性的コンテンツのグレードなど、さまざまなカテゴリにわたってコミュニティがブランド セーフであるクリエイターを特定します。

クリエイターはこのツールを使用して個々のストリームに飛び込み、どの会話が最も安全か最も安全でないか、スポンサーの積極的なエンゲージメントを促進したか、モデレーションの取り組みを改善したほうがよい会話はどこかを確認できます。

「」というタイトルの最近の論文FeelsGoodMan: Twitch 新語の意味論の推論』がスパイクトラップより出版されました。 この論文が何であるかを簡単に説明していただけますか?

人々がオンラインでコミュニケーションし、自分自身を表現する方法は、ますます複雑になり、解読するのが困難になっています。 最初に絵文字が登場しました:-)。 次に絵文字が登場しました。 それからミーム…そして今では、Twitch ストリーミング プラットフォームで非常に人気のあるアイコンベースのコミュニケーションの新しい形式である「エモート」です。 通常のテキストと混合して使用する点で絵文字を彷彿とさせますが、ユーザーが生成し、その不可解な意味が実際に描かれている画像と明らかな関連性を持たないという点で、ミームと同様の課題を提示します。 現在までに 8 万以上の異なるエモートがあり、毎週 400 万以上が使用されています。 それでも人々は、喜び、退屈、興奮、皮肉など、あらゆる種類の感情を表現するためにそれらを使用して効果的にコミュニケーションしています。 私たちの最近の論文は、感情表現の意味を推測するための AI クックブックです。 私たちのアプローチは、手動で厳選されたデータセットを維持および更新する必要がなく、新しい感情表現の継続的な導入だけでなく、人気のある感情表現の意味の進化にも自己適応することができます。 これは、エモートに政治的または人種的な要素が含まれている場合に特に重要です。これは、「TriHard」、「PogChamp」、「FeelsGoodMan」などの非常に人気のあるエモートで発生していることが確認されています。 言語の動的な使用と意味の変化は、モデレーション システムや感情分析フレームワークに大きな問題を引き起こすため、Spiketrap ではこの問題に正しい方法で取り組めることを誇りに思っています。

Spiketrap について他に共有したいことはありますか?

新年に向けて、スパイクトラップは、顧客のブランド感情をより深く理解できる新しいツールの開発と完成に取り組んでいます。 Spiketrap の新しい Affinity Tool は、クリエイター、ブランド、ゲームなどにわたる視聴者の親和性を特定し、定量化するためのインタラクティブで直感的な方法を提供します。 このツールは、特定のクエリに対して、特定のエンティティが別のエンティティとどの程度正の相関関係にあるかを示すアフィニティ インデックス スコアを生成します。 関連する言及の頻度やセンチメントなど、多数の文脈上のシグナルがスコアを構成します。 Spiketrap の技術スタックは、ゲーム、ブランド、クリエイター間の親和性をインデックスする独自の位置にあります。 独自の NLP AI である Clair は、毎日何百万もの公開投稿されたユーザー生成メッセージを処理し、曖昧なコンテンツを Spiketrap の広範なナレッジ グラフ内のエンティティに帰属させ、会話のトピックを特定し、センチメントを判断し、安全性を監視します。 新しいアフィニティ ツールの追加により、開発者、クリエイター、ブランドなどが視聴者やブランドへの影響をさらに理解できるようになります。

素晴らしいインタビューをありがとうございました。さらに詳しく知りたい読者は、こちらをご覧ください。 スパイクトラップ.

Unite.AI の創設パートナーであり、 フォーブステクノロジー評議会、 アントワーヌさんは、 未来派 AI とロボット工学の未来に情熱を持っている人。

彼はの創設者でもあります 証券.io、破壊的テクノロジーへの投資に焦点を当てたウェブサイト。