インタビュー
サラ・ナギー、Seek AIの創設者&CEO – インタビュー・シリーズ

サラ・ナギーは、Seek AIの創設者兼CEOです。Seek AIは、ビジネスエンドユーザーが、データチームに現在問いかけているのと同じ質問を、Slack、Teams、メールでSeekに直接問いかけることができるプラットフォームです。質問の書き方を「調整」する必要はなく、新しいプラットフォームの学習も必要ありません。
あなたはもともと、ハッブル宇宙望遠鏡のデータを用いた研究者でした。何を研究していたのですか?
私はUCLAとCaltechで研究を行っており、望遠鏡で観測できる最も遠い銀河を調査し、それらの特性(例えば、質量やサイズ)を分析していました。この研究の目的は、非常に遠い銀河と私たちの近くにある銀河の違いを理解し、銀河が時間の経過とともにどのように形成されるのかをモデル化することでした。
その後、さまざまなスタートアップでデータサイエンティストとして働きました。どのようなプロジェクトが特に面白かったですか?
1つのプロジェクトが特に印象に残っています。自然言語処理(NLP)を使用して、商品に関する構造化されていないテキストを分類するプロジェクトでした。例えば、生のテキスト(例:「air jordans green」)を受け取り、推定ブランド(「Nike」)をラベル付けするというものでした。NLPを専門とする同僚が別のプロジェクトで忙しかったため、もともと私はこのプロジェクトを担当する予定ではありませんでした。しかし、彼らが忙しかったため、結局私がこのプロジェクトを担当することになりました。当時私はNLPについて何も知らなかったので、スタンフォード大学とFast.aiの無料コースを利用して知識を身に付けました。NLPについて学ぶことをとても楽しんだし、NLPがなぜ重要であるか、そして人工知能(AI)が言語を理解することが「汎用AI」への大きなステップである理由を理解するようになりました。この経験は、GPT-3が最初にリリースされたときにその重要性をすぐに理解することができました。
Seek AIの創設の背景を共有してください。
OpenAIのGPT-3モデルがリリースされたとき、私はすぐにその驚くべき進歩を認識し、特にGPT-3がコードを書くアプリケーションに興奮しました。データサイエンティストとして、1日中コードを書いていたので、AIがこれを行い、完璧にコードを生成するのを見て、驚かされることになりました。私のGPT-3への反応は、2013年にVRを初めて学んだときと同じで、それも私にとって驚かされる経験でした。私は、このテクノロジーに賭けるためにスタートアップを設立する必要があると決めました。まだ何を作るかはわかりませんでしたが、モデルについてもっと学んだら、価値のあるものが見つかるだろうと直感で感じていました。
モデルについて本当に学んだら、私がデータサイエンティストまたはクォントとして働いていたすべての場所で遭遇した痛み点を解決できることがわかりました。その痛み点とは、ビジネスマンが自分のデータに関する質問に答えるための適切なツールを持っていないことでした。データサイエンティストとして、私は頻繁に集中力を必要とする問題に取り組んでいましたが、ビジネスサイドの同僚からデータに関する質問で頻繁に邪魔され、作業を中断する必要がありました。このプロセスは時代遅れで非効率的であると感じました。新しいテクノロジーがこの問題を解決することに焦点を当てれば、非常に重要で普遍的な問題に対するカテゴリ定義的な解決策になると実感しました。
Seek AIは生成AIを使用しています。読者にこれが何であるかを説明してください。
「生成AI」は、非常に注目されている用語ですが、他の流行語とは異なり、この流行語の注目度は不当ではないと思います。この用語は、DALL-EやGPT-3のような数百億のパラメータを持つ大規模な機械学習モデルを指します。これらのモデルの革新は、自然言語を理解し、テキスト、画像、コードなどを生成できることです。DALL-EやStable Diffusionを少し遊んでみると、これらのモデルがなぜ注目されているのかすぐに理解できます。なぜなら、彼らは自然言語コマンドを人間のように理解し、人間の最高のアーティストに匹敵するアートを生成できるからです。
コード生成は、生成AIの最もニッチですが最も重要なアプリケーションの1つです。データはより大きく複雑になっており、人間が手動で分析および組織化することが難しくなっています。ただし、このデータには多くの情報が符号化されています。この情報は、組織にとって強力なものであるだけでなく、学術的な側面でも驚くべき科学的ブレークスルーにつながる可能性があります。データから価値を抽出するAIを構築することは、有用な情報の形で驚くべき価値を解放することになります。
Seek AIは、ユーザーが自然言語でデータと対話できるインターフェイスを構築しています。ナレッジワーカーは、メール、Slack、テキスト、そしてさまざまな顧客関係管理(CRM)システムを介して、Seek AIの自然言語インターフェイスにアクセスできます。
Seek AIでは、生成AI以外にどのような機械学習が使用されていますか?
生成AIは私たちの機械学習アーキテクチャの一部ですが、私たちのアーキテクチャにはオープンソースのディープラーニングモデルのフォークも含まれています。(「生成AI」はその1つのバリアントである)トランスフォーマーモデルは、Seekが使用するモデルの多くを構成していますが、すべてではありません。
非技術的なユーザーがデータに迅速にアクセスできるようにすることはなぜ重要ですか?
データがROIを生み出さないのであれば、どのような意味がありますか?また、ビジネス向けユーザーがアクセスできないのであれば、企業がROIを生み出す方法は何ですか?これが、できるだけ多くの人にアクセスを提供することが絶対に必要な理由です。
データサイエンティストとして、私はCEOからデータを分析して会社の製品や市場戦略に役立てるように依頼されることがありました。これらのプロジェクトは数週間または数週間以上かかることがありました。現在CEOとして、私はこれらのプロジェクトの重要性をデータサイエンティストとして働いていたときよりも深く理解しています。私は、データを指先で簡単に取得できることで、より迅速に決定を下せることを願っています。これは、Seekが解決しようとしていることの例です。
Seek AIはどのようにしてデータを簡単に取得できるようにしていますか?
考えるべき興味深いことの1つは、データを分析するにはコードが必要であるということです。コードの上にある抽象化(例:データダッシュボード)があるプラットフォームもありますが、基本的には、データをビジネスエンドユーザーに提示するために、データアナリストによって手動で書かれたコードがあります。
ほとんどのナレッジワーカーは、コードを書くことができない、コードを書きたくない、またはコードを書くことができてもデータにアクセスすることができないため、データが必要なときは、ダッシュボードでそれを見つけるか、データチームに問い合わせる必要があります。データセットが大きくなるほど、これが起こりやすくなります。
したがって、データチームは、データチームに自然言語で質問する必要があるビジネスエンドユーザーと、コードを使用して問い合わせるデータとの「通訳者」となります。Seekが行っているのは、この「通訳者」の中間者を取り除くことです。
企業は、使用するデータが正確であることを保証するにはどうしていますか?
データの精度とアクセシビリティのトレードオフを管理することは、巨大な課題です。最近のインタビューで述べたように、1つの側面では、アクセシビリティにより、技術的なスキルが低い人でも会社のデータの知識の源泉と対話し始めることができます。另一方では、汚染された水(悪いデータ)の源泉は何の意味がありますか?
最高のデータチームは、このトレードオフを最も適切な方法で管理し、非技術的なユーザーが対話できるツールを慎重に調整および検証することが重要な要素です。
Seek AIプラットフォームの使用例をいくつか示してください。
B2B SaaS、FinTech、消費者財、B2C電子商取引の垂直市場で、既に顧客とデザインパートナーに価値を提供しています。
Battlefinは、代替金融データセットの先駆的なマーケットプレイスです。彼らは、顧客の質問に迅速に、高品質の回答を提供することが競合他社に対して勝つか負けるかという違いであると考えています。同社のCEOであるティム・ハリントンは、「Seek AIは、2023年の戦略において重要な役割を果たし、顧客の質問に応えて2,400以上のデータセットにアクセスおよび分析するためのエッジを提供しました。Seek AIなしでは同じレベルの効率性を達成するために費やすはずだった金額に基づいて、私の見積もりでは、Seek AIのROIは約10倍になります」と述べています。
Seek AIについてさらに共有したいことはありますか?
これは、恥ずかしいですが、Seek AIのプラットフォームの無料トライアルを現在提供していることを宣伝する良い機会かもしれません。無料トライアルは、seek.aiでアクセスできます。私たちは、データチームに生成AIをもたらすパイオニアになり、顧客と一緒にこの旅を進めることを楽しみにしています。
素晴らしいインタビュー、詳しく知りたい読者は、Seek AIを訪問してください。












