人工知能

最新の生成 AI アプリケーションにおけるベクトルデータベースの役割

更新中 on 2023 年 10 月 11 日

大規模な Generative AI アプリケーションが効果的に動作するには、大量のデータを処理する優れたシステムが必要です。そのような重要なシステムの XNUMX つがベクトルデータベースです。このデータベースの特徴は、テキスト、音声、画像、ビデオなどのさまざまなタイプのデータを数値/ベクトル形式で処理できることです。

ベクトルデータベースとは何ですか?

ベクトルデータベースは、高次元ベクトルを効率的に処理できるように設計された特殊なストレージシステムです。これらのベクトルは、多次元空間内の点と考えることができ、多くの場合、画像、テキスト、音声などのより複雑なデータの埋め込みまたは圧縮表現を表します。

ベクトルデータベースを使用すると、これらのベクトル間の類似性検索を迅速に行うことができ、膨大なデータセットから最も類似した項目を迅速に検索できます。

従来のデータベースとベクターデータベースの比較

ベクトルデータベース:

高次元データを扱う: ベクトルデータベースは、データを高次元空間で管理および保存するように設計されています。これは、データポイント (画像やテキストなど) を多次元空間内のベクトルとして表現できる機械学習などのアプリケーションに特に役立ちます。
類似性検索用に最適化: ベクトルデータベースの際立った機能の XNUMX つは、類似性検索を実行できることです。これらのデータベースを使用すると、完全一致に基づいてデータをクエリする代わりに、ユーザーは特定のクエリに「類似した」データを取得できるため、画像やテキストの検索などのタスクに非常に役立ちます。
大規模なデータセットに拡張可能: AI および機械学習アプリケーションが成長し続けるにつれて、処理されるデータの量も増加します。ベクターデータベースはスケールに合わせて構築されており、パフォーマンスを犠牲にすることなく大量のデータを処理できるようになります。

従来のデータベース:

構造化データストレージ: リレーショナルデータベースなどの従来のデータベースは、構造化データを保存するように設計されています。これは、データが事前定義されたテーブル、行、列に編成され、データの整合性と一貫性が確保されることを意味します。
CRUD操作用に最適化: 従来のデータベースは主に CRUD 操作用に最適化されています。つまり、データエントリを効率的に作成、読み取り、更新、削除できるように設計されており、Web サービスからエンタープライズソフトウェアまで幅広いアプリケーションに適しています。
固定スキーマ: 多くの従来のデータベースの特徴の XNUMX つは、固定スキーマです。データベース構造を定義した後の変更は複雑で時間がかかる場合があります。この堅牢性によりデータの一貫性が保証されますが、一部の最新のデータベースのスキーマレスまたは動的スキーマの性質に比べて柔軟性が劣る場合があります。

従来のデータベースは埋め込みの複雑さに悩まされることがよくありますが、ベクトルデータベースではこの課題に簡単に対処できます。

ベクトル表現

ベクトルデータベースの機能の中心となるのは、数値ベクトルを使用してさまざまな形式のデータを表現するという基本概念です。例として画像を見てみましょう。猫の写真を見ると、私たちにとっては単なる愛らしい猫の画像かもしれませんが、機械にとっては次のような独自の 512 次元ベクトルに変換できます。

[0.23、0.54、0.32、…、0.12、0.45、0.90]

ベクトルデータベースを使用すると、Generative AI アプリケーションでより多くのことができるようになります。意味に基づいて情報を見つけ出し、物事を長期間記憶することができます。興味深いことに、この方法は画像だけに限定されません。文脈上の意味と意味論的な意味が詰め込まれたテキストデータは、ベクター形式に入れることもできます。

生成 AI とベクトルデータベースの必要性

生成 AI には埋め込みが含まれることがよくあります。たとえば、自然言語処理 (NLP) における単語埋め込みを考えてみましょう。単語や文章は、意味論的な意味を捉えるベクトルに変換されます。人間のようなテキストを生成する場合、モデルは関連するエンベディングを迅速に比較して取得し、生成されたテキストが文脈上の意味を確実に維持する必要があります。

ベクトルエンベディングとデータベース

同様に、画像やサウンドの生成において、エンベディングはパターンや特徴をエンコードする上で重要な役割を果たします。これらのモデルが最適に機能するには、類似したベクトルを瞬時に検索できるデータベースが必要であり、ベクトルデータベースは生成 AI パズルの重要なコンポーネントとなっています。

自然言語のエンベディングを作成するには、通常、次のような事前トレーニングされたモデルを使用する必要があります。

GPT-3 および GPT-4: OpenAI の GPT-3 (Generative Pre-trained Transformer 3) は、175 億のパラメーターを備えた NLP コミュニティの記念碑的なモデルです。それに続き、さらに多くのパラメーターを備えた GPT-4 は、高品質の埋め込み生成の限界を押し広げ続けています。これらのモデルは多様なデータセットでトレーニングされており、さまざまな言語のニュアンスを捉えるエンベディングを作成できます。
BERT とそのバリアント: ベルト Google の (Bidirectional Encoder Representations from Transformers) は、RoBERTa や DistillBERT など、さまざまな更新と反復が行われたもう XNUMX つの重要なモデルです。 BERT の双方向トレーニングはテキストを両方向に読み取り、単語の周囲のコンテキストを理解することに特に優れています。
エレクトロニクス: 効率的で、GPT-3 や BERT などのはるかに大規模なモデルと同等のパフォーマンスを発揮しながら、必要なコンピューティングリソースが少ない、より新しいモデル。エレクトロニクス事前トレーニング中に本物のデータと偽のデータを区別し、より洗練された埋め込みを生成するのに役立ちます。

ソース

上記のプロセスを理解すると、次のようになります。

最初に、埋め込みモデルを使用して、目的のコンテンツをベクトル埋め込みに変換します。これらの埋め込みは生成されると、ベクトルデータベース内に保存されます。追跡可能性と関連性を容易にするために、これらの保存された埋め込みは、派生元の元のコンテンツへのリンクまたは参照を維持します。

その後、ユーザーまたはシステムがアプリケーションに質問をすると、同じ埋め込みモデルが動作を開始します。このクエリは、対応する埋め込みに変換されます。これらの新しく形成された埋め込みは、ベクトルデータベースを検索して、類似したベクトル表現を探します。一致として識別された埋め込みは元のコンテンツと直接関連付けられており、ユーザーのクエリに関連性のある正確な結果が得られることが保証されます。

Vector Database の新規参入者への資金提供の拡大

AI の人気の高まりに伴い、多くの企業がアルゴリズムをより良く、より高速にするためにベクトルデータベースにさらに多くの資金を投入しています。これは、次のようなベクターデータベースのスタートアップへの最近の投資からもわかります。松毬, クロマDB, ウィビエイト.

ベクトルデータベースの風景

Microsoft のような大規模な協力会社も独自のツールを持っています。例えば、 Azure コグニティブ検索企業はベクトルデータベースを使用して AI ツールを作成できます。

オラクルも最近、その新機能を発表しました。データベース 23c、統合ベクトルデータベースを導入します。「AI Vector Search」と名付けられたこのサービスには、ベクトルを使用して文書や画像などのデータを保存および検索するための新しいデータ型、インデックス、検索ツールが搭載されています。サポートします検索拡張生成 (RAG)、大規模な言語モデルとビジネスデータを組み合わせて、プライベートデータを共有せずに言語に関する質問に対するより適切な回答を提供します。

ベクターデータベースの主な考慮事項

距離メトリック

類似性検索の有効性は、選択した距離メトリックによって異なります。一般的な指標には次のものがあります。 ユークリッド距離 & コサイン類似性、それぞれが異なるタイプのベクトル分布に対応します。

インデキシング

ベクトルの高次元性を考慮すると、従来のインデックス作成方法では対応できません。ベクターデータベースでは次のような手法が使用されます。階層型ナビゲート可能なスモールワールド (HNSW) グラフまたは木を困らせる、ベクトル空間の効率的な分割と迅速な最近傍検索が可能になります。

迷惑木 (ソース)

Annoy は二分探索木と呼ばれるものを使用する手法です。データ空間を何度も分割し、その一部だけを調べて近くのデータを見つけます。

階層型ナビゲート可能スモールワールド (HNSW) グラフ (ソース)

一方、HNSW グラフはネットワークに似ています。検索を高速化するために特別な方法でデータポイントを接続します。これらのグラフは、データ内の近い点をすばやく見つけるのに役立ちます。

スケーラビリティ

データセットが増大するにつれて、高速な取得時間を維持するという課題も増大します。分散システム、GPU アクセラレーション、最適化されたメモリ管理は、ベクトルデータベースがスケーラビリティに取り組む方法の一部です。

ベクターデータベースの役割: 意味と機会

1. 最先端の学習データ生成 AI モデル: DALL-E や GPT-3 などの生成 AI モデルは、膨大な量のデータを使用してトレーニングされます。このデータは多くの場合、画像、テキスト、コード、その他のドメインを含む無数のソースから抽出されたベクトルで構成されます。ベクトルデータベースはこれらのデータセットを細心の注意を払って厳選および管理し、AI モデルがこれらのベクトル内のパターンと関係を特定することによって世界の知識を同化および分析できるようにします。

2. フューショット学習の推進: フューショット学習は、限られたデータを使用してモデルをトレーニングする AI トレーニング手法です。ベクトルデータベースは、堅牢なベクトルインデックスを維持することでこのアプローチを強化します。モデルが少数のベクトル (たとえば、数枚の鳥の画像) にさらされると、これらのベクトル間の類似点と関係を認識することで、鳥のより広範な概念を迅速に推定できます。

3. レコメンダーシステムの強化: レコメンダーシステムはベクトルデータベースを使用して、ユーザーの好みに密接に一致したコンテンツを提案します。ユーザーの行動、プロフィール、クエリを分析することにより、ユーザーの興味を示すベクトルが抽出されます。次に、システムはベクトルデータベースをスキャンして、これらの関心ベクトルによく似たコンテンツベクトルを見つけ、正確な推奨を保証します。

4. セマンティック情報検索: 従来の検索方法は、キーワードの完全一致に依存しています。ただし、ベクトルデータベースにより、システムは意味上の類似性に基づいてコンテンツを理解し、取得できるようになります。これは、単に単語を一致させるだけでなく、クエリの根底にある意味に焦点を当て、検索がより直感的になることを意味します。たとえば、ユーザーがクエリを入力すると、対応するベクトルがデータベース内のベクトルと比較され、語句だけでなくクエリの意図と共鳴するコンテンツが検索されます。

5. マルチモーダル検索: マルチモーダル検索は、テキスト、画像、音声、ビデオなどの複数のソースからのデータを統合する新しい技術です。ベクターデータベースは、さまざまなモダリティからのベクターの組み合わせ分析を可能にすることで、このアプローチのバックボーンとして機能します。これにより、ユーザーが単一のクエリに基づいてさまざまなソースから情報を取得できる総合的な検索エクスペリエンスが実現し、より豊富な洞察とより包括的な結果が得られます。

まとめ

AI の世界は急速に変化しています。それは多くの業界に影響を及ぼし、良いことと新たな問題をもたらしています。 Generative AI の急速な進歩は、多次元データの管理と分析におけるベクトルデータベースの重要な役割を浮き彫りにしています。

これらの特殊なストレージシステムは、画像、テキスト、音声などのさまざまなデータ形式からの高次元ベクトルの処理に熟達しており、特に類似性検索の領域において、現代の AI アプリケーションが効果的に機能するための要として立っています。

その重要性の増大は、Pinecone のような新興企業や Microsoft のような大手企業が進歩に積極的に貢献するなど、この分野に流入する投資によってさらに強調されています。

関連トピック：生成AI GPT NLP ベクトルデータベース

次に

感覚 AI の公開: 汎用人工知能 (AGI) を実現するための道筋

お見逃しなく

MetaGPT: 現在利用可能な最高の AI エージェントの完全ガイド

アーユシュ・ミタル

私は過去 50 年間、機械学習と深層学習の魅力的な世界に没頭してきました。私の情熱と専門知識により、特に AI/ML に重点を置いた XNUMX を超える多様なソフトウェアエンジニアリングプロジェクトに貢献してきました。私の継続的な好奇心は、私がさらに探求したいと思っている分野である自然言語処理にも引き寄せられました。