Connect with us

ソートリーダー

ミラ・ジョボビッチのMemPalaceがAIの記憶問題を解決することを目指す

mm
A woman standing in a luminous, neoclassical hallway, interacting with glowing holographic data structures representing a

毎日、数百万の人々がチャットウィンドウを開き、人工知能(AI)に自分自身を説明し始めます。AIは注意深く傾聴し、すぐに賢い答えを生成し、セッションが終了すると、インタラクションの詳細をすべて忘れてしまいます。

この儀式の規模は驚くべきものです。ChatGPTだけが1日あたり10億以上のクエリを処理しており、2025年後半の時点で、800万人以上の週間アクティブユーザーがいます。生成的なAIの採用は、世界人口の16%以上に達しており、この数は3年前には存在しませんでした。

このモデルをサポートする巨大なインフラストラクチャは、環境へのコストが増加しています。2024年の米国のデータセンターは183テラワット時もの電気を消費しており、米国の総電力使用量の4%以上、またはパキスタンの年間電力需要に相当します。

AIシステムの記憶力の欠如により、そのエネルギーの大部分がコンテキストを再確立するために費やされます。セッションの開始時に繰り返し説明する、プロジェクトを再導入する、コンテキストをダンプすることは、無駄な計算です。

記憶がツールをコラボレーターに変える

AIアシスタントには、デフォルトで永続的な記憶がありません。これは、AIを計算機のように使用する場合には問題ありません。数字を入力し、結果を取得し、進みます。

しかし、ほとんどの人はそれをそのように使用しません。彼らは、AIと長い、反復的な、深いコンテキストの会話をしています。数週間または数ヶ月にわたって、共有言語、決定、歴史を構築しています。AIが任意の時点で保持できるコンテキストの量は、サブスクリプションのレベルによって異なります。

今までのところ、AIは素晴らしいツールであることを証明していますが、初期の開発段階から、コンパニオンと見なされることを目指しています。その野心には記憶が必要です。そうでなければ、進歩は続いてリセットされます。

永続的な記憶は、AIが実践で何ができるかを変えます。開発者は、AIがアーキテクチャ上の決定とその理由を保持するものを取得します。チームは、プロジェクトの歴史を知っているAIを取得しますが、再びブリーフィングする必要はありません。作家は、時間の経過とともに自分の作品について蓄積された知識を持っているAIを取得します。モデルの能力は、実際にそれを使用する人の知識を蓄積できるかどうかよりも重要です。

なぜこれが解決するのが難しいのか

課題は、単にストレージではなく、回復です。理論的には、過去の会話をすべて新しいセッションにフィードできます。しかし、それはすぐに計算上の無意味になります。コンテキストウィンドウは拡大していますが、無限ではありません。数ヶ月にわたる構造化されていないチャットをプロンプトにダンプすることは、効果的ではなく、時間とエネルギーも消費されます。

データエンジニアのParas Pandeyは、核心的な困難を簡潔に述べています。 「AIの記憶は、実際にはストレージ問題として装った回復忠実度問題です。何かを保持することはできますが、推論時にそれを正確に回復するのが難しいです。データシステムで解決してきたものの、より難しいバージョンです。この分野はまだ初期段階にあります。」

現在のAIメモリアプローチには、システムが記憶する価値のあるものを決定することが含まれます。しかし、AIが何が重要かを決定することを許可すると、元の交換で価値のあったニュアンスのあるコンテキストが正確に捨て去られることがよくあります。一般的なアイデアは保持されますが、特定の懸念を説明し、検討して却下した代替案について説明した元の会話はすべて失われます。

理想的なシナリオは、正しい情報が正しいときに見つかることです。

MemPalaceの登場

これは、最近リリースされたオープンソースプロジェクトであるMemPalaceが目標とする正確に問題です。要約または破棄するのではなく、会話を完全に保存し、古代ギリシャの記憶宮殿のテクニックから借用した会話の周りにナビゲーション可能な構造を構築します。ここで、演説家は、後で思い出すために、アイデアを想像された建物の特定の部屋に精神的に配置していました。

MemPalaceが注目に値するのは、そのアプローチの優雅さだけではありません。それは結果です。AIメモリ回復の標準的な学術ベンチマークでは、MemPalaceは、無料のシステムとして公開された最高のスコアを記録しており、サブスクリプション、クラウド依存、外部APIは必要ありません。

競合する商用サービスは、同等の、そしてしばしば劣る機能に対して、月額20ドルから250ドルまで請求しています。

このような、最高レベルのパフォーマンス、完全にローカル、完全に無料の組み合わせは、注目に値するものです。さらに、MemPalaceはリモートサーバーではなく、自分のハードウェアで実行されるため、MemPalaceを介してルーティングされる各クエリは、データセンター業界の膨張するエネルギーレジャーに追加されません。

より大きな絵

MemPalaceは1つのプロジェクトですが、それはより大きなものを指しています。AIシステムにおける永続的な記憶は、プレミアムアドオンではなく、新しいAIのユースケースのための基本的な特性であることを認識しています。

このプロジェクトは、ミラ・ジョボビッチ(はい、レジデントイービルの女優)、ベン・シグマン、クロードの小さなチームによって構築され、7つのコミットしかありません。

商用製品の専用エンジニアリングチームを上回るシステムが、そんなにも手軽な努力から生まれたことは、どこに本当の困難があるかについて何かを語っています。

問題はコンピューターまたはリソースではありませんでした。それは、記憶が実際に何をしなければならないかについてのより明確なモデルでした。

Juan Pablo Aguirre Osorioは、Espacio Media Incubatorの寄稿記者です。フルスタックエンジニアリングの背景を持ち、Juan Pabloは、AIを含む最先端のテクノロジーに関するレポートに技術的な背景をもたらします。彼の作品は、HackerNoon、The Sociable、その他の媒体に紹介され、以前はMicrosoftのStudent Ambassadorでした。