Connect with us

ソートリーダー

あなたのAIのパーソナリティは、知能と同じくらい重要であり、企業での導入に成功または失敗をもたらす

mm
A woman and a man standing on a high-rise balcony looking at a glowing data visualization that blends sharp blue geometric lines with soft amber waves, symbolizing the balance between AI benchmarks and personality.

まだ多くの企業は、AIモデルをベンチマークに基づいて選択しています。実際には、システムが実際に機能するかどうかを決定するのは、まれにベンチマークだけです。

これまで、企業環境における大規模言語モデルに関する会話は、ベンチマークによって支配されてきました。チームは、測定可能なパフォーマンス、たとえばどのモデルが最も賢いのか、コーディングで最も強いのか、要約で最も正確なのか、または数学的推論で優れているのか、に惹かれます。

しかし、チームが実験段階を超えて、大規模な展開に着手するにつれ、多くのCEOによって大幅に見過ごされている他の重要な要因が、企業の成功にとって同様に重要であることがすぐに明らかになるでしょう。

AIの採用可能性

生の知能と分析能力は明らかに重要ですが、企業のAI導入における最も過小評価された変数はパーソナリティです。パーソナリティとは、大規模言語モデルの文脈において、モデルが相互作用を通じて一貫して表現する声、トーン、動作を指します。それは、AIが一貫性と信頼性を持つようにするものです。

AIを実装する際、企業は、人間の従業員を採用するのと同じアプローチを採用する必要があります。モデルがタスクを完了する能力だけではなく、その仕事に対する態度、コミュニケーション方法、そしてより広いワークフローへの適合性も評価する必要があります。

モデルの一貫性を維持する能力、適切に応答する能力、さまざまなコンテキストでのニュアンスを処理する能力は、ビジネス成果に重大な影響を与える可能性があります。技術的に優れたAIが遅く応答したり、トーンが変化したり、ニュアンスのある相互作用を不適切に処理したりすると、ビジネスによって誤って適用され、ユーザーがフラストレーションを感じ、エンゲージメントが減り、最終的にAIとビジネスの成功が低下する可能性があります。

これは、特にカスタマーサポート、政治的アウトリーチ、または内部コミュニケーションのような業界では重要です。応答間のトーンやフレーズの微妙な変化は、混乱を招き、信頼を損ない、全体的なエンゲージメントを低下させる可能性があります。人間と同様に、すべてのカテゴリで競争を上回す単一の理想モデルは存在しません。一部のモデルは、コーディングや数学などの分析タスクを実行するのに適していますが、他のモデルは会話的な文章作成や会議のまとめに大幅に優れています。

しかし、チームがこれらのシステムを構築する上で直面する課題は、これらの特性が固定されていないことです。

動的な目標

AIの景観は、多くの組織が追随できるよりも速く進化しています。新しいバージョンが頻繁にリリースされ、パフォーマンスの特性は1つの更新から次の更新へと変化する可能性があります。GoogleのGeminiモデルシリーズは、最近の例です。

Gemini 2.0 Proは、2025年2月にリリースされ、すぐに開発者と企業向けのフラグシップモデルとして注目されました。これは、世界中でコーディングや複雑なプロンプトに使用されていました。

当時、Googleが提供した最大のコンテキストウィンドウ(200万トークン)を備えていたため、同時に大量の情報を包括的に分析および理解し、Google検索などのツールを利用したり、コードを書いたりすることができました。

大量のデータを迅速かつ正確に処理する必要があるシステムを構築するチームにとって、これは明らかに最も適切な選択肢のようです。しかし、わずか数週間で、GoogleはGemini 2.5 Proをリリースし、直ちにリーダーボードを超え、前身を上回った。コーディング、数学、科学の分野で改善されました。

一晩で、市場で最も優れた選択肢であったモデルは、リリースからわずか2ヶ月ですでに旧式になりました。しかし、早期の採用者はすぐに、変更が漸進的または分析的だけではないことを認識しました。Geminiの全パーソナリティが一晩で変更されました。複数の開発者は、AIが「ロボトミー」されたように動作しているとまで言いました。

彼らは、AIが「実際に『賢く』」なっていると主張しました。以前は問題のないプロンプトやタスクに対して、遅い応答、不連続な出力、不一致を生み出し、流暢だったタスクが硬直化しました。

そして、これは企業のAI導入戦略が根本的に変化し始める地点です。

ベンチマークを超えて

紙上では、Gemini 2.5 Proは、能力と安全性の向上により、明らかに勝者となるはずでした。

しかし、実際には、これらの変更は、モデルがどのように信頼性があり、どのように動作し、どのように応答し、そしてどのようにタスクを処理するかを完全に変えました。システムを構築したチームは、モデルの新しい機能が既存のパイプラインと一致しない場合、莫大な時間と金額を費やしてシステムを構築したにもかかわらず、最初からやり直すことになりました。

わずかな動作の変化でも、一貫性と予測可能性に基づいて構築されたシステムを混乱させる可能性があります。これにより、ビジネスが単一のモデルに密接に結びついている場合、更新によって直ちにシステムの不安定性が生じる可能性があります。

これに対処するために、多くの先進的な企業は、多モデル戦略を実装し始めています。これは、すべてのタスクを1つのモデルに頼るのではなく、各タスクに最も適したモデルにルーティングするものです。

このアプローチは、各タスクに合わせたパフォーマンスを向上させるだけでなく、AIの実装に関連するリスクも軽減します。なぜなら、1つのモデルが更新後に低下したとしても、バックアップがあるため、システム全体が低下することはないからです。

簡単に言えば、AIのパーソナリティと信頼性は、作業環境でさまざまなタスクを実行する場合、生の知能と同じくらい重要です。この思考の転換は、企業が単に「賢いツール」を購入するのではなく、全体的なデジタルインフラストラクチャシステムを構築して管理する方法に根本的な変化を表しています。

企業が現代のビジネス環境で生き残るだけでなく、繁栄するには、タスクに応じてさまざまなモデルを入れ替えることができるパイプラインを確立し、更新がパフォーマンスとインタラクションの品質に与える影響を継続的に監視する必要があります。

最終的に、モデル自体は、企業が追随するのが難しいペースで進化し続けるでしょう。しかし、変化に備え、冗長性を構築し、AIをツールとチームメイトの両方として扱う企業は、これらの急速な変化を競争上の優位性に変えるでしょう。

アンドリュー・ミッシーは、Convos(旧称PubSent)の共同創設者であり、政治ストラテジスト、選挙運動、非営利団体、支援団体が、国民規模で、個別化された、事実に基づいた選挙人会話を提供するための、双方向のAIを搭載したテキストプラットフォームであり、そこでは彼が製品とエンジニアリングを指揮している。また、Convos以前には、アンドリューは、スターバックス、Crumbl、Mod Pizzaなどの国民的食料品および小売ブランドにサービスを提供するシアトルに拠点を置くベンチャー系AIスタートアップを含む複数の企業でソフトウェアエンジニアとして働いていた。また、アンドリューは、Javascript、Python、Typescriptに堪能である。