プロンプトエンジニアリング
金融におけるジェネレーティブAI:FinGPT、BloombergGPT、その先

ジェネレーティブAIとは、入力データに似た新しいデータサンプルを生成できるモデルを指します。ChatGPTの成功により、企業は自社の大規模言語モデルを設計する機会が多くなりました。データ駆動の金融部門は、以前よりもデータ密度が高くなっています。
私はフランスに拠点を置く金融サービス会社でデータサイエンティストとして働いています。1年以上ここで働いており、最近、全ての部門でタスクの自動化とロバストでセキュアなAIシステムの構築のためにLLMの使用例が大幅に増加していることを観察しています。
すべての金融サービスは、LLAMA 2やFalconのようなオープンソースモデルを使用して、独自のファインチューンされたLLMを構築しようとしています。特に、数十年分の金融データを持つレガシーバンクがそうです。
これまで、限られたコンピューティングリソースと複雑でない低パラメーターモデルにより、これらの大量のデータを単一のモデルに組み込むことは実現できませんでした。ただし、これらのオープンソースモデルは数十億のパラメータを持つため、大量のテキストデータセットにファインチューンできます。データはこれらのモデルにとって燃料のようなものであり、データが多いほど結果が良くなります。
データとLLMモデルは、自動化、効率、精度の向上などにより、銀行や他の金融サービスに数百万ドルを節約できます。
最近のマッキンゼイの推定によると、ジェネレーティブAIは、銀行部門だけで年間340億ドルの節約をもたらす可能性があるとされています。
BloombergGPT&ジェネレーティブAIの経済学
2023年3月、ブルームバーグはBloombergGPTを発表しました。これは、50億パラメータを持つ金融データ用に特化した言語モデルです。
お金を節約するには、時々お金を費やす必要があります。BloombergGPTやMetaのLlama 2のようなモデルをトレーニングすることは安くはありません。
Llama 2の700億パラメーターモデルのトレーニングには170万GPU時間が必要でした。商用クラウドサービスでNvidia A100 GPU(Llama 2で使用)を使用すると、GPU時間ごとに1〜2ドルかかります。計算すると、100億パラメーターモデルは15万ドル、1000億パラメーターモデルは150万ドルかかる可能性があります。
レンタルではなくGPUを直接購入することもできます。ただし、1000個のA100 GPUをクラスタ化するには1000万ドル以上かかる可能性があります。
ブルームバーグが100万ドル以上を投資したことは、AIの急速な進歩と比較して特に注目に値します。驚くことに、100ドルで開発されたモデルは、BloombergGPTの性能を半年で上回りました。BloombergGPTのトレーニングデータの99.30%は公開されていました。そこで、FinGPTが登場しました。
FinGPT
FinGPTは、AI4Finance-Foundationによって開発された最先端の金融ファインチューン大規模言語モデル(FinLLM)です。FinGPTは現在、コスト効率と精度の点で他のモデルを上回っています。
現在、3つのバージョンがあります。FinGPT v3シリーズはLoRAメソッドを使用して改良されたモデルであり、ニュースやツイートを分析して感情を分析するためにトレーニングされています。これらは多くの金融感情テストで最高の成績を収めています。FinGPT v3.1はchatglm2-6Bモデルに基づいており、FinGPT v3.2はLlama2-7bモデルに基づいています。
FinGPTの運用:
- データソーシングとエンジニアリング:
- データ取得:FinGPTは、ヤフー、ロイターなど、信頼できる情報源から金融ニュースを収集し、米国株から中国株まで、幅広い金融ニュースを網羅しています。
- データ処理:生データは、クリーンアップ、トークナイズ、プロンプトエンジニアリングを経て、関連性と精度を確保されます。
- 大規模言語モデル(LLM):
- トレーニング:カリブレーションデータを使用して、LLMをファインチューンし、軽量モデルを特定のニーズに合わせて作成できます。また、既存のモデルやAPIをアプリケーションをサポートするために適応させることもできます。
- ファインチューニング戦略:
- テンソルレイヤー(LoRA):FinGPTを開発する上で重要な課題は、高品質のラベル付きデータを取得することです。この課題を認識して、FinGPTは革新的なアプローチを採用しています。伝統的なラベリングにのみ頼るのではなく、株価の変動をラベルとして使用して、ニュースの感情をポジティブ、ネガティブ、またはニュートラルなどの具体的なラベルに変換します。これにより、モデルの予測能力が大幅に向上し、特にポジティブおよびネガティブの感情を区別する能力が向上します。LoRAなどのファインチューニング技術を使用して、FinGPT v3はパフォーマンスを最適化しながら計算オーバーヘッドを削減しました。
- 人間のフィードバックからの強化学習:FinGPTは”RLHF(人間のフィードバックからの強化学習)“を使用しています。BloombergGPTにはない機能です。RLHFにより、LLMモデルは個人の好み、リスク許容度、投資パターン、またはカスタマイズされたロボアドバイザー設定などの差異を認識する能力を獲得します。この技術は、ChatGPTやGPT4の基盤であり、よりカスタマイズされたユーザーエクスペリエンスを保証します。
- アプリケーションとイノベーション:
- ロボアドバイザー:FinGPTはニュースの感情を分析し、市場の趨勢を予測することができます。
- クォンタムトレーディング:FinGPTは、ニュースやツイートなどの多様な情報源から感情を特定し、効果的なトレーディング戦略を立てることができます。実際、ツイートの感情のみに基づいても、約束のあるトレーディング結果を示しています。
FinGPTの現在と将来:2023年7月はFinGPTにとって重要なマイルストーンです。研究論文「Instruct-FinGPT:Instruction Tuning of General-Purpose Large Language Models for Financial Sentiment Analysis」が発表されました。この論文の中心は、FinGPTが複雑な金融感情分析を実行できるようにする、インストラクションチューニングというテクニックの探索です。
しかし、FinGPTは感情分析のみに限定されていません。実際、19の異なるアプリケーションがあり、それぞれがLLMを新しい方法で活用することを約束しています。プロンプトエンジニアリングから複雑な金融コンテキストの理解まで、FinGPTは金融分野で多才なジェネレーティブAIモデルとしての地位を確立しています。
世界の銀行がジェネレーティブAIを受け入れる方法
2023年の初めに、バンク・オブ・アメリカ、シティバンク、ゴールドマン・サックスなどの主要金融機関が従業員のOpenAIのChatGPT使用を制限した一方で、業界の他の企業はより受け入れの姿勢を見せています。
モルガン・スタンレーは、OpenAIパワードのチャットボットを金融アドバイザーのツールとして統合しました。これらのチャットボットは、会社の広範な内部研究とデータを活用して、豊富な知識源となり、金融アドバイスの効率と精度を高めます。
今年の3月、ヘッジファンドシタデルは、企業全体でChatGPTライセンスを交渉しようとしていました。予想される実装では、ソフトウェア開発や複雑な情報分析などの分野を強化することを目指しています。
JPモルガン・チェースも、大規模言語モデルを使用して不正検出に取り組んでいます。メソッドは、メールパターンを使用して潜在的な脆弱性を特定することです。この銀行は、さらに、年末までにAIを使用して15億ドルの価値を創出するという野心的な目標を設定しています。
ゴールドマン・サックスも、AIの魅力に完全に抵抗していません。同社は、ソフトウェアエンジニアリング分野を強化するためにジェネレーティブAIの力を探究しています。ゴールドマン・サックスのCIOであるマルコ・アーゲンティは、この統合により、ワークフォースが「超人」になる可能性があると述べています。
銀行・金融業界におけるジェネレーティブAIの使用例
ジェネレーティブAIは、金融業務、意思決定、顧客とのやり取りを根本的に変革しています。以下はその応用の詳細な探究です。
1. 不正防止:ジェネレーティブAIは、最先端の不正検出メカニズムを開発する最前線にあります。大量のデータを分析することで、複雑なパターンや不規則性を検出できます。従来のシステムは、データの量によって過負荷になることが多く、誤検知を生み出すことがあります。ジェネレーティブAIは、精度を高めながら誤検知を減らすことで、より安全な金融取引を実現します。
2. 信用リスク評価:従来の信用度評価方法は、信頼性はあるものの、時代遅れになりつつあります。ジェネレーティブAIモデルは、信用履歴から微妙な行動パターンまで、さまざまなパラメータを使用して、包括的なリスクプロファイルを提供します。これにより、従来のメトリックによって不十分に評価されていた顧客にもサービスを提供できます。
3. 顧客とのやり取りの強化:金融業界は、ジェネレーティブAI駆動のNLPモデルによって、顧客サービス革命を経験しています。これらのモデルは、さまざまな顧客の質問に理解し、迅速にパーソナライズされたソリューションを提供することができます。ルーチンワークを自動化することで、金融機関はオーバーヘッドを削減し、業務を合理化し、顧客満足度を高めることができます。
4. パーソナライズされた金融:ワンサイズフィットオールは過去のものです。今日の顧客は、独自のニーズと目標に合わせた金融計画を求めています。ジェネレーティブAIは、支出パターンから投資好みまで、データを分析して個別の金融計画を立てることができます。
5. アルゴリズムトレーディング:ジェネレーティブAIの分析能力は、アルゴリズムトレーディングの世界で大きな価値を示しています。市場の趨勢やニュースの感情を分析することで、金融の専門家は戦略を最適化し、市場の変化を予測し、潜在的なリスクを軽減することができます。
6. コンプライアンスフレームワークの強化:反_money_洗い(AML)規制は、金融システムの完全性を維持する上で重要です。ジェネレーティブAIは、取引データを分析して不正な活動を特定することで、コンプライアンスを容易にします。これにより、金融機関は世界規模の基準を遵守し、誤検知の可能性を大幅に減らすことができます。
7. サイバーセキュリティ:サイバー脅威は不断に進化しています。金融業界は、ダイナミックな予測モデルを実装することで、脅威を迅速に検出して金融インフラを強化する必要があります。
しかし、ジェネレーティブAIも、金融業界で特有の課題をもたらします。
課題
- バイアスの増幅:AIモデルは、人間が生成したトレーニングデータに依存しています。このデータには、意図的または無意識的なバイアスが含まれており、歪んだ結果になる可能性があります。金融業界では、公平性が重要な分野で、バイアスは深刻な結果をもたらす可能性があります。金融のリーダーは、データセットが包括的で代表的なものであることを確認し、バイアスを特定する必要があります。
- 出力の信頼性と意思決定:ジェネレーティブAIは、間違ったり誤解を招く結果を生み出すことがあります。これは、”hallucinations“と呼ばれます。AIモデルが精度を高め、学習する際には、これらのミスはある程度予想されますが、金融では精度が不可欠です。重要な決定、たとえばローンの承認については、AIのみに頼ることは危険です。AIは、計算の重荷を担い、人間の専門家が最終的な情報に基づいた決定を下すための洞察を提供するツールとして見るべきです。
- データプライバシーとコンプライアンス:ジェネレーティブAIアプリケーションにおける機密性の高い顧客データの保護は、重大な懸念事項です。システムが、GDPRやCCPAなどの世界規模の基準を遵守することを確認することが重要です。AIは、これらの境界を認識したり尊重したりすることはありません。したがって、その使用は、特に金融業界で機密性が重要であるため、厳格なデータ保護ガイドラインで制限される必要があります。
- 入力データの品質:ジェネレーティブAIは、入力されたデータの品質に依存しています。不正確または不完全なデータは、金融アドバイスや決定に悪影響を及ぼす可能性があります。
結論
トレーディング戦略の強化からセキュリティの強化まで、ジェネレーティブAIの応用は幅広く変革的です。ただし、どの技術でも、採用に際しては、倫理的およびプライバシー上の影響を慎重に考慮する必要があります。
ジェネレーティブAIの能力を活用しながら、その限界と潜在的な落とし穴を尊重することに成功した機関は、世界の金融アリーナの将来の軌道を決して形作るでしょう。















