Connect with us

人工知能

Gemma を公開: Google のオープンソースによるジェネレーティブ AI への飛躍

mm

Google は最近、Gemma を導入しました。これは、Google の高度な AI 技術である Gemini と技術的基盤を共有するオープンソースの言語モデルです。ラテン語の「宝石」を意味する名前が付けられた Gemma は、その前身である Gemini 1.5 と比べて、よりアクセスしやすい対象となることを目的として設計されていますが、同時に高いパフォーマンスと責任ある使用のバランスを維持しています。このオープンソースのジェネレーティブ AI への取り組みは、Google が AI 技術を民主化するというコミットメントを強調しており、より広範な適用とイノベーションを可能にします。この記事では、Gemma の独自の特徴と、市場をリードする 2 つのオープンソース AI モデルである Meta の Llama 2Mistral の Mistral 7B との違いについて説明します。

Gemma: 言語モデルの新たな飛躍

Gemma は、2 億と 7 億のパラメータ構成を備えた軽量なオープンソース言語モデルのファミリーです。これは、幅広い計算ニーズに対応するように設計されています。GPU、TPU、CPU、およびデバイス アプリケーションを含むさまざまなプラットフォームで展開できます。Gemma のアーキテクチャは、特に トランスフォーマー アーキテクチャなどの高度なニューラル ネットワーク技術を利用しています。
Gemma が際立つのは、テキストベースのタスクにおけるその卓越したパフォーマンスです。11 個の学術的ベンチマークで競合他社を上回っています。言語理解、推論、質問回答、共通感覚推論、および数学、科学、コーディングなどの専門ドメインで優れています。このパフォーマンスは、言語モデルの進化における Gemma の重要な貢献を強調しています。

主な特徴

Gemma には、さまざまな AI 開発フレームワークとプロジェクトへのアクセスと統合を容易にするために設計された一連の機能が導入されています:

  • クロス フレームワークの互換性: Gemma では、JAXPyTorch、および TensorFlow へのネイティブ Keras 3.0 を介した主要な開発フレームワークとの推論と教師ありファインチューニングのツールチェーンを提供しています。これにより、開発者は新しい環境に適応する際の障壁を克服せずに、好みのツールを利用できます。
  • すぐに使用できるリソースへのアクセス: Gemma には、ColabKaggle ノートブック がすぐに使用できるようになっています。また、Hugging FaceNVIDIA NeMo などの人気プラットフォームとの統合も提供されます。これらのリソースは、新規および経験豊富な開発者にとって、Gemma を使用し始めるプロセスを簡素化することを目的としています。
  • 柔軟性と最適化された展開: Gemma は、パーソナル デバイスからクラウド サービスおよび IoT デバイス まで、さまざまなハードウェアで使用するように設計されています。AI ハードウェアの最適化により、デバイス全体で最高のパフォーマンスが実現します。また、Vertex AIGoogle Kubernetes Engine などの簡単な展開オプションもサポートしています。
  • 責任ある AI へのコミットメント: 安全で倫理的な AI 開発を強調し、Gemma には自動データ フィルタリング、人間のフィードバックからの強化学習、および包括的なテストが含まれており、高い信頼性と安全性の基準を維持します。Google では、開発者が責任ある AI の実践を維持するためのツールキットとリソースも提供しています。
  • 好ましい条件によるイノベーションの促進: Gemma の使用条件は、責任ある商用アプリケーションとイノベーションをサポートしています。研究および開発のための無料クレジット、Colab ノートブックの無料プラン、および Google Cloud クレジットを提供し、研究者と開発者が AI の新しいフロンティアを探索できるようにします。

他のオープンソース モデルとの比較

  • Gemma Vs Llama 2: Gemma と Llama 2 は、Google と Meta によって開発されたオープンソース言語モデルのドメインで、それぞれ独自の強みを示しています。Gemma は、コード生成や数学的問題解決などの STEM フィールドのタスクに最適化されており、特に NVIDIA プラットフォームで機能する特殊な機能が必要な研究者や開発者にとって貴重なリソースとなっています。一方、Llama 2 は、テキスト要約や創造的書き込みなどの幅広い一般的な言語タスクを処理する能力で、より広いオーディエンスにアピールしています。Gemma の STEM タスクへの特化は、より広範なリアルワールド シナリオでの適用可能性を狭める可能性がありますが、Llama 2 の高い計算要求は、リソースが限られているユーザーにとってアクセスしにくい可能性があります。これらの違いは、AI テクノロジーのさまざまな応用と潜在的な限界を強調し、デジタル時代の進歩と課題に貢献するための別々のパスを反映しています。
  • Gemma 7B Vs Mistral 7B: Gemma 7B と Mistral AI の Mistral 7B は、軽量なオープンソース言語モデルのカテゴリに分類されますが、異なるドメインで優れています。Gemma 7B は、コード生成と数学的問題解決の能力で際立っていますが、Mistral 7B は、論理的推論スキルと現実世界のシナリオの処理で認められています。にもかかわらず、両方のモデルは、推論速度と待ち時間に関して類似したレベルのパフォーマンスを提供します。Mistral 7B の完全にオープンソースの性質により、Gemma 7B に比べてより簡単な変更が可能です。このアクセシビリティの違いは、Google が安全性とプライバシーの措置を確保するために、Gemma を使用する前に特定の条件に同意することをユーザーに要求することによってさらに強調されます。一方、Mistral AI のアプローチは、同等の基準を課すことに課題をもたらす可能性があります。

まとめ

Google の Gemma は、オープンソースのジェネレーティブ AI への重要な一歩を表しています。高いパフォーマンスと責任ある使用のバランスをとるように設計された、多機能でアクセスしやすい言語モデルを提供します。Google の高度な AI 技術である Gemini の技術的基盤に立脚し、Gemma は AI テクノロジーを民主化することを目的としています。幅広い計算ニーズに対応するように設計された構成と、開発者がアクセスしやすく、クロス フレームワークの互換性、最適化された展開を可能にする一連の機能を備えています。Gemma は、Meta の Llama 2 や Mistral AI の Mistral 7B などの競合他社と比べて、専門の STEM タスクでの卓越したパフォーマンスで際立っています。ただし、Gemma の責任ある AI 開発への取り組みと、好ましい条件によるイノベーションのサポートは、Google が倫理的かつアクセスしやすい方法で AI テクノロジーを進歩させるというコミットメントを強調しています。

Dr. Tehseen ZiaはCOMSATS University Islamabadの正教授であり、オーストリアのVienna University of TechnologyでAIのPh.D.を取得しています。人工知能、機械学習、データサイエンス、コンピュータビジョンを専門とし、信頼性の高い科学雑誌に掲載された出版物で著しい貢献をしています。Dr. Tehseenは、主な調査員としてさまざまな産業プロジェクトを率い、AIコンサルタントとしても務めています。