Connect with us

ソートリーダー

中国のAIミラージュ: 「オープンソース」が最も重要なものを隠している方法

mm

Google、Microsoft、Metaなどのビッグテック企業がAI市場を支配しようとしている中、中国のハイフライヤー、バイドゥ、ムーンショット、阿里巴巴は、それぞれのDeepSeekERNIE 4.5Kimi K2Qwen3の大規模言語モデルをオープンソースとしてリリースし、注目を集めています。この、ガードされたプロプライエタリGenAIモデルからオープンソースへのシフトは、中国のAI業界がAI開発を民主化し、イノベーションを促進するためのオープンソースの力を受け入れているという信号と受け取られています。

しかし、オープンソースと称して会社名にそれを入れる多くの企業と同様に、ハイフライヤー、バイドゥ、ムーンショットは、実際にはモデルの中核となる重要なピースであるデータセットを共有していません。これらの大規模モデルが開発者に頼られるコモディティになるにつれて、信頼できる、倫理的で、有益なテクノロジーを作成するために、テスト、調査、反復が可能な真正のオープンソースの透明性は重要です。すべての「オープンソース」モデルは、実際には「オープンウェイト」であり、ダウンロードして使用できますが、データなしでは意味のある方法で検査することはできません。

米国のプレーヤーであるOpen AIMetaがオープンソースから離れていくように見えるとき、バイドゥのERNIE 4.5モデルの無料で利用可能なスイートを活用するためのオープンな招待は、開発者が小規模で強力なアプリケーションを作成しようとしているのと同様に、イノベーションとコラボレーションを促進できます。同時に、中国のGoogleに相当するこの会社は、採用を促進し、モデルを新興のAIエコシステムに根付かせることで、競争上の優位性を与えました。

同様のことが、低価格のKimi K2や最新のQwen3についても言えます。Qwen3は、オープンソースコミュニティのフィードバックによってインスピレーションを受けた革新的な更新を備えており、クローズドモデルのClaude Opus 4やGPT-4o-0327に挑戦するベンチマークを誇ります。

これらのAIプレーヤーは、コモディティモデルとしての地位を確立するレースで自分たちをうまく位置付けました。Qwen3の最新の革新的な更新は、オープンソースコミュニティのフィードバックによってインスピレーションを受けたものです。

しかし、多くの企業が大規模AIモデルをオープンソースと称しているように、中国のAIコミュニティは、実際にはデータやAIシステムの他の重要なピースを共有していません。代わりに、開発者は、真正に理解したり調査したりできないモデルに盲目的に信頼を寄せているのです。

オープンソースコモディティAIモデルによる未来への挑戦

2007年にiPhoneが市場に登場したとき、MacがiOSでスマートフォンのゲームを支配するだろうと何人かが考えました。しかし、オープンソース参加はスタートアップにとって不可欠であり、同時に世界中で起業家精神と経済成長を促進します。Googleが2005年に買収したスタートアップであるAndroidは、この道をたどり、勝利を収めました。

オープンソースソフトウェアをリリースすることで、Androidはアカデミア、開発者、そして競合他社にまで、ソフトウェアの共同作業を呼びかけたのです。この結果、イノベーションのプロセスが加速され、競争が平等になり、価格が下がりました。Androidは最初のiPhoneの1年後に市場に登場し、今年の初めには、71.88パーセントの世界市場を占め、iOSは27.65パーセントでした。

一夜にして起こった技術革命により、スマートフォンは至る所に存在し、ソフトウェア、ハードウェア、ユーザーインターフェースの改善は続いていますが、業界はスマートフォンの動作を革命的に変えることを目指すのをやめています。携帯電話は今やコモディティとなり、現在のイノベーションは、それらが動作するアプリケーションにあります。競争するためには、スマートフォンプロバイダーは、開発者が参加するエコシステムを維持する必要があります。

ChatGPTの発売から3年も経たないうちに、AI業界は同様の岐路に立っています。世界中のAI業界のすべてのプレーヤーは、AndroidまたはiOSの次のバージョンになることを目指しています。中国のイノベーターは、DeepSeek、ERNIE 4.5、Kimi K2モデルをオープンソースとしてリリースすることで、新しいエコシステムに地位を確立しようとしています。

しかし、これが彼らの利益になるかもしれませんが、真正のオープンソースの透明性は、イノベーションを生み出すだけでなく、信頼できるイノベーションを生み出すために不可欠です。

オープンソースAIの欠けているピース: データ

AIモデルは従来のソフトウェアよりも作成して共有するのがはるかに複雑であるため、完全にオープンソースのAIを求めることは小さな要求ではありません。代わりに、単純なソースコードだけでは、AIシステムは7つのコンポーネントで構成されています。ソースコード、モデルパラメータ、データセット、ハイパーパラメータ、トレーニングソースコード、乱数生成、ソフトウェアフレームワークが含まれます。

各ピースはモデルが望ましい結果をもたらすために調和して機能する必要があります。つまり、開発者はシステムを共有、変更、採用し、 何が起こっているのかを理解するために、完全な可視性が必要です。再現性は科学的方法の基盤であるため、AI業界には、オープンソースという用語を、無料または低価格でリリースされるピースのいくつかへのアクセスが可能になることを指すために使用する習慣があります。

例えば、バイドゥは10個のERNIE 4.5モデルを無料で提供しました。モデルとパラメータを共有することに加えて、会社はERNIEKitとFastDeployデプロイメントツールキットもオープンソース化しました。これらにより、開発者は産業規模の機能を提供し、リソース効率の高いトレーニングと推論ワークフロー、そしてマルチハードウェアの互換性を提供することで、強力なAIアプリケーションを構築できます。

つまり、バイドゥは開発者に、イノベーションをより迅速に解き放つための魅力的なツールを提供しました。彼らは、開発者が競合他社よりもERNIE 4.5を選択することを期待しています。

しかし、ERNIE 4.5を利用する開発者は、モデルを真正に理解したり調査したりできないため、それを盲目的に信頼するよう求められています。なぜなら、バイドゥは、モデルを教えるデータセットを含む多くのことを隠しているからです。

透明なオープンソースAIモデルの力

AIのパズルの各ピースは、モデルが機能するために重要ですが、80パーセントのAIプロジェクトが失敗し、データが問題の核心にあります。不正確で、不完全で、偏ったデータセットは、モデルが予測不可能または望ましくない動作につながります。

例えば、最近公開された2023年のテスラFull-Self-Driving(FSD)クラッシュの映像は、データセットとモデルの欠陥がもたらす最悪のシナリオを明らかにしました。テスラModel Yが明るく設定された太陽に向かって進むとき、部分的に自動化されたシステムは、カメラが何を見ているか、または見ていないかを理解または適切に反応できませんでした。人間が運転する車は減速して停止しましたが、FSDの混乱は女性の死につながりました。

この悲惨な失敗は、視覚的なデータが不完全であり、またそのような盲点に対応する安全メカニズムが欠けていたことを示しています。開発者がデータを確認できない場合、データがモデルとどのように相互作用するかを見て、強力なパフォーマンスのためにミスを発見して反復することはできません。

さらに心配なことは、モデルを動かすデータセットがなければ、開発者はそれを盲目的に信頼することを強いられることです。

しかし、データセットがオープンソースになると、AIコミュニティは、LAION 5Bに含まれる1,000を超えるURLに確認された児童性的虐待物質を発見することで、問題を明らかにすることができます。AIテキストから画像生成モデルを作成するための基礎となるデータセットは、Stable DiffusionやMidjourneyなどのアプリを作成する上で重要です。ユーザーが違法な写実的な画像を生成し始めた場合、AI業界にとって壊滅的なことになりました。代わりに、データセットのオープン性により、コミュニティが危険なコンテンツを発見し、修正を促すことができました。

さらに、その最初のデータセットの多くは、ChatGPTやLLAMAモデルでも使用された大きなCommon Crawlによるウェブスクレイピングに基づいていました。AIクローラーが著作権、プライバシー、偏ったラベルの問題を引き起こし続ける中でも、AIコミュニティの開発者は、Common Crawlの成長するオープンソースデータセットのピースをより安全な使用のためにクリーンアップする方法に取り組んでいます。

開発者が強力なAIを構築するだけでなく、信頼できるAIを構築することを目指すにつれて、ユーザーと業界は、真正のオープンソースの透明性とコラボレーションによって保護されています。

オープンソースの道を歩む

多くの人がまだこの新興テクノロジーに懐疑的である中で、大規模AIコモディティモデルのiOSまたはAndroidになるレースは進行中です。世界中のAIコミュニティが、将来の標準となるものを構築している現在、AIシステムはすでに車を運転し、医療の診断を提供しています。信頼できる、偏りのない、安全なAIを作成することは、以前より重要です。

中国のAIコミュニティがオープンイノベーションのチャンピオンとして自分たちを位置付けようとしている中で、安全なAIへの道は、数十年のソフトウェアイノベーションを通じて実証された真正のオープンソースの透明性にあります。重要なピースであるデータを共有していないシステムに「オープンソース」という用語を付けることは、開発者が調査したり、複製したり、反復したりできないため、信頼できるイノベーションを生み出すことはできません。DeepSeek、ERNIE 4.5、Kimi K2、Qwen3のような利用可能なモデルへの魅力は否定できませんが、開発者がこれらを利用する場合、透明性を犠牲にして便利さを選ぶことになります。

AIコミュニティは選択しなければなりません。真正のオープンソースを通じて根底的な透明性を受け入れるか、今日のブラックボックスの上に明日の重要なシステムを構築するリスクを冒すか。

ジェイソン・コーソー博士は、Voxel51の共同創設者兼チーフサイエンスオフィサーであり、ミシガン大学のロボティクスおよび電気工学&コンピューターサイエンスの教授です。 コンピュータビジョンの分野のベテランであるコーソー博士は、ビデオ理解、ロボティクス、データサイエンスの分野で20年以上の学術研究に尽力しています。