Connect with us

人工知能

DALL-E 2はただの「ものを貼り合わせる」だけで、関係性を理解できないのではないか?

mm

ハーバード大学の新しい研究論文によると、OpenAIの注目を集めたテキストから画像を生成するフレームワークDALL-E 2は、生成された写真の要素間の関係性を再現することに著しい困難を抱えていることがわかった。研究者は169人のクラウドソーシング参加者を募集し、DALL-E 2の画像とテキストプロンプトを提示し、関係性が適切に表現されているかどうかを尋ねた。結果は、関係性のある画像が22%以下しかないことを示した。研究者は、DALL-E 2の関係性の理解の欠如は、人間の知能の基本的な側面であり、早期から発達するものであると指摘している。さらに、DALL-E 2の画像生成能力は、関係性のある要素を組み合わせる能力ではなく、単に要素を貼り合わせる能力にすぎない可能性があると示唆している。研究者は、DALL-E 2の関係性の理解の欠如は、ロボティクスで使用されるアルゴリズムを活用することで改善できる可能性があると提案している。

機械学習に関するライター、ヒューマンイメージシンセシスのドメインスペシャリスト。Metaphysic.aiの研究コンテンツ責任者を務めた。