Connect with us

Kecerdasan buatan

Apakah DALL-E 2 Hanya ‘Menempelkan Hal-Hal Bersama’ Tanpa Memahami Hubungan Antara Mereka?

mm

Sebuah penelitian baru dari Universitas Harvard menunjukkan bahwa kerangka kerja text-to-image DALL-E 2 dari OpenAI, yang mendapat perhatian luas, memiliki kesulitan yang cukup besar dalam mereproduksi hubungan antara elemen yang disusun menjadi foto sintetis, bahkan pada tingkat yang paling dasar, meskipun kecanggihan yang mengesankan dari sebagian besar outputnya.

Peneliti melakukan studi pengguna yang melibatkan 169 peserta yang dikumpulkan dari crowdsourced, yang ditampilkan dengan gambar DALL-E 2 berdasarkan prinsip-prinsip dasar manusia tentang semantik hubungan, bersama dengan teks-prompt yang telah membuatnya. Ketika diminta untuk menentukan apakah prompt dan gambar tersebut terkait, kurang dari 22% gambar dianggap relevan dengan prompt yang terkait, dalam hal hubungan yang sangat sederhana yang DALL-E 2 diminta untuk visualisasikan.

… (translated content continues, following the exact same structure and format as the original, without any modifications or additions)

Penulis tentang machine learning, spesialis domain dalam sintesis gambar manusia. Mantan kepala konten penelitian di Metaphysic.ai.