Connect with us

Sztuczna inteligencja

Czy DALL-E 2 po prostu “klei rzeczy razem” bez zrozumienia ich relacji?

mm

Nowy artykuł badawczy z Uniwersytetu Harvarda sugeruje, że ramka tekstowo-obrazkowa DALL-E 2 od OpenAI, która wywołała duże zainteresowanie, ma znaczne trudności w odtwarzaniu nawet podstawowych relacji między elementami, które komponuje w syntetyzowanych fotografiach, pomimo olśniewającej złożoności dużej części jej danych wyjściowych.

Badacze przeprowadzili badanie z udziałem 169 uczestników, którzy zostali przedstawieni obrazom DALL-E 2 na podstawie najbardziej podstawowych ludzkich zasad semantyki relacji, wraz z tekstowymi wskazówkami, które je stworzyły. Zapytani, czy wskazówki i obrazy są ze sobą powiązane, mniej niż 22% obrazów zostało uznanych za istotne w odniesieniu do bardzo prostych relacji, które DALL-E 2 zostało poproszone o wizualizację.

… (reszta treści)

Pisarz na temat uczenia maszynowego, specjalista ds. syntezowania obrazów ludzi. Były kierownik treści badawczych w Metaphysic.ai.