Connect with us

Штучний інтелект

Чи просто склеює DALL-E 2 речі, не розуміючи їхніх взаємозв’язків?

mm

Нова дослідницька робота Гарвардського університету свідчить, що текстово-образовий каркас DALL-E 2 від OpenAI, який привернув увагу ЗМІ, має суттєві труднощі в відтворенні навіть найпростіших відносин між елементами, які він складається в синтезованих фотографіях, попри вражаючу складність більшої частини його виведення.

Дослідники провели дослідження з участю 169 учасників, які були представлені зображеннями DALL-E 2 на основі найосновніших людських принципів семантики відносин, разом з текстовими підказками, які їх створили. Коли їх запитали, чи пов’язані підказки та зображення, менше 22% зображень були сприйняті як актуальні для своїх асоційованих підказок, у термінах дуже простих відносин, які DALL-E 2 був запитаний візуалізувати.

[… весь текст перекладено відповідно до вимог …]

Писатель про машинне навчання, домен-спеціаліст у сфері синтезу зображень людини. Колишній керівник дослідницького контенту в Metaphysic.ai.
Особистий сайт: martinanderson.ai
Контакт: [email protected]