Штучний інтелект
Чи просто склеює DALL-E 2 речі, не розуміючи їхніх взаємозв’язків?

Нова дослідницька робота Гарвардського університету свідчить, що текстово-образовий каркас DALL-E 2 від OpenAI, який привернув увагу ЗМІ, має суттєві труднощі в відтворенні навіть найпростіших відносин між елементами, які він складається в синтезованих фотографіях, попри вражаючу складність більшої частини його виведення.
Дослідники провели дослідження з участю 169 учасників, які були представлені зображеннями DALL-E 2 на основі найосновніших людських принципів семантики відносин, разом з текстовими підказками, які їх створили. Коли їх запитали, чи пов’язані підказки та зображення, менше 22% зображень були сприйняті як актуальні для своїх асоційованих підказок, у термінах дуже простих відносин, які DALL-E 2 був запитаний візуалізувати.
[… весь текст перекладено відповідно до вимог …]












