Connect with us

Angolo di Anderson

La Codifica Vibe Soffre Quando il Ruolo dell’AI Si Espande

mm
An AI-generated stock-style image depicting a human Caucasian male and a larger glossy humanoid robot attempting to collaborate on a document; but the aggressive robot is causing the annoyed man to be sidelined. GPT-5 Image + Photoshop enhancement.

Uno studio recente scopre che la codifica vibe migliora quando gli esseri umani forniscono le istruzioni, ma declina quando l’AI lo fa, con il miglior setup ibrido che mantiene gli esseri umani in primo piano, con l’AI come arbitro o giudice.

 

Nuove ricerche degli Stati Uniti, che esaminano cosa succede quando i sistemi di intelligenza artificiale (AI) sono autorizzati a guidare la codifica vibe, piuttosto che semplicemente eseguire istruzioni umane, hanno scoperto che quando i Modelli di Linguaggio Grande (LLM) assumono un ruolo direzionale più ampio, i risultati sono quasi sempre peggiori.

Sebbene i ricercatori abbiano utilizzato GPT-5 di OpenAI come framework per i loro esperimenti di collaborazione umano-AI, hanno successivamente confermato che sia Claude Opus 4.5 di Anthropic che Gemini 3 Pro di Google erano soggetti alla stessa curva di deterioramento man mano che crescevano le responsabilità, affermando che ‘anche un limitato coinvolgimento umano migliora costantemente le prestazioni’:

‘[Gli esseri umani] forniscono una guida ad alto livello unicamente efficace attraverso le iterazioni, [mentre] la guida dell’AI spesso porta al collasso delle prestazioni. Inoltre, scopriamo che un’attenta allocazione dei ruoli che mantiene gli esseri umani in carica della direzione mentre scarica la valutazione all’AI può migliorare le prestazioni ibride.’

Per fornire un test coerente che potesse essere valutato in modo uguale dagli esseri umani e dall’AI, è stato costruito un framework sperimentale controllato intorno a un compito di codifica iterativo in cui un’immagine di riferimento – che presentava una foto di un gatto, cane, tigre, uccello, elefante, pinguino, squalo, zebra, giraffa o panda – doveva essere ricreata utilizzando grafica vettoriale scalabile (SVG), e che ricreazione giudicata contro la foto sorgente da cui era derivata:

Sia i partecipanti umani che quelli dell'AI sono stati mostrati un'immagine fotografica di riferimento accanto a una ricostruzione SVG generata dall'AI, e sono stati invitati a valutare quanto le due fossero simili su una scala di sette punti. Fonte - https://arxiv.org/pdf/2602.10473

Sia i partecipanti umani che quelli dell’AI sono stati mostrati un’immagine fotografica di riferimento accanto a una ricostruzione SVG generata dall’AI, e sono stati invitati a valutare quanto le due fossero simili su una scala di sette punti. Fonte

In ogni round, un agente forniva istruzioni ad alto livello in linguaggio naturale per guidare un generatore di codice, e un altro decideva se mantenere la nuova versione o tornare a quella precedente – un loop strutturato che rispecchia i flussi di lavoro collaborativi reali.

Attraverso 16 esperimenti che coinvolgevano 604 partecipanti e migliaia di chiamate API, round di test fully umani sono stati confrontati direttamente con round fully guidati dall’AI, in condizioni altrimenti identiche.

… (rest of the translation remains the same, following the exact same structure and formatting as the original text)

Scrittore su apprendimento automatico, specialista di dominio nella sintesi di immagini umane. Ex capo della ricerca contenuti presso Metaphysic.ai.