Intelligenza artificiale

La soluzione di Apple per la traduzione di lingue con genere

Published October 8, 2024

Updated April 3, 2026

Martin Anderson

A photo of the Rosetta Stone, with a woman out of focus in the background, looking at the stone. Source: https://smarthistory.org/the-rosetta-stone/

Apple ha appena pubblicato un documento, in collaborazione con la USC, che esplora i metodi di apprendimento automatico utilizzati per offrire agli utenti del suo sistema operativo iOS18 più opzioni riguardo al genere nella traduzione.

In iOS18, gli utenti possono selezionare suggerimenti di genere alternativi per una parola tradotta nell’app Translate nativa. Source: https://support.apple.com/guide/iphone/translate-text-voice-and-conversations-iphd74cb450f/ios

Sebbene le questioni affrontate nel lavoro (che Apple ha annunciato qui) si occupino, in una certa misura, di dibattiti attuali sulla definizione di genere, si concentra su un problema molto più vecchio: il fatto che 84 delle 229 lingue conosciute nel mondo utilizzano un sistema di genere basato sul sesso.

I punti rossi indicano le lingue che utilizzano un sistema di genere basato sul sesso. Source: https://wals.info/feature/31A#map

Sorprendentemente, la lingua inglese rientra nella categoria basata sul sesso, poiché assegna pronomi singolari maschili o femminili.

Al contrario, tutte le lingue romanze (incluse oltre mezzo miliardo di parlanti spagnoli) – e molte altre lingue popolari, come il russo – richiedono un accordo di genere in modi che costringono i sistemi di traduzione ad affrontare l’assegnazione di genere nella lingua.

Il nuovo documento illustra questo osservando tutte le possibili traduzioni spagnole della frase Il segretario era arrabbiato con il capo:

Dal nuovo documento, un esempio delle possibili assegnazioni di genere nella frase ‘Il segretario era arrabbiato con il capo’, traducendo dall’inglese allo spagnolo. Source: https://arxiv.org/pdf/2407.20438

Una traduzione ingenua è ben lontana dall’essere sufficiente per testi più lunghi, che possono stabilire il genere all’inizio (‘Lui’, ‘Lei’, ecc.) e successivamente non fare più riferimento al genere. Tuttavia, la traduzione deve ricordare il genere assegnato al partecipante in tutto il testo.

Ciò può essere difficile per gli approcci basati su token che affrontano le traduzioni in chunk discreti e rischiano di perdere il contesto di genere nel corso del contenuto.

Peggio, i sistemi che forniscono traduzioni alternative per assegnazioni di genere distorti non possono farlo indiscriminatamente, ovvero sostituendo semplicemente il sostantivo di genere, ma devono assicurarsi che tutte le altre parti della lingua siano d’accordo con il sostantivo di genere modificato.

In questo esempio dal documento Apple/USC, vediamo che sebbene Segretario sia stato assegnato un genere maschile, il verbo singolare al passato era è stato lasciato al femminile (estaba):

Le sostituzioni di genere brute-force possono trascurare la necessaria concordanza di genere. In questo esempio, la parola ‘enojada’ dovrebbe essere ‘enojado’, per concordare con il maschile ‘El secretario’.

Un sistema di traduzione deve anche affrontare le eccentricità di particolari lingue riguardo al genere. Come osserva il documento, il pronome Io è di genere in hindi, il che fornisce un indizio insolito per il genere.

Questioni di genere

Nel nuovo documento, intitolato Generazione di alternative di genere nella traduzione automatica, i ricercatori di Apple e USC propongono un metodo semi-supervisionato per convertire entità ambigue di genere in un array di alternative a livello di entità.

Il sistema, utilizzato per informare la traduzione dall’app Translate di Apple in iOS18, costruisce uno schema linguistico sia utilizzando grandi modelli linguistici (LLM), sia ottimizzando modelli di traduzione automatica pre-addestrati open source.

I risultati delle traduzioni da questi sistemi sono stati quindi addestrati in un’architettura contenente strutture di genere – gruppi di frasi che contengono forme diverse di sostantivi di genere che rappresentano la stessa entità.

Il documento afferma*:

‘I pregiudizi di genere presenti nei dati di addestramento sono noti per influenzare i sistemi di elaborazione del linguaggio naturale (NLP), risultando nella diffusione e potenziale amplificazione di quei pregiudizi. Tali pregiudizi sono spesso anche la causa radice degli errori.

‘Un sistema di traduzione automatica (MT) potrebbe, ad esempio, tradurre il medico nel termine spagnolo médico (maschile) invece di médica (femminile), dato l’input “Il medico ha chiesto all’infermiera di aiutarla nella procedura”.

‘Per evitare di prescrivere un’assegnazione di genere errata, i sistemi MT devono chiarire il genere attraverso il contesto. Quando il genere corretto non può essere determinato attraverso il contesto, fornire molteplici alternative di traduzione che coprono tutte le scelte di genere valide è un approccio ragionevole.’

L’approccio che i ricercatori arrivano a trasforma efficacemente una traduzione da un singolo token a un array controllato dall’utente.

(Sebbene il documento non lo menzioni, ciò apre la possibilità, sia in Apple Translate che in portali simili che offrono servizi di traduzione, per le scelte dell’utente di essere alimentate in iterazioni successive del modello)

Il modello sviluppato da Apple e USC è stato valutato sui set di test GATE e MT-GenEval. GATE contiene frasi sorgente con fino a 3 entità ambigue di genere, mentre MT-GenEval contiene materiale in cui il genere non può essere inferito, il che, secondo gli autori, aiuta a comprendere quando non devono essere offerte all’utente alternative di genere.

In entrambi i casi, i set di test dovevano essere ri-annotati per allinearsi con gli obiettivi del progetto.

Per addestrare il sistema, i ricercatori si sono affidati a un algoritmo di aumento dei dati automatico, a differenza dei set di test menzionati, che erano stati annotati da esseri umani.

I set di dati contributivi per la cura di Apple erano Europarl; WikiTitles; e WikiMatrix. Il corpus è stato diviso in G-Tag (con 12.000 frasi), che comprende frasi con parole chiave per tutte le entità, insieme a un’annotazione ambigua di genere; e G-Trans (con 50.000 frasi), che contiene entità ambigue di genere e allineamenti di genere.