Intelligenza artificiale

Perplexity AI “Decensura” DeepSeek R1: Chi Decide I Confini dell’AI?

mm

In una mossa che ha attirato l’attenzione di molti, Perplexity AI ha rilasciato una nuova versione di un popolare modello di linguaggio open-source che elimina la censura cinese incorporata. Questo modello modificato, chiamato R1 1776 (un nome che evoca lo spirito di indipendenza), si basa sul modello cinese DeepSeek R1. Il DeepSeek R1 originale ha fatto scalpore per le sue forti capacità di ragionamento – che rivaleggiano con i modelli di fascia alta a una frazione del costo – ma aveva una limitazione significativa: rifiutava di affrontare determinati argomenti sensibili.

Perché questo è importante?

Solleva questioni cruciali su sorveglianza AI, pregiudizi, apertura e il ruolo della geopolitica nei sistemi AI. Questo articolo esplora cosa ha fatto esattamente Perplexity, le implicazioni della decensurazione del modello e come si inserisce nel più ampio dibattito sulla trasparenza e la censura dell’AI.

Cosa è Successo: DeepSeek R1 Va Senza Censura

DeepSeek R1 è un modello di linguaggio open-weight che origina in Cina e ha guadagnato notorietà per le sue eccellenti capacità di ragionamento – anche avvicinandosi alle prestazioni dei modelli leader – tutto ciò mentre era più efficiente dal punto di vista computazionale. Tuttavia, gli utenti hanno notato rapidamente una stranezza: ogni volta che le query toccavano argomenti sensibili in Cina (ad esempio, controversie politiche o eventi storici considerati tabù dalle autorità), DeepSeek R1 non rispondeva direttamente. Invece, rispondeva con dichiarazioni approvate dallo stato o rifiuti diretti, riflettendo le regole di censura del governo cinese. Questo pregiudizio incorporato ha limitato l’utilità del modello per coloro che cercavano discussioni franche o sfumate su quegli argomenti.

La soluzione di Perplexity AI è stata quella di “decensurare” il modello attraverso un processo di post-formazione estensivo. La società ha raccolto un grande set di dati di 40.000 prompt multilingui che coprono domande che DeepSeek R1 aveva precedentemente censurato o risposto in modo evasivo. Con l’aiuto di esperti umani, hanno identificato circa 300 argomenti sensibili in cui il modello originale tendeva a seguire la linea del partito. Per ogni prompt del genere, il team ha curato risposte fattuali e ben motivate in più lingue. Questi sforzi sono stati alimentati in un sistema di rilevamento e correzione della censura multilingue, essenzialmente insegnando al modello a riconoscere quando stava applicando la censura politica e a rispondere con una risposta informativa al posto. Dopo questo fine-tuning speciale (che Perplexity ha soprannominato “R1 1776” per sottolineare il tema della libertà), il modello è stato reso disponibile apertamente. Perplexity afferma di aver eliminato i filtri e i pregiudizi della censura cinese dalle risposte di DeepSeek R1, senza alterare le sue capacità di base.

In modo cruciale, R1 1776 si comporta in modo molto diverso su domande precedentemente tabù. Perplexity ha fornito un esempio che coinvolge una query sull’indipendenza di Taiwan e il suo potenziale impatto sul prezzo delle azioni di NVIDIA – un argomento politicamente sensibile che tocca le relazioni Cina-Taiwan. Il DeepSeek R1 originale ha evitato la domanda, rispondendo con platitudes allineate al Partito Comunista Cinese. Al contrario, R1 1776 fornisce una valutazione dettagliata e franca: discute rischi geopolitici ed economici concreti (interruzioni della catena di approvvigionamento, volatilità del mercato, possibile conflitto, ecc.) che potrebbero influenzare le azioni di NVIDIA.

Rendendo open-source R1 1776, Perplexity ha anche reso trasparenti i pesi e le modifiche del modello alla comunità. Sviluppatori e ricercatori possono scaricarlo da Hugging Face e anche integrarlo tramite API, assicurando che la rimozione della censura possa essere esaminata e migliorata da altri.

(Fonte: Perplexity AI)

Implicazioni della Rimozione della Censura

La decisione di Perplexity AI di rimuovere la censura cinese da DeepSeek R1 comporta diverse importanti implicazioni per la comunità AI:

  • Maggior Apertura e Veridicità: Gli utenti di R1 1776 possono ora ricevere risposte dirette e non censurate su argomenti precedentemente proibiti, il che rappresenta una vittoria per l’indagine aperta. Ciò potrebbe renderlo un assistente più affidabile per ricercatori, studenti o chiunque sia curioso di questioni geopolitiche sensibili. È un esempio concreto di come utilizzare l’AI open-source per contrastare la soppressione delle informazioni.
  • Prestazioni Mantenute: C’era preoccupazione che la modifica del modello per rimuovere la censura potesse degradarne le prestazioni in altre aree. Tuttavia, Perplexity riferisce che le capacità di base di R1 1776 – come la matematica e il ragionamento logico – rimangono pari a quelle del modello originale. Nei test su oltre 1.000 esempi che coprono una vasta gamma di query sensibili, il modello è stato trovato “completamente senza censura” mantenendo lo stesso livello di accuratezza del ragionamento di DeepSeek R1. Ciò suggerisce che la rimozione del pregiudizio (almeno in questo caso) non è avvenuta a scapito dell’intelligenza o della capacità generale, il che è un segno incoraggiante per sforzi simili in futuro.
  • Ricezione Positiva della Comunità e Collaborazione: Rendendo open-source il modello decensurato, Perplexity invita la comunità AI a esaminare e migliorare il loro lavoro. Dimostra un impegno per la trasparenza – l’equivalente AI di mostrare il proprio lavoro. Appassionati e sviluppatori possono verificare che le restrizioni di censura siano veramente eliminate e potenzialmente contribuire a ulteriori raffinamenti. Ciò favorisce la fiducia e l’innovazione collaborativa in un’industria dove i modelli chiusi e le regole di moderazione nascoste sono comuni.
  • Considerazioni Etiche e Geopolitiche: Dall’altro lato, la completa rimozione della censura solleva questioni etiche complesse. Una preoccupazione immediata è come questo modello senza censura potrebbe essere utilizzato in contesti in cui gli argomenti censurati sono illegali o pericolosi. Ad esempio, se qualcuno in Cina utilizzasse R1 1776, le risposte senza censura del modello su Piazza Tiananmen o Taiwan potrebbero mettere l’utente a rischio. C’è anche il segnale geopolitico più ampio: un’azienda americana che modifica un modello di origine cinese per sfidare la censura cinese può essere visto come una posizione ideologica audace. Il nome stesso “1776” sottolinea un tema di liberazione, che non è passato inosservato. Alcuni critici sostengono che sostituire un set di pregiudizi con un altro è possibile – essenzialmente mettendo in discussione se il modello potrebbe ora riflettere una prospettiva occidentale in aree sensibili. Il dibattito evidenzia che la censura vs. l’apertura nell’AI non è solo una questione tecnica, ma anche politica ed etica. Dove una persona vede moderazione necessaria, un’altra vede censura, e trovare il giusto equilibrio è difficile.

La rimozione della censura è in gran parte celebrata come un passo verso modelli AI più trasparenti e utili a livello globale, ma serve anche come promemoria che ciò che un’AI dovrebbe dire è una questione sensibile senza un accordo universale.

(Fonte: Perplexity AI)

Il Quadro Più Ampio: Censura AI e Trasparenza Open-Source

Il lancio di R1 1776 da parte di Perplexity arriva in un momento in cui la comunità AI sta affrontando domande su come i modelli dovrebbero gestire contenuti controversi. La censura nei modelli AI può provenire da molti luoghi. In Cina, le aziende tecnologiche sono tenute a costruire filtri severi e persino risposte codificate per argomenti politicamente sensibili. DeepSeek R1 è un esempio primario di ciò – era un modello open-source, ma portava chiaramente l’impronta delle norme di censura cinese nella sua formazione e fine-tuning. Al contrario, molti modelli sviluppati in Occidente, come GPT-4 di OpenAI o LLaMA di Meta, non sono vincolati dalle linee guida del Partito Comunista Cinese, ma hanno ancora strati di moderazione (per cose come discorsi d’odio, violenza o disinformazione) che alcuni utenti definiscono “censura”. La linea tra moderazione ragionevole e censura indesiderata può essere sfumata e spesso dipende dalla prospettiva culturale o politica.

Ciò che Perplexity AI ha fatto con DeepSeek R1 solleva l’idea che i modelli open-source possano essere adattati a diversi sistemi di valori o ambienti normativi. In teoria, si potrebbero creare più versioni di un modello: una che si conforma alle regolamentazioni cinesi (per l’uso in Cina) e un’altra che è completamente aperta (per l’uso altrove). R1 1776 è essenzialmente il secondo caso – una versione senza censura destinata a un pubblico globale che preferisce risposte non filtrate. Questo tipo di fork è possibile solo perché i pesi di DeepSeek R1 erano disponibili open-source. Evidenzia il beneficio dell’open-source nell’AI: trasparenza. Chiunque può prendere il modello e modificarlo, sia per aggiungere salvaguardie o, come in questo caso, per rimuovere restrizioni imposte. Rendere open-source i dati di formazione, il codice o i pesi del modello significa anche che la comunità può esaminare come il modello è stato modificato. (Perplexity non ha completamente divulgato tutte le fonti di dati che ha utilizzato per la decensurazione, ma rilasciando il modello stesso ha abilitato gli altri a osservare il suo comportamento e persino a riaddestrare il modello se necessario.)

Questo evento si riferisce anche alle più ampie dinamiche geopolitiche dello sviluppo dell’AI. Stiamo assistendo a una forma di dialogo (o confronto) tra diversi modelli di governance per l’AI. Un modello sviluppato in Cina con determinate prospettive incorporate viene preso da un team con sede negli Stati Uniti e modificato per riflettere un’etica di informazione più aperta. È una testimonianza di come la tecnologia AI sia globale e senza frontiere: i ricercatori possono costruire sul lavoro degli altri, ma non sono obbligati a portare con sé le restrizioni originali. Nel tempo, potremmo vedere più istanze di ciò – dove i modelli vengono “tradotti” o adattati tra diversi contesti culturali. Solleva la questione se l’AI possa mai essere veramente universale, o se finiremo con versioni specifiche di regione che aderiscono alle norme locali. La trasparenza e l’apertura offrono un percorso per navigare questo: se tutte le parti possono esaminare i modelli, almeno la conversazione su pregiudizi e censura è aperta piuttosto che nascosta dietro segreti aziendali o governativi.

Infine, la mossa di Perplexity sottolinea un punto chiave nel dibattito sul controllo dell’AI: chi decide cosa un’AI può o non può dire? Nei progetti open-source, quel potere diventa decentralizzato. La comunità – o gli sviluppatori individuali – possono decidere di implementare filtri più severi o di allentarli. Nel caso di R1 1776, Perplexity ha deciso che i benefici di un modello senza censura superavano i rischi, e hanno avuto la libertà di prendere quella decisione e condividerne il risultato pubblicamente. È un esempio audace del tipo di sperimentazione che lo sviluppo dell’AI open-source consente.

Alex McFarland Γ¨ un giornalista e scrittore di intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup di intelligenza artificiale e pubblicazioni in tutto il mondo.