Intelligenza artificiale
L’AI ha simulato 500 milioni di anni di evoluzione – e ha creato una nuova proteina!
L’evoluzione ha perfezionato la vita a livello molecolare per miliardi di anni. Le proteine, i mattoni fondamentali della vita, si sono evolute attraverso questo processo per svolgere varie funzioni biologiche, dalla lotta alle infezioni alla digestione del cibo. Queste molecole complesse sono costituite da lunghe catene di aminoacidi disposti in sequenze precise che determinano la loro struttura e funzione. Mentre la natura ha prodotto un’eccezionale diversità di proteine, comprendere la loro struttura e progettare completamente nuove proteine è stata a lungo una sfida complessa per gli scienziati.
Le recenti avanzate nell’intelligenza artificiale stanno trasformando la nostra capacità di affrontare alcune delle sfide più significative della biologia. In precedenza, l’AI era utilizzata per prevedere come una data sequenza di proteine si sarebbe ripiegata e comportata – una sfida complessa a causa del vasto numero di configurazioni. Recentemente, l’AI ha fatto un passo avanti e può generare completamente nuove proteine su una scala senza precedenti. Questo traguardo è stato raggiunto con ESM3, un modello generativo multimodale progettato da EvolutionaryScale. A differenza dei sistemi di intelligenza artificiale convenzionali progettati per l’elaborazione del testo, ESM3 è stato addestrato per comprendere le sequenze di proteine, le strutture e le funzioni. Ciò che lo rende veramente notevole è la sua capacità di simulare 500 milioni di anni di evoluzione – un’impresa che ha portato alla creazione di una proteina fluorescente completamente nuova, qualcosa che non si è mai visto in natura.
Questo traguardo rappresenta un passo significativo verso la possibilità di rendere la biologia più programmabile, aprendo nuove possibilità per la progettazione di proteine personalizzate con applicazioni in medicina, scienza dei materiali e oltre. In questo articolo, esploriamo come funziona ESM3, cosa ha raggiunto e perché questo avanzamento sta ridefinendo la nostra comprensione della biologia e dell’evoluzione.
Conosciamo ESM3: l’AI che simula l’evoluzione
ESM3 è un modello linguistico multimodale addestrato per comprendere e generare proteine analizzando le loro sequenze, strutture e funzioni. A differenza di AlphaFold, che può prevedere la struttura di proteine esistenti, ESM3 è essenzialmente un modello di ingegneria delle proteine, che consente ai ricercatori di specificare requisiti funzionali e strutturali per progettare completamente nuove proteine.
Il modello possiede una profonda conoscenza delle sequenze di proteine, delle strutture e delle funzioni, nonché la capacità di generare proteine attraverso un’interazione con gli utenti. Questa capacità consente al modello di generare proteine che potrebbero non esistere in natura e che rimangono comunque biologicamente valide. La creazione di una nuova proteina fluorescente verde (esmGFP) è una dimostrazione impressionante di questa capacità. Le proteine fluorescenti, inizialmente scoperte nelle meduse e nei coralli, sono ampiamente utilizzate nella ricerca medica e nella biotecnologia. Per sviluppare esmGFP, i ricercatori hanno fornito a ESM3 le caratteristiche strutturali e funzionali chiave di proteine fluorescenti note. Il modello ha quindi raffinato iterativamente il design, applicando un approccio di ragionamento a catena di pensieri per ottimizzare la sequenza. Mentre l’evoluzione naturale potrebbe richiedere milioni di anni per produrre una proteina simile, ESM3 accelera questo processo per raggiungere il risultato in giorni o settimane.
Il processo di progettazione delle proteine guidato dall’AI
Ecco come i ricercatori hanno utilizzato ESM3 per sviluppare esmGFP:
- Prompting l’AI – Inizialmente, hanno inserito sequenze e strutture per guidare ESM3 verso caratteristiche correlate alla fluorescenza.
- Generazione di nuove proteine – ESM3 ha esplorato uno spazio vasto di sequenze potenziali per produrre migliaia di proteine candidate.
- Filtraggio e raffinamento – I design più promettenti sono stati filtrati e sintetizzati per test in laboratorio.
- Validazione in cellule viventi – Le proteine progettate dall’AI selezionate sono state espresse in batteri per confermare la loro fluorescenza e funzionalità.
Questo processo ha portato alla creazione di una proteina fluorescente (esmGFP) diversa da tutto ciò che esiste in natura.
Come esmGFP si confronta con le proteine naturali
Ciò che rende esmGFP straordinario è quanto sia lontana dalle proteine fluorescenti note. Mentre la maggior parte delle nuove proteine fluorescenti scoperte hanno variazioni leggere rispetto a quelle esistenti, esmGFP ha un’identità di sequenza del 58% rispetto al suo parente naturale più vicino. Evolutivamente, una tale differenza corrisponde a un tempo di divergenza di oltre 500 milioni di anni.
Per mettere questo in prospettiva, l’ultima volta che proteine con distanze evolutive simili sono emerse, i dinosauri non erano ancora apparsi e la vita multicellulare era ancora nelle sue fasi iniziali. Ciò significa che l’AI non ha solo accelerato l’evoluzione – ha simulato un intero nuovo percorso evolutivo, producendo proteine che la natura potrebbe non aver mai creato.
Perché questa scoperta è importante
Questo sviluppo rappresenta un passo significativo in avanti nell’ingegneria delle proteine e approfondisce la nostra comprensione dell’evoluzione. Simulando milioni di anni di evoluzione in soli giorni, l’AI sta aprendo le porte a nuove possibilità emozionanti:
- Scoperta più rapida di farmaci: Molti farmaci funzionano bersagliando proteine specifiche, ma trovare quelle giuste è lento e costoso. Le proteine progettate dall’AI potrebbero accelerare questo processo, aiutando i ricercatori a scoprire nuovi trattamenti più efficientemente.
- Nuove soluzioni in bioingegneria: Le proteine sono utilizzate in tutto, dalla rottura dei rifiuti di plastica alla rilevazione di malattie. Con la progettazione guidata dall’AI, gli scienziati possono creare proteine personalizzate per la salute, la protezione ambientale e anche nuovi materiali.
- AI come simulatore dell’evoluzione: Uno degli aspetti più intriganti di questa ricerca è che posiziona l’AI come simulatore dell’evoluzione piuttosto che come strumento di analisi. Le simulazioni evolutive tradizionali coinvolgono l’iterazione attraverso mutazioni genetiche, spesso richiedendo mesi o anni per generare candidati validi. ESM3, tuttavia, bypassa queste lente limitazioni prevedendo direttamente proteine funzionali. Questo cambio di approccio significa che l’AI potrebbe non solo imitare l’evoluzione ma attivamente esplorare possibilità evolutive al di là della natura. Date sufficienti risorse computazionali, l’evoluzione guidata dall’AI potrebbe scoprire nuove proprietà biochimiche che non sono mai esistite nel mondo naturale.
Considerazioni etiche e sviluppo responsabile dell’AI
Mentre i potenziali benefici dell’ingegneria delle proteine guidata dall’AI sono immensi, questa tecnologia solleva anche questioni etiche e di sicurezza. Cosa succede quando l’AI inizia a progettare proteine al di là della comprensione umana? Come possiamo assicurarci che queste proteine siano sicure per l’uso medico o ambientale?
Dobbiamo concentrarci sullo sviluppo responsabile dell’AI e su test approfonditi per affrontare queste preoccupazioni. Le proteine generate dall’AI, come esmGFP, dovrebbero subire test di laboratorio approfonditi prima di essere considerate per applicazioni nel mondo reale. Inoltre, i quadri etici per la biologia guidata dall’AI stanno essere sviluppati per garantire trasparenza, sicurezza e fiducia pubblica.
Il punto fondamentale
Il lancio di ESM3 è uno sviluppo vitale nel campo della biotecnologia. ESM3 dimostra che l’evoluzione non dovrebbe essere un processo lento e basato su prove ed errori. Comprimere 500 milioni di anni di evoluzione delle proteine in pochi giorni apre un futuro in cui gli scienziati possono progettare nuove proteine con incredibile velocità e precisione. Lo sviluppo di ESM3 significa che possiamo non solo utilizzare l’AI per comprendere la biologia, ma anche per ridefinirla. Questo traguardo ci aiuta ad avanzare nella nostra capacità di programmare la biologia allo stesso modo in cui programmiamo il software, sbloccando possibilità che stiamo solo iniziando a immaginare.








