Salud
Algoritmos utilizados por empresas como Netflix podrían descifrar el lenguaje biológico de las enfermedades neurodegenerativas

Los potentes algoritmos utilizados por empresas como Netflix, Facebook y Amazon podrían tener importantes implicaciones en la atención médica. Han demostrado la capacidad de predecir el lenguaje biológico del cáncer y otras enfermedades neurodegenerativas como el Alzheimer.
Esta iniciativa fue emprendida por académicos del St. John’s College, Universidad de Cambridge, quienes alimentaron con grandes cantidades de datos producidos durante décadas a un modelo de lenguaje de computadora. El objetivo era ver si la inteligencia artificial (IA) podría realizar descubrimientos más avanzados que los humanos, y encontraron justo eso con la capacidad de la tecnología para descifrar el lenguaje biológico.
El estudio se publicó en la revista científica PNAS, titulado “Aprendiendo la gramática molecular de los condensados de proteínas a partir de determinantes de secuencia y embeddings.” Según los expertos, podría utilizarse para “corregir los errores gramaticales dentro de las células que causan la enfermedad.”
El profesor Tuomas Knowles es el autor principal del documento y miembro del St. John’s College.
“Incorporar la tecnología de aprendizaje automático en la investigación sobre enfermedades neurodegenerativas y cáncer es un cambio total. En última instancia, el objetivo será utilizar la inteligencia artificial para desarrollar medicamentos dirigidos para aliviar dramáticamente los síntomas o para prevenir la demencia por completo”.
Algoritmos potentes
Los algoritmos de aprendizaje automático utilizados por empresas como Netflix y Facebook hacen predicciones muy educadas sobre los consumidores y qué harán a continuación. Esto es lo que sucede cuando Netflix recomienda una nueva película o Facebook recomienda un nuevo amigo. Los asistentes de voz como Alexa y Siri pueden reconocer a las personas de inmediato y responder.
La Dra. Kadi Liis Saar es la autora principal del documento y miembro de investigación del St. John’s College. Utilizó una tecnología similar para entrenar un modelo de lenguaje a gran escala, que tenía como objetivo identificar qué sucede con las proteínas durante la enfermedad.
“El cuerpo humano es el hogar de miles y miles de proteínas y los científicos aún no conocen la función de muchas de ellas. Le pedimos a una red neuronal basada en un modelo de lenguaje que aprendiera el lenguaje de las proteínas”, dijo.
“Específicamente, le pedimos al programa que aprendiera el lenguaje de los condensados biomoleculares de cambio de forma — gotas de proteínas encontradas en las células — que los científicos realmente necesitan entender para descifrar el lenguaje de la función y la disfunción biológica que causan el cáncer y las enfermedades neurodegenerativas como el Alzheimer. Encontramos que podía aprender, sin que se le dijera explícitamente, lo que los científicos ya han descubierto sobre el lenguaje de las proteínas durante décadas de investigación”.
Los científicos creen que hay varios cientos de enfermedades neurodegenerativas, siendo las más comunes el Alzheimer, la enfermedad de Parkinson y la enfermedad de Huntington. El Alzheimer afecta a 50 millones de personas en todo el mundo, y durante la enfermedad, las proteínas forman grumos y matan células nerviosas sanas.
Condensados de proteínas y tecnología de PNL
Con un cerebro sano, estas masas de proteínas pueden eliminarse de manera efectiva. Según hallazgos más recientes, los científicos ahora creen que algunas proteínas desordenadas forman condensados, que son gotas líquidas de proteínas. Estos no tienen una membrana y se fusionan libremente entre sí, y pueden formarse y reformarse.
“Los condensados de proteínas han atraído recientemente mucha atención en el mundo científico porque controlan eventos clave en la célula, como la expresión genética — cómo se convierte nuestro ADN en proteínas — y la síntesis de proteínas — cómo las células producen proteínas”, dijo el profesor Knowles.
“Cualquier defecto conectado con estas gotas de proteínas puede llevar a enfermedades como el cáncer. Esto es por qué incorporar la tecnología de procesamiento de lenguaje natural en la investigación sobre los orígenes moleculares de la disfunción de las proteínas es vital si queremos poder corregir los errores gramaticales dentro de las células que causan la enfermedad”, continuó.
“Alimentamos al algoritmo con todos los datos que se tienen sobre las proteínas conocidas para que pudiera aprender y predecir el lenguaje de las proteínas de la misma manera que estos modelos aprenden sobre el lenguaje humano y cómo WhatsApp sabe cómo sugerir palabras para que las use”, dijo la Dra. Saar.
“Luego pudimos preguntarle sobre la gramática específica que lleva a que solo algunas proteínas formen condensados dentro de las células. Es un problema muy desafiante y desbloquearlo nos ayudará a aprender las reglas del lenguaje de la enfermedad”, continuó la Dra. Saar.
Los principales impulsores detrás de este avance en la tecnología son la creciente cantidad de datos disponibles, una mayor potencia de cómputo y avances técnicos. El aprendizaje automático tiene el potencial de transformar dramáticamente la investigación en estas áreas, permitiendo descubrimientos que nunca podrían haber sido predichos.
Según la Dra. Saar, “El aprendizaje automático puede estar libre de las limitaciones de lo que los investigadores creen que son los objetivos para la exploración científica y significará que se encontrarán nuevas conexiones que aún no hemos concebido. Es realmente muy emocionante”.
La nueva red está disponible para investigadores de todo el mundo, y una cantidad creciente de científicos se están involucrando.












