Pensándolo bien...
Todo un síntoma el hecho de que estemos discutiendo en estas latitudes el interés o no de la irrupción de la IA en el sistema educativo, incluido el universitario, mientras que ya ha alcanzado protagonismo en los Nobel. Indicador de que no es nada reciente, por supuesto de que es útil y efectivo y de que es estelar su aportación. Induce a la reflexión e ilumina los debates, algunos estériles y posturales de un sistema que puede estar agonizando de no dar pasos decisivos y decididos en los foros oportunos.
El Nobel en Química 2024 ha recaído en Baker, Hassabis y Jumper, por descifrar la estructura de las proteínas. Un 50% del premio corresponde a Baker, director del Institute for Protein Design de la Universidad de Washington. Su aportación consiste es ser el creador de un programa, RoseTTAFold, tan reciente como que fue lanzado en 2021. Este software ha revolucionado la biología estructural, ya que es capaz de predecir con alta precisión la estructura tridimensional de proteínas a partir de su secuencia de aminoácidos. Esto es clave para entender cómo funcionan las proteínas y para acelerar el descubrimiento de nuevos fármacos, ya que la estructura de una proteína determina su función en los organismos. Además de su capacidad para predecir estructuras de proteínas ya existentes, RoseTTAFold tiene la capacidad única de diseñar nuevas proteínas desde cero. Esto abre la puerta a aplicaciones como la creación de proteínas con funciones específicas para biotecnología, medicina o incluso para resolver problemas ambientales, como la descomposición de plásticos.
El desarrollo de RoseTTAFold fue impulsado en parte por el éxito de AlphaFold de DeepMind y ambos programas han transformado un campo que durante mucho tiempo fue un reto para los científicos. Sin embargo, RoseTTAFold destaca por su enfoque modular y su capacidad para manejar interacciones de proteínas y complejos más grandes, lo que le permite diseñar nuevas proteínas con propiedades específicas.
Una de las principales áreas donde RoseTTAFold ha mostrado gran potencial es en el diseño de proteínas terapéuticas que puedan unirse a moléculas específicas dentro del cuerpo humano, como por ejemplo las proteínas que inhiben o bloquean la actividad de virus, bacterias o proteínas defectuosas relacionadas con enfermedades genéticas. Un ejemplo concreto es el diseño de inhibidores de proteínas virales, como aquellas que pueden bloquear el ciclo de vida del virus SARS-CoV-2, causante de la COVID-19. Al diseñar proteínas que se unan y neutralicen partes críticas del virus, RoseTTAFold puede generar nuevas proteínas que actúan como terapias altamente específicas y efectivas.
El proceso comienza con una secuencia de aminoácidos, dado que cada proteína está compuesta por una secuencia de aminoácidos, que son como las "piezas" básicas. Para una proteína existente, la secuencia de aminoácidos puede ser conocida o determinada a partir del código genético. Si estamos creando una proteína nueva, se parte de una secuencia completamente original o modificada con el fin de lograr una función deseada, por ejemplo, una proteína que se una a una región específica del virus SARS-CoV-2. Pero la secuencia de aminoácidos es solo el principio. Una vez que esta secuencia se pliega en una forma tridimensional, es cuando adquiere su función biológica. Las proteínas pueden plegarse de formas complejas y la clave para su función es esta estructura 3D. RoseTTAFold predice cómo una secuencia dada de aminoácidos se plegará en una estructura tridimensional precisa, lo cual es fundamental para entender cómo interactuará con otras moléculas.
Imagen creada con ayuda de ChatGPT con DALL-E
Si estamos diseñando una proteína terapéutica, RoseTTAFold también puede simular cómo esta nueva proteína interactuará con su objetivo, por ejemplo, con una proteína viral o una célula humana. Esto es crítico para garantizar que la nueva proteína diseñada se una específicamente al objetivo que queremos neutralizar, sin interferir con otras funciones biológicas. Pero RoseTTAFold no solo predice la estructura, sino que también permite iterar el diseño. Si la primera versión de la proteína diseñada no se pliega correctamente o no se une de manera eficiente a su objetivo, el modelo puede ajustar la secuencia de aminoácidos y probar nuevas versiones hasta obtener la más eficiente. Esto reduce drásticamente el tiempo que normalmente exigiría diseñar y probar nuevas proteínas en el laboratorio. Una vez diseñada una proteína mediante RoseTTAFold, se sintetiza en el laboratorio y se prueba en experimentos in vitro o in vivo para confirmar que la proteína tiene la actividad terapéutica deseada. Gracias a la alta precisión de las predicciones de RoseTTAFold, muchas veces la primera versión diseñada puede ser bastante cercana a lo óptimo, lo que minimiza las rondas de optimización.
Un ejemplo ilustrativo de aplicación lo encontramos en el COVID-19. Un equipo de investigación utilizó RoseTTAFold para diseñar proteínas que se unen al dominio de la proteína espiga del SARS-CoV-2, bloqueando así su capacidad para infectar células humanas. Este tipo de diseño de proteínas abre nuevas vías para el desarrollo de tratamientos antivirales que pueden adaptarse rápidamente a nuevas variantes de virus o a patógenos emergentes.
En suma, RoseTTAFold acelera enormemente el proceso de diseño de proteínas al proporcionar predicciones altamente precisas sobre cómo se plegarán las proteínas y cómo interactuarán con otras moléculas. Esto tiene un impacto directo en la biotecnología y la medicina, al permitir el desarrollo rápido de terapias personalizadas y nuevas soluciones para combatir enfermedades. Otros campos son susceptibles de su impacto como el medioambiente o la energía.
El otro 50% de la distinción ha recaído conjuntamente en Demis Hassabis y John Michael Jumper investigadores de la empresa británica DeepMind, propiedad de Google. Se premia el empleo de la IA en el aprendizaje profundo para la predicción de la estructura tridimensional de las proteínas. Esta distinción se refiere específicamente a su trabajo en el desarrollo de AlphaFold, una herramienta de IA que ha resuelto uno de los grandes desafíos de la biología estructural. AlphaFold, lanzado en 2020, utiliza el aprendizaje profundo para predecir con alta precisión la estructura tridimensional que adoptará una proteína a partir de su secuencia de aminoácidos. Este problema, conocido como el “problema del plegamiento de proteínas”, había sido un reto sin resolver durante más de 50 años. La estructura de una proteína determina su función, por lo que conocerla es clave para comprender y manipular procesos biológicos, diseñar nuevos medicamentos y mejorar nuestra capacidad para tratar enfermedades.
AlphaFold utiliza grandes cantidades de datos de secuencias y estructuras de proteínas conocidas para "aprender" cómo se pliegan las proteínas. A través de redes neuronales y métodos avanzados de aprendizaje atutomático, es capaz de hacer predicciones extremadamente precisas de la estructura de proteínas desconocidas en cuestión de horas o días, lo que anteriormente podría haber tomado años mediante experimentos de laboratorio.
Así funciona el enfoque de DeepMind. AlphaFold está basado en redes neuronales profundas, un tipo de inteligencia artificial “inspirada” en el funcionamiento del cerebro. Estas redes son capaces de aprender patrones complejos a partir de grandes cantidades de datos, como las relaciones entre secuencias de aminoácidos y las formas tridimensionales resultantes. El equipo de AlphaFold entrenó su modelo con datos de secuencias y estructuras de proteínas disponibles en bases de datos públicas, como el Protein Data Bank (PDB), que contiene miles de estructuras de proteínas obtenidas experimentalmente. A partir de estos datos, el modelo aprendió a identificar cómo ciertas secuencias tienden a plegarse en formas tridimensionales específicas. AlphaFold predice la distancia entre pares de aminoácidos en una proteína y las probabilidades de que adopten ciertos ángulos y conformaciones. Estos datos permiten reconstruir una estructura tridimensional plausible a partir de una secuencia de aminoácidos.: Una vez que la red neuronal ha hecho una predicción preliminar, AlphaFold utiliza técnicas de optimización para refinar la estructura, simulando cómo los átomos de la proteína se organizan en el espacio tridimensional. En 2020, AlphaFold fue evaluado en el concurso bienal CASP (Critical Assessment of Structure Prediction), que evalúa los avances en la predicción de la estructura de proteínas. AlphaFold mostró una precisión sin precedentes, resolviendo estructuras con una precisión comparable a métodos experimentales como cristalografía de rayos X o microscopía crioelectrónica, lo que fue considerado un "momento de cambio" para la biología.
El impacto de AlphaFold es enorme. Antes de esta herramienta, los científicos solo conocían la estructura de una pequeña fracción de los millones de proteínas que existen en la naturaleza. Con AlphaFold, ahora es posible predecir estructuras para prácticamente cualquier proteína de manera rápida y precisa, lo que tiene aplicaciones directas en el descubrimiento de fármacos, ya que al conocer la estructura de proteínas relacionadas con enfermedades, se puede diseñar con mayor precisión fármacos que interactúen con estas proteínas de manera específica. AlphaFold está ayudando a los químicos y biólogos a comprender mejor las funciones de proteínas hasta ahora no caracterizadas, lo que puede abrir nuevas áreas de investigación. Esta herramienta puede facilitar el diseño de proteínas con funciones específicas, para aplicaciones en biotecnología, biomedicina y otras áreas industriales.
El trabajo de Demis Hassabis y John Jumper con AlphaFold representa uno de los avances más significativos en la biología computacional en la última década y ha sido reconocido ampliamente por la comunidad científica, como se refleja en esta distinción que se les ha otorgado por su innovador uso de la inteligencia artificial para resolver problemas fundamentales en la biología.
El de la estructura tridimensional de las proteínas es un campo de investigación de largo recorrido. En la década de los setenta ya se andaba con intentos de predecir estructuras de proteínas a partir de secuencias de aminoácidos, pero era sumamente costoso y complicado. La irrupción de la IA, ha desbordado las previsiones y las expectativas, pues estamos hablando de desarrollos efectuados en los cinco últimos años. La incidencia es espectacular, dado que AlphaFold2 ha predicho la estructura de prácticamente los 200 millones de proteínas identificadas y se dice que lo usan más de dos millones de personas en 190 países. La proteómica se ve asistida por herramientas que permiten abordar cuestiones como la resistencia a antibióticos o la creación de enzimas con finalidades específicas. Podemos diseñar proteínas, lo cual tiene el beneficio potencial de afectar al desarrollo y estabilidad de la propia Humanidad
Tomemos nota: la IA irrumpe con ventaja en todos los campos y ¿por qué no? en el educativo. Una nueva alfabetización es precisa. Como vemos, algunos ya llegan al máximo. No hay tiempo que perder.
Sopa de letras: LA IA EN LOS NOBEL
Soluciones: MATERIA OSCURA