Pensándolo bien...
El interés en la estructura de las proteínas radica en su importancia central para comprender tanto las funciones biológicas básicas como las aplicaciones prácticas en medicina, farmacología y biotecnología.
La estructura de una proteína determina su función. Las proteínas son responsables de una amplia gama de funciones celulares y comprender su estructura es crucial para entender cómo realizan estas funciones. Por ejemplo, las enzimas, que son proteínas que catalizan reacciones bioquímicas, tienen sitios activos cuya forma y química son esenciales para su actividad catalítica. El conocimiento detallado de las estructuras proteicas es fundamental para el diseño racional de fármacos. Muchos fármacos actúan al unirse a proteínas específicas y modificar su actividad. Conocer la estructura tridimensional de estas proteínas permite diseñar moléculas que se ajusten de manera precisa y así ejerzan un efecto terapéutico deseado. Muchas enfermedades están asociadas con proteínas mal plegadas o que han sufrido alguna mutación. Comprender las estructuras proteicas puede ayudar a identificar las causas moleculares de estas enfermedades y a desarrollar tratamientos específicos. El conocimiento de la estructura de las proteínas permite a los científicos modificarlas para crear nuevas funciones. Esto tiene aplicaciones en biotecnología, como la producción de biofármacos, enzimas industriales y cultivos agrícolas. La estructura de las proteínas es fundamental para entender los procesos biológicos a nivel molecular. Esto incluye la replicación del ADN, la transcripción, la traducción, la señalización celular y el metabolismo. Las técnicas que identifican y cuantifican proteínas específicas y permiten dilucidar sus estructuras, se utilizan en el diagnóstico de enfermedades y en el control de la respuesta al tratamiento. El conocimiento de las estructuras proteicas es importante para el desarrollo de terapias génicas y celulares, donde se modifican genes o se utilizan células para tratar enfermedades. La estructura de las proteínas es una pieza clave para entender la biología a nivel molecular y tiene implicaciones directas en la salud humana, el desarrollo de nuevos medicamentos y la biotecnológica.
Antes del desarrollo de herramientas avanzadas, como las actualmente basadas en Inteligencia Artificial, por ejemplo, AlphaFold, la predicción de la estructura de las proteínas se realizaba principalmente a través de métodos experimentales y algunos métodos computacionales. La cristalografía de Rayos X ha sido el método más utilizado para determinar la estructura de las proteínas. Consiste en cristalizar la proteína, luego irradiarla con rayos X y analizar el patrón de difracción que se produce. Este patrón proporciona información sobre la densidad electrónica de la proteína, lo que permite deducir su estructura tridimensional. La RMN se utiliza para determinar la estructura de proteínas en solución. Funciona detectando las señales de los núcleos atómicos en un campo magnético y puede proporcionar información detallada sobre la estructura y la dinámica de las proteínas. La crio-microscopía electrónica (Crio-EM), se ha vuelto cada vez más popular para determinar estructuras de grandes complejos proteicos. Implica congelar las proteínas en su estado natural y luego usar un microscopio electrónico para registrar imágenes de la muestra congelada desde diferentes ángulos, construyendo una imagen tridimensional.
Desde el punto de vista teórico, el tratamiento de modelado por homología o modelado comparativo, se ha empleado cuando ya es conocida la estructura tridimensional de una proteína y se puede usar esa información para predecir la estructura de una nueva proteína. Este proceso implica alinear la secuencia de aminoácidos de la proteína desconocida con una o más estructuras conocidas y modelar la estructura desconocida basándose en esta alineación. Los métodos Ab Initio y de plegamiento de proteínas, intentan predecir la estructura de la proteína exclusivamente a partir de su secuencia de aminoácidos, sin utilizar estructuras conocidas como referencia. Estos enfoques son computacionalmente intensivos y han sido menos precisos que otros métodos. Algunos métodos se centraban en predecir aspectos de la estructura secundaria de las proteínas, como hélices alfa y hojas beta, a partir de la secuencia de aminoácidos. En todo caso diversas bases de datos y herramientas bioinformáticas se han utilizado para recopilar y analizar datos estructurales existentes, proporcionando información útil para la predicción de estructuras de proteínas.
Cada uno de estos métodos tiene sus fortalezas y limitaciones. Por ejemplo, la cristalografía de rayos X y la RMN requieren una gran cantidad de proteína pura y pueden ser procesos largos y costosos. Los métodos computacionales, por otro lado, han estado limitados por la precisión y la capacidad de modelar interacciones complejas dentro de las proteínas.
Con la llegada de herramientas avanzadas de IA, la predicción de estructuras de proteínas ha entrado en una nueva era, donde es posible obtener predicciones rápidas y precisas con menos dependencia de métodos experimentales intensivos en recursos. Un ejemplo concreto y notable del uso de la Inteligencia Artificial (IA) para resolver problemas matemáticos complejos es el proyecto AlphaFold desarrollado por DeepMind, una subsidiaria de Alphabet (la compañía matriz de Google). Aunque AlphaFold se centra principalmente en el ámbito de la Biología, su enfoque se basa en principios matemáticos y computacionales y es un excelente ejemplo de cómo la IA puede abordar problemas complejos de una manera que va más allá de los métodos tradicionales.
Como hemos introducido, la predicción de la estructura tridimensional de las proteínas a partir de su secuencia de aminoácidos ha sido un desafío significativo en la bioinformática y la biología estructural. Este problema es intrínsecamente matemático, en su subsuelo, ya que implica entender cómo las secuencias de aminoácidos se pliegan en estructuras 3D complejas. En el caso concreto de la herramienta AlphaFold, utiliza técnicas avanzadas de aprendizaje profundo, específicamente redes neuronales, para predecir la estructura de las proteínas. Aprendiendo de un gran conjunto de datos de estructuras de proteínas conocidas, el sistema puede predecir la estructura tridimensional de una nueva proteína con una precisión sorprendente. Ha tenido un gran impacto en el campo de la biología estructural, ofreciendo nuevas posibilidades para el entendimiento de enfermedades y el desarrollo de fármacos. Este es un claro ejemplo de cómo la IA no solo acelera un proceso existente, sino que también proporciona profundidad que antes no eran posibles.
La predicción de la estructura tridimensional, comienza con la secuencia de aminoácidos de la proteína, que es básicamente una cadena larga de unidades moleculares (aminoácidos) que definen la proteína. Esta secuencia se determina mediante técnicas de secuenciación genética. Se utiliza una base de datos de estructuras de proteínas previamente resueltas, como la Protein Data Bank (PDB), para comparar y entender cómo ciertas secuencias de aminoácidos se correlacionan con estructuras específicas. Si una proteína similar ya ha sido estructurada, se puede utilizar modelado por homología. Esto implica tomar la estructura conocida y modificarla para adaptarse a la nueva secuencia de aminoácidos, asumiendo que las secuencias similares tendrán estructuras similares. Para las proteínas sin estructuras conocidas similares, se utilizan técnicas experimentales como la cristalografía de rayos X, la resonancia magnética nuclear (RMN) o la criomicroscopía electrónica. Estos métodos pueden determinar directamente la estructura 3D de una proteína, pero son costosos y requieren mucho tiempo. Entra en juego la IA y otros métodos computacionales, cuando se utilizan algoritmos para predecir cómo una cadena de aminoácidos se pliega en una estructura 3D. Estos algoritmos pueden basarse en principios físicos (como la minimización de la energía) o en el aprendizaje a partir de estructuras ya conocidas. Los sistemas como AlphaFold, utilizan el aprendizaje profundo para predecir la estructura de las proteínas. Entrenan redes neuronales con grandes cantidades de datos de estructuras de proteínas conocidas y luego utilizan estas redes para predecir cómo se pliegan nuevas secuencias de aminoácidos. Una vez que se tiene una estructura predicha, es crucial validarla experimentalmente. Esto puede implicar comparar la estructura predicha con datos experimentales o usar la estructura predicha para realizar experimentos que confirmen su validez. Este proceso es un ejemplo de cómo la biología estructural se ha beneficiado enormemente de los avances en bioinformática y tecnologías computacionales, especialmente con la aplicación de la inteligencia artificial y el aprendizaje automático. Estos métodos han aumentado la velocidad y la precisión con la que podemos predecir las estructuras de las proteínas, lo que tiene implicaciones importantes en áreas como el diseño de fármacos y la comprensión de enfermedades.
AlphaFold utiliza un enfoque de aprendizaje profundo, entrenando su red neuronal con una gran cantidad de estructuras de proteínas conocidas. Luego, aplica este conocimiento para predecir la estructura de nuevas proteínas basándose en su secuencia de aminoácidos. La capacidad para predecir rápidamente estructuras de proteínas con alta precisión tiene un enorme potencial para acelerar la investigación en múltiples campos, incluyendo el diseño de nuevos medicamentos, la comprensión de enfermedades y la ingeniería de enzimas para aplicaciones industriales y ambientales. Ha sido reconocido por su contribución significativa a la ciencia. En la Critical Assessment of Structure Prediction (CASP), una competición bienal para evaluar herramientas de predicción de estructuras de proteínas, AlphaFold ha logrado una calificación sobresaliente, superando a otros métodos. Por cierto, la empresa que la soporta, DeepMind ha hecho públicas las predicciones de estructuras de proteínas de AlphaFold, proporcionando acceso a la comunidad científica mundial a estos datos valiosos, lo que facilita y acelera la investigación en diversas áreas de la biología y la medicina. Es un hito en la aplicación de la inteligencia artificial a problemas complejos en biología y ha abierto nuevas vías para la investigación científica y el desarrollo tecnológico en este campo.
Hasta hoy no disponemos de una verdadera Inteligencia Artificial General (AGI, por sus siglas en inglés), ni siquiera en una forma incipiente. La AGI se refiere a un tipo de inteligencia artificial que tiene la capacidad de entender, aprender y aplicar su inteligencia a cualquier problema, de manera similar a como lo haría un humano. Los desarrollos actuales en IA aún no han alcanzado este nivel de versatilidad y adaptabilidad. Los sistemas de IA actuales, incluyendo los más avanzados, son ejemplos de lo que se llama «Inteligencia Artificial Estrecha» o «IA específica de la tarea». Estos sistemas están diseñados para realizar tareas específicas y no poseen la capacidad general de razonamiento y adaptación que caracterizaría a una AGI.
La IA actual es altamente especializada. Por ejemplo, un sistema de IA diseñado para jugar ajedrez no puede, sin una extensa reprogramación, diagnosticar enfermedades médicas o conducir un automóvil. Mientras que los sistemas de IA actuales pueden aprender dentro de su dominio específico (por ejemplo, reconocimiento de imágenes o procesamiento de lenguaje), carecen de la capacidad de transferir ese aprendizaje a dominios totalmente distintos. La AGI implicaría un nivel de comprensión y autoconsciencia que ningún sistema actual de IA posee. La IA actual no «entiende» las tareas que realiza en el sentido humano de comprensión; simplemente procesa datos según su programación. Una AGI sería capaz de interactuar con una gama mucho más amplia de entornos y situaciones, ajustándose y aprendiendo de manera autónoma, mientras que la IA actual está limitada a entornos y tareas predefinidas.
A pesar de que aún estamos lejos de alcanzar una verdadera AGI, hay avances continuos en el campo de la IA que podrían ser pasos en esa dirección. Estos incluyen mejoras en el aprendizaje por refuerzo, algoritmos de aprendizaje no supervisado y el desarrollo de sistemas que pueden realizar múltiples tareas. Sin embargo, estos sistemas todavía están muy lejos de la flexibilidad y adaptabilidad generalizadas de una AGI. Además, la búsqueda de AGI presenta no solo desafíos técnicos sino también importantes consideraciones éticas y de seguridad. A medida que la tecnología avanza, será crucial abordar estas cuestiones para asegurar que cualquier avance hacia la AGI se realice de manera responsable y segura.
Un ejemplo concreto y notable del uso de la Inteligencia Artificial (IA) para resolver problemas matemáticos complejos es el relatado de predicción de la estructura de proteínas. Aunque AlphaFold se centra principalmente en la biología, su enfoque se basa en principios matemáticos y computacionales y es un excelente ejemplo de cómo la IA puede abordar problemas complejos de una manera que va más allá de los métodos tradicionales.