Columnas
En una anterior columna publicada el 24 de septiembre de 2022 sobre inteligencia artificial comenté que muchos de sus procedimientos se basan en las redes neuronales artificiales. La importancia presente y futura de estos procedimientos es evidente y ha hecho que el término ‘inteligencia artificial’ haya sido elegido como expresión del año 2022 por la Fundación del Español Urgente.
Estas redes neuronales imitan el funcionamiento del cerebro humano y están formadas por distintas capas con numerosas »neuronas» artificiales. En cada una de estas neuronas se aplica un método estadístico denominado regresión logística que permite decidir sobre si un individuo pertenece a un grupo o no a partir de una serie de medidas (variables). Por ejemplo, podríamos usar medidas sobre un paciente (fiebre, edad, presión arterial, etc.) para decidir si tiene o no una enfermedad. Estas medidas se multiplican por unos pesos (coeficientes) que medirán su influencia en la decisión final y se suman, añadiendo un coeficiente constante. Unas variables tendrán un peso positivo y otras negativo. Si el resultado es mayor que cero se pronostica que el individuo está en el grupo, haciendo lo contrario si es negativo. Las clasificaciones con sumas cercanas a cero serán poco fiables. Para medir esta fiabilidad esa suma se introduce en la función logística que la transformará en un número entre uno (seguro que tiene la enfermedad) y cero (seguro que no la tiene).
Para »ajustar» los coeficientes debemos disponer de una muestra de entrenamiento con casos correctos de los dos grupos. Un algoritmo matemático resuelve el problema obteniendo los coeficientes óptimos. Se suele guardar una parte de la muestra inicial para comprobar cómo funciona este procedimiento en datos no usados para su construcción.
Lo mismo ocurre con la red neuronal formada por muchas capas de estas `neuronas’ con muchos coeficientes que deben ser ajustados por el procedimiento para obtener los mejores resultados posibles. Cada una de estas ‘neuronas’ nos dará un sí o un no y con todas esas capas el ordenador toma una decisión. Uno de los primeros ejemplos donde se aplicó este método permitió la lectura automática del código postal en cartas. Aquí el algoritmo »decide» qué es lo que cada neurona debe realizar para que al final podamos predecir qué dígito representa un determinado garabato en un sobre.
Este tipo de métodos se suelen denominar Aprendizaje Automático Supervisado ya que necesitan de una muestra correcta de casos de cada grupo. El principal problema de estos procedimientos es que las decisiones en cada neurona no tienen un sentido claro y, en algunas ocasiones, las decisiones tomadas por el algoritmo pueden ser absurdas. Se está investigando cómo solventar este problema.