Arquitecturas del Dato IA & ML
Redes Neuronales Auto Organizativas
Inteligencia Artificial Conexionista IIIntroducción
La década de los 80 había sido testigo de un continuo avance en el campo de la Inteligencia Artificial Conexionista. El modelo de clasificación multicapa, que había superado las críticas de Minsky y Papert en el 69, había demostrado su eficacia en diversas aplicaciones, abriendo nuevas vías para el procesamiento de información. Asimismo, las redes neuronales con base radial habían emergido como una herramienta poderosa para abordar problemas de aproximación de funciones y reconocimiento de patrones.
De hecho, dentro del terreno operacional, parecía que la creación de sistemas capaces de realizar tareas de clasificación y predicción se había resuelto en gran medida gracias a estos avances. Sin embargo, muchos problemas del mundo real requerían un enfoque diferente, uno que permitiera identificar la estructura y distribución de la información dentro de un espacio multidimensional. Esta necesidad de comprender las relaciones topológicas o incluso asociacionales entre los datos impulsó el desarrollo de un nuevo tipo de redes.
Las, así llamadas, redes Auto-Organizativas ofrecerían una solución a este desafío al proporcionar una representación del espacio de entrada capaz de preservar las relaciones vecinales dentro del espacio. A diferencia de los clasificadores multicapa, que se centraban en la asignación de etiquetas clasificativas, las redes topológicas buscaban descubrir la estructura intrínseca de los datos, revelando patrones y agrupaciones que pueden no ser evidentes a simple vista. Esta capacidad de auto-organización y aprendizaje no supervisado las convertiría en una herramienta valiosa para una amplia gama de aplicaciones.
En este artículo, exploraremos el diseño y funcionamiento de las Redes Auto-Organizativas que Kohonen desarrollaría allá por el año 1982, un tipo fundamental de red neuronal topológica. Analizaremos cómo estas redes logran mapear datos de alta dimensión a un espacio de baja dimensión, preservando la topología de los datos originales. Además, discutiremos las aplicaciones de este tipo de redes en diversos campos, destacando su utilidad en problemas de clustering, visualización de datos y asociación.
Redes Neuronales Auto Organizativas
Habían transcurrido casi cuatro décadas desde que McCulloch y Pitts concibieran su modelo de neurona artificial, un hito que había sentado las bases para el desarrollo de las redes neuronales. Desde entonces, los avances en Inteligencia Artificial Conexionista habían sido notables. Se habían desarrollado sistemas capaces de realizar clasificaciones y predicciones en espacios densamente poblados. Las redes neuronales multicapa, con su capacidad para aprender representaciones jerárquicas de los datos, habían demostrado ser particularmente efectivas en estas tareas. Y las soluciones basadas en funciones de activación con base radial parecían también haber dado sus frutos para responder con agilidad a ciertos tipos de problemas, tal como ya hemos discutido.
Sin embargo, parecía reconocerse que, muchos de los problemas del mundo real, exigían un marco de operación diferente, uno que fuera más allá de la simple clasificación o predicción. En este tipo de escenarios, el objetivo principal no era tanto asignar una etiqueta a un dato, sino comprender cómo se distribuyen los datos dentro de un espacio multidimensional. Esto implicaría identificar grupos o clusters que comparten características similares, así como descubrir las relaciones topológicas entre ellos.
Este modelo de operación, centrada en descubrir las estructuras de infoemación subyacentes, es lo que se conoce comúnmente como clusterización o agrupamiento. Como ya describimos en un artículo anterior, básicamente, se trata de una técnica que busca identificar patrones ocultos, organizándolos en grupos de tal manera que los datos dentro de un mismo grupo sean más similares entre sí que aquellos otros pertenecientes a diferentes grupos. De este modo, la clusterización se presenta como una técnica fundamental en el análisis, ya que permite extraer información valiosa de conjuntos de información complejos y descubrir relaciones que podrían pasar desapercibidas de otra manera. Para llevar todo esto a cabo se hace uso de modelos de aprendizaje no supervisados. Esto significa que, a diferencia de las técnicas supervisadas, que requieren un conjunto de datos etiquetados para entrenar un modelo, el agrupamuento opera sobre información no etiquetada, descubriendo la estructura inherente a la misma sin necesidad de una guía externa.
Las estructuras neuronales que Kohonen idearía en el año 1982 representarían, en este sentido, una solución innovadora para abordar este tipo de problemas. Los Mapas Auto-Organizativos, también conocidos como Redes Topológicas de Kohonen, serían un tipo de red neuronal que utilizaría un modelo de aprendizaje no supervisado para encontrar asociaciones de datos de alta dimensión a un espacio de baja dimensión, generalmente bidimensional. Esta asociación preservaría las relaciones topológicas entre los elementos, lo que permitiría visualizar y comprender la estructura de los datos de una manera intuitiva.
Un Mapa Auto-Organizativo de Kohonen constaría de una capa de entrada y una capa de salida, donde las neuronas de la capa de salida estarían dispuestas en una cuadrícula o retícula. Cada neurona de la capa de salida estaría asociada con un vector de peso, que tendría la misma dimensionalidad que los datos de entrada. El proceso de aprendizaje de la red se basaría en la competencia entre las neuronas de la capa de salida para responder a un dato de entrada dado. Cuando se presentase un dato de entrada a la red, se calcularía la distancia entre este dato y el vector de peso de cada neurona de la capa de salida. La neurona con el vector de peso más cercano al dato de entrada se establecería como la neurona activa de manera que los vectores de peso de esta neurona junto con sus vecinas se actualizarían para acercarse al dato de entrada. Este mecanismo provocaría que estas neuronas fueran más sensibles a datos similares en el futuro.
Este proceso de aprendizaje se repitiría para cada dato de entrada en el conjunto de entrenamiento, ajustando gradualmente los vectores de peso de las neuronas de la capa de salida. A medida que avanzara el entrenamiento, las neuronas de la capa de salida se organizarían de tal manera que representaran diferentes regiones del espacio de entrada preservando las relaciones topológicas entre los datos. Los datos similares se asociarían a aquellas neuronas cercanas en la cuadrícula de salida, mientras que los datos diferentes lo harían con las neuronas más alejadas.
En comparación con otras redes neuronales, como los clasificadores multicapa, los Mapas Auto-Organizativos de Kohonen parecían ofrecer varias ventajas. En primer lugar, su capacidad de aprendizaje no supervisado los hacía ideales para explorar datos no etiquetados y descubrir patrones ocultos. En segundo lugar, su capacidad para mapear datos de alta dimensión a un espacio de baja dimensión facilitaría la visualización y comprensión de datos complejos. Además, su capacidad para preservar las relaciones topológicas entre los datos permitiría identificar agrupaciones y relaciones entre los datos que podrían pasar desapercibidas con otros métodos.
Redes Neuronales Auto Organizativas en Acción
Como acabamos de explicar, las redes Auto-Organizativas demostrarían su capacidad para abordar una amplia gama de problemas que van más allá de la simple clasificación o predicción. En efecto, estas redes aplicarían técnicas de aprendizaje no supervisado para descubrir la estructura inherente a los datos, revelando patrones y relaciones que pueden ser de gran utilidad en diversos contextos. Su capacidad para asociar datos de alta dimensión a un espacio de baja dimensión facilitaría la visualización y comprensión de datos complejos, lo que permitiría obtener información valiosa de manera intuitiva.
Además, este tipo de redes aprovecharían las relaciones topológicas que se dan entre los datos dentro del espacio multidimensional. Esto significa que se preservaría la estructura de los datos originales al asociarlos a un espacio de menor dimensión, lo que permitiría identificar grupos de datos similares y relaciones entre ellos lo cual resulta particularmente útil en problemas donde la estructura de los datos es importante, como en el análisis de redes sociales o la segmentación de imágenes.
El uso de estructuras topológicas de Kohonen resultaría asi de gran utilidad en muchos tipos de problemas, que abarcan desde el agrupamuento y la asociación hasta la visualización de datos y la reducción de dimensionalidad. En problemas de agrupación, las redes Auto-Organizativas podrían utilizarse para agrupar datos similares, lo que facilita la identificación de patrones y la toma de decisiones. En problemas de asociación, por el contrario, este tipo de soluciones permitirían descubrir relaciones entre diferentes variables, lo que permite predecir el comportamiento de los datos. En general, es posible resumir en los siguientes puntos las características de estos problemas.
-
Datos no etiquetados. Una característica fundamental de estos problemas reside en que los datos de entrada carecen de etiquetas o categorías predefinidas, lo que implica que no se dispone de un conocimiento a priori sobre la clase o grupo al que pertenece cada dato. El objetivo primordial no es, por lo tanto, asignar una clase conocida a cada dato, como ocurre en el aprendizaje supervisado, sino descubrir la estructura inherente a los datos mismos, explorando sus propiedades intrínsecas para identificar patrones y agrupaciones naturales.
-
Descubrimiento de la estructura subyacente. El propósito principal en este tipo de problemas es revelar patrones, agrupaciones o relaciones ocultas dentro de los datos, que no son evidentes a simple vista. Se busca comprender cómo se organizan los datos de forma natural, sin la imposición de categorías externas o predefinidas, permitiendo que la propia distribución y las características de los datos determinen su organización y estructura. Este enfoque permite obtener información valiosa sobre las interdependencias y similitudes entre los datos.
-
Importancia de las relaciones topológicas. Las relaciones espaciales o de proximidad entre los datos son cruciales y contienen información valiosa que debe ser preservada y analizada. La forma en que los datos se distribuyen y se relacionan entre sí en un espacio multidimensional, ya sea este espacio físico o abstracto, refleja similitudes y diferencias significativas. Comprender estas relaciones topológicas permite capturar la estructura subyacente de los datos y facilita la identificación de patrones y agrupaciones relevantes.
-
Utilidad de la visualización de los datos. La representación visual de los datos emerge como una herramienta clave para facilitar la comprensión de su estructura y las complejas relaciones que se establecen entre ellos. Las técnicas de visualización permiten explorar patrones de manera intuitiva, identificar clusters o grupos de datos similares, y comunicar los hallazgos de manera efectiva a otros usuarios o analistas. La capacidad de representar datos multidimensionales en un espacio de menor dimensión, conservando sus características esenciales, es fundamental para extraer conocimiento significativo.
Algunos ejemplos de problemas donde las redes Auto-Organizativas son útiles incluyen la segmentación de clientes en marketing, la detección de anomalías en datos financieros, la clasificación de documentos en procesamiento del lenguaje natural y la visualización de datos genómicos en bioinformática. En todos estos casos, las redes Auto-Organizativas permiten extraer información valiosa de los datos y obtener una comprensión más profunda de su estructura.
Este tipo de escenarios entra en contrapunto con problemas típicos de clasificación o predicción como el reconocimiento de imágenes o la predicción de series temporales, donde lo que se pretende es asignar una etiqueta a un dato o predecir su valor futuro. En estos problemas, el objetivo principal no es descubrir la estructura subyacente de los datos, sino aprender a mapear los datos de entrada a las etiquetas o valores de salida correspondientes.
Conclusiones
A lo largo de este artículo, hemos descrito las estructuras topológicas de red neuronal que Kohonen plantearía en 1982. Se trataba de idear soluciones capaces de hacer frente a problemas de clusterización, pero también de ser pertinentes para aprender relaciones de asociación entre los datos. Aunque muchos de los problemas más vigentes están más relacionados con la clasificación o la predicción o incluso con la generación de datos sintéticos, como veremos en series posteriores, lo cierto es que los problemas de clasificación o asociación son fundamentales en muchos campos.
Las Redes Auto-Organizativas de Kohonen, con su capacidad para mapear datos de alta dimensión a un espacio de baja dimensión, ofrecen una herramienta poderosa para visualizar y comprender la estructura de los datos. Su enfoque en el aprendizaje no supervisado las distingue de otras arquitecturas de redes neuronales, permitiéndoles descubrir patrones y relaciones inherentes a los datos sin necesidad de etiquetas predefinidas. Esta característica las hace particularmente valiosas en exploraciones de datos y en la identificación de segmentos o grupos dentro de conjuntos de datos complejos.
Además, la preservación de las relaciones topológicas en la asociación realizado por este tipo de redes es crucial en aplicaciones donde la vecindad y la proximidad de los datos son significativas. Por ejemplo, en el análisis de datos geográficos o en la modelización de redes sociales, la capacidad de las redes Auto-Organizativas para representar la cercanía de los puntos de datos en el espacio de entrada se traduce en una representación visual intuitiva de las relaciones entre entidades. Esta capacidad de visualizar la complejidad de los datos multidimensionales es una de las fortalezas clave de estas redes.
Si bien las redes neuronales profundas y otras arquitecturas han ganado prominencia en tareas como el reconocimiento de imágenes y el procesamiento del lenguaje natural, las Redes de Kohonen mantienen su relevancia en escenarios específicos. Su eficacia en la clusterización y la visualización las convierte en una herramienta complementaria valiosa en el conjunto de herramientas del científico de datos. La elección de la arquitectura de red adecuada depende, en última instancia, de la naturaleza del problema y los objetivos del análisis.
En el contexto más amplio de la Inteligencia Artificial, es importante reconocer la diversidad de arquitecturas de redes neuronales y sus respectivas fortalezas. Las Redes de Kohonen representan un enfoque distinto, inspirado en los principios de la auto-organización biológica, que ofrece una perspectiva única sobre el análisis de datos. Su estudio y aplicación continúan contribuyendo al avance del campo, enriqueciendo nuestra capacidad para extraer conocimiento de la información. En el artículo final que da cierre a esta serie, hablaremos de una última anatomía de arquitectura de red basada en el uso de operaciones convolucionales que resulta de gran utilidad en problemas de procesamiento de señales y visión artificial.