Javier Vélez Reyes - Artículos
Data & Inteligencia Artificial

Arquitecturas del Dato IA & ML

Redes Neuronales Relacionales

Inteligencia Artificial Conexionista III
Javier Vélez Junio 2024 9 mins

Introducción

Como explicamos en artículos anteriores, el desarrollo de redes neuronales profundas ya había marcado un hito significativo en el campo de la Inteligencia Artificial Conexionista demostrando su capacidad para aprender representaciones complejas de los datos y resolver problemas de caracter predictivo o clasificatorio en condiciones de no linealidad. Por su parte, las estructuras convolucionales que emergerían años después se mostrarían como una arquitectura potente y capaz para procesar grandes volumenes de datos con una estructura espacial inherente, transformando la forma en que se abordaban problemas de creciente complejidad.

Y es que este último tipo de arquitectura de red abriría la puerta para mirar a un nuevo espacio de problemas. Uno caracterizado por la presencia de fuertes dependencias entre los datos de entrada, ya fueran dentro del dominio espacial o temporal. La necesidad de abordar este tipo de problemas daría lugar a una nueva familia de redes neuronales que, años después, se conocería con el término de Redes Neuronales Estructurales y que estan siendo objeto de discusión a lo largo de esta serie.

En efecto, algunas de estas arquitecturas ya fueron discutidas en articulos anteriores. Las Redes Neuronales Recurrentes, por ejemplo, se mostraron capaces de atender a relaciones desarrolladas en la dimensión temporal, demostrando su eficacia en el procesamiento de secuencias de datos desarrolladas a lo largo del tiempo. Las Redes Neuronales Jerárquicas, por su parte, se mostraban optimas para procesar volúmenes de información con un marcado carácter de dependencia jerárquica, resultando útiles en tareas con datos estructurados por niveles.

Pero dentro de la familia de soluciones estructurales surgiría un último modelo de red conocido por el nombre de Redes Neuronales Relacionales. Se trataba de una solución que permitiría hacer frente a problemas que operaban con estructuras de información organizados en grafo, donde las relaciones entre los elementos son complejas y no pueden representarse fácilmente de forma secuencial o jerárquica. A lo largo de este último artículo de la serie, abordaremos precisamente este tipo de arquitectura de red, explorando sus fundamentos, sus aplicaciones y su impacto en el campo de la Inteligencia Artificial.

Redes Neuronales Relacionales

La Inteligencia Artificial Conexionista ya había logrado hacer frente a muchos tipos de problemas caracterizados en términos de la estructura de la información con la que operaban. En sus orígenes, las redes neuronales densamente conectadas habían resultado ser apropiadas para escenarios con arbitrariedad en el orden de entrada de los datos. Las redes recurrentes y jerarquicas, por su parte, se habían mostrado oportunas para hacer frente a otro tipo de problemas con una marcada relación de dependencia temporal o jerarquica dentro del espacio de información.

Sin embargo, aún quedaba un nuevo tipo de situaciones de interés que demandaban un modelo de solución conexionista. Se trataba de dar respuesta al espacio de problemas caracterizado por una estructura informacional general y abierta. Problemas donde los datos se relacionaban entre sí formando grafos de dependencia sin un marcado carácter secuencial ni jerárquico. Y es que, no en vano, este tipo de escenarios resultaba presentarse con alta recurrencia dentro del perímetro de soluciones de computación conexionista estructural que estamos recorriendo. Es por ese motivo que, allá por el año 2005 sugiría el desarrollo de las Redes Neuronales Relacionales de la mano de Franco Scarselli y su equipo.

Las Redes Neuronales Recurrentes, ideadas años atrás, ya habrían mostrado su competencia para procesar secuencias de datos linealmente ordenados al modelar oportunemente las dependencias temporales que de forma inherente se dan entre los datos de entrada para determinados tipos de problemas. Sin embargo, estas redes parecían presentar ciertas dificultades para capturar relaciones complejas de caracter no secuencial, donde el orden de los elementos no fuera un factor relevante.

Por su parte, las Redes Neuronales Jerárquicas, también desarrolladas tiempo atrás, parecían especializarse en el procesamiento de información estratificada en distintos niveles de abstracción donde las representaciones de alto nivel se construyen progresivamente a partir de componentes más simples. Esto las hacía especialmente eficaces en contextos donde los datos presentaran una fuerte organización estrutural o anidada. Pero igualmente, su enfoque imponía limitaciones importantes a la hora de capturar relaciones complejas y arbitrarias entre elementos del espacio de datos que no se ajustaran a una organización jerárquica explícita.

En contraste, las redes neuronales relacionales si que parecían ofrecer una oportunidad para representar y capturar las interconexiones que se dan de manera natural entre los elementos del espacio de datos de muchos tipos de problemas. Esto permitiría abordar problemas donde las relaciones son de naturaleza más general en los que la información se distribuye de manera no secuencial ni jerárquica, sino según patrones de conectividad entre nodos que pueden variar ampliamente.

En esencia, una Red Neuronal Relacional se presentaría como un modelo de Inteligencia Artificial Conexionista diseñado para operar sobre datos organizados en forma de grafo que constituiría el cuerpo de conocimiento general del problema. Este grafo estaría formado por un conjunto de nodos y aristas. A diferencia de otros tipos de redes, donde las conexiones entre las unidades de procesamiento son fijas, en este tipo de topología de red neuronal la estructura de la red se correspondería directamente con la estructura de grafo del espacio del problema.

Esta característica permitiría que la red se adaptara a la complejidad y variabilidad de las relaciones presentes en los datos, capturando toda aquella información que, de otra forma, se perdería en arquitecturas más rígidas. El funcionamiento de una red neuronal relacional implicaría la propagación de información a través del grafo, donde cada nodo actualizaría su estado en función de los estados de sus nodos vecinos y las relaciones que los conectan. Este proceso se repetiría iterativamente, permitiendo que la red capturase dependencias de largo alcance y razonase sobre la estructura global del problema.

El entrenamiento de una Red Neuronal Relacional se asemejaría bastante a la que se da en otros tipos de redes neuronales, utilizando un conjunto de datos etiquetados y un algoritmo de optimización para ajustar los parámetros de la red. Sin embargo, la estructura variable de la propia red requeriría técnicas de entrenamiento específicas, como el paso de mensajes, donde los nodos intercambiarían información para actualizar sus representaciones. Este proceso permitiría que la red aprendiera a extraer características relevantes de las relaciones entre los datos, mejorando su capacidad para realizar tareas como la clasificación, la predicción o la generación en espacios basados en grafos.

Las Redes Neuronales Relacionales representarían, de esta manera, un modelo de solución potente para el procesamiento de datos con estructuras complejas, abriendo nuevas vías para el desarrollo de sistemas de Inteligencia Artificial Conexionista más flexibles y capaces de razonar sobre las relaciones entre la información.

Redes Neuronales Relacionales en Acción

Junto con las Redes Neuronales Recurrentes y Las Redes Neuronales Jerárquicas, las Redes Neuronales Relacionales habían nutrido un marco de soluciones para hacer frente a problemas con un marcado carácter relacional entre los elementos dentro del espacio de datos de muchos problemas de aplicación vigente. En efecto, la creciente complejidad de los datos en escenarios reales de aquellos años de la decada del 2005 impulsaría el desarrollo de este tipo de redes. Y es que esta complejidad se manifestaría en la abundancia de información interconectada, donde las relaciones entre los datos serían tan importantes como los datos en sí mismos.

Muchos problemas no resueltos con las aproximaciones anteriores se caracterizaban por la presencia de una red de relaciones intrincadas entre las entidades, lo que requeriría de un enfoque más sofisticado para su captura y procesamiento. Y justo en este sentido, las redes relacionales serían las que ofrecerían una solución a este desafío, contribuyendo a la Inteligencia Artificial Conexionista con la capacidad de procesar toda esta información relacional no solo para descubrir patrones dentro de los datos sino para comprender el contexto y verdadero significado subyacente en las relaciones.

Este tipo de aproximación encontraba muchos tipos de problemas comunes que las Redes Relacionales eran capaces de resolver de manera efectiva. Un ejemplo se encontraría en el análisis de grandes redes sociales, donde se pretende identificar comunidades, predecir la propagación de información o recomendar conexiones entre usuarios. Aquí, las redes relacionales capturan las complejas interacciones entre los usuarios y los patrones de comunicación que se dan entre ellos. este conocimento permite realizar predicciones más precisas y ofrecer recomendaciones más relevantes en torno a las actividades de red.

Otro ejemplo, aparece al aplicar los modelos de Red Relacional en el campo de la química computacional, para predecir las propiedades de las moléculas o descubrir nuevas sustancias. Al modelar las relaciones entre los átomos y los enlaces químicos, las redes relacionales podrían predecir con mayor precisión el comportamiento de las moléculas y acelerar el proceso de descubrimiento de fármacos. Este es un perímetro de investigación muy próspero que, aún hoy en día, está generando importantes avances en investigación científica.

Las Redes Neuronales Relacionales también encuentran marco de actuación en la generación de razonamiento sintético sobre estructuras de conocimiento especializado. Dentro de este espacio, las Redes Relacionales permitirían modelar las relaciones entre conceptos y hechos, facilitando la inferencia y la toma de decisiones. Esta capacidad de razonamiento simbólico, combinada con el poder del aprendizaje automático, abriría nuevas posibilidades para el desarrollo de sistemas de inteligencia artificial que puedan comprender y manipular el conocimiento de manera más efectiva y eficaz. Llevado sobre el terreno pragmático, estas nuevas capacidades permitirían desde mejorar los sistemas de recomendación hasta el desarrollo de agentes inteligentes capaces de interactuar con el mundo de manera más natural e incluso, operando dentro del sector financiero, facilitarían la detección de fraudes y la gestión del riesgo

A la postre, el desarrollo de las Redes Neuronales Relacionales supondría un avance significativo de la Inteligencia Artificial Conexionista que abriría nuevas vías para el desarrollo de sistemas más robustos, flexibles y capaces de razonar sobre el mundo que nos rodea. Su capacidad para modelar relaciones complejas en escenarios relacionales reales permitiría superar las limitaciones de las arquitecturas anteriores, permitiendo hacer frente a problemas que antes se considerarían inalcanzables.

Conclusiones

A lo largo de este artículo, hemos descrito las redes neuronales relacionales, un tipo de arquitectura neuronal diseñada para operar sobre datos representados como grafos. Hemos explorado su estructura, funcionamiento y aplicaciones, destacando su capacidad para modelar relaciones complejas entre los elementos de un conjunto de datos.

Las redes neuronales relacionales de esta naturaleza se enmarcarían dentro de la familia de las redes estructurales, caracterizadas por adaptar su arquitectura a la estructura específica de los datos de entrada. En particular, las redes relacionales representarían un avance significativo con respecto a las arquitecturas tradicionales, como las redes densas profundas y las redes convolucionales, al permitir la captura y explotación de la información relacional presente en los datos de muchos tipos de problemas del mundo real.

En efecto, este tipo de redes se presentó como un modelo de solución de gran utilidad práctica para abordar una amplia gama de problemas, desde el análisis de redes sociales y la química computacional hasta el razonamiento sobre el conocimiento y el desarrollo de sistemas de recomendación. Su capacidad para procesar información compleja y estructurada convertiría a este tipo de arquitecturas de red neuronal en una aproximación valiosa para enfrentar muchos de los desafíos de computación a los que nos enfrentamos a día de hoy.

Y con este último artículo, hemos llegado al final de la revisión de la familia de Redes Neuronales Estructurales que hemos desarrollado a lo largo de esta serie, explorando las diferentes formas en que la arquitectura de una red neuronal puede adaptarse en favor de la estructura específica de los datos del problema.