Javier Vélez Reyes - Artículos
Data & Inteligencia Artificial

Arquitecturas del Dato IA & ML

El Clasificador Geométrico

Inteligencia Artificial Conexionista I
Javier Vélez Abril 2024 7 mins

Introducción

Desde que McCulloch y Pitts definieran su modelo de neurona artificial allá por el año 1943, habian transcurrido la friolera de 15 largos años. Aquella descripción no se limitaría solamente a proponer una representación formal y simplificada de la estructura de una neurona biológica, sino que, adicionalmente, ofrecería un marco operativo y funcional como modelo de cómputo y procesamiento de información. En voz de los propios autores, su modelo de neurona era capaz de realizar operaciones de razonamiento inteligente basadas en operaciones de lógica fundamental.

Sin embargo, a pesar del profundo impacto que su contribución supuso en el ámbito más científico, su traslación concreta hacia perímetro pragmático de la ingeniería aún estaba por descrubrir. Una neurona artificial sería capaz de mostrar un razonamiento primitivo inteligente. Pero, ¿cómo podría aplicarse de manera tangible y efectiva todo este cuerpo de conocimiento al dominio de una Inteligencia Artificial progresivamente más centrada en el diseño de sistemas con comportamiento emergente?

Para dar respuesta a esta pregunta, Frank Rosenblatt, allá por el año 1958, hizo una reinterpretación pragmática y fundacional de la neurona artificial de McCulloch y Pitts que transformaría el campo de la Inteligencia Artificial Conexionista. Cada neurona, dentro de un espacio de variables multidimensional, se comportaba siempre como un clasificador geométrico que dividía el espacio es dos subespacios de manera lineal.

Esta idea marcaría un antes y un después en la interpretación del modelo formal de neurona y tendría unas implicaciones directas en la construcción de sistemas que pudieran emular capacidades cognitivas. La nueva perspectiva ofrecía así un puente entre el modelo neuronal más puramente teórico y la posibilidad de construir máquinas capaces de procesar información de manera inteligente y aprender de los datos. A lo largo de este artículo nos centraremos en describir toda este proceso de transformación.

El Clasificador Geométrico

La formulación original de la neurona artificial de McCulloch y Pitts había establecido los pilares teóricos de la Inteligencia Artificial Conexionista. Sin embargo, la materialización de una interpretación más pragmática y directamente aplicable al campo de la ingeniería no llegaría hasta 15 años después cuando Frank Rosenblatt, llevó a cabo una reformulación de la idea formal de neurona. Toda neurona artificial podía interpretarse como un agente que presentaba un comportamiento clasificador geométrico inteligente.

Considerada dentro de un espacio geométrico de múltiples variables, cada neurona era capaz de segmentar dicho espacio en dos subespacios complementarios a través de una variedad lineal. Esta variedad, que puede imaginarse intuitivamente como un hiperplano dentro del espacio, opera como frontera de separación lo que conduce a la idea de clasificación. De esta manera, todas aquellas señales que, al presentarse como entrada a la neurona, se ubicaran por encima del límite fronterizo, serían clasificadas como pertenecientes a la categoría A, mientas que las que cayeran por debajo serán relativas a la categoría B.

La reformulación geométrica de la neurona artificial como clasificador ofrecía, de esta manera, una forma intuitiva de concebir a la misma cómo una entidad computacional simple que podía realizar tareas de discriminación entre diferentes clases de datos. La reinterpretación de Rosenblatt transformó la neurona artificial de un mero modelo teórico a una herramienta práctica para la construcción de sistemas de clasificación. Al enfatizar la naturaleza geométrica de su operación, proporcionó un marco para entender cómo se podían tomar decisiones basadas en las características de los datos de entrada.

El Clasificador Geométrico en Acción

La interpretación pragmática de Rosenblatt, aunque aparentemente sencilla, tardó más de una década en materializarse. No obstante, su llegada supuso una contribución de enorme valor para el campo de la Inteligencia Artificial, trascendiendo su rol como mera disciplina científica para consolidarse como una herramienta de ingeniería con aplicaciones concretas. A partir de este avance, se hizo posible configurar redes de neuronas artificiales capaces de llevar a cabo procesos de clasificación sobre conjuntos de datos multifactoriales.

La clave para definir la frontera de separación, representada por un hiperplano que dividiera el espacio de datos en dos subespacios complementarios, residía en la modulación precisa del conjunto de pesos sinápticos con los que operaba el modelo neuronal de los autores originales. Sin embargo, la pregunta que naturalmente surgía era relativa a cómo llevar a cabo esta modulación de manera eficaz. Naturalmente, la opción más convencional apuntaba directamente al campo de las matemáticas. Pero, nuevamente el pragmatismo de la ingeniería, apuntaría a encontrar una respuesta a esta pregunta en otra dirección.

Para Rosenblatt, una neurona debía poseer la capacidad de aprender a reajustar sus propios pesos sinápticos de forma autónoma, modulando así sus criterios de clasificación internos. Esta adaptación continua implicaría la modificación de la inclinación y el desplazamiento del hiperplano característico dentro del espacio multifactorial de los datos. Con este objetivo en mente, Rosenblatt ideó un proceso de ajuste preliminar a la fase de uso productivo de la neurona, al que denominó fase de aprendizaje o entrenamiento.

La idea fundamental detrás de esta fase era relativamente simple pero profundamente innovadora. Durante este periodo, la red neuronal sería expuesta a un conjunto de datos de entrenamiento cuidadosamente seleccionados. Cada dato consistía en una estructura ampliada que no solo contenía el conjunto de señales de entrada, sino que también informaba sobre el valor de salida esperado que idealmente la neurona debería producir como respuesta.

El proceso de aprendizaje en sí mismo se basaba en un mecanismo de reajuste iterativo de los pesos sinápticos en función de un parámetro de base llamado tasa o factor de aprendizaje. De acuerdo a esta idea, cuando la respuesta real emitida por la neurona durante el procesamiento de un dato de entrenamiento resultaba inferior al valor esperado, los pesos sinápticos correspondientes se ajustarían al alza proporcionalmente a la tasa de aprendizaje. De manera recíproca ocurriría a la baja cuando la salida real de la neurona excedía el valor esperado. Los pesos no se veían alterados solamente si la respuesta real y esperaba eran coincidentes. Así, este proceso, concebido de forma iterativa, permitía que la salida de la neurona se fuera ajustando de forma progresiva hacia los valores correctos en iteraciones futuras.

De esta manera, la contribución de Rosenblatt a este respecto, no solo consistió en una reinterpretación pragmática del modelo formal de neurona sino que sentó las bases fundamentales de la Inteligencia Artificial Conexionista en un plano más metodológico. En esencia, todo diseño inteligente Conexionista que se concibe como un sistema neuronal requiere ser entrenado mediante una fase previa de aprendizaje. Durante esta etapa, se le presentan datos realistas del problema en forma de ejemplos, con el objetivo de ajustar los pesos sinápticos internos de las neuronas y condicionando el comportamiento observado en la fase posterior de respuesta productiva.

Esta perspectiva propia de la Inteligencia Artidicial Conexionista contrastaría fuertemente con las aproximaciones propias de la rama Simbólica que se exploraría con ambición y poco fructifera durante la década de los setenta. El comportamiento observable de un sistema inteligente no debía ser el resultado de modelos artificiales diseñados explícita y artidicialmente en el laboratorio, sino una manifestación del conocimiento latente en los datos adquirido a través del aprendizaje.

Hoy en día, esta lección aprendida, tal vez, pueda parecer una evidencia. Sin embargo, en aquella época, el panorama sobre qué enfoque ganaría la carrera de la Inteligencia Artificial - inteligencia dirigida por modelos o por los datos - era mucho menos claro. A la postre recordemos que estamos hablando de los años cincuenta del siglo pasado.

Conclusiones

A lo largo de este artículo, hemos explorado en detalle el modelo de clasificador geométrico propuesto por Frank Rosenblatt y hemos descrito cómo su contribución supuso una reinterpretación pragmática fundamental en el campo de la Inteligencia Artificial como ingeniería. Esta nueva perspectiva serviría como elemento de empuje para fomentar el desarrollo de sistemas capaces de mostrar un verdadero comportamiento inteligente operativo basado en operaciones de clasificación.

Sin embargo, la principal aportación de Rosenblatt dentro de este ámbito fue, sin lugar a dudas, la introducción de la idea de una modulación de los pesos sinápticos de la neurona articulada por medio de procesos de aprendizaje basados en datos de entrenamiento. Las neuronas genéricas debían ser expuestas a una colección de datos realistas, convenientemente preparados, durante una fase específica de aprendizaje para adquirir conocimiento sobre los patrones ocultos en dichos datos de manera que dicho conocimiento adquirido se manifestaría posteriormente como un comportamiento inteligente emergente durante la fase posterior de uso productivo del sistema.

El concepto de aprendizaje como fase preliminar de la producción sentó las bases metodológicas de la Inteligencia Artificial Conexionista, un paradigma que ha demostrado una enorme capacidad para abordar problemas complejos en la actualidad. En los siguientes artículos de esta serie, exploraremos precisamente las dos principales líneas de investigación que surgieron a partir de los trabajos de este autor. En primer lugar, trataremos de abordar qué otras primitivas de operación ofrecen los modelos de IA basados en redes neuronales más allá de la simple clasificación. Por otro lado, nos preocuparemos de revisar qué otros modelos de aprendizaje alternativos pueden ser aplicados con éxito dentro este campo.