Mundo, 29 junio 2025 (ATB Digital).- Los modelos de lenguaje como ChatGPT han demostrado una capacidad extraordinaria para comprender y generar texto, resumir información y responder preguntas basadas en grandes volúmenes de datos no estructurados. Sin embargo, cuando se trata de hacer predicciones complejas a partir de datos estructurados en bases de datos relacionales, muchas empresas siguen dependiendo de métodos tradicionales de machine learning. Es aquí donde entra Kumo AI, una startup que busca cambiar radicalmente este panorama con su nuevo enfoque: el modelo fundacional relacional (RFM, por sus siglas en inglés).
El problema con el machine learning tradicional
A pesar de los avances en inteligencia artificial, las tareas de predicción en entornos empresariales —como anticipar la pérdida de clientes, detectar fraude o prever compras futuras— siguen siendo complicadas. Estas tareas requieren mucho trabajo manual y recursos costosos. Los equipos de datos deben invertir semanas en «ingeniería de características«, es decir, seleccionar y transformar datos de diversas tablas para que un algoritmo pueda aprender de ellos.
Por ejemplo, predecir si un cliente dejará de usar un servicio implica combinar tablas de compras, visitas al sitio web, tickets de soporte, entre otras. Esta fusión de datos es costosa, propensa a errores y poco escalable.
Qué propone Kumo con su modelo fundacional relacional
Kumo, fundada por el profesor de Stanford Jure Leskovec, introduce el concepto de aprendizaje profundo relacional, que automatiza y acelera la forma en que los sistemas entienden los datos tabulados. El enfoque de Kumo se basa en dos ideas clave:
- Transformar la base de datos en un grafo: En lugar de trabajar con tablas aisladas, Kumo convierte todo el conjunto de datos relacional en un grafo interconectado. Cada fila en una tabla se representa como un nodo, y las relaciones entre tablas (como claves foráneas) forman los enlaces entre ellos. De este modo, la base de datos se convierte en una red compleja y rica en conexiones, sin necesidad de intervención manual.
- Aplicar arquitecturas tipo transformer al grafo: Kumo ha adaptado el modelo transformer —el mismo que da vida a los modelos de lenguaje como GPT— para trabajar directamente sobre estos grafos. En lugar de palabras, el modelo presta atención a nodos y relaciones en el grafo, lo que le permite aprender patrones complejos a través de múltiples tablas al mismo tiempo.
Este cambio es comparable al paso que dio la visión por computadora hace unos años, cuando dejó de depender de reglas manuales para detectar bordes y formas, y empezó a usar redes neuronales capaces de interpretar directamente los píxeles.
Predicciones al instante y sin entrenamiento previo
Gracias a este enfoque, Kumo ha creado un modelo que puede adaptarse a una nueva base de datos sin necesidad de reentrenamiento. Es decir, puede realizar predicciones en «zero-shot«, como si se tratara de una consulta a un asistente inteligente.
Durante una demostración, el sistema fue capaz de predecir la probabilidad de que un cliente hiciera una compra en los próximos 30 días, simplemente recibiendo una consulta escrita. En cuestión de segundos, devolvió una probabilidad acompañada de una explicación basada en datos recientes del usuario, como actividad pasada o ausencia de interacciones.
Según Leskovec, «tenemos un modelo preentrenado que se conecta a tus datos y te da una predicción en 200 milisegundos». Esa eficiencia podría compararse al trabajo de semanas de un equipo de científicos de datos, pero accesible desde una interfaz sencilla.
Democratizar el análisis predictivo
Una de las ventajas de este sistema es que está diseñado para ser utilizado por analistas de datos, no solo por especialistas en machine learning. Esto amplía significativamente el acceso a herramientas predictivas, especialmente en empresas que no pueden permitirse equipos de IA sofisticados.
El modelo fundacional relacional también tiene el potencial de impulsar el desarrollo de agentes inteligentes corporativos. Por ejemplo, un asistente virtual de atención al cliente podría consultar al RFM para determinar el riesgo de cancelación de un usuario, y luego usar un modelo de lenguaje para adaptar su respuesta y ofrecer soluciones personalizadas.
Dos mundos complementarios: texto y estructura
El planteamiento de Kumo no busca reemplazar a los modelos de lenguaje, sino complementarlos. Mientras los LLM (Large Language Models) son expertos en analizar texto y conocimientos ya existentes, los RFM están optimizados para prever comportamientos futuros a partir de datos estructurados.
Este equilibrio entre capacidades retrospectivas y predictivas puede ser la clave para una nueva generación de herramientas de inteligencia artificial empresarial, donde se unan la comprensión del lenguaje natural con la anticipación basada en datos.
Próximos pasos y disponibilidad
Kumo ha lanzado una demo pública de su modelo, y en breve permitirá que las empresas lo conecten a sus propios conjuntos de datos. Para aquellas organizaciones que necesiten una precisión aún mayor, se ofrecerá un servicio de ajuste fino personalizado.
Esta propuesta marca un paso importante para que el análisis predictivo sea más accesible, rápido y eficaz, sin la carga habitual de los proyectos de machine learning tradicionales.
Fuente: Whatsnew.com