Cuatro niveles para transitar desde el dato descriptivo hasta el dato explicativo, la simulación y los patrones de IA
La conversación sobre people analytics se ha desplazado hacia la inteligencia artificial a una velocidad muy superior a la capacidad real de absorción de personas y organizaciones. ¿Modelos predictivos sin haber acordado todavía qué se considera talento y cómo se mide? La gestión del dato tiene un proceso evolutivo y, con frecuencia, las organizaciones sobreestiman el estadio en el que se encuentran.
El primer «jefe» que anotó en una tablilla cuántos jornaleros tenía y qué ración de comida les correspondía estaba recogiendo datos sobre personas para tomar decisiones sobre personas. Eso ocurrió hacia el 3.300 a.C. en Mesopotamia. Sin saberlo, ya hacían people analytics.
La dificultad de entonces y de ahora tiene el nexo común de los medios disponibles en el contexto que los condiciona. Antes había que saber cincelar símbolos; hoy, manejar con soltura un Excel como mínimo. En RR.HH. siempre ha habido gestión del dato y siempre ha habido que interpretarlos. Su evolución ha sido acumulativa: cada fase introduce capacidades nuevas y también condiciones que, si no se cumplen, invalidan las siguientes.
Describir — el punto de partida
Toda gestión del dato comienza aquí. El BI consolida información para responder a la pregunta «¿qué ha pasado?». Su valor es enorme pero limitado: describe lo ocurrido sin modelizar las relaciones que lo explican.
Pregunta que responde: ¿cuál es nuestra rotación? ¿cómo evoluciona la plantilla? ¿qué estructura salarial tenemos?
Requisito mínimo:
Explicar — el primer salto real
El nivel que más organizaciones dicen tener y menos tienen realmente. Introduce la pregunta crítica: ¿por qué ocurre lo que el dato dice? Se apoya en estadística inferencial para aislar variables y estimar el peso de cada una.
Pregunta que responde: ¿qué factores están asociados a la rotación? ¿existe una brecha salarial no explicada una vez controladas todas las variables?
Aportación clave: defendibilidad ante inspección, sindicato o empleado.
Simular — antes de decidir
El nivel que el mercado suele saltar. Modelos que ejecutan supuestos definidos por la organización: no aprenden de los datos, aplican lógica explícita. La diferencia con la IA no es de complejidad, sino de naturaleza.
Pregunta que responde: ¿qué pasaría si subimos el salario de este colectivo un 5%? ¿cuál sería el impacto en la equidad interna y el presupuesto?
Distinción clave: la simulación ejecuta lo que le dicen. La IA aprende de lo que ve.
Anticipar — donde empieza realmente la IA
Detecta patrones complejos y anticipa comportamientos de forma probabilística. No es un paso natural: exige condiciones específicas de dato, gobernanza y claridad conceptual. Sin definición operativa del problema, los modelos tienen buen ajuste estadístico pero nula validez real.
Requisito clave: cuando afecta a salarios, promociones o selección, la explicabilidad no es un complemento: es el requisito legal.
Nivel 1. El punto de partida: describir bien antes de explicar
Toda gestión del dato comienza en la analítica descriptiva. Es el territorio del Business Intelligence, que consolida información para responder a la pregunta «qué ha pasado». Los dashboards con datos limpios, únicos y consistentes tienen un valor enorme, pero limitado: describen lo ocurrido sin modelizar las relaciones que lo explican. Para avanzar, la gestión del dato necesita gobernanza básica:
- Definiciones consistentes: que todos entiendan lo mismo por «salario total», «baja voluntaria» o «desempeño».
- Trazabilidad: capacidad organizativa para reproducir cualquier dato en cualquier momento, independientemente de quién lo construyó.
Sin esto, cualquier capa posterior se construye sobre terreno inestable. The Josh Bersin Company estima que solo el 9% de las organizaciones integra datos de personas, operaciones, trabajo y ventas con métricas estandarizadas en toda la empresa, y apenas el 6% de los managers tiene competencia para analizar e interpretar datos. Gartner predice que antes de 2026 las organizaciones abandonarán el 60% de los proyectos de IA que no estén respaldados por una arquitectura de datos adecuada.
Nivel 2. El primer salto: explicar, no solo mostrar
El siguiente nivel introduce la pregunta crítica: ¿por qué ocurre lo que el dato dice? Este es el terreno de la analítica avanzada —en el sentido de ir más allá del reporting descriptivo, no necesariamente de IA—, que se apoya en la estadística inferencial para aislar variables y estimar el peso de cada una sobre el resultado.
- Regresión para brecha salarial: pondera qué parte de una diferencia retributiva está asociada a la antigüedad o al desempeño, y si persiste una brecha no explicada una vez controladas todas las variables.
- Drivers de rotación: identifica qué factores tienen mayor peso explicativo en el abandono cuando se analizan en conjunto, controlando el efecto de las demás variables.
La diferencia entre este nivel 2 y el nivel 1 es clara: mientras el BI muestra patrones, la estadística intenta explicarlos. BI visualiza que la rotación es más alta en un área; la regresión estima qué variables están asociadas a esa diferencia y con qué peso cuando se controlan las demás.
Al ser métodos más interpretables que los modelos complejos de ML, este segundo paso aporta algo esencial en entornos de cumplimiento normativo: la explicabilidad de la toma de decisiones basada en datos. El riesgo más frecuente es avanzar hacia los niveles 3 o 4 arrastrando los problemas del nivel 2: definiciones inconsistentes y datos no trazables que contaminan cualquier modelo posterior.
Nivel 3. Anticipar escenarios: la analítica como simulador
Antes de llegar a la IA y después del BI, hay un nivel intermedio: la simulación de escenarios. Consiste en usar modelos que ejecutan supuestos definidos por la organización. Aunque algunos incorporan componentes estadísticos, su núcleo no es el aprendizaje automático, sino la lógica explícita.
Nivel 4. IA: ¿Dónde empieza realmente?
La IA entra en juego cuando el objetivo es detectar patrones complejos y anticipar comportamientos de forma probabilística. No es un paso natural: es un salto cualitativo que exige condiciones específicas de dato, gobernanza y claridad conceptual.
- Predicción de rotación: modelos como random forest que estiman la probabilidad de abandono cruzando múltiples variables. Requieren datos históricos consistentes.
- Análisis automático de respuestas abiertas (NLP): procesamiento del lenguaje natural para analizar sentimiento y temas recurrentes en encuestas de clima a escala.
- Matching de talento: algoritmos que sugieren candidatos internos basándose en skills y trayectoria. Dependen críticamente de la calidad del inventario de competencias.
Lo que necesitan los modelos de IA es que el problema esté bien definido antes de modelizarse. Sin tener claro qué se mide y cómo, difícilmente se obtendrá una valoración realista y útil.
Sin una definición operativa del problema —qué es talento, qué es engagement, qué se quiere predecir—, los modelos pueden tener buen ajuste estadístico pero nula validez real. Son sofisticación al servicio del ruido.
La diferencia que importa: explicable frente a opaco
En RR.HH., la pregunta relevante no es si un modelo es estadística o inteligencia artificial —una frontera técnica más borrosa de lo que suele presentarse—, sino si la organización puede explicar por qué ese modelo llegó a una conclusión determinada. De esa capacidad depende que una decisión sea defendible y jurídicamente segura.
Hay modelos que producen resultados explicables. Un modelo de regresión aplicado a la brecha salarial puede decir: la antigüedad explica un 30% de la diferencia, el nivel jerárquico un 45%, y queda un 12% sin explicar por ninguna variable objetiva. Eso es auditable, discutible y sostenible ante cualquier interlocutor —un sindicato, una inspección, el propio empleado—.
Y hay modelos que no lo son. Los más potentes —random forest, gradient boosting, redes neuronales profundas— procesan cientos de variables simultáneamente y detectan patrones que ningún analista encontraría manualmente. Pero el precio de esa potencia es la opacidad: el modelo llega a una conclusión sin que nadie pueda señalar con precisión por qué. Existen técnicas para aproximar una explicación caso a caso, pero siguen siendo aproximaciones, no la lógica interna del modelo.
Saber que un empleado tiene alta probabilidad de abandono no dice qué hacer al respecto, qué variable es intervenible ni si la intervención es ética o legal. Cuando las decisiones afectan a salarios, promociones o selección, la explicabilidad no es un complemento: es el requisito obligatorio para pasar el corte normativo.
El proceso evolutivo de la gestión del dato
Los cuatro niveles analíticos son un recorrido condicionado por la madurez del dato y de la organización. No se puede operar con rigor en el nivel 2 si el nivel 1 no está resuelto, ni modelizar en el nivel 4 sin datos consistentes y con histórico suficiente.
Las empresas no suelen transitar por las cinco fases de manera lineal: avanzan, retroceden, se estancan o se saltan pasos, con un coste que aflora siempre a posteriori.
Conceptos que se parecen pero que conviene distinguir claramente
Desmontando la inflación semántica
La inflación semántica en torno a la IA alimenta el hype. No todo lo «IA powered» es IA, ni todo lo que ofrece el mercado conviene. A menudo, lo que se vende como «IA que elimina sesgos» son reglas de negocio tradicionales disfrazadas de algoritmo. Y cuando sí es IA, la exigencia normativa —AI Act, RGPD, transparencia retributiva— convierte en indefendible lo que parecía solo un reto técnico.
La mayor laguna no es tecnológica: es cultural y analítica. El problema no es que las organizaciones estén atrasadas tecnológicamente —muchas lo están sin duda—, sino que están avanzando sin haber definido bien el problema. Y así es como la IA funciona como coartada: permitiendo aparentar rigor donde no lo hay.
En people analytics, el valor no está en «tener IA», sino en hacer las preguntas precisas, trabajar con datos consistentes y sostener las decisiones con argumentos que se puedan explicar.
Lo demás, lejos de ser analítica útil, es dar apariencia de rigor a lo que no lo tiene.