People analytics sin atajos — ORH
Niveles de people analytics
People Analytics

Cuatro niveles para transitar desde el dato descriptivo hasta el dato explicativo, la simulación y los patrones de IA

La conversación sobre people analytics se ha desplazado hacia la inteligencia artificial a una velocidad muy superior a la capacidad real de absorción de personas y organizaciones. ¿Modelos predictivos sin haber acordado todavía qué se considera talento y cómo se mide? La gestión del dato tiene un proceso evolutivo y, con frecuencia, las organizaciones sobreestiman el estadio en el que se encuentran.

El primer «jefe» que anotó en una tablilla cuántos jornaleros tenía y qué ración de comida les correspondía estaba recogiendo datos sobre personas para tomar decisiones sobre personas. Eso ocurrió hacia el 3.300 a.C. en Mesopotamia. Sin saberlo, ya hacían people analytics.

La dificultad de entonces y de ahora tiene el nexo común de los medios disponibles en el contexto que los condiciona. Antes había que saber cincelar símbolos; hoy, manejar con soltura un Excel como mínimo. En RR.HH. siempre ha habido gestión del dato y siempre ha habido que interpretarlos. Su evolución ha sido acumulativa: cada fase introduce capacidades nuevas y también condiciones que, si no se cumplen, invalidan las siguientes.

Describir — el punto de partida

Toda gestión del dato comienza aquí. El BI consolida información para responder a la pregunta «¿qué ha pasado?». Su valor es enorme pero limitado: describe lo ocurrido sin modelizar las relaciones que lo explican.

Pregunta que responde: ¿cuál es nuestra rotación? ¿cómo evoluciona la plantilla? ¿qué estructura salarial tenemos?

Visualización de datos históricos en herramientas como Power BI, Tableau o Looker. Requiere dato limpio, único y consistente. Sin eso, el dashboard es un espejo roto.
Indicadores operativos: rotación, absentismo, headcount, tiempo de cobertura. Su utilidad depende de que la definición sea la misma para toda la organización.
Informes periódicos de plantilla para negocio, dirección o RRLL. El formato más habitual de people analytics en la mayoría de empresas españolas.
Cortes del dato por área, nivel, género, antigüedad. Útiles para detectar diferencias, pero sin control estadístico no distinguen causas de coincidencias.

Requisito mínimo:

Dato integradoDefiniciones acordadas

Explicar — el primer salto real

El nivel que más organizaciones dicen tener y menos tienen realmente. Introduce la pregunta crítica: ¿por qué ocurre lo que el dato dice? Se apoya en estadística inferencial para aislar variables y estimar el peso de cada una.

Pregunta que responde: ¿qué factores están asociados a la rotación? ¿existe una brecha salarial no explicada una vez controladas todas las variables?

Estima qué parte de una diferencia retributiva está asociada a antigüedad, nivel o desempeño, y si persiste una brecha no explicada. Alta explicabilidad y defendibilidad legal.
Identifica qué factores tienen mayor peso explicativo en el abandono cuando se analizan en conjunto, controlando el efecto de las demás variables.
Seguimiento de grupos de empleados a lo largo del tiempo. Requiere histórico mínimo de 2-3 años con definiciones estables.
Estima la asociación entre dos variables controlando terceras. Distinción clave: asociación estadística ≠ causalidad.

Aportación clave: defendibilidad ante inspección, sindicato o empleado.

Dato estructuradoVariables definidas

Simular — antes de decidir

El nivel que el mercado suele saltar. Modelos que ejecutan supuestos definidos por la organización: no aprenden de los datos, aplican lógica explícita. La diferencia con la IA no es de complejidad, sino de naturaleza.

Pregunta que responde: ¿qué pasaría si subimos el salario de este colectivo un 5%? ¿cuál sería el impacto en la equidad interna y el presupuesto?

Calcula el impacto de cambios en política retributiva antes de aplicarlos. No aprende: aplica reglas definidas por el analista.
Proyección de necesidades de plantilla en función de supuestos de negocio: crecimiento, rotación esperada, disponibilidad de perfiles.
Comparación de múltiples escenarios. Una simulación precisa sobre premisas débiles es errónea por construcción.

Distinción clave: la simulación ejecuta lo que le dicen. La IA aprende de lo que ve.

Estructura salarial detalladaSupuestos validados

Anticipar — donde empieza realmente la IA

Detecta patrones complejos y anticipa comportamientos de forma probabilística. No es un paso natural: exige condiciones específicas de dato, gobernanza y claridad conceptual. Sin definición operativa del problema, los modelos tienen buen ajuste estadístico pero nula validez real.

Modelos como random forest estiman probabilidad de abandono por empleado. Alta capacidad predictiva, baja explicabilidad. Requiere histórico de 2-3 años. Alto riesgo bajo el AI Act.
Procesamiento automático de texto para analizar sentimiento y temas recurrentes en encuestas de clima. Sube a alto riesgo si el output afecta decisiones individuales.
Algoritmos que sugieren candidatos internos. Dependen críticamente del inventario de competencias. Alto riesgo normativo si orienta decisiones de promoción o selección.

Requisito clave: cuando afecta a salarios, promociones o selección, la explicabilidad no es un complemento: es el requisito legal.

Histórico consistenteHipótesis definidaGobernanza legal
1 / 4

Nivel 1. El punto de partida: describir bien antes de explicar

Toda gestión del dato comienza en la analítica descriptiva. Es el territorio del Business Intelligence, que consolida información para responder a la pregunta «qué ha pasado». Los dashboards con datos limpios, únicos y consistentes tienen un valor enorme, pero limitado: describen lo ocurrido sin modelizar las relaciones que lo explican. Para avanzar, la gestión del dato necesita gobernanza básica:

  • Definiciones consistentes: que todos entiendan lo mismo por «salario total», «baja voluntaria» o «desempeño».
  • Trazabilidad: capacidad organizativa para reproducir cualquier dato en cualquier momento, independientemente de quién lo construyó.

Sin esto, cualquier capa posterior se construye sobre terreno inestable. The Josh Bersin Company estima que solo el 9% de las organizaciones integra datos de personas, operaciones, trabajo y ventas con métricas estandarizadas en toda la empresa, y apenas el 6% de los managers tiene competencia para analizar e interpretar datos. Gartner predice que antes de 2026 las organizaciones abandonarán el 60% de los proyectos de IA que no estén respaldados por una arquitectura de datos adecuada.

Nivel 2. El primer salto: explicar, no solo mostrar

El siguiente nivel introduce la pregunta crítica: ¿por qué ocurre lo que el dato dice? Este es el terreno de la analítica avanzada —en el sentido de ir más allá del reporting descriptivo, no necesariamente de IA—, que se apoya en la estadística inferencial para aislar variables y estimar el peso de cada una sobre el resultado.

  • Regresión para brecha salarial: pondera qué parte de una diferencia retributiva está asociada a la antigüedad o al desempeño, y si persiste una brecha no explicada una vez controladas todas las variables.
  • Drivers de rotación: identifica qué factores tienen mayor peso explicativo en el abandono cuando se analizan en conjunto, controlando el efecto de las demás variables.

La diferencia entre este nivel 2 y el nivel 1 es clara: mientras el BI muestra patrones, la estadística intenta explicarlos. BI visualiza que la rotación es más alta en un área; la regresión estima qué variables están asociadas a esa diferencia y con qué peso cuando se controlan las demás.

Al ser métodos más interpretables que los modelos complejos de ML, este segundo paso aporta algo esencial en entornos de cumplimiento normativo: la explicabilidad de la toma de decisiones basada en datos. El riesgo más frecuente es avanzar hacia los niveles 3 o 4 arrastrando los problemas del nivel 2: definiciones inconsistentes y datos no trazables que contaminan cualquier modelo posterior.

No toda analítica avanzada es IA ni toda IA aporta valor analítico relevante.

Nivel 3. Anticipar escenarios: la analítica como simulador

Antes de llegar a la IA y después del BI, hay un nivel intermedio: la simulación de escenarios. Consiste en usar modelos que ejecutan supuestos definidos por la organización. Aunque algunos incorporan componentes estadísticos, su núcleo no es el aprendizaje automático, sino la lógica explícita.

Si se sube el salario de un colectivo un 5%, el modelo calcula el impacto en el coste total aplicando reglas definidas. El sistema no aprende de los datos: aplica álgebra sobre supuestos. A diferencia de la IA, que aprende de lo que ve, la simulación ejecuta lo que le dicen.

Nivel 4. IA: ¿Dónde empieza realmente?

La IA entra en juego cuando el objetivo es detectar patrones complejos y anticipar comportamientos de forma probabilística. No es un paso natural: es un salto cualitativo que exige condiciones específicas de dato, gobernanza y claridad conceptual.

  • Predicción de rotación: modelos como random forest que estiman la probabilidad de abandono cruzando múltiples variables. Requieren datos históricos consistentes.
  • Análisis automático de respuestas abiertas (NLP): procesamiento del lenguaje natural para analizar sentimiento y temas recurrentes en encuestas de clima a escala.
  • Matching de talento: algoritmos que sugieren candidatos internos basándose en skills y trayectoria. Dependen críticamente de la calidad del inventario de competencias.

Lo que necesitan los modelos de IA es que el problema esté bien definido antes de modelizarse. Sin tener claro qué se mide y cómo, difícilmente se obtendrá una valoración realista y útil.

Para recordar

Sin una definición operativa del problema —qué es talento, qué es engagement, qué se quiere predecir—, los modelos pueden tener buen ajuste estadístico pero nula validez real. Son sofisticación al servicio del ruido.

La diferencia que importa: explicable frente a opaco

En RR.HH., la pregunta relevante no es si un modelo es estadística o inteligencia artificial —una frontera técnica más borrosa de lo que suele presentarse—, sino si la organización puede explicar por qué ese modelo llegó a una conclusión determinada. De esa capacidad depende que una decisión sea defendible y jurídicamente segura.

Hay modelos que producen resultados explicables. Un modelo de regresión aplicado a la brecha salarial puede decir: la antigüedad explica un 30% de la diferencia, el nivel jerárquico un 45%, y queda un 12% sin explicar por ninguna variable objetiva. Eso es auditable, discutible y sostenible ante cualquier interlocutor —un sindicato, una inspección, el propio empleado—.

Y hay modelos que no lo son. Los más potentes —random forest, gradient boosting, redes neuronales profundas— procesan cientos de variables simultáneamente y detectan patrones que ningún analista encontraría manualmente. Pero el precio de esa potencia es la opacidad: el modelo llega a una conclusión sin que nadie pueda señalar con precisión por qué. Existen técnicas para aproximar una explicación caso a caso, pero siguen siendo aproximaciones, no la lógica interna del modelo.

Saber que un empleado tiene alta probabilidad de abandono no dice qué hacer al respecto, qué variable es intervenible ni si la intervención es ética o legal. Cuando las decisiones afectan a salarios, promociones o selección, la explicabilidad no es un complemento: es el requisito obligatorio para pasar el corte normativo.

Introducir modelos sin capacidad interna para entenderlos y cuestionarlos no acelera la madurez: solo la simula.

El proceso evolutivo de la gestión del dato

Los cuatro niveles analíticos son un recorrido condicionado por la madurez del dato y de la organización. No se puede operar con rigor en el nivel 2 si el nivel 1 no está resuelto, ni modelizar en el nivel 4 sin datos consistentes y con histórico suficiente.

Las empresas no suelen transitar por las cinco fases de manera lineal: avanzan, retroceden, se estancan o se saltan pasos, con un coste que aflora siempre a posteriori.

1
Recolección sin criterio. Los datos existen pero están dispersos. No hay modelo de datos ni definiciones compartidas. No habilita ningún nivel de forma fiable.
2
Integración y orden. Se trabaja sobre la idea del dato único consolidando las fuentes existentes. Habilita el nivel 1 como requisito mínimo para cualquier paso siguiente.
3
Análisis con hipótesis. Se formulan preguntas antes de mirar los datos. Aparecen los modelos estadísticos. Habilita el nivel 2 y, si los supuestos son sólidos, el nivel 3.
4
Modelización y predicción. Los modelos entran en producción con validación, monitorización y gobernanza legal activa. Habilita el nivel 4.
5
Dato como activo estratégico. Los modelos se cuestionan internamente, no se delegan al proveedor. Consolida el nivel 4 y garantiza que produce decisiones que la organización puede sostener.

Conceptos que se parecen pero que conviene distinguir claramente

Correlación no es predicción: un patrón agregado —este colectivo rota más— no permite asignar probabilidades individuales. La primera describe un grupo; la segunda requiere un modelo entrenado que opere a nivel individual.
Predicción no es decisión: identificar un riesgo no legitima actuar sobre personas concretas sin contexto, validación y supervisión.
Sofisticación no es validez: un algoritmo complejo entrenado con datos sesgados reproduce y oculta ese sesgo porque lo embebe en un modelo que se percibe como objetivo, haciéndolo más difícil de detectar y cuestionar.

Desmontando la inflación semántica

La inflación semántica en torno a la IA alimenta el hype. No todo lo «IA powered» es IA, ni todo lo que ofrece el mercado conviene. A menudo, lo que se vende como «IA que elimina sesgos» son reglas de negocio tradicionales disfrazadas de algoritmo. Y cuando sí es IA, la exigencia normativa —AI Act, RGPD, transparencia retributiva— convierte en indefendible lo que parecía solo un reto técnico.

La mayor laguna no es tecnológica: es cultural y analítica. El problema no es que las organizaciones estén atrasadas tecnológicamente —muchas lo están sin duda—, sino que están avanzando sin haber definido bien el problema. Y así es como la IA funciona como coartada: permitiendo aparentar rigor donde no lo hay.

En people analytics, el valor no está en «tener IA», sino en hacer las preguntas precisas, trabajar con datos consistentes y sostener las decisiones con argumentos que se puedan explicar.

Lo demás, lejos de ser analítica útil, es dar apariencia de rigor a lo que no lo tiene.

CEO de ORH, plataforma de conocimiento e innovación en gestión estratégica de personas en las organizaciones creada en 2006. Es Licenciada en Periodismo y bajo la cabecera Observatorio de Recursos Humanos ha puesto en marcha proyectos como ORHIT-Observatorio RH de Innovación y Transformación, OES-Observatorio de Empresas Saludables, SFS-Empresas Saludables, Flexibles y Sostenibles e IA+Igual.

Compartir

Entradas relacionadas

SUSCRÍBETE AL BOLETÍN

Suscríbete a nuestro boletín y ejerce la libertad de aprender.

CONTACTA CON NOSOTROS

HAZ TU CONSULTA Y CONTACTAREMOS CONTIGO A LA MAYOR BREVEDAD​