Diagrama causal

De Enciclopedia Salmantina

Un diagrama causal es una representación gráfica de un proceso de generación de datos (DGP, por sus siglas en inglés) que ilustra de forma estructurada las variables relevantes de un sistema y las relaciones de causalidad existentes entre ellas. Desarrollados a mediados de la década de 1990 por el científico de la computación Judea Pearl con el propósito de dotar a los sistemas de inteligencia artificial de una estructura formal para razonar sobre causas y efectos, estos diagramas se han consolidado como una herramienta fundamental para el diseño de investigación empírica en ciencias sociales y de la salud [1]. Su función principal es proporcionar un marco visual y matemático que permita a los investigadores determinar metodológicamente cómo aislar e identificar las respuestas a preguntas de investigación a partir de datos observacionales [2].

Concepto de causalidad subyacente[editar | editar código]

En el contexto de los diagramas causales, se adopta una definición de causalidad operativa de tipo intervencionista: se establece que una variable X causa a otra variable Y si, al intervenir de manera externa para modificar el valor de X, la distribución estadística de Y cambia como consecuencia directa [2]. Esta conceptualización es de carácter probabilístico, lo que implica que no requiere que un cambio en X altere el resultado de Y de forma determinista o inequívoca en todos los casos; es suficiente con que modifique la probabilidad de ocurrencia de los distintos valores de la variable afectada [2].

A través de esta perspectiva, es posible distinguir conceptualmente entre una correlación simple y una relación causal. Aquellas variables que covarían de forma espuria debido a factores antecedentes comunes no mostrarán cambios ante una intervención directa en una de ellas, lo que invalida cualquier interpretación causal directa entre ambas [2].

Elementos estructurales del diagrama[editar | editar código]

Basados en los fundamentos matemáticos de la teoría de grafos, los diagramas causales se componen exclusivamente de dos elementos [1]:

  • Nodos (o vértices): Representan las variables analizadas dentro del proceso de generación de datos. Cada nodo engloba a la variable en su totalidad con todo su rango de valores posibles, evitando la fragmentación en elementos individuales para cada estado o categoría específica (por ejemplo, un único nodo representa una variable binaria completa) [1].
  • Flechas causales (o aristas dirigidas): Representan una relación causal directa que se origina en la variable presuntamente causante y apunta hacia la variable que recibe el efecto. La dirección de la flecha señala el sentido del impacto, sin especificar a priori si dicho efecto posee un signo positivo o negativo, o si responde a una forma funcional lineal [1].

Modelado de variables omitidas y confusión[editar | editar código]

La utilidad metodológica de los diagramas causales radica en su capacidad para formalizar la complejidad de los entornos reales y resolver problemas empíricos comunes, tales como el sesgo por variables omitidas. Un ejemplo de estudio es la aparente contradicción observada al analizar la relación entre la presencia policial y la tasa de criminalidad, donde los datos correlacionales brutos suelen mostrar una asociación positiva (a mayor número de policías, mayor delincuencia registrada) [3].

Mediante un diagrama causal, esta paradoja se esclarece al introducir variables adicionales en el proceso de generación de datos, como la "criminalidad rezagada" (niveles de delincuencia en periodos de tiempo anteriores). Esta variable influye simultáneamente en el incremento de la asignación policial del presente y en la presencia de la delincuencia actual, actuando como un factor de confusión [4]. Al visualizar formalmente estas trayectorias alternativas, los investigadores pueden identificar con precisión qué variables o rutas alternativas deben ser bloqueadas o controladas estadísticamente para aislar de forma limpia la variación de los datos que responde estrictamente a la pregunta de investigación causal [5].

Tipos de efectos y variables moderadoras[editar | editar código]

Dentro de un diagrama causal es posible diferenciar la naturaleza de los impactos entre:

  • Efectos directos: Representados por un vector que conecta de forma inmediata dos nodos (XY) [5].
  • Efectos indirectos: Aquellos que se transmiten a través de una o más variables mediadoras intermedias (XZY), operando de manera análoga a una reacción en cadena [5].

Por otra parte, la inclusión de variables moderadoras (factores que alteran la intensidad o la naturaleza del efecto de una variable sobre otra sin poseer necesariamente un impacto directo independiente) representa un desafío conceptual dentro de los grafos dirigidos acíclicos convencionales, los cuales asumen funciones causales generales para cada nodo [6]. Para solventar esta limitación en el ámbito de la investigación aplicada, es habitual flexibilizar las restricciones formales del diagrama e incorporar de forma explícita nodos de interacción combinados (como un nodo que represente el producto de ambas variables, X × Z), permitiendo una visualización más clara de cómo una variable modera las dinámicas del sistema [7].

Notas[editar | editar código]

  1. 1,0 1,1 1,2 1,3 Huntington-Klein, 2025, p. cap. 6.2.
  2. 2,0 2,1 2,2 2,3 Huntington-Klein, 2025, p. cap. 6.1.
  3. Huntington-Klein, 2025, p. cap. 6.3.
  4. Huntington-Klein, 2021, p. cap. 6.3.
  5. 5,0 5,1 5,2 Huntington-Klein, 2025, p. cap. 6.4.
  6. Huntington-Klein, 2021, p. cap. 6.5.
  7. Huntington-Klein, 2025, p. cap. 6.5.

Referencias[editar | editar código]

  • Huntington-Klein, Nick (2025). «Causal Diagrams». The Effect: An Introduction to Research Design and Causality (en inglés). CRC Press.