SciELO - Scientific Electronic Library Online

 
vol.78 número4Albúmina en el paciente crítico: ¿Mito o realidad terapéutica?Caso Clínico Radiológico para diagnóstico índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Revista chilena de pediatría

versión impresa ISSN 0370-4106

Rev. chil. pediatr. v.78 n.4 Santiago ago. 2007

http://dx.doi.org/10.4067/S0370-41062007000400010 

 

Rev Chil Pediatr 2007; 78 (4): 414-417

BIOESTADÍSTICA
BIOESTATISTICS

Interpretación del test de Chi-cuadrado (X2) en investigación pediátrica

Interpretation of Chi-square test in pediatric investigation

 


JAIME CERDA L.1, LUIS VILLARROEL DEL P.2


1. Pediatra, Programa de Especialidad en Salud Pública. Departamento de Salud Pública, Facultad de Medicina,
Pontificia Universidad Católica de Chile.
2. Doctor en Estadística. Departamento de Salud Pública, Facultad de Medicina, Pontificia Universidad Católica de Chile.

Correspondencia a :


ABSTRACT

Qualitative variables are often used in pediatric research, for example, newborn gender (male, female) or malnutrition level (lesser, moderate, severe). In order to determine the association or independence of two qualitative variables with a certain level of significance, a frequently used statistical tool is available: chi–square test (X2). The present article explains the theoretical background of the test, the methodology employed for calculating the X2 statistic and its correct interpretation, exemplifying these concepts using a real investigation. In simple terms, chi–square test (X2) compares the results observed in an investigation with a set of expected results calculated under the assumption that both variables are independent from each other. The difference between the observed and expected results is summarized in the value of the X2 statistic, which has an associated p–value; according to its magnitude, the independence hypothesis is either supported or rejected. In consequence, the application of the chi–square test (X2) allows the investigator to determine if two variables are associated or are mutually independent, an affirmation that can be statistically sustained.

(Key words: Chi–square, statistics, investigation, pediatrics).


RESUMEN

Numerosos protocolos de investigación en pediatría trabajan con variables de tipo cualitativo, por ejemplo, sexo del recién nacido (masculino, femenino) o grado de desnutrición (leve, moderado, severo). Para determinar la asociación o independencia de dos variables cualitativas con un cierto grado de significancia, se dispone de una herramienta estadística frecuentemente utilizada, el test de chi–cuadrado (X2). El presente artículo explica el fundamento teórico del test, la metodología de cálculo del estadístico X2 y su correcta interpretación, ejemplificando estos conceptos mediante una investigación real. En términos simples, el test de chi–cuadrado (X2) contrasta los resultados observados en una investigación con un conjunto de resultados teóricos, estos últimos calculados bajo el supuesto que las variables fueran independientes. La diferencia entre los resultados observados y esperados se resume en el valor que adopta el estadístico X2, el cual tiene asociado un valor–p, por debajo del cual se acepta o rechaza la hipótesis de independencia de las variables. De esta forma, al someter los resultados de una investigación al test de chi–cuadrado (X2) el investigador puede afirmar si dos variables en estudio están asociadas o bien son independientes una de la otra, afirmación que cuenta con un sustento estadístico.

(Palabras clave: X2, estadística, investigación, pediatría).



Introducción

En investigación pediátrica, frecuentemente se trabaja con variables de tipo cualitativo (también conocidas como variables categóricas) tales como sexo, grado de desnutrición o “niños mayores de 10 años” (variable cuantitativa transformada en cualitativa). Los valores que toman estas variables se resumen en “tablas de frecuencias”, las cuales permiten ordenarles y comparar su ocurrencia. Si el interés del investigador es establecer la relación (asociación o independencia) entre dos variables, los datos se disponen en “tablas de contingencia”, las cuales incluyen en sus columnas los distintos niveles que adopta la primera variable (ej. masculino, femenino) y en sus filas los distintos niveles que adopta la segunda variable (ej. desnutrición leve, desnutrición moderada y desnutrición severa).

Para determinar la asociación o independencia de dos variables cualitativas, en 1.900 Pearson introdujo el test de chi–cuadrado (χ2), herramienta estadística ampliamente difundida en investigación biomédica1. Este test contrasta dos hipótesis, una hipótesis nula o hipótesis de independencia de las variables (H0) y una hipótesis alternativa o hipótesis de asociación de las variables (H1). En términos simples, el test de χ2 compara los resultados observados con resultados teóricos, estos últimos calculados bajo el supuesto que las variables fuesen independientes entre sí, es decir, bajo el supuesto que H0 fuese verdadera. Si los resultados observados difieren significativamente de los resultados teóricos, es decir, difieren de H0, es posible rechazar H0 y afirmar que H1 es verdadera, concluyendo que las variables están asociadas. Por el contrario, si los resultados observados y teóricos no difieren significativamente, se confirma la veracidad de H0 y se afirma que las variables son independientes2,3. Mediante el siguiente ejemplo, tomado de una investigación real, se ilustrarán estos conceptos.

Ejemplo

Waisman y colaboradores describieron en 1998 la epidemiología de los accidentes infantiles ocurridos en la Región Centro Cuyo, Argentina4. Uno de sus objetivos fue determinar si existía alguna asociación entre la tasa de incidencia de consultas por accidentes y la estación del año. Para ello, compararon la proporción de consultas por accidentes en invierno y en verano. La tala 1 resume sus observaciones.

Si la variable “tipo de consulta” fuese independiente de la variable “estación del año”, la tasa de incidencia de consultas por accidentes en ambas estaciones deberían ser iguales. En el ejemplo, se observa que la tasa de incidencia de consultas por accidentes en verano es superior a la registrada en invierno (13,5% vs 6,6%), por lo tanto, es posible afirmar que las variables “tipo de consulta” y “estación del año” están asociadas, más ignoramos si esta asociación es estadísticamente significativa. Para objetivar la asociación entre las dos variables, se utiliza el test de χ2.

La hipótesis nula ( H0) del test de χ2 apoya la independencia de las variables, en otras palabras, el “tipo de consulta” es independiente de la “estación del año”. Por el contrario, la hipótesis alternativa (H1) apoya la asociación de las variables, es decir, el “tipo de consulta” se asocia a la “estación del año”. El test de χ2 contrasta los resultados observados con valores teóricos, estos últimos calculados bajo el supuesto que H0 es verdadera. Por consiguiente, se deben calcular los valores teóricos de la tabla de contingencia asumiendo que la proporción de consultas por accidentes en invierno y verano son iguales entre sí e iguales a la proporción de consultas por accidentes totales (9,6%). En la tabla 2 se presentan los valores teóricos que toman las variables asumiendo la veracidad de H0. Nótese que los valores totales no cambian, sólo lo hacen los valores de los niveles que toma cada variable (a’, b’, c’ y d’).

El estadístico χ2 dimensiona cuánto difieren los valores observados (tabla 1) de los valores teóricos (tabla 2). Se calcula sumando el valor del cuadrado de la diferencia del valor observado en cada casilla y su valor teórico, dividido por el valor teórico. La razón para elevar las diferencias al cuadrado es convertir todas las diferencias en valores positivos. La siguiente fórmula entrega el valor del estadístico:

χ2 = [(a–a’)2/a’] + [(b–b’)2/b]’ + [(c–c’)2/c’] + [(d– d’)2/d’].

Utilizando los valores observados y teóricos del ejemplo, el valor de estadístico χ2 es el siguiente:

χ2 = [(1.418–2.062)2/2.062] + [(2.221– 1.577)2/1.577] + [(20.133–19.489)2/19.489] + [(14.269–14.913)2/14.913] = 512,5.



A mayor valor del estadístico χ2, mayor es la diferencia entre los valores observados y teóricos, por consiguiente, más alejados están los valores observados de los valores calculados bajo el supuesto que las variables fuesen independientes (H0 verdadera). En consecuencia, a mayor valor del estadístico χ2, mayor es el grado de asociación entre las variables (H1 verdadera).

El siguiente paso consiste en evaluar si el valor que toma el estadístico χ2 es significativo. Para ello, se utiliza la tabla de distribución probabilística de χ2, la cual es dependiente de los “grados de libertad” (estimador del número de categorías independientes en un test particular o experimento estadístico). En una tabla de contingencia de “r” filas y “k” columnas, los grados de libertad son igual al producto del número de filas menos 1 (r–1) por el número de columnas menos 1 (k–1). Para el caso de variables dicotómicas, es decir, variables que toman solamente dos niveles (como las del ejemplo), los grados de libertad son igual a 1. En la tabla de distribución probabilística de χ2, se ubica en la fila correspondiente al número de grados de libertad el valor del estadístico χ2, determinándose su valor–p. En el ejemplo, el estadístico χ2 (512,5) con 1 grado de libertad tiene un valor–p menor a 0,005. Esto significa que existe una probabilidad menor a 0,005 de obtener frecuencias como las observadas en caso de ser H0 verdadera; en consecuencia, se rechaza H0 en favor de H1, apoyando la asociación entre las variables.

Existen algunas consideraciones importantes inherentes al test de χ2. En primer lugar, es un test de tipo no dirigido (test de planteamiento bilateral), es decir, solamente determina la asociación o independencia de dos variables cualitativas, sin informar el sentido ni la magnitud de dicha asociación. Para conocer estos atributos, una vez establecida la asociación entre las variables deben calcularse medidas de riesgo, por ejemplo, odds ratio. En segundo lugar, es importante destacar que el test de χ2 siempre determina la asociación o independencia de dos variables cualitativas, sin embargo, cada una de las variables puede tener más de dos niveles. Un ejemplo de esta situación sería estudiar la asociación entre la variable “nivel socioeconómico”, (alto, medio y bajo) y la variable “grupo sanguíneo Rh positivo” (A, B, AB y 0). En este caso, la tabla de contingencia será de 3 × 4, por consiguiente, los grados de libertad (g.l.) se calculan según la fórmula g.l. = (3-1) × (4-1) = 6. Por último, para realizar el test de χ2 los valores que toman los niveles de las variables deben cumplir una serie de condiciones numéricas; como norma general, se exigirá que el 80% de las celdas en una tabla de contingencia tengan valores esperados mayores de 5. Así, en una tabla de dos por dos será necesario que todas las celdas verifiquen esta condición; en caso contrario, se deben aplicar herramientas estadísticas tales como el test exacto de Fisher, cuya explicación excede el propósito de esta publicación3,5.

Existen numerosos programas computacionales capaces de realizar el test de χ2, sin embargo, su cálculo es útil solamente cuando lo realiza un investigador familiarizado con su significado estadístico e interpretación. El presente artículo abordó aspectos generales relacionados a este test, siendo necesario para una comprensión más acabada del mismo el estudio personal de estos conceptos en mayor profundidad. Un buen punto de partida es construir tablas de contingencia a partir de los datos reportados en artículos de investigación, calcular el valor del estadístico χ2 para cada una de ellas y determinar su significancia estadística. Esta práctica seguramente aportará al lector una mejor comprensión de los resultados del estudio.

Referencias

1.- Pearson K: On a criterion that a given system of deviations from the probable in the case of correlated system of variables is Duch that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine 1900; 50: 157-75.         [ Links ]

2.- Bewick V, Cheek L, Ball J: Statistics review 8: qualitative data – tests of association. Critical Care 2004; 8: 46-53.         [ Links ]

3.- Pita S, Pértega S: Asociación de variables cualitativas: test de chi–cuadrado. Disponible en www.fisterra. com [Consultado el 21/03/07].         [ Links ]

4.- Waisman I, Núñez J, Sánchez J: Epidemiología de los accidentes en la infancia en la Región Centro Cuyo. Rev Chil Pediatr 2002; 73: 404-14.         [ Links ]

5.- Pértega S, Pita S: Asociación de variables cualitativas: el test exacto de Fisher y el test de Mcnemar. Disponible en http://www.fisterra.com/ [Consultado el 21/03/ 07].        [ Links ]

Trabajo recibido el 4 de abril de 2007, devuelto para corregir el 07 de mayo de 2007, segunda versión el 24 de mayo de 2007, aceptado para publicación el 18 de junio de 2007.

Correspondencia a: Dr. Jaime Cerda L., E-mail: jcerdal@gmail.com