Contraste de porcentajes y muestras independientes

Contraste de porcentajes y muestras independientes

Top  Previous  Next

Existen ocasiones en las que el investigador necesita conocer si algún estímulo o acontecimiento introducido de forma diferente a distintos grupos en una muestra produce diferencias en la actitud o comportamiento reflejado por una segunda variable. Este ejemplo se puede asimilar también a analizar si una medición determinada puede diferir en un subgrupo de la muestra del obtenido por otro subgrupo.

Podemos pensar por ejemplo en el estadístico más utilizado, la media aritmética. Imaginemos que hemos medido el comportamiento de los individuos por medio de la media de su gasto en la realización de un viaje de fin de semana. Queremos comprobar si aquellos grupos en los que el entrevistado era un hombre han tenido un comportamiento respecto al gasto diferente de los grupos en los que el entrevistado era una mujer. Disponemos para ello de las siguientes informaciones:

Número de casos en cada grupo
Media aritmética de la variable analizada (gasto)
Desviación típica de esa variable (raíz cuadrada de la varianza)

Dejemos claro por tanto que vamos a intentar establecer una inferencia estadística en la que nuestra hipótesis nula será la igualdad de las medias. La teoría estadística nos dice que pueden producirse dos casos:

que las varianzas de los subgrupos sean iguales
que las varianzas de los subgrupos sean diferentes

Como habitualmente trabajamos con muestras que pertenecen a poblaciones con varianza poblacional no conocida es el segundo caso el más habitual.

Imaginemos que de una muestra hemos obtenido una tabla de porcentajes verticales, dónde podemos hacer comparaciones entre las distintas categorías que forman la variable de cabecera de la tabla, para las distintas alternativas de respuesta de la variable de filas.

Cada cruce de esta tabla representa un %. La hipótesis nula de este contraste será la igualdad de proporciones es decir Ho: a=b y por tanto, la hipótesis alternativa sería H1: a¹ b. La fórmula utilizada en el contraste es

a es el porcentaje de la primera categoría comparada
b es el porcentaje de la segunda categoría comparada
na es el tamaño o frecuencia marginal obtenida por la alternativa cuyo porcentaje es a
nb es el tamaño o frecuencia marginal obtenida por la alternativa cuyo porcentaje es b

Para cada fila de porcentajes, obtenemos posibles resultados. Ver resultado de test t de medias para conocer la intepretación.

Desde la versión 1344, se incorpora una modificación a la formulación anterior, incorporando nuevos conceptos como es el overlapping o solapamiento de muestras que ayuda a una mejor integración en la formulación de la restricción de grupos independientes en el contraste. El overlapping puede aplicarse o no desde el diálogo de pruebas de significación, así como la corrección de continuidad o la consideración de varianzas iguales. Como se puede observar en el diálogo por defecto aparece marcada la consideración de varianzas iguales u la aplicación del overlapping.

datawin_clip0006

Se introduce un nuevo concepto que es la base efectiva. La base efectiva es el número de casos en solapamiento entre los grupos de las columnas (o filas) comparadas. La base efectiva se computa como un cociente entre la suma de pesos de los.

Su formulación para cada columna es

datawin_clip0009

y para el total

datawin_clip0010.

El test T para proporciones compara los valores percentuales en dos columnas de la tabla. Para cada dos valores se testa la hipótesis de que la diferencia de proporciones es 0 donde las proporciones son definidas como:

datawin_clip0011

y que además se asume que las muestras son obtenidas de una población común, por lo que estimamos la proporción de la varianza usando la fórmula:

datawin_clip0012

La variable T es calculada como

datawin_clip0015

y se distribuye con e1+e2-e0-1 grados de libertad.

Podemos observar que en la fórmula aparece la corrección por continuidad (no por defecto). Este cálculo queda definido como: datawin_clip0014

y donde

datawin_clip0016

En caso de no existir overlapping, el cociente que incluye la correlación queda a 0.