Distribución de la población frente a la distribución de muestreo
La distribución de la población generalmente se asocia con una población de individuos u objetos que son de interés. Por lo general, el parámetro de interés es la media de esta población. Para hacer esto, tendríamos que hacer un censo, es decir, tomar una medida de cada individuo en la población. El problema es que las poblaciones pueden ser muy grandes, lo que hace que el costo del censo sea muy costoso.
Entonces, para mantener bajos los costos, decidimos tomar una muestra aleatoria y tomar una medida. ¿Qué nos dice esta medida sobre la media de la población? Francamente, no mucho. ¿Qué pasaría si tuviéramos que tomar dos muestras aleatorias y calcular la media de las dos? Esto probablemente tampoco nos dirá mucho, pero tendríamos más confianza que si solo tuviéramos una medición de una muestra. De esto se deduce que si tomáramos tres muestras aleatorias y calculáramos la media de las tres, tendríamos aún más confianza sobre la media de la población.
Quedémonos por un momento con el tamaño de muestra de tres, y seleccione al azar un segundo grupo de tres individuos y encuentre la media de esta segunda muestra de tamaño tres. La probabilidad de que la media de esta muestra sea la misma que la primera muestra de tamaño tres es prácticamente cero. Entonces, ¿qué muestra es una mejor estimación de la media de la población?
La respuesta es que cada uno debería tener la misma influencia en lo que sea que concluyamos sobre la media de la población. Al igual que cada individuo es miembro de una Distribución de población que deseamos estudiar, cada muestra es un miembro de una Distribución de muestreo. Al igual que cualquier otra distribución, la distribución de muestreo tiene una media y una desviación estándar al igual que la distribución de población.
Resulta que la media de la distribución de muestreo es la misma que la media de la distribución de la población. Pero la desviación estándar de la distribución de muestreo es diferente para muestras de tamaño dos versus muestras de tamaño te. Esto dice que la distribución de muestreo para una muestra de tamaño dos es una distribución diferente a la distribución de muestras de tamaño tres. Y como razonamos antes, a medida que aumenta el tamaño de la muestra, tendríamos más confianza en el resultado.
Esta es la esencia misma del Teorema del límite central, que establece que la media de la Distribución de muestreo es igual a la media de la Distribución de población, y la Desviación estándar de la Distribución de muestreo es igual a la Población Desviación estándar dividida por la raíz cuadrada del tamaño de la muestra.
A partir del Teorema del límite central, finalmente podemos determinar exactamente cuánta confianza deberíamos tener en el resultado obtenido de una muestra.