La importancia de establecer un margen de error al momento de error al momento de hacer un muestreo
Respuestas a la pregunta
Demos un paso atrás. ¿Qué es el margen de error y el nivel de confianza? Podéis encontrar un post en este mismo blog donde se explica con detalle esta cuestión. La idea es la siguiente: si estudio una población de individuos mediante una muestra aleatoria de los mismos, la relación entre el tamaño del universo y el tamaño de la muestra determina la precisión de los resultados de mi encuesta. Y, obviamente, cuanto mayor sea el tamaño de mi muestra, el error que cometo va a ser más pequeño. Por esta razón es habitual ver fichas técnicas de encuestas en las que se indica el tamaño de la muestra empleado (p.e. 1200 encuestas), junto a unos valores de margen de error y nivel de confianza (p.e. +-3% de error con un nivel de confianza del 95%).
¿Dónde está el problema? En la forma en la que obtengo la muestra. Estrictamente hablando, sólo es posible determinar el margen de error si usamos muestras probabilísticas (probability sampling). En una muestra probabilística cada individuo de la población a estudiar tiene una probabilidad conocida y no nula de ser seleccionado para la muestra. Bajo estas condiciones, el error muestral se calcula como el efecto de estudiar sólo una parte del universo en lugar de su totalidad y por lo tanto depende fuertemente del tamaño de la muestra. Para hacer una muestra probabilística se necesita algo que se conoce como marco muestral (sampling frame), una lista de todos los individuos que pueden entrar en mi muestra.
Sin embargo, pensemos cuantas muestras cumplen el criterio anterior: conocer de antemano la probabilidad de que un individuo del universo entre en nuestra muestra y que esta probabilidad no sea nula. Desde luego, las muestras obtenidas en un panel online, no.