Frecuencia y muestreo

En cualquier periódico que leamos, nos encontramos algún escrutinio o recuento de datos, con porcentajes y comentarios. ¿Pero son fiables estos escrutinios? Vamos a ver las nociones en que se basan (frecuencia y simulación) y a especificar las limitaciones de sus resultados.
I. Tener la distribución de frecuencias de una serie de datos
Comenzamos con una serie de datos, cuyos valores yfrecuencias absolutas,fi, aparecen recogidos en una tabla similar a la siguiente:

Para cada valorxi, calculamos sufrecuencia relativahi.
Se halla dividiendo la frecuencia absolutafide ese valor entre el número total de datosnde la población estudiada, es decir:

.
Construimos una tabla con los valores de la serie de datos y sus frecuencias relativas, similar a la siguiente:

Lo que habitualmente manejamos es lafrecuencia relativa acumulada, que para un determinado valor deXse obtiene sumando su frecuencia relativa con las frecuencias relativas de todos los valores anteriores a él. Dicha frecuencia relativa acumulada la expresamos en valor decimal o en tanto por ciento. La frecuencia relativa acumulada del último valor de la serie debe ser igual a 1, que equivale al 100%.

II. Fluctuación de las muestras
Cuando queremos conocer la proporciónpde una característica en una población numerosa, supervisar uno a uno cada individuo de la población es un proceso largo y costoso, así que tomamos unamuestra.
Tomar una muestra de tamañonde la población significa tomarnindividuos, o repetir el experimentonveces bajo las mismas condiciones en las que medimos la característica que estamos estudiando.
La serie de datos formada por losnresultados obtenidos es una muestra de tamañon.
Este método no puede proporcionar el valor exacto dep, ya que diferentes muestras pueden dar diferentes proporciones.
Si tenemos varias muestras, podemos observar estas diferencias en la distribución de frecuencias. Esto es lo que llamamosfluctuacióny para observarla, basta con tomar dos muestras.
III. Interpretación de un escrutinio de datos
Como acabamos de ver, con una única muestra no podemos saber la proporción exactapde una característica en una población completa.
No obstante, si respetamos ciertas condiciones, la proporción observadapepara esa muestra es un buen valor aproximado de la proporciónp.
Estas condiciones son las siguientes:
—los individuos de la muestra deben ser elegidos aleatoriamente;
—los individuos se deben devolver a la población (o repetir el experimento en idénticas condiciones);
—el tamañonde la muestra debe ser bastante grande; se tiene que cumplir que

Leer más: Definir una función lineal del tipo y = ax o f(x) = ax

.
Cumpliéndose estas condiciones, podemos asegurar que en el 93% de los casos (de las muestras observadas) se cumple que:

, lo que significa quepees un valor aproximado depcon una imprecisión o error absoluto de

.
IV. Simulación de un experimento
Un experimento aleatorio es un experimento cuyo resultado es impredeciblea priori, depende de la suerte.
Simular un experimento aleatorio significa sustituir el experimento real por otro también aleatorio que nos proporcione resultados similares a los del real.
Simulamos un experimento cuando el experimento original es difícil de reproducir, bien porque sea demasiado costoso, bien porque llevaría demasiado tiempo o bien porque sería muy difícil de observar.
Simulando varias veces un experimento (por ejemplo, tomando varias muestras), podremos sacar conclusiones de la distribución de frecuencias y de la fluctuación.
Para simular un experimento podemos usar la tecla

de una calculadora o una hoja de cálculo (Excel, por ejemplo, tiene la función RAND).
En una calculadora, esta tecla o función proporciona un número aleatorio con unas 10 cifras decimales.
Ejemplo:
Hemos metido 35 prendas rojas y 65 verdes en una caja. El experimento consiste en extraer 10 prendas de la caja, reemplazando cada vez la prenda extraída. ¿Cómo podemos simular este experimento? Usando una calculadora, activamos 10 veces la función

obteniendo 10 números decimales. Observamos las dos primeras cifras de la parte decimal de cada número. Si el número que forman esas dos cifras está comprendido entre 1 y 35, consideramos que hemos extraído una prenda roja, de lo contrario consideramos que la prenda extraída ha sido verde. De esta manera podemos simular nuestro experimento tantas veces como queramos.
Recuerda
—La frecuencia relativahide un valor perteneciente a una serie de datos viene dada por el cociente entre la frecuencia absolutafide dicho valor y el tamañonde la población:

Leer más: Composición de dos giros

.
—La proporción observadapede una característica en una muestra de tamañones un valor aproximado de la proporciónpde dicha característica en la población total, y cuya imprecisión es

.
—Si nuestra calculadora tiene la tecla

, pulsándola podemos simular experimentos aleatorios.

Estadística

Calcular frecuencias acumuladas
Calcular frecuencias relativas acumuladas
Calcular frecuencias relativas
Calcular la media de una serie de datos
Calcular la media y el recorrido de una serie de datos
Calcular la mediana de una serie de datos
Estadística conceptos
Estadística
Frecuencia y muestreo
Representar datos estadísticos
Media mediana moda y distribución de una serie de datos

La frecuencia y el muestreo son conceptos fundamentales en estadística que están estrechamente relacionados con la recopilación y el análisis de datos. A continuación, te explico brevemente cada uno de ellos:

Frecuencia: La frecuencia se refiere al número de veces que ocurre un valor específico en un conjunto de datos. Cuando tenemos una variable cuantitativa, es decir, una variable que puede ser medida en términos numéricos, podemos contar cuántas veces aparece cada valor en el conjunto de datos. La frecuencia nos ayuda a entender la distribución de los datos y qué valores son más o menos comunes.

Por ejemplo, si estamos estudiando las edades de un grupo de personas y tenemos los siguientes datos: 15, 18, 20, 20, 22, 25, 18, 20, 22, 30

La frecuencia del valor 20 sería 3, porque aparece tres veces en el conjunto de datos.

Muestreo: El muestreo es el proceso de seleccionar una muestra representativa de una población con el fin de obtener información sobre toda la población sin estudiar cada uno de sus elementos. Cuando la población es muy grande o no es práctico estudiarla en su totalidad, se utiliza el muestreo para obtener datos de un subconjunto más pequeño pero representativo, conocido como muestra.

Leer más: Usar una escala

La selección de una muestra representativa es crucial para que los resultados obtenidos de la muestra puedan ser generalizados a toda la población con cierto grado de precisión. Existen diferentes técnicas de muestreo, como el muestreo aleatorio simple, el muestreo estratificado y el muestreo por conglomerados, entre otros.

Por ejemplo, si queremos estudiar las preferencias alimenticias de los estudiantes de una escuela con 1000 alumnos, no sería práctico encuestar a todos ellos. En su lugar, podríamos seleccionar una muestra aleatoria de 100 estudiantes representativos y obtener información relevante sobre las preferencias alimenticias de toda la población.

La frecuencia y el muestreo son conceptos esenciales en estadística y se utilizan en conjunto para obtener información precisa y significativa a partir de los datos.

Compartir

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio