Media, mediana, moda y distribución de una serie de datos

Media, mediana, moda y distribución de una serie de datos
Cualquier estudio estadístico incluye generalmente los siguientes apartados:
1. Especificación de las cuestiones a las que hay que responder con el estudio.
2. Ordenación y recuento de datos.
3. Presentación de estos datos en una tabla.
4. Construcción de uno o más diagramas en los que se representa gráficamente esta serie de datos.
5. Finalmente, los matemáticos deducen los parámetros que nos permiten caracterizar el conjunto completo de datos a partir de unos pocos valores.
I. Construir la tabla que corresponde a una serie de datos
En estadística, el términopoblaciónsignifica el conjunto completo de individuos sobre el que estamos recogiendo los datos, es decir, realizando el estudio.
Dentro de esta población, estudiamos una característica que llamamosvariable estadística. Principalmente, se estudian variables cuantitativas, es decir, variables que toman valores numéricos.
Una variable cuantitativa puede ser:
discreta, cuando el número de valores que puede tomar es limitado o finito;
—ocontinua, si la variable puede tomar infinitos valores, todos los comprendidos entre dos números dados.
Cuando la variable estadísticaXes discreta, para cada valor deXcontamos el número de veces que se repite este valor en la población. A este número lo llamamosfrecuencia absoluta. Con los valores de la variable y de la frecuencia absoluta de cada uno de ellos construimos una tabla como la siguiente:

Cuando la variable estadísticaXes continua, agrupamos los valores en clases o intervalos. Las clases son intervalos semiabiertos

. Su anchura o amplitud es el número

y su centro, también llamado marca de clase, es el valor medio

.
Para cada clase, contamos el número de veces en que el valor de la variableXes mayor que o igual a

y menor que

: esta es la frecuencia absoluta de dicha clase. Construimos con estos valores una tabla como la siguiente:

Notas:
—cuando el número total de datosn=f1 +f2 + … +fp es demasiado grande, tratamos la variable discreta como si fuera una variable continua;
—cuando agrupamos los valores por clases, tratamos que los intervalos sean de la misma anchura o amplitud, y que esta no sea demasiado grande. Sin embargo, a menudo los límites de los intervalos dan problemas; esta es la razón de que el primer y el último intervalo sean, o bien abiertos, o de amplitud diferente a los demás.
II. Representar una serie de datos
Para representar una variable estadística discreta usamos undiagrama o gráfico de barras(en el que la altura de cada barra es proporcional a la frecuencia absoluta) o undiagrama de sectores(en el que cada sector es proporcional a dicha frecuencia absoluta).
Por ejemplo, supongamos que al preguntar a 60 individuos sobre su profesión hemos obtenido los resultados siguientes: 8 obreros, 23 ejecutivos, 15 autónomos, 11 docentes y 3 de otras profesiones.
Para representar esta serie en un diagrama de sectores, tenemos que calcular la amplitud del ángulo que corresponde a cada sector. Para el sector “obreros” el ángulo es: (360 : 60) x 8 = 48, es decir, 48°.
Procedemos igual para los demás sectores, con lo que dibujamos el siguiente diagrama de sectores:

Leer más: Calcular el área y el perímetro de un rectángulo

Para representar una variable estadística continua, dibujamos unhistograma. Un histograma está formado por rectángulos adosados cuya área es proporcional a la frecuencia absoluta de la clase correspondiente.
Si las clases son de la misma amplitud, la altura de los rectángulos es proporcional a dicha frecuencia. Si las clases son de diferentes amplitudes, representamos la más pequeña, y a continuación, para una clase de amplitudkveces mayor, dibujamos un rectángulo cuya base seakveces la del primer rectángulo, procediendo igual para las demás clases.
Si unimos los puntos medios de las bases superiores de los rectángulos de un histograma, obtenemos el polígono de frecuencias.
III. Calcular la media
Cuando la variable es discreta y el total de datos esn, podemos recoger estos en una tabla como la siguiente:

donde

.
LamediadeXse obtiene así:

.
Cuando la variable es continua y el total de datos esn, construimos una tabla de este tipo:

Para calcular la media de esta serie, usamos la fórmula anterior, introduciendo el centro

del intervalo

, o marca de clase, en lugar de los valores de

.
Así la media deXes:

, donde

.
IV. Propiedades de la media
Cuando mediante operaciones básicas cambiamos los valores de una serie de datos, no siempre es necesario calcular de nuevo la media.
Tenemos en cuenta las siguientes propiedades:
—si

es la media de los valores

e

la media de los valores

, entonces la media de los valores suma

es

;
—sikes cualquier número real y

la media de los valores

, entonces la media de los valores suma

es

;
—si

es cualquier número real y

la media de los valores

, entonces la media de los valores producto

es

.
V. Calcular la mediana
Lamedianaes el valor que divide a una serie de valores, escritos en orden creciente, de tal forma que la mitad de los valores son menores o iguales que él y la otra mitad, mayores o iguales que él.
Para hallarla, escribimos en orden creciente la lista de valores, repitiendo cada uno de ellos tantas veces como aparezca. Se pueden producir entonces dos situaciones:
—si el número total de valoresnes un número impar, la mediana es el valor que ocupa la posición

Leer más: Escribir un número decimal en forma de fracción y viceversa

;
—si el número total de valoresnes un número par, la mediana es el centro del intervalo formado por los valores que ocupan las posiciones

y

.
Cuando la serie viene agrupada en intervalos, hallamos gráficamente la mediana utilizando el polígono de frecuencias acumuladas. Para cada clase

, hallamos el valor

de la frecuencia absoluta acumulada, es decir, el número de veces que aparece un valor menor que

. A continuación, representamos los puntos

sobre un sistema de coordenadasxy, obteniendo de esta forma el polígono de frecuencias acumuladas.
La mediana es la coordenadaxdel punto cuya coordenadayes

.
VI. Otros parámetros
Los matemáticos dicen a veces que hay tantos parámetros estadísticos como estadísticos. Sin llegar tan lejos, además de la media y la mediana, podemos calcular los parámetros siguientes:
—losvalores límites, es decir, los valores mayor

y menor

de la serie;
—elrango, que es igual a la diferencia entre los valores límites de la serie, es decir,

;
—lamoda(o clase modal), que es el valor (o clase) de la serie para el que se da la mayor frecuencia absoluta.
Nota:un parámetro no es muy útil por sí solo. Lo que habitualmente hacemos con una serie de datos es cotejar varios parámetros.
Recuerda
La media deXes el valor:

.
La mediana es el número que divide a la serie de tal forma que la mitad de los datos son menores o iguales que él y la otra mitad, mayores o iguales que él.

Estadística

Calcular frecuencias acumuladas
Calcular frecuencias relativas acumuladas
Calcular frecuencias relativas
Calcular la media de una serie de datos
Calcular la media y el recorrido de una serie de datos
Calcular la mediana de una serie de datos
Estadística conceptos
Estadística
Frecuencia y muestreo
Representar datos estadísticos
Media mediana moda y distribución de una serie de datos

La media, mediana y moda son medidas de tendencia central utilizadas en estadística para representar y entender la distribución de un conjunto de datos. Cada una de ellas proporciona información valiosa sobre la ubicación o valor central de los datos. A continuación, te explico qué representa cada una de estas medidas:

  1. Media: La media, también conocida como promedio aritmético, es la medida de tendencia central más común. Se calcula sumando todos los valores del conjunto de datos y dividiéndolos entre la cantidad total de datos. La fórmula para calcular la media es:
Leer más: Calcular frecuencias relativas acumuladas

Media (X̄) = (x1 + x2 + x3 + … + xn) / n

Donde x1, x2, x3, …, xn son los valores del conjunto de datos y n es la cantidad total de datos.

La media es sensible a los valores extremos, ya que se ve afectada por los valores muy grandes o muy pequeños. Es una medida útil para datos que tienen una distribución simétrica.

  1. Mediana: La mediana es el valor que se encuentra en el centro del conjunto de datos cuando estos están ordenados de manera ascendente o descendente. En otras palabras, la mediana divide el conjunto de datos en dos partes iguales: la mitad de los datos están por encima de la mediana y la otra mitad están por debajo.

Si la cantidad de datos es impar, la mediana es simplemente el valor central. Si la cantidad de datos es par, la mediana se calcula promediando los dos valores centrales. La mediana es menos sensible a los valores extremos y es útil para datos que tienen una distribución sesgada o con valores atípicos.

  1. Moda: La moda es el valor o valores que aparecen con mayor frecuencia en el conjunto de datos. Es simplemente el valor más común. Un conjunto de datos puede tener una moda (unimodal) si hay un valor que aparece con mayor frecuencia, o puede tener varias modas (bimodal, trimodal, etc.) si hay dos o más valores que aparecen con la misma frecuencia máxima.

La moda es útil para identificar los valores más frecuentes en el conjunto de datos y es especialmente útil para datos categóricos o discretos.

En resumen, la media, mediana y moda son medidas de tendencia central que nos permiten entender dónde se encuentra el valor típico o central de un conjunto de datos. Cada una de ellas tiene sus propias ventajas y se utiliza en diferentes situaciones según la naturaleza de los datos y el tipo de distribución que presenten.

Compartir

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio