1. MEDIDAS DE TENDENCIA CENTRAL
· - Media aritmética o MEDIA(x): Sumamos valores y los dividimos por la muestra total de individuos. Se calcula para variables cuantitativas. Es el centro aritmético de nuestro dato.
Cuando los datos son agrupados se usa la marca de clase: es la media del intervalo pero en este caso se multiplica por la frecuencia de ese intervalo. Se suma todo y se divide por la población total.
· - Media ponderada: igual que la anterior pero para datos agrupados en intervalos.
Existe una desviación típica o estándar que se acompaña de la media y es el +/-.
Alternativo a esto: la mediana.
-Mediana: Valore medio que agrupa la variable, con un 50% a cada lado. La mediana es siempre el valor del medio. Por ello hay que ordenar los datos de menor a mayor.
-Moda: Es el valor que más se repite. Si hay dos modas se llama muestra bimodal. Si hay más de dos se llama multimodal. Por ejemplo, en la serie de números 60,90,50,60,40, el valor que más se repite es el 60. Este ejemplo, concretamente, es bimodal.
2. MEDIDAS DE POSICIÓN
Valores de la distribución que la dividen en partes iguales, en intervalos que comprenden el mismo número de valores. Los más usados son:
- Percertiles. Se divide en 100 partes
- Deciles. Se divide en 10 partes.
- Cuartiles. Se divide en 4 partes.
3. MEDIDAS DE DISPERSIÓN
Existen porque la información aportada por la dependencia central es limitada.
Rango o recorrido: diferencia entre el mayor valor de la muestra y el menor. Da poca información porque solo nos da el recorrido pero no sabemos como se agrupan los datos.
|xn-x1|
Desviación media: Es la media aritmética de las distancias de cada observador con respecto a la media de la muestra. Es decir, mide cuanto se aleja de la media aritmética cada observación. Es muy similar a la desviación típica.
Desviación típica: Desviación con respecto de la media. Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Aglutinamos un porcentaje de la población (habrá algunos que se me aíslen).
Variancia: lo mismo que la desviación típica pero en vez de hacer la raíz cuadrada se pasa al cuadrado del sumatorio. S2 en vez de raíz cuadrada de x.
Recorrido intercuartilico: diferencia entre el tercer y el primer cuartil. Si yo tengo el valor ordenado de mayor a menor entre 100 valores, seria el 75 menos el 25.
|Q3-Q1|
Coeficiente de variación: no tiene unidad. Es adimensional. Medida de dispersión relativa ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida. Formula: desviación típica entre la media.
Cabe hacer mención también a las distribuciones normales, o también llamada distribución de Gauss. Esto es una distribución de probabilidad de una variable continua cuya gráfica tiene forma de campana. Es simétrica, y por lo tanto en ella coinciden la media, la moda y la mediana.
5. SIMETRÍA Y CURTOSIS
La asimetría nos permite identificar si los datos se distribuyen de forma uniforme alrededor de un punto central
Y la curtosis es una medida que nos permite determinar el grado de concentración que presentan valores en la región central de la distribución.
EJEMPLOS MEDIA, MEDIANA, MODA, MEDIDAS DE POSICIÓN, DESVIACIÓN TÍPICA
No hay comentarios:
Publicar un comentario