Professional Documents
Culture Documents
ESTADISTICA
Eva Romero Chaves
Con respecto a N nos indica el tamaño de la muestra que vamos a analizar, y tanto en el caso
de Granada como en el de Sevilla disponemos de 30 individuos, por lo tanto el número de
observaciones también será de 30.
En el caso de Sevilla presenta un mínimo de precipitaciones totales anuales de 307 mm
correspondiendo con el año 1981 mientras que en Granada existe un mínimo de 213,90 mm
en el año 1993, siendo inferior que el mínimo sevillano.
El máximo en Sevilla referido a las precipitaciones totales anuales es de 940,60 mm en el año
1989, mucho más elevado que las de Granada de 661,70 mm en el año 1996.
Con respecto a la media nos indica, la suma de valores que toma la variable entre el número
de observaciones, y es la medida de tendencia central más común. En el caso de Sevilla su
media es de 536,0333 mm, mientras que en Granada la media presenta un valor de 360,5533
mm.
El rango es una medida de dispersión absoluta que expresa la diferencia entre los valores
extremos que toma la variable (valores máximos y mínimos), el rango no muestra bien el grado
de dispersión de los datos porque son datos heterogéneos y el rango es una medida no
robusta que se ve afectada por los valores extremos, existentes en las tablas anteriores. En el
caso de Sevilla el rango toma el valor de 633,60 mm, y en el caso de Granada el valor de
447,80 mm.
La varianza es la media de las desviaciones elevado al cuadrado con respecto a la media, en
estos casos la varianza toma unos valores en Sevilla de 31483,823 y en Granada 12011,130.
2
La desviación típica es la diferencia entre cada valor de la variable y una medida de tendencia
central, que normalmente es la media. En estos casos toma unos valores de 177,43681 mm en
Sevilla y de 109,59530 mm en Granada de desviación respecto a la media.
En segundo lugar analizaremos las temperaturas medias anuales de cada estación mediante la
opción Analizarestadísticos descriptivosdescriptivos
Temperaturas Temperaturas
medias anuales N válido (según medias anuales N válido (según
Sevilla lista) Granada lista)
N Estadístico 30 30 N Estadístico 31 31
3
Ahora vamos a calcular los cuartiles que queramos, los percentiles, la mediana y la moda,
mediante la opción Analizar Estadísticos descriptivos Frecuencias para cada una de las
variables y de las estaciones anteriores. Comenzaremos con las precipitaciones.
Estadísticos
Precipitaciones totales anuales Sevilla
N Válidos 30
Perdidos 0
Mediana 507,2500
a
Moda 307,00
Percentiles 10 327,0200
20 372,3800
25 401,3750
30 413,5300
40 448,1600
50 507,2500
60 546,0200
70 607,0400
75 638,0000
80 704,1000
90 811,6900
El primer cuartil coincide con el percentil 25, quiere decir que el 25% de los valores se
encuentran por debajo de 401,3750 mm y el 75% de los valores se encuentran en por encima
de este valor. El segundo cuartil coincide con el percentil 50 y con la mediana, quiere decir que
el 50% de los valores se encuentran por debajo de 507,25 mm y el 50% restante tiene valores
por encima de 507,25 mm. El tercer cuartil coincide con el percentil 75, significa que el 75% de
los valores se encuentran por debajo de 638 mm y el 25%de esos valores están por debajo de
638 mm.
El percentil 10 indica que el 10% de los valores son inferiores a 327,02 mm, mientras que el
90% de los valores se encuentran por encima. Y el percentil 90 indica que el 90% de los valores
se encuentran por debajo de 811,69 mm y el 10% restante está por encima
La curva del histograma es una curva asimétrica, presenta asimetría a la izquierda donde los
valores se concentran en los tres primeros intervalos, entre 300 y 600 mm, su asimetría es de
0,746. Y con respecto al apuntamiento, es una curva leptocúrtica donde los valores se
encuentran apuntados.
La mediana nos expresa el valor de la variable que ocupa la posición central, es decir,
suponiendo que la distribución esta ordenada de mayor a menor, el valor de la variable que
deja a su izquierda y a su derecha la misma frecuencia de observaciones. En este caso la
mediana es de 507,25 mm. Cuanto más cerca estén la media de la mediana más representativa
es la media, en este caso la media es bastante representativa comparándola con la mediana.
La moda, siendo el valor que más se repite de la variable, en este caso, según nos indica la
curva, se encuentra en el intervalo de 500-600 mm, la moda sería de 550 mm.
4
Estadísticos
Precipitaciones totales anuales Granada
N Válidos 30
Perdidos 1
Mediana 353,1000
Moda 213,90 a
Percentiles 10 233,4100
20 246,9000
25 277,4250
30 288,7300
40 319,8200
50 353,1000
60 382,8000
70 388,1800
75 399,1750
80 435,6200
90 511,4100
La mediana es de 353,1 mm, se acerca aún más a la media que en el caso anterior por lo que la
media de las precipitaciones totales anuales de Granada es muy representativa de la realidad,
comparándola con la mediana.
Nos indica esta tabla que existe un valor perdido en los datos, pues en el último de los años
hace referencia a las temperaturas medias pero no existen datos de las precipitaciones.
La curva del histograma es asimétrica la izquierda, por lo que los valores de la variable se
acumulan en los intervalos de la izquierda. Es una curva mesocúrtica, presenta menor
apuntamiento que la del histograma anterior. La moda se observa más claramente en este
gráfico, concretamente la moda es la marca de clase del intervalo entre los valores 350-400
mm, es decir la moda es 375 mm.
El percentil 10 nos indica que el 10% de los valores de la variable se encuentran por debajo de
233,41 mm, mientras que el 90% se encuentra por encima. El percentil 90 indica que el 90% de
los valores se encuentran por debajo de 511,41 mm, y el 10% restante está por debajo.
Los cuartiles dividen la distribución en cuatro partes, el primer cuartil nos dice que el 25% de
los datos están por debajo de 277,425 mm, y el 75% está por encima de este valor. El 50% de
los valores se encuentran por debajo de 353,1 mm y el otro 50% por encima, según el segundo
cuartil. El tercer cuartil indica que el 75% de los datos están por debajo de 399,175 mm, y el
25% restante está por encima de este valor.
5
Continuaremos analizando las temperaturas medias de
las dos estaciones.
Estadísticos
Temperaturas medias anuales Granada
N Válidos 31
Perdidos 0
Mediana 15,1025
Moda 13,90 a
Percentiles 10 14,2094
20 14,5196
25 14,5708
30 14,7396
40 14,8376
50 15,1025
60 15,5552
70 15,6283
75 15,7604
80 15,7696
90 16,1153
La mediana y la media son muy cercanas, así podemos ver que la media es representativa
comparándola con la mediana. La mediana es de 15,1025 ºC, lo que indica que la mitad de los
valores se encuentran por debajo de estos grados y la otra mitad por encima.
El percentil 10 indica que el 10% de los valores se encuentran por debajo de 14,2094 ºC,
mientras que el 90% de los valores están por encima. El percentil 90 indica como el 90% de los
valores están por debajo de 16,1153 ºC, mientras que el 10% es superior.
El primer cuartil explica que el 25% de los valores están por debajo de 14,5708 ºC mientras que
el 75% está por encima. El segundo cuartil indica lo mismo que la mediana. Y el te rcer cuartil
dice que el 25% de los valores están por encima de 15,7696 ºC y el 75% de los valores está por
debajo de estos grados.
La curva del histograma es bastante simétrica, con una asimetría de 0,384, acercándose más al
cero, y a la simetría perfecta, esto indica que la media, la mediana y la moda se encuentran
cercanas. Presenta un apuntamiento o curtosis de -0,104, sus valores se encuentran muy
apuntados, presenta una curva leptocúrtica.
6
Estadísticos
Temperaturas medias anuales Sevilla
N Válidos 30
Perdidos 0
Mediana 18,5021
Moda 17,23 a
Percentiles 10 17,7740
20 17,9128
25 17,9641
30 18,0573
40 18,1733
50 18,5021
60 18,6715
70 18,9138
75 19,3056
80 19,4099
90 19,5745
7
Podemos utilizar también la opción AnalizarEstadísticos descriptivos Explorar.
Está pensada para un primer examen de nuestros datos, que pueda mostrarnos la existencia
de casos atípicos, discontinuidades en los datos o alguna otra peculiaridad. Este procedimiento
te señala los cinco casos extremos por arriba y por abajo, lo que permite identificarlos para un
examen más detallado, es muy interesante cuando el número de observaciones es mayor a 12.
Casos
Valores extremos
Número del
caso Valor
3 17 812,10
4 6 808,00
5 2 765,30
Menores 1 11 307,00
2 23 316,80
3 24 326,90
4 4 328,10
5 3 354,70
8
En el gráfico de caja y bigotes podemos observar a simple vista la asimetría y la poca dispersión
de los datos, observamos que el valor más grande y más pequeño no llega a ser atípico, la caja
contiene el 50% de los casos centrales. Podemos ver también el valor del percentil 75 o el
tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites superior e inferior de
la caja.
Casos
Valores extremos
Número del
caso Valor
3 9 512,00
4 2 506,10
5 6 500,60
Menores 1 23 213,90
2 25 226,70
3 24 232,50
4 4 241,60
5 28 244,80
9
En este gráfico de caja y bigotes observamos la asimetría, podemos ver también el valor del
percentil 75 o el tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites
superior e inferior de la caja. Destaca la presencia de un caso atípico alejado más de 1,5
longitudes de la caja, del percentil 75, siendo este valor el número 27 que es 582,30 mm.
Observamos también un caso extremo alejado más de 3 longitudes de la caja, del tercer
cuartil, el valor 26 que es 661,7 mm.
Casos
Valores extremos
Número del
caso Valor
3 19 16,14
4 27 16,03
5 24 15,96
Menores 1 2 13,90
2 1 13,92
3 6 14,17
4 18 14,36
5 4 14,46
10
En el gráfico de caja y bigotes podemos observar a simple vista la asimetría y la poca dispersión
de los datos, observamos que el valor más grande y más pequeño no llega a ser atípico, la caja
contiene el 50% de los casos centrales. Podemos ver también el valor del percentil 75 o el
tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites superior e inferior de
la caja.
Casos
Valores extremos
Número del
caso Valor
3 19 19,58
4 24 19,56
5 30 19,50
Menores 1 2 17,23
2 1 17,36
3 3 17,77
4 14 17,78
5 6 17,84
11
En el gráfico de caja y bigotes podemos observar a simple vista la asimetría y la poca dispersión
de los datos, observamos que el valor más grande y más pequeño no llega a ser atípico, la caja
contiene el 50% de los casos centrales. Podemos ver también el valor del percentil 75 o el
tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites superior e inferior de
la caja.
En este diagrama observamos como la nube de puntos está totalmente dispersa, es una
relación casi nula.
12
Correlaciones
Precipitaciones Temperaturas
totales anuales medias anuales
Sevilla(mm) Sevilla(ºC)
N 30 30
Temperaturas medias Correlación de Pearson ,089 1
anuales Sevilla(ºC) Sig. (bilateral) ,641
N 30 30
La covarianza es positiva lo que indica que cuando una variable crece o decrece la otra actúa
de la misma manera, tienen una relación directa, o la tendrían si no fuera el coeficiente y la
relación de las variables insignificante. El coeficiente de correlación de Pesaron es de 0,089,
podemos utilizar la escala Guilford para interpretarla, y según esta menos de 0,20 muestra una
correlación ligera, una relación casi insignificante entre las variables, una relación
prácticamente nula de las variables.
me
nsi
on
R cuadrado es la bondad del ajuste, el ajuste no es perfecto, tiene un valor de 0,008, los
valores observados se encuentran alejados de los valores estimados. El 0,8% es explicado por
la recta. Con respecto al Error típ. de la estimación daría cero si fuera perfecto, como no lo es su valor
es de 0,77754.
13
Coeficientes a
Modelo Coeficientes
Coeficientes no estandarizados tipificados
14
Una nube de puntos muy dispersa, la relación es dispersa y negativa, variables muy poco
relacionadas, casi nula la relación también.
Correlaciones
Precipitaciones Temperaturas
totales anuales medias anuales
Granada(mm) Granada(ºC)
N 30 30
Temperaturas medias Correlación de Pearson -,111 1
anuales Granada(ºC) Sig. (bilateral) ,560
N 30 31
me
nsi
on
R cuadrado es la bondad del ajuste, el ajuste no es perfecto, tiene un valor de 0,012, los
valores observados se encuentran alejados de los valores estimados. El 1,2% es explicado por
la recta. Con respecto al Error típ. de la estimación daría cero si fuera perfecto, como no lo es su valor
es de 0,77776.
15
a
Coeficientes
Modelo Coeficientes
Coeficientes no estandarizados tipificados
16