You are on page 1of 37

Mtodos, Diseos y Tcnicas de Investigacin Psicolgica

MINIMANUAL DE ESTADSTICA

Psicopedagoga

Introduccin Conceptos estadsticos: Media Varianza y desviacin tpica Coeficiente de correlacin Regresin lineal Distribucin normal
Universidad Nacional de Educacin a Distancia

Introduccin
Hay cinco conceptos estadsticos que no son objeto propio del programa de esta materia pero que es necesario conocer para poder comprender los conceptos estadsticos que s son propios del bloque 2 del programa de la asignatura. El tratamiento dado en la Unidad Didctica a estos conceptos es un cuadro de texto en el que se proporciona una definicin del concepto en cuestin, su frmula y un ejemplo. El alumno que desee una informacin ms detallada, as como ejemplos adicionales sobre estos conceptos estadsticos previos a los propios del programa lo encontrar en este minimanual.

CONCEPTOS ESTADSTICOS QUE NO SON OBJETO PROPIO DEL PROGRAMA DE LA ASIGNATURA


Media Varianza Distribucin normal de una variable Coeficiente de correlacin Modelo de regresin

CONCEPTOS ESTADSTICOS QUE S SON OBJETO PROPIO DEL PROGRAMA DE LA ASIGNATURA A continuacin, se indica una relacin de cuestiones relativas al bloque 2 del programa que exigen el clculo de algunos ndices estadsticos:

Determinacin de la puntuacin de un sujeto en un tem y en un test Clculo de puntuaciones cronolgicas, centiles y tpicas Estimacin del error de medida cometido al evaluar a un sujeto (o grupo) con un test Estimacin de la caracterstica de inters que evala un test Estimacin de la calidad mtrica de un test, tanto de la prueba en su conjunto como de cada tem que la integra.

Media Aritmtica
1. Definicin y frmula
La media aritmtica es el ndice de tendencia central definido como la suma de los valores observados, dividido por el nmero de ellos. Junto con la mediana y la moda se caracteriza por proporcionar un resumen numrico de los valores que adopta la variable y ser la medida de tendencia central ms utilizada. Segn su definicin, si tenemos N valores de la variable X, entonces la media aritmtica responde a la siguiente expresin:

= X=

i =1

Xi N

donde: Xi son los distintos valores adoptados por la variable; N es el nmero total de observaciones. Ntese que la media de una variable se denota con la misma letra que representa a la variable con una lnea horizontal encima. En cualquier caso si los datos provienen de una poblacin en lugar de una muestra la notacin correcta corresponde a la letra griega. Para poder utilizar la media aritmtica la escala de medida debe ser al menos de intervalo. Si la escala de medida es solo nominal u ordinal, entonces es conveniente calcular la mediana o la media, como medida de la tendencia central de los datos.

2. Clculo en una Distribucin de Frecuencias


Si el nmero de datos de una variable es grande es conveniente agruparlos en una distribucin de frecuencias para facilitar los clculos. La frmula quedara de la siguiente manera: =X=

f iX i
N

donde: f i es el nmero de veces que se ha observado el valor Xi de la variable X; Xi son los distintos valores adoptados por la variable (si los datos estn agrupados en intervalos es el punto medio de dicho intervalo); N es el nmero total de observaciones. Si los datos estn agrupados en intervalos, para realizar los clculos se asume el supuesto de concentracin en el punto medio del intervalo. Esto significa que utilizamos como valor Xi la semisuma de los lmites del intervalo, denominada marca de clase. Por ejemplo, si un intervalo comprende las puntuaciones 5-9, el valor Xi correspondiente es (5+9)/2 = 7.

3. Propiedades
1) La media es funcin de todas y cada una de las puntuaciones de la distribucin. Basta que cambie un valor cualquiera de la misma para que vare el valor de la media. Por tanto, no se debe calcular si existe algn valor extremo que distorsione su interpretacin. En este caso sera ms apropiado utilizar la mediana, que tan solo es sensible a las variaciones en los valores centrales.

2) La suma de las diferencias de n puntuaciones con respecto a su media, o puntuaciones diferenciales, es igual a 0:

=0

donde x i es la puntuacin diferencial definida como x i = Xi - 3) La suma de los cuadrados de las desviaciones de unas puntuaciones con respecto a su media es menor que con respecto a cualquier otro valor:

( X i X ) 2 < (X i c ) 2
donde c es un valor distinto de la media. 4) Si a todas las puntuaciones de una distribucin se le suma una constante arbitraria, la media de la nueva variable as generada es igual a la media de la variable original ms el valor de la constante que se ha sumado a cada puntuacin: Y = X +k donde Y = X + k. 5) Si todas las puntuaciones de una variable son multiplicadas por una constante, el valor de la media de la nueva distribucin es igual al valor de la media de la distribucin original multiplicada por el valor de la constante. Es decir:

Y = kX
donde Y = k.X. 6) Si los valores de una variable son transformados linealmente por una ecuacin del tipo Y = A + BX, donde A y B son constantes arbitrarias, el valor de la media de la nueva variable es igual al valor de la media de la variable original multiplicada por la constante multiplicativa ms el valor de la constante aditiva. Es decir:

Y = A + BX

4. Ejemplos
Ejemplo 1: Cul es la nota media en selectividad de un alumno que en la convocatoria de junio ha obtenido las siguientes calificaciones? Lenguaje 4,5 Matemticas II 7,5 Idioma 8 Historia del Mundo Contemporneo 6,5

Historia del Arte 5,5 Comentario de Texto 6

Ejemplo 2: Se est realizando un estudio sociolgico acerca del nmero de coches que tienen las familias espaolas. Los datos de la tabla corresponden a 100 familias que estn compuestas como mnimo por dos miembros con carnet de conducir y como mximo por cuatro. Cul es el nmero medio de vehculos que poseen estas familias?

X 0 1 2 3 4

f 2 20 35 38 5

Ejemplo 3 Calcula la media de las puntuaciones obtenidas por 200 escolares en un test de razonamiento abstracto X, cuya distribucin de frecuencias es la siguiente: X f 10-14 9 15-19 13 20-24 21 25-29 45 30-34 57 35-39 33 40-44 16 45-49 6

Ejemplo 4: Calcula la media de la variable estatur a en dos muestras de deportistas juveniles, que practican ftbol y baloncesto respectivamente. Ftbol: 175, 170, 180, 160, 190. Baloncesto: 185, 190, 194, 182 197.

Solucin al ejemplo 1: Para resolver el ejercicio aplicamos la frmula de la media de la siguiente manera:

= X=

i =1

Xi N

4,5 + 7,5 + 8 + 6,5 + 5,5 + 6 38 = = 6,33 6 6

Su nota media en selectividad es 6,33.

Solucin al ejemplo 2: Para realizar los clculos se suele aadir a la distribucin una columna con los productos de cada valor por su frecuencia. X f Xf 0 2 0 1 20 20 2 35 70 3 38 114 4 5 20 Total 100 224 = X =

f iX i
N

0 + 20 + 70 + 114 + 20 224 = = 2, 24 100 100

Solucin al ejemplo 3: X 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 Total
=X=

Marca de clase 12 17 22 27 32 37 42 47

f 9 13 21 45 57 33 16 6 200

fX 108 221 462 1215 1824 1221 672 282 6005

f i X i = 108 + 221 + 462 + 1215 + 1824 + 1221 + 672 + 282 = 6005 = 30,025
N 200 200

Solucin al ejemplo 4:
XF = 175 + 170 + 180 + 160 + 190 875 = = 175 5 5 185 + 190 + 194 + 182 + 197 948 = = 189 ,6 5 5

XB =

La media en estatura de los jugadores de baloncesto es mayor que la de los jugadores de ftbol.

Varianza y desviacin tpica


1. Definicin y frmulas
La variabilidad, dispersin u homogeneidad de un conjunto de datos hace referencia al grado en que stos se parecen o se diferencian entre s. En un conjunto de puntuaciones indicarn si existe ms o menos heterogeneidad entre los datos, esto es, no proporcionan informacin sobre la tendencia central o general de los datos sino sobre lo dispersos o variables que son stos. Aunque hay muchos procedimientos para cuantificar la variabilidad, los ms importantes son la varianza y la desviacin tpica. Otros ndices menos utilizados son la desviacin media, la amplitud total, la amplitud semiintercuartil y el coeficiente de variacin.

La varianza se calcula con la siguiente frmula:

2 x =

(X i x ) 2
i =1

donde: Xi denota los valores de la variable X; x es la media de la variable X ; N es el nmero total de observaciones.

Hay otra manera ms prctica y sencilla de calcular la varianza:

2 x =

X2 i
i=1

2 x

Ambas frmulas son equivalentes, como puedes comprobar a continuacin: 2 X =

(X i ) 2
N

2 2 (X 2 X2 i + 2 Xi ) i + 2 Xi =

2 X =

2 Xi + N 2 2 X i

2 X

X2 i
N

+ 2 =
2 2

X2 i
N

La desviacin tpica se define como la raz cuadrada de la varianza, por lo que su frmula es:

x =

(X i )
i=1

X2 i
i =1

2. Clculo en una Distribucin de Frecuencias


Si el nmero de datos de una variable es grande es conveniente agruparlos en una distribucin de frecuencias para facilitar los clculos. L a frmula quedara de la siguiente manera:

f i (X i )2 f i X 2 i =S = = 2
2 x 2 x

donde:
2 x es la varianza poblaciona l de la variable X; S2 x es la varianza muestral de la variable X;

f i es la frecuencia absoluta; Xi son los valores de la variable (si los datos estn agrupados en intervalos su punto medio); N es el nmero total de observaciones. La forma de proceder cuando los datos estn agrupados en intervalos es la misma que en el caso de la media aritmtica.

3. Propiedades
1) La varianza y la desviacin tpica son funcin de todas y cada una de las puntuaciones que componen una muestra o poblacin. 2) Su valor (tanto el de la varianza como el de la desviacin tpica) siempre es positivo, ya que el caso de menor varianza posible se produce cuando todos los valores son iguales, por lo que las desviaciones de los valores con respecto a su media son cero, y en consecuencia tambin es cero la varianza. 3) Si a todas las puntuaciones de una variable X se les suma una constante a, tanto la varianza como la desviacin tpica de la nueva variable Y es igual a la varianza o a la desviacin tpica de la variable original: 2 S = Sx SY2 = S X y y 4) Si multiplicamos por una constante a un conjunto de puntuaciones, la varianza de la nueva variable Y es igual a la varianza de la variable original X multiplicada por el cuadrado de la constante multiplicativa k . Por su parte, la desviacin tpica de la nueva variable es igual a la desviacin tpica de la variable original multiplicada por el valor absoluto de la constante multiplicativa.
2 SY2 = k 2 S X

SY = k S X

donde Y = kX

4. Ejemplos
Ejemplo 1: Calcula la varianza y la desviacin tpica de la variable estatura en dos muestras de deportistas juveniles, que practican ftbol y baloncesto respectivamente. Qu grupo presenta una mayor variabilidad? Ftbol: 175, 170, 180, 160, 190. Baloncesto: 185, 190, 194, 182 197.

Ejemplo 2: Calcula la desviacin tpica de las variables A y B: A 4 6 7 10 13 40 B 2 7 11 3 15 38

Ejemplo 3: Calcula la varianza de las puntuaciones obtenidas por una muestra de 200 escolares en un test de razonamiento abstracto X, cuya distribucin de frecuencias es la siguiente: X f
10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 9 13 21 45 57 33 16 6

Solucin al ejemplo 1:
XF = 175 + 170 + 180 + 160 + 190 875 = = 175 5 5 175 2 + 170 2 + 180 2 + 160 2 + 190 2 153625 175 2 = 30625 = 30725 30625 = 100 5 5

S2 X =
F

S X = 100 = 10
F

XB =

185 + 190 + 194 + 182 + 197 948 = = 189 ,6 5 5 185 2 + 190 2 + 194 2 + 182 2 + 197 2 179894 189 ,6 2 = 35948 ,16 = 35978 ,8 35948 ,16 = 30 ,64 5 5

S2 X =
B

S X = 30 , 64 = 5,54
B

La varianza y la desviacin tpica son menores en el grupo de jugadores de baloncesto. Esto quiere decir que hay menor variacin en la estatura de los jugadores de baloncesto que en los de ftbol.

Solucin al ejemplo 2: A 4 6 7 10 13 40 B 2 7 11 3 15 38 A2 16 36 49 100 169 370 B2 4 49 121 9 225 408

XA =

40 =8 5

XB =

38 = 7,6 5

S XA =

370 82 = 10 = 3,16 5 408 7,6 2 = 23,84 = 4,88 5

S XB =

Solucin al ejemplo 3:

Intervalos 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49

Marca de clase 12 17 22 27 32 37 42 47

f
9 13 21 45 57 33 16 6 200

fX
108 221 462 1215 1824 1221 672 282 6005

X2
144 289 484 729 1024 1369 1764 2209

fX2
1296 3757 10164 32805 58368 45177 28224 13254 193045

Total
X=

f i X i = 108 + 221 + 462 + 1215 + 1824 + 1221 + 672 + 282 = 6005 = 30,025
N 200 200

S x2 =

193045 30,025 2 = 63,724 200

Correlacin Lineal
1. Introduccin
Generalmente, en las ciencias humanas interesa el estudio no slo de cada una de las variables aisladas sino de las relaciones entre variables, habiendo desarrollado la estadstica instrumentos apropiados para esta tarea. Son dos bsicamente los ndices que se utilizan para cuantificar la relacin existente entre variables: la covarianza y la correlacin. La covarianza es un ndice que discrimina entre diferentes asociaciones lineales pero tiene el inconveniente de carecer de unos valores mximos y mnimos estables, comunes a todos los casos, que permitan su interpretacin directa. Esta dificultad la supera el coeficiente de correlacin de Pearson. Para utilizar cualquiera de estos dos ndices es necesario que: 1. la relacin entre ambas variables sea lineal, es decir, el diagrama de dispersin ha de mostrar una nube de puntos semejante a una lnea recta. En el caso de que haya relacin entre ambas variables pero sta sea curvilnea es conveniente el empleo del coeficiente eta, tambin llamado razn de correlacin. 2. las variables que se van a correlacionar sean de naturaleza cuantitativa, esto es, que puedan expresarse en escalas de intervalo o de razn. En el caso de las

escalas ordinales se debe utilizar el coeficiente de correlacin lineal de Spearman o el coeficiente de Kendall. Si la escala de las variables es nominal se puede utilizar el coeficiente C de contingencia.

2. Definiciones y Frmulas
Covarianza Es un ndice de la relacin lineal basado en el promedio de productos cruzados de puntuaciones diferenciales. Su valor es positivo si la relacin es directa, negativo si es inversa y en torno a cero si es nula; adems, su valor absoluto ser mayor cuanto ms acusada sea la tendencia a la linealidad en el diagrama de dispersin. Se representa por si los datos provienen de una poblacin y por Sxy si provienen de una muestra, siendo sus frmulas:
xy

x y X X Yi Y X Y xy = SXY = i i = i = i i X Y N N N
donde: xy es la covarianza en una pob lacin ; Sxy es la covarianza en una muestra; xi, yi son las puntuaciones diferenciales de las variables X e Y;
x = X X y = YY X es la media de la variable X ;
Y es la media de la variable Y ;

[(

)(

)]

N es el nmero total de observaciones.

Coeficiente de Correlacin de Pearson El coeficiente de correlacin lineal de Pearson es un ndice de la asociacin lineal que consiste en hallar un promedio de productos cruzados, pero no de las puntuaciones diferenciales sino de las tpicas. Se representa por la letra griega por la letra r (dependiendo si los datos provienen de una poblacin o de una muestra) y sus frmulas son:

xy = rxy =

[N X
xi

N Xi Yi X i Yi
2 i 2

( Xi ) N Yi2 ( Yi )

][

rxy = rxy =

z yi yi

N N Sx S y S xy Sx Sy

rxy =

donde:
xy es el coeficient e de correlaci n lineal de Pearson en una poblacin ;

rxy es el coeficiente de correlacin lineal de Pearson en una muestra; N es el nmero total de observaciones; zx , zy , son las puntuaciones tpicas de las variables X e Y X X Y Y zx = zy = Sx Sy xi, yi son las puntuaciones diferenciales de las variables X e Y;
x = X X y = YY

Sx es la desviacin tpica de la variable X; Sy es la desviacin tpica de la variable Y; Sxy es la covarianza entre las variables X e Y.

3. Interpretacin
El coeficiente de correlacin lineal de Pearson no puede valer ms que uno ni menos que menos uno. Una correlacin en torno a cero indica una relacin lineal baja o nula, esto es, una variable poco o nada tiene que ver con la otra; una correlacin positiva indica una relacin lineal directa, cunto ms se acerca a uno mayor es la relacin existente entre las variables, y una correlacin negativa i ndica una relacin inversa, cunto ms se acerque a menos uno ms fuerte es la relacin que existe entre las variables. En una relacin lineal directa a mayores valores de la variable X nos encontramos con valores altos de la variable Y y los valores bajos de la variable X se corresponden con valores bajos de la variable Y. En una relacin lineal inversa los valores altos de X se corresponden con valores bajos de Y y viceversa.

Que exista correlacin entre dos variables no quiere decir que entre ambas haya una relacin de causalidad, nicamente nos est indicando que hay una covariacin, una variacin conjunta o concomitante entre las variables, pero NO que una variable sea causa de la otra.

4. Ejemplos
Ejemplo 1: Estamos investigando la posible relacin existente entre las variables autoestima y depresin, en un grupo de 10 pacientes aquejados en los ltimos 5 aos de problemas de esta ndole. Los datos obtenidos son los siguientes: Autoestima Depresin 2 2.5 3 2.5 4 3 1 2 5 4 3 2.5 8 6 6 5 4 3.5 3 3.5 Podra decirse que hay relacin entre las dos variables? De qu tipo? Realiza los clculos necesarios para justificar tu respuesta.

Ejemplo 2: El encargado de la seleccin de personal de una empresa dedicada a la ve nta de enciclopedias desea conocer la relacin entre el nmero de ventas diarias (Y) y la fluidez verbal (X) del vendedor. Para ello dispone de una serie de datos de antiguos trabajadores, que se muestran en la tabla: X Y 1 2 5 4 6 5 6 3 2 1 Calcula e interpreta el coeficiente de correlacin lineal de Pearson.

Solucin al ejemplo 1: Autoestima Depresin X Y 2 2,5 3 2,5 4 3 1 2 5 4 3 2,5 8 6 6 5 4 3,5 3 3,5 39 34,5 XY 5 7,5 12 2 20 7,5 48 30 14 10,5 156,5 X2 4 9 16 1 25 9 64 36 16 9 189 Y2 6,25 6,25 9 4 16 6,25 36 25 12,25 12,25 133,25

rxy = =

[N X

N Xi Yi X i Yi
2 i 2

( Xi ) N Y ( Yi )
2 i 2 2

][

= 1565 1345,5 369 142,25 = 219,5 = 0,96 229,11

[10 189 39 ][10 133,25 34,5 ]

10 156,5 39 34,5

Existe una estrecha relacin lineal directa entre ambas variables.

Solucin al ejemplo 2: Para facilitar los clculos aadimos las siguientes columnas: X 1 5 6 6 2 20 Y 2 4 5 3 1 15 XY 2 20 30 18 2 72 X2 1 25 36 36 4 102 Y2 4 16 25 9 1 55

rxy = =

[N X

N X i Yi X i Yi
2 i 2

( X i ) N Y ( Yi )
2 i 2 2

][

= = 60 = 0,81 74,16

[5 102 20 ][5 55 15 ]

5 72 20 15

360 300 110 50

El valor del coeficiente de correlacin lineal es alto y su signo es positivo, por lo que existe una relacin lineal directa entre el nmero de ventas diarias y la fluidez verbal del vendedor. Esto quiere decir que a mayor fluidez verbal del vendedor mayor nmero de ventas realizar y a la inversa, cuanto menor fluidez verbal menor ser el nmero de ventas.

Regresin Lineal
1. Introduccin
La regresin es un procedimiento estadstico que utiliza la informacin contenida en las relaciones lineales observadas entre variables para, conociendo la puntuacin de un sujeto en una variable, pronosticar su puntuacin en la otra. El concepto de regresin proviene del ilustre psiclogo Sir Francis Galton (18221911) que, analizando la estatura de una muestra numerosa de padres e hijos, advirti que los hijos de padres altos eran tambin, en general, superiores en estatura al promedio de la poblacin, pero no tan altos como sus progenitores. Algo parecido ocurra con los hijos de padres bajos que, an siendo ms bajos que el promedio, no eran, por trmino general, tan bajos como ellos. De estas observaciones dedujo que se produca en los hijos lo que el llam una regresin a la media de la distribucin, esto es, que los valores tendan a regresar a la media de la variable. A partir de aqu, busc una ecuacin matemtica que sirviera para estimar los valores que adoptaran en una variable sujetos para los que se conoce sus puntuaciones en otra variable y la relacin entre ambas. Sus estudios fueron continuados y ampliamente desarrollados por Karl Pearson (1857-1936). La tcnica de la regresin se basa en las ecuaciones de la recta en el plano, esto es, en funciones lineales. Si la relacin entre dos variables X e Y es lineal, sta ser de la forma: Y = A + BX donde: A es una constante que se denomina ORIGEN, porque corresponde al valor que adopta la variable Y cuando la variable X vale cero. Por tanto, indica el origen, el punto en el que la recta corta al eje de ordenadas. B es una constante que se denomina PENDIENTE, porque de ella depende la inclinacin de la recta. Indica en cunto cambian los valores de Y por cada incremento de una unidad en los valores de X.

La precisin de la prediccin depender, entre otros factores, de la funcin, siendo ms precisas nuestras predicciones cunto ms lineal observada entre las variables del modelo. Para saber si existe relacin variables, se puede realizar una inspeccin visual del diagrama de representa grficamente dicha relacin.

linealidad de la sea la relacin lineal entre dos dispersin que

2. Ecuaciones de regresin
La ecuacin de regresin de Y sobre X es: Y = A+ BX Los coeficientes A (origen) y B (pendiente) se obtienen mediante las frmulas:

N XY X Y B= 2 N X 2 ( X )
A =Y B X

B = rXY

SY SX

A = Y r xy

Sy Sx

donde: N es el nmero de observaciones; rxy es el coeficiente de correlacin lineal de Pearson entre las variables X e Y; Sy es la desviacin tpica de la variable Y; Sx es la desviacin tpica de la variable X; X es la media de la variable X ; Y es la media de la variable Y .

3. Valoracin del modelo


Para examinar la utilidad predictiva de un modelo de regresin, esto es, para determinar hasta qu punto un modelo de regresin permite predecir con garantas los valores -desconocidos- en una variable a partir de los valores -conocidos- en otra variable, se puede utilizar

1. la varianza error 2. el coeficiente de determinacin 1. La varianza error La varianza error es la varianza de los errores cometidos al pronosticar la variable Y a partir de la variable X, esto es, nos proporciona una medida de la variabilidad de estos errores, definidos como la diferencia entre la puntuacin que realmente obtendra el sujeto en esa variable (Y) y la puntuacin que se le ha pronosticado con el modelo de regresin a partir de su valor en la variable X (Y'). Esto es:
E = Y Y

2 2 2 e = ( y y ) = y. x =

(Yi Yi )
N i =1

2 = 2 y 1 xy

donde:

2 es en la variable Y; y es la varianza de las puntuacion


2 xy es el coeficient e de correlaci n entre las variables X e Y elevado al cuadrado; N es el nmero de sujetos. 2. El coeficiente de determinacin El coeficiente de determinacin es igual al coeficiente de correlacin de Pearson 2 elevado al cuadrado, rxy , e indica la proporcin de varianza de la variable pronosticada o criterio que queda explicada por ese modelo lineal, por la variable predictora. En particular:

r = 1
2 xy

S2 y. x S2 y

S2 y S2 y

donde:
2 rxy es el coeficient e de determinacin;

S2 y. x es la varianza error; S2 da o criterio; y es la varianza de la variable pronostica


S2 y es la varianza de las puntuacion es pronostica das en el criterio con la recta de regresin.

4. Ejemplos
Ejemplo 1: Cierta empresa necesita contratar para su plantilla fija un determinado nmero de vendedores. El encargado de la seleccin de personal desea pronosticar el nmero de ventas diarias (Y) a partir de la fluidez verbal (X) del aspirante. Para ello, dispone de una serie de datos de antiguos trabajadores, que se muestran en la tabla:

X 1 5 6 6 2

Y 2 4 5 3 1

Calcula la recta de regresin del nmero de ventas diarias sobre la fluidez verbal.

Ejemplo 2: Estamos investigando la posible relacin existente entre las variables autoestima y depresin, en un grupo de 10 pacientes aquejados en los ltimos 5 aos de problemas de esta ndole. Los datos obtenidos son los siguientes: Autoestima Depresin 2 2.5 3 2.5 4 3 1 2 5 4 3 2.5 8 6 6 5 4 3.5 3 3.5 a) Halla la recta de regresin que permite predecir el grado de depresin a partir del nivel de autoestima. b) Haz una valoracin del modelo lineal hallado. c) Qu nivel de depresin pronosticaras a una persona de caractersticas idnticas a las del grupo investigado, sabiendo que su nivel de autoestima es 6?

Solucin del ejemplo 1: Para facilitar los clculos aadimos las siguientes columnas: X 1 5 6 6 2 20 Y 2 4 5 3 1 15 XY 2 20 30 18 2 72 X2 1 25 36 36 4 102

B=

N XY X Y 5 72 15 20 60 = = = 0,55 5 102 202 110 N X2 ( X)2


20 =4 5

X=

A = Y BX = 3 0,55 4 = 3 2,18 = 0,82

Y = A + BX = 0,82 + 0,55X

Solucin al ejemplo 2: a) Autoestima Depresin X Y 2 2,5 3 2,5 4 3 1 2 5 4 3 2,5 8 6 6 5 4 3,5 3 3,5 39 34,5 XY 5 7,5 12 2 20 7,5 48 30 14 10,5 156,5 X2 4 9 16 1 25 9 64 36 16 9 189 Y2 6,25 6,25 9 4 16 6,25 36 25 12,25 12,25 133,25

B=

N XY X Y N X ( X )
2 2

10 156,5 39 34 ,5 219,5 = = 0,59 369 10 189 39 2


34,5 = 3, 45 10

X=

39 = 3,9 10

Y=

A = Y BX = 3, 45 0,59 3,9 = 3,45 2,3 = 1,15 Y = A + BX i = 1,15 + 0,59X i


b)

rxy = =

[N X

N Xi Yi X i Yi
2 i 2

( Xi ) N Y ( Yi )
2 i 2 2

][

= 1565 1345,5 369 142,25 = 219,5 = 0,96 229,11

[10 189 39 ][10 133,25 34,5 ]

10 156,5 39 34,5

2 rxy = 0,96 2 = 0,92

El 92% de la varianza de las puntuaciones en depresin se puede predecir a partir de las puntuaciones en la variable ansiedad. Por su parte, la varianza de los errores cometidos en los pronsticos es la siguiente:
2 2 S2 1,42 ) 1 0,96 2 = 0,11 y .x = S y 1 rxy = (

S2 y = c)

133, 25 3,45 2 = 1,42 10

Y = A + BX i = 1,15 + 0,59X i = 1,15 + 0,59 6 = 1,15 + 3,54 = 4, 69 Le pronosticaramos 4,69 puntos en depresin.

Distribucin Normal
1. Definicin y frmula
La distribucin de probabilidad de una variable nos indica qu probabilidad de ocurrencia tiene cada uno de los posibles valores de dicha variable. La distribucin normal es un tipo de distribucin continua de probabilidad que engloba a todo un conjunto de distribuciones que tienen en comn una serie de caractersticas. Esta distribucin es de gran importancia en las ciencias sociales, por su utilidad para el anlisis estadstico y, sobre todo, porque gran parte de las variables de inters para estos profesionales tienen distribuciones muy semejantes a la normal (como, por ejemplo, el cociente intelectual, el peso, la estatura, la extraversin, el razonamiento espacial, etc.) Matemticamente, una variable se distribuye normalmente, con parmetros y , si la probabilidad de que ocurra un determinado valor x de dicha variable viene dada por la siguiente frmula:

f (x ) =
donde: es el nmero pi, igual a 3,1416;

1 2 2

( X )2
2 2

es la desviacin tpica de la variable X; e es el nmero e, igual a 2,718; es la media de la variable X.

Ejemplo: Supongamos que el cociente intelectual es una variable que vara aleatoriamente en la poblacin de estudiantes de enseanza secundaria. Supongamos, asimismo, que estimamos el cociente intelectual de una muestra de 100 nios del ltimo curso de la ESO, obteniendo los siguientes valores:

96 110 100 105 89 87 92 111 115 99

102 118 115 110 90 92 96 98 100 105

103 105 98 93 97 89 88 95 96 93

92 105 106 105 101 98 103 96 80 112

109 87 94 118 107 103 112 115 95 96

99 112 104 103 106 98 95 99 87 79

103 118 98 96 100 86 115 95 120 119

90 99 86 89 110 102 98 90 87 118

108 100 117 95 99 103 115 89 101 97

98 75 124 99 106 84 79 124 130 80

A la vista de estos datos, se puede decir que esta variable se distribuye normalmente? Para responder a esta cuestin, tenemos que hacer lo siguiente: 1. Calcular la distribucin de frecuencias con los valores obtenidos para el cociente intelectual de los alumnos de la muestra. 2. Calcular la probabilidad terica de obtener cada uno de los valores de la distribucin de frecuencias emprica. 3. Comparar la frecuencia emprica con la probabilidad terica de cada valor de la distribucin de frecuencias: :::: si los valores son semejantes, la distribucin obtenida es aproximadamente normal :::: si los valores son diferentes, la distribucin obtenida no se distribuye normalmente.

1. Clculo de la distribucin de frecuencias : Para construir la distribucin de frecuencias del cociente intelectual, lo nico que tenemos que hacer es ver qu valores distintos ha adoptado ste en la muestra bajo estudio (columna X) y cuntas veces ha aparecido cada uno de esos valores en nuestra muestra (columna f):

X
75 79 80 84 86 87

f
1 2 2 1 2 4

88 89 90 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 115 117 118 119 120 124 130 Total

1 4 3 3 2 1 5 6 2 7 6 4 2 2 6 1 5 3 1 1 1 3 1 3 5 1 4 1 1 2 1 100

Podemos aadir una nueva columna a la tabla anterior, dividiendo el valor de la columna f por el nmero de sujetos de la muestra. De este modo, dispondramos de la frecuencia relativa o proporcin emprica de cada valor del cociente intelectual:

X
75 79 80 84 86 87 88 89 90 92 93 94 95 96 97 98 99

f
1 2 2 1 2 4 1 4 3 3 2 1 5 6 2 7 6

fr
0,01 0,02 0,02 0,01 0,02 0,04 0,01 0,04 0,03 0,03 0,02 0,01 0,05 0,06 0,02 0,07 0,06

100 101 102 103 104 105 106 107 108 109 110 111 112 115 117 118 119 120 124 130 Total

4 2 2 6 1 5 3 1 1 1 3 1 3 5 1 4 1 1 2 1 100

0,04 0,02 0,02 0,06 0,01 0,05 0,03 0,01 0,01 0,01 0,03 0,01 0,03 0,05 0,01 0,04 0,01 0,01 0,02 0,01 1

2. Clculo de la probabilidad terica Para calcular la probabilidad terica de observar cada uno de los posibles valores del cociente intelectual estimados para los alumnos de nuestra muestra, lo nico que tenemos que hacer es aplicar la frmula anterior sustituyendo X por cada valor de la distribucin de frecuencias y la media y la varianza por su valor: X
75 79 80 84 86 87 88 89 90 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108

f
1 2 2 1 2 4 1 4 3 3 2 1 5 6 2 7 6 4 2 2 6 1 5 3 1 1

fX
75 158 160 84 172 348 88 356 270 276 186 94 475 576 194 686 594 400 202 204 618 104 525 318 107 108

X2
5625 6241 6400 7056 7396 7569 7744 7921 8100 8464 8649 8836 9025 9216 9409 9604 9801 10000 10201 10404 10609 10816 11025 11236 11449 11664

fX2
5625 12482 12800 7056 14792 30276 7744 31684 24300 25392 17298 8836 45125 55296 18818 67228 58806 40000 20402 20808 63654 10816 55125 33708 11449 11664

109 110 111 112 115 117 118 119 120 124 130 Total

1 3 1 3 5 1 4 1 1 2 1 100

109 330 111 336 575 117 472 119 120 248 130 10045

11881 12100 12321 12544 13225 13689 13924 14161 14400 15376 16900 384981

11881 36300 12321 37632 66125 13689 55696 14161 14400 30752 16900 1021041

fX 10045 = X = i i = = 100,45 N 100 1021041 fi X 2 i 2 = 100,45 2 = 10210 ,41 10090, 20 = 120, 21 N 100

2 X =

f (X = 75) =

1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21

(75 100, 45 )2
2 120, 21

= 0,00

f (X = 79) =

(79 100, 45 )2
2 120, 21

= 0,01

f (X = 80) =

(80 100,45 )2
2120, 21

= 0,01

f (X = 84) =

(84 100,45 )2
2120, 21

= 0,01

f (X = 86) =

(86 100, 45 )2
2 120, 21

= 0,02

f (X = 87) =

(87 100, 45 )2
2120, 21

= 0,02

f (X = 88) =

1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21

(88100, 45 )2
2 120, 21

= 0,02

f (X = 89) =

(89 100, 45 )2
2120, 21

= 0,02

f (X = 90 ) =

(90 100, 45 )2
2 120, 21

= 0,02

f (X = 92) =

(92 100, 45 )2
2120,21

= 0,03

f (X = 93) =

(93100, 45 )2
2 120, 21

= 0,03

f (X = 94) =

(94 100, 45 )2
2120,21

= 0,03

f (X = 95) =

(95 100, 45 )2
2120, 21

= 0,03

f (X = 96) =

(96 100, 45 )2
2120,21

= 0,03

f (X = 97 ) =

(97100,45)2
2120,21

= 0,03

f (X = 98) =

(98 100, 45 )2
2120, 21

= 0,04

f (X = 99) =

(99100, 45 )2
2120, 21

= 0,04

f (X = 100 ) =

1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21

(100 100 ,45 )2


2 120, 21

= 0,04

f (X = 101) =

(101100, 45 )2
2 120, 21

= 0,04

f (X = 102 ) =

(102 100 ,45 )2


2 120, 21

= 0,04

f (X = 103 ) =

(103100 ,45 )2
2 120, 21

= 0,04

f (X = 104 ) =

(104 100 ,45 )2


2 120, 21

= 0,03

f (X = 105 ) =

(105100, 45 )2
2120 ,21

= 0,03

f (X = 106 ) =

(106 100 ,45 )2


2 120, 21

= 0,03

f (X = 107 ) =

(107 100, 45 )2
2120, 21

= 0,03

f (X = 108 ) =

(108100, 45 )2
2120 ,21

= 0,03

f (X = 109 ) =

(109 100 ,45 )2


2 120, 21

= 0,03

f (X = 110 ) =

1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21 1 2 3,1416 120,21

(110 100 ,45 )2


2 120, 21

= 0,02

f (X = 111) =

(111100, 45 )2
2 120, 21

= 0,02

f (X = 112 ) =

(112 100 ,45 )2


2 120, 21

= 0,02

f (X = 115 ) =

(115100, 45 )2
2120 ,21

= 0,02

f (X = 117 ) =

(117100, 45 )2
2120, 21

= 0,01

f (X = 118 ) =

(118100, 45 )2
2120 ,21

= 0,01

f (X = 119 ) =

(119 100 ,45 )2


2 120, 21

= 0,01

f (X = 120 ) =

(120 100 ,45 )2


2 120, 21

= 0,01

f (X = 124 ) =

(124 100 ,45 )2


2 120, 21

= 0,00

f (X = 130 ) =

(130 100 ,45 )2


2 120, 21

= 0,00

3. Comparacin de la frecuencia emprica con la probabilidad terica Para facilitar la comparacin de estos dos valores, podemos construir una nueva tabla en la que pondremos la columna de la frecuencia relativa de cada valor de la distribucin de frecuencias junto a su correspondiente probabilidad terica:

fr 0,01 0,02 0,02 0,01 0,02 0,04 0,01 0,04 0,03 0,03 0,02 0,01 0,05 0,06 0,02 0,07 0,06 0,04 0,02 0,02 0,06 0,01 0,05 0,03 0,01 0,01 0,01 0,03 0,01 0,03 0,05 0,01 0,04 0,01 0,01 0,02 0,01

Pt 0,00 0,01 0,01 0,01 0,02 0,02 0,02 0,02 0,02 0,03 0,03 0,03 0,03 0,03 0,03 0,04 0,04 0,04 0,04 0,04 0,04 0,03 0,03 0,03 0,03 0,03 0,03 0,02 0,02 0,02 0,02 0,01 0,01 0,01 0,01 0,00 0,00

Una mera inspeccin visual nos dice que en ambas columnas los valores obtenidos son muy semejantes, es decir, que los valores mostrados por los alumnos de la muestra

son muy semejantes a los que se predicen desde la teora. Por consiguiente, se puede decir que la variable COCIENTE INTELECTUAL se distribuye normalmente. NOTA IMPORTANTE: Existen ndices estadsticos que nos permiten determinar claramente si las dos columnas son realmente muy semejantes (y, por tanto, la variable se distribuye normalmente) o si, por el contrario, los valores empricos y tericos obtenidos son lo suficientemente diferentes como para no poder concluir que dicha variable se distribuye normalmente.

2. Caractersticas
1) La representacin grfica de una variable que se distribuye normalmente se asemeja a una campana y, al igual que en cualquier otra distribucin de probabilidad, el rea que queda bajo su curva es igual a la unidad:

La curva es asintntica, se extiende indefinidamente en las dos direcciones del continuo de valores sin tocar nunca el eje de abcisas. 3) Es simtrica con respecto a un valor central () , y en ese valor central coinciden la media (o valor esperado), la mediana (divide a la curva en dos zonas de igual rea a su izquierda y a su derecha) y la moda (es el punto de la curva con mxima ordenada). 4) Hay toda una familia de curvas normales, dependiendo de los valores de y . De entre ellas, la ms importante es la estandarizada (con media 0 y desviacin tpica 1), a la que tambin se la denomina distribucin normal unitaria. 5) Los puntos de inflexin se encuentran en los puntos correspondientes a la media ms/menos una desviacin tpica ( ) . Entre tres desviaciones tpicas por debajo de la media y tres desviaciones tpicas por encima de la media se encuentran prcticamente todos los casos de la distribucin normal. 6) Cualquier combinacin lineal de variables aleatorias normales se ajusta tambin al modelo normal.

2)

3. Aplicacin
La distribucin normal unitaria permite calcular la probabilidad exacta de obtener un cierto valor de dicha distribucin. Por medio de las tablas de la curva normal es posible conocer con exactitud el rea o probabilidad que existe bien por debajo o por encima de un cierto punto. Para obtener las reas asociadas a un valor de cualquier otra distribucin normal basta con tipificar ese valor y acudir con la z obtenida a la tabla de la distribucin normal unitaria. Para referirnos a un valor concreto de la distribucin normal unitaria utilizaremos la letra Z con un subndice que indica la probabilidad acumulada para ese valor Z. As, z 0 ,791 = 0,81 indica que en la distribucin normal unitaria el valor 0,81 tiene una probabilidad acumulada, o rea izquierda, igual a 0,791. (Ver tabla): la probabilidad de encontrar un valor igual o menor que 0,81 es igual a 0,791. Para obtener esta probabilidad basta con buscar en la primera columna de la tabla (columna Z) el valor correspondiente al valor Z en cuestin (hasta el primer decimal) y en la columna correspondiente el valor del segundo decimal de Z. La interseccin de fila y columna nos proporciona la probabilidad buscada, tal y como se ilustra en la tabla adjunta. Cualquier valor con un subndice menor de 0,5 ser negativo, el valor 0 tendr un subndice 0,50 (el valor 0 es tanto la media como la mediana de la distribucin) y cualquier valor con un subndice mayor de 0,50 ser positivo.

TABLA A

Distribucin normal P(Z z)


z -3,5 -3,4 -3,3 -3,2 -3,1 -3,0 -2,9 -2,8 -2,7 -2,6 -2,5 -2,4 -2,3 -2,2 -2,1 -2,0 -1,9 -1,8 -1,7 -1,6 -1,5 -1,4 -1,3 -1,2 -1,1 -1,0 -0,9 -0,8 -0,7 -0,6 -0,5 -0,4 -0,3 -0,2 -0,1 0,0 0,00 0,0002 0,0003 0,0005 0,0007 0,0010 0,0013 0,0019 0,0026 0,0035 0,0047 0,0062 0,0082 0,0107 0,0139 0,0179 0,0228 0,0287 0,0359 0,0446 0,0548 0,0668 0,0808 0,0968 0,1151 0,1357 0,1587 0,1841 0,2119 0,2420 0,2743 0,3085 0,3446 0,3821 0,4207 0,4602 0,5000 0,01 0,0002 0,0003 0,0005 0,0007 0,0009 0,0013 0,0018 0,0025 0,0034 0,0045 0,0060 0,0080 0,0104 0,0136 0,0174 0,0222 0,0281 0,0351 0,0436 0,0537 0,0655 0,0793 0,0951 0,1131 0,1335 0,1562 0,1814 0,2090 0,2389 0,2709 0,3050 0,3409 0,3783 0,4168 0,4562 0,4960 0,02 0,0002 0,0003 0,0005 0,0006 0,0009 0,0013 0,0018 0,0024 0,0033 0,0044 0,0059 0,0078 0,0102 0,0132 0,0170 0,0217 0,0274 0,0344 0,0427 0,0526 0,0643 0,0778 0,0934 0,1112 0,1314 0,1539 0,1788 0,2061 0,2358 0,2676 0,3015 0,3372 0,3745 0,4129 0,4522 0,4920 0,03 0,0002 0,0003 0,0004 0,0006 0,0009 0,0012 0,0017 0,0023 0,0032 0,0043 0,0057 0,0075 0,0099 0,0129 0,0166 0,0212 0,0268 0,0336 0,0418 0,0516 0,0630 0,0764 0,0918 0,1093 0,1292 0,1515 0,1762 0,2033 0,2327 0,2643 0,2981 0,3336 0,3707 0,4090 0,4483 0,4880 0,04 0,0002 0,0003 0,0004 0,0006 0,0008 0,0012 0,0016 0,0023 0,0031 0,0041 0,0055 0,0073 0,0096 0,0125 0,0162 0,0207 0,0262 0,0329 0,0409 0,0505 0,0618 0,0749 0,0901 0,1075 0,1271 0,1492 0,1736 0,2005 0,2296 0,2611 0,2946 0,3300 0,3669 0,4052 0,4443 0,4840 0,05 0,0002 0,0003 0,0004 0,0006 0,0008 0,0011 0,0016 0,0022 0,0030 0,0040 0,0054 0,0071 0,0094 0,0122 0,0158 0,0202 0,0256 0,0322 0,0401 0,0495 0,0606 0,0735 0,0885 0,1056 0,1251 0,1469 0,1711 0,1977 0,2266 0,2578 0,2912 0,3264 0,3632 0,4013 0,4404 0,4801 0,06 0,0002 0,0003 0,0004 0,0006 0,0008 0,0011 0,0015 0,0021 0,0029 0,0039 0,0052 0,0069 0,0091 0,0119 0,0154 0,0197 0,0250 0,0314 0,0392 0,0485 0,0594 0,0721 0,0869 0,1038 0,1230 0,1446 0,1685 0,1949 0,2236 0,2546 0,2877 0,3228 0,3594 0,3974 0,4364 0,4761 0,07 0,0002 0,0003 0,0004 0,0005 0,0008 0,0011 0,0015 0,0021 0,0028 0,0038 0,0051 0,0068 0,0089 0,0116 0,0150 0,0192 0,0244 0,0307 0,0384 0,0475 0,0582 0,0708 0,0853 0,1020 0,1210 0,1423 0,1660 0,1922 0,2206 0,2514 0,2843 0,3192 0,3557 0,3936 0,4325 0,4721 0,08 0,0002 0,0003 0,0004 0,0005 0,0007 0,0010 0,0014 0,0020 0,0027 0,0037 0,0049 0,0066 0,0087 0,0113 0,0146 0,0188 0,0239 0,0301 0,0375 0,0465 0,0571 0,0694 0,0838 0,1003 0,1190 0,1401 0,1635 0,1894 0,2177 0,2483 0,2810 0,3156 0,3520 0,3897 0,4286 0,4681 0,09 0,0002 0,0002 0,0003 0,0005 0,0007 0,0010 0,0014 0,0019 0,0026 0,0036 0,0048 0,0064 0,0084 0,0110 0,0143 0,0183 0,0233 0,0294 0,0367 0,0455 0,0559 0,0681 0,0823 0,0985 0,1170 0,1379 0,1611 0,1867 0,2148 0,2451 0,2776 0,3121 0,3483 0,3859 0,4247 0,4641

Los valores interiores representan la probabilidad de obtener valores de Z menores o iguales que la puntuacin tpica z, definida por el cruce de la fila con la columna indicativa del segundo decimal. As, la probabilidad de obtener puntuaciones Z menores o iguales que 204 es 00207. Es decir:

P ( Z 2 ,04 ) = 0, 0207

Distribucin normal

P( Z z)

z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,9938 0,9953 0,9965 0,9974 0,9981 0,9987 0,9990 0,9993 0,9995 0,9997 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,9649 0,9719 0,9778 0,9826 0,9864 0,9896 0,9920 0,9940 0,9955 0,9966 0,9975 0,9982 0,9987 0,9991 0,9993 0,9995 0,9997 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 0,9066 0,9222 0,9357 0,9474 0,9573 0,9656 0,9726 0,9783 0,9830 0,9868 0,9898 0,9922 0,9941 0,9956 0,9967 0,9976 0,9982 0,9987 0,9991 0,9994 0,9995 0,9997 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,8907 0,9082 0,9236 0,9370 0,9484 0,9582 0,9664 0,9732 0,9788 0,9834 0,9871 0,9901 0,9925 0,9943 0,9957 0,9968 0,9977 0,9983 0,9988 0,9991 0,9994 0,9996 0,9997 0,5557 0,5948 0,6331 0,6700 0,7054 0,7389 0,7704 0,7995 0,8264 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,9671 0,9738 0,9793 0,9838 0,9875 0,9904 0,9927 0,9945 0,9959 0,9969 0,9977 0,9984 0,9988 0,9992 0,9994 0,9996 0,9997 0,5596 0,5987 0,6368 0,6736 0,7088 0,7422 0,7734 0,8023 0,8289 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0,9599 0,9678 0,9744 0,9798 0,9842 0,9878 0,9906 0,9929 0,9946 0,9960 0,9970 0,9978 0,9984 0,9989 0,9992 0,9994 0,9996 0,9997 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 0,9131 0,9279 0,9406 0,9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0,9948 0,9961 0,9971 0,9979 0,9985 0,9989 0,9992 0,9994 0,9996 0,9997 0,5675 0,6064 0,6443 0,6808 0,7157 0,7486 0,7794 0,8078 0,8340 0,8577 0,8790 0,8980 0,9147 0,9292 0,9418 0,9525 0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0,9949 0,9962 0,9972 0,9979 0,9985 0,9989 0,9992 0,9995 0,9996 0,9997 0,5714 0,6103 0,6480 0,6844 0,7190 0,7517 0,7823 0,8106 0,8365 0,8599 0,8810 0,8997 0,9162 0,9306 0,9429 0,9535 0,9625 0,9699 0,9761 0,9812 0,9854 0,9887 0,9913 0,9934 0,9951 0,9963 0,9973 0,9980 0,9986 0,9990 0,9993 0,9995 0,9996 0,9997 0,5753 0,6141 0,6517 0,6879 0,7224 0,7549 0,7852 0,8133 0,8389 0,8621 0,8830 0,9015 0,9177 0,9319 0,9441 0,9545 0,9633 0,9706 0,9767 0,9817 0,9857 0,9890 0,9916 0,9936 0,9952 0,9964 0,9974 0,9981 0,9986 0,9990 0,9993 0,9995 0,9997 0,9998

0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

Los nmeros interiores representan la probabilidad de obtener valores de Z menores o iguales que la puntuacin tpica, Z, definida por el cruce de la fila con la columna indicativa del segundo decimal. As, la probabilidad de obtener puntuaciones menores o iguales que 2,04 es 0,9793. Es decir:

P( Z 2,04) = 0,9793

4. Ejemplos
Ejemplo 1: Sabiendo que la variable X se distribuye segn la distribucin normal con media igual a 40 y varianza 64, obtenga la probabilidad de observar un valor como mucho igual a 48. Ejemplo 2: Para la misma variable X obtenga la probabilidad de observar un valor como mnimo igual a 43.

Ejemplo 3: Sabiendo que la variable X se distribuye normalmente con media igual a 15 y varianza igual a 4, obtenga el valor de esta variable para el que la probabilidad de observar un valor como mucho igual a l es 0,352.

Solucin del ejemplo 1: Se trata de obtener la probabilidad acumulada del valor 48, y para ello basta con tipificar y acudir con ese valor tipificado a la tabla de la normal unitaria, dado que sta nos proporciona directamente las reas izquierdas. X 48 40 P( X 48) = P z = P z = P( z 1) = 0,8413 8 x

Solucin 2: Se trata de obtener el complementario de la probabilidad acumulada del valor 43.

43 40 P( X 43) = 1 P( X 43) = 1 P z = 1 P( z 0,38) = 1 0,648 = 0,352 8

40

43

Solucin 3: Se trata de obtener el valor que deja un rea a su izquierda igual a 0,352. Para ello acudimos a la tabla y buscamos la z correspondiente a ese valor de rea que es 0,38: Z 0 , 352 = 0,38 = X 15 2

despejando, X = 0,38 2 + 15 = 14,24

5. Ejercicio Propuesto
Sabiendo que la variable inteligencia transformada a escala C.I. se distribuye normalmente con media igual a 100 y desviacin tpica igual a 15, en una poblacin de sujetos espaoles de determinadas caractersticas, calcule: a) La probabilidad de observar un valor como mnimo igual a 120. b) La probabilidad de obtener un valor comprendido entre los valores 93 y 107. c) La puntuacin en inteligencia para el que la probabilidad de observar un valor como mucho igual a l es 0,1736. Solucin: a) 0,0918. b) 0,3616. c) 85,9.

You might also like