You are on page 1of 7

Estadística Bidimensional

La siguiente introducción se ha realizado con el modelo fx-9750G Plus de Casio, los demás
modelos de calculadora gráfica Casio funcionan de manera similar al anterior.

1. CREACIÓN DE TABLAS DE FRECUENCIAS:

Consideremos, como ejemplo la distribución bidimensional dada por la tabla


siguiente:
X 1 3 5 6 8 9 11 14
Y 0,5 2 4,5 5 7,5 8 9 9

Utilicemos la opción R del p principal de la calculadora para introducir


los datos correspondientes a la distribución.

Pulsando Lp(SET UP), guardamos los valores de la distribución en File#


(el archivo que creamos conveniente). De esta manera serán recuperables para
utilizarlos más adelante.

Introducimos en list 1 los valores de la variable estadística X.


A continuación introducimos en list 2 los valores de la variable estadística Y.

2. CÁLCULO DE PARÁMETROS ESTADÍSTICOS:

Seleccionamos la opción W del p


principal:
Escogemos w(CALC) y después u(SET),
fijamos:

Seleccionamos la opción 2VAR, ya que trabajamos con dos variables, de esta


manera obtenemos los diferentes valores de los parámetros estadísticos.

La calculadora no hace el cálculo de la covarianza, si es necesario, habrá que


buscarla a partir de los valores obtenidos:

σxy =
∑ x y − x ⋅ y = 416 − 7,125 ⋅ 5,6875 = 11,48
n 8

1
3. REPRESENTACIÓN GRÁFICA Y CÁLCULO DE REGRESIONES:

El gráfico de nube de puntos (Scatter), nos ayudará a determinar si existe una


correlación entre las dos variables, así como el grado de dicha correlación.
Veamos pues, una representación gráfica de la distribución anterior:

Nube de puntos:

Escogemos la opción pW y
seleccionamos q(GRPH) y a continuación
u(SET).

Escogemos el gráfico q(GPH1) e


introducimos los siguientes valores:

A continuación l y escogemos con Le(V-Window), la escala de los


ejes apropiada para la representación:

Con Lp(SET
UP), etiquetamos los
ejes.

Pulsamos otra vezl, q(GRPH) y q(GPH1),obtenemos la nube de puntos


de la distribución.

Con la opción ur(2VAR) recuperamos los diferentes valores de los


parámetros estadísticos.

La opción Lq(TRACE), con la ayuda de las teclas del cursor, nos permite
desplazar el puntero por el diagrama.

Regresión lineal:
Las características de la nube indican una posible regresión lineal:

Con el gráfico de nube de puntos dibujado, pulsamos q(X) de manera que


obtenemos los parámetros resultantes de una regresión lineal:

pulsamos
u(DRAW) y nos
dibujará la recta de
regresión.

2
Es posible guardar la recta de regresión de manera que se pueda usar como una
función en el modo Y de la calculadora, para ello, hacer: q(X) y(COPY).

Guardamos la recta como la función Y1.

Regresión cuadrática:
Pulsamos u(DRAW) para volver a la representación gráfica y escogemos
ahora e(X^2) que corresponde a una regresión cuadrática.

Pulsamos
u(DRAW) y nos
dibujará la gráfica
correspondiente a la
regresión cuadrática.

Podemos comprobar que se ajusta mejor que la recta de regresión.

Guardamos la fórmula en la memoria de funciones gráficas: e(X^2)


y(COPY). Guardamos la parábola como la función Y2.

Regresión logarítmica:
Análogamente podemos hacer una regresión logarítmica: Dentro del diagrama
de nube de puntos pulsar uq(Log).

Pulsamos
u(DRAW) y nos
dibujará la gráfica
correspondiente a la
regresión
logarítmica.

Podemos comprobar que el ajuste no es tan bueno como en la regresión


cuadrática.

Guardamos la fórmula en la memoria de funciones gráficas: uq(Log)


y(COPY). Guardamos la gráfica como la función Y3.

Cálculo de regresiones sin representación gráfica:

También es posible hacer una regresión desde el menú Wsin tener que hacer
su representación gráfica.
Si escogemos la opción w(CALC), y pulsamos e(REG), podemos obtener
los diferentes parámetros y la expresión que hace referencia a la regresión deseada.

3
4. CÁLCULO DE ESTIMACIONES:

La predicción de valores esperados se realiza desde el menú Q.


Para la obtención de estimaciones partiremos del menú W, con la gráfica de la
regresión lineal dibujada y, entonces pulsar pQ. Las predicciones que
obtengamos corresponderán pues al modelo de regresión lineal

Por ejemplo queremos predecir el valor de y para x = 7:

Pulsamos i y(STAT) y escribimos 7w( ŷ ) l. Obtenemos un valor


estimado de y = 5,597.

Queremos predecir el valor de x para y = 3:


Escribimos 3q( x̂ ) l. Obtenemos un valor estimado de x = 3,411.

Es necesario recordar que el resultado obtenido por la calculadora es sólo una


predicción, que en general no será el valor real, sino una estimación del mismo. (La
recta de regresión explicaría el 95’8% de los casos ya que r = 0,95803566).

El menú Q no permite hacer estimaciones de cualquier tipo de regresión,


sólo es posible para regresiones lineales (X), logarítmicas (Log), exponenciales (Exp) y
de potencia (Pwr). No será posible el cálculo de estimaciones de las regresiones
cuadráticas (X^2), cúbicas (X^3), cuartas (X^4) y mediana-mediana (Med).

Si queremos obtener una predicción a partir el modelo de regresión cuadrática,


por ejemplo, se deberá realizar a partir del menú Y, donde previamente habremos
copiado la fórmula correspondiente. En nuestro ejemplo corresponde a la función Y2.

pY seleccionamos Y2 y pulsamos
u(DRAW). A continuación Ly(G-Solv)
uq(Y·CAL) y hacemos x = 7 l.

Obtenemos y = 6,376.

Análogamente Ly(G-Solv)
uw(X·CAL) y hacemos y = 3 l.
Obtenemos x = 3,423.

4
Es necesario ir con cuidado en el momento de hacer predicciones. Si bien
cuando hacemos una estimación para algún valor concreto, comprendido entre los
valores dados (interpolación), el resultado obtenido decimos que es fiable, esto no es
posible cuando extrapolamos a datos fuera de los intervalos dados.

Si nos fijamos en las regresiones anteriores, podemos ver que las tres regresiones
son similares en el intervalo donde se ha realizado el estudio:

Nos fijamos que si cambiamos la escala de los ejes para representar las funciones de
regresión en un intervalo más ancho:

Podemos apreciar ahora notables diferencias entre los diferentes modelos de


regresión, la cual cosa nos permite reflexionar sobre la validez de las estimaciones que
pudiéramos hacer extrapolando los datos iniciales.

Aún se puede apreciar mejor dibujando la recta x = 15, valor para el que las
diferencias entre regresiones comienzan a ser notorias:

5
5. EJERCICIOS:

1. La tabla siguiente muestra la nota de un examen de literatura catalana de 12 estudiantes,


las horas dedicadas al estudio de la materia, las horas que van a ver la televisión los días
previos a la prueba y el peso de cada uno.

Nota 3 4 4,5 5 6 6,5 7 7,5 8 8 9 9


horas de estudio 3 5 4 7 11 8 7 10 12 15 14 16
horas TV 18 12 15 14 10 6 8 6 5 8 6 4
peso (kg) 72 54 68 70 65 58 74 64 70 62 78 64

Estudia gráficamente la correlación entre la nota y cada una de las otras tres variables.

2. Determina la recta de regresión correspondiente a la distribución bidimensional


siguiente:

Altura sobre el nivel del mar (m) 0 184 231 481 730 911 1550
Presión atmosférica (mm Hg) 760 745 740 720 700 685 650

¿Qué presión atmosférica habrá en una población que se encuentra a una altitud
aproximada de 2600 m?

3. El número de trasplantes de corazón llevados a cabo en el estado español entre 1986 y


1992 se recoge en la tabla siguiente:

X (año) 1986 1987 1988 1989 1990 1991 1992


Y (trasplantes) 45 53 73 97 164 232 254

a) Representa el diagrama de dispersión de la distribución y describe el tipo de


relación que se establece entre las variables.
b) Calcula el coeficiente de Pearson. ¿El resultado es coherente con el apartado
anterior?

4. La tabla siguiente relaciona el número atómico de diversos metales de la misma fila en


el sistema periódico (período IV), con su densidad:

Elemento K Ca Ti V Mn Fe Co Ni
Número atómico 19 20 22 23 25 26 27 28
densidad (g/cm3) 0,86 1,54 4,5 5,6 7,11 7,88 8,7 8,8

6
Representa los puntos, calcula el coeficiente de correlación y busca la ecuación de la
recta de regresión. A partir de esta, estima la densidad del cromo (Cr), de número
atómico 24. Haz lo mismo con la densidad del escandio (Sc), de número atómico 21.

5. Los datos de evolución del crecimiento del PIB y de la ocupación a España (en
porcentaje) durante los últimos nueve años están recogidos en la tabla siguiente:

PIB 4,7 3,7 2,3 0,7 -1,2 2,1 2,8 2,4 3,1
Ocupación 4,1 2,6 0,2 -1,9 -4,3 -0,9 2,8 3,3 3

a) Dibuja la nube de puntos y estudia la relación entre las dos variables. Si existe
correlación lineal, calcula el coeficiente de Pearson.
b) ¿Cuánto crecerá la ocupación el año que viene, suponiendo que el PIB crezca un
3,4%?

6. La edad que tiene un árbol y el diámetro de su tronco, medidos para un número pequeño
de árboles (supongamos 10 árboles) se representan en la tabla siguiente:

Edad (años) 2 4 4 8 10 11 14 15 15 20
diámetro (cm) 10 15 14 20 30 28 50 55 52 60

a) Calcula, usando una regresión lineal, el diámetro que se puede predecir para un
árbol de 15 años.
b) Compara el resultado con los valores observados en la tabla, razona el porqué
de las diferencias.

7. Les características físicas de los 18 jugadores de un equipo de fútbol son las siguientes:

Altura (cm) 168 170 170 172 175 176 178 180 180 182 184 186
peso (kg) 70 68 72 71 72 75 80 80 82 82 82 84
Número de jugadores 1 2 1 1 3 1 1 2 1 2 2 1

a) Calcula los parámetros estadísticos que consideres más adecuados y explica los
resultados obtenidos.
b) Dibuja la nube de puntos y comenta a partir de ésta la relación entre las dos
variables.
c) Si existe correlación lineal, calcula el coeficiente de Pearson e interpreta el
resultado.
d) Busca la ecuación de la recta de regresión, y estima cual sería el peso de un jugador
escogido al azar que midiera 174 cm.

You might also like