You are on page 1of 8

DISTRIBUCIONES BIDIMENSIONALES

1. Distribuciones bidimensionales
En estadstica se estudian en ocasiones varias caractersticas de una poblacin para compararlas, estudiar su dependencia o correlacin o realizar cualquier otro estudio conjunto. El caso ms comn de dos variables se conoce como estadstica bidimensional. Un ejemplo tpico es el de un estudio que recoja la estatura (denotmosla por X) y el peso (sea Y) de los n individuos de una determinada poblacin. En tal caso, fruto de la recogida de datos, se obtendra una serie de parejas de datos (xi, yi), con i = 1, ..., n, cada una de las cuales estara compuesta por la estatura y el peso del individuo i, respectivamente. En los estudios bidimensionales, cada una de las dos variables que entran en juego, estudiadas individualmente, pueden resumirse mediante los parmetros que se han visto hasta ahora. As, tendra sentido hablar de la media de las estaturas ( ) o la desviacin tpica de los pesos (Y). Incluso para un determinado valor de la primera variable, xk, cabe hacer estudios condicionados. Por ejemplo, la mediana condicionada a la estatura xk sera la mediana de los pesos de todos los individuos que tienen esa estatura. Se denota Me/x=xk. Sin embargo existen otros parmetros que resumen caractersticas de ambas distribuciones en su conjunto. Los ms destacados son el centro de gravedad, la covarianza y elcoeficiente de correlacin lineal.

Representacin grfica realizada mediante un dibujo en un sistema bidimensional de coordenadas cartesianas. En este tipo de diagramas cada punto representa la puntuacin que el sujeto obtiene en las dos variables, determinando su puntuacin por la lectura de los valores que aparecen en la escala vertical y horizontal. La produccin de este tipo de diagramas es el paso ms importante a la hora de estudiar la correlacin entre dos variables. Con frecuencia se descuida a veces este paso, o incluso es despreciado en los anlisis de datos pasando directamente los autores a utilizar estadsticos ms complejos.

2. Grficas: Nubes de puntos. Significado. Coeficiente de Pearson.

Caractersticas de la nube de puntos


Segn la forma de la nube de puntos podemos obtener la siguiente informacin: 1. Conocer si existe una relacin directa o inversa entre las variables. 2. Saber si esa relacin es fuerte o dbil. 3. Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, puede darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial, Cuadrtica, entre otras. Las ecuaciones de cada relacin se presentan en la siguiente forma:

REGRESIN Lineal Logartmica Exponencial Cuadrtica

ECUACIN y = a + bx y = a + bLn(x) y = ae(bx) y = a + bx +cx2

Aplicaciones
Extraer informacin 2D y 3D del modelo de nube de puntos generado es un proceso indispensable. Al avanzar la tecnologa es cada vez ms sencillo visualizar y gestionar un mayor nmero de puntos en

tiempo real. Los visualizadores permiten explorar el modelo y generar las vistas necesarias para una mejor comprensin del objeto de estudio. Las principales ventajas de utilizar la creacin de un modelo de nube de puntos son: El levantamiento no se limita el uso de un solo instrumento gracias a la incorporacin en el registro de programas de ingeniera inversa. Se reduce tiempo en campo de manera significativa gracias a la reduccin en el uso de puntos de control. Por una parte no es necesario montar y desmontar las dianas y el tiempo de barrido se reduce hasta en una tercera parte. Se consiguen resultados vlidos alternativos si se aprovecha la gran densidad de puntos que generan los escneres lser y evita el complejo proceso de triangulacin de la nube de puntos. En levantamientos 3D con escner lser, a partir de la nube de puntos es posible obtener medidas directas.

Modelos de nubes de puntos A continuacin veremos un ejemplo real, donde la figura representada refleja la covariacin entre la inteligencia (CI) y el rendimiento escolar (Nota) de los sujetos estudiados.

Estando claro a partir de la observacin de los puntos que existe una tendencia general a que los

sujetos en la medida que tengan ms inteligencia obtendrn tambin mejor nota acadmica. A este tipo de relacin se le conoce como directa o positiva. Si se observase un proceso contrario, es decir, a medida que aumenta la inteligencia disminuye el rendimiento acadmico, la correlacin sera inversa o negativa.

Coeficiente de Pearson
En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables.
El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente

donde XY es la covarianza de (X,Y) y X y Y las desviaciones tpicas de las distribuciones marginales. El valor del ndice de correlacin vara en el intervalo [-1, +1]: Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en proporcin constante. Si 0 < r < 1, existe una correlacin positiva. son independientes: pueden existir todava relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlacin negativa. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en proporcin constante.

Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables

3. Tablas
Tabla simple
Notas de matemticas (X) 3 4 4 7 2 3 5 4 Notas de lengua (Y) 2 5 4 6 4 3 6 4

Tabla de doble entrada


X|Y 2 3 4 5 6 2 --1 --1 3 1 1 ---2 4 --2 1 -3 5 ----1 1 7 ----1 1 1 1 3 1 2 8

Tablas marginales:
Es realizar una tabla para cada variable. Notas de matemticas 2 3 4 5 7 SUMA Nmero de alumnos 1 2 3 1 1 8 Notas de lengua 2 3 4 5 6 SUMA Nmero de alumnos 1 1 3 1 2 8

Tabla condicionada
Se trata de hacer una tabla marginal de una variable condicionada a un valor de la otra variable. Notas de matemticas 2 3 4 5 6 Nmero de alumnos con 2 en lengua --1 --1

4. Regresin y correlacin. Covarianza


Recta de regresin
La recta de regresin es la que mejor se ajusta a la nube de puntos. La recta de regresin pasa por el punto llamado centro de gravedad.

Recta de regresin de Y sobre X


La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresin de X sobre Y

La recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus eucaciones son: y= x=

La correlacin
La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

Tipos de correlacin
1 Correlacin directa La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversa La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nula La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlacin
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por sxy o xy.

La covarianza
La covarianza indica el sentido de la correlacin entre las variables Si xy > 0 la correlacin es directa. Si xy < 0 la correlacin es inversa. La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes. Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares.

You might also like